4 Décrire l’oralité enfantine sourde : proposition d’outils de transcription et d’annotation

!" # $% &'" (')*+ ," -! ./" 0 "! &# 1$ # ()*+ 1 2%" ##" ./ ! 3'2) ^&*! (*)+4 !-$2 1 5/- 3#$ 3'2)' ^&'" ()*+ 1 2%" ,6 6 ! 32% " 3'2)7 &# 1$ # ()+# %# - #-% ./" 8 &%" 3 3'2)* 5& &*! (*)*+!

Tableau 9 – Synthèse des volets de l’étude

4 Décrire l’oralité enfantine sourde : proposition d’outils de transcription

et d’annotation

Une première étape centrale de notre réflexion sur l’oralité enfantine sourde a été de développer des outils de transcription à même de saisir ses réalités plurielles. Ces réflexions nous ont amenée à réinvestir les premiers outils descriptifs que nous avions développés durant nos travaux de master pour les formaliser en une grille de transcription sous le logiciel ELAN. Par ailleurs, cette grille est le résultat d’une adaptation nécessaire de la grille de transcription élaborée pour les conduites narratives des enfants entendants dans le projet de recherche global dans lequel s’ancre le volet narration de notre corpus [Collettaet al., 2009].

Soulignons d’ores et déjà que si les questions liées à la transcription de l’oralité représentent un défi pour tout chercheur – puisque la transcription répond sinon à une certaine forme d’analyse, tout au moins à une pré-selection et une indéniable interprétation des productions –, les questions posées par la transcription des données multimodales, et de façon encore plus cruciale en contexte de surdité, se doivent de répondre à une double nécessité : si la transcription contraint, en effet, à un impératif de linéarisation des productions, il est impératif d’envisager une nécessaire délinéarisation des

catégor-ies/-sations pour ne pas perdre de vue l’essence multimodale et donc l’articulation plurisémiotique des productions.

Nous souhaitons ainsi, dans cette section, rendre compte du cheminement qu’il nous a fallu parcourir pour parvenir à élaborer une grille de transcription et d’annotations sous le logiciel ELAN à même de répondre aux questions que posent les spécificités des productions langagières de jeunes enfants sourds âgés de 6 à 12 ans lors d’une tâche narrative. La présentation de la grille est largement inspirée des publications dont elle a été l’objet [voir, Millet & Estève, 2009, 2010; Estève & Millet, 2011] et propose une synthèse dynamique des réflexions menées.

Avant de présenter de façon détaillée la grille de transcription que nous proposons pour répondre à ces questions spécifiques de linéarisation/délinéarisation auxquelles nous confronte l’oralité sourde, nous recontextualiserons nos réflexions au regard des outils de transcription existants sur la multi-/bi-modalité qui proposent, pour la plupart, une transcription en portée pour rendre compte de phénomènes qui s’expriment dans la simultanéité. Nous présenterons plus précisément les éléments principaux de la grille de transcription élaborée pour le volet entendant du projet ANR [Collettaet al., 2009] (voir section 3.3 pour une présentation du projet), pour développer en fin de parcours les adaptations nécessaires que requièrent l’oralité sourde appréhendée dans ses aspects bilingues et multimodaux. Il nous a paru important de présenter l’intégralité de l’outil que nous avons élaboré même si nous n’exploiterons pas ici l’ensemble des catégories établies.

4.1 Décrire la gestualité et la vocalité : transposer, décrire, transformer, traduire Dans la plupart des études portant sur des corpus oraux les outils de transcription sont généralement proposés de façon annexe, dans une partie souvent appelée "convention de transcription", des précisions qui ont pour but d’aiguiller le lecteur en lui fournissant une explication typographique des notations effectuées. Néanmoins, les conventions de transcription ne se réduisent pas, la plupart du temps, à une utilisation de symboles spécifiques, mais, parce qu’elles ont nécessairement fait l’objet de réflexions théoriques, sont un enjeu crucial de lecture des données, non pas seulement pour le lecteur mais avant tout pour le chercheur qui en propose une lecture inévitablement orientée et sélective – voir pour une revue de questions sur la transcription de l’oralité [Blanche-Benveniste, 1997; Cosnier & Kerbrat-Orecchioni, 1991; Gadet, 2007; Mondada, 2000, entre autres]. Comme le formulent très bien Gadet & Mazière [1986, 61] :

« Admettre que la transcription soit perte [..], c’est obéir à un principe de réel qui pose la question de la matérialité diﬀérente des deux codes et du rapport à l’écoute : écouter et transcrire,

com-4. Décrire l’oralité enfantine sourde : proposition d’outils de transcription et d’annotation

ment, pourquoi ? Le fruit de l’attention est toujours et encore une sélection. » [Gadet & Mazière, 1986, 61]

Les décalages entre transcription et productions effectives sont donc inévitables.

4.1.1 Généralités : transcrire, une lecture indéniablement sélective

Le décalage sans doute le plus manifeste est induit par le recours à une transcription orthographique, dont les normes sont propres à l’écrit. Il est certes toujours possible d’adapter le moule orthographique, afin de rester au plus près des productions effectives en transcrivant les pauses, les hésitations, les assi-milations, les élisions, les prononciations effectives, les reprises, les inachevés, etc. Toutefois, en dehors de ces adaptations minimes, ponctuelles, il semble que la description de l’oralité se trouve trop souvent corsetée dans les normes syntaxiques, notamment, de l’écrit. Gadet [2007] parle d’une appréhension de l’oraldomestiquéepar les normes de l’écrit, alors qu’[il] faudrait [...] savoir regarder l’écrit transcodé de l’oral autrement que comme de l’écrit, s’abstraitre de la routine de l’œil façonné à l’écrit. »Gadet [2007, 45]. S’agissant de transcrire les productions linguistiques du jeune enfant, par exemple, la trans-cription engage nécessairement des mécanismes d’interprétation (sur-interprétation ?) et de normalisation des propos de l’enfant en regard du modèle adulte. Morgenstern [2009] parle à ce propos de représenta-tions adultomorphes des producreprésenta-tions de l’enfant. Le paradoxe réside donc dans le fait que, par souci de lisibilité et pour faciliter les analyses, on préférera une transcription orthographique à une transcription phonétique, bien que cette transcription moins coûteuse et plus malléable exige une plus grande pru-dence puisqu’il s’agit de négocier entre fidelité et réécriture pour rendre lisible les phénomènes propres à l’oralité.

La transcription de la gestualité, pose en des termes un peu similaire, la question du décalage entre réalisation effective et description, puisque s’opposent une descriptionémicet une descriptionétic[voir, entre autres, sur cette question Cosnier, 1982]. En effet, la descriptionétic, engage la description formelle du mouvement, une description physique, objective [voir pour une revue des différents systèmes de transcription existants Martin-Dupont, 1994], alors que la descriptionémicse focalise sur le sens ou la fonction des mouvements, et est donc indéniablement plus marquée par la subjectivité du transcripteur puisqu’elle suppose, comme le souligne Cosnier [1982, 259]« la (re)connaissance du phénomène comme appartenant à une classe ». La plupart des transcriptions s’accommodent toutefois d’une description glosée des gestes qui porte en elle l’interprétation98. C’est notamment le cas dans la grille proposée

98. Dominique Boutet est, à notre connaissance, un des seuls chercheurs à proposer un système de description articulatoire et morphologique de la gestualité entendante – voir Boutet [2001, 2010, entre autres]

par Collettaet al. [2009] pour transcrire les conduites narratives des enfants entendants, comme on le verra. Ainsi, de fait, la transcription de la gestualité procède d’une indéniable sélection des données en ne retenant que les éléments considérés comme porteurs de sens.

Dans les études sur la multi-/bi-modalité, et plus particulièrement encore sur la multi-/bi-modalité de l’enfant, les questions que posent la transcription, sont souvent rediscutées par les chercheurs à la lumière des choix méthologiques effectués, plaçant la transcription comme une étape cruciale du cheminement théorique [Cosnier, 1982; Colletta, 2004; Morgenstern, 2009, entre autres] – voir pour une revue de question Mondada [2000].

4.1.2 Approche multimodale de la transcription

Si l’approche multimodale la transcription se veut aussi exhaustive que possible, nombre de cher-cheurs rappellent tout de même l’aspect réducteur de toute transcription, dans le fait-même que celle-ci est adaptée aux visées d’une recherche spécifique [Colletta, 2004; Morgenstern, 2009, entre autres].

Pour pallier ces décalages, tout en en étant conscient, les questions de transcriptions explicitées par nombre de chercheurs se posent donc dans les termes suivants – on retrouve ces questions formulées plus spécifiquement chez Colletta [2004]; Morgenstern [2009]; Cosnier [1982] :

– Que transcrit-on ? (verbal vocal, gestes, postures, prosodie, regard, description de l’interaction, etc..) ;

– Quel type de transcription ? (pour le linguistique : phonétique, phonologique, lexicale, orthogra-phique, etc. ; pour le gestuel : physiologique, sémantique, pragmatique, etc.) ;

– Jusqu’à quel point détailler la transcription ?

Les transcriptions effectuées dans une approche multimodale, proposent, de façon assez systématique, des transcriptions en portée pour être à même de rendre compte de tous les éléments qui s’inscrivent dans la simultanéité. Au côté des lignes assignées pour l’une à la transcription orthographique de la production vocale – généralement inscrite comme ligne principale – pour l’autre à la description des gestes co-verbaux – production gestuelle manuelle et céphalique à valeur communicative –, se déclinent d’autres lignes de description : transcription phonétique/morpho-syntaxique de la parole, fonction/description du geste, description du contexte, actions pendant l’interaction, etc.

Transcrire la LSF rejoint par bien des points ces questions posées par les chercheurs pour la transcrip-tion de la multimodalité. Comment transcrire étant d’autant plus une questranscrip-tion cruciale que, cette langue ne bénéficiant pas de système d’écriture, transcrire engage donc un passage quasi obligé par l’écrit de la langue vocale.

4. Décrire l’oralité enfantine sourde : proposition d’outils de transcription et d’annotation

4.1.3 Les problématiques de transcription spécifiques à la LSF

Dans la mesure où ces langues sont spatiales par essence et laissent donc plus de place à la simul-tanéité, transcrire confronte les chercheurs à deux problèmes majeurs : d’une part la mise au point d’un système de transcription qui soit à même de rendre compte linéairement des procédés syntaxiques de cette langue qui s’élaborent dans la simultanéité et dans l’espace, et conjointement, d’autre part, d’élaborer des outils d’annotations qui permettent l’identification et la description même des procédés spécifiques de cette langue.

Dans la plupart des systèmes de transcription des LS, et ce à l’échelle internationale, les signes sont glosés, au niveau lexical, par un mot équivalent dans la langue vocale écrite typographié en petites majuscules et entre crochets99. Par exemple, le signe signifiant « tricoter », s’exécutant avec les deux index tendus dans un mouvement de rotation imitant les aiguilles à tricoter, sera simplement transcrit [TRICOTER].

Cette transposition en gloses amène des décalages importants, comme nous l’avons souligné ailleurs Estève & Millet [2011]. Tout d’abord, cette transposition évacue la matérialité du signe, ce qui ne permet pas au lecteur ne maitrisant pas la LS glosée de se faire une idée de la réalisation discursive effective. En second lieu, cette glose est une traduction, avec tous les dangers liés à la transposition d’une langue dans une autre. Et enfin, cette traduction centrale fige le lexique de la LS, excluant les variations de sens liées au contexte, etin finefocalise sur ledit lexique, en imposant des cadres de lecture qui sont peu à même de rendre compte de l’essence des LS.

Toutefois, pour pallier le décalage lié à la transposition d’une langue dans une autre, les systèmes de transcription incluent des annotations supplémentaires pour transcrire les spécificités morpho-syntaxiques des LS – voir pour la LSQ le système de transcription X, Y, Z [Dubuissonet al., 1996; Parisot, 2003], pour la LSF, le système élaboré pour rendre compte des dynamiques iconiques et corporelles [Millet, 2006b,a, 2002b, entre autres], pour la BSL : le système de transcription restitué sous le concept de Dy-namic Space Transcriptionmis au point par Morgan [2008]. Précisons néanmoins que si la plupart des systèmes de transcription proposés à l’échelle internationale sont des partitions en portées, l’entrée prin-cipale de ces systèmes se trouve être bien souvent centrée sur l’élément lexical et laisse en suspens la

99. Peu de systèmes s’attachent à une description systématique des paramètres de formations du signe (configuration ma-nuelle, orientation, lieu d’articulation, mouvement) dans une description que l’on pourrait qualifier de phonologique. Quelques systèmes se sont développés à la suite des propositions de Stokoe [1960]. Hamonsys (

), développé par une équipe d’Hambourg, propose notamment une version plus accessible et plus lisible du système de transcription proposée par Stokoe. Nous pouvons par ailleurs fait référence au Signwriting ( ) qui, contrairement au système hamnosys n’a pas pour vocation une description de la LS, mais vise une annotation économique et globale dans l’optique de développer un système d’écriture adapté aux LS.

question des unités syntaxiques.

Par cette remarque, nous abordons une question qui fait, selon nous, se rejoindre les problématiques de transcription liées à une appréhension multimodale de l’oralité et à la transcription de la LSF : les processus de linéarisation, nécessités par la transcription d’éléments distincts qui interviennent en si-multanéité, et de délinéarisation, nécessités par la restitution des dynamiques entre ces éléments, posent inévitablement la question de la hiérarchisation des lignes de transcription et celle d’une unité globale de transcription.

4.1.4 La question d’une unité de segmentation globale en suspens

Les grilles de transcription proposées pour les productions LS ou les données multimodales en LV sont généralement en portée mais ne semblent pas intégrer de hiérarchisation : les lignes semblent fonc-tionner de façon autonome comme un relevé assez exhaustif des éléments porteurs de sens. Peu de chercheurs se sont, en effet, attachés à proposer une transcription hiérarchisée des lignes de transcription proposées en se penchant sur la conception d’une unité globale de segmentation.

Ceci est tout particulièrement manifeste dans les propositions effectuées pour la transcription de la bimodalité enfantine sourde, comme le montrent les premières transcriptions proposées par Sepulchre-Manteau [1997] et Van den Bogaerde [2000] – voir pour une revue globale des différentes méthodologies existant dans les recherches sur l’acquisition en contexte de surdité, l’article de Bakeret al.[2008].

Speculchre-Manteau propose une transcription "parallèle" à plusieurs niveaux : une première ligne est destinée à la transcription des énoncés vocaux, une seconde à la transcription des énoncés en langue des signes – les mimiques ayant un rôle dans les énoncés en LS sont indiquées au-dessus des signes –, les éléments mimo-gestuels n’appartenant pas à la LSF, mais à valeur communicative, sont transcrits sur une troisième ligne, comme en donne un exemple l’extrait de transcription suivant :

Enfant : Pas école (mer)credi, [ we](=joué) frè(re)

non

ecole hier mercredi jouer frere avec

sourire de connivence

Adulte : Bien sûr, c’était mercredi ! tu as joué avec ton frère !

bien-sur mercredi tu jouer avec ton frère

Exemple 15 – Extrait de transcription des énoncés bimodaux [Sepulchre-Manteau, 1997, 153]

Van den Bogaerde dans sa thèse propose une grille de codage en portée multi-linéaire plus détaillée comprenant : le comportement non-verbal (essentiellement lié aux actions des locuteurs durant l’inter-action), les aspects morpho-phonologiques des productions signées déviant du modèle adulte, les gestes

4. Décrire l’oralité enfantine sourde : proposition d’outils de transcription et d’annotation non-verbaux, les expressions faciales (mimique, regard), les gloses des signes, « l’oral » (mots labia-lisés ou vocalabia-lisés de la langue vocale). La démarche de transcription reste toutefois assez similaire à la précédente, comme le montre l’exemple suivant rendant compte de la transcription des productions linguistiques vocales et gestuelles simultanées :

Exemple 16 – Extrait de transcription des énoncés bimodaux [Van den Bogaerde, 2000, 50]

Dans cet extrait, que nous pourrions traduire parQui a mangé le porridge ?, les productions sont appréhendées sous trois lignes principales – la traduction de la transcription de l’extrait transcrit en anglais a été effectuée par l’auteur. Van den Bogaerde indique ainsi sur la première ligne la mimique faciale interrogative (notée q (question)), une glose des signes (AV correspondant à un signe marquant la question (paumes vers le haut)), les mots vocalisés ou labialisés sur la troisième ligne100.

Comme en donne un aperçu ces propositions de transcriptions multi-linéaires qui rendent assez bien compte des transcriptions utilisées dans les travaux sur le bilinguisme bimodal [Donati & Branchini, 2009; Emmoreyet al., 2005; Bishopet al., 2006], la question d’une unité permettant une appréhension globale des phénomènes bimodaux est laissée en suspens.

On soulignera plus largement que, dans les études sur la multimodalité enfantine, la délinéarisation des lignes de transcription/annotation ne semble pas être pensée au-delà des regroupements qu’autorisent la modalité de production : gestuellevsvocale. Ainsi, c’est souvent sous deux blocs distincts qu’appa-raissent des lignes consacrées à la vocalité et d’autres à la gestualité. Il semble donc que les outils de transcription/catégorisation/segmentation liées à la gestualité et ceux liés à la vocalité soient encore dif-ficiles à concilier autrement que en les traitant comme des éléments distincts101.

L’absence de hiérarchisation et l’aspect juxtaposé des lignes de transcription est, à notre sens, lar-gement dû au support des transcriptions, jusqu’alors réalisées sous forme de transcriptions papier ou

100. Notons que ce type de transcription en 3 lignes est celui qui a été retenu par Van den Bogaerde & Baker dans la suite de leurs travaux sur le bilinguisme bimodal enfantin pour ne se focaliser que sur les énoncés linguistiques [Van den Bogaerde & Ba-ker, 2001, 2008; Baker & Van den Bogaerde, 2008; Van den Bogaerde, 2000].

101. Notons que dans les propositions plus récentes de Pichleret al.[2010] des énoncés bilingues bimodaux d’enfants enten-dants de parents sourds réalisées sous ELAN, on retrouve, de manière assez similaire à ce que l’on trouve dans les transcriptions de la multimodalité entendante, deux blocs distincts qui servent à transcrire respectivement l’un les énoncés linguistiques vo-caux, l’autre les énoncés linguistiques gestuels.

tout au moins sous des logiciels de traitement de texte (word, excel, par exemple), rendant le transcrip-teur assez libre de procéder à des modifications/ajouts/suppressions dans l’organisation des lignes de transcription et permettant une gestion autonome de chacune d’elles. On soulignera donc l’impact des logiciels sur les pratiques de transcription : CLAN102, ANVIL103, et plus spécialement ELAN104– logi-ciel très massivement utilisé dans les recherches sur la surdité –, entre autres logilogi-ciels récents, permettent de synchroniser la vidéo avec la transcription et d’envisager donc, plus finement l’agencement temporel des transcriptions. ELAN, entre autres, et c’est là tout l’intérêt du logiciel, autorise/contraint à repenser la hiérarchisation des différentes lignes de transcriptions et leur dépendance. Ceci incite donc à penser la transcription multimodale non plus uniquement de manière exhaustive en "listant" en quelque sorte toutes les entrées pertinentes, mais en envisageant plus précisément comment cette transcription peut rendre compte au mieux de l’organisation temporelle, sémantique et structurelle des productions simul-tanées, ce qui impose nécessairement de réfléchir à la question des unités de segmentation. ELAN donne ainsi une marge de manœuvre au chercheur pour répondre à la question cruciale de la délinéarisation des lignes de transcriptions/annotations.

Par ailleurs, comme nous allons le montrer en nous appuyant sur des exemples issus de notre corpus, la transcription des données bi-/multi-modales en contexte de surdité exige de repenser une unité de trans-cription globale à l’échelle de la bimodalité. Nous ne pouvons concevoir, en effet, que les deux modalités soient transcrites exclusivement de façon parallèles et indépendantes alors même que les dynamiques qui s’expriment entre gestualité et vocalité témoignent du fait que ces deux moyens de symbolisations conservent certes une certaine autonomie, mais sont intimement liés réciproquement dans l’expression de la pensée du locuteur – ceci rejoint notre discussion sur l’appréhension du contact de langues dans le bilinguisme bimodal (cf. section Partie 1 Chap. 2 section 1.2.1). Cette organisation de la bimodalité a une réalité non seulement chez le locuteur sourd, comme nous l’avons développé en proposant le terme de

productions conjointes(cf. chapitre 2 section 1.2.1.2), mais a largement été démontrée chez le locuteur entendant [Kita, 2000; McNeill, 1992; McNeill & Duncan, 2000, entre autres] sans cependant que les chercheurs en proposent une application effective dans la transcription (voir les réflexions développées dans la Partie 1 (cf. Chap. 1 section 3). Transcrire les productions narratives des enfants sourds nous a donc amenée à réfléchir à la question d’unité de segmentation des énoncés qui permettrait d’appréhender plus globalement les liens entre vocalité et gestualité. Nous introduisons par cette remarque les aména-gements nécessaires auxquels nous avons dû procéder pour adapter aux spécificités de la multimodalité

Dans le document Approche bilingue et multimodale de l'oralité chez l'enfant sourd : outils d'analyses, socialisation, développement (Page 182-200)