• Aucun résultat trouvé

CHAPITRE I Développement phonologique chez le jeune enfant enfant

CHAPITRE 1 Projet international Paidologos : présentation et méthodologie.et méthodologie

1.10. Recueil et traitement des données

1.10.1. Recueil des données

Les réponses ont été enregistrées via un enregistreur audio numérique de très bonne qualité muni d’un microphone de marque MARANTZ. Ces fichiers sons ont ensuite été anonymisés et exportés sur le logiciel PRAAT pour être segmentés et transcrits.

1.10.2. Segmentation des données

Les fichiers sons importés sous le logiciel PRAAT ont ensuite été segmentés mot après mot et non-mot après non-mot. La même procédure a été employée pour la segmentation des mots et des non-mots. La segmentation est semi-automatisée grâce à un script sous PRAAT, développé dans le cadre du projet Paidologos. Une fois les frontières du mot délimitées sous PRAAT, le script inscrit automatiquement le mot ou le non-mot sous sa forme phonétique.

Figure 4 : Exemple de segmentation des données sous PRAAT

Le programme isole également la consonne initiale. La figure ci-dessous donne l’exemple du /tS/ et du contexte vocalique qui suit cette consonne, ici le /i/.

La ligne 4 indique le numéro de la répétition.

La ligne 5 indique ici que le mot a été répété normalement après que l’enfant l’a entendu une fois. D’autres annotations peuvent être utilisées pour cette cinquième ligne. Par exemple, si l’enfant répète spontanément le mot une seconde fois sans que le stimuli audio ne soit rejoué, l’expérimentateur note « TargetRep-repeat ». Si l’on a demandé à l’enfant de répéter le mot pour l’une des raisons citées ci-dessus, on note « TargetRep-check ». Enfin, si l’enfant donne un autre mot, ou un mot phonétiquement proche, d’autres annotations sont reportées dans cette ligne.

Figure 5 : Exemple d'un mot segmenté sous PRAAT

1.10.3. Transcription

Un locuteur natif pour chaque langue, qui est aussi un phonéticien entraîné, a transcrit les productions des enfants.

Deux parties distinctes à la transcription peuvent être décrites :

- Dans un premier temps, la transcription porte sur la consonne initiale suivie de la voyelle du mot. Cette consonne et cette voyelle sont codées comme « correcte » (1) ou incorrecte (0). Une autre catégorie existe pour les consonnes, il s’agit du voisement (noté V).

- Dans un deuxième temps, la transcription porte sur l’annotation proprement dite des « erreurs » produites par l’enfant. Cette transcription est réalisée selon un codage spécifique et partagé pour toutes les langues du projet Paidologos.

Nous obtenons sous PRAAT cette forme de transcription :

Pour les langues du projet Paidologos, un second phonéticien et également locuteur natif de la langue a retranscrit 20% des données, sans disposer de la transcription préalablement réalisée par le premier locuteur. Les résultats indiquent un jugement analogue pour les productions correctes dans environ 90% des cas (90% pour l’anglais, 96% pour le cantonais, 94% pour le grec, 89% pour le japonais.)

Les données en français ont été transcrites par l’auteur de cette thèse. Les données en drehu ont été transcrites par un étudiant de l’Université de la Nouvelle-Calédonie, locuteur natif du drehu.

En français et en drehu, les données de deux enfants par âge (soit 8 enfants pour le français et 6 pour le drehu) ont été transcrites une deuxième fois par des étudiantes en sciences du langage. Les résultats de ces transcriptions sont présentés au paragraphe 1.10.4. Ils permettent de valider les transcriptions effectuées en français et en drehu par les deux locuteurs natifs.

a. Codage des types d’erreurs

Comme nous l’avons mentionné ci-dessus, les erreurs dans la production des phonèmes sont annotées selon une grille spécifique et similaire d’une langue à l’autre. Différents types d’erreur peuvent être reportés (sur la 6ème ligne de transcription sous Praat, dans les intervalles 1 pour la consonne et 4 pour la voyelle) :

- Distorsion du son : le son produit est hors de l’espace phonétique du son-cible et ne peut être transcrit en utilisant un symbole phonétique. Dans ce cas, il est noté « # ».

- Substitution par un son n’appartenant pas au répertoire de la langue-cible : l’enfant produit un son que l’on peut transcrire avec un symbole phonétique, mais le son n’appartient pas au répertoire de la langue-cible.

* Par exemple, l’enfant produit un h aspiré pour le son /s/. On note « +h ».

- Substitution par un autre son de la langue-cible : un son remplace le son-cible. Dans ce cas, le son substitué peut être transcrit. De plus, le son substitué appartient à l’inventaire de la langue.

* Par exemple, l’enfant substitue en français /t/ à /k/. On note alors le code suivant « $t ».

- Entre deux sons : le son produit par l’enfant est entre le son cible et un autre son. Ici, cette annotation peut être utilisée si les deux sons appartiennent au répertoire de la langue, ou s’ils ne font pas partie du répertoire de la langue, ou enfin si l’un des sons appartient au répertoire de la langue et l’autre non.

* on note par exemple : « S :$s » si l’enfant français semble dire un son entre /S/ et /s/ quand le son-cible attendu est /s/. Ici, le transcripteur entend plutôt le son /S/ et place donc ce signe le plus à gauche. Comme le son-cible attendu est /s/, le transcripteur laisse le signe « $ » devant /s/. Si au contraire, le transcripteur entend avant tout le son /s/, alors il note « $s :S » et dans ce cas, le son /s/ produit par l’enfant est compté comme correct.

* Il se peut que l’enfant produise un son compris entre deux sons différents du son attendu. Par exemple, si l’enfant produit un son compris entre /t/ et /k/ pour le

son attendu /s/, alors on note : « t :k » si le son est plutôt /t/, ou « k :t » si le son est plutôt /k/.

* Si l’enfant produit un son n’appartenant pas au répertoire de la langue considérée, par exemple un son compris entre /x/ et /k/, on note « +x :t » ou « +x :$t » si le son attendu est /t/.

- Ne peut être transcrit : un son ne peut être transcrit car un bruit empêche de l’annoter ou parce qu’il est prononcé trop faiblement. Si une consonne ne peut être transcrite pour ces raisons, la consonne et la voyelle sont transcrites « m ». Si seule la voyelle ne peut être transcrite, le locuteur note « m » uniquement pour la voyelle et transcrit la consonne normalement.

- Suppression du son attendu : l’enfant ne produit pas le son-cible et ne le remplace pas. On note : deletion

b. Codage des erreurs

En plus des types d’erreurs listés ci-dessus, on fournit un codage pour chaque erreur. Les erreurs sont codées de la façon suivante, sur la ligne de transcription Praat n°6, dans les intervalles 2 (pour la consonne) et 3 (pour la voyelle) :

- Son correct : 1 - Son incorrect : 0

On utilise ce symbole lorsque la production sort de l’espace phonétique du son cible. - Erreur de voisement : V

On n’utilise ce symbole que pour les consonnes, lorsque le lieu et le mode d’articulation sont corrects mais le voisement est incorrect.

- Production émergente : E

On n’utilise ce symbole que pour les fricatives (ou pour la partie fricative d’une affriquée). On l’utilise lorsque le début de la fricative est incorrect mais que la fin est correcte, c’est-à-dire lorsque l’enfant finit par atteindre la fricative attendue.

c. Codage des insertions

Les insertions sont codées de la façon suivante, dans l’intervalle 5 de la ligne Praat n° 6 (ou dans la ligne réservées aux notes) :

(l’insertion a lieu avant la voyelle).

- On utilise le code « non-initial » lorsqu’un son est inséré avant la consonne (comme un article, une hésitation).

d. Codage des commentaires

Les commentaires sont codés dans la ligne Praat réservée aux notes. Les codes suivants sont utilisés :

- dev : la voyelle est dévoisée - split CV : C et V sont séparées

- merged : la syllabe initiale est supprimée et un nouveau son prend sa place. - prevoicing : la consonne est prévoisée

- nasalpause : la consonne est prévoisée et il y a une pause entre le prévoisement et le burst.

- syllable deletion : la production de l’enfant contient moins de syllabes que le mot cible.

- initial syllable deletion : la syllabe initiale est supprimée

Toutes les consonnes d’attaque des mots en français et en drehu et des non-mots, ainsi que toutes les voyelles consécutives à ces consonnes ont été transcrites en suivant cette méthodologie.

1.10.4. Homogénéité des codages entre transcripteurs.

Les répétitions de mots concernant des enfants français des tranches d’âge 1, 2, 4, 6 et 8 ont été transcrites à nouveau par deux autres transcripteurs afin de vérifier l’homogénéité dans les transcriptions. Le choix des enfants s’est fait au hasard dans chacun des quatre âges (2 ans, 3 ans, 4 ans, 5 ans). Les transcripteurs étaient deux étudiantes en licence de sciences du langage à l’université de Grenoble, qui ont travaillé ensemble.

Les résultats sont reportés dans le tableau ci-dessous : nous observons que les pourcentages d’homogénéité sont élevés entre les transcriptions de ces étudiantes et nos propres transcriptions, même pour les 2 enfants de 2 ans (2,6 ans et 2,4 ans).

Tableau 20 : Pourcentage d'homogénéité entre transcripteurs pour les enfants français. Par exemple : E3_5_8_M3 est le troisième enfant enregistré et âgé de 5 ans et 8 mois, ayant répété la liste 3.

Nom de l’enfant français Pourcentage d’homogénéité (consonne et voyelle) E3_5_8_M3 88.9 et 91.5 E1_5_7_M2 94 et 98.3 E11_4_10_M4 81.3 et 91 E17_4_6_M4 91.5 et 94.9 E2_3_8_M3 76.9 et 87.18 E4_3_8_M4 84.6 et 89.7 E14_2_6_M2 82.5 et 85 E2_2_4_M2 81.3 et 80.5

Il est intéressant de noter que les étudiantes n’ont pas remarqué d’accent particulier chez ces enfants de Nouméa.

Les deux étudiantes ont également transcrit les données en drehu, après avoir été formées rapidement à la phonologie de cette langue. De nouveaux, 6 enfants ont été pris au hasard dans les 3 groupes d’âge (deux enfants parmi la tranche d’âge 1, deux enfants parmi la tranche d’âge 2 et deux enfants parmi la tranche d’âge 3).

Même si les étudiantes qui ont fait les nouvelles transcriptions n’étaient pas locutrices du drehu, de la même façon que pour les enfants français, les transcriptions sont remarquablement homogènes entre les transcriptions du locuteur natif et celles des étudiantes. Les pourcentages sont reportés dans le tableau ci-dessous :

Tableau 21 : Pourcentage d'homogénéité entre transcripteurs pour les enfants drehu. Par exemple : E3_5_8_M3 est le troisième enfant enregistré et âgé de 5 ans et 8 mois, ayant répété la liste 3.

Nom de l’enfant locuteur du drehu Pourcentage d’homogénéité (consonne et voyelle) E2_5_8_M2 88.4 et 99 E2_4_0_M2 68.7 et 91.6 E4_5_1_M3 75.5 et 93.6 E7_4_1_M6 72.1 et 93.8 E11_3_10_M2 72.1 et 89.6 E11_3_0_M2 81.2 et 92.8