• Aucun résultat trouvé

CHAPITRE 4 : Étude de production (1 ère étude expérimentale) : méthodologie

2. Analyses acoustiques

2.2. Consonnes : VOT, moments spectraux

2.2.4. Moments spectraux

2.2.4.1.Caractérisation acoustique des fricatives

Calliope (1989) définit la fricative comme un « bruit [qui résulte] d’une turbulence aérodynamique qui prend naissance en un ou plusieurs points du conduit vocal en raison de la présence d’un fort resserrement (ou constriction) ou d’un obstacle placé dans le flot d’air expiratoire »27. L’intensité du bruit de friction provoque une perturbation acoustique, visible sur le spectrogramme sous la forme de « stries verticales plus ou moins longues, d’intensité variable » (Calliope, 1989), qui peuvent être accompagnées d’une barre de voisement s’il s’agit de fricatives voisées (par exemple /v/, /z/ ou /ʒ/). Plusieurs caractéristiques acoustiques permettent d’analyser une fricative : le centre de gravité qui correspond à la zone de fréquences excitée lors de la production de la fricative, la dispersion du bruit, la (dis-)symétrie du bruit sur la zone de fréquence et l’amplitude du bruit. Ces quatre caractéristiques sont appelées les moments spectraux.

Calliope (1989) propose une caractérisation des fricatives selon le lieu d’articulation : /s/ et /z/ sont produites avec un bruit localisé dans les fréquences comprises entre 4000 et 8000 Hz, /ʃ/ et /ʒ/ avec un bruit de forte intensité et localisé entre 1600 et 2500 Hz, enfin /f/ et /v/ avec un bruit assez peu intense et localisé en deux points à 3500 Hz et 8000-10000 Hz. Ces valeurs sont celles de locuteurs adultes, mais des études de production de fricatives (Nissen & Fox, 2005, Körkkö, 2015, Nittrouer, 1995) indiquent que les fricatives sont réalisées différemment par les adultes et les enfants, avec des réalisations également différentes par les enfants selon le lieu d’articulation.

De façon générale, il existe dans la littérature assez peu d’études sur la production des fricatives et la plupart sont des études sur des populations d’enfants et d’adultes présentant des difficultés de production liées à l’audition (présentées dans le chapitre 3 ci-dessus) ou à une pathologie. Il existe également quelques études développementales utilisant des moments spectraux pour caractériser acoustiquement les productions de fricatives par les enfants. Nous allons proposer un aperçu de ces études développementales dans le paragraphe suivant.

2.2.4.2.Moments spectraux dans les études développementales

Plusieurs études développementales utilisent des mesures de moments spectraux pour caractériser l’acquisition des fricatives chez les enfants. Nous allons présenter les études de Nissen & Fox (2005), Nittrouer (1995), Li et al. (2009) et Körkkö (2015) qui caractérisent des productions de fricatives et leur évolution lors de l’acquisition de la langue maternelle par les enfants.

Nissen & Fox (2005) étudient des productions des fricatives /f, θ, s, ʃ/ par 30 enfants de trois à six ans de mots monosyllabiques CV(C)(C) dans des phrases porteuses, enregistrés lors d’une tâche de répétition. Cette étude chez des enfants anglophones a pour but de proposer une description acoustique de la production typique de fricatives non voisées chez des enfants en la comparant à une production d’adultes, d’étudier les effets de caractéristiques individuelles telles que l’âge, le genre, le lieu d’articulation, le contexte vocalique sur la réalisation des fricatives, puis d’étudier les combinaisons de paramètres acoustiques qui permettent de caractériser les fricatives. Nissen & Fox (2005) prennent en compte plusieurs mesures, dont quatre moments spectraux : 1) la moyenne spectrale (1er moment), qui correspond au centre de gravité dans d’autres études, et

qui est mesurée en Hz, puis transformée en ERB, 2) la variance spectrale ou écart-type (2ème

moment), 3) le coefficient de dissymétrie ou « skewness » (3ème moment), et 4) le coefficient d’aplatissement ou « kurtosis » (4ème moment). La figure 4.13 ci-dessous présente les résultats de l’étude de Nissen & Fox (2005).

Figure 4.13 : représentation des 1er (haut, gauche), 3ème (haut, droite) et 4ème (bas) moments spectraux, dans l’étude de Nissen & Fox (2005)

Nissen & Fox (2005) montrent notamment un effet du lieu d’articulation sur le centre de gravité des fricatives chez adultes et enfants, ainsi qu’un effet de l’interaction lieu-âge sur ce centre de gravité. Il est important de noter que les trajectoires d’évolution vers la production adulte ne sont pas les mêmes selon les fricatives : le centre de gravité de /f/ est stable chez les trois groupes d’enfants, mais inférieur à celui des adultes, celui de /θ/ augmente légèrement pour atteindre un niveau similaire à celui des adultes, dès quatre ans, celui de/s/ augmente fortement et de façon constante vers la cible adulte, enfin, celui de /ʃ/ a la trajectoire inverse aux autres fricatives, puisqu’il est très élevé chez les enfants les plus jeunes, puis il décroit vers la cible adulte. Cette étude met également en évidence un effet du lieu d’articulation sur l’écart-type qui distingue fricatives sibilantes /s/ et / ʃ/ des non sibilantes /f/ et /θ/ : les sibilantes ont un écart-type plus petit que les non-sibilantes, ce qui correspond à une concentration d’énergie autour du centre de gravité pour les sibilantes. Nissen & Fox (2005) mettent également en évidence un effet du lieu d’articulation sur le coefficient de dissymétrie qui est plus élevé pour les /ʃ/ chez les adultes et tous les enfants, ainsi qu’un effet de l’âge (entre adultes et enfants, mais pas entre les groupes d’enfants d’âges différents) et de l’interaction âge-lieu d’articulation sur le coefficient de dissymétrie. Enfin, les résultats de Nissen & Fox (2005) indiquent un effet du lieu d’articulation (/ʃ/ vs les autres lieux), de l’âge et de l’interaction lieu-genre sur le coefficient d’aplatissement qui est globalement plus bas chez les adultes, sauf pour /ʃ/. Cette étude montre donc que le développement articulatoire n’est pas stabilisé et n’a pas atteint une maturation comparable à celle

des adultes, pour les enfants de cette étude, et les auteurs concluent que ce développement continue même après l’âge de sept ans. Cette étude montre également qu’il existe une différence marquée entre consonnes sibilantes et non-sibilantes dans le développement du contrôle articulatoire par les enfants.

L’étude de Nittrouer (1995) s’intéresse aux productions de deux fricatives /s/ et /ʃ/ chez des enfants de trois, cinq et sept ans, en les comparant à celles d’adultes. Cette étude s’intéresse notamment à la réalisation des fricatives selon le lieu d’articulation et le contexte vocalique. La figure 4.14 ci-dessous présente les résultats de cette étude pour le premier moment spectral (centre de gravité).

Figure 4.14 : représentation du 1er moment spectral par lieu d’articulation (gauche) et par lieu et contexte vocalique (droite), dans l’étude de Nittrouer (1995)

Les résultats de cette étude montrent un effet de l’âge (adultes vs enfants), du lieu d’articulation et du contexte vocalique sur le centre de gravité : le centre de gravité est plus élevé chez les enfants que chez les adultes, plus élevé pour /s/ que pour /ʃ/ chez les adultes et les enfants, et plus élevé en contexte /#_i/ puis /#_u/ puis /#_a/. Par ailleurs, la différence entre centres de gravité de /s/ et /ʃ/ est plus grande chez les adultes que chez les enfants. Nittrouer (1995) indiquent un effet de l’âge et du lieu d’articulation sur le coefficient de dissymétrie (skewness) : les fricatives produites par les adultes ont un coefficient positif plus élevé que celles qui sont produites par les enfants, et le coefficient de dissymétrie de /ʃ/ est positif et plus élevé que celui de /s/. Enfin, les résultats de cette étude font état d’un coefficient d’aplatissement plus plat pour /ʃ/ que pour /s/ pour tous les groupes d’enfants et d’adultes, ce qui indique que /ʃ/ est produit avec une concentration d’intensité plus faible que /s/. Pour Nittrouer (1995), la production de fricatives d’enfants de sept ans n’a pas encore atteint une maturité de contrôle comparable à celle des adultes, ce qui serait lié à une capacité de constriction des articulateurs en cours d’acquisition, qui ne permet pas encore aux enfants de cet âge de produire distinctement /s/ et /ʃ/. Cette étude propose également une caractérisation de l’évolution de la production des occlusives /k/ et /t/ par les mêmes enfants : à la différence de ce qui se passe pour les fricatives, les enfants de sept ans ont atteint une production des occlusives similaire à celle des adultes. Nittrouer (1995) en déduit que la coordination des gestes articulatoires nécessaires à la production des occlusives serait acquise avant la coordination des gestes utilisés pour la production des fricatives.

Li et al. (2009) proposent une comparaison de l’acquisition du lieu d’articulation de deux fricatives par des enfants anglophones américains et japonophones de deux et trois ans : la

fricative alvéolaire/s/ et la fricative (alvéo-)palatale /ʃ/ de l’anglais ou /ɕ/ du japonais. Pour cette étude, les enfants sont enregistrés dans une tâche de répétition de mots qui contiennent la fricative cible en position initiale de mot. Leurs productions sont analysées acoustiquement (moments spectraux) et par le biais de transcriptions phonétiques fines. Les productions des deux groupes d’enfants sont également comparées à celles d’adultes enregistrés selon la même procédure. Les résultats de l’étude indiquent qu’il existe une plus grande différence de localisation du centre de gravité entre les lieux d’articulation chez les adultes anglophones que chez les adultes japonophones. Pour les deux groupes en revanche, l’analyse de l’écart-type de /s/ et de /ʃ-ɕ/ indique une plus grande variance pour /s/, qui est plus diffus que /ʃ-ɕ/. Le coefficient d’aplatissement est à l’inverse chez les deux groupes : plus plat pour /ʃ/ que /s/ chez les anglophones alors qu’il est plus plat pour /s/ que pour /ɕ/ chez les japonophones. Les résultats des enfants indiquent une moins bonne distinction entre les deux lieux d’articulation que ce qui était observé chez les adultes, mais cette distinction se traduit cependant par des moments spectraux statistiquement différents entre les deux consonnes pour les enfants chez qui ce contraste est présent perceptivement. Li et al. (2009) montrent des différences entre les réalisations des deux types de consonnes par les deux groupes d’enfants : en combinant analyses perceptives (qui correspondent aux transcriptions phonétiques) et analyses acoustiques (avec les quatre moments spectraux), il ressort de cette étude que les enfants anglophones produisent /s/ plus correctement que /ʃ/ alors que les enfants japonophones produisent /ɕ/ plus correctement que /s/. Cette étude contribue à montrer que l’acquisition des fricatives reflète les caractéristiques de la langue maternelle des enfants, et qu’à l’âge de deux ou trois ans, le contrôle articulatoire nécessaire à une production comparable à celle des adultes n’est pas encore acquis, ce qui confirme les résultats de l’étude de Nittrouer (1995) réalisée auprès d’enfants plus âgés, notamment la distinction du lieu d’articulation qui se traduit par une distance plus grande entre les centres de gravité de /s/ et /ʃ/ chez les adultes, et que les enfants n’ont pas encore acquise. La dernière étude qui s’intéresse à l’acquisition de fricatives est celle de Körkkö (2015). Cette étude propose une caractérisation acoustique de la variation allophonique de /s/ en contexte /i_i/, /y_y/, /u_u/, /æ_æ/ et /ɑ_ɑ/, et l’évolution de cette variation dans l’acquisition de la langue maternelle. Les enfants de cette étude sont regroupés par groupe d’âge (six, neuf et onze ans) et leurs productions sont comparées à celles d’adultes. Dans cette étude, deux moments spectraux (centre de gravité et écart-type) sont utilisés pour caractériser acoustiquement les productions enregistrées. Les résultats indiquent un effet de l’âge et du sexe sur la réalisation du centre de gravité, mais également un effet du contexte vocalique. En contexte /i_i/, le centre de gravité est plus élevé alors qu’en contexte /u_u/, celui-ci est plus bas. Körkkö (2015) observe en outre une variation moins grande de la hauteur du centre de gravité pour tous les contextes vocaliques chez les enfants de neuf et onze ans que chez les adultes, alors que cette variation est similaire à celle des adultes chez les enfants de six ans, sauf pour les contextes /æ_æ/ et /ɑ_ɑ/. Il ressort de cette étude que les adultes sont plus sensibles aux effets de la coarticulation et du contexte vocalique que les enfants, chez qui ces effets sont moins marqués : la production des fricatives n’aurait pas atteint une production d’adultes, même à l’âge de 11 ans, et ce processus d’acquisition se ferait en dents de scies pendant cette période. D’après Körkkö (2015), ces effets du contexte sur la réalisation de la fricative /s/ pourraient être liés à un effet de variation plus important de la production de voyelles chez les enfants.

Ces quelques études centrées sur l’acquisition de la production de fricatives ont mis en évidence une variation assez importante des enfants par rapport aux adultes et une trajectoire d’acquisition qui ne semble pas linéaire, comme ce qui pouvait être le cas dans les études développementales centrées sur la production d’occlusives. Cette acquisition est influencée par le lieu d’articulation pour Nissen & Fox (2005) et Nittrouer (1995), par la langue maternelle pour Li et al. (2009) ou encore par le contexte vocalique pour Nittrouer (1995) et Körkkö (2015). Notre étude de production se propose d’étudier ces facteurs ainsi que l’effet de l’audition sur l’acquisition du mode d’articulation fricatif chez des enfants sourds, porteurs d’implant cochléaire et normo-entendants. Dans le paragraphe suivant, nous allons détailler notre méthodologie de mesure des moments spectraux.

2.2.4.3.Mesure des moments spectraux

Pour mesurer les moments spectraux des consonnes /f/, /s/ et /ʃ/ en contexte /#_i/ et /#_u/, nous adoptons une méthodologie similaire à celle de Li et al. (2009). Dans un premier temps, nous utilisons un script Praat (Boersma, P. & Weenink, D. (2015)) qui, pour chaque son, à partir du fichier d’annotation TextGrid, extrait les temps où nous avons placé les points « dv » (pour début du voisement) et « fr » (pour début de la fricative). Notre méthode d’annotation est décrite en détails au paragraphe §1.4.2 ci-dessus. Pour chaque mot du corpus utilisé pour l’étude des consonnes, nous avons placé le point « fr » au début de la perturbation du signal acoustique de la fricative, et nous avons placé le point « dv » lorsque le signal devient périodique, ce qui correspond à l’apparition d’une structure formantique, qui survient toujours après le point « fr », puisque toutes les fricatives que nous analysons sont non-voisées. A partir de ces relevés, nous calculons la durée de la fricative avec la formule : durée=Tdv-Tfr. A partir de cette mesure, nous calculons le point temporel correspondant au centre de la fricative. A partir de ce centre, nous définissons puis extrayons une fenêtre de 40 ms (20 ms avant et 20 ms après le centre de la fricative). A partir de cette fenêtre, nous extrayons les quatre moments spectraux suivants : centre de gravité, écart-type, coefficient de dissymétrie et coefficient d’aplatissement. La figure 4.15 ci-dessous présente ces mesures des moments spectraux pour une fricative labio-dentale.

Figure 4.15 : fenêtre utilisée pour mesurer les quatre moments dans le mot « ficelle » produit en répétition par l’enfant NH24

2.3. Coarticulation

La coarticulation est définie par Noiray et al. (2013) comme « the articulatory overlapping of a sound on another one »28. La parole est donc constituée d’un enchaînement de sons qui

interagissent les uns avec les autres lors de leur production. Ainsi, parallèlement à l’étude des différents segments (voyelles, consonnes) individuellement, nous proposons une étude de la réalisation de la coarticulation par les deux groupes d’enfants, normo-entendants et porteurs d’implant cochléaire. Nous avons décidé, pour caractériser cette coarticulation, d’utiliser la mesure de l’équation de locus, dont nous allons proposer une description dans la suite de ce paragraphe.