• Aucun résultat trouvé

Première'partie!:"Introduction!

2) Filtre supraglottique

1.1.2 Lien articulatoire-acoustique dans la modélisation des voyelles

Si Chiba et Kajiyama, puis Fant et Stevens ont pu poser les fondements de la théorie acoustique de la parole, les progrès sont dus initialement aux modèles mécaniques du conduit vocal, élaborés sur la base de données physiologiques, telles que la radiographie, palatographie et laryngoscopie, puis aux modélisations basées sur l’informatique.

Le nombre de tubes droits strictement nécessaires pour modéliser correctement une voyelle varie. Il est possible de modéliser la forme du conduit vocal pour produire une voyelle par un (la voyelle neutre [œ]), deux (les voyelles [ɑ], [i] ou [y]) ou quatre tubes (la voyelle labiale [u]) (Stevens, 1998). Il existe des modèles plus complexes comme celui de Maeda (1982) qui utilise sept paramètres articulatoires (ce modèle est plus largement décrit dans le chapitre 4 qui traite des outils dans l’enseignement de la phonétique).

La voyelle [œ] peut être modélisée par un seul tube, fermé à la glotte et ouvert aux lèvres (Figure 3, page 28) long de 17,5 cm pour un homme. Les formants correspondent alors à des résonances quart d’onde de ce tube. La formule qui permet de calculer une résonance quart d’onde est la suivante : F = c/4L * (2n+1), où F correspond à la résonance, c représente la vitesse de l’air et L la longueur du conduit vocal. L’espacement des formants F1-F2-F3 pour la voyelle [œ] en français est équidistant (Kamiyama and Vaissière, 2009). Un allongement de ce tube va faire baisser tous les formants et on obtient le timbre [ø].

Figure 3 : Modèle avec un tube pour [œ], avec la glotte à gauche et les lèvres à droite. Adaptation selon (Fant 1960)

La voyelle pharyngale [ɑ] peut être modélisée par deux tubes (Figure 4) : un tube pharyngal très étroit, fermé-ouvert qui part de la glotte, comprend la constriction et correspond à une résonance quart d’onde qui détermine le premier formant (ou le second si le tube postérieur est plus court que le tube antérieur). Le tube buccal fermé-ouvert est celui entre la constriction et les lèvres, il est large et présente une résonance quart d’onde, souvent à l’origine du deuxième formant. Pour résonner à la même fréquence, les deux cavités doivent être de longueur effective similaire.

Figure 4 : Modèle de deux tubes pour [ɑ] avec la glotte à gauche et les lèvres à droite. 1 = cavité buccale, 2 = cavité pharyngale. Adaptation selon Fant (1960)

Dans les cas des voyelles antérieures très fermées [i, y], la valeur très basse de F1 est une résonance de Helmholtz. Cette résonance résulte de la combinaison d’une grande cavité (ici la cavité postérieure) avec un goulot étroit. La fréquence peut être calculée avec la formule RH = c/2π*

√A/L*V. La fréquence F1 diminue quand le volume de la cavité postérieure V (cm3) augmente, quand la longueur L (cm) du goulot augmente et quand le volume A (cm2) du goulot diminue. Les deux tubes, antérieur et postérieur, (fermé-fermé et ouvert-ouvert) engendrent des résonances mi-onde (F = nc/2L). F2 dépend du tube le plus long et F3 du tube le plus court : le F2 de [i] est une résonance demi-onde de la cavité postérieure qui est plus longue que la cavité antérieure, calculée avec la formule F = nc/2L, et F3 une résonance demi-onde de la cavité antérieure (la plus courte des cavités). Dans le passage de [i] à [y], il se produit un changement d’affiliation. La cavité antérieure se prolonge par l’avancement des lèvres, devient plus longue que la cavité postérieure, et détermine désormais le F2.

En revanche, la cavité postérieure se raccourcit et détermine le F3. Les voyelles [i, y], modélisées avec deux tubes, sont démontrées à la Figure 5. Afin d’obtenir un F3 maximalement élevé dans la cas de [i], il faut réduire au maximum la longueur de la cavité antérieure, et donc faire une constriction la plus avancée et la plus étroite possible dans la partie avant du conduit vocal et d’étirer les lèvres. Afin d’obtenir un F3 maximalement bas dans le cas de [y], il faut allonger au maximum la longueur effective de la cavité antérieure, et donc avancer et arrondir les lèvres et éventuellement reculer la constriction et l’élargir.

Pour modéliser la voyelle [u], les quatre tubes du modèle de Fant sont nécessaires car deux constrictions se produisent, au niveau vélaire et au niveau labial. Les quatre tubes correspondent respectivement à la cavité pharyngale, à la constriction vélaire réalisée par le dos de la langue, à la cavité buccale et à la constriction labiale.

Figure 5 : Modèle de deux tubes pour [i] (à gauche) et [y] (au milieu), avec la glotte à gauche et les lèvres à droite. 1 = cavité buccale, 2 = cavité pharyngale. Adaptation selon (Fant 1960). Changement d’affiliation de cavités que l’on peut voir sur le spectrogramme du [i] et [y] (à droite)

Les deux premiers formants sont dus à une résonance de type Helmholtz, le troisième formant serait dû à la résonance demi-onde du tube de constriction centrale et le quatrième formant dépend de la résonance demi-onde du tube buccal (Maeda and Carré, 1996). L’énergie pour [u] se concentre dans la région (F1F2), et les troisième et quatrième formants, peu intenses, ont un poids perceptif négligeable.

Dans le modèle à quatre tubes de Fant (1960), les paramètres utilisés pour faire varier la longueur et l’aire de chaque tube sont au nombre de trois et ils correspondent à la position de la constriction entre la glotte et les lèvres, au degré de la constriction et/ou à l’arrondissement/ étirement des lèvres. Les nomogrammes de Fant (voir Figure 6, page 30) illustrent les conséquences acoustiques d’un changement de l’un des ces trois paramètres articulatoires en termes d’évolution des cinq premiers formants. Les fréquences des formants dus à une cavité diminuent lorsque la longueur de cette cavité augmente. La longueur de la cavité antérieure diminue quand la cavité postérieure s’allonge et donc les formants dus à chacune de ces cavités évoluent en sens inverse, si la configuration des lèvres reste identique. Dans le cas des formants liés à la cavité antérieure, leur valeur diminue au fur et à mesure que la constriction s’éloigne des lèvres, c’est-à-dire lorsque la langue recule et/ou les lèvres s’allongent (par arrondissement ou protrusion). Nous avons indiqué par des flèches à la Figure 6 les endroits de convergence acoustique où les résonances des cavités en avant et en arrière de la constriction se croisent (appelés également les points focaux). Les convergences de F1/F2 se trouvent dans la région près de la glotte alors que les convergences de F2/F3 ou F3/F4 se produisent dans la région en avant du conduit vocal.

Figure 6 : Modèle à quatre tubes et nomogrammes de Fant (1960) représentant la glotte à droite, les lèvres à gauche.

Les flèches indiquent les points focaux