CHAPITRE I. La vision pour percevoir la parole : « Quand les lèvres ont besoin d’un coup
II.3. Les modèles d’anticipation labiale
II.3.1. Trois modèles de production pour l’anticipation
L’anticipation vocalique d’arrondissement a été largement étudiée sur le plan articulatoire, à partir du
geste de la lèvre supérieure, pour des séquences V1CnV2, où V1 est une voyelle étirée comme [i], V2
une voyelle arrondie comme [u] et Cn, une ou plusieurs consonnes.
Le modèle dit « Look-ahead » de Henke (1967) prédit que le geste de protrusion/arrondissement du [u]
dans des séquences [iCnu] peut démarrer dès la fin acoustique du [i]. Ce modèle s’appuie sur la
caractéristique d’arrondissement des phonèmes : les segments caractérisés par le trait arrondi sont
notés par la valeur « + », ceux caractérisés par le trait non arrondi sont notés « - » et les segments non
spécifiés (unspecified) au niveau de ce trait sont notés « 0 ». Dans la production d’une suite de
phonèmes, la caractéristique + ou - arrondie pour un phonème va s’étendre à tous les segments
précédents qui ne sont pas spécifiés, c’est-à-dire à tous ceux qui ont la valeur 0. Ainsi, dans une
séquence [iCnu], dans laquelle les consonnes sont « neutres » du point de vue de l’arrondissement,
l’arrondissement du [u] va commencer dès la fin du [i]. Benguérel et Cowan (1974) ont par ailleurs
démontré, pour des locuteurs français, que le geste de protrusion des lèvres, dû à la voyelle arrondie
[y] ou [u], peut commencer à la première consonne d’une suite de six consonnes successives dans des
séquences de type [iC1…6Varrondie]. En outre, dans des séquences de ce type n’incluant que quatre
consonnes intervocaliques, le geste de protrusion peut même démarrer durant la production de la
voyelle non arrondie [i]. Ainsi dans ce modèle, le geste de protrusion est déterminé par le contexte
acoustico-phonétique (dans la mesure où la caractéristique d’arrondissement s’étend à tous les
segments précédents jusqu’à rencontrer une articulation opposée) et augmente donc avec la longueur
de la séquence consonantique.
Le modèle « Time-locked » (aussi appelé frame model ou modèle de coproduction, voir Boyce et al.,
1990) proposé par Bell-Berti et Harris (1981, 1982) prédit au contraire, pour des séquences [iCnu], que
le geste de protrusion des lèvres pour former la voyelle [u] ne dépend pas de la fin acoustique de la
voyelle non arrondie, mais commence à date fixe avant le début acoustique du [u], quel que soit le
nombre de consonnes intervocaliques. Le début du geste de protrusion peut éventuellement dépendre
du rythme de parole mais en aucun cas de la longueur de la séquence consonantique intervocalique.
Dans ces séquences, c’est donc l’intervalle entre la fin acoustique du [i] et le début du geste de
protrusion du [u] qui varie ; le geste de protrusion est quant à lui invariant. D’après ces auteurs, le
geste de protrusion est relié essentiellement à l’articulation de la voyelle arrondie (à sa dynamique
gestuelle) et ne dépend pas du contexte avoisinant, et donc ne s’étend pas à l’articulation des
consonnes non arrondies comme dans le modèle Look-ahead, mais ce geste est en fait « co-produit »
avec l’articulation des consonnes (Fowler, 1980) : « […] the specification of lip position for the
consonants is not altered by a migrating vowel feature. Instead, […], we see the vowel-rounding
gesture beginning at a relatively fixed time before the acoustic onset of the vowel and simply
co-occuring with some portion of the preceding lingual consonant articulations. » (Bell-Berti & Harris, 1982,
p. 454). Dans ce cas, il semblerait que ce ne soit pas le phénomène de coarticulation qui soit planifié
mais plutôt le début de la voyelle (Whalen, 1990). Il est à noter que les auteurs (Bell-Berti & Harris,
1982) ont également observé ce patron temporel fixe pour les effets de persévération.
Perkell et Chiang (1986), s’inspirant des résultats obtenus par Bladon et Al-Bamerni (1982) pour la
coarticulation vélaire (ces auteurs ont observé deux patrons différents pour le mouvement
d’anticipation vélaire des consonnes nasales : un geste régulier et un geste à deux étapes), proposent
un « modèle hybride » à deux phases pour le geste de protrusion labiale. Ils observent sur un locuteur
américain, prononçant des séquences du type [Vnon-arrondieCn#Cmu], un geste de protrusion anticipatoire
des lèvres qui se fait en deux étapes : une première étape lente et progressive et une seconde étape
plus rapide et plus importante, les deux étapes étant délimitées par un point d’inflexion sur la trajectoire
correspondant au pic d’accélération le plus important. La première phase du geste suivrait le modèle
Look-ahead et serait donc initiée dès que les contraintes du contexte phonétique avoisinant le
permettent. La deuxième phase du geste serait en revanche indépendante du contexte (et donc de la
longueur de la séquence consonantique intervocalique) et serait initiée à date fixe avant le début
acoustique de la voyelle arrondie, se conformant ainsi plutôt au modèle Time-locked. Perkell (1986)
observe également ce patron « segmenté » du geste de protrusion labiale chez des locuteurs
américains, français et espagnols. Il interprète ce phénomène comme étant le reflet d’une
co-production (Fowler, 1980) entre les segments adjacents : le mouvement entier serait le résultat de la
« somme » des trajectoires articulatoires invariantes qui se chevauchent en partie (« […] it is possible
to conceive of the overall movement pattern as being the result of some kind of ‘summation’ of
overlapping, relatively invariant trajectories for each of the segments in the string. », p. 65).
Pour des séquences Vnon-arrondieCnVarrondie, ces trois modèles prédisent donc une coarticulation labiale
différente (voir une représentation des différentes prédictions sur la Figure 11). Perkell (1990) a testé
ces trois modèles chez quatre locuteurs américains produisant des transitions [iCnu] dans des phrases
de type « It’s a lee coot again » (n=1) ou du type « It’s a leaked scoot again » (avec n=4 consonnes
intervocaliques). L’auteur observe chez ces locuteurs une grande variabilité dans le déploiement
spatio-temporel du geste de protrusion labiale, mais il remarque cependant que ce geste de protrusion
est la plupart du temps divisé en deux phases, une phase initiale lente et une seconde phase plus
rapide, comme le proposait le modèle « hybride » (voir aussi Perkell & Matthies, 1992). Il exprime les
différentes prédictions des modèles sous la forme de relations entre des intervalles temporels : (i)
l’intervalle acoustique, temps entre la fin acoustique du [i] et le début acoustique du [u] (acoustic
interval), (ii) l’intervalle de mouvement, temps entre le début du mouvement de protrusion des lèvres et
le début acoustique du [u] (movement interval) et (iii) l’intervalle d’accélération, temps entre le pic
d’accélération et le début acoustique du [u] (acceleration interval). Les prédictions des trois modèles
peuvent alors être représentées sous forme de relations linéaires entre deux intervalles.
Figure 11. Représentation schématique des différentes prédictions des trois modèles d’anticipation du geste de protrusion labiale pour une séquence du type [iCny] (signal acoustique schématisé en haut). Chaque tracé représente la protrusion labiale de la lèvre supérieure en fonction du temps. Les points noirs indicés de v=0+ correspondent au début du geste de protrusion, déterminé au moment où la vitesse de la courbe passe à 0. Le point noir indicé de γMax indique le moment du pic d’accélération, qui détermine le début de la 2ème phase du geste de protrusion dans le modèle hybride. (Figure tirée de Cathiard, 1994).
En ce qui concerne l’intervalle de mouvement, pour les modèles Look-ahead et Hybride, il devrait
augmenter linéairement en fonction de l’intervalle acoustique (avec une pente de 1) et être
indépendant (pente à 0) pour le modèle Time-locked. En revanche, l’intervalle d’accélération devrait
être indépendant de l’intervalle acoustique (pente à 0) pour le modèle Hybride. L’auteur mesure donc
ces différentes variables chez les locuteurs testés et s’aperçoit qu’en fait, aucun des modèles proposés
ne peut expliquer entièrement la coarticulation labiale observée dans cette expérience : il rejette donc
ces trois modèles, du moins dans leur version forte. Perkell et Matthies (1992) proposent un
compromis pour l’anticipation coarticulatoire du geste de protrusion labiale qui subirait une double
influence du contexte acoustico-phonétique et des propriétés dynamiques des mouvements. Ils
proposent finalement la compétition de trois contraintes pour ce geste de protrusion des lèvres : (1) le
locuteur doit utiliser une durée préférentielle du geste (cette contrainte est en accord avec les modèles
de coproduction comme le modèle Time-locked), (2) le geste de protrusion peut commencer dès que la
contrainte pour la voyelle non arrondie est relâchée (cette contrainte est en accord avec le modèle
Look-ahead) et (3) le geste de protrusion doit se terminer pendant la partie voisée de la voyelle
arrondie (cette contrainte est en accord avec les deux modèles).
Dans le document
La Langue Française Parlée Complétée: Production et Perception
(Page 74-77)