Trois modèles de production pour l’anticipation

CHAPITRE I. La vision pour percevoir la parole : « Quand les lèvres ont besoin d’un coup

II.3. Les modèles d’anticipation labiale

II.3.1. Trois modèles de production pour l’anticipation

L’anticipation vocalique d’arrondissement a été largement étudiée sur le plan articulatoire, à partir du

geste de la lèvre supérieure, pour des séquences V1CnV2, où V1 est une voyelle étirée comme [i], V2

une voyelle arrondie comme [u] et Cn, une ou plusieurs consonnes.

Le modèle dit « Look-ahead » de Henke (1967) prédit que le geste de protrusion/arrondissement du [u]

dans des séquences [iCnu] peut démarrer dès la fin acoustique du [i]. Ce modèle s’appuie sur la

caractéristique d’arrondissement des phonèmes : les segments caractérisés par le trait arrondi sont

notés par la valeur « + », ceux caractérisés par le trait non arrondi sont notés « - » et les segments non

spécifiés (unspecified) au niveau de ce trait sont notés « 0 ». Dans la production d’une suite de

phonèmes, la caractéristique + ou - arrondie pour un phonème va s’étendre à tous les segments

précédents qui ne sont pas spécifiés, c’est-à-dire à tous ceux qui ont la valeur 0. Ainsi, dans une

séquence [iCnu], dans laquelle les consonnes sont « neutres » du point de vue de l’arrondissement,

l’arrondissement du [u] va commencer dès la fin du [i]. Benguérel et Cowan (1974) ont par ailleurs

démontré, pour des locuteurs français, que le geste de protrusion des lèvres, dû à la voyelle arrondie

[y] ou [u], peut commencer à la première consonne d’une suite de six consonnes successives dans des

séquences de type [iC1…6Varrondie]. En outre, dans des séquences de ce type n’incluant que quatre

consonnes intervocaliques, le geste de protrusion peut même démarrer durant la production de la

voyelle non arrondie [i]. Ainsi dans ce modèle, le geste de protrusion est déterminé par le contexte

acoustico-phonétique (dans la mesure où la caractéristique d’arrondissement s’étend à tous les

segments précédents jusqu’à rencontrer une articulation opposée) et augmente donc avec la longueur

de la séquence consonantique.

Le modèle « Time-locked » (aussi appelé frame model ou modèle de coproduction, voir Boyce et al.,

1990) proposé par Bell-Berti et Harris (1981, 1982) prédit au contraire, pour des séquences [iCnu], que

le geste de protrusion des lèvres pour former la voyelle [u] ne dépend pas de la fin acoustique de la

voyelle non arrondie, mais commence à date fixe avant le début acoustique du [u], quel que soit le

nombre de consonnes intervocaliques. Le début du geste de protrusion peut éventuellement dépendre

du rythme de parole mais en aucun cas de la longueur de la séquence consonantique intervocalique.

Dans ces séquences, c’est donc l’intervalle entre la fin acoustique du [i] et le début du geste de

protrusion du [u] qui varie ; le geste de protrusion est quant à lui invariant. D’après ces auteurs, le

geste de protrusion est relié essentiellement à l’articulation de la voyelle arrondie (à sa dynamique

gestuelle) et ne dépend pas du contexte avoisinant, et donc ne s’étend pas à l’articulation des

consonnes non arrondies comme dans le modèle Look-ahead, mais ce geste est en fait « co-produit »

avec l’articulation des consonnes (Fowler, 1980) : « […] the specification of lip position for the

consonants is not altered by a migrating vowel feature. Instead, […], we see the vowel-rounding

gesture beginning at a relatively fixed time before the acoustic onset of the vowel and simply

co-occuring with some portion of the preceding lingual consonant articulations. » (Bell-Berti & Harris, 1982,

p. 454). Dans ce cas, il semblerait que ce ne soit pas le phénomène de coarticulation qui soit planifié

mais plutôt le début de la voyelle (Whalen, 1990). Il est à noter que les auteurs (Bell-Berti & Harris,

1982) ont également observé ce patron temporel fixe pour les effets de persévération.

Perkell et Chiang (1986), s’inspirant des résultats obtenus par Bladon et Al-Bamerni (1982) pour la

coarticulation vélaire (ces auteurs ont observé deux patrons différents pour le mouvement

d’anticipation vélaire des consonnes nasales : un geste régulier et un geste à deux étapes), proposent

un « modèle hybride » à deux phases pour le geste de protrusion labiale. Ils observent sur un locuteur

américain, prononçant des séquences du type [Vnon-arrondieCn#Cmu], un geste de protrusion anticipatoire

des lèvres qui se fait en deux étapes : une première étape lente et progressive et une seconde étape

plus rapide et plus importante, les deux étapes étant délimitées par un point d’inflexion sur la trajectoire

correspondant au pic d’accélération le plus important. La première phase du geste suivrait le modèle

Look-ahead et serait donc initiée dès que les contraintes du contexte phonétique avoisinant le

permettent. La deuxième phase du geste serait en revanche indépendante du contexte (et donc de la

longueur de la séquence consonantique intervocalique) et serait initiée à date fixe avant le début

acoustique de la voyelle arrondie, se conformant ainsi plutôt au modèle Time-locked. Perkell (1986)

observe également ce patron « segmenté » du geste de protrusion labiale chez des locuteurs

américains, français et espagnols. Il interprète ce phénomène comme étant le reflet d’une

co-production (Fowler, 1980) entre les segments adjacents : le mouvement entier serait le résultat de la

« somme » des trajectoires articulatoires invariantes qui se chevauchent en partie (« […] it is possible

to conceive of the overall movement pattern as being the result of some kind of ‘summation’ of

overlapping, relatively invariant trajectories for each of the segments in the string. », p. 65).

Pour des séquences Vnon-arrondieCnVarrondie, ces trois modèles prédisent donc une coarticulation labiale

différente (voir une représentation des différentes prédictions sur la Figure 11). Perkell (1990) a testé

ces trois modèles chez quatre locuteurs américains produisant des transitions [iCnu] dans des phrases

de type « It’s a lee coot again » (n=1) ou du type « It’s a leaked scoot again » (avec n=4 consonnes

intervocaliques). L’auteur observe chez ces locuteurs une grande variabilité dans le déploiement

spatio-temporel du geste de protrusion labiale, mais il remarque cependant que ce geste de protrusion

est la plupart du temps divisé en deux phases, une phase initiale lente et une seconde phase plus

rapide, comme le proposait le modèle « hybride » (voir aussi Perkell & Matthies, 1992). Il exprime les

différentes prédictions des modèles sous la forme de relations entre des intervalles temporels : (i)

l’intervalle acoustique, temps entre la fin acoustique du [i] et le début acoustique du [u] (acoustic

interval), (ii) l’intervalle de mouvement, temps entre le début du mouvement de protrusion des lèvres et

le début acoustique du [u] (movement interval) et (iii) l’intervalle d’accélération, temps entre le pic

d’accélération et le début acoustique du [u] (acceleration interval). Les prédictions des trois modèles

peuvent alors être représentées sous forme de relations linéaires entre deux intervalles.

Figure 11. Représentation schématique des différentes prédictions des trois modèles d’anticipation du geste de protrusion labiale pour une séquence du type [iCny] (signal acoustique schématisé en haut). Chaque tracé représente la protrusion labiale de la lèvre supérieure en fonction du temps. Les points noirs indicés de v=0+ correspondent au début du geste de protrusion, déterminé au moment où la vitesse de la courbe passe à 0. Le point noir indicé de γMax indique le moment du pic d’accélération, qui détermine le début de la 2ème phase du geste de protrusion dans le modèle hybride. (Figure tirée de Cathiard, 1994).

En ce qui concerne l’intervalle de mouvement, pour les modèles Look-ahead et Hybride, il devrait

augmenter linéairement en fonction de l’intervalle acoustique (avec une pente de 1) et être

indépendant (pente à 0) pour le modèle Time-locked. En revanche, l’intervalle d’accélération devrait

être indépendant de l’intervalle acoustique (pente à 0) pour le modèle Hybride. L’auteur mesure donc

ces différentes variables chez les locuteurs testés et s’aperçoit qu’en fait, aucun des modèles proposés

ne peut expliquer entièrement la coarticulation labiale observée dans cette expérience : il rejette donc

ces trois modèles, du moins dans leur version forte. Perkell et Matthies (1992) proposent un

compromis pour l’anticipation coarticulatoire du geste de protrusion labiale qui subirait une double

influence du contexte acoustico-phonétique et des propriétés dynamiques des mouvements. Ils

proposent finalement la compétition de trois contraintes pour ce geste de protrusion des lèvres : (1) le

locuteur doit utiliser une durée préférentielle du geste (cette contrainte est en accord avec les modèles

de coproduction comme le modèle Time-locked), (2) le geste de protrusion peut commencer dès que la

contrainte pour la voyelle non arrondie est relâchée (cette contrainte est en accord avec le modèle

Look-ahead) et (3) le geste de protrusion doit se terminer pendant la partie voisée de la voyelle

arrondie (cette contrainte est en accord avec les deux modèles).

Dans le document La Langue Française Parlée Complétée: Production et Perception (Page 74-77)