CHAPITRE VI. Expérience 3 : généralisation à d’autres locuteurs-codeurs sur des séquences
VI.2. Résultats
VI.2.1. Schéma temporel de coordination pour les trois codeuses
VI.2.2.1. Geste manuel 22
Examinons tout d’abord le geste LPC indépendament de sa coordination avec les événements
temporels de parole. Comment les durées de transition de main évoluent-elles dans le domaine de la
syllabe ? Nous avons sur la Figure 39 le déploiement du geste de transition LPC en fonction de la
durée de la syllabe CV pour chaque codeuse. Comme nous pouvons le remarquer, il ne semble pas y
avoir de lien entre la durée de la transition de main et la durée de la syllabe : les nuages de points sont
en effet très dispersés. Le calcul des corrélations confirme cette observation : les coefficients sont tous
non significatifs au seuil de 1% : r= 0,05 pour AM, r= 0,19 pour SC (significatif à 5% mais plus à 1%,
p= 0,0146 ; notons que la part de variance expliquée est seulement de 3,7%) et r= 0,02 pour RV. Ainsi,
pour les trois codeuses, les durées de transitions manuelles ne varient pas en fonction de la durée de
la syllabe. Globalement, les transitions de main peuvent durer de 100 ms à 300 ms, indépendamment
de la durée de la syllabe produite. Rappelons que nous avions montré précédemment que la durée de
cette transition manuelle était statistiquement stable (section VI.2.1), ce qui ne signifie pas sans
variance. Ici cette variance n’est pas régulièrement liée à la durée CV.
Figure 39. Evolution des durées de transitions manuelles M1M2 (ms) en fonction de la durée de la syllabe CV pour les trois codeuses.
VI.2.2.2. Coordination main-lèvres-son dans le domaine syllabique : à la
recherche des invariants
Qu’en est-il maintenant de la coordination du geste de main avec la parole ? Comment le patron de
coordination main-lèvres-son mis en évidence évolue-t-il dans le domaine syllabique ? Nous
présentons sur la Figure 40, le positionnement relatif – algébrique (en ms) – des différents événements
M1, M2 et L2, référencés par rapport au début acoustique de la consonne (A1) pour l’ensemble des
séquences, en fonction de la durée de la syllabe CV (ms). Nous avons également calculé les équations
des droites d’ajustement linéaire ainsi que les coefficients de corrélation (indiqués à côté de chaque
graphe pour chaque événement). A première vue, ce qui ressort graphiquement est le fait que les trois
événements temporels M1, M2 et L2 semblent déterminer trois « zones » bien distinctes dans le
domaine syllabique : nous pouvons constater en effet que globalement les nuages de points pour
chaque événement ne se mélangent pas. Nous retrouvons donc en fonction de la durée de la syllabe
CV, le schéma de coordination temporelle main-lèvres-son que nous avions mis en évidence
précédemment : la main débute son geste de transition avant le début acoustique de la syllabe et
atteint la position cible LPC en tout début de consonne, soit bien avant la cible labiale vocalique et cela
quelle que soit la durée de la syllabe CV. Remarquons également que nous trouvons chez les trois
codeuses un certain parallélisme des droites ajustées pour M1 et M2, soit une autre façon de voir que
la durée de la transition manuelle M1M2 ne varie pas en fonction de la durée de la syllabe. Notons
cependant que cette représentation n’est pas la meilleure façon pour examiner la préservation
éventuelle, dite invariance, des relations de phases (Benoît & Abry, 1986 ; Gentner, 1987). Son
utilisation a déjà donné lieu à débat dans la littérature (Barry, 1983 ; Munhall, 1985 ; Gentner, 1987 ;
voir Sock, 1998 pour une revue) car elle souffre d’un artefact statistique lié à la corrélation «
tout-partie » (part-whole correlation ; Benoît, 1986 ; le fait de calculer la corrélation entre un ensemble et
ses parties peut engendrer de fortes corrélations ; voir par exemple, Tuller & Kelso, 1984).
Remarquons en ce sens que dans nos données, tous les coefficients de corrélation sont significatifs (à
p< .01) mais peu élevés en ce qui concerne le début (M1) et la fin (M2) de la transition manuelle.
Notons que le positionnement relatif de la cible labiale L2 par rapport au début de la consonne A1 est
bien corrélée à la durée de la syllabe pour les trois sujets (r= 0,76 pour AM, r= 0,81 pour SC et r= 0,82
pour RV, p< .01). Mais nous ne discuterons pas davantage ces données de timing relatif évaluées par
une méthode entâchée d’un artefact statistique. Il était néanmoins nécessaire de les présenter pour
alerter le lecteur sur la critique de cette approche.
La meilleure façon d’étudier le maintien des relations de phases quand la durée de la syllabe augmente
est d’étudier l’évolution des proportions, par rapport à la durée totale de la syllabe, prises par chaque
phase (Benoît & Abry, 1986 ; Gentner, 1987), en utilisant le test de la proportion constante (Constant
Proportion Test) proposé par Gentner (1987), qui consiste à comparer la pente de la droite de
régression avec 0. Cette statistique permet de tester le modèle proportionnel de durée (proportional
duration model, Gentner, 1987 ; ce modèle correspond au concept de Programme Moteur Généralisé
ou PMG, Schmidt, 1982, 1988) qui postule l’invariance relative proportionnelle, c’est-à-dire un maintien
de proportions constantes (par rapport à la durée totale du geste) par les composantes d’un geste,
malgré la variation de la durée totale du geste. Il a déjà été utilisé de nombreuses fois et a permis de
démontrer que pour les activités motrices en général, le modèle proportionnel n’est pas une description
adéquate, c’est-à-dire qu’il n’y a pas réellement d’invariance généralisée (voir Gentner, 1987 et
Jeannerod, 1988 ; plus spécifiquement pour la parole, voir Benoît & Abry, 1986 ; Abry et al., 1990 ;
Löfqvist, 1991 ; Sock, 1998).
L2 : y= 0.87 x - 47 r= 0,76 M2 : y= 0,46 x - 99 r= 0,37 M1 : y= 0,43 x - 260 r= 0,32 L2 : y= 1,06 x - 96 r= 0,81 M2 : y= 0,69 x - 145 r= 0,56 M1 : y= 0,5 x - 278 r= 0,42 L2 : y= 0,90 x - 60 r= 0,82 M2 : y= 0,32 x -34 r= 0,37 M1 : y= 0,31 x - 223 r= 0,35
Figure 40. Organisation temporelle des événements manuels et orofaciaux durant la production de code LPC en fonction du cycle syllabique pour les trois codeuses AM, SC et RV : M1 est le début du geste de transition manuelle (représenté par des triangles), M2 est la fin de la transition (représenté par des croix) et L2 est la cible labiale vocalique (représenté par des cercles). Les événements temporels sont positionnés en relatif (ms) par rapport au début acoustique de la syllabe A1 (représenté par la droite en traits tiretés à 0 ms). Ces graphes complètent ceux de la Figure 41 pour le positionnement relatif proportionnel.
Equations des droites et coefficients de corrélations : Pour M1 : y= 0,4 x – 164 ; r= 0,59 Pour M2 : y= 0,16 x – 34 ; r= 0,31 Pour L2 : y= 0,07 x + 50 ; r= 0,23 Pour M1 : y= 0,44 x – 171 ; r= 0,67 Pour M2 : y= 0,23 x – 48 ; r= 0,46 Pour L2 : y= 0,14 x + 31 ; r= 0,4 Pour M1 : y= 0,33 x – 146 ; r= 0,69 Pour M2 : y= 0,05 x + 4 ; r= 0,16 (non sign.) Pour L2 : y= 0,09 x + 42 ; r= 0,34
Figure 41. Organisation temporelle relative des événements manuels et orofaciaux durant la production de code LPC en fonction du cycle syllabique pour les trois codeuses AM, SC et RV : M1 est le début du geste de transition manuelle (représenté par des triangles), M2 est la fin de la transition (représenté par des croix) et L2 est la cible labiale vocalique (représenté par des cercles). Les événements temporels positionnés par rapport au début acoustique de la syllabe A1 sont exprimés en pourcentages de la durée de la syllabe CV (%rel). La droite en traits tiretés à 0%rel indique le début acoustique de la syllabe, soit l’événement A1. Les droites d’ajustement linéaire (au sens des moindres carrés) pour chacun des événements sont superposées sur chacun des graphiques. Les équations de droite et les coefficients de corrélations (Bravais-Pearson) sont également indiqués.
Qu’en est-il de notre coordination LPC-parole ? Est-ce que la coordination entre la main, les lèvres et le
son suit un timing proportionnel dans le domaine syllabique ? Nous présentons nos données de
coordination LPC-parole en timing proportionnel relatif à la durée de la syllabe acoustique CV dans la
Figure 41 : comme précédemment, les événements temporels M1, M2 et L2 sont référencés par
rapport à A1 (représenté par le zéro dans la figure) mais les intervalles résultants sont exprimés en
pourcentages relatifs de la durée de la syllabe CV (%rel). Nous indiquons également les équations des
droites d’ajustement linéaire (superposées sur chaque graphe pour chaque événement) ainsi que les
coefficients de corrélation de Bravais-Pearson.
Globalement la durée de la syllabe peut varier de 150 ms à 400 ms environ. En ce qui concerne la
relation temporelle entre le début du geste de transition de la main (M1) et le début acoustique de la
syllabe (A1), nous pouvons voir que le début du geste de main se produit globalement entre -150%rel
(pour les syllabes courtes) et 0%rel (pour les syllabes longues), ce qui signifie que la main peut initier
son geste avec une avance de bien plus d’une syllabe (équivalent à 100%rel) jusqu’à être quasiment
synchrone avec le début acoustique de la consonne (0%rel). Pour les trois codeuses, il apparaît
clairement que plus la syllabe est longue, plus l’instant d’initiation du geste manuel se rapproche du
début acoustique A1 de la syllabe en proportion relative à CV, c’est-à-dire que le geste va avoir
tendance à moins anticiper en timing relatif par rapport au début de la consonne quand la syllabe
s’allonge. Il est donc évident que la relation entre le début du geste de main et le début acoustique de
la consonne dans le domaine de la syllabe n’est pas proportionnellement invariante ; nous aurions
autrement obtenu des pentes de droites significativement non différentes de 0 (ce n’est pas le cas car
toutes les pentes sont significativement différentes de 0 : t(AM)= 9,3 ddl= 159, t(SC)= 11,3 ddl= 157 et
t(RV)= 11,9 ddl= 153). De plus, nous pouvons remarquer chez les trois codeuses un comportement
relativement similaire (les trois pentes de droites ajustées sur les M1 ne sont pas significativement
différentes pour les trois sujets : au risque α= 5%, t(AM-SC)= 0,63 ddl= 318 ; t(AM-RV)= 1,25 ddl=
314 ; t(SC-RV)= 2,12 ddl= 312 significatif à 5% mais pas au risque α= 1%).
En ce qui concerne la relation temporelle entre la fin du geste manuel de transition (M2) et le début
acoustique de la syllabe (A1), nous observons cette fois des pentes de droite moins importantes
(pentes à 0,16 pour AM, 0,23 pour SC et 0,05 pour RV). Plus précisément, les pentes pour AM et SC,
bien que relativement faibles, sont significativement différentes de 0 (t(AM)= 4,1 ddl= 159 et t(SC)= 6,6
ddl= 157) alors que celle de RV ne l’est pas (au risque de 5%, t(RV)= 1,9755 ddl= 153 ; notons
cependant que le t théorique est à 1,9756). Ainsi, les codeuses AM et SC semblent avoir un
comportement similaire en fonction de la durée de la syllabe : globalement, pour des syllabes de
durées inférieures à 250 ms, la position de main peut parfois être atteinte avant le début acoustique de
la consonne A1, puis avec l’allongement de la durée de la syllabe, la main atteint sa position après A1
(notons qu’un ajustement linéaire par parties semblerait plus approprié). La codeuse RV, quant à elle,
a davantage tendance à atteindre la position de main après le début de la consonne de manière peu
variable en fonction de la durée de la syllabe. Ainsi l’atteinte de la position cible LPC maintient une
proportion constante avec l’allongement de la durée de la syllabe.
Comment comprendre la coordination de la transition manuelle avec le début acoustique de la
consonne ? Nous avions vu précédemment que la durée absolue de la transition était statistiquement
stable : quand l’anticipation du début du geste était importante (M1A1), la position était atteinte de
manière très proche du début de la consonne (A1M2) et inversement (pour un rappel, voir Figure 37 p.
22). Nous avons ici cette relation en fonction de la durée de la syllabe acoustique CV. Pour des
syllabes courtes, la main commence son geste avec une avance de plus d’une syllabe sur le début
acoustique. Elle atteint sa position de manière synchrone avec le son, voire avec une légère avance
sur le début acoustique de la consonne. Pour des syllabes plus longues, il apparaît que le début du
geste de main se rapproche temporellement du début acoustique de la consonne. Dans ce cas,
l’atteinte de la position cible LPC spatiale se fait plutôt après le début acoustique de la consonne. Il
apparaît donc que la codeuse va beaucoup anticiper le geste manuel par rapport au son quand la
syllabe qui va être produite est courte. Elle va anticiper dans une moindre mesure quand la syllabe qui
va être produite est plus longue. Le sujet a donc tendance à anticiper davantage quand la « cible
temporelle » – la première partie de la consonne – est petite, le point de rencontre temporelle entre la
main et la consonne recquérant plus de précision. Il est important de rappeler, comme nous l’avons vu
plus haut, que la durée de la transition manuelle ne varie pas avec la durée de la syllabe CV (Figure
39). C’est bien la coordination entre les deux qui va changer : en fonction de la durée de la syllabe
qu’elle va produire, la codeuse va « décaler » temporellement plus ou moins le moment de l’initiation
du geste de main de façon à atteindre la position cible LPC durant la consonne. La Figure 42 montre la
distribution (sous forme de boîtes à moustaches) de l’intervalle A1M2 exprimé en pourcentage relatif
de la durée de la consonne acoustique : les bornes à 0 et 100% représentent donc les frontières de la
consonne (début et fin). Nous pouvons voir, pour la majorité des données, que l’atteinte de la position
LPC se fait avant la fin de la consonne acoustique (c’est toujours le cas pour SC). Bien que les
données soient assez dispersées, en moyenne, la position LPC est atteinte à 10% de la durée de la
consonne pour AM, à 16% pour SC et à 33% pour RV (les moyennes sont représentées par des ‘x’ sur
la figure), soit de manière très proche du début acoustique de la consonne.
Figure 42. Boîtes à moustaches représentant la distribution de l’intervalle temporel A1M2 exprimé, pour chaque séquence, en pourcentage de la durée de la consonne acoustique, pour les trois codeuses AM, SC et RV. Chaque boîte indique la médiane, les 1er et 3ème quartiles, les valeurs frontières, les valeur hors normes (‘+’) et la moyenne (‘x’). Les traits tiretés à 0 et à 100 % indiquent le début et la fin de la consonne acoustique.