CHAPITRE VI. Expérience 3 : généralisation à d’autres locuteurs-codeurs sur des séquences
VI.2. Résultats
VI.2.1. Schéma temporel de coordination pour les trois codeuses
VI.2.1.1. Organisation temporelle main-lèvres-son 22
Les résultats moyens (et écarts-types) en millisecondes pour les trois sujets sont indiqués dans le
Tableau 3 et schématisés sur la Figure 35 afin de donner un aperçu général des patrons temporels de
coordination obtenus pour chaque sujet.
13 Les événements cinématiques sont repérés manuellement à l’aide du profil d’accélération des
signaux filtrés passe-bas à une fréquence de coupure de 4 Hz. Dans la plupart des séquences, l’événement temporel est étiqueté sur un pic d’accélération (ou de décélération). Quand le pic n’est pas bien marqué, l’événement étiqueté est approximé au point le plus proche temporellement sur le signal de position.
Durées moyennes en ms (écarts-types) AM SC RV Syllabe CV 252 (41) 253 (45) 258 (56) Consonne 119 (37) 141 (41) 147 (51) M1M2 170 (29) 174 (37) 192 (33) M2M3 146 (75) 156 (62) 164 (60) M1A1 153 (56) 145 (56) 143 (50) A1M2 17 (51) 29 (55) 49 (49) M2L2 155 (54) 143 (50) 123 (66) M3L2 9 (73) -13 (57) -41 (64) M3M4 183 (34) 175 (33) 197 (37)
Tableau 3. Durées moyennes et écarts-types (en ms) des différents intervalles temporels obtenus pour les trois locutrices-codeuses AM, SC et RV.
Figure 35. Schémas des patrons temporels de coordination main-lèvres-son pour chacune des codeuses AM, SC et RV.
Codeuse AM
Codeuse SC
Nous pouvons remarquer une grande similarité des caractéristiques de production ainsi que des
patrons de coordination obtenus entre les trois codeuses. En particulier certaines durées semblent très
proches (c’est le cas par exemple des durées de syllabes et des transitions de main, mais également
de la relation temporelle entre le début du geste manuel et le début acoustique de la syllabe M1A1)
tandis que d’autres, comme l’intervalle M3L2 par exemple, démontrent plus de variabilité (ces
intervalles seront comparés statistiquement dans la section VI.2.1.2). Néanmoins, l’organisation
temporelle générale entre la main, les lèvres et le son qui se profile pour les trois locutrices-codeuses
semble être la suivante (voir sur la Figure 35 les schémas moyens et sur la Figure 36 le détail
séquence par séquence).
La main débute son mouvement vers la position cible LPC avant le début acoustique de la
consonne (M1A1). C’est toujours le cas pour la codeuse SC (sur la Figure 36, nous pouvons en effet
remarquer que tous les triangles qui représentent le début du geste de la main M1 sont placés
en-dessous de la ligne en pointillés représentant A1). La codeuse AM a quant à elle produit une seule
séquence pour laquelle la main débute la transition après le début acoustique de la consonne et la
codeuse RV a produit deux séquences où la main débute son mouvement en synchronie avec le début
de la consonne. Ces trois exceptions mises à part, nous pouvons considérer que de manière générale,
la main débute son geste de transition avant le début acoustique de la syllabe (les trois distributions
peuvent en effet être considérées comme des densités de probabilité avec aux extrêmités les
événements les moins probables) ; cette durée d’anticipation est assez variable (elle peut aller de 19
ms à 312 ms) et s’élève en moyenne à 143-153 ms pour les trois sujets.
La main arrive en position cible en moyenne en début de consonneacoustique (A1M2). Pour les
trois sujets, cette atteinte de position de main par rapport au début acoustique de la consonne peut
varier selon la séquence : la main peut parfois arriver en position cible LPC avant le début de la
consonne (ceci est représenté par le fait que des croix représentant M2 sont positionnées en-dessous
de A1 sur la Figure 36). Pour la plus grande partie des séquences, la main arrive en position cible LPC
après le début acoustique de la consonne. Elle atteint la position de 17 ms à 49 ms en moyenne après
le début de la syllabe. Plus précisément, la main atteint la position dans la première partie de la
consonne ; en effet, l’intervalle A1M2 représente en moyenne 14% de la durée totale de la consonne
acoustique pour le sujet AM, 21% pour le sujet SC et 33% pour le sujet RV (valeur donnée par le calcul
[moyenne(A1M2) / moyenne(Consonne) x 100]). Nous retrouvons donc chez ces trois codeuses une
certaine synchronie de la position manuelle avec le début acoustique de la consonne.
Figure 36. Positionnement temporel (en ms) des événements M1 (début du geste manuel), M2 (fin du geste manuel), L2 (cible labiale vocalique) et M3 (début du geste manuel vers la position suivante) par rapport au début acoustique de la consonne A1, pour les trois codeuses AM, SC et RV. Pour faciliter la lecture des graphiques, les items sont triés dans l’ordre croissant en fonction de M1.
La transition manuelle (M1M2) peut durer en moyenne de 170 ms à 192 ms selon le sujet et semble
relativement peu variable d’une séquence à l’autre : nous pouvons remarquer en effet sur la Figure
36 que le positionnement des croix qui représentent la fin de la transition manuelle M2 semble suivre le
positionnement des triangles, représentant M1 (l’espace vertical entre les triangles et les croix semble
relativement constant au cours des séquences et définit un certain parrallélisme entre les deux
distributions, ce qui signifie que M1 et M2 sont appariés).
Figure 37. Evolution de l’intervalle A1M2 en fonction de l’intervalle M1A1 (ms) pour les trois codeuses AM, SC et RV. Sur chacun des graphes sont indiqués les coefficients de corrélation (tous significatifs à p< .01) et les équations de droites ajustées linéairement sur les données.
La Figure 37 montre plus précisément l’évolution de l’intervalle A1M2 (l’atteinte de la position de main
par rapport au début acoustique de la consonne) en fonction de M1A1 (le début du geste de main par
rapport au début de la consonne), soit le phasage de la transition de main M1M2 avec le début
acoustique A1 de la consonne. Nous pouvons clairement voir que plus M1A1 augmente, plus A1M2
diminue (cette relation est très bonne pour les trois sujets car nous obtenons de fortes corrélations
négatives ; voir sur les graphes de cette figure). La relation statistique mise en évidence signifie que la
durée de la transition manuelle (c’est-à-dire la somme de M1A1 et A1M2) est statistiquement stable
(invariance absolue, cf. infra VI.2.3) : la transition de main va en fait se déplacer autour du début
acoustique de la consonne (A1). Notons que les coefficients sont très proches d’une codeuse à l’autre,
de même que les valeurs d’intercepts (137 ms, 139 ms et 158 ms) qui indiquent le temps minimal de
transition lorsque le geste démarre au début acoustique de la consonne. Ainsi, si la durée de la
transition est stable, le calage de cette phase par rapport au début acoustique de la consonne est
variable. Plus la main anticipe son début de mouvement de transition sur le début acoustique de la
consonne, plus la position cible LPC est atteinte précocement. Elle peut être atteinte avant même le
début du son (c’est le cas pour les séquences pour lesquelles A1M2 est négatif) et dans ce cas les
valeurs de M1A1, soit l’anticipation du début du geste manuel, sont grandes. Notons de plus que pour
chacun des sujets, les durées de transitions manuelles au cours de la séquence sont en moyenne
assez constantes (M1M2 est en effet proche de M3M4).
La main a donc atteint la position vocalique LPC avant la réalisation de la voyelle aux lèvres
(M2L2). C’est toujours le cas pour la codeuse SC (pour qui les croix représentant M2 sont toutes
en-dessous des cercles représentant L2 sur la Figure 36). Pour la codeuse AM, c’est toujours le cas à
l’exception d’une séquence et pour la codeuse RV, c’est également le cas à l’exception de deux
séquences. Dans l’ensemble, nous pouvons considérer que la position manuelle LPC est atteinte en
avance par rapport à la réalisation de la voyelles aux lèvres : en moyenne cette avance s’élève de 123
ms à 155 ms pour les trois sujets. Ainsi pour la voyelle, le comportement anticipatoire de la position
manuelle sur la cible labiale qui caractérisait le sujet GB, se retrouve également chez ces trois autres
sujets.
La main reste en position durant toute la consonne (l’intervalle M2M3 – tenue de cible manuelle –
étant en moyenne plus long que la durée moyenne de la consonne, voir Tableau 3) et repart
finalement vers la position suivante aux alentours de la réalisation de la cible labiale vocalique
(M3L2), soit durant la voyelle acoustique. L’examen de l’ensemble des séquences pour les trois
sujets sur la Figure 36, nous permet de remarquer une assez grande dispersion de la cible labiale L2
(représentée par les cercles) et du début du geste vers la position suivante M3 (représentée par les
points) : contrairement à M2, ces deux événements ne semblent pas être liés au début de la transition
manuelle M1. Les deux événements sont dans l’ensemble confondus, ce qui montre que le début de la
transition suivante se produit autour de la cible labiale. En moyenne, la main débute la transition
suivante 9 ms avant la cible articulatoire pour la codeuse AM et de 13 ms à 41 ms après pour les
codeuses SC et RV. Ainsi, il semble que l’ajustement plus fin LPC-parole se fasse plus au niveau de la
tenue de la position manuelle (M2M3), la durée de la transition étant peu variable.
En résumé, nous trouvons chez ces trois codeuses un schéma temporel de coordination
main-lèvres-son globalement assez similaire d’un sujet à l’autre. L’organisation LPC-parole trouvée chez ces trois
codeuses est de plus similaire à celle que nous avions observée précédemment chez la codeuse GB
durant la production de syllabes CV codées en LPC. Bien que le rythme syllabique et les durées
d’intervalles soient différents de ceux observés chez la codeuse GB (de manière générale, le rythme
est plus rapide et les durées sont plus courtes pour ces codeuses ; voir sections V.2.3 et V.3.3),
l’organisation temporelle des différents articulateurs de la LPC est maintenue. Notre résultat majeur
réside dans le rendez-vous temporel de la position manuelle vocalique (et en même temps de la
configuration consonantique, celle-ci étant superposée à la transition) avec le début acoustique de
la consonne et l’anticipation de la position manuelle LPC vocalique sur la cible labiale vocalique
(Figure 35).
VI.2.1.2. Comparaison interlocuteur
Afin de comparer les résultats des trois locutrices de manière objective (c’est-à-dire en éliminant les
éventuelles fluctuations de rythme syllabique), nous les avons normalisés par la syllabe CV : pour
chaque séquence, chaque intervalle en millisecondes est exprimé en pourcentage par rapport à la
durée acoustique de la syllabe S2 (sans unité, noté %rel ; voir section V.4.1). Nous rappelons que ces
durées de syllabes s’élevaient en moyenne à 252 ms (s= 41 ms) pour AM, à 253 ms (s= 45 ms) pour
SC et à 258 ms (s= 56 ms) pour RV (Tableau 3) ; ces durées ne sont significativement pas différentes
(ANOVA
14, F< 1 ; voir une représentation graphique de cette proximité sur le graphe en Annexe 3). Ces
durées mènent à un rythme syllabique moyen de 4 Hz pour les sujets AM et SC et de 3,9 Hz pour RV.
Les résultats moyens et les écarts-types obtenus (en %rel) pour chaque intervalle et chaque sujet sont
présentés dans le Tableau 4 (voir également Figure 38). Pour comparer les trois codeuses nous avons
effectué une ANOVA à un facteur pour chaque durée d’intervalle (les différences significatives sont
indiquées par des astérisques dans le Tableau 4). Le lecteur intéressé pourra trouver en Annexe 3 (p.
22) les représentations graphiques, par des boîtes à moustaches, de ces données normalisées pour
chaque intervalle et chaque sujet ainsi que les commentaires associés détaillés (incluant les résultats
des analyses de variance et des comparaisons multiples a posteriori).
Ce qui ressort de cette comparaison en durées normalisées est le fait que nous trouvons dans le
domaine syllabique, un schéma de coordination main-lèvres-son très similaire d’une codeuse à l’autre
(voir les patrons de coordination schématisés sur la Figure 38 pour chaque codeuse) avec, certes, une
part de variabilité en ce qui concerne les caractéristiques de codage LPC. De manière générale,
l’anticipation de l’initiation du geste manuel sur le son (M1A1) caractérise le codage des trois sujets
avec un timing relatif qui semble en moyenne ne pas varier d’un sujet à l’autre. En ce qui concerne la
coordination temporelle des autres événements dans le domaine syllabique, nous trouvons une
différence de la codeuse RV par rapport aux deux autres (révélée par les tests post-hoc, voir Annexe
3) mais le schéma général reste le même : la position de main LPC vocalique est atteinte en début de
consonne acoustique (un peu plus tard dans la consonne pour RV), soit bien avant la réalisation de la
14 Moyennes comparées également par le test non-paramétrique de Kruskal-Wallis indiquant une
cible labiale vocalique et la main repart ensuite vers la position suivante aux environs de la cible labiale
(soit en même temps soit après).
Durées moyennes en %rel (écart-type) AM SC RV
M1M2 * 69 (15) 71 (17) 78 (21) M2M3 58 (29) 64 (29) 65 (25) M1A1 63 (28) 61 (29) 60 (27) A1M2 * 6 (21) 10 (22) 18 (19) M2L2 * 62 (21) 57 (20) 47 (23) M3L2 * 4 (30) -6 (23) -18 (27) M3M4 * 75 (19) 72 (19) 80 (23)
Tableau 4. Moyennes et écart-types des différents intervalles temporels obtenus pour les trois locutrices-codeuses, calculés en proportions par rapport à chaque durée de syllabe CV de chaque séquence (sans unité noté %rel). Les astérisques (*) près des noms d’intervalles indiquent les différences significatives (ANOVA) entre les trois sujets à p< .01.
Figure 38. Schémas des patrons temporels de coordination main-lèvres-son dans le domaine syllabique pour chacune des codeuses AM, SC et RV. Les valeurs indiquées correspondent aux durées d’intervalles exprimées en pourcentages relatifs de la durée de la syllabe CV (la durée de la syllabe s’élève donc à 100%rel).