• Aucun résultat trouvé

Vers un schéma de coordination « position-clé-lèvres-son »

CHAPITRE V. Etude pilote de la production de syllabes codées 22

V.3. Expérience 2 : formation des clés manuelles

V.3.4. Vers un schéma de coordination « position-clé-lèvres-son »

Nous avons obtenu un rythme syllabique moyen de 3,6 Hz (pour les séquences à positions fixes) à

3,2 Hz (pour les séquences à positions variables), puisqu’il faut effectuer dans cette dernière condition,

en plus des changements de configurations manuelles, un déplacement de la main d’une position à

une autre du visage. Il semble que le code manuel, nécessitant plus de temps dans la condition 2,

ralentisse légèrement le rythme de parole par rapport à la condition 1.

En ce qui concerne les formations de configurations digitales (D1D2 et D3D4), nous avons obtenu des

durées moyennes de 170 ms et 162 ms pour les séquences à positions fixes et de 168 ms et 160 ms

pour les séquences avec transitions. Il apparaît que ces durées de formations de clés sont très proches

les unes des autres. Elles ne sont en effet pas significativement différentes par le test de Kruskal-Wallis

(test non paramétrique, équivalent de l’ANOVA, utilisé ici car les conditions de normalité et

d’homoscédasticité n’étaient pas vérifiées : Hc= 8,5 < Ht= 11,345 pour α= 1% et ddl= 3). Ces résultats

nous laissent donc supposer que le geste digital pour former les clés est relativement indépendant du

fait qu’il y ait un déplacement ou non de la main d’une position à une autre du visage.

En ce qui concerne la coordination de ces clés avec le son, il apparaît, dans les deux conditions, que la

clé LPC est synchrone avec le début acoustique de la syllabe CV, c’est-à-dire avec le début de la

consonne. Plus précisément la configuration digitale commence à être formée 124 ms en moyenne

avant le début acoustique de la syllabe (D1A1) et sera complètement mise en forme dès le début

acoustique de la consonne (A1D2 s’élevant à 46 ms). Dans le cas où la main effectue un déplacement

d’une position à l’autre (condition 2), ce schéma est maintenu : la main débute d’abord sa transition

vers la position cible (en moyenne 205 ms avant le début acoustique de la consonne, M1A1) puis

commence à former la configuration de la clé (en moyenne 171 ms avant le début de la consonne,

D1A1). La clé est entièrement formée en synchronie avec le début acoustique de la consonne (A1D2,

-3 ms) et la main atteint la position cible en début de consonne (A1M2, 33 ms). Ce patron de

coordination est globalement conservé quand on examine plus précisément le comportement

séquence par séquence. Le positionnement temporel des différents événements est illustré sur la

Figure 27. Nous pouvons remarquer pour la condition 1, que le geste des doigts est toujours initié

avant le début acoustique de la syllabe (les triangles représentant D1 sont tous en-dessous des croix

représentant A1). La configuration de main est entièrement formée juste après le début acoustique de

la consonne, dans les 100 premières millisecondes (à quelques exceptions près, on retrouve la

majorité des croix au-dessus de A1). Pour la condition 2, il apparaît également que le geste digital est

toujours initié en avance par rapport au début acoustique de la consonne. En ce qui concerne la fin de

la formation de la clé, celle-ci se termine plutôt aux alentours du début acoustique de la consonne :

nous pouvons remarquer en effet dans cette condition, une distribution répartie de manière presque

identique de part et d’autre de A1. La clé est donc formée en synchronie avec le début du son. En ce

qui concerne les transitions de main, nous pouvons de manière générale constater que la main semble

débuter sa transition avant le début de la formation de la clé digitale (les étoiles représentant M1 ont

plutôt tendance à être en-dessous des triangles représentant D1). De la même manière, il apparaît que

la position cible LPC est atteinte après la fin de la formation de la clé, durant le début de la consonne

(de manière générale, les points représentant M2 se retrouvent au-dessus des croix représentant D2).

Ainsi la formation de la clé est incluse dans la transition de main.

Figure 27. Positionnement temporel des événements suivants par rapport à A1 (repéré par 0), début acoustique de la consonne, pour les deux conditions avec transitions de main (corpus 2, à droite) et sans transition de main (corpus 1, à gauche) : D1 (début de la configuration des doigts), D2 (fin de la formation de la configuration), M1 (début de la transition de main), M2 (atteinte de la position cible) et L2 (atteinte de cible labiale). Les items sont ordonnés dans l’ordre croissant de D1 pour le corpus 1 et de M1 pour le corpus 2.

Nous avions noté que les durées de formation de clés LPC étaient similaires dans les deux conditions

mais nous pouvons remarquer cependant une légère différence d’une condition à l’autre en ce qui

concerne la relation temporelle entre la formation de la clé et le son. Dans le cas où la main doit se

déplacer vers une autre position du visage (corpus 2), la formation de la clé manuelle débute un peu

plus tôt (D1A1, 171 ms contre 124 ms avant le début acoustique de la consonne) et se termine

également plus tôt (A1D2, - 3 ms contre 46 ms) que dans le cas où la main reste à une même position

cible (corpus 1). Dans les deux cas, la clé consonantique est entièrement formée à un moment très

proche du début acoustique de la consonne. La différence entre les deux peut néanmoins s’expliquer

par la nécessité d’effectuer en plus la transition manuelle ; tout se passe comme si la main devait

arriver en position cible en début de consonne acoustique. C’est ce que nous avions déjà remarqué

dans l’expérience 1. Ce but semble confirmé ici, puisque nous observons une atteinte de la position

cible manuelle qui se produit au tout début de la consonne (33 ms). La formation de la clé se trouve

donc légèrement décalée par rapport au son. L’information sur la consonne donnée par la forme de

main est donc disponible en quasi-synchronie avec le début acoustique de cette consonne.

En ce qui concerne l’information sur la voyelle, pour le corpus 1, elle est donnée en même temps que

l’information sur la consonne puisque la main reste à la même position cible, soit bien avant la cible de

la voyelle aux lèvres (D2L2, 149 ms) (pour un rappel des règles de codage, voir section I.4). Nous

retrouvons cette anticipation séquence par séquence : nous pouvons voir sur la Figure 27 que les croix

représentant l’événement D2 sont toutes au-dessous des cercles qui représentent l’événement L2.

Pour le corpus 2, cette information vocalique est donnée par la position manuelle, qui est atteinte en

début de consonne acoustique, soit également bien avant la cible vocalique labiale (M2L2, 172 ms). De

la même manière, nous retrouvons une anticipation de la position LPC sur la cible labiale en examinant

le positionnement dans le temps de ces événements séquence par séquence : tous les points

représentant M2 sont placés au-dessous des cercles représentant L2. Dans les deux cas,

l’information vocalique donnée par la main anticipe sur la cible labiale vocalique. Cette

anticipation manuelle est le résultat majeur que nous avions mis en évidence dans l’expérience

précédente pour des séquences avec clés manuelles fixes et que nous retrouvons ici pour des

séquences impliquant des changements de configurations de main.

Enfin, en ce qui concerne la syllabe suivante S3, dans les deux conditions, la formation de configuration

correspondante débute de 34 ms à 53 ms en moyenne après la réalisation de la cible vocalique labiale

de la syllabe S2 (L2D3). Dans la condition 2, la transition manuelle codant la syllabe S3, débute en

moyenne 43 ms avant cette cible articulatoire (M3L2). Cette coordination manuelle et labiale

correspond à celle que nous avions mise en évidence dans l'expérience précédente pour des

transitions de main avec configurations fixes : le geste de la main vers la position suivante est initié

autour de la cible labiale, durant la voyelle acoustique. Ceci reste donc valide pour des transitions avec

changement de configurations de main.

V.3.5. En résumé

Figure 28. Schéma temporel de coordination entre les doigts, les lèvres, le son et éventuellement la main résumant les résultats de l’expérience 2 dans les deux conditions pour la codeuse GB. En haut, schéma résumé de l’étude 1 des changements de configuration consonantique sans transition manuelle. En bas, schéma résumé de l’étude 2 des changements de configurations avec transitions manuelles.

Nous pouvons donc proposer le patron général suivant à partir du corpus 2 (schématisé sur la Figure

28) : pour une syllabe CV, nécessitant à la fois un déplacement de main et un changement de

configuration, la main débute sa transition en avance de 205 ms en moyenne par rapport au début

acoustique de la consonne et atteint sa position en début de consonne, soit bien avant la cible labiale

vocalique. La main reste en position 130 ms et repart ensuite vers la position suivante un peu avant la

réalisation de la cible de la voyelle aux lèvres. La configuration de main, quant à elle, est formée durant

la transition d’une position à l’autre du visage. Elle est temporellement incluse dans la transition

manuelle, de façon à ce que la configuration soit complètement formée au début du son. En ce qui

concerne la transmission des deux informations, pour une syllabe CV, il apparaît clairement que

l’information sur la consonne et celle sur la voyelle sont données quasiment en même temps.

L’information consonantique est superposée à l’information vocalique, et recouvre de plus une grande

partie de la transition (71% environ, cette indication est donnée par le calcul du rapport D1D2/M1M2). Il

apparaît donc, comme pour la parole, que les deux informations ne sont pas séquentielles mais

Corpus 1

coarticulées. Contrairement à ce qu’avaient proposé Duchnowski et al. (2000) pour leur système de

synthèse, nous n’avons pas spécifiquement trouvé un changement de configuration qui se produirait en

milieu de transition.