• Aucun résultat trouvé

CHAPITRE V. Etude pilote de la production de syllabes codées 22

V.4. Conclusion sur les deux expériences

V.4.1. Comparaison normalisée

Que pouvons-nous conclure sur l’ensemble des expériences 1 et 2 ? A première vue, ce qui apparaît

est bien le fait que nous retrouvions un patron de coordination temporelle très similaire d’une

expérience à l’autre. De manière plus précise, afin de voir si les changements de formes de main au

cours du code modifiaient le schéma de coordination, nous avons comparé la condition 1 de

l’expérience 1 (codage de syllabes CV avec configuration fixe et transitions manuelles) et la condition 2

de l’expérience 2 (codage de syllabes CV avec changement de configurations et transitions

manuelles). Pour procéder à une comparaison objective, nous avons normalisé les différentes durées :

nous avons exprimé les différents intervalles temporels dans le domaine de la syllabe acoustique CV,

afin d’éliminer l’effet du rythme syllabique qui est différent dans les deux études (2,5 Hz et 3,2 Hz).

Pour chaque séquence, les différents intervalles temporels sont exprimés en proportions de temps

relatives à la durée de la syllabe CV de la séquence (sans unité, noté %rel). Nous aurons ainsi des

valeurs comparables en fonction du cycle syllabique.

Les valeurs moyennes et les écarts-types obtenus sont donnés dans le Tableau 2. Nous avons

également représenté graphiquement chaque distribution par des boîtes à moustaches (Box &

Whiskers Plot ou diagrammes de Tuckey) sur la Figure 29. Ces diagrammes permettent de visualiser

certains paramètres descriptifs tels que les quartiles, la médiane et la moyenne de chaque distribution

ainsi que leurs positions respectives. Ils décrivent ainsi de façon synthétique les mesures de tendance

centrale, l’étendue, la dispersion et la symétrie des données. Ils permettent également d’identifier les

valeurs extrêmes (hors normes) de chaque distribution. En outre, nous avons tracé côte à côte les

boîtes à moustaches des intervalles temporels des deux expériences (en utilisant la même échelle) :

pour chaque intervalle, la comparaison des deux distributions est de cette manière très aisée. Sur

chaque graphique de la Figure 29, nous avons ainsi les deux boîtes à moustaches définies pour

chaque intervalle de durée des deux expériences, avec en ordonnée, la durée correspondante des

intervalles (en millisecondes ou en pourcentages relatifs). La boîte centrale est construite à partir des

1

er

(25

ème

percentile) et 3

ème

quartiles (75

ème

percentile) (Q1 et Q3) qui définissent ses bords (la

longueur de la boîte correspond à l’écart interquartile Q3-Q1). Le trait horizontal à l’intérieur de la boîte

représente la médiane et la croix ‘x’ représente la moyenne. Ainsi la partie centrale représentée par la

boîte contient 50% des données. Les moustaches sont les lignes verticales qui s’étendent au-dessous

et au-dessus de la boîte dont les traits horizontaux sont les extrémités. Elles correspondent aux valeurs

minimum et maximum des données si la distribution ne contient aucune valeur hors norme. Les valeurs

hors normes sont des valeurs supérieures à 1,5 fois l’écart interquartile à partir de Q3 et inférieures à

1,5 fois l’écart interquartile à partir de Q1 (le coefficient 1,5 est une valeur pragmatique) ; elles sont

représentées par le signe ‘+’.

Expérience 1 Expérience 2

Moyenne Ecart-type Moyenne Ecart-type

M1M2 72 19 76 17 M2M3 51 24 40 21 M1A1 62 25 65 17 A1M2 10 19 10 15 M2L2 64 20 55 21 M3L2 13 16 15 25 M3M4 74 19 92 17 D1D2 54 12 D1A1 55 17 A1D2 -1 15 D2L2 66 19 L2D3 16 16 D3D4 57 8

Tableau 2. Moyennes et écart-types (%rel) des intervalles temporels exprimés en fonction du cycle syllabique CV pour les expériences 1 et 2.

Figure 29. Boîtes à moustaches représentant la distribution de chaque intervalle temporel dans le cycle syllabique pour la codeuse GB dans les expériences 1 et 2. Chaque boîte indique la médiane, les 1er et 3ème quartiles, les valeurs frontières, les valeur hors normes (‘+’) et la moyenne (‘x’).

Comme nous l’avons souligné plus tôt, la codeuse GB a produit des syllabes de durées différentes

dans les deux expériences. Cette différence est facilement visualisable sur la Figure 29 (graphique en

haut à gauche) : la comparaison des deux boîtes à moustaches montre que la locutrice a produit des

syllabes de durées très dispersées dans l’expérience 1, avec une tendance à être plus longues que

celles de l’expérience 2 (cette différence est confirmée statistiquement

11

par un test t ; |tc|= 6,09 ddl=

117, p< .01).

Les données obtenues dans le domaine syllabique confirment la similarité des résultats des deux

expériences. Nous pouvons constater en effet certaines caractéristiques de codage relativement

constantes du sujet GB. Tout d’abord, cette codeuse maintient un rythme de transitions manuelles

relativement stable par rapport au cycle syllabique (dans 3 cas sur 4 autour de 72-76%rel). Comme

nous pouvons le voir en bas de la Figure 29, les boîtes à moustaches représentant les distributions des

transitions manuelles M1M2 et M3M4 sont globalement similaires d’une expérience à l’autre. Seule la

durée moyenne des transitions M3M4 de l’expérience 2 diffère statistiquement des autres : cette

différence est clairement visible sur la figure, de plus, cette observation est confirmée par une ANOVA

à un facteur sur les différentes transitions (groupes significativement différents, F(3, 237)= 15,2 p< .01 ;

les tests post-hoc confirment que c’est bien le dernier type de transitions qui diffère des autres, p< .01).

Malgré cette différence, nous pouvons remarquer cependant un écart interquartile (longueur des

boîtes) très proche d’une distribution à l’autre. Ces durées d’intervalles sont distribuées de manière

normale

12

pour l’expérience 1 et pour les transitions M3M4 de l’expérience 2 (nous pouvons noter une

certaine symétrie des données autour de la médiane, ainsi qu’une correspondance

médiane-moyenne), alors qu’elles sont légèrement asymétriques pour les transitions M1M2 de l’expérience 2 (il

semble y avoir une plus grande dispersion des données pour les valeurs supérieures à la médiane).

Dans tous les cas, la répartition des durées de transitions par rapport au cycle syllabique semble avoir

une même étendue, avec une concentration de la moitié des données grossièrement entre 60 et 80%rel

(en excluant le dernier groupe).

En ce qui concerne la coordination temporelle des différents événements, nous obtenons un patron

très semblable d’une expérience à l’autre. En effet dans les deux expériences, la main débute sa

transition vers la position correspondant à la voyelle bien avant le début acoustique de la syllabe CV.

En outre, cette avance manuelle est en moyenne très proche pour les deux expériences (M1A1 de 62

à 65%rel en moyenne) : les moyennes ne sont en effet pas significativement différentes (test t, |tc|= 0,79

11 Quand les conditions d’application du test t de Student ne sont pas entièrement respectées, nous

utilisons également le test non paramétrique de la somme des rangs de Wilcoxon (Wilcoxon rank

sum test) : nous avons également obtenu une différence significative (p< .01).

ddl= 117 au risque α= 5%). En regardant l’ensemble de la distribution sur la Figure 29, nous pouvons

remarquer d’une part que toutes les valeurs d’intervalles sont positives ; ce qui signifie clairement que

la main débute sa transition toujours avant le son, même dans le cas où des changements de clés se

superposent aux transitions de main. D’autre part, il apparaît que, bien que les données soient

beaucoup plus dispersées dans l’expérience 1, il semble y avoir dans les deux cas, une concentration

de la majorité des données centrales entre 50%rel et 70%rel. Ce résultat indique que la main anticipe

sur le début du son, avec une avance équivalent à plus d’une demi-syllabe.

La position vocalique manuelle est ensuite atteinte en début de consonne acoustique dans les deux

expériences. Les deux boîtes à moustaches représentant les distributions de A1M2 sur la Figure 29

sont très similaires : les deux jeux de données sont distribués normalement avec une variabilité plus

importante pour l’expérience 1. Nous pouvons remarquer pour les deux distributions que le 1

er

quartile

est situé autour de 0 (à - 4,6%rel pour l’expérience 1 et à 0,3%rel pour l’expérience 2) : la majorité des

données se retrouve donc dans les valeurs positives, ce qui signifie clairement que la position cible

LPC est en majorité atteinte après le début acoustique de la consonne. Les données positionnées dans

la partie centrale (soit 50% des données totales) se retrouvent concentrées globalement entre 0 et

20%rel de la durée de la syllabe CV, soit clairement au début de la consonne acoustique. En moyenne,

l’intervalle A1M2 représente 10%rel de la durée de la syllabe CV dans les deux expériences : les deux

moyennes ne sont significativement pas différentes (test t, |tc|= 0,05 ddl= 117 au risque α= 5%). Dans

le domaine de la syllabe, le calcul des durées relatives des consonnes dans les deux expériences

donne des valeurs moyennes de 59%rel (s= 11%rel) pour l’expérience 1 et de 61%rel (s= 9%rel) pour

l’expérience 2. Ainsi il apparaît clairement que la position cible est atteinte dans la toute première partie

de la consonne (de 16 à 17% [= A1M2/duréeConsonne] en moyenne sur les deux expériences). Il

semblerait donc que ce comportement anticipatoire de la main soit motivé par un but, un rendez-vous

temporel entre la position de main et le début acoustique de la consonne.

La position de main codant la voyelle est donc atteinte en quasi-synchronie avec le début acoustique

de la consonne ; elle est de ce fait largement en avance sur la cible articulatoire de la voyelle, en

moyenne de 55%rel à 64%rel (M2L2), moyennes significativement non différentes (test t, |tc|= 2,3 ddl=

117 au risque α= 1%). L’examen des boîtes à moustaches sur la Figure 29 nous indique que cette

anticipation de la cible manuelle sur la cible labiale est toujours positive, à l’exception d’une valeur hors

norme de - 6%rel dans l’expérience 2 (identifiée sur la figure par un signe ‘+’ en-dessous de la

moustache inférieure de la boîte). Les deux distributions sont normales et concentrent la moitié des

données en position centrale largement entre 40%rel et 80%rel. Nous retrouvons donc au niveau de la

cible l’anticipation d’une bonne demi-syllabe notée précédemment pour l’initiation du geste. Les durées

M2L2 sont toutefois plus dispersées que les durées M1A1 et démontrent de ce fait une plus grande

variabilité, sans doute liée à la cible labiale.

La main est maintenue en position cible de 40%rel à 51%rel en moyenne (M2M3). Les distributions des

durées de tenue de cible paraissent assez dissemblables sur la Figure 29 : nous pouvons remarquer

en effet des durées distribuées normalement pour l’expérience 1, avec une très grande variabilité (les

moustaches de la boîte s’étendent en effet de 8%rel à 105%rel), alors que pour l’expérience 2, les

données semblent moins dispersées (les moustaches de la boîte s’étendent de 11%rel à 60%rel) mais

présentent plusieurs valeurs hors normes. Ces différences sont confirmées statistiquement (test t, |tc|=

2,55 ddl= 117 p< .05).

La main repart ensuite vers la position suivante un peu avant la réalisation de la voyelle aux lèvres en

moyenne de 13%rel à 15%rel (M3L2) ; ces moyennes ne sont significativement pas différentes (|tc|= 0,47

ddl= 117 au risque α= 5%). Nous pouvons voir d’après les boîtes à moustaches sur la Figure 29 que

les deux distributions sont normales, les durées de l’expérience 2 étant plus dispersées. Le 1

er

quartile

des deux distributions est positionné autour de 0 (1,3%rel pour l’expérience 1 et -6%rel pour l’expérience

2), ce qui indique que la majorité des deux distributions est répartie dans les valeurs positives : ainsi la

main repart vers la position suivante avant la réalisation de la cible de la voyelle aux lèvres dans la

majorité des cas.

Figure 30. Boîtes à moustaches indiquant la distribution de chaque intervalle temporel pour l’étude de la configuration digitale relativement au cycle syllabique pour la codeuse GB dans l’expérience 2 (corpus 2).

En ce qui concerne la configuration consonantique pour l’expérience 2, nous pouvons noter une très

grande proximité des durées de formation de clé (D1D2 et D3D4) : la visualisation des boîtes à

moustaches correspondantes sur la Figure 30 nous permet de juger graphiquement de cette similarité.

Les données sont globalement assez peu dispersées : l’écart interquartile (longueur de la boîte

comprenant 50% des données) est de 11%rel pour D1D2 et de 12%rel pour D3D4. Les durées

moyennes de 54%rel et 57%rel obtenues pour les deux jeux de données ne sont pas significativement

différentes (test t, |tc|= 1,6 ddl= 116 au risque α= 5%). Nous pouvons remarquer que ces formations de

configuration de main (D1D2, m= 54%rel) durent en moyenne moins longtemps que les transitions

manuelles (M1M2= 76%rel) ; ceci reste valable séquence par séquence comme nous pouvons le

constater sur le graphique en bâtons superposés représentant les durées de transitions de main et les

durées de formations de clés sur la Figure 31 (les durées de transitions manuelles sont plus longues

que les durées de formations de clés, à l’exception de cinq séquences).

Figure 31. Graphique en bâtons superposés représentant les durées (en %rel) des formations de configurations digitales (foncé) superposées sur les durées totales de transitions de main (clair) pour toutes les séquences. Les données sont triées dans l’ordre croissant de la durée M1M2.

Comme nous l’avons remarqué plus tôt, les formations de clés sont en fait superposées sur les

transitions de main. De cette manière, il apparaît que le début de la formation de la clé se produit

toujours avant le début acoustique de la consonne : la boîte à moustaches sur la Figure 30 montre que

les valeurs de D1A1 sont toutes positives. La moitié des données, concentrées dans la partie centrale

de la distribution, se retrouve entre 41,5%rel et 65%rel, avec une moyenne s’élevant à 55%rel : ce

résultat indique que le début du geste de formation de la configuration de main est en avance d’une

demi-syllabe par rapport au son. En ce qui concerne la fin de la formation de la clé, il apparaît qu’elle

est synchrone avec l’acoustique (A1D2 s’élevant à -1%rel) : cette moyenne n’est en effet pas

statistiquement différente de 0 (test t, |tc|= 0,05 ddl= 58 au risque α= 5%). Sa distribution est normale

et répartit les données autour de 0. Ainsi cette codeuse forme les clés consonantiques alors qu’elle est

en train de déplacer sa main vers une position cible avant la production de son ; les deux informations

transmises par la main se chevauchent (plus précisément c’est l’information consonantique qui se

superpose à l’information vocalique) et sont complètement disponibles en synchronie avec le début

acoustique de la consonne. La clé est donc formée entièrement bien avant la réalisation de la voyelle

aux lèvres, avec une avance moyenne de 66%rel, soit bien plus qu’une demi-syllabe. Enfin, les résultats

montrent que la main débute la formation de clé suivante en moyenne 16%rel après la réalisation de la

cible de la voyelle aux lèvres. La Figure 30 indique que le 1

er

quartile se trouve au-dessus de 0

(6,7%rel), ce qui signifie que plus de 75% des données sont positives : la clé est donc formée dans la

majorité des cas après la cible labiale.