DISCUSSION 77 3 sessions d'entraînement, nos sujets ne le trouvent pas On peut imputer

La resynthèse de parole

3.4. DISCUSSION 77 3 sessions d'entraînement, nos sujets ne le trouvent pas On peut imputer

cela à la diculté de la tâche, qui nécessite de se concentrer pendant une dizaine de minutes sur des stimuli très appauvris et relativement monotones. De plus, les régularités à découvrir ne sont pas ponctuelles, mais s'étalent sur la durée d'une phrase, ce qui demande sans doute une attention d'autant plus soutenue. On peut penser que dans ces conditions la variabilité des stimuli augmente également la diculté de la tâche. C'est ce qui pourrait expliquer pourquoi les scores ne sont pas supérieurs dans la condition sasasa que dans la condition sasasa plat : si le rythme est l'indice le plus able, la présence supplémentaire de l'intonation qui, nous l'avons vu, n'est pas bien analysée par nos sujets, ne constitue pas une aide mais peut au contraire les distraire ou les détourner de l'indice principal. En ce qui concerne la condition saltanaj, on peut conjecturer que les indices phonotactiques sont en fait redondants

avec le rythme12_{, et n'apportent donc pas d'information supplémentaire.}

La question la plus importante qui reste en suspens est de savoir comment les sujets ont eectué la discrimination. Tout d'abord, on peut toujours craindre d'avoir introduit par inadvertance dans les stimuli des indices discri- minants qui n'auraient rien à voir avec l'hypothèse testée. Certes, les stimuli sasasa préservent rigoureusement les intervalles vocaliques et consonantiques, mais on aimerait être sûr que c'est bien ce genre d'indices que les sujets ont utilisé pour eectuer la tâche. Il est évidemment très dicile d'avoir accès à ce genre d'information. Après l'expérience, il avait été demandé aux sujets de préciser la stratégie et les indices qu'ils avaient utilisés. Malheureusement, la plupart des sujets n'ont pas été capables de verbaliser de manière susam- ment précise ce qu'ils avaient fait, et leurs compte-rendus n'ont globalement pas été informatifs. Nous proposons néanmoins d'accéder à cette information en analysant les erreurs des sujets.

3.4.3 Comparaison de l'expérience et de la simulation

Dans la simulation présentée en section 2.3.1, la régression logistique trouve la valeur seuil de %V qui sépare au mieux les phrases des deux langues. Bien entendu, les phrases qui, du fait du recouvrement entre les deux langues, se trouvent du mauvais côté de la valeur seuil sont mal classiées par la simulation. Si les sujets humains utilisaient un critère de décision équivalent à %V , ils devraient donc échouer sur ces mêmes phrases. Cette prédiction nous invite à comparer plus en détail les erreurs des sujets et celles de la simulation.

Signalons tout d'abord que les mesures et simulations du chapitre précé- 12. Un groupe de consonnes en saltanaj équivaut à un [s] plus long en sasasa.

dent avaient été planiées indépendamment des expériences ci-dessus, et par conséquent ce ne sont pas tout à fait les mêmes phrases qui ont été utilisées. Elles ont toutefois été choisies dans le même corpus, et par chance 26 de ces phrases se trouvent être communes à l'expérience et à la simulation de la discrimination anglais/japonais. Dans la simulation, trois phrases seulement

avaient été mal classiées13_{, dont deux utilisées également dans l'expérience.}

Il apparaît que ces deux phrases (anglaises) sont également les plus mal clas- siées par les sujets : respectivement 38% et 43% de réponses correctes. Cela signie que les sujets les ont plus souvent attribuées au japonais qu'à l'anglais, mimant ainsi la régression logistique basée sur %V . Cette similitude est frappante, mais ne repose bien sûr que sur deux phrases. On peut néanmoins généraliser la démarche.

Bien que dans la simulation, le nombre de phrases mal classiées soit faible, le critère de décision, lui, est connu pour toutes les phrases : il s'agit de la valeur de %V . Si l'on suppose que les sujets humains catégorisent égale- ment les phrases sur leurs valeurs de %V , on doit alors prédire que leurs taux d'erreurs suivent ces valeurs : les phrases dont la valeur de %V est typique de leur langue devraient être plus aisément classiées que celles qui ont des valeurs atypiques. Cette prédiction est testée par la Figure 3.2, qui donne, pour chaque phrase de l'expérience, son score moyen de classication correcte par les sujets en fonction de sa valeur de %V .

Cette gure montre tout d'abord la séparation presque parfaite des phrases anglaises et japonaises sur l'axe %V , ce qui explique les 92.5% de réponses correctes dans la simulation. On observe par ailleurs que les phrases anglaises ont des valeurs %V beaucoup plus étalées que les phrases japonaises. De fait, la structure syllabique du japonais étant plus contrainte, elle n'auto- rise que peu de variabilité. Mais la constatation la plus remarquable est que les phrases anglaises sont d'autant plus mal classées quelles ont une grande valeur de %V , ce qui signie que tout se passe comme si les sujets jugeaient eectivement les phrases anglaises sur leur valeur de %V , et utilisaient un seuil de décision moyen d'environ 0.47. Cette observation est conrmée par une régression linéaire (R = −0.82, p < 0.001). Ces données viennent donc directement à l'appui du modèle de la perception du rythme que nous avons proposé à la Section 2.3.

Cependant, la corrélation entre %V et les scores de catégorisation ne tient pas du tout dans le cas du japonais (R = 0.004, p = 0.99). La raison prin- cipale en est sans doute le plus faible étalement des valeurs de %V pour le

japonais, qui réduit d'autant la probabilité d'observer une corrélation14_{. Re-}

13. Il y avait 92.5% de réponses correctes sur 40 phrases.

3.4. DISCUSSION 79 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0,3 0,4 0,5 0,6 %V S c o r e m o y e n d e c at ég o r is at ion pa r p h r ase P hras es anglais es P hras es japonais es R é g re s s io n lin é a ire (p h ra s e s a n g la is e s )

Fig. 3.2 Discrimination anglais/japonais par des sujets adultes : pourcen- tage moyen de réponses correctes par phrase, en fonction de sa valeur de

%V.

marquons toutefois que les trois phrases japonaises les plus mal catégorisées sont justement les trois qui ont la plus faible valeur de %V . Ainsi, même si la corrélation ne révèle rien dans ce cas, les valeurs extrêmes restent compatibles avec notre hypothèse.

3.4.4 Conclusion

Au Chapitre 2, nous avons proposé un modèle de la perception du rythme de parole selon lequel les sujets segmentent la parole en intervalles vocaliques et consonantiques, et eectuent des jugements sur la base des valeurs de %V des énoncés. Tester ce modèle nécessitait de développer une méthodologie particulière, que nous avons exposée dans ce chapitre : nous avons montré comment utiliser la resynthèse de parole pour dégrader sélectivement cer- taines propriétés de la parole, et notamment pour produire des stimuli qui n'en conservent que le rythme. Après avoir testé cette technique sur la discrimination de l'anglais et du japonais, il nous semble que les résultats obtenus renforcent la plausibilité de notre modèle. Premièrement, les sujets ont réussi cipalement des variations de la complexité des syllabes, en japonais elles doivent plutôt reéter des variations de la longueur des voyelles. Or ce phénomène n'étant pas contrastif en français, les sujets français n'y sont pas très sensibles (cf. Dupoux, Kakehi, Hirose, Pallier, & Mehler, sous presse).

à discriminer les deux langues dans la condition sasasa plat, qui ne dévoile que les intervalles vocaliques et consonantiques. Il semble donc que les sujets soient capables d'analyser ces intervalles, au moins lorsque la segmentation consonne/voyelle est rendue évidente par la resynthèse. Deuxièmement, la concordance entre les scores de l'expérience et les valeurs de %V suggère que les sujets analysent ces intervalles en termes de la variable %V , ou en tous cas d'une mesure équivalente.

Ces indications en faveur du modèle ne sont bien sûr pas susantes, et autorisent d'autres interprétations (voir discussion page 173). Puisque nous disposons maintenant d'un outil pour étudier la discrimination des langues sur la base du rythme, nous allons donc continuer à tester notre modèle en eectuant de nouvelles expériences sur d'autres paires de langues, dont les résultats seront à comparer avec les prédictions des simulations basées sur le modèle (Section 2.3). C'est l'objet du prochain chapitre.

Chapitre 4

Discrimination de langues par des

Dans le document Rythme des langues et acquisition du langage (Page 84-88)