• Aucun résultat trouvé

1. M ETHODE 177

1.4 Création des stimuli 181

Afin d’obtenir les stimuli définitifs pour l’expérience de gating, chaque mot a dû être extrait des phrases enregistrées, puis segmenté. Ces deux étapes sont décrites dans cette sous-section.

1.4.1 Extraction des mots

Les mots ont dû, dans un premier temps, être extraits de leur contexte « Il a dit

MOT deux fois » ou « He said MOT three times ». Cette opération a été réalisée

manuellement dans le logiciel Praat. Pour ce faire, je me suis appuyé conjointement sur le spectrogramme, la courbe de F0 et l’onde sonore afin de déterminer précisément les frontières de mots. Une fois ces frontières localisées, j’effectuais la sélection du mot, puis le décalage des bornes gauche et droite de la sélection au passage par zéro le plus proche (opération automatisée grâce à la création d’un script) afin d’éviter les clics parasites. Une vérification auditive a permis de confirmer ce découpage.

Chacun des mots a ensuite été exporté dans un fichier au format Wave, en maintenant la fréquence d’échantillonnage à 44 kHz.

1.4.2 Découpage des mots pour l’expérience

Le principe général du gating est de segmenter des items en extraits, et de présenter des extraits de plus en plus longs à l’auditeur. Le choix du découpage des mots a donc été un élément crucial de cette étude.

La segmentation des mots en moments (consonne 1, consonne 1 plus voyelle 1, etc.) plutôt qu’en extraits de longueur brute équivalente m’a semblé plus pertinente pour

144 En stéréo (pas d’enregistrement direct en mono possible avec l’Edirol R-09HR), avec encodage à

- 182 -

une expérience d’identification du genre par la voix : en effet, les mêmes mots n’étant pas de longueur identique selon les locuteurs l’ayant produit, un découpage temporel brut n’aurait pas été adéquat.

La principale contrainte a été de limiter raisonnablement le nombre de stimuli, qui détermine la durée de l’expérience. Pour rappel, nous avons pour base 27 mots, lus par quatre locuteurs différents dans chaque langue, soit 108 items pour chacune des deux versions de l’expérience (en anglais et en français). A raison d’environ 10 secondes pour

traiter chaque stimulus145, j’ai souhaité limiter le nombre de stimuli à environ 300, pour

ne surtout pas dépasser une durée d’expérience égale à une heure. Etant donné que les mots entiers seront bien entendu présentés, cela me laisse donc la possibilité de réaliser au maximum deux paliers ou points de segmentation par mot.

Tout d’abord, il m’a paru tout à fait indispensable de présenter isolément la

consonne initiale de mot (que j’appellerai C1), afin de tester la capacité des auditeurs à

reconnaître le genre par la voix à partir d’une consonne isolée, selon qu’elle est voisée ou non, fricative ou occlusive. Les résultats obtenus à ce point pourront notamment être mis en perspective avec les études de Schwartz (1968) et Whiteside (1998b). Cela constituera donc le premier point de segmentation, et générera 96 stimuli dans chaque langue (24 mots146 x 4 locuteurs).

Pour le deuxième palier, j’ai opté pour une segmentation après la première voyelle (V1). Ainsi, pour les 24 mots de type CVCV, cela permettra d’évaluer l’effet de l’ajout d’une voyelle à la consonne 1 sur le taux de bonnes réponses, et de comparer ces résultats selon les différentes combinaisons de consonnes et de voyelles. De plus, grâce aux trois mots de type VCV, ce point de segmentation me permet également de tester l’identification du genre sur des voyelles isolées : l’analyse de ces résultats offrira notamment une possibilité de comparaison avec l’étude menée par Whiteside (1998a). Cette deuxième segmentation implique la création de 108 stimuli supplémentaires pour chaque langue (27 mots x 4 locuteurs).

145 Voir la procédure expérimentale en 1.6.

146 Les trois mots débutant directement par une voyelle ([api], [ipi], [upi] pour le français et [ӕpi], [i:pi],

- 183 -

Enfin, comme je l’ai annoncé précédemment, les mots entiers seront également

présentés (27 mots x 4 locuteurs soit 108 stimuli). Le total des items expérimentaux

s’élève donc à 312 pour chacune des langues. La figure 57 ci-après résume le découpage des mots opéré pour l’expérience.

Figure 57 – Représentation schématique des découpages opérés sur chaque mot pour

obtenir les stimuli de l’expérience. L’exemple utilisé ici est le mot [ipi] produit par la locutrice F2FR : son onde sonore et son spectrogramme, obtenus avec

Praat, sont visibles respectivement dans la partie centrale et inférieure de la figure. Les barres verticales indiquent les frontières du découpage.

Pour obtenir les items d’entraînement, seul un mot a été utilisé : le mot [ʃapi] pour

l’expérience sur les francophones, et l’équivalent [ʃӕpi] pour celle menée sur les

anglophones. Ces mots, enregistrés l’un comme l’autre par deux locuteurs (WUFFR et

WUHFR pour le mot français, WUFAN et WUHAN pour le mot anglais147) ont été

segmentés de la même manière que les items expérimentaux, donnant ainsi six items par langue. En ajoutant ces items d’entraînement, on arrive par conséquent à un total de 318 stimuli par expérience.

Pour obtenir ces stimuli, j’ai réutilisé les fichiers TextGrid réalisés pour l’analyse

acoustique du chapitre 2148 : ces derniers contiennent le découpage précis et l’étiquetage

147 Voir section 1.2.

- 184 -

en phones de chaque mot. En m’appuyant sur ces fichiers TextGrid, j’ai programmé un script permettant d’automatiser l’ensemble des actions suivantes : dans un premier temps, extraire l’élément C1 de chaque mot, l’exporter dans un fichier au format Wave, et dans un deuxième temps, extraire les éléments C1 et V1 de chaque mot, les regrouper, exporter le tout dans un fichier au format Wave. Ce script a été lancé sur l’ensemble des mots, et m’a ainsi permis de créer 208 fichiers sons par langue, qui ajoutés aux 110 fichiers sons

contenant les mots entiers, constitueront les 318 stimuli149 utilisés pour l’expérience dans

chacune des deux langues150.