• Aucun résultat trouvé

3. Revue de la littérature

4.5 Dépouillement et codification des données

4.5.2 Analyse des données de l’AO

Lors de l’administration de la tâche de narration, les échantillons de parole ont été consignés à partir d’un enregistreur numérique et ont ensuite été convertis en fichier audio. Les échantillons numériques ont été analysés acoustiquement à l’aide d’un script du logiciel Praat (de Jong & Wempe, 2009). Ce logiciel permet une visualisation des fichiers sonores sur un spectrogramme à trois dimensions. Les échantillons ont été transcrits par une assistante de recherche et vérifiés par une autre pour les analyses des répétitions, de réparations et l’utilisation de remplissage (ums, eh, etc.), la présence de mots en L1 et les mots inaudibles (voir annexe 8 pour les conventions de codage utilisées). Une rencontre d’accord inter- juges a été organisée pour régler les cas où il y avait désaccord. Les juges ont écouté de nouveau les cas où il y avait désaccord pour faire consensus.

À l’aide des transcriptions et de l’utilisation du logiciel Praat, les mesures temporelles reconnues comme étant le plus fortement associées au développement de l’AO (Segalowitz et al., 2014) ont été traitées et mesurées à la milliseconde près, à savoir le débit de parole (DP), le temps de phonation (TP) et la longueur moyenne de l’énoncé (LME). Lors du traitement des fichiers sonores, tous les segments d’une durée minimale de 0,2 seconde (segment en français (L1), segment en anglais (L2), pauses remplies, pauses silencieuses et segments inaudibles ont été traités. Les segments de parole en L1 et en L2 ont été séparés. Pour les mesures d’AO en L2, Les mots en L1 et les segments inaudibles ont été retranchés et les mesures temporelles ne tiennent compte que de la production en L2.

70

Il est important de mentionner que seuls les mots clairement prononcés en français (L1) ont été retranchés. Toute tentative de prononcer en anglais un mot a été considérée comme un mot en L2. Pour l’AO en L2 et en L1, les onomatopées ont été considérées comme des mots (p. ex. « bang » a été comptabilisé en L1 (français) et « wham » a été comptabilisé en L2 (anglais)). Les mots non complétés (une syllabe et plus ou les syllabes répétées lors d’une hésitation) ont été identifiés à l’aide du segment de parole qui suivait. Si le segment suivant était en L1, les mots non complétés étaient identifiés comme étant en L1. Les syllabes répétées et les mots non complétés sont considérés dans le compte des syllabes. Les pauses remplies sont des vocalisations du type « eeeeeee » et « hummm ». Les élongations de syllabes ne sont pas considérées (p. ex. « annnnnnnn »). Les rires, les soufflements et les bruits de bouche ne sont pas considérés comme des pauses remplies. Les pauses silencieuses sont des moments de silence entre deux segments.

Le calcul des mesures temporelles d’AO (DP, TP et LME), pour la narration en L1 et en L2, ainsi que pour l’entrevue en L1 et en L2 ont été effectuées par trois juges. Un comptage manuel du nombre de syllabes a été effectué. Chaque juge devait compter manuellement le nombre de syllabes à partir du fichier audio et à l’aide de la transcription. À l’aide de l’adaptation d’un script Praat (Kawahara, Hajime, & Sudo, 2006), les fichiers audio ont par la suite été importés dans Praat afin d’y inscrire les données sous chaque segment pour déterminer s’il s’agissait d’un segment de parole (en anglais ou en français), d’une pause (silencieuse ou remplie) ou d’un segment inaudible.

La durée de la pause a été établie à 200 millisecondes. Bien que certaines études sur l’aisance aient utilisé une durée de la pause plus importante de 250 à 400 millisecondes (p. ex. Derwing et al., 2004; Freed, Segalowitz, & Dewey, 2004; O'Brien et al., 2007; Skehan et al., 2016), des études récentes ont permis de voir que des durées plus courtes (250-300 millisecondes) pour les pauses silencieuses permettaient de mettre en lumière des corrélations plus importantes entre les mesures des compétences langagières et les pauses silencieuses (Bosker, Pinget,

71

Quené, Sanders, & de Jong, 2013). À une durée plus courte, cela permet aussi de capturer 12 % de pauses silencieuses de plus (Kahng, 2014). Aussi, il a été démontré que le fait de tenir compte des pauses à une durée de 400 millisecondes faisait perdre 77 % des pauses à l’intérieur des énoncés (Kahng, 2014). Comme l’un des indicateurs de l’AO de la présente étude est la LME, il s’avérait central de bien capturer le phénomène de pausologie dans les énoncés. Les pauses ont donc été comptées à partir d’une durée de plus de 200 millisecondes, à la fois pour les pauses silencieuses et les pauses remplies afin de ne perdre aucune information potentiellement liée au développement de l’AO dans le présent contexte de l’étude. Tout cela permet d’aligner la présente étude à la lumière des données récentes en permettant de bien saisir les variations du phénomène de pausologie et d’éviter de perdre des indicateurs importants.

Par la suite, le script Praat a permis un comptage précis des différents segments et l’établissement des moyennes pour chaque type de segment. Le script permet le calcul du temps total de la narration, le nombre et la durée totale des segments (pour la tâche en L2 en enlevant les segments en L1 pour ne tenir compte que de la production en L2), le nombre et la durée totale des pauses silencieuses et remplies ainsi que le nombre et la durée des segments inaudibles.

Le traitement de la tâche de l’entrevue pour le traitement des données temporelles a exigé plus de manipulations. En effet, lors de la prise de mesures au T1, compte tenu du niveau débutant des apprenants (ils ont eu 220 heures d’enseignement au total réparties sur 5 ans), la prise de parole spontanée à la suite des questions de l’entrevue a été très limitée. La plupart des participants ne produisaient que quelques mots par question lors de l’entrevue (moyenne variant de 2,5 à 11,4 mots). Lorsque le traitement des données a dû être fait, il s’est avéré que le nombre de mots était insuffisant à la plupart des questions pour rendre possible un traitement des mesures temporelles. Une moyenne de mots produits par question a donc été établie. La recherche antérieure sur l’AO chez des apprenants de niveau débutant a été faite minimalement à l’aide de segments de parole d’une dizaine de mots pour la prise de mesures temporelles (Munro & Derwing, 1999).

72

Dans notre étude, deux questions ont rendu possible le traitement des données en permettant un échantillonnage d’une dizaine de mots (10,8 et 11,4 mots). Ces deux segments ont donc été ciblés pour le calcul des mesures temporelles.

Les questions ciblées portaient sur des données factuelles comme le numéro de téléphone (m = 10,8 mots) et la description de la famille (m = 11,4 mots). Cette production plus importante à ces deux questions s’explique, entre autres, par les connaissances travaillées en classe dans les années précédant le programme intensif. En effet, le programme de formation cible la description de l’environnement immédiat de l’élève et le vocabulaire courant tel que les nombres, la famille, les formes et les couleurs (MELS, 2001).

Le compte des mots a été fait à partir du nombre de mots produits lors de la réponse initiale du participant à la question originale (le compte de mots ne tenait pas compte par exemple de mots produits à la suite d’une sous-question de l’examinateur (p. ex. si la question était « Tell me about your family? », le compte de mots a été fait à la réponse originale et non pas aux sous-questions « How many brothers/sisters do you have? »). Ce choix méthodologique permet ainsi de conserver l’homogénéité dans la production de parole et de favoriser la comparaison des participants puisqu’ils ont tous produits leur échantillon de parole dans un contexte identique.

Par la suite, le même traitement des données a été fait pour l’entrevue, la narration, la transcription et le calcul des mesures temporelles d’AO. Tous les échantillons de parole de la tâche monologique et de la tâche dialogique ont été traités de la même manière pour la L1 et pour la L2. Il est également important de mentionner que les mêmes questions ont été utilisées dans la tâche dialogique pour mesurer l’AO en L1 afin de favoriser la comparaison entre les variables d’AO en L2 et en L1.