• Aucun résultat trouvé

Profilage suprasegmental par analyse automatique (Ferragne 2013)

CHAPITRE V — Vérification de la fiabilité du système d’évaluation prototypique semi-

4.5 Profilage suprasegmental par analyse automatique (Ferragne 2013)

Comme précédemment pour les autres recherches, voyons les objectifs assignés et la méthodologie utilisée par Ferragne avant d’en faire le bilan.

4.5.1 Objectifs

Ferragne (2013) souligne le caractère crucial du rythme dans la détection d’un accent étranger et propose de rendre compte des productions d’apprenants anglicistes francophones par analyse automatique du rythme et d’autres traits suprasegmentaux comme l’étendue de registre ou l’intensité.

Pour cela, il se fixe deux objectifs (2013 : 154). Le premier est d’établir une comparaison entre, d’une part, l’annotation manuelle d’intervalles vocaliques et consonantiques, et d’autre part, une segmentation entièrement automatisée. Le deuxième objectif est de classer automatiquement les résultats obtenus pour catégoriser apprenants francophones et natifs anglophones.

4.5.2 Méthodologie d’investigation

Afin de calculer automatiquement les paramètres rythmiques et de registre pouvant contraster les réalisations suprasegmentales natives et celles d’apprenants, Ferragne utilise une partie du corpus ANGLISH (Tortel 2009, voir plus haut, ou [2008] 2013), c’est-à-dire les fichiers de lecture du groupe de 23 locuteurs natifs d’une part (GB) et des 20 apprenants ayant un niveau d’anglais L2 du Baccalauréat d’autre part (FR1). L’annotation manuelle est fournie avec le corpus ANGLISH. Le profilage consiste à extraire une moyenne des données (inclusion) de chaque paramètre afin de la contraster avec d’autres moyennes (exclusion) de même type. L’individu n’a de signification que dans sa relation au groupe auquel il appartient ou auquel il s’oppose.

Ferragne établit une comparaison de la durée de lecture dans les groupes GB et FR1 pour chacun des textes de lecture. Il limite l’étendue de la plage de variations mélodiques à l’écart interquartile de F0, qu’il calcule automatiquement avec Praat39

en balisant la F0 à 75 et 400 Hertz pour chaque locuteur et chaque passage de lecture, qu’il convertit en demi-tons. Il justifie son choix d’utiliser l’écart interquartile des données recueillies plutôt que l’écart type par la difficulté d’obtenir des mesures fiables de F0.

L’analyse de l’étendue de registre montre que son écart interquartile dépend à la fois de la différence natif-non natif, du genre du locuteur, ainsi que du style de texte. Ferragne reste confiant dans la robustesse de l’écart interquartile pour mesurer le registre bien que l’un

39

de ses résultats, 32 demi-tons, équivalent à trois octaves, lui semble excessif dans le recueil de mesures d’un des textes.

Pour comparer les intervalles vocaliques dans les groupes GB et FR1, il corrèle les résultats de l’algorithme de Pellegrino & André-Obrecht (2000) de repérage des voyelles à ceux de l’analyse manuelle de détection des voyelles et montre que l’algorithme tend à détecter plus de voyelles que l’annotation manuelle. Examinant les frontières des intervalles, Ferragne (2013 : 158) vérifie statistiquement (test de Wilcoxon) que la durée moyenne de chaque méthode est significative et utilise le test de Fisher pour appuyer sa conclusion sur la différence d’écart interquartile.

Ferragne utilise la variable PVI (Pairwise Variability Index) pour mesurer l’intensité (au lieu de la durée) et appelle intensity PVIs ou PVIi cette différence moyenne entre toutes les

paires de voyelles successives dans un énoncé.

Pour atteindre son deuxième objectif de classification automatique, Ferragne applique des régressions logistiques par variables binaires à chacun des textes et utilise la validation croisée pour estimer le taux d’erreur moyen.

La méthodologie de Ferragne se base sur une démonstration argumentée étayée à tous les niveaux de vérifications statistiques. Elle se caractérise par le souci d’effectuer une recherche cohérente et utile, qui fait sens sans se limiter au seul domaine phonétique.

4.5.3 Bilan et discussion

Lors de l’extraction des mesures de F0, Ferragne ne prend en compte que l’écart interquartile pour éviter les erreurs de détection automatique : il filtre ainsi une partie des données possibles en ciblant son objectif. Par ailleurs, toujours pour étudier la F0, il subdivise le corpus de lecteurs selon le sexe. De même, dans les mesures automatiques des voyelles, il signale qu’il y a plus de voyelles repérées automatiquement que manuellement (2013 : 159). En conséquence, il décide d’exclure les mesures des voyelles de son étude (2009 : 165). Le profilage opéré est organisé en amont des mesures par la création de certaines catégories par subdivision ou au contraire par une exclusion radicale. Il s’agit là d’un profilage de groupes à tous les niveaux de l’expérimentation, dont le résultat final est un profil suprasegmental des apprenants anglicistes et celui des locuteurs natifs selon les paramètres utilisés.

Ferragne aborde un profilage d’inclusion, exclusion et classement entièrement automatisé. Les variables qu’il utilise diffèrent de celles obtenues par segmentation manuelle, mais elles fonctionnent, au moins pour les deux groupes de locuteurs FR1 et GB. Selon lui (2013 : 155), un avantage de la segmentation automatique est que les décisions arbitraires en fonction de la langue étudiée font place à une harmonisation des pratiques conduisant à une élégance du système méthodologique (2013 : 155).

Ferragne dresse un profil de la prosodie des apprenants anglicistes francophones à partir des variables de durée de lecture (aisance), d’intensité et de durée vocalique (rythme), et de la plage de registre des variations mélodiques (mélodie). Le bilan que je peux tirer de sa recherche est que la durée de lecture et l’étendue de registre sont facilement transposables à mon étude. Je garderai cependant l’annotation manuelle de F0, pour obtenir précision et fiabilité maximales des mesures, certains des fichiers de mon corpus n’étant pas de qualité maximale. Je ne retiendrai pas le facteur d’intensité car mes corpus n’ont pas été élaborés en fonction de cette variable : les locuteurs étaient libres de se mouvoir pendant l’enregistrement et je ne peux garantir la fiabilité de la correspondance entre les mesures et les réalisations originelles. Le critère de durée vocalique, bien que prometteur, me semble difficile à mettre en œuvre sur l’ensemble d’un fichier par son caractère chronophage si on y inclut les vérifications nécessaires à la fiabilité des données. Des aménagements devraient pouvoir le modifier pour cibler davantage les éléments mesurés selon un profilage par inclusion et exclusion.

4.6 Profilage intonatif par étude multidimensionnelle quantitative et