Corpus et données - Méthodologie générale

3. Méthodologie générale

3.2 Corpus et données

3.2.1 Corpus

Notre corpus (Annexe 2, p.182) est composé de diverses tâches de lecture et d’une production de voyelles tenues, le tout dans un contexte contrôlé en laboratoire. L’ordre chronologique de présentation des différentes tâches aux locutrices est le suivant :

50 o Ces voyelles tenues sont utilisées pour différentes mesures acoustiques ainsi que pour une partie de l’évaluation perceptive experte réalisée sur l’échelle GRBAS.

• Deux lectures consécutives d’une liste de paires minimales intégrées dans une phrase porteuse de type « clique sur le dessin de boule », « clique sur le dessin de moule » : toutes les paires minimales ont une structure syllabique de type « CVC » et sont des noms communs que l’on peut représenter simplement par un dessin (Annexe 3, p.185).

o Les paires minimales sont insérées dans des phrases porteuses car elles sont utilisées lors d’une expérimentation travaillée à la manière d’un jeu sur ordinateur à l’attention d’élèves de primaire. Certaines phrases sont également utilisées pour réaliser une seconde évaluation GRBAS, basée sur un extrait de parole continue.

• La lecture, en deux temps, du texte « La Bise et le Soleil », très courant dans les études phonétiques. Ici, une mise en condition est demandée à la locutrice : la première lecture réalisée est « neutre » c’est-à-dire « comme si vous lisiez pour vous-même » alors que la deuxième lecture est produite en imaginant être dans une classe bruyante.

o Ces lectures font l’objet d’une comparaison acoustique afin d’observer s’il y a des différences acoustiques saillantes entre les deux conditions. Le premier paragraphe de la lecture neutre est également utilisé pour un test de perception à destination d’auditeurs naïfs.

• Enfin, la lecture de deux courtes histoires inventées à partir de vignettes de Babar (très célèbre personnage fictif de la littérature enfantine Française). Encore une fois, la première lecture est à réaliser en condition neutre de « lecture à soi-même », en revanche, la deuxième lecture est une mise en condition de lecture dîtes « devant une classe calme ».

o Ces enregistrements n’ont finalement pas été utilisés lors des analyses finales. Cette partie du corpus était supposée être employée afin d’évaluer l’impact de la voix dysphonique sur la compréhension d’une histoire par des enfants de 6 ans, mais cette tranche d’âge était sous-

51 représentée parmi les enfants qui ont pu être recrutés, si bien que nous avons dû laisser de côté cette expérimentation.

3.2.2 Prise de données audio et électroglottographiques

Avant de débuter les prises de données auprès des professeures des écoles, le protocole expérimental suivant a été évalué, puis validé par le Comité d’éthique pour les recherches comportementales et en santé (CERCES) de l’Université Paris Descartes en mars 2018. Les enregistrements se sont alors déroulés de mars jusqu’en octobre 2018. Tout d’abord les participantes sont invitées à lire une lettre d’information (Annexe 4, p.185), puis à signer un formulaire de consentement (Annexe 5, p.190) et un formulaire de « droit à la voix » (Annexe 6, p.191) nous donnant l’autorisation de diffusion de certains extraits sonores anonymisés dans le cadre de manifestations scientifiques. Dans un second temps, les participantes sont enregistrées, pour une durée de 20 minutes, à partir de la station Computerized Speech Lab 4500 de KayPENTAX à une fréquence d’échantillonnage de 22050 Hz. Un micro-casque AKG C410 est positionné à environ 5 cm des lèvres et un EGG A-100 est également placé sur chaque locutrice. De mars à juin 2018, les enregistrements ont pris place dans une salle isolée et calme de l’unité Voix, Parole, Déglutition du Service ORL de l’Hôpital Européen Georges Pompidou (HEGP) mais après le changement d’établissement de l’ORL qui nous permettait d’utiliser l’arrière de son cabinet, nous avons été contraints de changer de lieu pour les enregistrements. Nous avons donc déplacé notre matériel de prise de données dans la chambre sourde de l’Institut de Linguistique et Phonétique Générales et Appliquées (ILPGA), département de l’université Paris 3, Sorbonne Nouvelle, où les enregistrements de nos locutrices se déroulent alors jusqu’à leur terme de juillet à octobre 2018.

Afin de nous assurer que ce changement n’ait pas d’impact important sur nos données acoustiques, des rapport signal sur bruit (SNR) sont calculés à partir d’enregistrements tests réalisés par une locutrice n’appartenant pas à notre cohorte de PE, dans les deux lieux d’enregistrement et avec le même matériel que celui utilisé pour enregistrer les participantes.

52 Les valeurs de SNR sont calculées à partir de la phrase, faisant partie du corpus enregistré par nos PE : « Clique sur le dessin de bac ». Pour cela, les /a/ dans le mot « bac » des deux enregistrements sont segmentés sur Praat (Boersma et al., 2020) et la mesure d’intensité prélevée au milieu du segment. Enfin, la mesure d’intensité réalisée sur la partie considérée comme « silencieuse » est effectuée au début du signal du même enregistrement, lors d’un blanc d’environ 0.5 secondes, demandé à la locutrice contrôle dont les productions sont utilisées pour l’évaluation du SNR. Le SNR est ainsi calculé comme la différence en décibels entre l’intensité dans la réalisation du /a/ et de l’intensité dans la portion de signal supposée silencieuse.

Nos calculs révèlent que les SNR de ces deux lieux d’enregistrement sont proches avec un rapport de 27dB pour l’HEGP et 31dB pour l’ILPGA (Figure 10).

Figure 10 : Spectrogramme de la réalisation du /a/ (à gauche) et du silence (à droite) séparé par un silence de 30 ms, sur lesquels ont été calculés les SNR à l’HEGP (à gauche) et à l’ILPGA (à droite)

Cette différence de bruit de fond ne devrait donc pas être suffisante pour créer un biais dans les mesures acoustiques réalisées parmi les locutrices enregistrées dans chacun des deux laboratoires.

Dans le document La dysphonie chez les professeures des écoles : perception et représentations (Page 60-63)