• Aucun résultat trouvé

Le corpus PFC/LVTI Toulouse et Marseille

4.4.3 La segmentation et le codage des voyelles moyennes

Dans le chapitre 2, nous avons mentionné le respect de la loi de position dans les variétés méridionales. Sans trop anticiper sur le chapitre 6 traitant les voyelles moyennes, rappelons que cette loi prévoit que l’on trouve une voyelle mi-ouverte en syllabe fermée ou en syllabe ouverte suivie d’une syllabe à schwa, d’un autre côté, on trouve une voyelle mi-fermée en syllabe ouverte. Dans le cadre de notre travail, nous souhaiterions savoir dans quelle mesure cette loi qui régit la distribution des voyelles moyennes s’applique à notre corpus. Dans le chapitre 6, nous montrerons

4.4. Annotation du corpus

Figure 4.15 – Extrait de la base de données contenant les informations relatives aux voyelles basses du corpus.

que des observations phonétiques doivent également être menées pour comprendre la dynamique des systèmes des locuteurs.

Nous avons tout d’abord construit un codage propre aux voyelles moyennes. Son but est de nous indiquer si la loi de position est respectée ou non. Nous avons appliqué ce codage dans la cinquième tire de chacune des tâches du protocole et pour chacun des locuteurs. Nous présentons le codage que nous avons établi dans la Figure 4.16.

Le premier champ permet de caractériser quel est le couple concerné par la possible application de la loi de position. Ainsi, les voyelles [e] et [E] sont codées 1 ; les voyelles [ø] et [œ] sont codées 2, et enfin, les voyelles [o] et [O] sont codées 3. Le troisième champ de ce codage permet de caractériser le type de syllabe dans la-quelle la voyelle moyenne est réalisée. Ainsi, en syllabe ouverte, le troisième champ recevra la valeur 1, alors qu’en syllabe fermée ou en syllabe ouverte suivie d’une syllabe à schwa graphique, il sera codée 2. Enfin, le deuxième champ permet de déterminer si la loi de position est respectée (0), ou non (1). Nous proposons égale-ment la possibilité d’une incertitude (2). Ce champ est en grande partie déterminé par le type de syllabe. On peut donc se demander pourquoi il le précède. La prin-cipale raison de ce choix est ergonomique. Nous fournissons plusieurs exemples en (5).

Figure 4.16 – Codage des voyelles moyennes. — Champ 1 :

• 1 = voyelle [e] ou [E] • 2 = voyelle [ø] ou [œ] • 3 = voyelle [o] ou [O] — Champ 2 :

• 0 = respect de la loi de position • 1 = écart à la loi de position • 2 = incertitude

— Champ 3 :

• 1 = syllabe ouverte

• 2 = syllabe fermée, ou syllabe ouverte suivie d’une syllabe à schwa graphique

(5) a. « peu » ; [pø] ; « peu201 »

b. « Paul » ; [pol] ; « Pau312l »

c. « pôle » ; [pOl(@)] ; « pô302le »

d. « fais » ; [fE] ; « fai111s »

Dans l’exemple (5-a), la voyelle moyenne ([ø]) appartient au deuxième couple de voyelles (champ 1 = 2 : voyelle [ø] ou [œ]). La voyelle est en syllabe ouverte, c’est-à-dire que la syllabe ne possède pas de coda (champ 3 = 1). Suivant la loi de position, nous devons trouver une voyelle mi-fermée en syllabe ouverte. Dans cet exemple, la voyelle moyenne [ø] est mi-fermée, la loi de position est donc bien respectée (champ 2 = 0). La voyelle moyenne doit donc recevoir le codage 201.

Concernant l’exemple (5-b), la voyelle moyenne [o] appartient au troisième couple (champ 1 = 3). Étant donné que la syllabe est fermée, c’est-à-dire que la voyelle moyenne possède une coda, le champ 3 doit être codé 2. En syllabe fermée, la loi de position prévoit que l’on trouve une voyelle mi-ouverte. Dans cet exemple, la voyelle moyenne est réalisée comme une mi-fermée ([o]) ; ceci constitue un écart à la loi de position (champ 2 = 1). La voyelle moyenne reçoit finalement le codage 312.

Dans le troisième exemple, la voyelle moyenne est une postérieure [O], mi-ouverte (champ 1 = 3). Cette voyelle est en syllabe mi-ouverte ; toutefois, la syllabe suivante est une syllabe contenant un schwa graphique. La réalisation (ou non) de ce schwa ne doit avoir aucune incidence sur le codage des voyelles moyennes, de sorte que nous ne codons pas deux phénomènes au sein d’une même tire. Dans ce cas de figure, le champ 3 doit être codé 2. De plus, selon la loi de position, nous nous attendons à trouver une voyelle mi-ouverte, ce qui est le cas (champ 2 = 0).

4.4. Annotation du corpus

Enfin, pour le quatrième exemple, la voyelle [E] (champ 1 = 1) est en syllabe ouverte (champ 3 = 1). Le timbre mi-ouvert de cette voyelle est un écart à la loi de position (champ 2 = 1). Cette voyelle donc être codée : 111.

En suivant cette procédure, nous avons obtenu 46110 codages sur l’ensemble du corpus. Ajoutons que dans un contexte de liaison (par exemple : « dernier étage », nous codons la syllabe de la voyelle moyenne comme étant ouverte ou fermée en fonction de l’enchaînement ou non de la consonne de liaison, de sorte qu’aucun parti pris théorique n’était présent en amont de l’application du codage, nous nous basons uniquement sur la perception. Ainsi la séquence « dernier étage », réalisée [dEKnje KetaZ], doit être codée : « de102rnie101r é101tage ». Un avantage de notre codage est qu’il permet de vérifier si le contexte de liaison favorise la présence d’une voyelle mi-ouverte ou d’une voyelle mi-fermée. Il n’y a pas, dans ce codage, d’hypothèse théorique de départ ; il s’agit d’un simple relevé phonétique pour ensuite poser une hypothèse phonologique. En ce sens, nous pensons avoir établi un codage suivant les conventions préconisées par le programme PFC.

Le codage que nous avons établi nous permet de déterminer le timbre exact de chaque voyelle codée. Prenons un exemple pour illustrer ce propos. Concernant les voyelles postérieures, le premier champ de codage est : 3. Les deuxième et troisième champs nous donnent des indications sur le respect de la LdP ainsi que sur le type de syllabe (fermée ou ouverte). En combinant ces champs, nous pouvons retrouver le timbre perçu :

— si la loi de position est respectée (champ 2 = 0) et que l’on est en syllabe ouverte (champ 3 = 1), nous avons une voyelle mi-fermée [o], par exemple,

« beau » [bo],

— si la loi de position est respectée (champ 2 = 0) et que l’on est en syllabe fermée (champ 3 = 2), nous avons une voyelle mi-ouverte [O], par exemple,

« bol » [bOl],

— si la loi de position n’est pas respectée (champ 2 = 1) et que l’on est en syllabe ouverte (champ 3 = 1), nous avons une voyelle mi-ouverte [O], par exemple, « beau » [bO],

— si la loi de position n’est pas respectée (champ 2 = 1) et que l’on est en syllabe fermée (champ 3 = 2), nous avons une voyelle mi-fermée [o], par exemple, « bol » [bol],

L’avantage d’avoir accès à la prononciation perçue est que nous pouvons la com-parer avec la réalisation effective (relevé formantique). Nous n’avons pas souhaité effectuer systématiquement cette comparaison. Toutefois, sur un petit échantillon du corpus, une double annotation (codage et analyse acoustique) pourrait être sa-lutaire. En effet, l’analyse acoustique permettrait de valider l’analyse perceptive. Nous développerons la procédure de validation de ce codage à l’aide de l’analyse acoustique dans le chapitre 6. D’autre part, nous avons expliqué ci-dessus que des

observations phonétiques sur les voyelles moyennes seraient indispensables. Pour mener des analyses acoustiques, nous avons effectué la même procédure que pour les voyelles basses. En premier lieu, nous avons segmenté, sur la sixième tire, chacune des voyelles moyennes de la liste de mots pour chacun des locuteurs du corpus excepté 31cnl1. Nous fournissons dans le tableau 4.4 chacune des voyelles moyennes potentiellement segmentables de la liste de mots.

Table 4.4 – Voyelles moyennes de la liste de mots. Voyelles de 6. fou à lier ; 7. des jeunets ; 10. fêtard ; 11. nièce ;

type [e] ou [E] 13. piquet ; 14. épée ; 16. fête ; 19. pêcheur ; 20. médecin ; 22. infect ; 23. dégeler ; 24. bêtement ; 25. épier ;

26. millionnaire ; 28. scier ; 29. fêter ; 30. mouette ; 31. déjeuner ; 32. ex-femme ; 33. liège ; 34. baignoire ; 35. pécheur ; 37. relier ; 38. aspect ;

39. niais ; 40. épais ; 41. des genêts ; 45. piqué ;

48. bouleverser ; 50. explosion ; 53. ex-mari ; 55. étrier ; 58. lierre ; 63. miette ; 68. cinquième ; 69. nier ;

70. extraordinaire ; 72. vous prendriez ; 75. étriller ; 76. faites ; 78. quatrième ; 79. muette ; 80. piquais ; 81. trouer ; 82. piquer ; 84. beauté ; 87. épais ; 88. épée ; 91. beauté ; 92. botté.

Voyelles de 1. roc ; 18. agneau ; 21. paume ; 26. millionnaire ; type [ø] ou [œ] 36. socialisme ; 47. gnôle ; 50. explosion ; 54. pomme ;

62. rhinocéros ; 67. rauque ; 70. extraordinaire ; 73. botté ; 84. beauté ; 91. beauté ; 92. botté.

Voyelles de 3. jeune ; 19. pêcheur ; 31. déjeuner ; 35. pécheur ; 43. creux ; type [o] ou [O] 61. jeûne ; 66. peuple ; 71. meurtre ; 77. feutre ; 83. creuse ;

89. jeune ; 90. jeûne.

Nous avons, en second lieu, extrait automatiquement des informations acous-tiques et des métadonnées pour construire une base de données récapitulative33. Toutefois, nous avons détecté certains problèmes de relevés formantiques dans les relevés automatiques de Praat, tant pour la constitution de la base des voyelles basses que pour celle des voyelles moyennes. En effet, l’extraction automatique est basée sur le repérage formantique disponible dans le logiciel Praat, mais, il peut arriver que ce repérage soit mal effectué. Nous donnons un exemple de deux rele-vés formantiques de Praat pour le locuteur 13cgc1 pour illustrer nos propos (cf. tableau 4.5). Dans ce tableau, il apparaît que les relevés du F1 sont relativement

4.4. Annotation du corpus

Table 4.5 – Exemples de relevés formantiques issus de l’extraction automatique.

Locuteur Voyelle Mot F1 F2 F3

13cgc1 [o] 84. beauté 359 Hz 468 Hz 2477 Hz

91. beauté 371 Hz 2494 Hz 3032 Hz

similaires. En revanche, il y un écart très important entre les deux F2 et les deux F3. Remarquons que le F3 de « 84. beauté » est du même ordre de grandeur que le F2 de « 91. beauté ». Nous savons que le F2 est un marqueur de l’antériorité et, étant donné que ces relevés ont été effectués sur des voyelles postérieures, nous considérons que les F1, F2 et F3 de « 84. beauté » sont corrects et que pour la voyelle de « 91. beauté », le logiciel a réalisé un « saut formantique ». C’est-à-dire, que pour cette voyelle, l’extraction automatique n’a pas réussi à « récupérer » la valeur du F2 ; par conséquent, la valeur du F3 est présentée comme le F2 et la valeur du F4 est présentée comme la valeur du F3. Nous observons dans la Figure 4.17, la visualisation spectrographique de cette voyelle.

Figure 4.17 – Visualisation des relevés formantiques de Praat.

pourrait expliquer que le F2 n’ait pas été détecté. Nous avons systématiquement repéré ce type d’erreur dans les deux bases de données, puis nous avons apporté des corrections manuelles. Pour reprendre l’exemple précédent, la correction a consisté à attribuer aux F1, F2 et F3 les valeurs : 371 Hz, 455 Hz et 2494 Hz, la valeur 455 Hz étant relevée manuellement (cf. Figure 4.17).

Une fois ces ajustements effectués, nous avons également extrait le codage de chacune des voyelles moyennes segmentées pour caractériser dans la base de données le timbre exact de la voyelle segmentée. Nous fournissons un extrait de cette base dans la Figure 4.18 qui contient les informations relatives à 4121 voyelles segmentées répertoriées.

Figure 4.18 – Extrait de la base de données contenant les informations relatives aux voyelles moyennes du corpus.