• Aucun résultat trouvé

Chapitre 3 : Réalisation prosodique des fonctions de la focalisation

5. Etude de perception

5.2.2. Stimuli

Nous avons sélectionné, dans le corpus de l’expérience de production (cf § 4.2.1), trente énoncés comportant une occurrence de focalisation prosodique. Nous avons choisi des énoncés relativement courts, afin que les participants de l’expérience n’aient pas une quantité trop importante d’informations prosodiques à traiter. Nous avons choisi dix énoncés pour chacune des trois fonctions analysées (insistance, expressivité et marquage de focus). Comme nous l’avons expliqué ci-dessus (cf § 5.1), nous avons également présenté aux participants le contexte d’origine de chaque énoncé. Nous présentons ci-dessous, pour chaque fonction, un exemple d’énoncé précédé de son contexte (l’énoncé est souligné et le constituant focalisé est indiqué en majuscules) :

- insistance : « Bah, en plus on lui avait prévu pour son séminaire, on lui avait prévu une – séminaire de M1 – une toute petite salle, ce qui était étonnant parce qu’y avait… énormément d’étudiants, à Paris 4 en philo, et la salle était toute petite ! Et elle était BLINDEE à craquer. »

- expressivité : « Et le premier cours, il commente la bibliographie, et y a une étudiante qui prenait des notes ou qui soulignait, et il lui a hurlé dessus, il lui a arraché la bibliographie, il l’a déchirée en mille morceaux en disant : ECOUTEZ ce que je dis ! »

- marquage de focus : « A propos de mon nom, du coup j’ai une anecdote. Quand j’étais… Je devais être… Ouais, j’étais au LYCEE. »

Nous avons réenregistré chaque énoncé afin d’en obtenir une version à la prosodie relativement peu marquée61. Cette étape a pour but d’éviter que les participants soient influencés par la prosodie d’origine des stimuli. Une telle influence aurait en effet pu avoir lieu, étant donné que la manipulation prosodique ne porte que sur la syllabe initiale du constituant focalisé. Nous avons prononcé nous-même les énoncés, en employant un débit relativement lent et un registre tonal relativement étroit. Nous n’avons pas produit d’accents autres que rythmiques (ayant pour fonction de délimiter les groupes prosodiques de l’énoncé, cf chap. 1, § 2.1). Nous avons contrôlé la qualité des énoncés réenregistrés en visualisant leurs informations acoustiques sur le logiciel Praat (cf Boersma 2002). Nous avons également réenregistré les contextes d’origine des énoncés, afin de ne pas créer de disparité avec les énoncés lors de l’expérience. Nous présentons ci-dessous (cf Figure 46), à titre comparatif, la courbe de fréquence fondamentale de la version originale et de la version réenregistrée d’un énoncé.

Figure 46. Courbes de fréquence fondamentale de la version originale (à gauche) et de la version réenregistrée (à droite) d’un des énoncés utilisés dans l’expérience de perception. Dans la version originale, une focalisation a lieu sur le

mot blindée.

Nous avons ensuite manipulé prosodiquement les énoncés, afin d’obtenir les quatre réalisations phonétiques souhaitées (cf § 5.1). Nous détaillons ci-dessous les étapes de la manipulation :

- détermination des seuils d’augmentation de hauteur et de durée : Il est nécessaire, pour manipuler la hauteur et la durée de la syllabe initiale du constituant focalisé, de disposer de seuils acoustiques à respecter. Pour déterminer les seuils, nous nous sommes basé sur deux sources. La première source est l’étude d’Astésano (2001), qui comprend une analyse de la réalisation des différents types d’accents en français. Concernant la hauteur, l’étude ne mentionne pas explicitement de seuil. Concernant la durée, Astésano rapporte que l’accent initial est réalisé par une augmentation moyenne de 42,5% par rapport aux syllabes non-accentuées62. La seconde source est le corpus de notre expérience de production (cf § 4.2.1). Nous avons comparé la hauteur et la durée des syllabes initiales accentuées et des syllabes non-accentuées du corpus63. Concernant la hauteur, on observe que l’accent initial est réalisé par une augmentation moyenne de 3,89 demi-tons. Nous avons adopté ce seuil pour la manipulation prosodique. Concernant la durée, on observe une augmentation moyenne de 34,0%. Nous avons adopté comme seuil la moyenne entre cette augmentation et celle observée par Astésano (2001), soit un seuil de 38,3%.

- manipulation de la hauteur : Nous avons effectué la manipulation sur le logiciel Praat, à l’aide de l’extension Momel-Intsint (cf Hirst 2007). Momel-Intsint permet d’obtenir une stylisation de la courbe de hauteur de l’énoncé64. Il est ensuite possible de manipuler la courbe de hauteur stylisée. Nous illustrons ci-dessous (cf Figure 47) le processus de manipulation de la hauteur. On voit que la courbe stylisée est composée de points successifs. En déplaçant un point vers le haut ou vers le bas, on augmente ou on diminue

62 Cette moyenne concerne deux types d’accent initial : l’accent initial rythmique et l’accent initial emphatique (cf chap. 1, § 2.1). La moyenne a été réalisée sur neuf locuteurs, dans trois phonogenres différents (interview, parole lue, journal radiophonique).

63 Pour rappel (cf § 4.2.3), la hauteur et la durée des syllabes du corpus ont été normalisées par rapport à plusieurs paramètres. La hauteur a été normalisée par rapport aux locuteurs. La durée a été normalisée par rapport à la structure syllabique, ainsi que par rapport au débit de parole des locuteurs.

64 La stylisation emploie la fonction mathématique de « spline quadratique » : « The quadratic spline function used

to model the macro-melodic component is defined by a sequence of target points, (couples <s, Hz>) each pair of which is linked by two monotonic parabolic curves with the spline knot occurring (by default) at the midway point between the two targets. […] This, in fact, defines the most simple mathematical function for which the curves are both continuous and smooth. » (Hirst 2007)

la hauteur de ce point. Ce déplacement modifie la portion de courbe qui se trouve entre le point précédent et le point suivant. Pour obtenir les réalisations 1 et 3 (cf § 5.1), nous avons déplacé vers le haut le point le plus proche de la syllabe initiale du constituant focalisé. Afin de déterminer la valeur de fréquence fondamentale à attribuer à ce point, nous avons additionné le seuil préalablement déterminé (3,89 demi-tons) à la valeur initiale du point en Hertz65. Une fois la manipulation effectuée, nous avons rajouté des points le long de la courbe manipulée, entre les points obtenus par stylisation66. Cette opération est nécessaire afin que l’intonation de l’énoncé paraisse plus naturelle auditivement. Notons que la réalisation 4 (sans manipulation sur la syllabe initiale) a également été obtenue en employant Momel-Intsint67. Pour cette réalisation, nous avons simplement stylisé la courbe, sans la manipuler.

- manipulation de la durée : Nous avons employé le menu de manipulation de Praat, qui permet de modifier la durée d’une portion du signal. Ce processus est également illustré ci-dessous (cf Figure 47). On voit qu’il est possible d’insérer des points le long d’une ligne horizontale. La manipulation fonctionne de manière similaire à celle de la hauteur. En déplaçant un point vers le haut ou vers le bas, on augmente ou on diminue la durée de la portion qui se trouve entre le point précédent et le point suivant. Pour obtenir les réalisations 2 et 3 (cf § 5.1), nous avons inséré un point au début et à la fin de la syllabe initiale du constituant focalisé. Nous avons ensuite employé une fonction de Praat qui permet d’augmenter la durée de la portion ainsi délimitée selon le pourcentage souhaité. Nous avons indiqué comme pourcentage le seuil préalablement déterminé (38,3%) :

65 La conversion des demi-tons en Hertz a été effectuée à l’aide d’un logiciel disponible sur Internet à l’adresse suivante : http://users.utu.fi/jyrtuoma/speech/semitone.html.

Figure 47. Capture d’écran du menu de manipulation prosodique du logiciel Praat. La fenêtre du haut contient l’oscillogramme de l’énoncé (ainsi que les pulsions laryngées détectées dans le signal). La fenêtre du milieu contient la courbe de hauteur stylisée par Momel-Intsint (en vert), ainsi que la courbe de hauteur originale (en gris). On voit qu’un des points de la courbe stylisée (en rouge) a été déplacé vers le haut, afin d’augmenter la hauteur de la syllabe. La fenêtre du bas

contient la ligne de manipulation de la durée. On voit que deux points de la ligne (en rouge) ont été déplacés vers le haut, afin d’augmenter la durée de la syllabe.

Nous avons également préparé cinq items d’entraînement et cinq items de contrôle :

- Les items d’entraînement ont pour but de préparer les participants à la tâche qui leur est demandée. Il s’agit, comme pour les stimuli de l’expérience, d’énoncés sélectionnés dans le corpus de l’expérience de production et contenant une occurrence de focalisation prosodique. Les énoncés sont composés de deux occurrences d’insistance, deux occurrences d’expressivité, et une occurrence de marquage de focus. Nous avons réenregistré les énoncés ainsi que leurs contextes d’origine, puis nous avons manipulé la prosodie des énoncés afin d’obtenir les quatre réalisations phonétiques souhaitées.

- Les items de contrôle ont pour but de vérifier la capacité générale des participants à interpréter les phénomènes de nature prosodique. Il s’agit, comme pour les stimuli et les items d’entraînement, d’énoncés sélectionnés dans le corpus de l’expérience de production et contenant une occurrence de focalisation prosodique. Nous avons réenregistré les énoncés ainsi que leurs contextes d’origine, puis nous avons manipulé la prosodie des énoncés. Nous avons obtenu, pour chaque énoncé, deux réalisations a priori

acceptables68 , une réalisation neutre69, et une réalisation a priori non-acceptable70. Selon nos prédictions, le premier type de réalisation doit obtenir une évaluation positive de la part des participants, le second type de réalisation doit obtenir une évaluation positive ou moyenne, et le troisième type de réalisation doit obtenir une évaluation négative. Il est possible, de cette façon, d’exclure de l’analyse les participants qui n’évaluent pas les réalisations de la manière attendue.