• Aucun résultat trouvé

Chapitre 2 : Influence du phonogenre sur la fréquence d’occurrence et la réalisation

3. Parole spontanée, lue et interprétée

3.2. Différences prosodiques

Les différences prosodiques entre la parole spontanée et la parole lue ont fait l’objet de nombreuses études45. Notons que la plupart de ces études portent sur l’anglais. Nous

présentons ci-dessous (cf Tableau 4) les résultats observés concernant différents aspects prosodiques tels que l’intonation, l’accentuation, la durée ou la qualité vocalique. Comme on peut le voir, les résultats sont souvent contradictoires, en particulier concernant l’intonation, les variations de registre tonal et la durée. Cependant, on observe plusieurs différences. La

4 Notons que ces études ont généralement une visée technologique : l’amélioration de systèmes de reconnaissance

et de synthèse de la parole. En effet, ces systèmes sont généralement entraînés sur de la parole lue, mais ont pour but de recevoir de la parole spontanée (dans le cas de la reconnaissance), ou de produire de la parole ressemblant à de la parole spontanée (dans le cas de la synthèse). Pour obtenir une bonne qualité, il est nécessaire de savoir en quoi les deux phonogenres divergent.

5 Notons également que le protocole expérimental employé par la plupart de ces études (e.g. Batliner et al 1995,

Laan 1997, Wagner et Windmann 2016) est très proche du protocole RepTask (cf Laurens et al 2011) que nous avons employé dans notre expérience de production (cf § 4.1). Ce protocole consiste à demander à des locuteurs de reproduire une conversation spontanée qui a vraiment eu lieu. Notre expérience se distingue par le fait que nous n’avons pas seulement demandé aux locuteurs de lire le texte à haute voix, mais aussi de l’apprendre par cœur.

parole lue se caractérise par une plus forte déclinaison de la hauteur que la parole spontanée, un plus grand nombre de contours descendants, un plus grand nombre de syllabes accentuées, des groupes prosodiques plus courts, des allongements de fin de groupes plus marqués, un nombre beaucoup plus faible de marques d’hésitation, et moins de perturbation de la qualité vocalique.

6 Le shimmer est la variation d’amplitude du signal sonore entre deux cycles. Il reflète la qualité de la vibration

des cordes vocales. La réduction de la qualité spectrale des voyelles désigne la déviation du premier et du deuxième formant vers la position des formants du schwa (environ 500 et 1500 Hz). Cette déviation est la conséquence d’une prononciation relativement relâchée.

intonation registre tonal durée et débit d’articulation

- plus de variations en parole lue (Laan 1997)

- moins de variations en parole lue (Lieberman et al 1985)

- plus de déclinaison en parole lue (Swerts et al 1996, Laan 1997)

- plus de contours descendants en parole lue (Lieberman et al 1985, Blaauw 1994, de Ruiter 2015)

- plus élevé en parole lue (Swerts et al 1996, Laan 1997) - moins élevé en parole lue

(Batliner et al 1995)

- plus étendu en parole lue (Batliner et al 1995, Laan 1997, Goldman et al 2011)

- plus réduit en parole lue (Simon et al 2010, Wagner et Windmann 2016)

- plus d’allongement sur les accents finaux en parole lue (Astésano 2001 : 192)

- débit plus élevé en parole lue (Mixdorff et Pfitzinger 2005, Simon et al 2010, Wagner et Windmann 2016)

- débit moins élevé en parole lue (Batliner et al 1995, Laan 1997, Dellwo et al 2015)

- beaucoup moins de marques d’hésitation en parole lue (Wagner et Windmann 2016)

accentuation phrasé qualité vocalique

- variation dans la localisation des accents (Howell et Kadi- Hanifi 1991)

- plus de syllabes accentuées en parole lue (Mixdorff et Pfitzinger 2005, Wagner et Windmann 2016)

- peu de différences (Blaauw 1994, Swerts et al 1996)

- groupes prosodiques plus courts en parole lue (Howell et Kadi-Hanifi 1991)

- moins de shimmer et moins de réduction de la qualité spectrale des voyelles en parole lue6 (Laan 1997)

Par comparaison avec la parole lue, la parole interprétée a fait l’objet de moins d’études7. De

plus, ces études portent parfois sur un autre aspect que les différences prosodiques entre la parole interprétée et la parole spontanée :

- Audibert et al (2008) et Jürgens et al (2011) testent la capacité de sujets à différencier auditivement la parole spontanée et la parole interprétée. Les sujets parviennent à effectuer cette différenciation dans la première étude, mais pas dans la seconde.

- Audibert et al (2008) comparent également des jugements d’« intensité émotionnelle » obtenus auprès de sujets concernant la parole spontanée et la parole interprétée. La parole interprétée est jugée plus intense que la parole spontanée.

- Certaines études s’intéressent enfin aux différences entre la parole produite par des acteurs professionnels et celle produite par des acteurs amateurs :

o Jürgens et al (2015) testent la capacité de sujets à identifier, parmi ces deux types de locuteurs, le fait qu’il s’agit de parole interprétée. Les acteurs professionnels sont plus souvent correctement identifiés que les acteurs amateurs (bien que le taux global d’identification soit assez faible).

o Krahmer et Swerts (2008) comparent des jugements d’intensité émotionnelle concernant les deux types de locuteurs. Les acteurs professionnels sont jugés plus « extrêmes » et moins naturels que les acteurs amateurs8.

7 Notons que ces études ont généralement une visée méthodologique. Elles se situent en effet dans le cadre des

recherches sur l’expression vocale des émotions. Ces recherches se basent souvent sur de la parole interprétée produite par des acteurs. Le choix de ce phonogenre est motivé par les problèmes éthiques que pourrait poser

Seules deux études, Audibert et al (2010) et Jürgens et al (2011), s’intéressent aux différences prosodiques entre la parole spontanée et la parole interprétée. Les résultats suivants sont observés :

- La parole interprétée présente un registre tonal plus élevé que la parole spontanée (Audibert et al 2010).

- La parole interprétée présente de plus fortes variations de hauteur que la parole spontanée (Jürgens et al 2011).

- Les autres différences concernent la qualité vocalique :

o En parole interprétée, les voyelles présentent un premier formant plus large qu’en parole spontanée (Jürgens et al 2011), ainsi qu’un deuxième formant plus bas (Audibert et al 2010).

o On observe également, en parole interprétée, une plus forte amplitude des fréquences harmoniques basses, des pics fréquentiels moins hauts, et plus de shimmer9 (Jürgens

et al 2011).