• Aucun résultat trouvé

1.1 La parole

1.1.4 Perception de la parole

Apr`es avoir expos´e les m´ecanismes de production de la parole puis sa mod´elisation en utilisant le mod`ele source/filtre, nous allons maintenant pr´esenter la perception de ce ph´enom`ene qui s’effectue sur deux niveaux : le niveau segmental et le niveau supraseg-mental ´egalement appel´e niveau prosodique.

Description segmentale de la parole

Tout d’abord, il est important de noter que l’oreille ne per¸coit pas les sons sous une

´echelle lin´eaire mais logarithmique. Plusieurs ´echelles de perception ont ´et´e propos´ees pour se rapprocher de l’analyse effectu´ee par l’oreille. L’une des plus courantes est l’´echelle Mel[Stevens1937]. Le coefficient α du mod`ele STRAIGHT, pr´esent´e section pr´ec´edente, permet d’approcher cette ´echelle.

Comme nous l’avons vu section 1.1.2 de ce chapitre, la parole est per¸cue, au niveau segmentale, comme une succession de sons ´el´ementaires, les phones. Ces phones peuvent ˆetre class´es en trois cat´egories principales :

— les voyelles qui sont des sons vibrants. Elles peuvent ˆetre class´ees selon leur nasa-lit´e/oralit´e, leur degr´e d’ouverture du conduit vocal, la position de la constriction principale ainsi que l’aperture des l`evres[Calliope1989],

— les consonnes qui peuvent ˆetres des sons vibrants ou non. Elles peuvent ˆetre class´ees selon le voisement, le mode d’articulation ainsi que la position de la constriction principale (lieu d’articulation),

— les semi-voyelles qui correspondent `a des sons interm´ediaires.

Le tableau1.2pr´esente les diff´erents phones pour le fran¸cais class´es en fonction de leurs cat´egories principales et des diff´erentes caract´eristiques articulatoires li´ees `a ces cat´egories.

tel-00913565, version 1 - 3 Dec 2013

Consonnes Voyelles XXXX

XXXX Modes XX

Lieux

Labiales Dentales V´elo-pal. Ant. Post.

Occlusives Orales NA Arr. NA

- non-vois´ees p t k - Ferm´es i y u

- vois´ees b d g e ø o

E œ O

- Ouvertes a

Nasales m n ñ Nasales Ant. Post.

- Ferm´es ˜E ˜o

Table1.2 – Classification des phon`emes du fran¸cais [Calliope1989]

La prosodie

Une d´efinition de la prosodie est donn´ee par DiCristo [Dicristo2000] :

La prosodie(ou la prosodologie) est une branche de la linguistique consacr´ee

`

a la description (aspect phon´etique) et `a la repr´esentation formelle (aspect pho-nologique) des ´el´ements de l’expression orale tels que les accents, les tons, l’in-tonation et la quantit´e, dont la manifestation concr`ete, dans la production de la parole, est associ´ee aux variations de la fr´equence fondamentale (F0), de la dur´ee et de l’intensit´e (param`etres prosodique physiques), ces variations ´etant per¸cues par l’auditeur comme des changements de hauteur (ou de m´elodie), de lon-gueur et de sonie (param`etres prosodiques subjectifs). Les signaux prosodiques v´ehicul´es par ces param`etres sont polys´emiques et transmettent `a la fois des informations para-linguistiques et des informations linguistiques d´eterminantes pour la compr´ehension des ´enonc´es et leur interpr´etation pragmatique dans le flux du discours.

En se basant sur cette d´efinition, nous pouvons distinguer trois param`etres principaux de la prosodie corr´el´es avec une repr´esentation acoustique du signal de parole : la fr´equence fondamentale et la dur´ee qui permettent de d´ecrire la m´elodie de l’´enonc´e ; l’intensit´e qui correspond `a la perception de la force sonore de la voix. En se basant sur ces param`etres, l’´etude de la prosodie consiste `a analyser diff´erents ph´enom`enes tels l’accentuation, l’in-tonation ou le d´ebit. Il en existe d’autres mais nous allons nous focaliser sur ces trois ph´enom`enes car ils sont souvent utilis´es en synth`ese de la parole `a partir du texte.

Tout d’abord, dans le cadre du fran¸cais, l’unit´e de l’accentuation est la syllabe. Ainsi, [Mertens1992] d´efinit une syllabe accentu´ee, ou syllabe pro´eminente, comme une syllabe qui ressort sur son entourage par sa force particuli`ere, par un contraste d’intensit´e subjec-tive. Le fran¸cais est consid´er´e comme une langue `a accent fixe ce qui implique que l’accent

tel-00913565, version 1 - 3 Dec 2013

est appliqu´e `a la syllabe en fonction de sa position dans le mot.

L’intonation correspond `a la courbe m´elodique de l’´enonc´e. Elle est donc bas´ee sur deux param`etres prosodiques : la dur´ee et le F0. Pour le fran¸cais, l’unit´e du groupe into-natif est une s´equence de syllabes ne comportant qu’un unique accent final [Mertens1993, Mertens2001]. P. Delattre [Delattre1966] a mis en ´evidence dix cas d’intonation de base et montre ´egalement qu’une substitution d’intonation, sur un mˆeme contenu, implique un changement de sens (comme par exemple la perception d’un ´enonc´e comme une interroga-tion ou bien comme une affirmainterroga-tion). La figure1.6pr´esente les courbes des dix intonations identifi´ees par P. Delattre.

Figure 1.6 – Les dix intonations identifi´ees par Delattre [Delattre1966]

Enfin le d´ebit qui correspond `a la vitesse d’´elocution et qui s’exprime en unit´e de parole par temps. Dans le cadre du fran¸cais, le d´ebit syllabique, nombre de syllabes par seconde, est g´en´eralement utilis´e. Toutefois, B. Zellner [Zellner1998] a montr´e que cet ´el´ement est en r´ealit´e influenc´e par plusieurs facteurs : les pauses, l’allongement/raccourcissement des syllabes ou bien encore l’ajout de sons dans le cadre de l’hyper-articulation. Dans son

´etude B. Zellner [Zellner1998] note que le d´ebit syllabique du fran¸cais se situe entre 4 (d´ebit lent) et 7 (d´ebit rapide) syllabes par seconde.

Pour conclure concernant la prosodie, I. F´onagy [Fonagy2003] a effectu´e une synth`ese des diff´erentes fonctions de l’intonation. Parmi les fonctions principales, la prosodie permet la distinction entre homonyme (cas de l’anglais) ou bien de distinguer les fronti`eres de mots (cas du fran¸cais). La prosodie a donc une fonction de structuration de l’´enonc´e

tel-00913565, version 1 - 3 Dec 2013

importante. Ensuite, la prosodie a une fonction de focalisation qui permet de nuancer le sens d’un mˆeme ´enonc´e en faisant ressortir l’entit´e importante. Au del`a de ces fonctions linguistiques, la prosodie renseigne ´egalement sur l’´etat ´emotif du locuteur, son attitude, son niveau social ou culturel. Il s’agit donc d’une composante fondamentale en parole.