• Aucun résultat trouvé

De nombreux modèles phonologiques de la structure prosodique du français ont été échafaudés (Rossi [1985], Hirst & Di Cristo [1993], Mertens [1993], Vaissière [1997], Di Cristo [1998, 2000], Post [2000] et Jun & Fougeron [2000, 2002] et inter alia). Ces modèles considèrent, pour la plupart, que l’intonation française est constituée de suites de mouvements mélodiques montants et descendants et que l’accent est post-lexical. De plus, l’énoncé y est souvent organisé en niveaux prosodiques hiérarchisés. Ces modèles divergent du point de vue du nombre de niveaux hiérarchiques, du type de hiérarchie, des représentations tonales et intonatives sous-jacentes et, de façon plus générale, au niveau de la notion d’accent en français.

Dans le cadre des travaux décrits dans ce mémoire, le modèle phonologique auto-segmental de Jun & Fougeron (Jun & Fougeron [2000, 2002]) a été choisi. Ce modèle, qui s’inscrit dans le cadre de la phonologie prosodique développée particulièrement par Pierrehumbert [1980], Selkirk [1984], Pierrehumbert & Beckman [1988] et Beckman [1996], est en effet en accord avec la plupart des descriptions de l’intonation du français et utilise un système de transcription qui a montré son utilité dans la description prosodique de nombreuses langues : le système ToBI et ses diverses versions (Beckman et al. [2005]).

Le modèle de Jun & Fougeron comporte principalement deux unités prosodiques de niveaux hiérarchiques croissants : la « Accentual Phrase » souvent traduit par Syntagme Accentuel (SA) et la

« Intonational Phrase » souvent traduit par le Syntagme Intonatif (SI). L’unité la plus basse, Syntagme Accentuel (SA), correspond environ au « groupe de force » de Passy, au « Mot/Syntagme Prosodique » de Vaissière, à l’« Arc Accentuel » de Fonagy, au « Mot Phonologique » de Milner &

Regnaud, à l’« Intonème Mineur » de Rossi, à l’« Intonation Group » de Mertens, au « mot rythmique » de Pasdeloup et au « groupe rythmique » de Delais-Roussarie (cf. Jun & Fougeron [2002]). Il est au-dessus de l’ « Unité Tonale » de Di Cristo & Hirst et correspond parfois à leur « Unité Rythmique ». Le SA contient un (ou plusieurs) mot(s) de contenu (au moins un) et éventuellement un (ou plusieurs) mot(s) de fonction. En moyenne, un SA contient ainsi 2,3-2,6 mots (ou 1,2 mots de contenu) et 3,5-3,9 syllabes (selon Jun & Fougeron [2000]). Il est marqué à droite par un accent mélodique (pitch accent) démarcatif : l’accent primaire bitonal LH* (Low-High*, montée de F0 constituée d’un ton bas suivi d’un ton haut). Le ton H* est associé à la dernière syllabe pleine (sans e-muet final) du SA. On note que l’étoile (*) est utilisée de façon conventionnelle pour indiquer une association fixe à une syllabe en particulier. Le SA est de plus marqué par un allongement final. Il est parfois aussi marqué par une montée initiale de F0 d’emplacement variable (phrase accent) : l’accent secondaire LHi (Low-High initial). Contrairement au ton H*, sommet de l’accent primaire, le ton Hi,

A

sommet de l’accent secondaire, n’est pas toujours réalisé sur une syllabe spécifique et n’entraîne pas un allongement de la syllabe qui le porte (Pasdeloup [1990], Mertens et al. [2001], Jun & Fougeron [2000] et Welby [2003]). Le ton Hi est le plus souvent porté par la première, la deuxième ou plus rarement la troisième syllabe du premier mot de contenu du SA. Cette montée initiale est considérée comme étant un « accent de syntagme » (« phrase accent ») par Jun & Fougeron [2002] plutôt qu’un

« accent de hauteur » (« pitch accent ») comme le LH*. La séquence LHi n’est en effet pas associée à des syllabes précises, Jun & Fougeron ont observé que le L peut s’étendre sur plusieurs syllabes clitiques précédant le premier mot de contenu du SA. LHi est ainsi simplement associé à la frontière gauche du SA. Bien que le L de LHi ne soit pas associé à une syllabe précise et qu’il puisse s’étendre à plusieurs syllabes, Jun & Fougeron [2002] notent qu’il est toujours réalisé à la frontière gauche du SA et pas plus tard. Un SA commence ainsi généralement par un L. Selon Welby [2002, 2003], LHi aurait également une autre fonction que celle d’accent de syntagme. Jun & Fougeron précisent d’ailleurs que le L peut s’étendre sur plusieurs mots de fonction précédant le premier mot de contenu mais les associations tonales de leur modèle ne le précisent pas. Or Welby montre, notamment avec les données exposées dans Welby [2002], que le point d’inflexion du L vers le Hi, nommé « coude » (« elbow »), est le plus souvent réalisé soit très tard dans le dernier mot de fonction, soit très tôt dans la première syllabe du premier mot de contenu du SA. Welby conclut, grâce à d’autres études notamment en perception, que ce coude aurait pour cible la frontière mot de fonction/mot de contenu et serait ainsi un indice fort à la segmentation pour identifier les frontières entre les mots ou le début du premier mot de contenu. Elle propose ainsi (Welby [2003]) l’hypothèse d’une double association du ton bas (L) de l’accent de syntagme (montée initiale) avec la frontière gauche du premier mot de contenu du SA et de manière facultative avec la frontière gauche du SA ou avec le début d’une autre syllabe. Cette double association rejoint celles décrites par Pierrehumbert & Beckman [1988] et Grice et al. [2000] pour d’autres langues. Un schéma exposant les associations tonales proposées par Welby [2002] est donné figure II.1.

FIGURE II.1 – Associations tonales pour le SA : a. (gauche) modèle de Jun & Fougeron [2002] ; b. (droite) révision proposée par Welby [2002].

(Mf : mot de fonction ; Mc : mot de contenu ; σ : syllabe).

Pour Jun & Fougeron, le patron tonal par défaut d’un SA est donc /LHiLH*/. Une illustration en est donnée pour le deuxième SA de la figure II.2 (i.e. pour le verbe ranima).

Dans le modèle de Jun & Fougeron, l’unité intonative de niveau le plus élevé est le Syntagme Intonatif (SI). Le SI correspond approximativement à l’« Intonème Majeur » de Rossi, à l’« Unité Intonative » de Di Cristo & Hirst et au « Groupe de Souffle » de Vaissière. Il est composé d’en moyenne 2-2,7 SA et de 7,3-10,1 syllabes (selon Jun & Fougeron [2000]). Le SI est marqué à sa

SA

droite par un ton de frontière : L% ou H%. L% (Low%) correspond à une chute finale majeure et souvent à un énoncé déclaratif. H% (High%) correspond à une continuation finale majeure et plutôt à une interrogation ou une continuation (en effet un énoncé peut être composé de deux SI et dans ce cas le premier SI peut être terminé par une montée de continuation H%). Le SI est aussi marqué par un allongement final parfois suivi d’une pause. L’allongement final est plus important en fin de SI qu’en fin de SA (cf. e.g. Di Cristo [1985, 1998] et Jun & Fougeron [2000]). Un SI peut de plus moduler le SA qu’il contient. En effet, dans le modèle de Jun & Fougeron, lorsqu’un SA est en fin de SI, son accent primaire (LH*) est remplacé par le ton de frontière du SI : L% ou H% comme c’est le cas pour le dernier SA de la figure II.2 (i.e. l’objet la jolie maman).

FIGURE II.2 - Suivi de F0 pour un SI comprenant 3 SA.

L’énoncé est {[Romain]SA[ranima]SA[la jolie maman.]SA}SI réalisé {[LHiH*][LHiLH*][LHiL%]}.

Aux représentations sous-jacentes ou par défaut ainsi définies pour les SA (LHiLH*) et SI (L% ou H%) peuvent correspondre diverses réalisations phonétiques effectives. Au niveau du SA, les réalisations phonétiques dépendent de la longueur du SA (notamment du nombre de syllabes qu’il contient) et de facteurs rythmiques ou pragmatiques. L’accent primaire est le seul quasi-obligatoire. La réalisation /LHiLH*/ n’est ainsi observée en pratique que pour des SA de plus de trois syllabes de contenu (Jun & Fougeron [2000]). Jun & Fougeron [2000] rapportent l’observation de cinq réalisations tonales simplifiées souvent par manque de temps parce que le syntagme est trop court pour réaliser les quatre cibles tonales. Ces représentations sont résumées dans le tableau II.1.

La troisième colonne du tableau II.1 (ajoutée par moi-même) donne la longueur en syllabes des SA pour lesquels on observe le plus souvent les patrons décrits dans les deux colonnes précédentes.

Dans la première version de leur modèle, Jun & Fougeron [2000] précisaient qu’en principe, chacun des quatre tons L, Hi, L et H* était associé à une syllabe, rendant le patron /LHiLH*/ impossible sur les syntagmes de moins de quatre syllabes. Dans une version ultérieure (Jun & Fougeron [2002]), elles sont revenues sur cette association forte, et seul H* est associé précisément à une syllabe, ce qui rend compte de l’observation de syntagmes de trois syllabes ayant un schéma /LHiLH*/. Cette deuxième version du modèle est plus conforme à mes propres données.

TABLE II.1 – Les cinq types de réalisations sous-jacentes possibles d’un SA (/LHiLH*/) dans le cas où l’un ou plusieurs des quatre tons n’est pas réalisé. Le (ou les) ton(s) entre parenthèses ne sont pas réalisés.

D’après Jun & Fougeron [2000] (p. 216).

Le tableau II.1 montre qu’un SA d’une syllabe sera réalisé [LH*] comme c’est le cas pour le SA central de la figure II.3 (i.e. le verbe vit). Les SA de 3 syllabes par exemple peuvent être réalisés de diverses façons. Un facteur important qui détermine la réalisation prosodique qui sera utilisée est le contenu lexical du SA. Le premier L ne sera par exemple souvent pas réalisé si le SA commence par un mot de contenu et non par un mot outil tel un article (Jun & Fougeron [2000]). Welby [2003] montre ainsi que la réalisation est de toute évidence conditionnée par la segmentation du flux de parole en mots. Le coude du L vers le Hi en début de SA marque en général la passage d’un mot outil vers un mot de contenu. En l’absence de mot outil avant le premier mot de contenu, un coude peut tout de même être réalisé en tout début de ce mot.

En outre, d’autres patrons, non décrits par Jun & Fougeron semblent exister tel LHi comme l’expose Welby [2003] (p. 89).

FIGURE II.3 – Suivi de F0 pour un SI comprenant un SA central de 1 syllabe avec la réalisation tonale [LH*]. L’énoncé est {[Mélanie]SA[vit]SA[les mauvais loups malheureux.]SA}SI.

On constate que la réalisation [HiLH*] est observable non seulement pour des SA de trois syllabes mais aussi pour des SA de plus de trois syllabes. Le ton initial L peut en effet ne pas être réalisé lorsque le SA commence par un mot lexical, un ton Hi étant alors réalisé sur sa première syllabe. La réalisation [LHiL*] est la réalisation la moins courante de toutes dans le corpus étudié par Jun &

Fougeron [2002]. Les réalisations [LHiLL*] et [LHiL*] sont observées lorsqu’un SA est suivi d’un autre SA commençant par Hi et ceci pour éviter une succession de trois tons hauts comme ce serait le cas pour la séquence : [LHiH*]SA1[HiLH*]SA2 qui serait ainsi plutôt réalisée [LHiL*]SA1[HiLH*]SA2.

On soulignera enfin qu’en français, comme dans la plupart des langues du monde, le niveau global de F0 baisse de façon constante du début à la fin d’un énoncé (anglais américain : Pike [1945], Maeda [1976] ; anglais britannique : De Pijper [1980] ; néerlandais : ‘t Hart et al. [1990] ; japonais : Fujisaki & Sudo [1971] ; danois : Thorsen [1980] ; suédois : Bruce [1977] ; français : Vaissière [1971], Delgutte [1978] et voir aussi le cas particulier du Hausa : Meyers [1976]). C’est ce que les chercheurs nomment phénomène de déclinaison.

B. État de l’art sur les corrélats acoustiques de la