• Aucun résultat trouvé

Un contraste de sonorité maximalisé

1. Les processus articulatoires de marquage supraglottique de l’accent

1.2. Un contraste de sonorité maximalisé

Beckman et ses collègues (Edwards & Beckman 1988, Beckman & Edwards 1992, Beckman et al. 1992) proposent que la proéminence accentuelle repose au niveau supraglottique sur une stratégie visant à augmenter l’énergie acoustique globale (Sonority Expansion) de la syllabe par une ouverture spécifique à la voyelle. L’accroissement de la sonorité générale de la syllabe sous l’accent nucléaire est réalisé par des manœuvres articulatoires supraglottiques distinctives permettant une ouverture plus importante et plus longue du conduit vocal lors de l’articulation du noyau vocalique.

L’allongement différentiel en fonction du marquage des têtes (accent nucléaire) et des frontières finales de constituants intonatifs (ton de frontière), ou de l’accent lexical (« stress »), serait mieux prédit par un modèle de timing articulatoire segmental reposant sur une propriété sous-jacente dynamique spécifiée en terme de profil de sonorité que par sa durée acoustique.

Cette hypothèse de Beckman12, relative à un marquage des proéminences accentuelles reposant sur la réduction de l’impédance acoustique du noyau vocalique, est très proche de la proposition de Macchi (1985) : le modèle de Jaw Expansion (selon le terme de de Jong et al. 1993).

Macchi montre qu’en anglais l’accent lexical provoque un abaissement important de la mâchoire inférieure et de la langue pour les voyelles ouvertes (/Œ , Ã/). Les voyelles fermées (/i , u , «/) montrent également une ouverture mandibulaire plus grande, mais maintiennent leur constriction linguale qui n’est ni plus large ni plus resserrée. Cette ouverture mandibulaire est aussi beaucoup plus longue. A l’inverse, les consonnes sous l’accent sont réalisées avec une fermeture plus extrême et plus longue. Elle attribue les effets de l’accent à une expansion, une amplification spatiale et temporelle, du cycle d’ouverture mandibulaire des voyelles portant l’accent lexical.

1.2.1. Une ouverture mandibulaire plus importante sous l’accent

Cet effet de l’accent sur l’amplitude d’abaissement de la mandibule est notamment pointé par Kozhevnikov & Chistovich (1965) sur une réalisation du mot ['baba] : « lowering of the jaw is three to five-fold greater in accented syllables than unaccented ones. » (p. 184).

Ce phénomène a été spécifiquement étudié dans de nombreux travaux plus récents (principalement sur l’anglais) pour différents types d’accent. La plupart concernent essentiellement les voyelles ouvertes ou basses (Fletcher et al. 1994 ou Harrington et al. 1995, par exemple), bien que certaines études montrent que la mâchoire peut également, selon les sujets, être abaissée pour les voyelles hautes accentuées comme /i , ö/ (Kent & Netsell 1971, Farnetani & Faber 1992, Rietveld & van Lieshout 1995, Fletcher et al. 1996 ou Harrington et al. 2000).

Summers (1987) étudie en anglais l’effet de l’accent focal contrastif sur les mouvements d’ouverture et de fermeture de la mâchoire inférieure pour les voyelles /Ã/ et /¾/ en contexte inter-consonantique labial.

Il montre que ces mouvements sont plus longs, amples et rapides en position accentuée, reproduisant les résultats obtenus par Kelso et al. (1985) sur les mouvements de la lèvre inférieure. Il note également la réalisation d’une tenue d’ouverture mandibulaire maximale plus longue sous l’accent. De plus, la position de la mâchoire en fin de voyelle, c'est-à-dire au terme du geste de fermeture pour la consonne labiale suivante, est plus haute quand la voyelle est accentuée.

Ce dernier point montre que le contraste d’ouverture entre la voyelle accentuée et la consonne subséquente est maximalisé, participant ainsi à une mise en relief syntagmatique local plus importante du noyau syllabique sous l’accent.

Cet effet d’un contraste local est spécifiquement étudié par Erickson & Fujimura (1996) et Erickson (1998) concernant le même type d’accent sur la voyelle /ai/ en anglais. L’accent focal rend compte au niveau de l’articulation mandibulaire de deux types de contraste.

D’une part, l’abaissement de la mâchoire inférieure plus ample et plus long pour la voyelle accentuée provoque un rehaussement local de sa position verticale dans la consonne et la voyelle post-focales suivantes. Cette différence plus marquée renforce localement l’articulation plus ouverte de la voyelle accentuée.

D’autre part, plus globalement toute la portion de l’énoncé suivant le focus peut être produite avec une position plus haute de la mandibule, cet effet étant graduellement décroissant du focus à la fin de l’énoncé.

L’accent opèrerait donc non seulement un contraste syntagmatique local, mais aussi un contraste plus global permettant la mise en relief de la voyelle accentuée au niveau de l’énoncé, reposant sur une réduction de l’amplitude du cycle d’ouverture-fermeture de la mâchoire. Cette stratégie n’est cependant pas constante chez les deux locuteurs observés, l’un l’utilisant et l’autre ne réalisant qu’un contraste local renforcé.

Cet effet pourrait constituer le pendant supraglottique du phénomène intonatif d’écrasement mélodique suivant la réalisation d’un accent focal ou lors de la réalisation de parenthèse intonative basse, comme dans les énoncés à structure rhème – thème en français (Delattre 1966, Di Cristo 1998, Rossi 1999 ; mais cf. Delais-Roussarie et al. 2002).

Concernant ce point particulier, Harrington et al. (1998) étudient, sur la syllabe [wi:t], la possibilité, dans ce contexte de neutralisation des proéminences accentuelles post-focales, d’une compensation au niveau supraglottique opérant pour le maintien de la distinction accentuelle (stress) entre accent primaire et accent secondaire lexicaux.

Alors qu’un locuteur conserve cette distinction par une F0 légèrement plus importante sous l’accent primaire, les deux autres locuteurs montrent des corrélats articulatoires compensatoires à l’absence de contraste mélodique post-focus. Malgré des différences inter-individuelles importantes, la syllabe sous l’accent primaire montre globalement une production légèrement plus marquée, rendant compte d’une articulation linguale, labiale et/ou mandibulaire plus périphérique et plus longue.

L’articulation linguopalatale (EPG) du /t/ est plus longue et plus fermée, comme son geste mandibulaire de fermeture qui est également plus rapide. L’ouverture labiale dans [wi:] est plus ample et/ou plus rapide, mais la langue n’apparaît pas plus avancée en accent primaire qu’en accent secondaire au regard de la hauteur du deuxième formant de [i:]. Par contre, l’ouverture mandibulaire est plus longue et/ou plus ample et rapide selon les locuteurs, cette caractéristique semblant pouvoir être rattachée à une intensité moyenne (RMS) plus importante de la voyelle pour les deux locuteurs. Il semblerait donc que stratégie de renforcement des traits distincts des segments sous l’accentuation primaire et stratégie de contraste de sonorité globale renforcé ne soient pas strictement incompatibles pour le marquage supraglottique des proéminences accentuelles. Reste que dans ce contexte particulier les différences observées sont minimes au regard de celles pouvant apparaître en contexte prosodique non mélodiquement neutralisé.

Stone (1981) compare l’incidence de trois niveaux accentuels en anglais sur les mouvement d’ouverture de la mâchoire inférieure13 : inaccentué (non accentué à voyelle non réduite) < accent lexical < accentué nucléaire. Les résultats montrent que si l’amplitude ne permet pas une distinction constante des niveaux de proéminence, par contre, la vélocité croissante de l’ouverture mandibulaire selon ces trois niveaux apparaît comme un indice de la hiérarchie de proéminence moins variable en fonction des locuteurs, du débit et du contexte phonotactique.

Comme, entre autres, les travaux de Giot (1977) sur la voyelle /a/ en français, Rietvelt & van Lieshout (1995) sur les voyelles /i , a/ en néerlandais, Fletcher et al. (1994) sur les voyelles /a: , Ã/ en

13 Non plus, nous ne préciserons « inférieure » pour la mâchoire, puisque la mâchoire supérieure n’est pas mobile, la cause étant entendue.

anglais ou Harrington et al. (1995) sur la voyelle /a:/ le montrent, il apparaît, au moins pour certaines voyelles, particulièrement les voyelles ouvertes ou basses, que la mâchoire exécute un mouvement d’ouverture plus ample et plus long, voir aussi plus rapide, en syllabe accentuée qu’en inaccentuée.

1.2.2. Une expansion de la sonorité sous l’accent

La proposition de Sonority Expansion de Beckman (Edwards & Beckman 1988, Beckman & Edwards 1992, Beckman et al. 1992) est cependant plus générale et ne veut pas se limiter à la prise en compte que du cycle mandibulaire. La Jaw Expansion n’est qu’un aspect de l’hypothèse d’une sonorité plus contrastée en syllabe accentuée, même si elle en constitue en fait le principal support.

Pour ces auteurs, l’élargissement conditionné par l’accent afin de produire une énergie acoustique plus importante concerne le conduit vocal supraglottique dans sa globalité, c'est-à-dire les mouvements d’ouverture des lèvres, de la langue et de la mandibule.

L’accroissement de la sonorité dû à l’accent n’est pas seulement réalisé par une ouverture du conduit vocal plus grande, mais aussi, ou seulement, par le fait de maintenir sur une plus longue période une ouverture importante, par allongement, ou bien par réduction du chevauchement articulatoire des gestes consonantiques de fermeture du conduit vocal. La dimension temporelle est donc particulièrement importante, notamment s’agissant de l’intégration perceptive de la sonorité ; la sensation d’intensité sonore des voyelles étant fonction de la durée du signal (Nishinuma et al. 1983).

Beckman n’utilise la mâchoire que comme une mesure indirecte de la sonorité de la voyelle et comme un indice articulatoire de la dimension phonétique sonore sous-jacente contrôlant les patrons spatio-temporels des gestes articulatoires supraglottiques produisant les proéminences accentuelles : « Jaw heigth in our experiments is then an articulatory measure of this ‘overall openness’. And the time course of jaw opening and closing is an approximate representation of the rise and fall of sonority, or the syllable’s ‘sonority profile’ » (Edwards & Beckman 1988 : 161).

La radiation de l’énergie acoustique renforcée à la sortie du conduit vocal en position accentuée, par une portion plus longue et/ou plus ample d’ouverture maximale du tractus vocal, permet deux types de contraste syntagmatique au sein de l’énoncé : intra-syllabique et inter-syllabique. En premier lieu, il permet la mise en valeur du noyau syllabique, et donc de la tête de la syllabe face aux consonnes, en maximisant le contraste CV au sein ou aux marges de la syllabe accentuée. De plus, cette augmentation de la sonorité participe activement à la mise en relief des syllabes occupant une position forte (tête de pieds métrique et de constituant supérieur) dans la structure prosodique de l’énoncé, par un contraste plus prononcé avec les syllabe non accentuées.

La conception de Beckman de la Sonorité Expansion comme processus général de l’articulation supraglottique des marques prosodiques structurelles de l’énoncé est principalement développée dans Beckman et al. (1992).

Les auteurs argumentent sur la nécessité d'un niveau de représentation phonétique abstrait capable de rendre compte des réalisations physiques (articulatoires et indirectement acoustiques) des événements rythmiques et prosodiques. Celui-ci constituerait une représentation phonétique intermédiaire permettant d’établir les correspondances entre la structure prosodique et les réalisations articulatoires dynamiques en terme de gestes spatio-temporels coordonnés.

Ce niveau intermédiaire proposerait une spécification spatiale et temporelle en terme de profil de sonorité sous-jacent devant être réalisé dans et entre les syllabes apparaissant aux points clefs de la structure prosodique de l’énoncé, ou selon des impératifs para-linguistiques comme l’accélération du débit de parole par exemple : « A more promising approach is to try to describe the quantitative properties of the lengthenings associated with nuclear accent, phrase-final position, and overall tempo decrease in terms of some abstract phonetic representation that can mediate between the prosodic hierarchy and the gestural dynamics. We propose that the relevant level of description involves the time course of a substantive feature ‘sonority’ » (p. 83).

Ce niveau de représentation spécifierait une valeur catégorielle de sonorité dans un espace spatio-temporel de variation reflétant les contraintes exercées par la structure prosodique et les demandes para-linguistiques. Cet espace relèverait pour sa dimension spatiale de l’amplitude d’ouverture du conduit vocal et pour sa dimension horizontale de l'évolution temporelle de celle-ci. Les réalisations

spatio-temporelles des gestes articulatoires pourraient donc être différentiellement représentées en fonction des contextes prosodiques où ils doivent être produits.

Ce niveau de représentation n'est pas envisagé comme une étape dans une procédure de dérivation phonologique entre niveaux de représentation prosodique et segmental, mais plutôt comme un moyen de décrire et prédire la correspondance entre les événements segmentaux (articulatoires et acoustiques) et les unités structurelles prosodiques : « In proposing that these structures in a sonority-time space mediate between the prosodic hierarchy and gestural dynamics, we do not mean to imply that they represent a stage of processing in a hypothetical derivational sequence. Rather, we understand these structures as a picture of the rhythmic framework for interpreting the dynamics of the segmental gestures associated to a prosodic unit » (p. 86).

1.2.3. Effet de frontière et effet de proéminence

Même si le point de vue de ces auteurs sur l’importance du trait de sonorité, en tant que spécificateur essentiel des configurations articulatoires marquant la structure prosodique, semble avoir évolué avec l’approfondissement de leurs recherches, la première partie de leurs études (Edwards & Beckman 1988, Beckman & Edwards 1992, Beckman et al. 1992) sur les mouvements mandibulaires, et plus accessoirement labiaux (Edwards et al. 1991), dans les séquences /pŒp/ et /p\/ en anglais, cherche à valider cette hypothèse. Ces auteurs empruntent le cadre théorique de la Dynamique de Tâches (Saltzman & Munhall 1989, ou Hawkins 1992, pour une présentation « vulgarisée ») pour rendre compte de patrons articulatoires dynamiques différentiels en fonction des entités prosodiques produites.

Beckman analyse sur les patrons articulatoires dans /pŒp/ les effets d’allongement de la frontière de constituant intonatif (allongement final d’intonational phrase)14 et des proéminences accentuelles : accent nucléaire15, accent focal contrastif16 et accent lexical (stress : /pŒp/ versus no stress : /p\p/)17. Elle montre que des mécanismes dynamiques articulatoires différents permettent de réaliser un allongement en fin de constituant intonatif et sous l’accent. Elle distingue ainsi l’effet de frontière (« edge effect »), relatif à l’allongement final, de l’effet de proéminence (« prominence effect »), relatif à l’allongement corrélatif à l’accent (nucléaire, contrastif et lexical).

1.2.3.a. L’allongement final

L’allongement final est articulatoirement réalisé par des mouvements mandibulaires très longs, pas nécessairement plus amples, mais surtout bien moins rapides. Cet allongement est produit par une tension (ou raideur : « stiffness ») réduite des mouvements en finale de constituant, la tension exprimant les relations entre la vélocité et l’amplitude des mouvements : pour une durée constante, plus un mouvement est ample, plus sa vélocité est grande, et donc sa tension importante.

Ainsi, l’allongement final reposerait sur une diminution de la tension des gestes, caractéristique d’un ralentissement de l’articulation en syllabe finale de constituant. Ce motif articulatoire serait identique à celui produit lors d’une réduction du tempo en débit ralenti.

Si une augmentation de la sonorité est effectivement produite lors de l’allongement final, par une durée plus longue d’ouverture large du conduit vocal, l’allongement final n’est pas interprété par Beckman comme un impératif de contraste sonore, mais comme une commande spécifique d’allongement important de la syllabe en final de constituant intonatif majeur : « final lengthening makes a syllable primarily slower rather than bigger. That is, phrase-final syllables are longer not because their closing gestures are phased later, but rather because they are less stiff. In terms of the underlying dynamics, then, we might describe final lengthening as an actual targeted slowing down, localized to the last gesture at the edge of a phrase. » (Beckman et al. 1992 : 79). Beckman montre cependant que la diminution de la tension articulatoire des mouvements n’est pas suffisante pour rendre compte complètement du phénomène. Une limite inférieure de tension

14 Cf. Edwards & Beckman (1988, 1992), Edwards et al. (1991), Beckman et al. (1992).

15 Cf. Edwards & Beckman (1988, 1992), Edwards et al. (1991), Beckman et al. (1992).

16 Cf. Beckman & Edwards (1992, 1994), Beckman & Cohen (1999).

articulatoire peut être atteinte dans certaines conditions extrêmes, comme en parole lente. Dans ce contexte, pour garantir un contraste de débit de parole et d’allongement des syllabes finales de constituant, l’allongement peut être effectué par un phasage plus tardif du mouvement de fermeture mandibulaire exécuté pour la consonne par rapport à l’ouverture de la voyelle précédente.

1.2.3.b. L’accent nucléaire et l’accent lexical

L’impératif phonétique de la réalisation d’une sonorité acoustique plus importante est plutôt caractéristique de l’accent nucléaire ou focal contrastif. Même si les données et les interprétations faites peuvent légèrement différer entre les versions exposées pendant les onze années de leur recherche, en dernière analyse Beckman et ses collègues montrent que l’allongement de l’articulation mandibulaire pour les proéminences accentuelles, tant nucléaire, contrastive que lexicale, répondent à un même mécanisme gestuel dynamique sous-jacent.

Sous un accent nucléaire, la voyelle montre un cycle d’ouverture et de fermeture mandibulaire, ou labial, d’une durée, d’une amplitude et d’une vélocité de déplacement plus importantes qu’en syllabe inaccentuée. Cependant, cet allongement en position accentuée ne semble pas pouvoir être correctement prédit par la corrélation entre vélocité et déplacement maximal des mouvements. En effet, même si la vélocité des gestes est plus importante qu’en syllabe inaccentuée, celle-ci est comparativement plus faible sous l’accent au regard déplacement exécuté.

Dans le modèle de la Dynamique de Tâches, deux manœuvres gestuelles dynamiques peuvent expliquer un allongement produit par une vélocité proportionnellement plus faible par rapport au déplacement effectué par le mouvement articulatoire.

La première relève d’une spécification intra-gestuelle relative à une réduction de la tension des mouvements. Dans ce modèle, les mouvements de constriction ou d’ouverture sont déterminés intrinsèquement par une trajectoire spatio-temporelle asymptotique. Ainsi, l’écart temporel entre le point d’arrivée et celui de départ d’un mouvement articulatoire augmente plus rapidement que l’écart spatial (vertical), plus le déplacement vertical effectué est important. En d’autres mots, plus les mouvements sont amples, plus ils nécessitent de temps pour effectuer un déplacement encore plus important. Cela se traduit, dans ce cas, par une réduction critique de la tension du geste articulatoire. Le second mécanisme envisagé renvoie à une spécification inter-gestuelle relative à la relation de phase du mouvement de fermeture de la consonne par rapport à celui d’ouverture de la voyelle précédente. Il impliquerait que le geste consonantique serait retardé par rapport à celui d’ouverture vocalique. Du fait de la trajectoire asymptotique des mouvements, l’ouverture aurait alors plus de temps pour atteindre une position plus extrème, réduisant ainsi sa vélocité.

Ce mécanisme renversé correspond à une troncation du geste d’ouverture vocalique par celui de fermeture de la consonne subséquente en contexte inaccentué. Les analyses de Beckman (surtout, Beckman & Cohen 1999), confirmant les résultats de Harrington et al. (1995), montrent que le patron articulatoire dynamique des syllabes inaccentuées répond mieux à un mécanisme de troncation qu’à une augmentation de la tension des gestes. L’allongement corrélatif à l’accentuation semble donc reposer principalement sur un phasage retardé du geste de fermeture par rapport au geste d’ouverture mandibulaire.

Au niveau de la distinction entre les voyelles pleines porteuses de l’accent lexical et les voyelles réduites inaccentuées et unstressed, le mécanisme général serait identique. Ce patron articulatoire dynamique pourrait donc être identifié à un marquage supraglottique des têtes de constituant prosodique (de syllabe et de pieds métrique pour l’accent lexical, et d’intermediate ou d’intonational phrases pour l’accent nucléaire) : un « head effect », selon le termes de Beckman & Edwards (1992).

Reste que les différences avec les positions faibles (inaccentuée et unstressed), en termes d’amplitude, de vélocité et de durée, sont beaucoup plus importantes et constantes, à travers les locuteurs et les différents débits, pour le marquage de l’accent lexical, du fait de la qualité intrinsèque de la voyelle inaccentuée /\/, qu’elles ne le sont pour le contraste accentuel nucléaire (Beckman & Edwards 1994, Beckman & Cohen 1999).

sous-tendu par une nécessité d’augmenter significativement l’énergie acoustique globale de la syllabe accentuée, sinon par une ouverture maximale du conduit vocal plus ample, au moins par une ouverture large sur une section plus longue de la voyelle : « The lengthening associated with accented sequence , on the other hand, is a head effet. […] That is, the purpose of the lengthening seems to be not to make the sequence longer per se, but rather to expand the portion of the syllabe where maximum energy is radiating out of the mouth. » (Beckman &