• Aucun résultat trouvé

CHAPITRE V — Vérification de la fiabilité du système d’évaluation prototypique semi-

2.3 L’organisation rythmique

Cette sous-section se centrera sur l’organisation rythmique en interrogeant sa nature, puis en abordant deux procédés organisationnels possibles : celui déterminé par les phénomènes de proéminence et d’accentuation, puis celui d’alternance de durées (métriques).

2.3.1 Quiddité du rythme

Ainsi que l’écrit Grammont (1937 : 85), « Le rythme, on le sait, est constitué par le retour des temps marqués à intervalles théoriquement égaux. ». Toute la question est de savoir

quels éléments marquent ce rythme. Selon un consensus, le rythme s’inscrit dans le temps ; mais j’observe que la notion de rythme a deux sens. Le premier équivaut à un rythme naturel. Rythme cardiaque (battement du cœur), rythme des vagues, de la houle (battement, balancement des vagues ou de la houle) n’en sont que quelques exemples, qui ont en commun de correspondre à un bruit causé répétitivement par une action à intervalles perçus comme réguliers. Le mouvement qui l’a engendré est celui d’un aller-retour mécanique, lequel crée la perception du rythme par le bruit répétitif qu’elle cause. Ces mouvements « ne communiquent pas entre eux », ils sont « juxtaposés », ils sont « mis bout à bout »17. C’est une sorte d’alternance de temps forts et de temps faibles dénués de sens.

À l’inverse, le second rythme est produit artificiellement. Il s’inscrit dans le temps afin d’établir des repères réguliers déclencheurs d’action. La danse en est un excellent exemple : la perception de temps forts et faibles se succède et guide un mouvement continu et cohérent. Le rythme n’est donc plus signe, mais signal déclencheur des pas de dance. Temps forts et temps faibles n’ont de cohérence que les uns par rapport aux autres, « ils n’existent que comme des différences dans le continu du mouvement » et « chaque moment contient le précédent et le suivant »18. L’alternance et la rapidité des signaux oriente et guide le mouvement de « rencontre, enlacement et séparation », lequel peut alors prendre forme et sens. La beauté et l’émotion créées (ou leur absence) sont parties intégrantes du message véhiculé par cette forme fugitive et éphémère. De même que pour la parole, il ne reste rien de la danse lorsqu’elle prend fin, sinon l’impact produit sur nos sens et notre entendement. Aussi, on peut affirmer que le rythme est l’essence même de la parole car il en soutient l’agencement, quels que soient les procédés utilisés pour remplir sa mission.

D’emblée, Gut associe le rythme en L2 à la réduction vocalique. Elle le présente comme one of the major organising principles of speech (2009: 159) et rappelle la nature structurante du rythme, prégnante dans toutes les conceptions qui lui sont associées. Elle récapitule les deux manières fondamentales de concevoir le rythme qui sont la hiérarchie prosodique et la dichotomie des langues en classes rythmiques. La centration sur la localisation du rythme dans la Hiérarchie Prosodique de Selkirk 1986, Beckman et Pierrehumbert 1986, Nespor et Vogel 1986, etc., dont les unités de base sont les syllabes (Syllable), sont regroupées en unités supérieures : pieds (Foot), puis mots phonologiques

17 Ancet, Jacques, Ancet, Lucienne. La Caminata. Du rythme : de l'importance du rythme dans la danse d'improvisation qu'est le tango [https://sites.google.com/site/annecytango/chroniques/du-rythme], consulté en janvier 2017.

18

(Phonological Word), groupes clitiques (Clitic Group), phrases intermédiaires (Intermediate

Phrase) ou groupes phonologiques (Phonological Phrase), syntagmes intonatifs (Intonation Phrase) et syntagmes phonologiques (Phonological Utterance). Destinés à être des repères de

production de la parole, ils constituent en outre des domaines de restriction dans l’application de diverses règles phonologiques (Selkirk 1986).

Gut rappelle (2009 : 160) la division rythmique en classes de langues de Pike (1945) puis d’Abercrombie (1967) selon laquelle chaque langue serait régie par la prédominance soit de la syllabe (les syllabes seraient isochrones, par exemple le français), soit du battement rythmique (les pieds, intervalles entre deux battements rythmiques, seraient isochrones eux aussi, comme en anglais). Les nombreuses études acoustiques qui ont suivi n’ont pu corroborer l’ajustement temporel de la durée des syllabes dans l’un ou l’autre système sur lequel se fonde le principe de l’isochronie. Aussi, il a été relégué au rang de phénomène perceptif ou même tendanciel.

Tortel (2010 : 30) rappelle elle aussi qu’il existe deux sortes de rythme : la rythmicité accentuelle et la rythmicité syllabique, différence introduite par Pike (1945) suivi de Bolinger (1981). Elle précise que Di Cristo (2002) décrit l’architecture prosodique comme « un supra- système phonique constitué de trois sous-systèmes », lesquels sont métrique, tonal et temporel. Mètre et rythme doivent alors être dissociés. Di Cristo (2013 : 12) spécifie l’utilisation qu’il fait de chacun d’entre eux :

(i) le terme de métrique pour désigner l’étude formelle de la structure sous- jacente (ou abstraite) du phénomène rythmique (et des représentations abstraites qui s’y rattachent)

(ii) celle de rythme, pour décrire la manifestation concrète de ce phénomène, au niveau des structures de surface qui actualisent la prononciation des énoncés

L’étude de la structure rythmique sous-jacente (structure métrique, reflet des compétences linguistique et rythmique) ne peut qu’éclairer les observations faites à partir de la substance concrète du phénomène rythmique dans la quête de régularités prosodiques. Aussi, des deux faces du même phénomène (Di Cristo, 2013 : 121), c’est le rythme qui sera l’objet de recherche. Pourtant, pour en revenir à la question de départ, aucune des deux pistes que constituent le phénomène accentuel et l’organisation temporelle des syllabes ne devrait être négligée. Les procédés rythmiques mis en œuvre dans cette « rythmicité binaire » (Tortel, 2010 : 29) peuvent être très divers, mais, qu’ils correspondent à des proéminences basées sur

l’intensité, la hauteur mélodique, les mouvements de fréquence fondamentale, ou à des alternances de durées, ou de parole et de silences, tous convergent vers la même finalité : créer un maillage de temps forts et de temps faibles pour soutenir techniquement l’organisation du message en le structurant.

L’accentuation correspond à une fonction démarquative, alors qu’à d’autres endroits, elle aura une fonction expressive avec un « accent d’insistance [qui] permet une mise en relief d’une unité généralement plus petite que le syntagme » (Léon, 2011 : 157). Cet accent d’insistance aura l’une des trois fonctions suivantes : oppositive, emphatique ou

différenciative (2011 : 158).

Le rythme martèle un sens basique et vital dans la mesure où il constitue la trame même sans laquelle le sens ne pourrait matériellement s’inscrire dans la parole. On se souvient tous de la voix monocorde, dépourvue d’un quelconque rythme, des premiers essais sonores synthétiques. Seule l’introduction de pauses permettait le nécessaire découpage en unités de sens. Que l’on rende compte du rythme par l’accentuation ou bien par des mesures de durée, il est essentiel qu’il soit représenté de la manière la plus complète pour être la plus représentative, sans exclusive. Sa nature consiste en une alternance forte-faible. L’accentuation pourra donc être étudiée au niveau phrastique de deux manières : en comptant le nombre de proéminences dans une unité prosodique pour le comparer à celui d’un modèle natif ou non-natif, ou en repérant la localisation accentuelle attendue et en vérifiant sa présence au même endroit dans la parole d’apprenant, par exemple. La qualité rythmique dans l’accentuation lexicale sera vérifiée de la seconde manière. Les comparaisons de durées sont aussi à privilégier pour ne pas réduire le kaléidoscope des possibles rythmiques.

Afin de repérer les faits pertinents sans être assujettie à l’optique d’un système particulier, cette étude, se voulant tout d’abord descriptive, privilégiera les repères les plus « neutres » représentés par les corrélats acoustiques.

2.3.2 Rythme déterminé par phénomènes de proéminence et d’accentuation

Rythme et proéminences sont au cœur de l’analyse prosodique, ainsi que le rappellent Avanzi, Lacheret et Victorri (2008)19 :

19

Avanzi, M., Lacheret-Dujour, A., Victorri, B. (2008). « ANALOR : Un outil d’aide pour la modélisation de l’interface prosodie - grammaire », Cahiers du CERLICO, 21, 27-46.

Nous entendons par proéminence mise en valeur perceptive d’une syllabe par rapport à son environnement, et qui se manifeste par la perception d’un « accent » [Lacheret & Beaugendre 1999 : glossaire]. La détection des proéminences constitue la pierre angulaire de toute étude prosodique, quelle qu’elle soit [Avanzi

et al. 2007].

Il s’agit là d’une rythmicité basée sur un procédé accentuel. Cela correspond aussi à la posture de Léon : « Un rythme est instauré quand il y a perception d’une proéminence accentuelle

répétée » (2011 : 162). Di Cristo rappelle que, bien que les corrélats acoustiques étudiés pour

en rendre compte soient la F0, la durée et l’intensité, l’explicitation du phénomène rythmique accentuel réside dans la « construction subjective de la perception » (2013 : 120). Il explique que « l’accent est vu principalement comme une entité relationnelle, le produit d’un réseau de relations hiérarchiques fondé sur la syllabe » (2013 : 123). En effet, selon lui, et appuyant les vues du linguiste américain Hocket, la hiérarchie accentuelle fonde un « mode d’organisation phonologique ». Les divers niveaux relatifs composant la structure hiérarchique accentuelle de la chaîne sonore sont souvent représentés, dans l’approche de la phonologie métrique et sur le plan formel, par des « arborescences à branchements binaires » se ramifiant jusqu’à la syllabe « dans lesquelles tous les nœuds (à l’exception de celui de la racine) sont étiquetés au moyen des symboles s (strong) ou w (weak) ». Se référant à l’accent démarcatif, Fónagy relie forme et sens, et ainsi justifie sémantiquement le caractère fondamental du rythme dans la parole :

L’accent articule et organise la parole. Il divise la chaîne parlée continue en séquences, en « groupes rythmiques ». L’accent établit d’autre part une certaine

hiérarchie sémantique dans la phrase, en prêtant plus ou moins d’intensité aux

mots conformément à leur poids sémantique et à l’importance actuelle des mots dans le message concret. (Fónagy, [1983] 1991 : 107)

Vaissière différencie les prosodies typiques du français et de l’anglais (2006 : 111- 112) :

Les voyelles en position finale des groupes de sens dominent perceptivement en français. C’est le retour des syllabes allongées, avec des intonations montantes qui définissent essentiellement le rythme en français. En anglais, ce qui frappe un Français, c’est la récurrence énergique et quasi régulière de syllabes fortement accentuées, avec une forte attaque consonantique, qui alternent avec des syllabes réduites. Ce type d’accentuation évoque pour l’oreille française l’accent

langue anglaise à une oreille non entraînée. L’unité principale de rythme en anglais est le « stress group ».

D’après cette description, l’interlangue des anglicistes francophones se caractérise par la perception d’un poids plus égal des syllabes les unes par rapport aux autres.

Sur le plan acoustique, il est complexe de déterminer l’incidence de chacun des trois corrélats dans le phénomène d’accentuation, qu’il s’agisse de l’accent lexical ou de phrase. Ainsi que le souligne Vaissière, « L’accentuation lexicale est une notion abstraite. Elle est une caractéristique intrinsèque des mots et des morphèmes, stockée dans le lexique mental » (2006 : 101). Au niveau du syntagme intonatif, l’accent de phrase relève avant tout d’un phénomène perceptif, pouvant être expliqué par une convergence des corrélats acoustiques chez les anglophones natifs. Rien ne peut nous garantir que les non natifs observeront les mêmes critères de production que les natifs. Alors que c’est la fréquence fondamentale (Herment, 2001), ou dans certains cas l’intensité (Herment)20, qui revêt une importance essentielle pour marquer l’accentuation en anglais, c’est le phénomène de durée qui est fondamental en français, et parfois l’intensité, comme en français québéquois (Léon, 2011 : 170). Aussi, il sera nécessaire de différencier la méthodologie de repérage accentuel de celle d’explication du phénomène. La première se doit d’être perceptive, alors que la seconde peut être acoustique.

On a déjà noté que les expérimentations perceptives menées par Horgues (2010) montrent que les indices rythmiques et prosodiques résistant au filtrage et à la resynthèse étaient suffisant pour signaler aux anglophones natifs l’accent étranger des locuteurs francophones parlant anglais. Cela octroie au rythme une importance particulière. Dans l’analyse acoustique des pieds accentuels, elle constate que la variabilité des pieds accentuels est plus importante chez les apprenants francophones que chez les natifs anglophones. Elle remarque en outre que l’accentuation lexicale est difficile à déterminer perceptivement sans contexte chez les apprenants les moins avancés. Son test TPer2 souligne la difficulté des auditeurs natifs pour situer l’accentuation lexicale des stimuli sans contexte ; ils notent 2,5 fois plus de déplacements accentuels chez l’apprenant que chez le natif. Horgues signale la réalisation incorrecte du patron accentuel dans les contextes de frontière droite de syntagmes intonatifs (IP) non finaux et de contour montant dans les questions.

20

Herment, S. (article non publié). “Is intensity a relevant criterion in the perception of spontaneous speech? The case of emphasis in English”.

2.3.3 Rythme par phénomènes d’alternance de durées

Léon (2011 : 169) rapporte l’observation par Konopczynski de l’établissement d’un protolangage chez le jeune enfant apprenant à parler en situation d’interaction. Le début de structuration de la parole se traduit par une organisation syllabique tendant à leur octroyer une durée similaire. L’acquisition des phénomènes rythmiques et intonatifs lui permettra de se conformer graduellement aux règles en vigueur dans sa langue maternelle avec constitution des groupes rythmiques normés. Elle avance l’explication selon laquelle il s’agirait d’une étape normale dans une phase d’apprentissage, qu’il s’agisse de parole ou de gestuelle :

Avec l’acquisition du système de sa langue maternelle, l’enfant est soumis à de nouvelles contraintes rythmiques. Il passe d’une rythmicité biologiquement motivée à une structuration temporelle et accentuelle, stylisée selon des normes conventionnelles. (Léon, 2011 : 169)

La diction rythmique de l’enfant pourra alors se soumettre à la thèse de Pike (1946) selon laquelle les langues se subdivisent en deux catégories distinctes : langues isosyllabiques (à rythmicité syllabique, syllable timing), et langues à isochronie accentuelle (stress timing). Le français appartient à la première catégorie et l’anglais à la seconde. Le « principe d’isochronie » se base sur le sentiment que les durées des syllabes inaccentuées entre deux proéminences se réduisent ou s’allongent pour que leur total s’équivaille. À la suite de nombreux débats sur le sujet, il semblerait que le fondement de la thèse de Pike se vérifie non pas acoustiquement, car il s’agit d’une tendance, mais surtout perceptivement (Vogel, 2016)21.

Gut (2009) note elle aussi que des chercheurs se dispensent carrément de la notion de rythme accentuel pour faire valoir les propriétés structurelles des langues (Dauer 1983, Barry 2007) reposant fondamentalement sur la structure syllabique. Elle ajoute que la réduction vocalique de certaines syllabes intervient essentiellement dans les langues à battement rythmique. De plus, l’accent lexical des langues dites syllabiques, lorsqu’il existe, est marqué par des variations mélodiques alors que l’accent lexical des langues à battement rythmique est fortement imprimé par une combinaison acoustique alliant la durée, la hauteur mélodique, l’intensité et les changements de qualité de la voix. Gut aborde les approches actuelles selon lequel rhythm is a multidimensional concept that includes various phonological properties of

languages (2009 : 162). L’approche qui prévaut sur la dichotomie en classes de langues est

21

Irène Vogel : Chaire internationale du Laboratoire d’excellence « Fondements Empiriques de la Linguistique » Labex EFL à Paris (juin et juillet 2016)

celle de leur ancrage le long d’un continuum qui marquerait leur degré rythmique les unes par rapport aux autres. La réduction vocalique est à présent la source des mesures rythmiques, que ce soit au niveau de la syllabe qui l’inclut ou du segment lui-même. Les mesures peuvent soit être globales, soit se focaliser sur des comparaisons de durée très ciblées. Selon les mesures globales des traits phonétiques de Ramus et al. (1999), la chaîne sonore est divisée en segments qui sont regroupés selon leur nature vocalique ou consonantique. Les données qui en découlent sont la proportion des intervalles vocaliques d’un énoncé (%V), l’écart type de ces intervalles (V) et l’écart type des intervalles consonantiques (C). D’autres mesures du rythme se basent sur des comparaisons de durées sur des éléments très ciblés. Gut mentionne la différence de durée entre deux voyelles successives du Pairwise Variability Index (PVI) de Low et Grabe (1995), ainsi que son corollaire PVI pour les consonnes (Grabe et Low 2002). Le Rhythm Ratio (RR) de Gibbon et Gut (2001), dans chaque paire d’unités adjacentes (soit de voyelles, soit de syllabes), la plus courte est divisée par la plus longue et la moyenne des résultats est multipliée par 100. Le Variability Index (VI) de Deterding (2001) mesurent les différences de durée moyenne entre des syllabes qui se suivent à l’exclusion de celles en fin de mots. Gut (2009 : 165-167) remarque une très grande variabilité suivant les diverses variétés d’une même langue : les mesures de l’anglais de Singapour, de Hong Kong, de Taiwan, du Nigéria classent ces variétés parmi les langues traditionnellement rythmiquement classées sur la syllabe et non sur le battement syllabique comme l’anglais britannique. Toutes ces variétés se positionnent individuellement sur le continuum rythmique. Les résultats empiriques des recherches antérieures répertoriées par Gut pour l’anglais figurent dans le tableau ci-dessous. Parmi les résultats relevés, on peut vérifier que les syllabes accentuées sont une fois et demie plus longues que les syllabes inaccentuées. La variation selon la vitesse d’élocution semble devoir être prise en compte dans l’appréciation des résultats : un accroissement de la vitesse d’élocution tend à restreindre les différences de durée entre les syllabes adjacentes en anglais de Singapour et en anglais britannique (Deterding 2001). D’après les études mentionnées par Gut (Dellwo et Wagner 2003, White et Mattys 2007), %V semble fournir des données plus stables indépendamment de la vitesse d’élocution. Le style de parole peut aussi avoir une incidence dans les principes organisationnels du rythme : Gut rapporte que, selon Guaitella 1999, la lecture permet une analyse acoustique quantitative, alors que l’analyse de la conversation est plus propice à un traitement perceptif.

British English

40.1% (Ramus et al. 1999) delta C 51.7 (Grabe and Low 2002)

53.5 (Ramus et al. 1999)

PVI vocalic: 57.2 (Grabe and Low 2002)

consonantal: 64.1 (Grabe and Low 2002) mean length of

stressed syllable

162-239 ms (Williams and Hiller 1994) 300 ms (Fant et al. 1991)

294 ms (Campbell 1989) 195-221 ms (Hoequist 1983) mean length of

unstressed syllable

164-183 ms (Williams and Hiller 1994) 140ms (Fant et al. 1991) 138 ms (Campbell1989) 138-158 (Hoequist 1983) mean ratio stressed/unstressed syllable 1.45:1 (Hoequist 1983) 1.5:1 (Dauer 1983) 1.7:1 (Delattre 1966)

Tableau 14 – Données rythmiques et durée moyenne des syllabes accentuées et inaccentuées en anglais britannique d’après Gut (2009 : 170)

Gut liste aussi les études faites sur le rythme en anglais des non natifs (2009 : 171- 172). On peut retenir celle d’Adams (1979) selon laquelle l’accent étranger en anglais est notamment perçu par insuffisance de durée entre les syllabes accentuées et inaccentuées, absence des mécanismes de liaison natifs, pauses erratiques et déplacement accentuel. Wenk (1985) remarque qu’en lecture de l’anglais après écoute, sur 43 non natifs francophones, la réduction vocalique était effective dans 40% des cas de syllabes non accentuées avant accent tonique et 81% des syllabes inaccentuées après accent tonique. Gut remarque (2009 : 174) l’utilisation d’un groupe de contrôle de natifs dans le profilage évaluatif et explique les différences rythmiques par la différence structurelle des L1 et L2.

Les données rythmiques qu’obtient Gut à la suite de sa recherche figurent dans son tableau 7.4, que j’ai reproduit ci-dessous. On peut voir que les syllabes (mean length sfv) des non natifs sont toujours de durée bien supérieure à celle des natifs. Leurs syllabes aux voyelles réduites (mean length srv) ou effacées (mean length sdv) sont moins nombreuses et la différence de durée moins importante entre les syllabes adjacentes avec voyelles pleines (ratio full/full) qu’avec voyelles réduites (ratio full/red).

mean length sfv mean length srv mean length sdv perc. red/del ratio full/ red ratio full/ full n

non- native English 236.1 (44.38) 155.07 (41.02) 157.07 (63.43) 24.01% (6.9) 1.98:1 (0.4) 1.22:1 (0.14) 41670 native English 210.75 (19.9) 101.8 (13.4) 85 (39.04) 30.65% (5.74) 2.45:1 (0.33) 1.18:1 (0.07) 2492 *** *** *** ** ** n.s.

Tableau 15 – Données rythmiques et leur écart type chez les natifs anglophones et non natifs de Gut (2009 : 179) (** = significatif avec p<0.01, *** = significatif avec p< 0.001)

Gut note en outre que seules les syllabes adjacentes avec voyelles pleines ont des durées correspondantes chez les natifs et les non natifs. La variabilité des mesures est plus importante chez les non natifs. Les différences de style de parole montrent que les natifs anglophones ont tendance à observer les mêmes proportions de durée des paires de syllabes entre celles avec voyelles pleines suivies de celles avec voyelles réduites ou effacées, bien qu’elles soient légèrement plus longues. La comparaison concerne la lecture et la reformulation, aucune donnée n’étant disponible en conversation. L’interdépendance entre le rythme de parole (speech rhythm) et le taux d’articulation (speech rate) ne fournit aucune corrélation pour les locuteurs non natifs de l’anglais.

Dans l’étude des non natifs spécifiquement francophones de l’anglais, Horgues (2010) compare ses résultats acoustiques avec ceux des natifs et observe une différence d’intensité moindre entre les voyelles accentuées et inaccentuées. Elle ajoute que le rapport entre syllabes