Droits et devoirs de la parole : les limites de la variabilité variabilité

Résumé chapitre I

I. Droits et devoirs de la parole : les limites de la variabilité variabilité

I.0 Introduction

Toute production de parole implique la préparation d‟une intention de communication.

Traditionnellement, le cerveau était supposé stocker des représentations mentales phonétiques qui requièrent l‟existence de cibles articulatoires, acoustiques et perceptives. Les articulateurs seraient ensuite activés par une commande motrice issue du système nerveux central. Ceux-ci exécuteraient différents mouvements, selon les « cibles¹ » à atteindre pour la production des sons visés. Cependant, les recherches actuelles en neurophysiologie nous indiquent que le déroulement des processus impliqués dans la production de la parole ne serait pas si linéaire, voire si simpliste.

Il suffit de considérer le rôle que peuvent jouer les réafférences sensorielles ou « feedbacks » pour se rendre compte que l‟information provient également des structures périphériques, vers le Système Nerveux Central (voir la section 3. de ce chapitre, consacrée à la Théorie de la Viabilité).

Dans ce qui suit, nous examinerons principalement les facteurs relatifs aux structures périphériques du système de production de la parole, en tentant de montrer le rôle prépondérant qu‟elles peuvent jouer en production-perception de la parole. Il s‟agit en réalité d‟examiner l‟importance des gestes articulatoires pour le système de communication humain, et les conséquences de déviances éventuelles liées, par exemple, à la parole pathologique.

Variations et contraintes

Le locuteur ajuste en permanence les paramètres caractéristiques de la production de la parole (vitesse d‟élocution, prosodie, pauses…) en fonction de son auditoire (Lindblom, 1996), et de ses aptitudes. Nous verrons plus tard que certaines variations interviennent dans la production des phrases, en fonction des connaissances communes et des facultés de perception des locuteurs. Certaines recherches présument que la programmation du processus de production de la parole précise directement des séquences de segments à réaliser (cibles), incluant des informations sur le réglage temporel (timing). Les séquences cibles introduiraient les modifications des caractéristiques acoustiques et articulatoires des formes canoniques stockées dans le cerveau (Perkell et al. 1995). Les séquences cibles discrètes seraient transformées en mouvements articulatoires par des processus articulatoires. Ces cibles discrètes seraient définies en termes de mouvements des articulateurs et de paramètres acoustiques. C‟est ainsi que les mouvements articulatoires contraindraient les variations acoustiques dans différentes situations, et ce dans les

1 Il est bien entendu que la notion de cible est toute relative puisque celle-ci n‟est jamais clairement identifiée dans les données articulatoires, acoustiques, voire perceptives.

limites perceptives acceptables qui peuvent être plus ou moins étendues. Si ce point de vue semble être plausible, il est difficilement vérifiable à cause de la difficulté de mettre au jour les facteurs liés à la programmation de ces cibles au niveau central.

En revanche, l‟analyse de données articulatoires et acoustiques montre que la parole en tant qu‟activité motrice volontaire est régie par un système complexe rempli de contraintes. Les contraintes articulatoires entraînant des variations sur l‟articulation des sons peuvent être phonologiques-linguistiques, ou encore physiologiques. Notons également la présence de contraintes co-articulatoires engendrées par l‟enchaînement des sons sur le plan temporel. Les sons ne sont alors plus produits comme ils le seraient de façon individuelle. Ils sont soumis à l‟influence du contexte phonétique.

Face à ces nombreuses contraintes, le système de production s‟adapte par différentes stratégies, ce qui conduit à de la variabilité lors de la réalisation des entités phonétiques. Lorsque les contraintes articulatoires et acoustiques le permettent, la cible est atteinte. Lorsque les contraintes sont trop lourdes, les cibles ne sont pas atteintes de manière optimale et la variabilité apparente est intégrée au message de manière intuitive et «inconsciente» par les locuteurs-auditeurs. En d‟autres termes, l‟articulation est compensée d‟une certaine façon, afin d‟atteindre la cible acoustique, à défaut de la cible articulatoire. Si aucune des deux n‟est atteinte, la perception ne pourra se faire correctement. Cela laisse croire en l‟existence de passages obligés dans les régions cibles sous forme de stabilités spatio-temporels. Nous savons cependant que le locuteur ne cesse de s‟adapter, ses productions étant soumises à toutes formes de variations. L‟adaptabilité du locuteur à des conditions perturbatrices étant habituellement démontrée notamment dans le cas de la parole pathologique, il serait difficile alors de croire à une invariance phonétique, articulatoire ou acoustique.

Plusieurs théories traitent de la question de la tension entre la variabilité et l‟invariance.

Elles peuvent nous éclairer quant aux capacités d‟adaptation et de réajustement des locuteurs en général, face aux contraintes, et de fait, de nos locuteurs porteurs de fente palatine en particulier.

I.1. L’obligation de cibles à atteindre

Si les gestes ont une marge de manœuvre assez large pour effectuer les sons de la parole, ils ont un devoir à accomplir ; des cibles à atteindre. En effet, quel qu‟en soit la manière, le but est le même : il s‟agit de préserver la distinctivité phonologique. Les théories que nous présentons dans cette section (qui doit beaucoup à la lecture de Sock, 1998) illustrent la nature flexible de la parole pour un résultat qui, pourtant, doit être stable.

I.1.1. La Théorie Quantique de Stevens (1972, 1985, 1989, 1991, 2002, 2005)

La Théorie Quantique (Quantal Theory) relate l‟existence de l‟invariance acoustico-auditive dans le signal de la parole. Stevens (1985) définit les cibles comme étant des régions dans l‟espace acoustique et articulatoire, par les principes quantique, dynamique et distributionnel. Les propriétés acoustiques, ayant un rôle perceptif, restent invariantes quels que soient les locuteurs et les contextes phonétiques. Le but acoustique devient alors plus important que le geste lui-même.

Selon Stevens (1985 ; 1991) il existerait une organisation hiérarchique des traits phonologiques qui structurent le lexique, ainsi qu‟une représentation directe de ces indices sous forme de caractéristiques acoustiques invariantes du signal de parole. Pour lui, le locuteur doit apprendre les différents modèles de coordination des articulateurs, afin de remplir les exigences acoustique-auditives du code phonologique. "Given this view of the feature-based structure of the lexicon and the way in which the various features are represented in the sound, we can speculate on the implications for strategies for speech production. […] [In producing speech sounds] speakers must learn patterns of coordination of the various articulators that satisfy [the] acoustic requirements." (Stevens, 1991, p. 86).

De ce fait, et par opposition à la proposition de la Théorie Motrice de Liberman et al., (1967, 1985), l‟espace de contrôle, pour Stevens (1991), serait acoustique, étant donné que le locuteur coordonnerait ses mouvements au mieux pour doter le signal acoustique des indices spectraux et temporels invariants, directement associés au code phonologique.

L‟ensemble des conclusions de Stevens (1991) repose sur ses travaux, menés en collaboration avec Blumstein depuis les années 70. Suite à une série d‟expériences sur la perception du lieu d‟articulation de consonnes occlusives /, , / dans des stimuli de synthèse du type consonne-voyelle, Stevens et Blumstein (1978) tentent de prouver l‟existence de propriétés acoustiques invariantes permettant la caractérisation du lieu d‟articulation de la consonne, indépendamment du contexte vocalique. Leurs données montrent que la forme globale du spectre, calculé au relâchement (soit la détente acoustique) de la consonne, diffère selon le lieu d‟articulation. Ainsi, ils observent :

- un pic spectral proéminent dans les fréquences moyennes (1 à 3 kHz) pour les vélaires ; - un spectre "diffus" et montant pour les dentales ; et

- un spectre "diffus" et descendant pour les labiales.

Sock (1998) rappelle qu‟il fallait cependant passer d‟un invariant statique à un invariant dynamique, plus tard, pour pouvoir se rendre compte de distinctions phonologiques plus fines telles que la distinction entre // et // (Blumstein, 1986). Toutefois, l‟hypothèse de base ne change pas avec ce réaménagement de la théorie. Pour Blumstein (1986) il existerait une invariance acoustique dans le signal de parole correspondant aux traits phonétiques d‟une langue.

Elle pose que le signal de parole serait hautement structuré, dans le sens où il contiendrait des

modèles acoustiques invariants. Ces modèles correspondent à la dimension phonétique de la langue, associés aux segments linguistiques et aux traits phonétiques. En outre, ces modèles resteraient invariants, quels que soient les locuteurs, les contextes phonétiques et les langues :

"There is acoustic invariance in the speech signal corresponding to the phonetic features of natural language. That is, it is hypothesized that the speech signal is highly structured in that it contains invariant acoustic patterns for the phonetic dimension of language relating in particular to linguistic segments and to phonetic features, and that these patterns remain invariant across speakers, phonetic contexts, and languages." (Blumstein, 1986, p. 178).

Il s‟agit alors de rendre compte des facteurs qui façonnent les caractéristiques acoustiques et articulatoires utilisées pour signaler les distinctions linguistiques. Comme le font par ailleurs remarquer Lindblom et Endgstrand (1989), la Théorie Quantique est une théorie des traits distinctifs qui, contrairement à la théorie relativement axiomatique de Jakobson et al. (1963), tente de rationaliser l‟origine des traits à partir de l‟observation des phénomènes articulatoires et des résultats acoustiques associés.

Ce constat fait, il importe de signaler que le lien entre une théorie de l‟invariance acoustique et la Théorie Quantique n‟est pas clairement défini chez Stevens (1989). Blumstein (1989) souligne ce fait, en disant que les propriétés invariantes ne sont pas intrinsèques aux paramètres acoustiques dans la Théorie Quantique et que seule la stabilité de l‟acoustique par rapport à l‟articulatoire peut être inférée. Elle admet, toutefois, qu‟une théorie de l‟invariance acoustique ne peut être viable sans une Théorie Quantique sous-jacente, puisqu‟elle requiert l‟émergence d‟un nombre défini de propriétés acoustiques invariantes à partir d‟un nombre potentiellement infini de configurations articulatoires. Ainsi, l‟existence d‟invariants acoustiques dans le signal de parole apparait dans le cadre de la Théorie Quantique (Quantal Theory) proposée par Stevens (1972 ; 1989). Le raisonnement de base de cette théorie consiste en la non-linéarité du passage de l‟articulatoire à l‟acoustique, responsable de l‟existence de zones de l‟espace articulatoire pour lesquelles le résultat acoustique est stable (Zones I et III dans la Figure 1), et de zones où une petite variation du paramètre articulatoire implique une variation abrupte du paramètre acoustique (zone quantale (Zone II)). Lorsqu‟un paramètre articulatoire varie de manière linéaire, il arrive que les conséquences acoustiques varient de façon non régulière. C‟est-à-dire que, dans certaines zones articulatoires, des mouvements qui seront sans conséquences acoustiques (résultat stable) sont observables.

I II III

Dans le document Perturbation de la production des Occlusives chez des locuteurs présentant une division palatine ou labio-palatine ~ Association Francophone de la Communication Parlée (Page 27-31)