• Aucun résultat trouvé

environnement bruyant ________________________

2. L ES MECANISMES DE L ’ ADAPTATION DE LA PAROLE DANS LE BRUIT

2.1. Une régulation basée sur le retour auditif de sa propre voix

Nous avons vu précédemment que l’adaptation de la parole observée en environnement bruyant est aussi appelée Effet Lombard, en référence à celui qui le mit en évidence. Cet effet est en particulier caractérisé par l’augmentation de l’intensité vocale lorsque le retour de la voix est atténué, en particulier par l’immersion dans du bruit (Lombard 1911 [224] ; Lane et al. 1970 [194] ; Sinnott et al. 1975

[318]). Il existe l’effet inverse, appelé effet Sidetone, correspondant au fait qu’un locuteur diminue son intensité vocale lorsqu’il a un retour amplifié de sa propre voix, par exemple dans un casque (Lane et al. 1970 [194]).

Mais un tel comportement d’adaptation à une modification du retour auditif a également été observé pour d’autres caractéristiques telles que la hauteur modifiée du retour auditif (« pitch-shift reflex » étudié par Burnett et al. 1998 [39] ; Elman 1981 [83] ou Ternström et al. 1988 [347]), le timbre modifié par filtrage (« filtered auditory feedback » étudié par Tomatis 1987 [352], Garber et al. 1981 [99] ou Burzynski et al. 1985 [40]) ou encore un délai différé du retour auditif (« delayed auditory feedback », étudié par Lee 1950 [203], Howell 92 ; Stuart et al. 2002 [333] ; Kawahara94)

Cordemoy, en 1668, est le premier à avancer l’hypothèse d’une relation directe entre la production vocale et l’audition. Lombard 1911 [224], Fletcher et Fairbanks 1954 [86] s’y sont ensuite intéressés plus scientifiquement. Plusieurs observations étayent en effet cette hypothèse :

- une modification comportementale est non seulement toujours observée lors de la modification du retour sensoriel, mais la rapidité et l’amplitude de cette réponse sont proportionnelles à celles du stimulus (Lane et al. 1970 [194] ; Larson et al. 2000 [196])

- il semble exister une corrélation entre la précision du contrôle moteur et la sensibilité perceptive du sujet. Ainsi, Ringel et al. 1970 [286] ou Fucci 1972 [98] ont observé de meilleures capacités articulatoires chez les enfants possédant une sensibilité buccale développée. Dans le même sens, Martone, cité par Baum et al. 1997 [22], constatent que l’adaptation à une perturbation de la parole est plus difficile pour des personnes présentant des troubles auditifs. Enfin, de nombreux auteurs soulignent l’importance de la modalité auditive dans le développement de la parole chez l’enfant (Siegel et al. 1976 [316]), un développement anormal permettant justement de détecter d’éventuels problèmes auditifs. De façon comparable, un adulte confronté à une nouvelle situation, provoquée par une perturbation articulatoire par exemple, arrive très rarement à la compenser totalement dès le premier essai, mais améliore cette compensation au bout de plusieurs tentatives, allant de quelques minutes à quelques heures (Savariaux et al. 1999 [302]; Jones et al. 2003 [169]). Une fois que les sujets ont trouvé et assimilé une solution adéquate à un nouveau problème, certains arrivent à ne plus avoir besoin de retour sensoriel pour s’adapter. En revanche, il semble indéniable que ce dernier soit nécessaire à l’apprentissage de cette adaptation.

Ces observations ont amené plusieurs chercheurs, en particulier Fairbanks 1954 [86], à modéliser cette relation entre la production vocale et l’audition sous la forme d’un système cybernétique de régulation dans lequel la perception de sa propre voix forme une boucle de rétroaction, et où la variable régulée correspond aux paramètres de la phonation (intensité, hauteur, timbre). Le système auditif est alors considéré comme le capteur de ce système, et le point de consigne envoie des commandes motrices au système phonatoire (tension des muscles, mouvement de cartilages, pression sous-glottique) (cf.

Figure 12).

Figure 12. Représentation d’un système de régulation.

L’adaptation de la parole dans le bruit est donc principalement considérée comme une régulation de la production à partir des retours auditifs de sa propre voix. Les retours auditifs dont dispose le locuteur de sa propre voix et leurs caractéristiques psychoacoustiques sont donc des facteurs importants de l’adaptation de la parole dans le bruit dont nous aurons à tenir compte au niveau des protocoles expérimentaux.

2.1.1. Les différents retours auditifs de sa propre voix

Le locuteur dispose de 2 retours auditifs principaux pour évaluer sa propre voix : un retour auditif par voie aérienne, un autre par voie osseuse.

La principale voie de retour auditif pour la plupart des locuteurs en situation de communication quotidienne est celle de perception par l’oreille externe du son rayonné au niveau de la bouche et conduit par l’air jusqu’à l’oreille. Le trajet du son de la bouche à l’oreille est à la fois direct et indirect, grâce aux réflexions du son sur les parois de la salle ou les objets alentours. Ce retour aérien dépend donc de deux caractéristiques :

- la morphologie du visage du locuteur. Selon la forme des lèvres, la rondeur de la joue, ou encore l’angle et la forme du pavillon de l’oreille, la fonction de transfert modélisant le canal bouche-oreille ne va pas être identique d’un locuteur à l’autre.

- les caractéristiques de la salle (taille, forme, réverbération) ainsi que la place du locuteur dans cette salle. On voit ainsi souvent des chanteurs se déplacer vers des murs pour améliorer le retour de leur voix.

Le retour auditif peut être également interne par conduction osseuse et tendino-cartilagineuse, et ne dépend alors plus des conditions extérieures, ce qui rend son étude ou sa suppression très difficile. Le son peut être conduit du larynx jusqu’à l’oreille interne par différentes voies internes, que Tonndorf 1966 [354] regroupe en 3 catégories, selon que la vibration parvient à l’oreille externe, à l’oreille moyenne ou directement à l’oreille interne. La composante de la conduction relative à l’oreille externe résulte du fait que la vibration du crâne entraîne des déformations du canal auditif externe et ainsi de légères variations de pression (Von Bekesy 1960 [370] ; Hood 1962 [155]). Enfin, certains auteurs suggèrent que les vibrations pourraient atteindre la cochlée directement (Tonndorf 1966 [354] ; Stenfelt et al. 2002 [330]). En temps normal, la contribution de la conduction osseuse a été mesurée comme équivalente à celle du retour auditif aérien (Von Bekesy 1960 [370] ; Stenfelt et al. 2002 [330]; Pörschmann 2000 [274]). Elle devient au contraire particulièrement importante lorsqu’il y a occlusion de l’oreille externe, par le port de protections auditives ou d’un casque fermé par exemple. Ce phénomène est appelé « effet d’occlusion ».

Enfin, nous devons mentionner l’existence d’un retour perceptif tactile et non plus auditif, de sa propre voix, par le biais de sensations vibratoires. Les chanteurs sont particulièrement entraînés à se baser autant voire davantage sur ce retour kinesthésique que sur leur retour auditif externe pour contrôler leur voix, car ils sont habitués à s’exprimer avec un accompagnement musical, dans des acoustiques de salles très différentes ou dans un chœur (Scotto di Carlo 194 [311], Ternström 1994

[344]).

2.1.2. La perception de sa propre voix à partir de ces retours auditifs

La perception de sa propre voix est le meilleur indice dont le locuteur dispose pour estimer la façon dont son interlocuteur le perçoit. Pourtant, les perceptions intérieure et extérieure de la voix sont très différentes, au point qu’il est fréquent que des locuteurs ne se reconnaissent pas lorsqu’ils ont l’occasion d’écouter leur voix enregistrée. Ce phénomène a motivé plusieurs études à comprendre

2. LES MECANISMES DE LADAPTATION DE LA PAROLE DANS LE BRUIT

les mécanismes de perception de sa propre voix et surtout les raisons de cette perception intérieure différente.

En 1961, Lane et al. 1961 [193] ont cherché à évaluer la courbe de perception de l'intensité de sa propre voix par un locuteur, appelée « échelle subjective de réponse autophonique ». Lorsque le locuteur pense doubler son intensité, sa voix n'est perçue que légèrement plus intense (d’un facteur 1.2) par un auditeur extérieur (cf. Figure 13).

Figure 13. Echelle autophonique et échelle de sonie (D’après Lane et al. 1970 [194]).

Mais ce qui différencie la voix perçue par un auditeur extérieur, de la voix perçue en interne par le locuteur lui-même, n’est pas qu’une question d’intensité mais aussi de timbre. Le renforcement des basses fréquences dans la perception de sa propre voix provient de plusieurs facteurs :

- tout d’abord, un premier effet de filtrage a lieu lors de la conduction aérienne du son de la bouche vers l’oreille. Le rayonnement du son est directif en hautes fréquences et omnidirectionnel en basses-fréquences, ce qui implique que les fréquences aiguës sont atténuées vers l’arrière, tandis que les basses fréquences se propagent beaucoup mieux jusqu’au pavillon de l’oreille externe. La fonction de transfert bouche-oreille peut déjà être modélisée par un filtre passe-bas (cf. Figure 14).

- un deuxième filtrage important est dû à la conduction osseuse, atténuant les fréquences supérieures à 2kHz, ce qui explique le caractère très sourd de la voix perçue de l’intérieur en se bouchant les oreilles (Pörschmann 2000 [274] ; Von Bekesy 1960 [370] ; Maurer et al. 1990 [234]).

Au contraire, la conduction osseuse participe de façon plus importante à la perception de sa propre voix que le retour aérien pour les fréquences entre 700 et 1200 Hz, c’est-à-dire dans la zone du premier formant (cf. Figure 14).

- enfin, l’oreille moyenne dispose d’un réflexe de protection de l’oreille aux fortes intensités, appelé réflexe stapédien (ou « acoustic reflex » en anglais) qui est également activé automatiquement lors de la phonation (Olsen et al. 1976 [261]). Ce réflexe permet de réduire la sensibilité de l’oreille juste avant la phonation, et se traduit concrètement par une atténuation auditive au niveau des basses fréquences.

Figure 14. Représentation des différentes contributions du retour aérien ou de la conduction osseuse à la perception de sa propre voix en fonction des fréquences (D’après Pörschmann 2000 [274]). Les basses fréquences seraient davantage régulées à l’aide de la conduction osseuse, et les hautes-fréquences à l’aide du retour aérien.

Ces différents retours perceptifs peuvent expliquer l’influence différente qu’exerce un retour filtré de sa propre voix sur la régulation vocale, selon la bande de fréquences affectée par le filtrage. Ainsi, Garber et al. 1981 [99] ont montré dans une expérience que l’effet Sidetone (diminution de l’intensité vocale lorsque le retour aérien est amplifié) est diminué lorsque le retour auditif est également filtré par un passe-bas, tandis qu’il reste inchangé par un passe-haut. Ces auteurs en concluent que les retours auditifs aériens et osseux ne sont pas « additifs » mais complémentaires: les basses fréquences de la voix seraient principalement régulées à l’aide du retour par conduction osseuse, et

les hautes fréquences à l’aide du retour aérien (cf. Figure 14). Ainsi, un filtrage des basses fréquences du retour aérien n’aurait pas de grande influence sur la perception de sa propre voix, entraînant une absence d’effet Sidetone, tandis qu’un filtrage des hautes fréquences du retour aérien entraînerait un changement important de perception de sa propre voix, et donc un effet Sidetone.

Outline

Documents relatifs