DIFFERENTES THEORIES ET METHODOLOGIES - Communiquer en environnement bruyant :de l'adaptation j

Notre problématique est de caractériser la façon dont un locuteur s’adapte à un environnement bruyant et gère l’effort vocal requis par cette adaptation. Nous avons d’abord rappelé les mécanismes mis en jeu lors de l’adaptation de la parole en environnement bruyant. Nous avons vu en particulier que l’adaptation de la parole en environnement bruyant, qualifiée d’ « effet Lombard », est imputée selon les études à un mécanisme réflexe de régulation de la voix par l’audition et/ou à une volonté de la part du locuteur de compenser la dégradation de l’intelligibilité induite par le bruit ambiant.

4.1. Bilan sur les mécanismes gouvernant l’adaptation de la parole

dans le bruit et sur les facteurs qui les influencent

Nous faisons ici l’hypothèse que l’adaptation de la parole en environnement bruyant fait intervenir une régulation réflexe du niveau d’intensité de la voix mais elle est également et surtout motivée par la volonté d’être compris par un interlocuteur. Nous explorerons au cours de la thèse plusieurs points pour apporter de nouveaux arguments à la validité de cette hypothèse.

Nous ne rentrerons pas plus dans le détail neurologique de la régulation réflexe de la voix par l’audition et considérerons seulement que les retours auditifs aériens et par conduction osseuse conditionnent cette régulation. Aussi, nous serons attentifs à la façon dont la situation expérimentale peut affecter ces retours. Nous prendrons également en considération l’influence probable des caractéristiques spectrales du bruit.

Figure 15. Schéma récapitulatif de notre conception de l’adaptation de la parole en environnement bruyant, sous

forme d’une résolution de problème par boucle de régulation fermée. Ce schéma est explicité dans le paragraphe suivant.

En ce qui concerne la part communicationnelle de l’adaptation au bruit, nous effectuons l’hypothèse qu’elle fait intervenir le fonctionnement cognitif du locuteur à plusieurs niveaux (cf. Figure 15):

(1) Tout d’abord au niveau de la perception et de l’analyse de la situation de communication, faisant intervenir ses représentations mentales afin d’évaluer de quelles modalités sensorielles (auditives, visuelles) il dispose pour interagir avec l’interlocuteur, sa distance, les caractéristiques de l’environnement bruyant dans lequel il est immergé, le niveau de compréhension de la langue par l’interlocuteur ou encore ses éventuels problèmes de déficit auditif.

(2) Ensuite, au niveau de la comparaison de cette situation à des expériences passées semblables stockées en mémoire. Cette catégorisation de la situation de communication peut alors lui permettre d’anticiper la façon dont l’interlocuteur peut le comprendre dans cette situation, ainsi que la façon dont il doit s’adapter pour maintenir un niveau correct d’intelligibilité.

(3) Enfin au niveau de la connaissance et de l’évaluation des contraintes limitant son action. Ces contraintes peuvent être de plusieurs ordres :

- la première contrainte réside dans le principe général de limiter autant que possible l’énergie dépensée pour l’adaptation.

(1) (2) (3)

(4)

- le locuteur est également vocalement limité dans sa capacité d’adaptation par son anatomie (forme du conduit vocal, longueur des cordes vocales, forme des lèvres), ses possibilités physiologiques (ouverture de la mâchoire), sa technique vocale (gestion du souffle ou des résonances), son hygiène de vie (tabagisme, alcool) ou sa santé vocale (affection de la sphère ORL ou lésion organique des cordes vocales).

- Cces possibilités vocales sont elles-mêmes limitées par les sensations de gêne, de confort ou de fatigue ressenties par le locuteur.

- les contraintes sociales limitent également l’adaptation du locuteur. Pour éviter que la parole ne soit jugée comme inconvenante ou anormale, certaines caractéristiques telles que la F0 ou la qualité vocale doivent rester dans une certaine marge imposée par des conventions sociales implicites et partagées par le locuteur et l’interlocuteur.

- les possibilités d’adaptation sont encore limitées par les contraintes phonologiques. Les indices acoustiques et articulatoires de reconnaissance des segments phonétiques ne peuvent pas s’écarter au-delà d’une certaine limite, au risque que la parole ne soit plus intelligible.

(4) A partir de l’intégration de ces différentes informations (1, 2 et 3), le locuteur peut alors prendre une décision et mettre en œuvre une stratégie de compromis entre les objectifs de l’action, les exigences de la situation et les contraintes à cette action.

(5) Enfin, une dernière étape de cette régulation consiste à vérifier l’action et la réajuster par rapport aux conséquences anticipées de l’action. Cette vérification est rendue possible dans une certaine mesure par la perception de sa propre voix (malheureusement perturbée) permettant d’estimer la façon dont un auditeur extérieur peut la percevoir, mais aussi par l’interprétation des indices visuels ou verbaux émis par l’interlocuteur sur sa compréhension ou non du message.

Cette hypothèse sur les mécanismes mis en jeu dans l’adaptation de la parole dans le bruit nous conduit à soigner la prise en compte des facteurs qui les influencent dans la mise au point de nos protocoles expérimentaux. Nous avons vu que ces facteurs sont principalement

- les retours auditifs que le locuteur a de sa propre voix

- la situation de communication, intégrant le bruit ambiant, mais également l’interlocuteur.

Par conséquent, nous serons attentifs dans la suite de cette thèse à bien contrôler les conditions expérimentales d’immersion du locuteur dans le bruit, afin de s’approcher d’une situation la plus naturelle possible pour l’auditeur et surtout de ne pas induire d’atténuation auditive supplémentaire à celle imposée par le bruit. La validité d’utiliser un casque pour immerger le locuteur dans le bruit, ainsi que la proposition de nouvelles méthodologies, fera ainsi l’objet du chapitre 4. Nous serons également particulièrement soucieux de prendre en compte la présence d’un interlocuteur (à une certaine distance, disposant de certaines modalités sensorielles pour interagir avec le locuteur, et d’une certaine prévisibilité quant au discours du locuteur) dans la situation de communication, ainsi que son influence interactive (retours sur le succès de la communication, etc.). Ces considérations feront l’objet du chapitre 4.

4.2. Hypothèses sur les différences interindividuelles d’adaptation

de la parole dans le bruit

Nous avons vu au paragraphe 1 les différentes manifestations observables de l’adaptation de la parole dans le bruit déjà caractérisées par les études antérieures. Cependant, ces travaux ont surtout cherché à recenser objectivement ces modifications, dans le but par exemple de les intégrer à des modèles de langage pour les systèmes de reconnaissance automatique de la parole, mais pas tant de les comprendre en terme de stratégie de communication du locuteur.

Notre hypothèse est justement que les différences interindividuelles d’adaptation de l’effort vocal à une situation de communication se situent au niveau de l’adoption de stratégies de communication différentes pour faire face à cette situation perturbée, et que ces différentes stratégies ne sont pas toutes de la même efficacité en ce qui concerne la répartition des efforts sur le larynx et le niveau d’effort dépensé pour un même niveau d’intelligibilité par l’interlocuteur.

Aussi, notre démarche ne consistera pas seulement à examiner de façon paramétrique toutes les différences acoustiques, articulatoires ou glottiques existant entre les locuteurs lorsqu’ils s’expriment en environnement bruyant mais plutôt à envisager différentes hypothèses de stratégies de communication pouvant être adoptées dans le bruit. Nous examinerons alors si ces stratégies sont propres à certains individus ou partagés par tous.

4. POSITIONNEMENT DE NOTRE ETUDE PAR RAPPORT A CES DIFFERENTES THEORIES ET METHODOLOGIES

55

Puisqu’un mécanisme principal de l’adaptation de la parole dans le bruit semble consister en la compensation de la dégradation de l’intelligibilité induite par le brut ambiant (Lane et al. 1971 ^[192]), nous avons recensé dans la littérature les différents facteurs dégradant ou améliorant l’intelligibilité de la parole en perception, de façon à élaborer des hypothèses de stratégies de communication potentiellement adoptées dans le bruit (donc du point de vue de la production) que nous testerons au cours des chapitres suivants.

En premier lieu, le rapport signal sur bruit est déterminant sur l’intelligibilité. La dégradation de l’intelligibilité d’enregistrements audio par leur mixage avec du bruit est un paradigme classique pour réaliser des tests perceptifs (Sumby et al. 1954 ^[335], Nicely et al. 1955 ^[255]).

L’intelligibilité de la parole peut être également affectée de façon différente selon le contenu spectral du bruit. Un bruit de conversations aux caractéristiques semblables à la parole du locuteur dégrade davantage son intelligibilité que d’autres types de bruit, en particulier si les conversations à l’intérieur de ce bruit restent intelligibles et ajoutent un effet de compétition lexicale pour l’auditeur. On connaît déjà l’existence de stratégies de renforcement spectral autour de 3kHz chez les chanteurs pour « émerger » par rapport à la masse sonore d’un orchestre (Sundberg 1972 ^[337] ; Oliveira Barrichelo et al. 2001 [260]).

On peut donc envisager l’existence de stratégies « acoustiques » chez les locuteurs immergés dans un bruit intense, visant à émerger du bruit ambiant par la préservation du rapport signal sur bruit, ou par le renforcement spectral de la voix dans des zones pertinentes (zone sensible de l’oreille, zone où l’énergie spectrale du bruit ambiant est la plus faible ou au contraire la plus forte). Nous examinerons ces différentes hypothèses au cours du chapitre 6.

L’acoustique d’une salle a également montré des effets sur l’intelligibilité puisqu’une réverbération trop forte peut entraîner un recouvrement des indices acoustiques spectro-temporels et perturber la reconnaissance des segments (Cox et al. 1987 [59] ; Nabelek 1990 [249]). De même, tous les phonèmes ne sont pas perturbés de la même façon par le bruit et par différents types de bruit. L’accélération du débit de parole perturbe également l’intelligibilité car elle restreint à la fois le temps de récupération de l’information par l’auditeur, mais surtout introduit des réorganisations temporelles à l’intérieur des segments et ne permet plus au locuteur d’atteindre les cibles articulatoires. Enfin, la disponibilité de la modalité visuelle accroît considérablement l’intelligibilité de la parole, en aidant à discriminer 40 à 60 % des phonèmes d’une langue et 10 à 20 % des mots (Schwartz et al. 2004 ^[309]). Sumby et al. 1954

[335] ont ainsi montré que l’ajout de la modalité visuelle était équivalent à une augmentation du rapport signal sur bruit de 15dB.

Ces différentes observations laissent envisager que les locuteurs puissent adopter dans le bruit des stratégies de renforcement de certains indices spectro-temporels et/ou visuels des segments pour augmenter leur intelligibilité. Nous explorerons cette possibilité dans le chapitre 7.

La prosodie joue également un rôle déterminant dans l’intelligibilité, en particulier par sa fonction démarcative permettant à l’auditeur de segmenter le flux de parole en unités de sens. Des études antérieures ont déjà montré que le renforcement de certains de ces indices de segmentation améliorait l’intelligibilité en perception (Christophe 1993 ^[52] ; Bagou et al. 2006 ^[20] ; Dodane et al. 2006

[72] ; Welby 2003 [373]) et étaient renforcés en production dans certains types de parole « hyper » (Dodane et al. 2006 [72] ; Welby 2006 [375]).

Il est donc fort probable que les locuteurs adoptent des stratégies semblables dans le bruit. C’est ce que nous examinerons dans le chapitre 8.

Pour finir, l’intelligibilité ne dépend pas seulement des indices audio ou visuels extérieurs, mais est fortement influencée par les mécanismes descendants (top-down) de traitement de ces indices par le sujet. En particulier, l’auditeur est capable de prévoir ou de reconstituer le message à partir des indices perçus et du contexte de communication (Dohalska et al. 2000 ^[73]). Ainsi, l’intelligibilité augmente avec le nombre de syllabes des mots, diminue lorsque la taille du vocabulaire possible augmente (Howes 1957 [159]), augmente lorsqu’un mot est plus probable par rapport au contexte. Des études antérieures ont déjà montré que les locuteurs n’adaptent pas seulement leur effort à la situation de communication, comme le propose Lindblom 1990 ^[217], mais réduisent également leur effort sur les mots de leur discours n’apportant pas d’information « nouvelle » ou étant facilement reconstituables par l’auditeur (Gravano et al. 2006 [122]).

Nous envisageons par conséquent qu’il puisse exister dans le bruit des stratégies de renforcement plus ou moins important des différents constituants de l’énoncé par rapport à leur prévisibilité ou au

degré d’information qu’ils apportent à l’interlocuteur. Nous testerons cette hypothèse au cours du chapitre 9.

Dans cette thèse, nous nous placerons toujours du point de vue de la production de la parole, en cherchant à déduire les stratégies de chaque locuteur pour communiquer dans le bruit à partir de leurs comportements observables. Nous prenons en compte la perception par l’interlocuteur dans le sens où nous envisageons la production du locuteur comme celle d’indices audibles et visibles son attention. L'adaptation ne réside pas tant dans la modification de la production du locuteur que dans la façon dont cette modification influence l’intelligibilité perçue par l’auditeur. Ce positionnement a des conséquences tant au niveau de l’interactivité des tâches de parole dans les protocoles expérimentaux que de la représentation des données mesurées, à l’aide d’unités perceptives plutôt que d’unités physiques (par exemples des barks plutôt que des hertz pour les modifications formantiques), ou à l’aide d’unités relatives plutôt que d’unités absolues lorsque cela est davantage pertinent du point de vue de la perception d’un paramètre (par exemple la fréquence fondamentale sera exprimée en tons plutôt qu’en Hertz).

_________________________

Chapitre 3 :

Influence de la méthode

Dans le document Communiquer en environnement bruyant :de l'adaptation jusqu'au forçage vocal (Page 64-68)