Apprendre à percevoir (ou à mieux percevoir) la parole

2.2.1Percevoir des sons, entendre un phonème

Un phonème est une représentation mentale de la catégorie associée à un

ensemble de sons. Les phonèmes d’une langue donnée sont distribués en un

ensemble fini de catégories distinctes (Liberman, Harris, Hoffman, & Griffith,

1957). Cependant, ces catégories sont construites sur un domaine continu

(typiquement celui des paramètres acoustiques) : par exemple, un son proche de la

limite des catégories /b/ ou /d/ est néanmoins perçu comme appartenant soit à

l’une soit à l’autre catégorie. Bien que le son soit ambigu, il est perçu comme un

phonème et un seul. Cette perception en catégories distinctes est également

attestée dans la perception des voyelles (Pisoni, 1975). L’association son-phonème

ainsi que les limites entre phonèmes sont plutôt claires (voir Figure 7, issue de

Peterson & Barney, 1952), et ce malgré les variabilités entre locuteurs et auditeurs.

Figure 7 : Extrait de Peterson & Barney (1952). Fréquence du second formant (en ordonnée) en fonction de celle du premier formant (en abscisse). Chaque point représente une voyelle produit par un des locuteurs (homme, femme, ou enfant ; n = 76). Les labels associés à chaque point ont été décidés

Les variations dans la production des sons dépendent de facteurs intra-

mais aussi inter-locuteurs tels que l’âge, le sexe ou le dialecte (Kraljic, Brennan, &

Samuel, 2008). On parle d’allophones pour désigner les variantes de la réalisation

sonore d’un phonème : la jota /r/ et le son/ʁ/sont deux phonèmes en espagnol,

mais deux allophones du seul phonème existant dans le répertoire de l’auditeur

français – même si un auditeur français entendra une différence entre les sons, il

les catégorisera comme un /ʁ/. Parmi l’ensemble des sons que l’humain est

capable de produire, il utilise un nombre restreint de phonèmes afin de

communiquer. L’apprentissage phonétique peut être décrit comme le fait de

cartographier cet ensemble de phonèmes, spécifique et nécessaire à l’auditeur, qui

en retour influe sur sa façon de percevoir les sons à travers différentes langues

(Strange, 1995). Ce processus, dérivé de l’expérience de l’auditeur, est unique à

chacun. Pourtant, il permet de communiquer avec tous. Ce chapitre se concentrera

sur cette relation sons-phonèmes et les mécanismes qui interagissent avec elle

pour assurer la communication.

2.2.2Qu’est-ce qu’être un bon auditeur ?

Le système de perception de parole se développe très tôt dans la vie d’un

être humain. Déjà dans le ventre de sa mère, le nourrisson perçoit sa voix et

montre une préférence pour celle-ci par rapport à d’autres voix après la naissance

(DeCasper & Spence, 1986). Au cours de leur première année de vie, le système

perceptif des nourrissons évolue. Lorsqu’ils ont été exposés à une paire de

phonèmes qui constitue un contraste phonologique en hindi mais pas en anglais,

des nourrissons anglais âgés de 7 mois ont été capables de discriminer les deux

sons hindi, tout comme des locuteurs adultes de l’hindi (Werker, Gilbert,

Humphrey, & Tees, 1981). Par contre, des locuteurs adultes anglais échouent à

discriminer ce contraste qui n’existe pas dans leur langue. Une autre étude Werker

et Tees (1984) ont reproduit ce résultat pour un autre contraste d’une autre langue

(Salish) et ont montré que cette capacité à discriminer des phonèmes d’une autre

langue disparaît à la fin de la première année de vie. Un nourrisson de moins d’un

an est-il alors un meilleur auditeur qu’un adulte ? Dans une tâche de discrimination

de sons non-natifs : oui. Mais la perte de sensibilité à discriminer deux sons qui

advient par la suite sera compensée par une spécialisation à distinguer les

phonèmes d’une langue particulière. C’est l’expérience linguistique qui permettra à

l ‘enfant d’acquérir une sensibilité accrue aux sons de sa langue (Jusczyk,

Friederici, Wessels, Svenkerud, & Jusczyk, 1993). Par la suite, cette sensibilité lui

permettra d’apprendre sa langue et de communiquer via le langage oral (Werker &

Yeung, 2005).

Un des critères pour être un « bon » auditeur de parole serait donc de

pouvoir associer un son donné à la bonne catégorie phonologique, qu’on suppose

partagée avec le locuteur. Chaque auditeur se spécialiserait très tôt dans sa vie à

percevoir un nombre fini de phonèmes, via l’expérience de la langue. Cela lui

permettrait de parvenir à associer une multitude de sons très variables à un

nombre limité de catégories pertinentes pour sa langue maternelle. Cette

spécialisation est associée à une discrimination réduite à l’intérieur des catégories

phonétiques pertinentes, à l’inverse de la perception aux limites de ces mêmes

catégories (Kuhl & Iverson, 1995). La perception d’un son de parole est façonnée

par les connaissances de l’auditeur. Ces connaissances peuvent être phonétiques,

mais également lexicales, comme le montre l’expérience de Ganong (1980). Dans

cette expérience, un continuum de sons a été préparé entre le mot anglais dash (en

français, « tiret ») et le pseudo-mot tash (sans signification). Des participants

devaient catégoriser quel mot ils entendaient. Les stimuli au milieu du continuum,

habituellement perçus comme les plus ambigus dans les expériences de perception

catégorielle, étaient plus souvent perçus comme étant le mot plutôt que le

pseudo-mot. Les sons ambigus ont donc été plus souvent associés au phonème en accord

avec la connaissance lexicale de l’auditeur. Les connaissances préalables (appelées

aussi « priors ») de l’auditeur semblent façonner sa perception de la parole. Dans

une autre étude (Niedzielski, 1999), des participants résidant dans la même ville

ont participé à un test perceptif dans lequel ils entendaient des stimuli synthétisés.

Ils avaient pour tâche d’identifier parmi ces stimuli synthétiques ceux qui

correspondaient le mieux à la parole d’un locuteur réel. La moitié des participants

croyaient que le locuteur était originaire de la même région qu’eux alors que

l’autre moitié pensait qu’il venait d’une autre région d’un pays frontalier. Les

participants écoutaient les mêmes stimuli mais avaient donc un prior différent

quant à la région d’où venait le locuteur. Les résultats montrent que les deux

groupes de participants n’ont pas choisi les mêmes réponses parmi l’ensemble des

stimuli présentés. Bien qu’il s’agisse strictement des mêmes sons, des stéréotypes

liés aux attentes entrent en jeu dans la perception du locuteur. Ainsi, on sait que

l’information géolinguistique relative au locuteur constitue un prior influant sur la

perception de la parole.

Tout comme la production des sons varie d’un locuteur à l’autre, la capacité

à les percevoir varie en fonction de l’auditeur. La perception de la parole n’est pas

déterminée uniquement par le locuteur ou l’auditeur, mais bien par la relation

entre les deux. Certains travaux ont d’ailleurs montré qu’un auditeur, lorsqu’il est

confronté à la même liste de stimuli, les perçoit mieux lorsqu’ils sont produits par

un unique locuteur plutôt que plusieurs (Creelman, 1957 ; Mullennix, Pisoni, &

Martin, 1989). L’auditeur adapterait son système perceptif à la parole du locuteur,

et cet avantage, bien qu’assez faible, se perdrait lorsque l’auditeur est aussi

confronté aux stimuli d’autres locuteurs (voir Figure 8). Néanmoins, cet effet de

congruence entre auditeur et locuteur peut produire des effets de généralisation,

puisque des auditeurs bénéficient d’un avantage d’intelligibilité lors de la

perception d’un locuteur produisant de la parole dans une langue étrangère

lorsqu’ils partagent la même langue maternelle (Bent & Bradlow, 2016). De la

même manière, la perception d’une langue seconde requiert plus d’efforts à

l’auditeur que lorsqu’il perçoit sa langue maternelle (Borghini & Hazan, 2018).

Figure 8 : Extrait de Mullennix et al. (1989). Pourcentages de réponses correctes (en ordonnée) en fonction du niveau de dégradation du signal de parole (en abscisse) et du nombre de locuteurs

présentés (trait plein : un seul / pointillés : plusieurs).

2.3 Nos représentations phonologiques s’adaptent à la parole qu’on

Dans le document Percevoir la parole quand elle est produite différemment : étude des mécanismes de familiarisation multimodale/multisensorielle entre locuteurs tout-venants et locuteurs présentant un trouble de l'articulation (Page 29-33)