• Aucun résultat trouvé

1.   Cadre  théorique

1.4   Modèles  théoriques

Parmi les modèles les plus utilisés pour expliquer la perception de phonèmes non natifs, nous pouvons citer le modèle d’assimilation perceptive (Perceptual Assimilation Model, PAM) de Best (1995) et le modèle d’apprentissage de la parole (Speech Learning Model, SLM) de Flege (1995).

Le modèle d’instructions pour la vitesse des articulateurs (Directions Into Velocities of Articulators, DIVA) de Guenther (1994, 2006) qui simule la production de phonèmes natifs et son acquisition sera également présenté dans cette partie.

1.4.1  Modèle  PAM  de  Best  (Perceptual  Assimilation  Model)  

L’idée fondamentale du modèle PAM (modèle d’assimilation perceptive) de Best est que les phonèmes non natifs sont perçus en fonction de leurs similarités et de leurs différences avec les phonèmes natifs. Selon Best, la parole est perçue en premier lieu via les gestes articulatoires. Par conséquent les similarités et les différences perçues entre un phonème L2 et un phonème natif sont à comprendre en termes de similarités et de différences dans les gestes articulatoires. Les gestes articulatoires comprennent le lieu d’articulation, l’utilisation des articulateurs actifs et le degré de constriction.

En cas de similarité, le phonème non natif peut être assimilé à une catégorie de la langue native. Citons comme exemple le cas de la perception de la voyelle antérieure anglophone /q/ par les francophones qui est identifiée comme la voyelle /i/ du français. S’il n’existe pas de ressemblance suffisante entre le phonème L2 et un phonème L1, le phonème non natif ne sera francophones perçoivent relativement facilement la différence entre cette voyelle et leurs voyelles francophones car le trait rhotique n’existe pas en français. Cette voyelle est tout de même considérée comme un son pouvant appartenir à une langue, contrairement aux clics zoulous qui sont perçus comme des bruitages.

Ces configurations d’assimilation perceptive permettent de prédire la performance des apprenants d’une seconde langue à discriminer des contrastes non natifs. Un contraste correspond à une paire de phonèmes qui a une fonction contrastive dans une langue : au sein d’un contraste, la substitution d’un phonème par l’autre dans un mot produit un changement de sens. Par exemple /i/ et /e/ forment un contraste en français : les mots

« pile » et « pelle » ne se distinguent phonologiquement en français que par leur voyelle.

Best, dans son article, mentionne six possibilités d’assimilation des contrastes dont quatre sont présentées ci-dessous. La figure 1 fournit une représentation imagée de ces quatre patterns d’assimilation. Dans le premier cas de figure, appelé « Two Category Assimilation » (assimilation à deux catégories), les deux phonèmes du contraste L2 sont assimilés à deux catégories différentes de la langue native. Par exemple un francophone assimile les voyelles anglaises ouvertes postérieures /à/ et /o/ respectivement aux phonèmes natifs /à/ et /c/. Selon Best, McRoberts, &

Goodell (2001), la discrimination d’un contraste du type « Two Category Assimilation » est excellente. Dans le deuxième cas de figure, nommé

« Category Goodness Difference » (différence dans la qualité au sein de la catégorie), les deux phonèmes L2 sont assimilés à la même catégorie de la langue native, mais l’un des phonèmes est considéré comme plus prototypique que l’autre. Citons en exemple les voyelles anglaises /E/ et /y/ qui sont assimilées le plus souvent à la voyelle /ø/ par les francophones, où /y/ sera considéré comme un meilleur exemplaire de la catégorie /ø/ que /E/.

Au sein de ce pattern d’assimilation, la discrimination des deux phonèmes est très bonne. Dans la troisième condition, appelée « Single Category Assimilation » (assimilation à une seule catégorie), les deux phonèmes sont assimilés au même phonème L1, les deux phonèmes étant autant proches du phonème L1. C’est les cas des voyelles anglaises fermées antérieures /i/ et /q/ qui sont identifiées comme /i/ par les locuteurs francophones. Dans ce cas de figure, la différenciation des deux phonèmes est mauvaise. Finalement les deux phonèmes peuvent tomber en dehors de l’espace phonétique natif et être considérés comme des sons n’appartenant pas au langage. Il s’agit du pattern « Non-Assimilable » (non assimilable). C’est le cas des clics zoulous pour les francophones. La perception du contraste non assimilable est variable, pouvant s’étendre d’excellente à médiocre. La perception de ce type de contraste dépend des similarités perçues entre les deux phonèmes L2 et de leur proximité gestuelle avec les phonèmes L1.

Quant à la question de l’amélioration des habiletés perceptives, Best &

Strange (1992) concluent que les locuteurs apprenant une langue étrangère sont en mesure de créer de nouvelles catégories perceptives. Il y a davantage de chance qu’une nouvelle catégorie se forme pour les phonèmes qui sont considérés comme non prototypiques d’une catégorie L1. Par conséquent, l’assimilation perceptive peut se réorganiser avec l’expérience.

Figure 1

Patterns d’assimilation des contrastes non natifs selon le modèle PAM de Best (1995).

Les ellipses représentent les catégories phonémiques natives, ici des phonèmes de la langue française. Les étoiles symbolisent les phonèmes L2. Pour les trois premiers patterns d’assimilation, il s’agit de voyelles anglophones. Pour le quatrième pattern, les étoiles correspondent à des clics zoulous.

1.4.2  Modèle  SLM  de  Flege  (Speech  Learning  Model)  

Contrairement au modèle PAM qui s’intéresse davantage aux contrastes, le modèle SLM (modèle d’apprentissage de la parole) de Flege traite de la perception de phonèmes isolés. Ce modèle a été développé pour expliquer les limites concernant la perception des phonèmes L2 chez les locuteurs bilingues. Contrairement aux autres modèles, il se focalise explicitement sur l’acquisition de la deuxième langue. Pour Flege, les mécanismes et les processus permettant la perception des phonèmes restent intacts tout au long de la vie. Ainsi de nouvelles catégories peuvent être créées ou les catégories existantes peuvent se modifier pour intégrer les nouvelles stimulations phonétiques.

Flege (1995) émet plusieurs hypothèses. Premièrement il défend l’idée que lorsque nous entendons un phonème non natif, nous allons le mettre en

relation avec l’allophone le plus similaire appartenant à la langue native.

C’est sur la base d’indices acoustiques que les individus arrivent à mettre en relation le phonème non natif et l’allophone L1 le plus similaire. Dans sa deuxième hypothèse, Flege prétend qu’une nouvelle catégorie peut être créée si le locuteur perçoit une différence entre le phonème L2 et l’allophone L1. Plus les deux sons sont différents sur le plan acoustique, plus il y a de chance qu’une nouvelle catégorie apparaisse. Toutefois la catégorie nouvellement créée peut être différente de la catégorie d’un locuteur natif.

De plus, avec l’âge, la probabilité de pouvoir discriminer le phonème L2 et l’allophone L1 diminuerait et par conséquent la possibilité de créer de nouvelles catégories. Le fait de percevoir deux sons comme équivalents empêche la formation d’une nouvelle catégorie. Toutefois cela n’exclut pas une modification de la catégorie existante pour intégrer les nouvelles stimulations. Et finalement, selon la dernière hypothèse, la production d’un phonème non natif découle des représentations rattachées à la catégorie phonétique. La production dépend donc directement de la perception.

1.4.3  Le  modèle  DIVA  de  Guenther  (Directions  Into  Velocities  of  Articulators)  

Un troisième modèle qu’il me paraît intéressant de mentionner est le modèle DIVA (instructions pour la vitesse des articulateurs) de Guenther (1994, 2006). Il modélise la production de phonèmes natifs et son acquisition chez le bébé. Il explique également la différence dans la production de phonèmes chez le bébé et chez l’adulte. Bien que ce modèle ne traite pas des phonèmes non natifs, il nous permet d’émettre des hypothèses sur la production de ces phonèmes et sur les causes de la difficulté à les produire. Par ailleurs, le modèle DIVA présente un autre intérêt : tout comme dans les modèles PAM de Best et SLM de Flege, la production dépend largement de la perception.

Pour Guenther, c’est à la fois l’information acoustique et l’information somatosensorielle qui permettent au système de se régler et de produire les phonèmes natifs avec précision.

Le modèle DIVA est un réseau de neurones simulant la production de phonèmes, de syllabes et de mots (cf. figure 2). La production commence par l’activation d’une première représentation, la carte sonore de parole (speech sound map). A partir de là, deux systèmes de contrôle sont activés.

Le système proactif calcule les commandes motrices décrivant la position et la vitesse des articulateurs. Le deuxième système de contrôle est de type rétroactif. La carte sonore de la parole active des représentations auditives et somatosensorielles cibles. Lors de la production, ces représentations cibles sont comparées aux sensations auditives et somatosensorielles perçues. En cas de discordance, un signal est envoyé au contrôle moteur pour modifier la position et la vitesse des articulateurs.

Lors de l’acquisition de la parole, le bébé doit faire les liens entre différentes représentations : entre la carte sonore de la parole et les représentations auditives et somatosensorielles, ainsi qu’entre ces représentations et les positions articulatoires. Ces deux types d’apprentissage s’effectuent grâce au babillage de l’enfant et aux feedbacks qui en résultent.

Au cours du développement langagier le contrôle moteur est d’abord effectué par le système rétroactif. Le système proactif va se régler petit à petit en intégrant les corrections, rendant la production automatique et le contrôle rétroactif accessoire. Par conséquent, lorsque nous parlons, nous activons directement la représentation du phonème à produire et le programme moteur correspondant, sans faire appel au feedback.

Il est donc possible que, lorsque nous devons produire un phonème non natif, nous le produisons en utilisant une carte sonore de parole existante sans faire appel au système de rétrocontrôle pour se corriger.

Figure 2

Adaptation du modèle DIVA de Guenther (2006)

Documents relatifs