• Aucun résultat trouvé

CHAPITRE I. BASES THEORIQUES DE L’ASSIMILATION ET ETUDE PSYCHOLINGUISTIQUE12

2. M ODELES PSYCHOLINGUISTIQUES ET RECHERCHES EMPIRIQUES SUR LES VARIATIONS PHONOLOGIQUES .23

2.2. Etude psycholinguistique des variations phonologiques

Reconnaître la parole implique un processus d’accès au lexique durant lequel l’entrée sensorielle acoustique est mise en relation avec les représentations lexicales stockées en mémoire. Or, la présence de segments ayant subi des variations génère une ambiguïté dans le sens où l’identité sous-jacente du mot stimulus ne peut pas être directement extraite à partir des propriétés phonétiques présentes dans sa forme de surface. Tout modèle théorique sur la perception de la parole devrait alors expliquer de quelle manière le système perceptif est organisé afin d’assurer l’accès au lexique en dépit de la variation phonologique. Si la plupart des études psycholinguistiques se sont consacrées au phénomène d’assimilation, quelques recherches récentes ont également examiné d’autres types de variations phonologiques, comme les variations allophoniques (McClennan, Luce, & Charles-Luce, 2003 ; Sumner &

Samuel, 2005). Ces travaux ont permis aux chercheurs d’aborder, en particulier, des questions importantes liées à la nature des représentations lexicales. Avant d’aborder le cas particulier des interprétations avancées à propos de l’assimilation, nous examinerons ici très brièvement quelques recherches consacrées à d’autres sortes de variations phonologiques.

A titre d’exemple, on peut citer l’étude effectuée par McClennan et al. (2003). Ces auteurs ont examiné le statut de la variation allophonique du son battu [R] (flap) en anglais. Ce son battu représente la forme neutralisée et allophonique des consonnes intervocaliques /t/ et /d/. Un mot tel que [aRom] contenant un son battu est ambigu dans le sens où il peut donner lieu à deux interprétations : atom ou Adam. Des stimuli ayant des consonnes intervocaliques alvéolaires et non alvéolaires (bacon) ont été sélectionnés et présentés dans deux blocs expérimentaux. Tantôt les mots stimuli servaient d’amorce, tantôt ils servaient de cible. La tâche utilisée était celle de shadowing, pendant laquelle les mots stimuli sont présentés auditivement aux participants, qui doivent les répéter aussi rapidement que possible. Les résultats obtenus ont montré que, en ce qui concerne les stimuli « alvéolaires », les amorces hypoarticulées (i.e. celles contenant les sons battus) et hyperarticulées (e.g., /atom/) ont amorcé les cibles hypo- et hyperarticulés de façon aussi efficace. Quant aux stimuli non alvéolaires (bacon), les temps de production ont révélé que l’amorçage était le plus efficace quand l’amorce et la cible partageaient le même style articulatoire. Ces résultats suggèrent donc que, en présence d’une ambiguïté (i.e. les stimuli alvéolaires), des représentations intermédiaires étaient activées alors que, en absence de toute ambiguïté (i.e. les stimuli non

alvéolaires), seules les formes de surface permettent un accès efficace aux représentations lexicales correspondantes. Les auteurs ont suggéré que le degré d’activation des représentations intermédiaires peut également être modulé par la « profondeur » de traitement lexical. En effet, dans la tâche de décision lexicale dite « facile », dans laquelle étaient insérés des non-mots qui ne respectent pas les règles phonotactiques en anglais (e.g., thushthugde), les mots hypoarticulés n’ont pas amorcé leurs contreparties hyperarticulées, alors qu’un tel effet d’amorçage était observé dans une tâche de décision lexicale dite « difficile », dans laquelle des non-mots très semblables aux mots réels étaient insérés. Les auteurs ont avancé l’idée que l’accomplissement de cette dernière tâche nécessite une analyse lexicale plus approfondie. Cette complexité supplémentaire de la tâche rallonge le temps de traitement et permet ainsi aux représentations intermédiaires d’être activées.

Pour leur part, Sumner et Samuel (2005) ont étudié les conséquences perceptives d’une variation systématique qui consiste à transformer la consonne coronale finale /t/ en anglais. A part sa réalisation canonique, cette consonne peut être réalisée sous forme coarticulée glottalisée, ou, encore, sous forme glottalisée. Afin de savoir si les différentes formes de cette consonne perturbent ou non l’accès au lexique, ces auteurs ont conduit une expérience en utilisant une tâche d’amorçage sémantique dans laquelle les trois variantes étaient présentées comme amorce (e.g., flute) à une cible sémantiquement reliée (e.g., MUSIC). Les résultats ont montré que les trois variantes ont donné lieu à des effets d’amorçage sémantique similaires.

En revanche, dans une tâche d’amorçage à long terme, il y avait un avantage perceptif pour la forme canonique.

Le fait que les variations systématiques observées dans une langue soient motivées par les règles phonologiques qui lui sont propres a conduit certains auteurs à proposer que le traitement perceptif des variations est modulé par les mécanismes spécifiques à la langue en question. En ce qui concerne l’assimilation de lieu d’articulation en anglais par exemple, il est présupposé que l’auditeur de langue maternelle anglaise prend appui sur le contexte droit afin d’inférer la forme sous-jacente du segment assimilé, car il a des « connaissances implicites » des règles phonologiques de sa langue et sait donc qu’une consonne coronale peut prendre la forme labiale dans le contexte labial (alors qu’une labiale ne prend jamais la forme coronale).

On retrouve l’idée de la spécificité à la langue dans les théories qui se prononcent sur la nature des représentations, comme c’est le cas de la théorie de la sous-spécification.

2.2.1. Théorie de la sous-spécification et le modèle FUL

Dans leur étude sur le traitement perceptif du trait de nasalité vocalique en anglais et bengali, Lahiri et Marlsen-Wilson (1991) ont proposé une solution représentationnelle qui est censée être spécifique à la langue. Suivant la théorie phonologique de sous-spécification (Archangeli, 1988 ; Kiparsky, 1985), l’idée proposée est la suivante : certains traits phonologiques sont sous-spécifiés dans le lexique mental, ce qui veut dire qu’ils restent neutres par rapport à certaines dimensions dans la représentation sous-jacente. Il convient d’introduire ici la notion phonologique de la marque (markedness). Précédemment, il a été précisé que, selon SPE, chaque trait dispose de la valeur [+] ou [-]. Or, dans la théorie de la sous-spécification, une de ces valeurs est considérée comme étant la valeur dite marquée. Il en résulte que l’autre valeur non marquée est la valeur par défaut. La notion de la marque s’avère pertinente dans le sens où elle permet d’expliquer par exemple la fréquence d’occurrence de certains sons qui sont spécifiés dans une langue donnée. A l’inverse, la valeur non marquée correspond à des propriétés phonologiques plus générales. De ce fait, la sous-spécification des sons dans le lexique mental dépend à la fois à des contraintes spécifiques à la langue et à des contraintes universelles. Lahiri et Marslen-Wilson (1991) ont fourni des données empiriques qui sont en accord avec les propositions de la théorie de sous-spécification. Ces auteurs ont examiné le cas de la nasalité vocalique, un trait qui n’est pas contrastif en anglais (et donc sous-spécifié) alors qu’il est contrastif en bengali. Les résultats d’une tâche de dévoilement progressif (gating, cf. Grosjean, 1980) ont montré que toute trace de nasalité perçue était associée à la présence d’une consonne nasale par les auditeurs anglais. En revanche, les auditeurs bengalais associaient toute trace de nasalité à la présence des voyelles (même si des voyelles orales peuvent subir une assimilation nasale dans la présence des consonnes nasales).

L’approche de sous-spécification revêt peut-être sa forme la plus radicale avec le modèle FUL (Full Underspecified Lexicon), proposé par Lahiri et Reetz (2002)6. Suivant les principes de la sous-spécification, le modèle FUL postule que certains traits ne sont pas spécifiés dans le lexique mental. Le système perceptif analyse le signal de parole à la recherche des traits

6 Dans le cadre de la discussion sur les mécanismes cognitifs mis en jeu dans la perception de la parole assimilée, nous avons choisi de présenter le modèle FUL ici comme étant représentatif pour les modèles qui postulent l’existence des mécanismes de traitement perceptifs spécifiques à la langue. Si la discussion portait sur la nature des représentations des formes lexicales, il est évident que le modèle FUL s’inscrit dans le cadre abstractionniste, par opposition aux modèles de type épisodique / à exemplaires (cf. Klatt, 1979 ; Goldinger, 1998 ; voir aussi Nguyen, sous presse ; Hawkins, 2003 ).

acoustiques qui sont directement convertis en traits phonologiques. Ainsi, le traits phonologiques sont appariés avec les représentations stockées dans le lexique mental par une conversion triple : match (concordance), mismatch (disconcordance), ou no mismatch (absence de toute discordance, ce qui n’équivaut pas à « concordance »). D’après le modèle FUL, l’auditeur est parfois insensible aux variations présentées par le lieu d’articulation de certaines consonnes finales, dans la mesure où celles-ci ne sont pas spécifiées pour certains traits. A titre illustratif, dans la séquence where can Mister Bean be ?, la consonne coronale dans le nom propre Bean peut devenir une labiale en présence du contexte labial dans be, et être ainsi prononcée [bim]. A l’inverse, les règles phonologiques en anglais ne permettent pas la transformation d’une consonne labiale en coronale (lame duck Æ *[len] 7). Il est alors supposé qu’en anglais (et aussi en allemand), la place coronale est sous-spécifiée dans le lexique, ce qui donne lieu à une certaine tolérance vis-à-vis de la forme de surface : la forme coronale peut se transformer en labiale et cela ne gêne en rien le système perceptif. En revanche, la place labiale est spécifiée dans le lexique anglais, ce qui rend tout changement de lieu d’articulation impossible : la labiale ne se transforme jamais en coronale. En résumé, la sous-spécification est utile dans la reconnaissance de la parole, car elle permettrait aux auditeurs de pouvoir tolérer certaines variations qui sont motivées par les règles phonologiques de leur langue. On retrouve l’idée selon laquelle les mécanismes de traitement de la parole assimilée sont guidés par les règles spécifiques à la langue dans les travaux de Gaskell et collègues, comme nous allons le voir dans la section suivante.

3. L’

ASSIMILATION

!:

C A D R E S T H E O R I Q U E S E T R E C H E R C H E S