• Aucun résultat trouvé

Présentation du modèle

Production orale

5.1. Présentation du modèle

Plusieurs extensions du modèle d'activation interactive (MAI, McClelland & Rumelhart, 1981) ont été réalisées afin de simuler les performances de sujets dans différents protocoles expérimentaux (e.g., la tâche de décision lexicale : Grainger & Jacobs, 1996 ; Jacobs & Grainger, 1992). Ces études gardent l'architecture computationnelle du MAI et lui greffent des procédures propres à chaque protocole (cf. Chap. 4). Ainsi, ce modèle fait implicitement l'hypothèse que les propriétés phonologiques des mots participent de manière négligeable aux processus d'identification. Toutefois, face au grand nombre d'études empiriques indiquant une influence de la phonologie au cours de la lecture (voir Chap. 3), l'objectif de cette dernière extension est d'introduire des niveaux de représentations phonologiques au sein du MAI et de

spécifier leur lien avec les niveaux de représentations orthographiques. Pour cela, nous som-mes parti de la dernière version du MAI, le MROM (pour Multiple Read-Out Model, Grain-ger & Jacobs, 1996), version à laquelle nous avons ajouté un niveau de représentations pho-nologiques sous-lexicales et un niveau de représentations phopho-nologiques lexicales. Nous appelons ainsi cette dernière version, le MROM-p (voir la description schématique de la Fi-gure 5.1). Entrée visuelle Lettres Unités Phonologiques Niveau orthographique des mots Niveau phonologique des mots MROM Traits visuels

Figure 5.1. : Représentation schématique du MROM-p. La partie quadrillée en pointillés contient le modèle original sans phonologie (le MROM).

5.1.1. Structure interne

La réalisation d'un tel modèle suppose de résoudre tout d'abord la question de sa structure interne, c'est-à-dire, (1) le problème du format des représentations phonologiques et (2) le problème des relations entre orthographe et phonologie au niveau lexical et sous-lexical. Au niveau lexical, nous faisons l'hypothèse qu'à chaque représentation orthographique d'un mot correspond une représentation phonologique. Ainsi, par exemple, au mot TABLE, représenté au niveau orthographique, correspond la représentation phonologique /tabl/ au niveau phono-logique. Ces deux représentations sont reliées par des connexions excitatrices. L'activation d'une représentation orthographique ou phonologique entraîne l'activation de l'unité phonolo-gique ou orthographique associée. Dans le cas de mots homophones, comme par exemple les mots VOIX et VOIE, les deux représentations orthographiques distinctes sont connectées à la

même représentation phonologique, ici /vwa/. Le format des représentations lexicales phono-logiques est donc similaire à celui des représentations lexicales orthographiques, et les rela-tions entre ces deux représentarela-tions sont établies par des connexions bi-latérales. Le même type de codage, au niveau lexical, est adopté dans le modèle à deux voies de Coltheart et al. (1993).

Au niveau sous-lexical, la question du format des représentations phonologiques est indis-sociable de la question des relations entre représentations phonologiques et orthographiques sous-lexicales. Dans le modèle de Coltheart et al. (1993), les relations entre unités orthogra-phiques (lettres) et unités phonologiques (phonèmes) sont matérialisées par un système de règles de correspondance entre graphèmes et phonèmes. Ce système de règles est toutefois très différent, d'un point de vue computationnel, d'un système d'activation interactive. Il fonc-tionne notamment de manière sérielle de la gauche vers la droite et suggère d'appliquer une procédure de recherche de règle de type machine de Turing (pour plus de détails : Rastle & Coltheart, 1998). Contrairement à ce modèle, notre objectif est de garder une structure homo-gène du point de vue des choix computationnels, c'est-à-dire de garder les principes computa-tionnels du modèle d'activation interactive. En d'autres termes, notre objectif est de trouver un système permettant de mettre en correspondance les unités orthographiques de base, i.e., les lettres, et les unités phonologiques de base, i.e., les phonèmes, par l'intermédiaire d'un réseau de connexions, en gardant le principe général de propagation de l'activation ("spreading of activation"). Or, du fait de l'absence d'isomorphisme entre orthographe et phonologie (i.e., le nombre de lettres est rarement égal au nombre de phonèmes au sein d'un même mot), ce type de connectivité est impossible pour des langues comme l'Anglais ou le Français car il ne peut répondre à la flexibilité des relations entre orthographe et phonologie.

De plus, ce type de codage ne peut résoudre ce que Plaut et al. (1996) appellent le pro-blème de la dispersion ("the dispersion problem" : Plaut et al., 1996, p.64). En effet, un tel système de correspondances sous-lexicales ortho-phonologiques doit être en mesure d'asso-cier certaines lettres ou groupes de lettres à certains phonèmes, indépendamment de la posi-tion de ces lettres. Il doit être également en mesure de retrouver les régularités ortho-phonologiques d'une langue et de généraliser cette connaissance à n'importe quelle séquence de lettres et quelle que soit la position des lettres. Aussi, un système composé de lettres et

phonèmes reliés par un réseau de connexions va-t-il pouvoir associer une ou des lettres à un phonème donné, lorsque la ou les lettres se trouvent à une position spécifique.

Par exemple, ce type de système peut apprendre à associer les lettres AI au phonème /E/, lorsque A et I se trouvent respectivement à la première et seconde positions d'un mot (comme dans AIDE, AIRE, AILE ou AISE). En revanche, le réseau ne peut pas généraliser cette connaissance à l'ensemble des positions ; sa connaissance sera liée à la position des lettres AI dans la séquence de lettres. Ainsi, ce système ne peut nullement retrouver et activer le pho-nème /E/ dans le non-mot DAIP, par exemple. Un codage basé sur des lettres et phonèmes, au sein d'un modèle d'activation interactive, ne fournit donc pas une solution satisfaisante à la question des rapports entre orthographe et phonologie au niveau sous-lexical.

Afin de "minimiser" le problème de la dispersion (et non de le résoudre), Plaut et al. (1996) adoptent un système de représentation plus structuré. Ils suggèrent de segmenter la syllabe en unités onset/noyau/coda au niveau orthographique et phonologique. Nous avons également choisi d'opter pour une telle structuration des représentations mais au niveau pho-nologique uniquement. C’est pourquoi les représentations sous-lexicales phopho-nologiques dans le MROM-p s'organisent en trois groupes : les onsets (groupe des consonnes initiales), les noyaux (groupe voyelle) et les codas (groupe des consonnes finales). Cette solution, à l'instar de Plaut et al. (1996), minimise également le problème de la dispersion en limitant et structu-rant les connexions possibles entre lettres et unités phonologiques8. La connectivité entre lettres et unités phonologiques est établie ensuite en codant les liens entre chaque lettre ren-contrée dans le lexique utilisé (i.e., CELEX : Baayen, Piepenbrock, & van Rijn, 1993) et cha-que unité phonologicha-que correspondante. Le codage est dépendant de la position de la lettre dans le mot et aussi de la position de l'unité phonologique.

En résumé, la structure interne du MROM-p est définie par deux nouveaux niveaux de représentation phonologiques : un niveau lexical comprenant la représentation phonologique de l'ensemble des mots du lexique utilisé et un niveau sous-lexical divisé en unités phonolo-giques onset-noyau-coda.

8 On ne parle plus alors d'unités phonèmes mais d'unités phonologiques. En effet, un onset, par exemple, peut être composé de plus d'un phonème, comme dans TRAIN (onset = /tr/).

5.1.2. Dynamique

La question de la dynamique d'un modèle est liée à la question des paramètres libres régis-sant notamment le poids des connexions entre les différents niveaux de représentation. En effet, outre ses différents niveaux de représentation, le MROM-p est composé de connexions reliant ces différents niveaux. Ces connexions peuvent être soit excitatrices, soit inhibitrices. La nature excitatrice ou inhibitrice des connexions, ainsi que le poids des connexions, sont déterminés par des paramètres libres qui fixent la nature des interactions entre niveaux de représentations. Déterminer la valeur de ces paramètres revient à donner une certaine dynami-que au modèle, c'est-à-dire un poids différent à chadynami-que interaction. Comme nous l'avons vu au chapitre précédent, des variations de certains paramètres peuvent entraîner des changements importants dans le comportement global du modèle. Le choix de ces paramètres semble donc crucial, bien qu'aucune règle ne soit donnée pour optimiser ce choix.

Afin de tester le MROM-p, nous avons adopté une stratégie en cinq étapes. La première étape a consisté à trouver un ensemble de paramètres pour lequel le MROM-p est en mesure de simuler un effet phonologique robuste : l'effet de pseudohomophonie. L'objectif, ici, est de parvenir à une activation lexicale plus importante lorsqu'un pseudohomophone est présenté au modèle par rapport à un contrôle orthographique. La Figure 5.1 donne un exemple de simu-lation de l'activation de la représentation phonologique d'un mot à partir d'un pseudohomo-phone, par rapport à un contrôle orthographique.

0 5 10 15 20 0 5 10 15 20 25 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 FEEL Activation Cycle Numéro de l'unité

Pseudohomophone: FEAL

FEEL Activation Cycle Numéro de l'unité 0 5 10 15 20 0 5 10 15 20 25 -0.2 -0.1 0 0.1 0.2 0.3 0.4