• Aucun résultat trouvé

Figure 4.5. : Représentation schématique du modèle de Seidenberg et McClelland (1989).

Le modèle fonctionne ensuite en deux étapes : une phase d'apprentissage et une phase de test. Durant la phase d'apprentissage, les auteurs utilisent un lexique composé de 2897 mots monosyllabiques anglais. L'apprentissage est divisé en "époques". A chaque époque, chaque mot a une chance d'être présenté au modèle proportionnelle à sa fréquence lexicale (Kucera & Francis, 1967). Lorsqu'il est sélectionné, le mot active l'ensemble des unités orthographiques

correspondant aux triplets de lettres le composant. Ces unités envoient ensuite leur activation au niveau des unités cachées, lesquelles excitent à leur tour les unités phonologiques. Le mo-dèle s'appuie finalement sur une procédure d'apprentissage utilisant un algorithme de rétro-propagation du gradient de l'erreur ("Back-rétro-propagation", Rumelhart, Hinton, & Williams, 1986). Cet algorithme compare l'activation obtenue au niveau des unités phonologiques à l'activation souhaitée et calcule une mesure de l'erreur produite. Cette erreur est ensuite utilisée pour ajuster le poids des connexions provenant des unités cachées, puis des unités orthogra-phiques. Cette procédure a pour effet de réduire l'erreur produite à chaque essai.

Après un certain nombre d'époques, le modèle est censé avoir appris les relations ortho-phonologiques présentes dans le lexique qui lui a été présenté et il est possible de passer à la seconde phase de test. On présente alors une entrée orthographique au modèle. L'activation passe ensuite jusqu'aux unités cachées et, enfin, aux unités phonologiques. On mesure alors, une fois encore, un score d'erreur. Ce score indique le niveau de performance du modèle pour un mot donné. Seidenberg et McClelland présentent dans la suite de leur article une série de simulations montrant que leur modèle à voie unique est capable de simuler notamment les effets de régularité/consistance ainsi que les interactions entre fréquence et régularité (Seiden-berg et al., 1984 ; Taraban & McClelland, 1987).

Malgré sa capacité à simuler un grand nombre de données expérimentales et plus particu-lièrement à rendre compte du problème de l'inconsistance grapho-phonémique, ce modèle a très vite été critiqué sur la question de la généralisation de son apprentissage et, donc, de la prononciation de non-mots. Besner, Twilley, McCann, et Seergobin (1990) ainsi que Col-theart et al. (1993) soulignent la faiblesse du modèle à cet égard. Ces auteurs utilisent une série de non-mots issue de l'étude de Glushko (1979) et montrent, par exemple, que le modèle produit seulement 69% de prononciations correctes contre 91% dans les conditions les plus difficiles pour les sujets humains. Seidenberg et McClelland (1990) répondent à cette critique en indiquant que leur modèle est limité dans ses capacités de généralisation à cause de l'échantillon lexical utilisé. Ce lexique réduit ne permettrait pas, selon eux, d'atteindre un ni-veau satisfaisant pour généraliser correctement l'ensemble des relations ortho-phonologiques. Il reste néanmoins que ce modèle semble bien limité, non pas de par sa faible expérience, mais bel et bien à cause de ses choix computationnels et surtout représentationnels. Une autre criti-que porte sur la manière dont le modèle simule des latences de prononciation. Seidenberg et

McClelland proposent en effet de déduire des latences de prononciation à partir des scores d'erreurs. Il semble toutefois improbable qu'une mesure du taux d'erreurs puisse être une mesure directe d'un temps de traitement.

En résumé, ce modèle propose la première version algorithmique d'un système de lecture à une voie. Il est capable, par ailleurs, d'apprendre les relations statistiques entre orthographe et phonologie, sans pour autant utiliser des représentations symboliques des codes orthographi-ques et phonologiorthographi-ques. Toutefois, ses capacités de généralisation à des non-mots sont mises en question et semblent révéler une carence importante de ce modèle. Le modèle de Seiden-berg et McClelland (1989) ne serait ainsi pas en mesure de résoudre convenablement le pro-blème de la prononciation des non-mots.

4.4. Coltheart et al., 1993

Alors que le modèle de Seidenberg et McClelland (1989) proposait une version du modèle schématique à une voie, le modèle de Coltheart et al. (1993) fournit une version prototypique et computationnelle du modèle à deux voies : le modèle à deux voies en cascade (DRC pour "Dual-Route Cascaded model"). Ce modèle propose l'implémentation d'un système de lecture composé d'une voie lexicale et d'une voie non-lexicale (Figure 4.6). La voie lexicale comprend la même structure que le MAI, à laquelle sont ajoutés un niveau de représentation phonologi-que des mots et un système sémantiphonologi-que (non-implémenté). Cette voie code toutes les corres-pondances ortho-phonologiques au niveau lexical ; elle permet donc de résoudre le problème de la régularité/consistance en stockant en mémoire lexicale la prononciation de chaque mot. La voie non-lexicale est constituée d'un système de conversion des graphèmes en phonèmes. Ce système comprend un ensemble de règles de conversion permettant d'associer chaque graphème au phonème avec lequel il a la relation la plus fréquente. Grâce à ce système sous-lexical, le DRC est en mesure de résoudre le problème de la prononciation des non-mots.

Comme nous l'avons déjà noté, plusieurs types de représentations peuvent être adoptés au niveau des conversions ortho-phonologiques (notamment le niveau de la rime). Cependant, le modèle de Coltheart et al. (1993) ne prend en compte que les unités graphèmes. Par ailleurs, ce modèle postule l'existence d'un mécanisme utilisant des règles et, ce, pour décrire des pro-cessus de perception. On peut ainsi se demander dans quelle mesure ce choix théorique est opportun pour rendre compte de processus de perception rapides et automatiques (un

sys-tème de règles étant généralement coûteux en temps de traitement). Enfin, ce modèle ne pos-tule plus l'indépendance des voies lexicales et non-lexicales mais des processus d'interaction entre ces deux systèmes. C'est, en effet, par l'interaction de ces deux voies qu'est produite la sortie phonologique au niveau du système phonémique. Par contre, la voie lexicale est censée être plus rapide et automatique que la voie non-lexicale. Dans des simulations récentes de ce modèle, cette hypothèse est implémentée en retardant le début de la procédure de conversion dans la voie non-lexicale (Rastle & Coltheart, 1998). De plus, alors que la voie lexicale fonc-tionne en parallèle, la voie non-lexicale foncfonc-tionne de manière sérielle. Cette hypothèse a été appuyée par le résultat d'une étude où Rastle et Coltheart (1994) obtiennent un effet de régu-larité d'autant plus fort que l'irrégurégu-larité se trouve en début de mot.

Le DRC fournit donc à la fois une description claire des différents composants hypothéti-ques du système de lecture mais également une description détaillée de leur organisation. Ce modèle résout, par ailleurs, le double problème de le consistance et de la production des non-mots. Il postule pour cela la présence de deux sous-systèmes ayant chacun une dynamique différente. De plus, par rapport aux pathologies telles que la dyslexie phonologique acquise (Beauvois & Derouesne, 1979 ; Funnel, 1983) ou la dyslexie de surface (Marshall & New-combe, 1973 ; McCarthy & Warrington, 1986 ; Patterson, Marshall, & Coltheart, 1985), il propose un cadre théorique capable de rendre compte de ces deux troubles du langage en les attribuant à des dysfonctionnements de l'une ou l'autre des deux voies de traitement.

Unités Lettres

Unités Mots Orthographiques

Système Sémantique Système de conversion

Graphèmes-Phonèmes Unités Mots Phonologiques Système Phonèmique Détecteurs de Traits

Stimulus