• Aucun résultat trouvé

Disponible à / Available at permalink :

N/A
N/A
Protected

Academic year: 2021

Partager "Disponible à / Available at permalink :"

Copied!
462
0
0

Texte intégral

(1)

- - -

- - -

Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository

Thèse de doctorat/ PhD Thesis Citation APA:

Lange, M. (2000). De l'orthographe à la prononciation: nature des processus de conversion graphème-phonème dans la reconnaissance des mots écrits (Unpublished doctoral dissertation). Université libre de Bruxelles, Faculté des Sciences psychologiques et de l'éducation, Bruxelles.

Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/211741/1/777f2cdc-a56b-4a9a-b3f8-8c21f995ea89.txt

(English version below)

Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université (di-fusion@ulb.be).

Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.

DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :

Le nom des auteurs, le titre et la référence bibliographique complète soient cités;

L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;

Le contenu ne soit pas modifié.

L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.

--- English Version ---

This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University (di-fusion@ulb.be).

If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.

DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.

Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:

The authors, title and full bibliographic details are credited in any copy;

The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;

The content is not changed in any way.

It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.

(2)

U N I V E R S I T é L I B R E D E B R U X E L L E S

F a c u l t é d e s S c i e n c e s P s y c h o l o g i q u e s e t d e l ' E d u c a t i o n

L a b o r a t o i r e d e P s y c h o l o g i e E x p é r i m e n t a l e

De l'orthographe à la prononciation: Nature des processus de conversion graphème-phonème

dans la reconnaissance des mots écrits

D i s s e r t a t i o n

présentée en v u e d e l'obtention d u grade de D o c t e u r e n Sciences Psychologiques, p r é p a r é e s o u s la direction d e M o n s i e u r A. C o n t e n t

M a r i e U e L a n g e

M a r s 2 0 0 0

(3)

Le. moyen k plus sûr de ne pas se tromper est de miner certitude après certitude.

H n'en demeure pas moins que tout u qui compte fut fait en ife/iorsdu doute.

Cioran, Tle Ûinconvénient d'être né

(4)

R E M E R C I E M E N T S

C e travail de thèse a été réalisé sous la direction d'Alain C o n t e n t . Je le r e m e r c i e p o u r son a i d e , ses c o n s e i l s et la qualité d e ses c r i t i q u e s qui ont b e a u c o u p a p p o r t é à c e travail. Je lui suis r e c o n n a i s s a n t e p o u r a v o i r su rester d i s p o n i b l e tout en m e laissant a u t o n o m i e et i n d é p e n d a n c e . Je r e m e r c i e é g a l e m e n t le F N R S p o u r m'avoir a c c o r d é un m a n d a t d'Aspirant qui m'a p e r m i s de réaliser c e travail.

J e r e m e r c i e S t e p h e n M o n s e l l , p o u r m ' a v o i r a c c u e i l l i e un an ( O c t o b r e 1 9 9 6 - S e p t e m b r e 1 9 9 7 ) au L a b o r a t o i r e d e P s y c h o l o g i e E x p é r i m e n t a l e de l'Université de C a m b r i d g e ( A n g l e t e r r e ) et la F o n d a t i o n W i e n e r - A n s p a c h p o u r m ' a v o i r o c t r o y é u n e b o u r s e finançant c e s é j o u r . C e t t e a n n é e a p o u r m o i é t é p a r t i c u l i è r e m e n t stimulante; aussi riche en amitiés qu'en c o n n a i s s a n c e s nouvelles. C'est là q u e les b a s e s de ce travail.

J e r e m e r c i e les m e m b r e s du j u r y , A s s a a d E. Azzi, M a r c B r y s b a e r t , Daniel H o l e n d e r , G u y K a m a s , et R o n a l d P e e r e m a n d ' a v o i r a c c e p t é d ' é v a l u e r ce travail. P o u r D a n i e l , j'espère q u e l ' i m p a t i e n c e qu'il a m o n t r é à lire ce travail p a r d o n n e r a les i m p e r f e c t i o n s qu'il pourrait y trouver.

M e s r e m e r c i e m e n t s vont é g a l e m e n t aux m e m b r e s d e m o n c o m i t é d ' a c c o m p a g n e m e n t d e l ' E c o l e D o c t o r a l e en S c i e n c e s C o g n i t i v e s (EDSC): Sally A n d r e w s , A x e l C l e e r e m a n s , R o n a l d P e e r e m a n (et A l a i n C o n t e n t ) p o u r leur intérêt s o u v e n t e x p r i m é d a n s m o n travail ainsi que p o u r les c o n s e i l s et l'assistance d o n t ils m ' o n t fait b é n é f i c i e r à d i f f é r e n t s m o m e n t s de la thèse. Ils vont aussi à M o n i q u e , V i r g i n i e , M m e D o n n e r , E v e l i n e , et Patricia, les s e c r é t a i r e s du l a b o ou de la f a c u l t é , p o u r leur a i d e logistique et la très g r a n d e qualité de leur accueil. Ils v o n t e n c o r e à un être abstrait, l'Internet p o u r les facilités extraordinaires qu'il o f f r e d a n s le contexte de la r e c h e r c h e .

J e tiens é g a l e m e n t à e x p r i m e r m a g r a t i t u d e à J o s i a n e L e c h a t ainsi q u e N i c o l a s D u m a y p o u r leur contribution à c e r t a i n e s e x p é r i e n c e s . Je tiens aussi à r e m e r c i e r les m e m b r e s du labo dans leur e n s e m b l e et p l u s s p é c i a l e m e n t A x e l e n c o r e , C a t h y , C é c i l e , D a n i e l , C a t h e r i n e T . , J a c q u e l i n e , K a t i a , M a u d , N a t h a l i e , N i c o l a s D D , Nicolas D e n c o r e , et Vincent, p o u r leur aide, leur relecture de certaines partie d e cette t h è s e , le s o u t i e n m o r a l q u ' i l s m ' o n t p r o d i g u é , les d i s c u s s i o n s e n r i c h i s s a n t e s , les d i s c u s s i o n s m a r r a n t e s , les b l a g u e s par mail, et b e a u c o u p de c h o s e s e n c o r e . P a r m i ceux-ci, N i c o l a s D. e n c o r e , p o u r qui j ' e n v i e n s à m e d e m a n d e r s'il p a r t a g e v r a i m e n t m o n b u r e a u tant il a fait attention à ne p a s m e d é r a n g e r p e n d a n t la p é r i o d e d e r é d a c t i o n . Je crois q u e s'il était possible de t a p e r au clavier a v e c d e s m o u f f i e s , il l'aurait fait p o u r e s s a y e r d e f a i r e e n c o r e m o i n s d e bruit. J e v o u d r a i s e n c o r e r e m e r c i e r q u e l q u e s a m i s m é r i t a n t s qui ont insisté p o u r m e c h a n g e r les idées, et en particulier A g n è s , et P a s c a l e ; é g a l e m e n t les a m i s du volley, q u e j'ai l â c h e m e n t d é l a i s s é s c e s derniers m o i s . J e les r e t r o u v e r a i a v e c plaisir. Merci à R a y m o n d aussi p o u r son intérêt persistant d a n s rngj].li4vail.

(5)

tl

Remerciements

E n f i n , merci à m a f a m i l l e , m o n père, A g n è s , sa f e m m e , et surtout m a m è r e d ' a b o r d p o u r le t e m p s c o n s a c r é aux corrections o r t h o g r a p h i q u e s , m a i s surtout p o u r le t e m p s consacré à m e c h a n g e r les idées. A n o u v e a u , un é n o r m e m e r c i à m a m è r e , p o u r son soutien discret, mais o m n i p r é s e n t . M e r c i aussi à Leïla, m o n petit bout d e nièce n é e d a n s le c o u r a n t d e cette thèse, p o u r ses sourires craquants, p o u r m e rappeler qu'il y a d é f i n i t i v e m e n t d e s millions d e c h o s e s plus i m p o r t a n t e s que la recherche dans la vie.

(6)

R É S U M É

D a n s des l a n g u e s a l p h a b é t i q u e s telles que le f r a n ç a i s o u l'anglais les relations entre l ' o r t h o g r a p h e et la p h o n o l o g i e s o n t le p l u s s o u v e n t s u f f i s a m m e n t p r é v i s i b l e s p o u r qu'il soit p o s s i b l e d e p r o d u i r e la p r o n o n c i a t i o n c o r r e c t e d ' u n e c h a î n e de caractères à partir d e s lettres constituantes. D a n s ce travail, n o u s n o u s i n t e r r o g e o n s sur la m a n i è r e d o n t cette c o n n a i s s a n c e d e s relations o r t h o g r a p h e - s o n de la l a n g u e est e n c o d é e ainsi q u e sur la nature du m é c a n i s m e de t r a n s c o d a g e qui la manipule.

A l o r s q u e c e r t a i n s auteurs r e m e t t e n t en question la n é c e s s i t é d ' u n e différenciation f o n c t i o n n e l l e e n t r e un m é c a n i s m e qui a s s u r e r a i t le t r a n s c o d a g e p h o n o l o g i q u e d ' u n e chaîne et celui qui a s s u r e r a i t la récupération r a p i d e de la prononciation d e s m o t s à partir d ' u n e identification lexicale, la p r e m i è r e partie, présentant u n e revue critique d e la littérature, montre que si les é t u d e s actuelles p e r m e t t e n t d e c o n c l u r e à l ' e x i s t e n c e d ' u n e c o n n a i s s a n c e s p é c i f i q u e d e s r é g u l a r i t é s o r t h o g r a p h e - s o n d e la l a n g u e et d ' u n m é c a n i s m e a u t o n o m e de t r a n s c o d a g e , peu d'entre elles, c e p e n d a n t , permettent de d o n n e r d e s i n d i c a t i o n s sur la nature e x a c t e de cette c o n n a i s s a n c e . Par e x e m p l e , a u c u n e ne permet de d é m o n t r e r l ' i n a d é q u a t i o n de l ' h y p o t h è s e , p o u r t a n t f o r t e m e n t d i s p u t é e , d'une c o n n a i s s a n c e d e s régularités qui p r e n d r a i t la f o r m e d'un s y s t è m e d e r è g l e s t o u t - o u - r i e n s t r i c t e m e n t g r a p h è m e - p h o n è m e (où un p h o n è m e est un son d u l a n g a g e et un g r a p h è m e la lettre ou g r o u p e de lettre qui le retranscrit; e.g., c h d a n s chou) où p o u r c h a q u e g r a p h è m e s seule la c o r r e s p o n d a n c e la plus f r é q u e n t e est c o d é e .

U n des p r é r e q u i s p o u r é v a l u e r la validité des h y p o t h è s e s relatives à la nature d e s r e p r é s e n t a t i o n s et d e s p r o c e s s u s qui i n t e r v i e n n e n t lors du t r a n s c o d a g e d e l ' o r t h o g r a p h e en sa p h o n o l o g i e est l'accès à d e s d o n n é e s statistiques relatives aux associations g r a p h è m e - p h o n è m e pour une sélection et un c o n t r ô l e d u matériel e x p é r i m e n t a l . P o u r g a r a n t i r cet accès, la d e u x i è m e partie introduit une d e s c r i p t i o n s t a t i s t i q u e des a s s o c i a t i o n s g r a p h è m e - p h o n è m e du f r a n ç a i s et de l'anglais. Elle fournit en outre une d e s c r i p t i o n et u n e c o m p a r a i s o n d e s s y s t è m e s d ' a s s o c i a t i o n o r t h o g r a p h e - s o n d u français et de l'anglais à d i f f é r e n t s n i v e a u x d ' a n a l y s e p r o c h e s du g r a p h è m e (associations lettre-son plutôt que g r a p h è m e - p h o n è m e ; prise en c o m p t e ou non d e s c o n t e x t e s qui i n f l u e n c e n t de m a n i è r e s y s t é m a t i q u e la prononciation, c o m m e p o u r le c qui suivi d e e, i, y se p r o n o n c e t o u j o u r s /s/; estimation d e l'ambiguïté du d é c o u p a g e de certains g r o u p e s d e lettres en g r a p h è m e s c o m m e a n qui c o r r e s p o n d à d e u x unités d e prononciation d a n s c.a.n.e et à u n e d a n s c.an.t.on, etc.) d e m a n i è r e à d o n n e r une i n d i c a t i o n sur la prédictibilité de la p r o n o n c i a t i o n d e s g r a p h è m e s en d e ç à et au delà de celle c a p t u r é e par nos tables.

C e t t e a n a l y s e a servi de f o n d e m e n t a u x t r a v a u x e m p i r i q u e s de la t r o i s i è m e partie. L e s q u a t r e s p r e m i è r e s é t u d e s , qui c o n c e r n e n t la n a t u r e d e s r e p r é s e n t a t i o n s , invalident, p o u r la p r e m i è r e f o i s d e m a n i è r e n o n - é q u i v o q u e , l ' h y p o t h è s e de règles g r a p h è m e - p h o n è m e tout-ou-rien et c o n v e r g e n t v e r s la c o n c e p t u a l i s a t i o n d u s y s t è m e d e c o n n a i s s a n c e d e s r é g u l a r i t é s o r t h o g r a p h e - s o n c o m m e u n r é s e a u

(7)

IV

Résumé

a s s o c i a t i f qui r e f l è t e aussi bien u n e c o n n a i s s a n c e de l'existence de p r o n o n c i a t i o n s alternatives que la p r o b a b i l i t é de c h a q u e p r o n o n c i a t i o n d ' u n g r a p h è m e . L e s six d e r n i è r e s , qui c o n c e r n e n t la nature d u p r o c e s s u s d e t r a n s c o d a g e de l ' o r t h o g r a p h e e n sa p h o n o l o g i e , i n f i r m e n t l ' h y p o t h è s e a c t u e l l e d'un t r a n s c o d a g e lettre-après-lettre d'une c h a î n e d e caractères et favorisent plutôt un t r a i t e m e n t prenant place d a n s u n e a r c h i t e c t u r e p a r a l l è l e d a n s l a q u e l l e il y a t r a i t e m e n t s i m u l t a n é d e s d i f f é r e n t e s lettres d'un g r a p h è m e ; en m ê m e t e m p s , elles i n v a l i d e n t u n e autre h y p o t h è s e actuelle, c o m p l è t e m e n t o p p o s é e à la p r e m i è r e , d ' u n t r a n s c o d a g e p h o n o l o g i q u e t r a d u i s a n t d e m a n i è r e s y n c h r o n e t o u s les c a r a c t è r e s d'une c h a î n e en leurs associés p h o n é m i q u e s .

E n s o m m e , n o s r é s u l t a t s ne s o u t i e n n e n t d e m a n i è r e f e r m e a u c u n d e s m o d è l e s a c t u e l s de la d é n o m i n a t i o n des m o t s écrits. Ils établissent plutôt le besoin de poursuivre la d é m a r c h e qui a été la nôtre d e n o u s d é t a c h e r de la t e n d a n c e a c t u e l l e à p o r t e r l ' é v a l u a t i o n au n i v e a u d e s p e r f o r m a n c e s d ' u n e r é a l i s a t i o n c o m p u t a t i o n n e l l e d ' u n e t h é o r i e p o u r e s s a y e r p l u t ô t d e t r a n c h e r e n t r e d e s h y p o t h è s e s t h é o r i q u e s , s o u v e n t a n t a g o n i s t e s , é m i s e s par les t h é o r i e s qui les d é f i n i s s e n t . Il a p p a r a î t , en e f f e t , étant d o n n é l'état actuel d e n o s c o n n a i s s a n c e s q u a n t a u x r e p r é s e n t a t i o n s et p r o c e s s u s i m p l i q u é s dans le t r a n s c o d a g e de l ' o r t h o g r a p h e en sa p h o n o l o g i e , bien plus i m p o r t a n t de d é f i n i r d e s c o n t r a i n t e s sur les m o d è l e s actuels de la d é n o m i n a t i o n d e s m o t s écrits q u e de c h e r c h e r à d é s i g n e r un v a i n q u e u r u n i q u e p a r m i ceux-ci.

(8)

T A B L E D E S M A T I è R E S

I N T R O D U C T I O N 1

P A R T I E I

R E V U E C R I T I Q U E D E L A L I T T É R A T U R E 9

C H A P I T R E 1

L E S M O D è L E S D E L A P R O N O N C I A T I O N D E S M O T S é C R I T S E T L E U R é V O L U T I O N 1 3

1. MODèLES SYMBOLIQUES DES ANNéES 7 0 - 8 0 13 / . / . Modèles à deiLX voies /-î

1.2. Critiques du modèle à deiLX voies /8 1.3. Modèles unitaires 22

Modèles d'analogie lexicale 23 Modèles d'activalion-synlhèse 24

1.4. Modèles à systèmes de codage parallèles et à niveau.x multiples d'association 26 2. MODèLES à TRAITEMENT PARALLèLE DISTRIBUé 3 3

2. /. NETtalk (Sejnowski et Rosenberg. 1986) 34

2.2. Modèle distribué de la reconnaissance et de la dénomination des mots (Seidenberg et McClelland.

1989) 35 Description 35 Simulations 38

Dénimùmiiitm de mots (erreur phonohgiifue) ^9 Décision le.xiaile ierreur orthographique) 'fO Développetnent 40

2.3. Critiques du modèle conne.xionniste de la dénomination 41

3 . DéVELOPPEMENT DE MODèLES COMPUTATIONNELS DE NATURES DIVERSES 4 5

4 . SYNTHèSE 51

C H A P I T R E 2

M O D è L E S C O M P U T A T I O N N E L S A C T U E L S D E L A D é N O M I N A T I O N 5 3

1. CONTRIBUTIONS ET LIMITES DE L'APPROCHE COMPUTATIONNELLE 5 5

2. CARACTéRISTIQUES COMMUNES DES MODèLES 6 5 2.1. Dynamique des systèmes 65

(9)

Table des matières

2.2. Influence des voisins lexicau.x sur la prononciation d'une chaîne 68 2.3. Intenention des codes sémantiques dans la prononciation <59

2.4. Activation en retour des représentations lexicales phonologiques, sémantiques à partir des codes phonologiques

3. D R C — MODèLE à DEUX VOIES EN CASCADE (COLTHEART ET COLLèGUES, 1 9 9 3 à 1 9 9 9 ) 7 3 3.1. Description du modèle 74

3.2. Simulations 7S

4 . P M S P — MODèLE CONNEXIONNISTE à VOIE DE TRANSCODAGE UNIQUE (PLAUT ET COLLèGUES, 1 9 9 3 À 1 9 9 6 ) 81 4.1. Description du modèle

4.2. Simidations ^'^

5 . A C V — MODèLE CONNEXIONNISTE DE MéMOIRE à TRACES MULTIPLES ( A N S ET COLLABORATEURS, 1 9 9 6 à 1998) 87

5. /. Description du modèle ^7 5.2. Simulations ^2

6. Z H B — MODèLE CONNEXIONNISTE à DEUX VOIES (ZORZI ET COLLABORATEURS, 1 9 9 8 à 1 9 9 9 ) 9 5 6.1. Description du modèle

6.2. Simulations 9^

7. SYNTHèSE DES MODèLES ' 0 '

C H A P I T R E S

N A T U R E DE LA CONNAISSANCE UTILISéE AU COURS DE LA CONVERSION 1 0 3 1. SOURCE DE CONNAISSANCE SPéCIFIQUEMENT INFRA-LEXICALE 1 0 5

/ . / . La question du nombre de voies de traitement 106

1.2. L'explication des dyslexies suggère l'atteinte sélective de 3 sources de connaissance: sémantique, t lexicale, et infra-lexicale

1.3. Une source de connaissance unique ne simule pas les effets de régularité bas niveau 114 2 . NATURE DES REPRéSENTATIONS INFRA-LEXICALES 1 ' 9

2.1. Sensibilité à la consistance de la prononciation des formes orthographiques visuellement similaires

120 Prédominance de la rime 1^1

Sensibilité à la consistance plus importante que celle prédite par DRC 123 Question de l'origine lexicale ou infra-lexicale des effets de consistance 127 2.2. Régularités graphème-phonème: règles tout-ou-rien ou associations 129

Sensibilité des lecteurs aux fréquences d'occurrence des événements 130 Activation d'associations minoritaires '32

Degré de régularité graphème-phonème 136 3. SYNTHèSE 1 3 9

(10)

C H A P I T R E 4

N A T U R E D U M é C A N I S M E D E T R A N S C O D A G E P H O N O L O G I Q U E 1 4 3

1. MéCANISME SPéCIFIQUE POUR LE TRANSCODAGE PHONOLOCIQUE 1 4 5

2. NATURE DU PROCESSUS DE TRANSCODAGE 148

2. /. Transcodage gourmand en ressources attentionnelles 149 2.2. Transcodage sous contrôle stratégique 154

Modulation de l'assemblage? '56 Contrôle stratégique? '58 Mécanisme distinct? '62 2. S. Transcodage lent et tardif 164 2.4. Transcodage de nature séquentielle 165

Avant propos — Critère qui préside à l'initiation d'une réponse (préparation et initiation de la prononciation).. 165 Problème de la généralisation aux mots polysyllabiques 168

Effet de longueur de chaîne 169

Effets variables en fonction de la position gauche-droite d'un segnYent orthographique dans 171 la chaîne '^2

Effet de lu position du serment irrégulier. '72 Effet de la ftosilion dam une tâche Stroop 175 2.5. Traitement lettre-après-lettre du transcodage 176 3. SYNTHèSE ' 8 1

C H A P I T R E 5

S Y N T H è S E G é N é R A L E E T A P P R O C H E M é T A T H é O R I Q U E 1 8 3

1. ANALYSE COMPUTATIONNELLE ' 8 5

2. CONTRIBUTION EXPéRIMENTALE 1 8 6

Représentations: Règles tout-ou-rien ou associations? 186 Processus: Séquentiel et lettre-après-lettre? 186 3. SIMULATION P D P 1 8 7

(11)

P A R T I E I I

D E S C R I P T I O N S T A T I S T I S T I Q U E D E S A S S O C I A T I O N S G R A P H È M E - P H O N È M E D U F R A N Ç A I S E T D E L ' A N G L A I S 1 8 9

CHAPITRE 1 INTRODUCTION 1 9 5

CHAPITRE 2

INVENTAIRE DES ASSOCIATIONS GRAPHèME-PHONèME DU FRANçAIS ET DE L ' A N G L A I S ... 2 0 1 1. CHOIX MéTHODOLOGIQUES GéNéRAUX 205

/ . / . Graphème silencieux 2 0 5 1.2. Régularités contextuelles 2 0 7

Variations de la prononciation des voyelles anglaises en fonction des valeurs d'accent 209 Régularités liées au contexte orthographique et phonologique 210

Manière dont ces régularités contextuelles sont indiquées dans les tables 21 2 2. DéFINITION DES GRAPHèMES ET ASSOCIATIONS 21 7

2.1. Corpora 2 / 7

Corpus français 217 Corpus anglais 218

2.2. Algorithme utilisé pour isoler les associations 219

2.3. Aperçu des graphèmes et associations qui composent nos tables 224 Graphèmes muets 2 2 4

Graphèmes associés à des groupements de phonèmes (graphèmes multisons) 225 Graphèmes multilettres 227

Graphèmes disjoints 228

Marquage des contraintes contextuelles 229 Codes de marquage communs aux deux langues 229 Codes de marquage pour le français 229

Codes de marquage pour l'anglais 230 3. DéCOMPTE DES FRéQUENCES D'ASSOCIATION 233

4. ESTIMATIONS DE LA PRéDICTIBILITé DE LA PRONONCIATION 235 4.1. Estimations graduelles pour les graphèmes et les associations 235 Mesures liées aux associations graphème-phonème 236 Mesures liées aux graphèmes 236

4.2. Evaluation de la prédictibilité de ta prononciation d'une table d'associations 238 4.3. Estimations de la régularité d'une chaîne 240

(12)

Table des maliens

C H A P I T R E 3

D E S C R I P T I O N S T A T I S T I Q U E D E S A S S O C I A T I O N S G R A P H è M E - P H O N è M E D U F R A N ç A I S E T D E L ' A N G L A I S 2 4 3

1. STATISTIQUES DESCRIPTIVES 2 4 3

2. TABLES DES ASSOCIATIONS GRAPHèME-PHONèME 2 4 7 2.1. Table des associations graphème-phonème du français 247 2.2. Table des associations graphème-phonème de l'anglais 252 3 . COMPARAISON FRANçAIS-ANGLAIS 2 5 7

3.1. Régularité des correspondances graphème-phonème pour les mots 257

3.2. Régularité des associations dans les deux langues pour différents niveaux d'analyse 259

4 . EVALUATION DE LA COHéRENCE DU SYSTèME ISSU DE NOS ANALYSES PAR RAPPORT à D'AUTRES CHOIX MéTHODOLOGIQUES 2 6 3

4.1. Economie descriptive de différentes analyses des relations graphème-phonème 263

4.2. Conséquences des choix de segmentation sur la définition de régularité induite à partir des tables 265

C H A P I T R E 4

A M B I G U ï T é S D A N S L A P R O N O N C I A T I O N D ' U N G R A P H è M E N O N C A P T U R é E S D A N S N O S T A B L E S 2 6 7

1. AMBIGUïTé DE LA SEGMENTATION 2 6 9 / . / . Probabilité de segmentation en graphème 270 1.2. Densité des graphèmes multilettres dans les mots 273

2. AMBIGUïTéS DANS LA PRONONCIATION D'UN GRAPHèME PRéALABLES à LA PRISE EN COMPTE DE CONTRAINTES CONTEXTUELLES 2 7 7

3 . CONTRAINTES CONTEXTUELLES NON PRISES EN COMPTE DANS NOS ANALYSES 2 8 1

C H A P I T R E 5

C O N C L U S I O N E T D I S C U S S I O N 2 8 7

(13)

,\7

P A R T I E I I I

E T U D E S E M P I R I Q U E S 2 9 5

CHAPITRE 1

N A T U R E DES RELATIONS G R A P H è M E - P H O N è M E : R è G L E S OU ASSOCIATIONS? 2 9 9 EXPéRIENCE 1 : RéGULARITé GRAPHèME-PHONèME POUR DES MOTS DISSYLLABIQUES ANGLAIS 3 0 1

Experiment la - Preliminary sélection and subjective ratings S03 Method 3 0 4

Results 305

Experiment Ib - Immédiate Naming ^06 Method 3 0 6

Results 3 1 0

Experiment le - Delayed Naming 311 Method 3 1 2

Results 313 Discussion 314

EXPéRIENCE 2 : ANALYSE DE RéGRESSION AVEC DIFFéRENTES MESURES DE RéGULARITé STATISTIQUE POUR DES MOTS MONOSYLLABIQUES ET DISSYLLABIQUES ANGLAIS 3 1 7

Method 319 Results 321

Monosyllabics 321 Disyllabics 323 Discussion 326

Discussion of Experiment 1 and 2 327

EXPéRIENCE 3: ENTROPIE MOYENNE DE GRAPHèMES OU DEGRé D'INCERTITUDE DE LA PRONONCIATION DU GRAPHèME EN DéNOMINATION ET EN RéPéTITION DE NON-MOTS 3 3 3

Expérience Sa: Effet d'entropie en dénomination 334 Méthode 3 3 4

Résultats 338 Discussion 340

Expérience 3b: Effet d'entropie en répétition de non-mots 341 Méthode 341

Résultats 341

Discussion des expériences 3a et 3b 342

EXPéRIENCE 4 : ACTIVATION DES ASSOCIéS PHONEMIQUES MINORITAIRES DANS UNE TâCHE DE DéTECTION DE LETTRE 3 4 5

Méthode 348

(14)

v// Table des matières

Résultats 350

A n a l y s e d e s erreurs 3 5 0 A n a l y s e d e s t e m p s de réaction 3 5 2 Discussion -^-îi

D I S C U S S I O N DES E X P é R I E N C E S l à 4 3 5 5

Régularité des relations graphème-phonème 355 Associations plutôt que règles 356 Associations minoritaires 357 Associations contextuelles 357

Conclusion 358

C H A P I T R E 2

N A T U R E D U M é C A N I S M E D E C O N V E R S I O N : A S S E M B L A G E S é Q U E N T I E L , L E T T R E - A P R è S - L E T T R E ? 3 6 3

E X P é R I E N C E 5 : F R é Q U E N C E M O Y E N N E D E G R A P H è M E S E N D é N O M I N A T I O N D E N O N - M O T S 3 7 1

Méthode 371 Résultats 373 Discussion 375

E X P é R I E N C E 6 : C O M P L E X I T é G R A P H é M I Q U E ET L O N G U E U R DE C H A î N E EN D é N O M I N A T I O N DE N O N - M O T S 3 7 7

Méthode 377 Résultats 379

A . E f f e t d e l o n g u e u r 3 8 0 B . C o m p l e x i t é d u g r a p h è m e 3 8 1

Graphème inullilertre vs htf^ramme formé de f;raphèmes .•iimples à nombre de lettres égal.

Complexité graphémique croissante à nombre de lettres constant 383 Nature des erreurs de prononciation 384

Discussion 384

E X P é R I E N C E 7 : O P A C I T é G R A P H é M I Q U E ET C O N T E X T E D E LISTE EN D é N O M I N A T I O N DE MOTS 3 8 7 Méthode 389

Résultats 390 Discussion 393

E X P é R I E N C E 8 : O P A C I T é G R A P H é M I Q U E EN D é N O M I N A T I O N DE N O N - M O T S A V E C UN M A T é R I E L CONSTRUIT PAR PAIRES 3 9 5

Méthode 395 Résidtats 396 Discussion 399

E X P é R I E N C E 9 : C O M P L E X I T é G R A P H é M I Q U E E N D é N O M I N A T I O N DE N O N - M O T S A V E C U N M A T é R I E L CONSTRUIT PAR PAIRES 4 0 1

Méthode 401 Résultats 402

(15)

xttt

Discussion 405

EXPéRIENCE 10: LONGUEUR EN LETTRES EN DéNOMINATION DE NON-MOTS AVEC UN MATéRIEL CONSTRUIT PAR PAIRES 4 0 7

Méthode 408 Résultats 410 Discussion 411

EXPéRIENCE 11 : LONGUEUR EN PHONèMES DANS UNE TâCHE DE RéPéTITION DE NON-MOTS 4 1 3 Méthode 413

Résultats 414 Discussion 415

DISCUSSION DES EXPéRIENCES 5 À 1 1 4 1 7 Longueur en lettres 419

Composition graphémique: fréquence, opacité et complexité. 421

Variabilité des effets de complexité et d'opacité en fonction de la position du graphème multilettre 425 Origine non-lexicale des effets de longueur et de composition graphémique 427

Conclusion 428 A. Refixation 429 B. Codage spatial 4 2 9

C O N C L U S I O N S G É N É R A L E S 4 3 5

R É F É R E N C E S 4 4 5

(16)

A N N E X E S D E L A P A R T I E I I : D E S C R I P T I O N S T A T I S T I S T I Q U E D E S

A S S O C I A T I O N S G R A P H È M E - P H O N È M E D U F R A N Ç A I S E T D E L ' A N G L A I S

A n n e x e A . CODES PHONéTIQUES pour le français pour l'anglais

MOTS éCARTéS DU CORPUS FRANçAIS

GRAPHèMES ET ASSOCIATIONS DU FRANçAIS ET DE L'ANGLAIS Associations du français

Associations de l'anglais

DéCOUPAGES EN ASSOCIATIONS DANS NOS CORPORA Français

Anglais

TABLES DES ASSOCIATIONS DU FRANçAIS 1. Mots monosyllabiques

2. Mots polysyllabiques

3. Mots monosyllabiques et polysyllabiques TABLES DES ASSOCIATIONS DU FRANçAIS

1. Mots monosyllabiques 2. Mots polysyllabiques

3. Mots monosyllabiques et polysyllabiques A n n e x e B .

A n n e x e C.

A n n e x e D.

A n n e x e E.

A n n e x e F.

(17)

Tab/e des maliens

A N N E X E S D E L A P A R T I E I I I : E T U D E S E M P I R I Q U E S

A n n e x e A.

A n n e x e B.

A n n e x e C.

A n n e x e D.

A n n e x e E.

A n n e x e F.

A n n e x e G.

A n n e x e H.

A n n e x e I.

A n n e x e J.

A n n e x e K.

CONTEXTUAL REGULARITIES

READER CROUP AND DURATIONS ANALYSES (PART III, E x p . 2 )

GPAS VALUES FOR DISYLLABIC WORDS, TOKEN COUNT EVALUATION OF REGULARITY ESTIMâTES

G P C TABLE FOR DISYLLABIC WORDS, TYPE COUNT G P C TABLE FOR DISYLLABIC WORDS, TOKEN COUNT VARIABLES SUMMARY TABLE (PART III)

G P C TABLE FOR MONOSYLLABIC WORDS, TYPE AND TOKEN COUNTS

CORRELATION MATRIX FOR MONOSYLLABIC WORDS (EXP. 2, REGRESSION ANALYSIS) CORRELATION MATRIX FOR DISYLLABIC WORDS (EXP. 2, REGRESSION ANALYSIS) EXEMPLAIRES D'ASSOCIATION SUR INTERNET

L I S T E S D E S T I M U L I

EXPéRIENCE 1 : RéGULARITé GRAPHèME-PHONèME POUR DES MOTS DISYLLABIQUES ANGLAIS EXPéRIENCE 3: ENTROPIE MOYENNE DE GRAPHèMES OU DEGRé D'INCERTITUDE DE LA

PRONONCIATION DU GRAPHèME EN DéNOMINATION ET EN RéPéTITION DE NON-MOTS EXPéRIENCE 4: ACTIVATION DES ASSOCIéS PHONéMIQUES MINORITAIRES DANS UNE TâCHE DE

DéTECTION DE LETTRE

EXPéRIENCE 5 : FRéQUENCE MOYENNE DE GRAPHèMES EN DéNOMINATION DE NON-MOTS

EXPéRIENCE 6 : COMPLEXITé GRAPHéMIQUE ET LONGUEUR DE CHAîNE EN DéNOMINATION DE NON- MOTS

EXPéRIENCE 7 : OPACITé GRAPHéMIQUE ET CONTEXTE DE LISTE EN DéNOMINATION DE MOTS EXPéRIENCE 8: OPACITé GRAPHéMIQUE EN DéNOMINATION DE NON-MOTS AVEC UN MATéRIEL

CONSTRUIT PAR PAIRES

EXPéRIENCES 9 ET 10: COMPLEXITé GRAPHéMIQUE ET LONGUEUR EN LETTRES EN DéNOMINATION DE NON-MOTS AVEC UN MATéRIEL CONSTRUIT PAR PAIRES (ITEMS PRéSENTéS ENSEMBLE)

(18)

C O N V E N T I O N S

ph U n g r a p h è m e (lettre ou g r o u p e de lettres a s s o c i é à u n p h o n è m e d u langage) est i n d i q u é en gras.

an U n e suite de lettres qui, d a n s c e contexte, ne f o r m e p a s un g r a p h è m e est i n d i q u é e e n gras, italique, s o u l i g n é (e.g., cane).

lîl Un p h o n è m e ("son d'une langue, défini par les propriétés distinctives — traits

pertinents — qui l'opposent aux autres sons de celle langue". Petit L a r o u s s e illustré).

T o u j o u r s entre d e u x "/". La liste des codes p h o n é t i q u e s est reprise sur le signet m o b i l e .

ph > / f / U n e association e n t r e g r a p h è m e et p h o n è m e (se lit p h se prononce I f l )

pomme L a f o r m e o r t h o g r a p h i q u e d e s m o t s cités en e x e m p l e dans le texte est i n d i q u é e e n italique.

[pom] L a f o r m e p h o n o l o g i q u e d e s m o t s cités en e x e m p l e est mise entre crochets. L a liste d e s c o d e s p h o n é t i q u e s est reprise sur le signet mobile.

p. o. m m. e L a f o r m e o r t h o g r a p h i q u e s e g m e n t é e e n g r a p h è m e s est en gras, les g r a p h è m e s s o n t séparés par des points.

pom-me La f o r m e o r t h o g r a p h i q u e s e g m e n t é e en syllabes. L e s syllabes sont séparés par un tiret.

(19)

INTRODUCTION

La dernière chose qu'on trouve en faisant un ouvrage, est de savoir celle qu'il faut mettre la première.

Pascal (Pensées 63)

(20)

Dans les systèmes d'écriture alphabétiques du français et de l'anglais, il existe des relations stables entre lettres et sons. Les lettres (e.g., b) et groupes de lettres (e.g., ou) qui f o r m e n t un g r a p h è m e (i.e., la lettre ou la suite de lettres qui retranscrit un son de parole) sont

r é g u l i è r e m e n t p r o n o n c é s a v e c le m ê m e son {e.g.,/h/ ou /u/). La raison principale p o u r supposer que cette c o n n a i s s a n c e des relations orthographe-son soit représentée et utilisée par le lecteur habile d'une langue alphabétique tel que le français ou l'anglais est le fait qu'elle permet de dériver la prononciation correcte d'un grand n o m b r e de mots aussi bien que celle d'une séquence de lettres dont la prononciation n ' a jamais été apprise (des non-mots c o m m e tabre).

Bien que les morceaux choisis littéraires présentés à la figure 1 nous montrent q u ' u n e fois acquise cette aptitude s'exerce avec facilité chez la plupart des lecteurs, la nature exacte de la c o n n a i s s a n c e qui p e r m e t le t r a n s c o d a g e d'une chaîne en sa p h o n o l o g i e à partir d ' u n e connaissance des régularités de la langue ainsi que la nature exacte d e s m é c a n i s m e s qui régissent l'acquisition, l'utilisation et les atteintes de cette aptitude sont p o u r l'instant sujets à d'intenses controverses théoriques.

En fait, pendant longtemps, on a pensé que ce processus de transcodage était très important en d é b u t d ' a p p r e n t i s s a g e d e la l e c t u r e pour créer un a p p a r i e m e n t e n t r e u n e f o r m e

orthographique encore inconnue de l'enfant et une forme phonologique qui lui est d é j à très familière (découvrir q u ' u n e fois prononcée, la séquence de lettres maman représente un concept qui lui est assez familier). M a i s pour les lecteurs adultes, on pensait que le s y s t è m e qui p o u v a i t r é c u p é r e r la p r o n o n c i a t i o n à partir d ' u n e c o n n a i s s a n c e d e s r é g u l a r i t é s orthographe-son de la langue était un système subsidiaire, indispensable d a n s la prononciation des non-mots, mais n'intervenant pas ou peu dans la dénomination des mots. Ceci a fortement été remis en question vers la fin des années 80. D'aucuns ont m ê m e d é f e n d u la proposition opposée selon laquelle le transcodage phonologique est un processus rapide et automatique et j o u e un rôle central dans l'accès à la prononciation et à la signification des mots. D e p u i s lors

de n o m b r e u x t h é o r i c i e n s d e la d é n o m i n a t i o n s ' e f f o r c e n t de d é t e r m i n e r la n a t u r e d e s connaissances ainsi que des processus impliqués dans le transcodage p h o n o l o g i q u e . L'objet du présent travail est de r é s u m e r et poursuivre ces recherches.

Il s'organise en trois parties, la première, théorique, d a n s laquelle n o u s p r é s e n t o n s une

revue critique de la littérature; la seconde, c o m p u t a t i o n n e l l e , qui introduit u n e a n a l y s e

(21)

2 Introduction

Science fiction

T U Des bandes d'Errants marchaient aussi vers les opulents tropiques, où se trouvaient en abondance nourriture et tlun pour les enfants aimés des Seigneurs Protecteurs. Les Errants ne suivaient pas toujours les routes; ils empruntaient, selon leur caprice, des pistes connues d'eux seuls.

Mais aucun groupe de voyageurs ne pouvait espérer rester invisible, particulièrement un groupe comprenant une demi-douzaine de Fallarins ailés, douze Tarfs rapides avec des épées à quatre mains, une dizaine de cavaliers voilés en cape de cuir de couleur, une autre dizaine d'hommes et de femmes vêtus de cuir et d'acier, et treize gigantesques chiens blancs, menés par un adolescent en casaque bleue."

Les pillards de Slcaith, Leigh Bracketl. Le Masque Science fiction. 96, pp. 76-77.

"Lorsqu'il arriva sur les lieux, l'issue du combat était claire. Les bataillons de Bohul, avec leurs memrils et leurs chariots de guerre rugissants, avaient réussi l'impensable. Sur la plaine finéenne à l'est de Vasques Tohor, les vingt potences du dernier royaume avaient été détruites. Vasques T o h o r devrait bientôt ouvrir ses portes aux ducs de Bohul."

Rhialto le merveilleux. Jack Vance. J'ai lu. 1890, p. 126.

Poésie française et anglaise

Il l'emparouille et l'endosque contre terre;

Il le rague et le roupète jusqu'à son drâle;

Il le pratèle et le libucque et lui barufle les ouillais:

Il le tocarde et le marmine, Le manage rape à ri et ripe à ra.

Enfin il l'écorcobalisse.

L'autre hésite, s'espudrine, se défaisse, se torse et se ruine.

'Tvvas brillig, and the slithy toves Did gyre and bimble in the «abe;

Ail mimsy were the borogoves, And the morne raths outgrabe.

Jabberwockw Lewis Caroll

Le grand combat, Henri Michaux, 1928

F / G 7. Morceaux choisis littiraires

(22)

3

statistique des associations g r a p h è m e - p h o n è m e du f r a n ç a i s et de l'anglais; la t r o i s i è m e , empirique, où de nouvelles recherches sont exposées.

L a partie théorique qui fait suite à cette introduction comprend cinq chapitres.

L e chapitre 1 {Les modèles de la prononciation des mots écrits et leur évolution) r é s u m e le

d é v e l o p p e m e n t et l'évolution, d e s a n n é e s septante à nos jours, des explications théoriques de la dénomination des mots écrits. Cette évolution historique se marque principalement par une succession d'explications qui tour à tour défendent ou rejettent le caractère inévitable d'une représentation explicite des régularités orthographe-son p o u r e x p l i q u e r la d é n o m i n a t i o n correcte des non-mots. Celles qui soutiennent une représentation explicite d e ces régularités ( m o d è l e s à deux voies de traitement de la fin des années 70 puis m o d è l e s à s y s t è m e s d e c o d a g e parallèles et niveaux m u l t i p l e s de régularité du milieu des a n n é e s 80) expliquent l ' a p p a r e n t e c o n n a i s s a n c e d e s r é g u l a r i t é s d e la l a n g u e par u n e r e p r é s e n t a t i o n d e s c o r r e s p o n d a n c e s e n t r e s e g m e n t s o r t h o g r a p h i q u e s et s e g m e n t p h o n o l o g i q u e s de tailles variables sous forme de règles où seule la prononciation la plus fréquente est représentée ou bien d'associations où toutes les prononciations possibles d'un segment orthographique sont représentées. Celles qui nient la nécessité de faire appel à une représentation explicite de ces régularités (modèles d'analogie lexicale purs de la fin des années 70 ou d'activation-synthèse du milieu des années 8 0 puis m o d è l e s connexionnistes de la fin des années 80) proposent que la prononciation correcte des n o n - m o t s peut-être obtenue par activation et synthèse soit de la connaissance de la p r o n o n c i a t i o n des f o r m e s orthographiques visuellement similaires à la séquence de lettres à p r o n o n c e r (théorie analogique) soit d'un multitude de micro-inférences non-verbalisables qui prennent place dans un réseau d'unités interconnectées dont les poids des c o n n e x i o n s sont c o n f i g u r é s p a r exposition à un e n s e m b l e r e p r é s e n t a t i f de f o r m e s orthographiques et à leur prononciation (théorie connexionniste). La p o l é m i q u e qui détermine pendant ces premières années une oscillation entre ces deux types d'explication théorique, donnant l'avantage tantôt à l'un tantôt à l'autre, atteint son point culminant au début des années 9 0 lorsque l'apparition d ' o r d i n a t e u r s et d'algorithmes de calculs p e r f o r m a n t s f a v o r i s e le développement de réalisations computationnelles s'inspirant de chacun des f o r m a l i s m e s qui a marqué l'histoire de la discipline.

S i g n a l o n s d ' e n t r é e de j e u q u e si le d o m a i n e d ' e x p l i c a t i o n d e c e s t h é o r i e s ,

computationnnelles ou non, de la reconnaissance et de la prononciation des mots écrits est

(23)

4

Introduction

potentiellement e x c e s s i v e m e n t large, les théories les p l u s actuelles ne proposent q u e d e s explications partielles. Idéalement, le d o m a i n e c o m m e n c e par une explication du traitement expert et se poursuit p a r une explication de l'acquisition et des d y s f o n c t i o n n e m e n t s faisant suite aux lésions. A u niveau du traitement expert, il s'agit pour ces théories de donner une explication de la m a n i è r e dont le lecteur e f f e c t u e des tâches aussi diverses que les tâches d e dénomination, d a n s lesquelles le sujet d é n o m m e à h a u t e voix une séquence de lettres, d e décision lexicale, o\x il s'agit de décider si une suite de lettres f o r m e ou non un mot (dame vs baine), ou de d é n o m i n a t i o n de mots en contexte phrastique, etc. Il s'agit aussi de donner une explication non s e u l e m e n t de la m a n i è r e dont ces p r o c e s s u s interviennent chez le lecteur habile, mais aussi de la manière dont ceux-ci se d é v e l o p p e n t selon le niveau d'expérience en lecture. Il s'agit e n c o r e de d o n n e r une e x p l i c a t i o n p o u r des d i f f é r e n c e s é v e n t u e l l e s de c o m p o r t e m e n t d e lecture d a n s des systèmes d'écriture obéissant à des principes différents:

logographique, s y l l a b i q u e ( k a n a j a p o n a i s ) , a l p h a b é t i q u e à g r a p h i e très p r o f o n d e c o m m e l'hébreu non pointé, ou à graphie p r o f o n d e c o m m e l'anglais, ou à graphie transparente c o m m e le Serbo-croate, qui varient f o r t e m e n t dans leur d e g r é de t r a n s p a r e n c e des régularités orthographe-son. E n f i n , il ne s'agit pas de donner une explication parmi beaucoup d'autres de ces modèles, mais de p r o p o s e r une explication qui ait le plus de vraisemblance en fonction de ce qu'on connaît du f o n c t i o n n e m e n t cérébral (i.e., d o n n é e s neurophysiologiques et imagerie cérébrale). Clairement, les explications proposées sont loin encore d'aborder l'ensemble de ces problèmes. D a n s la réalité, les théories d e l'identification et de la d é n o m i n a t i o n des m o t s écrits font carrément abstraction du but de la lecture ( c o m p r é h e n s i o n du texte écrit) et les auteurs des m o d è l e s actuels se contentent le plus souvent de concentrer leurs explications et débats théoriques autour des six questions définies par Coltheart. A savoir la dénomination de mots irréguliers, la d é n o m i n a t i o n de non-mots, la réalisation d'une tâche de décision lexicale, l'explication des déficits acquis de la dénomination que sont la dyslexie de surface d'une part (i.e., déficit s p é c i f i q u e d a n s la d é n o m i n a t i o n des m o t s irréguliers c o m m e femme) et la dyslexie phonologique d'autre part (i.e., déficit spécifique dans la dénomination des non-mots c o m m e bame), ainsi q u e l'explication des f o r m e s d é v e l o p p e m e n t a l e s de la dyslexie. N o u s ferons de m ê m e , en n o u s intéressant encore plus s p é c i f i q u e m e n t aux résultats empiriques qui reflètent le traitement du transcodage phonologique.

Le chapitre 2 (Modèles computaîionnels actuels de la dénomination) décrit de m a n i è r e

précise et complète quatre de ces réalisations computationnelles, à savoir: DRC, le modèle à

deux voies en cascade de Coltheart et collègues (1993 à 1999); PMSP, une version remodelée

du modèle de S e i d e n b e r g et M c C l e l l a n d développée p a r Plaut et collègues (1993 à 1996);

(24)

ACV, le m o d è l e de m é m o i r e à traces multiples d'Ans et collègues (1996 à 1998); et ZHB, le modèle connexionniste à deux processus de Zorzi et collaborateurs (1998 à 1999).

C e s m o d è l e s se caractérisent surtout par une importante hétérogénéité des p r o p o s i t i o n s théoriques. A l'image du débat qui a o p p o s é vers la fin de années 80 les c h a m p i o n s d e s positions extrêmes que sont les modèles à deux voies d'inspiration cognitiviste et les m o d è l e s PDP d'inspiration connexionniste, les modèles diffèrent sur bien des termes lorsqu'il s'agit de décider de leur architecture, de la nature des représentations des relations entre l ' o r t h o g r a p h e et la p h o n o l o g i e ainsi q u e de la nature des m é c a n i s m e s qui agissent sur ces représentations, proposant des descriptions parfois aux antipodes du m ê m e phénomène, le transcodage d'une suite de lettres en sa p h o n o l o g i e . Certains p r o p o s e n t que le c o m p o r t e m e n t régulier e n dénomination trouve son origine dans l'application d'une connaissance spécifiquement i n f r a - lexicale {DRC, ACV, ZHB) et d'autres non (PMSP). Certains supposent que cette connaissance prend la f o r m e d'un s y s t è m e de règles (DRC), d'autres d'une connaissance acquise de la structure statistique de la langue émergeant soit d'un réseau connexionniste médiatisé par une couche d'unités cachées (PMSP), soit d'un réseau associatif mettant en œ u v r e des associations d i r e c t e s entre lettres et p h o n è m e s (ZHB), soit de l'activation des s e g m e n t s s y l l a b i q u e s o r t h o g r a p h i q u e m e n t similaires au s e g m e n t à p r o n o n c e r (ACV). P a r a l l è l e m e n t , c e r t a i n s supposent l'intervention, à côté d'un m é c a n i s m e spécialisé dans la récupération rapide de la p r o n o n c i a t i o n des m o t s f a m i l i e r s , d'un m é c a n i s m e d e t r a n s c o d a g e spécialisé d a n s la dénomination de non-mots (DRC, ACV, ZHB), d'autres se contentent d'un m é c a n i s m e unique pour la dénomination des mots et des non-mots (PMSP). Ou encore certains proposent q u e le traitement de l'assemblage soit de nature séquentielle, traduisant une chaîne de caractères lettre-après-lettre (DRC-L) ou s y l l a b e - a p r è s - s y l l a b e (ACV), d'autres p r o p o s e n t q u e son traitement est de nature u n i f o r m é m e n t parallèle (ZHB, PMSP).

C o m m e n o u s l ' i n d i q u o n s d a n s l ' a v a n t - p r o p o s d u chapitre p r é s e n t a n t les m o d è l e s

computationnels, l'attrait de notre démarche est de poser la discussion théorique au niveau des

différentes hypothèses théoriques plutôt que de chercher, c o m m e le font bon nombre d'études

actuelles, à désigner un vainqueur parmi ces modèles. N o u s n'avons aucun modèle à d é f e n d r e

et nous ne s o m m e s personnellement pas convaincue q u e la bonne explication se trouve parmi

les m o d è l e s actuels de la dénomination. Il est plus important à notre sens de tenter d'établir

l'adéquation ou l'inadéquation éventuelle des hypothèses théoriques spécifiques que mettent

en œ u v r e ces différents m o d è l e s quant à la nature d e s représentations ou à la nature d e s

processus impliqués dans le transcodage phonologique. Pour ce faire, les chapitres 3 (Nature

(25)

6 Introduction

de la connaissance utilisée au cours de la conversion) et 4 {Nature du mécanisme de

transcodage phonologique) proposent u n e revue des études empiriques sur le lecteur habile, m a i s aussi développementales, neuropsychologiques, neurophysiologiques, qui permettent de trancher entre les hypothèses théoriques les plus disputées de ces modèles que sont, du côté de la représentation des c o n n a i s s a n c e s des régularités g r a p h è m e - p h o n è m e de la langue, celles relatives aussi bien à la nécessité de s u p p o s e r une source de connaissance spécifiquement infra-lexicale, à la nature des associations qu'elle c o d e (tout-ou-rien vs prise en c o m p t e de la f o r c e de la règle) q u ' à la densité du réseau d ' a s s o c i a t i o n s ( c o r r e s p o n d a n c e u n i q u e vs associations multiples) et, du côté du m é c a n i s m e de transcodage, celles relatives à la nécessité d e supposer un m é c a n i s m e distinct p o u r assurer le transcodage, à la nature séquentielle de celui-ci (lettre-après-lettre vs u n i f o r m é m e n t parallèle), à sa d é p e n d a n c e a u x ressources attentionnelles, à la modulation de son traitement en fonction de facteurs stratégiques, ou à son caractère lent et tardif. Dans cette évaluation, nous découvrirons que, malgré plus de vingt ans de recherches et une polémique omniprésente, le caractère incontournable ou inadéquat de la plupart des h y p o t h è s e s relatives à la nature des r e p r é s e n t a t i o n s et d e s m é c a n i s m e s i m p l i q u é s d a n s le t r a n s c o d a g e p h o n o l o g i q u e est loin d'être clairement établi. Au plus, la nécessité de prévoir u n e source de c o n n a i s s a n c e e n c o d a n t s p é c i f i q u e m e n t les régularités orthographe-son et un m é c a n i s m e séparé d'assemblage est-elle appuyée par les données.

D a n s le chapitre 5 (Synthèse générale et approche métathéorique), nous introduirons le

cadre métathéorique que nous avons choisi pour progresser par rapport à ces deux questions.

C e t t e approche, d é f e n d u e par C o n t e n t et F r a u e n f e l d e r (1996), s ' e f f o r c e de c o m b i n e r les approches computationnelle (analyse des contraintes i m p o s é e s par la structure de la langue), les études empiriques (évaluation, test d e s théories), et les simulations (évaluation, test des m o d è l e s qui sont censés correspondre à des mises en œ u v r e fidèles des théories). L a partie s i m u l a t i o n n e l l e initiée d a n s le courant de cette thèse est b r i è v e m e n t é v o q u é e m a i s pas développée dans cette thèse.

L a d e u x i è m e partie p r é s e n t e une "description statistique des associations graphème- phonème du français et de l'anglais". En e f f e t , une h y p o t h è s e critique par rapport aux

m o d è l e s actuels de la dénomination est la manière dont la p e r f o r m a n c e des lecteurs varie en

fonction de la force ou de prédictibilité de la p r o n o n c i a t i o n d'un g r a p h è m e {e.g., f qui se

prononce toujours / f / c o m m e dans chef\% c qui peut se prononcer tantôt IkJ c o m m e dans cas,

Isl c o m m e dans cil ou /g/ c o m m e dans zinc). Alors que les trois autres m o d è l e s (PMSP, ACV,

(26)

7

ZHB) supposent tous u n e c o n n a i s s a n c e multiple et graduelle des relations o r t h o g r a p h e - s o n , C o l t h e a r t et c o l l a b o r a t e u r s (DRC) se r e t r a n c h e n t derrière l'absence d e d o n n é e s n o n

équivoques en faveur d'un effet de la force des associations graphème-phonème pour proposer que l'assemblage phonologique repose sur un système de règles de transcodage de type tout- ou-rien dans lequel seul l'associé p h o n é m i q u e le plus fréquent d'un g r a p h è m e est répertorié, sans aucune c o n n a i s s a n c e de la f o r c e d'association qui unit le graphème à sa prononciation régulière. Une difficulté importante liée à l'évaluation de cette proposition est la pauvreté ou l'absence d'estimations précises des forces des différentes associations g r a p h è m e - p h o n è m e des s y s t è m e s f r a n ç a i s et anglais. L'objet de l'analyse computationnelle p r é s e n t é e d a n s la d e u x i è m e partie est de fournir une description statistique permettant d e d é f i n i r u n e m e s u r e c o n t i n u e de la régularité g r a p h è m e - p h o n è m e des mots et des n o n - m o t s qui puisse être m a n i p u l é e e x p é r i m e n t a l e m e n t . Par ailleurs, c o m m e ce type de données est a c t u e l l e m e n t manquant, nous profitons de l'établissement de ces tables d'association g r a p h è m e - p h o n è m e pour donner une description détaillée des caractéristiques des relations o r t h o g r a p h e - s o n des s y s t è m e s du f r a n ç a i s et de l'anglais à d i f f é r e n t s niveaux d'analyse p r o c h e s du g r a p h è m e (associations lettre-son plutôt que g r a p h è m e - p h o n è m e ; prise en compte ou non des contextes qui influencent de manière systématique la prononciation d'un graphème, c o m m e p o u r le c qui suivi de e, i, y se prononce t o u j o u r s /s/; estimation de l'ambiguïté du d é c o u p a g e d e certains groupes de lettres en g r a p h è m e s c o m m e a n qui correspond à deux unités d e p r o n o n c i a t i o n dans c.a.n.e et à une dans c.an.t.on, etc.).

La troisième partie introduit nos "études empiriques" et cherche à é v a l u e r la pertinence théorique, eu égard à nos données, des hypothèses relatives aux représentations et p r o c e s s u s impliqués d a n s le transcodage. Elle se d é c o u p e en deux chapitres. L e p r e m i e r qui s'intitule

"Mature des relations graphème-phonème: règles ou associations?" s'intéresse a u x e f f e t s de

régularité graduelle, qui sont, c o m m e nous venons de l'évoquer, parfaitement incompatibles avec les h y p o t h è s e s t h é o r i q u e s du m o d è l e DRC. Le second qui s'intitule "Nature du

mécanisme de conversion: assemblage séquentiel lettre-après-lettre?" p r é s e n t e des

e x p é r i e n c e s qui varient a l t e r n a t i v e m e n t la l o n g u e u r de chaîne ( n o m b r e d e lettres, d e g r a p h è m e s , et de p h o n è m e s ) et la c o m p o s i t i o n g r a p h é m i q u e ( g r a p h è m e f r é q u e n t vs rare, g r a p h è m e multilettre c o m m e p h d a n s chou vs simple c o m m e p d a n s pou, g r a p h è m e

multilettre divergent c o m m e p h où la première lettre du graphème se p r o n o n c e d i f f é r e m m e n t

de celui-ci vs multilettre c o n v e r g e n t c o m m e tt où la première lettre et le g r a p h è m e se

(27)

8 Introduction

prononcent de la m ê m e m a n i è r e ) dans des tâches de d é n o m i n a t i o n de mots et de non-mots

français d e m a n i è r e à n o u s éclairer de manière plus précise sur la nature séquentielle ou

parallèle du m é c a n i s m e de transcodage. L'observation d'un e f f e t de longueur en lettres ou en

g r a p h è m e s indépendant des variations de composition g r a p h é m i q u e invaliderait l'hypothèse

q u e f o n t la plupart d e s m o d è l e s c o n n e x i o n n i s t e s a c t u e l s d'un traitement u n i f o r m é m e n t

parallèle i n c a p a b l e d e r e n d r e c o m p t e d'un tel e f f e t ; l'absence d'un e f f e t de l o n g u e u r

spécifiquement en lettres invaliderait quant elle l'hypothèse que fait DRC d'un transcodage par

d é c h i f f r e m e n t lettre-après-lettre d'une chaîne de caractères. Pareillement, une confirmation de

la réalité p s y c h o l o g i q u e d'un e f f e t de la complexité g r a p h é m i q u e {e.g., le fait de contenir ou

non des g r a p h è m e s multilettres c o m m e ph) lorsque des différences en termes de fréquence de

graphèmes sont annulées fournirait un outil d'évaluation supplémentaire pour trois des quatre

modèles décrits {i.e., PMSP, ZHB,ACV) qui ont p o u r l'instant p a r f a i t e m e n t négligé cette

variable d a n s leur explication d e la d é n o m i n a t i o n ; u n e n o n - c o n f i r m a t i o n de cet e f f e t , par

contre, c o n d u i r a i t à u n e r e m i s e en question du m é c a n i s m e lettre-après-lettre qui a été

spécifiquement introduit dans DRC-L pour prédire ce type d'effet. Chacun des chapitres est

clos par une discussion générale des résultats des expériences qu'il présente. En fin de partie,

une section "Conclusions générales" r é s u m e b r i è v e m e n t les différentes contributions de ce

travail et o f f r e quelques perspectives pour un prolongement de celui-ci.

(28)

PARTIE I

R E V U E C R I T I Q U E D E L A L I T T é R A T U R E

A bend in the road is not the end of the road. Unless yoii fail to make the turn.

(29)

C H A P I T R E 1

Les modèles de la prononciation des mots écrits et leur évolution

C H A P I T R E 2

Modèles computationnels actuels de la dénomination

C H A P I T R E 3

Nature de la connaissance utilisée au cours de la conversion

C H A P I T R E 4

Nature du mécanisme de transcodage phonologique

C H A P I T R E 5

Synthèse générale et approche

métathéorique

(30)

CHAPITRE 1

LES MODèLES DE LA PRONONCIATION DES MOTS éCRITS ET LEUR éVOLUTION

I. M O D è L E S S Y M B O L I Q U E S D E S A N N é E S 7 0 - 8 0 1.1. M o d è l e s à deux v o i e s

1.2. Critiques du m o d è l e à d e u x v o i e s ^ 1.3. M o d è l e s unitaires de la prononciation

M o d è l e s d'analogie lexicale M o d è l e s d'activation-synthèse

1.4. M o d è l e s à s y s t è m e s de c o d a g e parallèles et à niveaux multiples d'association

2 . M O D è L E S à T R A I T E M E N T P A R A L L è L E D I S T R I B U é 2.1. NETtalk (Sejnowski et Rosenberg. 1986)

2.2. M o d è l e distribué de la reconnaissance et de la dénomination des mots (Seidenberg et McClelland. 1989)

2.3. Critiques du m o d è l e connexionniste de la dénomination 3 . D é V E L O P P E M E N T D E M O D è L E S C O M P U T A T I O N N E L S D E N A T U R E S

D I V E R S E S 4 . S Y N T H è S E

/ . MODèLES SYMBOLIQUES DES ANNéES 70-80

\.\. Modèles à deux voies

Les modèles qui s'efforcent de décrire les étapes du traitement de l'information au cours de la prononciation des mots écrits par le lecteur habile sont confrontés à la difficulté de trouver un mécanisme capable d'expliquer la dénomination correcte de l'ensemble des chaînes de caractères que peut être amené à rencontrer un lecteur, à savoir des mots irréguliers c o m m e femme dont la prononciation correcte ne peut être générée à partir des règles aussi bien que

des non-mots c o m m e tahre dont la prononciation ne peut être récupérée à partir d'une connaissance lexicale.

Au début des années 70, les explications dominantes ne parviennent qu'à rendre compte

d'une partie du phénomène de la prononciation des mots écrits: les modèles de l'accès direct

(31)

14 Chapitn 1

(Baron, 1973; F. Smith, 1971) avancent un m é c a n i s m e de récupération d'une prononciation à partir d'une identification lexicale qui explique la prononciation correcte des m o t s irréguliers mais non des non-mots; les m o d è l e s de la médiation phonologique (Gough, 1972; Rubenstein, Lewis, & Rubenstein, 1971; S p o e h r & Smith, 1973) proposent un m é c a n i s m e de transcodage à partir de règles orthographe-son permettant de rendre compte de la d é n o m i n a t i o n des non- mots mais non des mots irréguliers.

En proposant une sorte de synthèse entre ces deux types de modèles, les m o d è l e s à deux voies introduits vers 1975 {e.g.. Baron & Strawson, 1976; Carr, Davidson, & H a w k i n s , 1978;

Coltheart, Davelaar, Jonasson, & Besner, 1977; Coltheart 1978, 1980; Forster & Chambers, 1973; Marshall & N e w c o m b e , 1973; Patterson & Marcel, 1977; Shallice & Warrington, 1975) o f f r e n t une e x p l i c a t i o n b e a u c o u p plus c o n v a i n c a n t e de la d é n o m i n a t i o n , s'appliquant à l'ensemble des chaînes qu'arrive à p r o n o n c e r un lecteur habile. Bien qu'ils diffèrent parfois dans leur manière de c o n c e v o i r les étapes du traitement de l'information, leur g r o u p e m e n t sous le n o m de m o d è l e s à d e u x voies reflète le fait qu'ils sont tous s o u s - t e n d u s par deux hypothèses c o m m u n e s . D'une part, l'hypothèse de d e u x voies de traitement qui opèrent en parallèle: l'une, lexicale, s p é c i a l i s é e d a n s la d é n o m i n a t i o n des m o t s , qui r é c u p è r e la prononciation d'un mot écrit en activant la f o r m e phonologique stockée correspondant à la f o r m e écrite; l'autre, non-lexicale, spécialisée dans la dénomination des non-mots, qui traduit un mot écrit en sa p r o n o n c i a t i o n par un m é c a n i s m e de c o n v e r s i o n g r a p h è m e - p h o n è m e . D'autre part, l ' h y p o t h è s e selon laquelle la p r o n o n c i a t i o n des n o n - m o t s est o b t e n u e par conversion o r t h o g r a p h e - s o n à b a s e d'unités infra-lexicales {i.e., de taille plus petite que le mot). •

Puisque l'objet de ces m o d è l e s n'est pas uniquement d'imaginer des m é c a n i s m e s capables de produire la prononciation d e ces différents types de chaînes m a i s aussi de proposer une explication de la m a n i è r e dont cette p r o n o n c i a t i o n est o b t e n u e par u n lecteur habile, les partisans de cette a p p r o c h e s'efforcent rapidement d'attester que c h a c u n e d e ces hypothèses repose sur des arguments empiriques ou neuropsychologiques. " ~

L'hypothèse de deux voies de traitement est légitimée par l'observation des p e r f o r m a n c e s

de patients atteints d e d é f i c i t s a c q u i s d e la lecture, d y s l e x i e de s u r f a c e et d y s l e x i e

phonologique, qui s'interprètent c o m m o d é m e n t c o m m e l'effet d'un e n d o m m a g e m e n t assez

important d ' u n e des deux voies de traitement définies par le modèle avec préservation relative

de l'autre, et i n v e r s e m e n t ( d o u b l e dissociation, T e u b e r , 1955). S u i v a n t cette lecture, la

dyslexie de s u r f a c e ( M a r s h a l l & N e w c o m b e , 1973, pour l ' o b s e r v a t i o n initiale) qui se

Références

Documents relatifs

chou cacher lapin habit chimie. Ecris les syllabes au bon

Observons en tout premier lieu , que la charge é- tant héréditaire, il ne fallait pas dresser d'tmyt-pr pour la transmettre [l26].- Si un imyt-pr a été fait, c'est qu'une

Hormis les principales fibres de synthèse utilisées actuellement, les fibres de chrysotile présentent, de par leurs caractéristiques mé- caniques, un potentiel important d'agents

oeuvre commune. C'est la pratique surtout qui a suggéré l'idée et le fond du manuel. Là, sont réunies des remarques personnelles ti­ rées de l'expérience, rédigées sous forme

enfant ou un adolescent sur ses loisirs, il ne pensera pas à l'école, qui lui semble le plus souvent comme une contrainte, mais bien au temps dont il dispose librement après

résista pas longtemps à ces secousses nouvelles et sou- vent répétées, et il fut bientôt affect é du délire des ivre-.. Sa femme le fit contenir par plusieurs hommes;

RETROUVE LE BON CHEMIN POUR

La transcription graphème- phonème est typique du phénomène de décroissance exponentielle de l'efficacité des règles, bien connu en modélisation : peu de