• Aucun résultat trouvé

Unités de la lecture

7.1. Structure du modèle

Il se compose de 5 niveaux de représentations dont 3 sont identiques à ceux du MROM-p, c'est-à-dire le niveau des détecteurs de traits et le niveau des représentations lexicales ortho-graphiques et phonologiques. En revanche, le modèle se distingue du MROM-p en ce qui concerne les unités sous-lexicales orthographiques et phonologiques. Au niveau sous-lexical orthographique, le FUM est composé d'un niveau de représentations graphémiques et au ni-veau sous-lexical phonologique, il est composé d'un nini-veau de représentations phonémiques. La Figure 7.1 fournit une description schématique du FUM.

10 L'implémentation algorithmique de ce modèle a été réalisée en collaboration avec Kai Richter de l'Universi-té de Marburg en Allemagne. Seule la version "anglaise" de ce modèle sera présenl'Universi-tée ici.

Détecteurs de Traits Unités Graphèmes Unités Phonèmes Unités mots (Phonologie) Unités mots (Orthographe) /SAs/~ /dAs/~ /d/ /A/~ /s/ CHANCE AN A N D S SE E DANSE

DANSE

Entrée Visuelle

Figure 7.1. : Description de la structure du FUM. Sont représentés ici les cinq niveaux du modèle : niveau des détecteurs de traits, niveau des graphèmes, niveau des phonèmes, niveaux des représentations lexicales ortho-graphiques et phonologiques. Ce schéma montre les unités activées à la suite de la présentation du mot "DANSE". Seuls les liens excitateurs entre niveaux ont été représentés ici.

Le niveau graphémique est l'élément clé de ce nouveau modèle. Ce niveau remplace le ni-veau des lettres du MROM-p et du MAI (McClelland & Rumelhart, 1981). Nous faisons ici l'hypothèse que ce niveau est divisé en autant de groupes de graphèmes qu'il y a de lettres à traiter. Ainsi, dans la Figure 7.1, cinq groupes de graphèmes sont représentés correspondant aux cinq groupes de détecteurs de traits. Chaque groupe de graphèmes contient l'ensemble des graphèmes rencontrés dans un lexique donné. Nous avons donc auparavant déterminé la liste des graphèmes présents dans l'ensemble des mots anglais monosyllabiques de 3 à 5 let-tres du lexique de Celex11 (Baayen et al., 1993) ainsi que la liste des correspondances gra-pho-phonémiques. Pour réaliser cette segmentation, nous nous référons à la liste proposée

11 Dans la suite de ce chapitre, nous utiliserons les codes phonologiques utilisés par Celex et non plus ceux de l'IPA.

par Berndt, Lynne D'Autrechy et Reggia (1994) ou encore celle de Berndt, Reggia et Mit-chum (1987). Toutefois, ces deux études ne fournissant pas une réponse à toutes les ques-tions de segmentation, nous avons fait certains choix pour certains cas particuliers :

1. Le cas des "e" silencieux en dernière position (e.g., MATE). Un grand nombre de mots anglais contiennent un "e" en position finale et ce "e" semble influencer la prononciation de la voyelle centrale ("a" dans MATE se prononce différemment que dans MAT). Aussi, du point de vue de la segmentation en graphèmes du mot MATE, peut-on envisager deux solutions (Berndt et al., 1994) : soit le "e" est relié à la dernière lettre (donnant le gra-phème TE), soit le "e" et la voyelle centrale forment le gragra-phème A_E (Coltheart et al., 1993). Nous optons pour la première solution pour des raisons de simplicité. Cette ques-tion reste cependant ouverte12.

2. Le cas du "r" silencieux après une voyelle centrale. Certains mots, comme BIRD, sont codés comme ayant 3 phonèmes (/b3d/). Comme nous ne trouvons pas de solution à ce problème dans Berndt et al. (1994), nous décidons de lier le R à la voyelle centrale. Ceci est en accord avec les règles de segmentation proposées par Coltheart et al. (1993).

3. Le cas du "l" silencieux après une voyelle centrale (e.g., CALF). Pour des raisons de consistance, nous faisons le même choix que précédemment avec le R, c'est-à-dire :

C – AL – F ⇒ /c-#-f/

4. Le cas des lettres correspondant à plusieurs phonèmes (e.g., X => /ks/). C'est le cas no-tamment de certaines diphtongues13 comme le U de PURE. Afin de simplifier le codage des relations grapho-phonémiques, nous introduisons un ensemble de phonèmes pour ce type de graphèmes :

"X" (comme dans "SEX") /ks/ ⇒ /%/ "U" (comme dans "USE") /ju/ ⇒ /§/ "U" (comme dans "PURE") /j9/ ⇒ /}/

ainsi que pour "EU","EUE","EW","EWE","IEW" et "UE". "O" (comme dans "ONCE") /wV/ ⇒ /&/

5. Le cas de "QU". Dans la plupart des mots, QU est prononcé /kw/ (mise à part quelques

12 On peut, en effet, envisager une troisième hypothèse où le E final est un graphème silencieux ayant toute-fois une fonction du point de vue de la voyelle centrale.

13 Une diphtongue est une voyelle dont la tenue, sur le plan phonétique, comporte un changement d'articula-tion produisant une variad'articula-tion de timbre. Elle peut être considérée comme formée d'une voyelle et d'une semi-consonne.

exceptions comme QUEUE et QUAY, mots d'origine étrangère). Comme précédemment, nous choisissons d'assigner un phonème particulier pour ce graphème :

"QU" (comme dans "SQUID") /kw/ ⇒ /q/

Tableau 7.1. : Ensemble des graphèmes contenus au sein de chaque groupe de graphèmes au niveau sous-lexical orthographique du FUM.

Graph. Graph. Graph. Graph. Graph. Graph. Graph.

1 a 21 ce 41 ew 61 ir 81 oa 101 pt 121 tz

2 ach 22 ch 42 ewe 62 j 82 oar 102 qu 122 u

3 ah 23 che 43 ey 63 k 83 oe 103 r 123 ue 4 ai 24 ck 44 eye 64 ke 84 oh 104 re 124 ui 5 air 25 d 45 f 65 kh 85 oi 105 rh 125 ur 6 al 26 dd 46 fe 66 kn 86 ol 106 rps 126 uy 7 ao 27 de 47 ff 67 l 87 oo 107 rr 127 v 8 ar 28 dge 48 g 68 le 88 or 108 s 128 ve 9 are 29 e 49 ge 69 ll 89 ou 109 sc 129 w 10 au 30 ea 50 gg 70 lle 90 ough 110 se 130 wh

11 aul 31 eah 51 gh 71 m 91 oul 111 sh 131 wo

12 aw 32 ear 52 gn 72 mb 92 oup 112 sle 132 wor

13 awe 33 eau 53 gu 73 me 93 our 113 ss 133 wr

14 ay 34 ee 54 gue 74 mn 94 ow 114 t 134 x 15 aye 35 ei 55 h 75 n 95 owe 115 tch 135 xe 16 b 36 eigh 56 hei 76 ne 96 oy 116 te 136 y 17 bb 37 eir 57 i 77 ng 97 p 117 th 137 ye 18 be 38 er 58 ie 78 nn 98 pe 118 the 138 z 19 bt 39 eu 59 iew 79 nne 99 ph 119 tt 139 ze

20 c 40 eue 60 igh 80 o 100 ps 120 tte 140 zz

Le Tableau 7.1 contient l'ensemble des graphèmes obtenus à la suite de cette procédure de segmentation (N = 140). De même, l'Annexe V contient l'ensemble des correspondances gra-phème-phonème obtenues à la suite de cette segmentation ainsi que des informations sur la consistance et la fréquence de ces correspondances. Le niveau des unités graphèmes est donc composé de 5 * 140 unités graphèmes. Comme on peut le voir, chaque unité graphème est codée à une position donnée. Par exemple, si le mot DANSE est présenté au modèle (cf. Fi-gure 7.1), chaque détecteur de trait correspondant, à chaque position, est actif et excite à son tour les unités graphèmes : l'unité D dans le premier groupe de graphèmes est active, de même que les unités A et AN dans le second groupe, l'unité N dans le troisième groupe, les unités SE et S dans le quatrième groupe et l'unité E dans le cinquième groupe (nous prenons ici, bien entendu, un exemple en Français). Ensuite, nous faisons l'hypothèse que ces différentes unités vont rentrer en compétition. Ce processus de compétition est implémenté grâce à un réseau de connexions inhibitrices latérales entre unités graphèmes d'un même groupe et éga-lement entre unités graphèmes de groupes adjacents. La Figure 7.2 donne le détail de ce

pro-cessus de compétition et du réseau de connexions inhibitrices entre unités graphèmes.

Unités

graphèmes D A N

AN SE

S E

Figure 7.2 : Détail des connexions inhibitrices entre unités graphèmes d'un même groupe ou d'un groupe adjacent.

Comme on peut le voir dans cette figure, en seconde position par exemple, les unités A et AN sont en compétition, de même que l'unité AN et l'unité N situées en troisième position. De plus, tout comme Coltheart et al. (1993), nous donnons un avantage aux unités graphèmes plus importantes. Ainsi, le poids des connexions inhibitrices entre l'unité AN et les unités A et N est supérieur au poids des connexions inverses. Dans l'ensemble, grâce à ce système de représentations graphémiques et de compétition par inhibition latérale, nous implémentons de cette manière une procédure de segmentation de la séquence de lettres en utilisant les princi-pes computationnels des modèles d'activation interactive. En effet, une fois la compétition terminée, seules les unités D, AN et SE dépassent un seuil d'activation qui leur permet d'acti-ver les niveaux de représentations suivants.

Chacune de ces unités graphèmes active ensuite, d'une part, les unités lexicales orthogra-phiques contenant ces graphèmes aux différentes positions respectives et, d'autre part, les unités phonèmes correspondant à ces graphèmes. Le Tableau 7.2 contient l'ensemble des unités phonèmes recensées à la suite de la segmentation décrite ci-dessus (N = 51).

Le transfert de l'activation des unités graphèmes aux unités phonèmes s'effectue suivant les correspondances établies en Annexe V. Par exemple, si le graphème anglais EA est activé, il active à son tour 5 phonèmes différents : /i/, /7/, /E/, /1/ et /8/ (correspondances relevées dans les mots LEAVE -> /liv/ ; HEAR -> /h7R/ ; HEAD -> /hEd/ ; GREAT -> /gr1t/ ; WEAR -> /w8R/). Seulement, le transfert d'activation est pondéré par la fréquence d'occurrence de ces correspondances : la correspondance EA -> /I/, qui a la fréquence lexicale la plus forte (7219) et est présente dans le plus grand nombre de mots (86), a un poids de connexion proportion-nel à cette fréquence et est donc la correspondance dominante.

Tableau 7.2. : Ensemble des phonèmes contenus au sein de chaque groupe de phonèmes au niveau sous-lexical phonologique du FUM.

Phon. Phon. Phon.

1 1 18 E 35 R 2 2 19 f 36 r 3 3 20 g 37 S 4 4 21 h 38 s 5 5 22 I 39 T 6 6 23 i 40 t 7 7 24 J 41 U 8 8 25 j 42 u 9 9 26 k 43 ü 10 # 27 l 44 V 11 $ 28 m 45 v 12 % 29 N 46 w 13 @ 30 n 47 x 14 A 31 o 48 Z 15 b 32 p 49 z 16 D 33 Q 50 _ 17 d 34 q 51 §

Au niveau des unités sous-lexicales phonémiques, on retrouve une organisation similaire à celle du niveau orthographique. On a ainsi plusieurs groupes d'unités phonèmes contenant chacun l'ensemble des unités du Tableau 7.2. De même, il existe un système de compétition au sein de chaque groupe entre les différentes unités phonèmes activées. Chaque unité pho-nème active va ensuite activer les unités lexicales phonologiques correspondantes. Il existe par ailleurs une boucle de rétroaction entre le niveau lexical phonologique et le niveau des pho-nèmes et, ce, afin de permettre aux correspondances grapho-phonologiques les plus faibles de gagner la compétition à ce niveau de traitement. Les unités lexicales orthographiques et pho-nologiques activées entrent finalement en compétition avec les différentes unités d'un même niveau lexical, et activent également les unités associées appartenant à l'autre niveau lexical.

On le voit, ce modèle dispose des mêmes propriétés que ses prédécesseurs en ce qui concerne les principes computationnels adoptés. En revanche, il fait l'hypothèse différente d'un niveau de représentation constitué d'unités orthographiques fonctionnelles. Cette hypo-thèse permet de résoudre le problème de la dispersion, puisque les correspondances grapho-phonèmiques ne sont plus codées pour une position donnée, mais pour toutes les positions quelle que soit la séquence de lettres considérée. Le choix computationnel adopté ici est donc proche de celui de Coltheart et al. (1993) par ses capacités de généralisation. En revanche, ce choix s'en distingue clairement par le format adopté. La structure du FUM est en effet

homo-gène et suit les principes computationnels des modèles d'activation interactive. La structure du modèle proposé par Coltheart et al. (1993) est une structure hybride, se basant sur un système de règles peu plausible d'un point de vue fonctionnel.