• Aucun résultat trouvé

Début d’un essai

3.2. Variables phonologiques

3.2.3. La structure phonologique

3.2.3.2. Unités sous-syllabiques

Un certain nombre de travaux, initiés par E. Gibson, partent de l'hypothèse que la plus petite unité fonctionnelle de la perception des mots correspond à des groupements orthogra-phiques (GO, "spelling patterns"). Ces GO, selon la définition de Gibson (1965), sont des groupes de lettres dont la prononciation est invariante et suit les règles de prononciation d'une langue donnée. De plus, ces GO sont définis à une position spécifique dans les mots. Gibson (1965) donne l'exemple, en Anglais, de GH qui se prononce comme un F à la fin d'un mot mais pas au début d'un mot. Dans une expérience d'identification de non-mots, Gibson, Pick, Osser, et Hammond (1962) construisent ainsi deux catégories de stimuli : des non-mots constitués de GO, par exemple GLURCK (décomposé GL-UR-CK), et des non-mots cons-truits avec les GO de la première liste mais en inversant le GO initial et final (CKURGL, CK et GL n'ont plus alors valeur de GO, n'étant pas à leur position régulière dans la chaîne de lettres). Gibson et al. (1962) trouvent des pourcentages d'identification supérieurs pour la première liste de non-mots par rapport à la seconde liste, et concluent en faveur de la perti-nence des unités GO pour le codage ortho-phonologique des mots.

La même hypothèse des GO comme unités fonctionnelles de la lecture est testée dans un paradigme de conjonction illusoire par Millis (1986). Cet auteur obtient plus d'erreurs de conjonction pour des mots monosyllabiques ayant 2 GO par rapport à des mots ayant 3 GO. Les résultats de Millis indiquent que le nombre d'erreurs de conjonction décroît à mesure que le nombre de GO augmente. Ce résultat est en faveur de l'hypothèse des GO, puisque la logi-que de ces expériences est de dire logi-que la probabilité de produire une erreur de conjonction est plus forte au sein d'une unité perceptive qu'entre deux unités. Ainsi, plus un mot est composé de GO (i.e., d'unités perceptives fonctionnelles), plus ces unités seront petites et moins grande est la probabilité d'associer deux lettres entre elles. On le voit, contrairement aux définitions purement orthographiques présentées dans la section 3.1.4, les GO sont définis sur la base des relations entre orthographe et phonologie. Il s'agit donc bien là d'unités orthographiques fonctionnelles du point de vue de la phonologie, ou encore d'unités phonographiques.

Une autre approche des unités sous-syllabiques est développée, plus récemment, par R. Treiman et, ce, autour d'une segmentation de la syllabe en onset et rime. Treiman (1994) pro-pose que la segmentation des lettres écrites soit le miroir de la segmentation phonologique des mots. Or, en Anglais, plusieurs résultats empiriques indiquent que les unités phonologi-ques correspondent à l'onset et à la rime (pour une revue, voir Treiman, 1989). Partant de cette hypothèse, Treiman et Chaftez (1987) montrent notamment des temps de réponse plus rapi-des, en TDL, pour des mots monosyllbiques de cinq lettres segmentés à la jonction onset-rime, que pour des mots segmentés une lettre après le début de la rime (i.e., CR//ISP est ré-pondu plus rapidement que CRI//SP). De même, Treiman, Goswami, et Bruck (1990) enre-gistrent de meilleurs performances, dans une tâche de prononciation de non-mots, pour des non-mots construits à partir de rimes partagées par un grand nombre de mots que pour des non-mots construits à partir de rimes peu fréquentes ou inexistantes dans le lexique anglais (ces deux groupes de stimuli étant composés globalement du même type de correspondances grapho-phonémiques). Dans une grande étude réalisée en Anglais mesurant les latences de prononciation d'un large corpus de mots, Treiman, Mullenix, Bijeljac-Babic, et Richmond-Welty (1995) montrent que la consistance de la prononciation de la rime explique une plus grande part de la variance des latences que n'importe quel autre indice sous-syllabique. Trei-man et ses collaborateurs ont ainsi testé l'hypothèse des unités onset-rimes dans plusieurs protocoles expérimentaux et également dans un grand nombre d'études avec des enfants (e.g., Gattuso, Smith, & Treiman, 1991 ; Treiman & Zukowski, 1988, 1996 ; Wise, Olson, & Trei-man, 1990). Cette même approche est poursuivie par J. Bowey dans différentes expériences utilisant la technique d'amorçage. Bowey (1990, 1993) obtient un effet facilitateur de l'amorce sur le traitement du mot cible lorsque les lettres contenues dans l'amorce correspondent à la rime du mot. Enfin, Peereman et Content (1997) suggèrent que la segmentation onset-rime est également fonctionnelle en Français. Dans une étude visant à préciser la nature des effets facilitateurs du voisinage orthographique, ces auteurs montrent (1) que ces effets sont dus principalement aux voisins orthographiques qui sont également des voisins phonologiques du mot cible, appelés "voisins phonographiques" (par exemple, AISE, MISE, BASE et BILE sont tous des voisins orthographiques de BISE, mais seuls MISE, BASE et BILE sont des voisins phonographiques), et (2) que, parmi l'ensemble des voisins phonographiques, seuls ceux qui partagent la rime avec le mot cible semblent influencer son traitement (suivant notre

exemple, le mot BISE a un seul voisin phonographique avec lequel il partage la rime : MISE). L'importance de la segmentation de la syllabe en unités onset-rime est montrée dans un nombre croissant d'études. Ce résultat, observé principalement en Anglais, semble pouvoir s'appliquer également au Français.

En résumé de cette section sur les unités sous-syllabiques, plusieurs études, conduites principalement en Anglais, indiquent que les processus de reconnaissance des mots écrits sont sensibles 1) aux groupements orthographiques ("spelling patterns") dont la prononcia-tion est invariante et suit les règles de prononciaprononcia-tion d'une langue donnée ; 2) à la segmenta-tion en unités onset et rimes, au moins pour des mots monosyllabiques Anglais et Français.

3.3. Discussion

Dans ce chapitre, nous avons souhaité présenter les relations mises à jour entre certaines variables indépendantes, caractérisant certaines propriétés des stimuli linguistiques, et certai-nes variables dépendantes, indices mesurables de la réponse d'un sujet, dans le domaine de la perception des mots écrits. Plus particulièrement, nous avons focalisé notre attention sur le rôle des variables orthographiques et phonologiques. Nous avons abordé séparément ces deux types de variables. Toutefois, il apparaît clairement que ces variables sont fortement im-briquées l'une dans l'autre et qu'une analyse purement en termes de composante orthographi-que ou de composante phonologiorthographi-que n'est pas ou plus envisageable. Ce constat est relative-ment récent dans la littérature sur la perception des mots écrits. Si l'on considère, comme nous le verrons au chapitre suivant, les premiers modèles qui ont été proposés dans ce domaine, nous constatons qu'ils ne considèrent les informations phonologiques que comme un module indépendant, ayant ses propres représentations distinctes des représentations orthographi-ques. Certains modèles éludent même complètement la question des informations phonologi-ques, tentant de rendre compte des phénomènes empiriques sans recours à la phonologie. Pourtant, les résultats que nous avons résumés ici indiquent (1) que les informations phono-logiques interviennent systématiquement dans la reconnaissance d'un mot ; (2) que la struc-ture phonologique d'un mot influence son identification visuelle ; (3) que la phonologie sem-ble donner forme à l'orthographe, ou encore, qu'orthographe et phonologie entretiennent une relation de couplage fonctionnel. Ainsi, cet ensemble de résultats conduit à reconsidérer la distinction classique entre orthographe et phonologie pour suggérer une approche où ces

deux variables s'entremêlent pour former des variables grapho-phoniques ou phono-graphiques.

Avant d'aborder la description des modèles qui sont proposés pour rendre compte de l'en-semble de ces relations empiriques, nous pouvons nous poser la question de la qualité des relations présentées. En effet, se poser la question de la qualité des données empiriques dont on dispose est crucial pour qui souhaite modéliser le système qui a produit ces données. Se-lon le degré de systématicité et d'invariabilité des données empiriques, il est possible de contraindre plus ou moins fortement les modèles que l'on formule. Or, au regard des données énoncées dans ce chapitre, il apparaît que l'ensemble des résultats dont nous disposons cor-respondent non à des lois révélant des propriétés invariantes du système de lecture, lois per-mettant de mettre en évidence des relations systématiques entre variables indépendantes et variables dépendantes, ou encore permettant de révéler des propriétés invariantes du système étudié, mais plutôt à des régularités indiquant des tendances dans les relations entre variables linguistiques et variables comportementales. D'ailleurs, si l'on se réfère à la terminologie em-ployée, on parle généralement de "l'effet" d'une variable X sur une variable Y. Si l'on reprend les différents "effets" que nous avons présentés, on constate aisément que ces effets nous fournissent des indicateurs de tendance mais nullement des relations invariantes et systémati-ques.

Pourquoi un tel constat ? On peut invoquer plusieurs raisons pour expliquer la fragilité des données empiriques dont nous disposons. La première raison vient des propriétés multiples des stimuli. Les mots écrits sont en effet des stimuli multidimensionnels. Cette multidimen-sionnalité rend très difficile toute approche visant à spécifier et isoler tous les facteurs interve-nant dans le traitement d'un mot. Ensuite, même s'il était possible de spécifier l'ensemble de ces facteurs, il serait sans doute très difficile de tous les contrôler afin d'isoler l'un d'entre eux et d'établir son rôle précis au cours du traitement d'un mot. Deuxièmement, il existe des inte-ractions entre ces différentes propriétés ; ainsi l'influence d'une propriété X peut être modulée par une propriété Y (ex. : l'interaction entre la fréquence et la consistance grapho-phonémique, e.g., Taraban & McClelland, 1987). Troisièmement, l'effet d'une propriété est très souvent contextuel : l'influence d'une propriété X est parfois dépendante de facteurs ex-ternes conditionnant l'état général du système de lecture (ex. : la taille de l'effet de fréquence en TDL selon le type de non-mots utilisés, e.g., Stone & Van Orden, 1993). Par ailleurs, une

propriété doit se rapporter au contexte de chaque langue. Une propriété X n'aura pas la même influence selon la langue considérée (e.g., Frost et al. 1987). Quatrièmement, les méthodes employées interagissent elles-mêmes avec les propriétés manipulées ou encore sollicitent des processus qui masquent les processus que l'on tente de mesurer ; un effet s'inscrit générale-ment dans un protocole expérigénérale-mental donné et requiert une analyse des processus liés à la tâche utilisée (e.g., Carreiras et al., 1997). Cinquièmement, il existe des différences interindi-viduelles dans la manière de réaliser une expérience. Peu ou pas d'analyses différentielles sont rapportées, il n'est donc pas possible de savoir si tous les sujets d'une expérience donnée pré-sentent un effet particulier (ce qui est en fait rarement le cas). Il serait donc utile de connaître les limites individuelles dans lesquelles l'effet apparaît (l'effet le plus fort et le plus faible, voire la taille et le nombre des effets inverses).

Ainsi, avant d'aborder la question de la modélisation des processus de reconnaissance des mots écrits, il est bon de rappeler que les descriptions théoriques auxquelles on peut aboutir dépendent grandement de la qualité des moyens d'investigation empirique dont on dispose. La qualité des méthodes employées conditionnent la qualité des données que l'on peut enregistrer et que l'on doit considérer pour contraindre les modélisations du système étudié.

Modèles de la perception