• Aucun résultat trouvé

M ODÈLES POUR LE DOMAINE VISUEL

IV. MODÈLES DE LA RECONNAISSANCE DES MOTS COMPLEXES RENDANT COMPTE DES EFFETS DE LA TRANSPARENCE SÉMANTIQUE ET DU DEGRÉ D'AFFIXATION

1. M ODÈLES POUR LE DOMAINE VISUEL

MODÈLE D'ACTIVATION INTERACTIVE DE TAFT (1994)

Dans le but d'actualiser l'architecture de son modèle aux courants théoriques des années 90, Taft a modifié son modèle sériel (Taft & Forster, 1975) en un modèle d'activation interactive (Taft, 1994).

Dans son nouveau modèle (cf. Figures 3 et 4), l'auteur prévoit plusieurs niveaux de représentations, dont un niveau morphémique, un niveau lexical et un niveau conceptuel. Sont représentés, au niveau morphémique, les morphèmes liés, c'est-à-dire les affixes (préfixes et suffixes) ainsi que les racines liées (dans l'exemple proposé dans la Figure 4 : re- et -late). Au niveau lexical, on trouve les représentations codant la forme entière de tous les mots connus du sujet, c'est-à-dire, les mots monomorphémiques (dans l'exemple des Figures 3 et 4 : late, heat) et les mots dérivés (dans l'exemple des Figures 3 et 4 : relate, reheat). Les racines libres, qui entrent dans la composition des mots dérivés, sont également codées à ce niveau, puisqu'elles constituent des mots à part entière. Ainsi, tout comme dans la première version du modèle de Taft, les morphèmes liés (racines liées, affixes) sont représentés au niveau qui précède le niveau où sont représentés les mots et les racines libres.

Les formes codées au niveau morphémique sont connectées aux formes des mots dérivés qui les contiennent. Ainsi, pour accéder à la représentation unitaire de la forme d'un mot complexe, il est nécessaire d'activer, au préalable, la représentation de chacun de ses composants morphémiques (racine + affixe). Ce postulat n'implique pas pour autant qu'un mot qui contient un fragment formellement identique à une racine soit connecté aux mots complexes qui renferment la racine en question. On notera en effet que, si un mot monomorphémique ne correspond formellement mais pas sémantiquement à la racine d'un mot complexe, les représentations associées à ces deux mots ne sont pas reliées [dans l'exemple de la Figure 4 : late: "not on time" (en retard) et relate "to pertain to" (relier)].

Le sens des mots complexes peut être codé de deux manières. Si le mot est sémantiquement transparent, les morphèmes qui le composent activent directement la signification qui leur est associée au niveau conceptuel. Dans ce cas, la signification du mot complexe correspond à

l'activation conjointe de la représentation sémantique de chaque morphème qui le constitue. Par exemple, reheat correspond à la combinaison du sens de re- : "again" et de heat : "make hot", c'est-à-dire "make hot again". Ainsi, la représentation unitaire d'un mot morphologiquement complexe transparent sur le plan sémantique n'a pas de correspondant direct au niveau conceptuel (cf. Figure 3). Le sens d'un mot sémantiquement opaque doit, par contre, être accessible à partir de la forme entière du mot (cf. Figure 4), étant donné que sa signification ne peut être directement inférée à partir du sens des composants morphémiques. Dans l'exemple, relate ne signifie pas "not on time again" (re- + late), mais "to pertain to".

Chaque segment affixal ayant une signification récurrente dans plusieurs mots active directement la représentation correspondante au niveau conceptuel10. Ceci est vrai, même si

l'affixe en question n'apporte pas le sens attendu dans le mot en cours de traitement. Taft donne l'exemple de in- de invent. Ce fragment activerait la signification "in-ess"11 alors que

dans invent, il n'y porte pas cette signification.

Ainsi, selon Taft, les affixes, les racines libres et les racines liées ont une existence autonome au sein du lexique. Les mots, monomorphémiques ou morphologiquement complexes, sont, en outre, tous représentés au niveau lexical sous une forme unitaire. L'accès aux représentations lexicales des mots complexes demande nécessairement l'activation de celles codant les morphèmes qui les composent. On notera que la représentation d'un fragment formellement similaire à une racine n'est pas connectée à celles codant les mots morphologiquement complexes qui renferment la racine en question. Par ailleurs, seules les représentations unitaires des mots complexes ayant une sémantique opaque, contrairement à

10 Taft n'exclut pas que les représentations de certaines racines liées, sémantiquement transparentes, soient directement connectées au niveau conceptuel.

celles codant les mots morphologiquement complexes dont le sens est transparent, sont directement reliées à une représentation du niveau conceptuel. Les représentations codant les affixes ne sont directement connectées aux représentations du niveau conceptuel que si elles possèdent une signification récurrente dans plusieurs mots complexes.

RE HEAT REHEAT "make hot" "again" CONCEPT WORD BOUND MORPHEME

CONCEPT : niveau conceptuel WORD : niveau lexical BOUND MORPHEME : niveau morphémique

Figure 3 : Modèle de Taft (extrait de Taft, 1994, p. 286) pour un mot complexe contenant une racine libre. LATE RE LATE RELATE "not on time" "pertain to" "again" CONCEPT WORD BOUND MORPHEME

CONCEPT : niveau conceptuel WORD : niveau lexical BOUND MORPHEME : niveau morphémique

Figure 4 : Modèle de Taft (extrait de Taft, 1994, p. 286) pour un mot complexe contenant une racine liée.

Le passage d'un modèle de décomposition pré-lexicale (Taft & Forster, 1975) à un modèle mixte d'activation interactive (Taft, 1994) permet de mieux expliquer les différents effets relatifs à la structure morphologique des mots en reconnaissance, en particulier les effets des degrés de transparence sémantique et de préfixation.

Explication des effets

L'effet de la structure morphémique des non-mots

Taft propose que la racine liée et/ou l'affixe du non-mot active, au niveau morphémique, la représentation qui lui(leur) est associée. En conséquence, les représentations des mots morphologiquement complexes qui la(les) contiennent, sont également activées. La présence de cette activation lexicale induit une augmentation du temps nécessaire pour effectuer correctement la tâche demandée, c'est-à-dire ne pas considérer le non-mot présenté comme un mot.

Dans ce modèle, un effet différentiel de la présence d'une racine selon que le segment adjoint peut ou non prendre une valeur de préfixe n'est pas attendu, une analyse morphologique procédant par extraction du

préfixe n'est en effet plus postulée. Les racines et les segments affixaux ont le même statut. Les résultats obtenus par Taft à la fin des années 70 sont donc plus difficilement compréhensibles (différence entre non-mots préfixés et non-mots non-préfixés, ainsi que différence entre les non-mots préfixés contenant une racine et ceux ne contenant pas de racine), tandis que ceux observés par Caramazza et al. sont mieux expliqués (association d'un effet de la présence d'un préfixe et d'un effet de la présence d'une racine dans les non-mots).

L'effet de la fréquence de la racine

Taft pose que les représentations codant des racines fréquentes sont plus facilement activables que celles associées aux racines peu fréquentes. Les mots fréquents sont donc plus rapidement reconnus que les mots rares.

L'effet de l'amorçage morphologique

Taft postule que la présentation préalable de la racine liée et celle du préfixe augmente le niveau d'activation de la représentation mentale qui leur est associée, facilitant par conséquent leur activation lors de la présentation du mot-cible qui les contient.

L'effet de pseudo-préfixation

Taft propose que le pseudo-préfixe active, au niveau morphémique, une représentation qu'il ne devrait, en réalité, pas activer (celle du segment auquel il est formellement équivalent). Par conséquent, les différents mots morphologiquement complexes associés à cette entrée, ainsi que la signification du préfixe, sont activés. Ces différentes informations entrent en compétition avec celles activées par la forme globale du mot. Le temps nécessaire à la prise de décision en est donc allongé.

L'effet de la transparence sémantique

La différence entre les mots complexes transparents sur le plan sémantique et les mots complexes opaques est double. Premièrement, la racine composant un mot complexe opaque sur le plan sémantique (par exemple late de relate) n'est pas reliée à la racine homologue contenue dans les mots complexes transparents sur le plan sémantique (par exemple la représentation de la racine heat est reliée aux représentations codant les mots reheat et heat).

Deuxièmement, un mot transparent sur le plan sémantique n'est pas uniquement associé à un nœud conceptuel spécifique ; alors qu'un mot complexe opaque sur le plan sémantique l'est. La signification des affixes [dans l'exemple (re-)] et de la racine [dans l'exemple (heat)] permettent par exemple de construire la signification du mot complexe transparent sur le plan sémantique (ici reheat).

Les mots transparents sur le plan sémantique bénéficieraient donc de deux sources d'activation supplémentaires, celle liée, au niveau lexical, à l'activation conjointe des mots contenant la même racine et, au niveau sémantique, grâce à l'activation de la signification de chaque morphème qui les composent. Ces deux sources d'activation n'existent pas pour les mots opaques sur le plan morphologique. Les représentations codant les mots transparents sur le plan morphologique devraient donc être plus facilement activables que celles codant des mots opaques sur le plan morphologique, puisqu'elles sont liées à un nombre plus important de sources d'activation.

L'effet du degré de préfixation

Selon le modèle de Taft, plus un affixe est fréquemment utilisé dans des mots complexes, plus le lien entre sa représentation du niveau morphologique et celle du niveau conceptuel est fort. Ainsi plus ce lien est important, plus le feed-back entre ces deux niveaux sera important. Un mot dont le degré de préfixation est élevé sera donc plus rapidement reconnu qu'un mot dont le degré de préfixation est faible.

1.2. MORPHOLOGICAL RACE MODEL FRAUENFELDER & SCHREUDER (1992)

Le modèle de Frauenfelder & Schreuder (1992) propose également l'existence de deux types de représentations lexicales pour les mots complexes : la forme entière (campeur) et la forme décomposée (camp- et -eur). Une voie d'accès particulière – respectivement directe et analytique – est associées à chaque type d'entrées.

Ces postulats sont fort proches de ceux proposés par Caramazza et al et Taft. La nouveauté réside dans la compétition (race model) entre les deux voies d'analyse. Ainsi, comme nous le verrons ci-dessous, selon ses caractéristiques intrinsèques (fréquence de surface, degrés de transparence phonologique et sémantique), un mot peut être reconnu via la voie directe ou la voie analytique.

La voie directe

Selon le modèle, le choix de la voie directe est déterminé par la fréquence de surface du mot à reconnaître, facteur influençant le niveau de repos des représentations codant les mots entiers (cf. effet de la fréquence de surface). Ainsi tous les mots fréquents – simples et complexes - seront reconnus via la voie directe, car le niveau de repos des représentations associées est élevé. Peu d'activation supplémentaire est alors nécessaire avant la sélection de la représentation adéquate.

La voie analytique

Le choix de la voie analytique dépend de la fréquence des morphèmes traités et des degrés de transparence phonologique et sémantique du mot analysé. Ainsi, cette voie gagne la course

• lorsque les morphèmes – racines et affixes – qui composent le mot complexe sont fréquents, leur niveau de repos étant élevé (cf. effet de la fréquence cumulée) ;

• lorsque le mot est transparent sur le plan phonologique, car les composants morphologiques peuvent être facilement identifiés (cf. effet de la transparence phonologique) ;

• lorsque le mot est transparent sur le plan sémantique, car le sens des composants morphologiques est plus facilement intégrable (cf. effet de la transparence sémantique).

Ainsi, il y a compétition entre les deux voies, lorsque les mots sont peu fréquents, plutôt opaques sur les plans phonologique et sémantique et ne contiennent pas de morphèmes fréquents.

Comprendre un néologisme

Que se passe-t-il lorsqu'un nouveau mot est rencontré ? Lorsqu'un néologisme contient plusieurs morphèmes attestés de la langue et est transparent sur les plans phonologique et sémantique, l'analyse morphologique est amorcée. Par contre, lorsqu'il est opaque sur les plan phonologique et sémantique, la voie directe est choisie.

Avec le temps, le nouveau mot transparent sur les plans phonologique et sémantique continue à être analysé morphologiquement et ce d'autant plus que les morphèmes qui le composent deviennent fréquents (analyse morphologique réussie). Ainsi, plus l'analyse morphologique est un succès, plus la probabilité qu'elle soit utilisée lors d'une rencontre ultérieure pour le mot en question est élevée. Par contre, si l'analyse morphologique ne rencontre pas le succès escompté, ce qui survient lorsque le néologisme est plutôt opaque sur les plan phonologique et/ou sémantique, l'activation des représentation codant les morphèmes décline. La probabilité que la voie directe gagne la course augmente progressivement.

Explication des effets

L'effet de la structure morphologique des non-mots

La reconnaissance d'un non-mot procède obligatoirement par voie analytique. Toutefois, plus un non-mot ressemble à un mot de la langue – en contenant par exemple un et/ou deux morphèmes, plus les représentations associées à ces segments vont être activées. La reconnaissance du non-mot en tant que tel est donc rendue d'autant plus difficile que le nombre de morphèmes qu'il contient est élevé.

L'effet de fréquence de la racine

Les auteurs postulent qu'une représentation est d'autant plus facilement activable que le fragment qu'elle code est fréquent. Comme les représentations du lexique proprement dit contiennent, outre les représentations codant les mots en leur entier, les représentations codant les morphèmes, la fréquence des morphèmes peut également influencer la rapidité avec laquelle les mots morphologiquement complexes sont reconnus.

L'effet de pseudo-préfixation

L'effet de pseudo-préfixation n'est pas prévu tel quel par le modèle de Frauenfelder & Schreuder. Pour qu'un segment formellement similaire à un préfixe influence les procédures de reconnaissance des mots complexes, il doit être suffisamment fréquent et avoir un rôle morphologique dans une proportion importante de mots complexes. Dans ce cas, la présence d'un tel segment dans un mot monomorphémique (pseudo-préfixé) pourrait activer la représentation associée au préfixe homologue.

L'effet de l'amorçage morphologique

Frauenfelder & Schreuder proposent que la présentation préalable de la racine liée et/ou de l'affixe diminue le seuil d'activation de la représentation lexicale qui leur est associée, facilitant en conséquence leur activation lors de la présentation du mot-cible.

L'effet de la transparence sémantique

Seuls les mots transparents sur le plan sémantique sont reconnus par voie analytique et donc bénéficient d'une double activation (celle associée à chaque morphème). La vitesse à laquelle ces mots sont reconnus sera donc plus élevée que pour les mots opaques sur le plan sémantique. Ces derniers ne bénéficient que de l'activation de la représentation entière qui les code.

L'effet du degré de préfixation

Plus la probabilité qu'un segment formellement similaire à un préfixe particulier s'avère être un véritable préfixe est élevée, plus la représentation associée aura un niveau d'activation élevé et donc plus elle jouera un rôle important durant la reconnaissance des mots qui la contiennent. Les mots à degré de préfixation élevé seront donc reconnus plus rapidement que les mots dont le degré de préfixation est bas.

1.3. MODÈLE DE SCHREUDER & BAAYEN 1995

Le modèle de Schreuder & Baayen (1995) a été construit sur la base du modèle de Frauenfelder & Schreuder (1992). Deux routes d'analyse sont à nouveau décrites – la voie directe et la voie analytique. La principale différence entre le modèle de Frauenfelder &

Schreuder et celui de Schreuder & Baayen réside dans la coopération plutôt que la compétition entre les deux voies d'analyse.

Selon les auteurs du présent modèle, la fonction cruciale de la prise en compte de la structure interne des mots réside dans le calcul du sens. Poursuivant ce but, ils ont construit un modèle dont l'architecture hybride prévoit des calculs symboliques et des mécanismes d'activation interactive (cf. Figures 5 et 6).

Figure 6 : Liens entre les représentations d'accès (niveau A), les conceptual nodes (niveau B), les représentations sémantiques et syntaxiques (niveau C) pour les mots hollandais boek (livre) et ruim (spacieux) et les mots appartenant à leur famille morphologique respective (Schreuder & Baayen, 1995, p. 138).

Les 3 niveaux de représentations Les représentations d'accès

Les représentations d'accès existent pour les mots entiers ainsi que pour les morphèmes libres et liés. Elles contiennent des information spécifiques à la modalité dans laquelle le signal est produit (écrit ou oral) mais sont déjà normalisées (plus de différence entre différents locuteurs). La vitesse à laquelle elles deviennent activées dépend de leur niveau d'activation au repos mais également de la complexité des opérations d'appariement avec le signal d'entrée. Par ailleurs, leur niveau d'activation en cours de traitement dépend de la quantité de feedback qu'elles reçoivent depuis le niveau supérieur, celui des concept nodes (voir ci- dessous).

Les concept nodes

Les représentations intermédiaires - appelées concept nodes par les auteurs – sont interconnectées entre elles. Elles jouent un rôle important dans le cheminement d'un stimulus vers le signifié qui lui correspond. Elles servent en effet à la médiation entre les représentations d'accès et les représentations sémantiques et syntaxiques. Leur niveau d'activation au repos dépend de leur fréquence d'usage.

A ce niveau, les mots simples et les mots complexes opaques sur le plan sémantique sont représentés sous une forme globale. Seuls les mots transparents sur le plan sémantique12 sont

codés sous un format décomposé. Par ailleurs, toutes les formes fréquentes sont également codées sous un format unitaire. Par exemple, un mot complexe transparent sur le plan sémantique (même fléchi) et très fréquent peut développer sa propre représentation lexicale.

Les représentations sémantiques et syntaxiques

Au niveau supérieur, les représentations sémantiques et syntaxiques définissant respectivement des aspects particuliers du signifié et les propriétés combinatoires des mots. Notons que ce qui est communément appelé représentations lexicales, correspond aux

concept nodes, et aux informations sémantiques et syntaxiques associées.

Les 4 étapes de traitement L'étape de segmentation

La première étape, celle de la segmentation, permet l'appariement de l'input sensoriel aux représentations d'accès, codant les morphèmes libres et liés (affixes, racines liées). Les informations prosodiques, les phénomènes de resyllabification, de changements d'accentuation (stress shifts) et autres changements phonologiques peuvent compliquer cette étape de traitement.

L'étape du licensing

La deuxième étape, celle du licensing, vérifie que les représentations co-activées peuvent se combiner entre elles sur la base de leurs caractéristiques de sous-catégorisation.

L'étape de combinaison

La troisième étape, celle de combinaison, s'occupe du calcul de la représentation du mot complexe sur la base des informations sémantiques et syntaxiques des constituants morphémiques activés, leur combinaison ayant été attestée.

La rétro-alimentation

Une procédure de rétro-alimentation permet aux concept nodes d'influencer l'activation des représentations d'accès. Cette influence différera selon que le concept node code un mot entier ou un des morphèmes qui le compose. En effet, le concept node qui code la forme entière d'un mot complexe est connecté à toutes les caractéristiques sémantiques et syntaxique du mot- cible, alors que le concept node codant chaque morphème présent n'est connecté qu'à un sous- ensemble des caractéristiques de mot-cible. Les représentations morphémiques reçoivent donc moins d'activation du niveau sémantique-syntaxique que les représentations codant les mots entiers. Leur influence sur les représentations d'accès sera donc moindre.

Par l'action de la procédure de rétro-alimentation par exemple, la présentation fréquente d'un mot complexe modifiera le format sous lequel il est représenté. Ainsi,

The feedback from the concept nodes to their access representations ensures that frequently processed complex words will eventually be recognized on the basis of their full forms rather than on the basis of their constituents (Schreuder &

Explication des effets

L'effet de la structure morphologique des non-mots

L'existence au sein du lexique mental des représentations codant les morphèmes libres et liés permet d'expliquer l'existence de l'effet de la structure morphologique des non-mots. L'activation de ces représentations retarderait la prise de décision du sujet consistant à rejeter de l'item en tant que mot de la langue (expérience de décision lexicale).

L'effet de fréquence de la racine

La présentation répétée de différents mots d'une même famille morphologique (camper,