• Aucun résultat trouvé

2 Les programmes de deuxième génération

2.1 Les outils lexicau

Un grand nombre d’outils lexicaux à base de traitement automatique du langage naturel sont maintenant disponibles. Il s’agit notamment de dictionnaires en ligne de diverses formes (monolingues, bilingues, spécialisés), de concordanceurs, d’analyseurs morphologiques, d’analyseurs syntaxiques et de vérificateurs d’orthographe et de grammaire. L’outil le plus fréquemment rencontré est le dictionnaire électronique (nous y reviendrons au chapitre 5) même si ceux-ci, pour l’instant, n’ont rien de spécifiquement informatique mais sont des adaptations sur ordinateur de la version papier.

Mayday (Sussex, Cumming et Cropp, 1994) est un environnement ouvert d’aide à l’apprentissage lexical qui repose, d’une part, sur un jeu d’activités lexicales et, d’autre part, sur plusieurs outils lexicaux complémentaires. Le but du système est de familiariser l’apprenant au phénomène de la composition de vocables en anglais à l’aide d’affixes, de préfixes et de suffixes. Pour cela, plusieurs activités lexicales sont proposées telles que des exercices sur les affixes des verbes (figure 2.2), des mots-croisés, des correspondances de sens entre une série de définitions et une autre de vocables composés à l’aide d’affixes, de préfixes et de suffixe ou bien des exercices à trous (l’apprenant doit trouver le vocable manquant à l’aide de racines et de suffixes proposés dans une liste).

Pour toutes ces activités, qui sont indépendantes les unes des autres, qui peuvent être faites dans n’importe quel ordre et à tout moment, l’apprenant dispose de nombreux outils lexicaux variés. L’environnement comprend un dictionnaire pour apprenant (Oxford Advanced

Learner’s Dictionary), un dictionnaire de synonymes, un corpus d’exemples, une présentation

sonore des vocables pour indiquer la prononciation et un module de construction de vocables composés à l’aide d’une racine. Le but de ce système étant justement d’étudier la composition des vocables, les entrées des dictionnaires sont les racines et les vocables composés doivent être consultés à partir du module de construction. Les définitions du dictionnaire sont numérotées et séparées du reste des informations (phonétique, exemples, etc.) de manière à pouvoir comparer les sens sans avoir à lire d’autres types d’informations. Celles-ci, dans les autres ressources, sont toutefois reliées au sens en question dans le dictionnaire principal par le même numéro, ce qui évite de se perdre. Par ailleurs, le système respecte les principes d’ergonomie et d’interaction homme-machine : la disposition des différents éléments à l’écran doit être la plus simple et la plus intuitive possible. Les outils, l’interaction avec l’apprenant, ses réponses et le retour de l’ordinateur sont dans des zones séparées qui conservent le même aspect et qui restent aux mêmes endroits dans toutes les activités. D’après les auteurs, l’utilisation du système n’a posé aucun problème même pour les étudiants qui éprouvaient des réticences vis-à-vis de l’ordinateur.

Mayday est donc un environnement ouvert d’exploration lexicale pour l’apprentissage de la langue dans le sens où l’apprenant a à sa disposition plusieurs sources d’informations et la possibilité d’appliquer plusieurs stratégies possibles pour parvenir à l’information recherchée. L’enseignant a aussi un rôle important à jouer dans la mesure où il peut aider et conseiller l’étudiant dans son travail. Le but de cette recherche est d’établir la quantité de connaissances que l’enseignant doit avoir sur la tâche que l’étudiant est en train d’effectuer pour pouvoir l’aider et le guider convenablement. Ce système est bien de seconde génération dans le sens où il aborde véritablement la question de l’apprentissage lexical et les types d’interactions que les apprenants peuvent avoir avec de tels programmes.

Pour autant, il ne faut pas réduire ces programmes à forte composante d’outils lexicaux à ces ressources lexicales elles-mêmes. Sans principes pédagogiques sous-jacents, un système ne peut prétendre favoriser l’apprentissage. C’est le cas, par exemple, de GLOSSER dans sa version actuelle (Nerbonne et Smit, 1996 ; Dokter et al., 1997 ; Nerbonne et al., 1998). GLOSSER est un environnement informatique composé uniquement de ressources lexicales. Il est destiné à faciliter la lecture de textes français pour des apprenants néerlandais, bien qu’en principe, il puisse s’adresser à d’autres étudiants apprenant d’autres langues pourvu que les ressources en question soient disponibles. Il est composé d’un corpus de textes français, d’un dictionnaire bilingue français-néeerlandais (Van Dale), d’un analyseur (analyse morphologique et désambiguïsation), Locolex (Bauer et Zaenen, 1995), développé par Rank Xerox et d’un corpus d’exemples accessible par un concordanceur. L’apprenant choisit donc un texte, le lit et par simple clic, peut consulter différentes informations dans les différentes ressources. Il peut donc avoir aussi bien la traduction du vocable dans sa langue, que sa forme canonique ou qu’une liste de phrases contenant le même vocable afin de comparer. D’après les auteurs (Nerbonne et al., 1998), le système facilite l’approche d’un texte en langue

étrangère. En effet, ils notent le plus grand nombre de vocables consultés dans le dictionnaire électronique par rapport à sa version papier (il faut 22,6 secondes en moyenne pour consulter un vocable dans le dictionnaire électronique contre 85,7 pour sa version papier) et la diminution conséquente de temps nécessaire pour lire le texte. Ils concluent sur le fait que ces deux phénomènes peuvent améliorer l’acquisition lexicale. Cette conclusion semble un peu rapide. En effet, ils remarquent, avec sincérité, que l’expérimentation n’a pas révélé de différence notable dans la compréhension du texte entre les deux méthodes, mais, toutefois, qu’ils s’attendent à ce que celle-ci apparaissent avec un nombre plus important de sujets. En attendant, cela reste à confirmer. Il nous semble en effet que cette constatation (pas de différence significative de compréhension entre les deux méthodes) puisse s’expliquer par d’autres raisons, notamment par la faiblesse des principes pédagogiques sous-jacents au système.

Tout d’abord, le choix des textes. A aucun endroit, les auteurs ne motivent leur choix sur les textes qu’ils présentent. Ceux-ci sont extraits d’Internet (projet Gutenberg par exemple), ou bien de projets de corpus spécialisés (MULTEXT, ECI). Il s’agit donc de textes « tout- venant », de sujets très variés, plus ou moins spécialisés et dont les niveaux de difficulté, par rapport au public visé de niveau intermédiaire (plutôt en lycée), peuvent être non pertinents pédagogiquement (ce que les auteurs reconnaissent d’ailleurs).

Le point fort du système réside dans la présence de l’analyseur Locolex. En effet, grâce à celui-ci, le lien peut être effectué entre les chaînes de caractères du texte et les entrées du dictionnaire électronique bilingue. L’analyse morphologique et la désambiguïsation permet d’orienter le système vers l’entrée la plus appropriée, avec un taux d’erreur satisfaisant et conforme à l’état de l’art. Cependant, même si l’utilisation du dictionnaire s’avère incontestablement bien plus pratique que la version papier2, les problèmes d’accès lexical et de compréhension ne sont pas réglés pour autant. Comment se comporte le système en cas d’homonymie, en cas de collocation ? Et surtout, quelle aide apporte-t-on à l’utilisateur pour choisir entre les différentes lexies de l’article, qui peuvent être nombreuses dans certains cas ? Car ce que cherche l’apprenant avant tout n’est pas l’article complet du vocable sélectionné, mais son sens dans le texte. La désambiguïsation sémantique, il est vrai, n’est pas d’un point de vue technologique encore possible et il est probable qu’elle ne pourra jamais être entièrement automatisée. Du reste, le problème est le même avec un dictionnaire papier, comme nous le verrons au chapitre suivant. Les auteurs tentent bien une correspondance (matching) entre le contexte du vocable sélectionné et celui des exemples du dictionnaire. Même si cette tentative peut dans certains cas porter ses fruits, il est probable qu’elle ne sera pas applicable la plupart du temps. Une solution consiste à préparer à l’avance les textes, en désambiguïsant (attribution d’un numéro de sens en correspondance avec le dictionnaire) par exemple les vocables les plus polysémiques. Il ne serait plus alors question de travailler sur des textes tout-venant mais les limites des traitements automatiques sur ce point imposent une

2

Il faut noter toutefois que l’accès au dictionnaire interrompt le processus de lecture (surtout s’il dure en moyenne 22 secondes, ce qui n’est tout de même pas négligeable). Il ne faut donc pas en abuser et inciter l’apprenant à ne chercher dans le dictionnaire que les vocables importants pour la compréhension et difficiles à comprendre d’après le contexte.

compensation par un apport humain manuel. En fait, une décision pédagogique doit être prise en fonction du niveau des apprenants et de la difficulté des textes. Il nous semble qu’une telle préparation est inévitable lorsque le niveau des apprenants n’est pas assez élevé par rapport à celui du texte.

Le même problème surgit avec les exemples : est-il intéressant, pour la compréhension du vocable en question, d’avoir une série de phrases dans lequel il peut être employé avec un sens différent ? On peut aussi se poser la question de la pertinence de ces concordances lors d’une lecture. L'étude de l'utilisation du système montre qu’elles sont bien moins utilisées que le dictionnaire. Ceci peut s'expliquer par le fait que le dictionnaire est un outil bien plus familier que le concordanceur. Mais la raison principale réside sans doute dans le fait que l'examen des exemples est une opération complexe qui demande beaucoup plus de temps et de réflexion de la part de l'apprenant qu'une consultation dans un dictionnaire. De plus, le résultat (trouver la signification du vocable ou des éléments de signification) est loin d'être garanti. Le concordanceur nous semble surtout pertinent pour l'exploration du lexique (nous y reviendrons un peu plus loin), mais beaucoup moins lorsqu'il s'agit de compréhension écrite. Car il ne faut pas oublier que pendant ce temps la lecture est interrompue (et sans doute beaucoup plus longtemps que dans le cas d'un dictionnaire), ce qui est toujours préjudiciable à la compréhension. Quant à l’analyseur morphologique, en dehors de son utilisation pour déterminer l’entrée du dictionnaire à consulter, il est certes intéressant pour comprendre les mécanismes de flexion et pour trouver la forme canonique, mais il n’apporte rien sur le plan de la compréhension du texte.

Enfin, sans la moindre conservation explicite, et organisation, des vocables consultés (sous forme d’enregistrements dans une base de données personnalisée par exemple), il y a fort à parier que ceux-ci ne seront pas retenus (il faut en effet une exposition répétée et une révision régulière, chapitre 1) et donc appris. L'étude de l'utilisation du système montre d'ailleurs qu'un certain nombre de vocables ont dû être consultés plusieurs fois car leur signification avait été oubliée entre-temps. Le système permet de sauvegarder les traductions des vocables consultés. Ceci nous semble pourtant insuffisant comme annotation, car une simple traduction se résume à un accès de dictionnaire optimisé (l'apprenant obtient le sens correct immédiatement). Il n'implique rien sur la mémorisation. Aucun travail sur le sens n'est effectué et le lien dans le lexique mental sera d’autant plus faible. Par ailleurs, un dictionnaire bilingue est loin de donner toutes les informations nécessaires à la connaissance d’un vocable. En conclusion, GLOSSER, quoiqu’en disent ses auteurs, ne nous semble pas un bon exemple d’environnement favorisant l’apprentissage lexical. Il présente des idées intéressantes pour la lecture de textes mais, en l’état actuel du système, la compréhension et la mémorisation des vocables nous semble plus problématique. Il se résume à ses ressources, et n’a pas vraiment de programme pédagogique d’acquisition de vocabulaire. Il est donc nécessaire que ce système soit amélioré, notamment par l'ajout de plus d’aide à la compréhension et par celui d'un module permettant de revoir et d’organiser les annotations les unes par rapport aux autres.