• Aucun résultat trouvé

des Langues Assisté par Ordinateur

3.5 Formalismes lexicaux

3.5.4 Autres outils lexicaux

Décrivons maintenant quelques autres outils lexicaux. Commençons par les applications de dictionnaires. Le Trésor de la Langue Française (TLF) est le dictionnaire électronique le plus complet (Dendien et Pierrel, 2003;

Bernard et al., 2004), disponible en CD-ROM ou sur Internet. Il compte 100 000 mots, 450 000 entrées et 500 000 citations précisément identifiées.

LeDictionnaire d’Apprentissage du Français Langue Etrangère ou Seconde (DAFLES) est conçu comme un outil d’apprentissage innovant qui facilite l’accès à l’information de manière différente que les traditionnels diction-naires sur papier (Selvaet al., 2003)50. Les informations sont filtrées selon les besoins. On trouve de nombreuses collocations et des listes associatives d’actants, comme scrutin, vote, élu, corps électoral, électeur etc. pour élec-tion. Alfalex (Actieve Leeromgeving Frans voor Anderstaligen - LEXicon, Verlindeet al., 2003) est un environnement actif d’apprentissage du français langue étrangère pour néerlandophones, inspiré du DAFLES et d’AlexiA (§B.2.1, Selva et Chanier, 2000).

Le projet multilingue Papillon51 (Mangeot et Thevenin, 2004) est une base lexicale multilingue de l’allemand, l’anglais, du français, du japonais, du malais, du lao, du thaï, du vietnamien, du chinois, etc. établi sur une base collaborative (§2.3), dont Zock (2006) propose une application pédagogique.

Citons encore les travaux de Tschichold et ten Hacken (1998); ten Hacken et Tschichold (2001) et Hamel et al. (1995); Singleton et al. (1998). Enfin, les réseaux sémantiques pourraient également fournir des aides intéressantes

50. Le DAFLES est disponible à l’adressehttp://www.kuleuven.ac.be/dafles/, dernier accès le 30 juillet 2004.

51.http://www.papillon-dictionary.org/, consulté le 30 octobre 2004.

pour l’apprentissage (Wilks et Farwell, 1992; Ji et al., 2003; Ji et Ploux, 2003; Ploux et Ji, 2003).

3.5.5 Discussion

Dans cette section, nous avons brièvement discuté de l’utilité des lexiques dans l’apprentissage des langues. Ils sont importants à deux titres : (i) en tant que tels, ils peuvent constituer une aide à la rédaction et à l’apprentissage ; (ii) combinés à d’autres outils de TAL, ils peuvent aider à la correction automatique et vérifier si la réponse de l’apprenant est compatible avec la réponse attendue par le système.

Parmi les formalismes lexicaux d’une certaine envergure, WordNet (§3.5.3) est le plus étendu. LeLexique Génératif (§3.5.1) est un formalisme très compliqué et difficile à bâtir, qui n’a pas été réellement implémenté sur ordinateur. Le lexique de la Théorie Sens-Texte (§3.5.2) est également difficile à construire et à définir, mais pour le français, le lexique a une éten-due qui pourrait s’avérer utilisable en ALAO. Enfin, nous pouvons aussi mentionner le Trésor de la Langue Française, qui est un dictionnaire per-formant et utile. D’autres applications fournissent des lexiques de moindre envergure. Les applications de type dictionnaire fournissent des indications utiles sur les collocations et les relations telles que l’hyponymie ou l’hyper-onymie. Par contre, les réseaux sémantiques permettent de découvrir des relations de proximité entre mots. A notre sens, les deux types d’outils sont utiles et peuvent se compléter. Relevons enfin que les liens hypertextes et les possibilités d’affichage et de représentation des informations offrent une plus-value indéniable aux supports électroniques par rapport aux versions papier classiques.

3.6 Conclusion

Dans ce chapitre, nous avons examiné les techniques de traitement du langage, et en particulier leur application au domaine de l’ALIAO. Nous avons pu constater que, plus les applications sont de haut niveau, plus elles sont sensibles aux erreurs, qui sont légion dans des productions des appre-nants. Issac et Hû (2002) soulignent qu’un petit gain en performance des outils d’intelligence artificielle entraîne un très fort accroissement de la com-plexité du système. Or il est impératif de pouvoir disposer d’outils fiables, robustes et rapides.

En outre, dans de nombreux domaines, les outils de TAL se heurtent à l’écueil de la compréhension des énoncés et de la connaissance du monde.

Certes, les performances des outils de TAL sont plus probantes si l’on res-treint le vocabulaire, les structures syntaxiques disponibles et les tâches à effectuer. Pourtant, les apprenants d’une langue étrangère ont toujours besoin de capacités générales de production et de compréhension, et cette capacité doit notamment être acquise par la consultation de documents au-thentiques, écrits ou oraux. Or il est plutôt préjudiciable à l’enseignement et frustrant pour l’enseignant de devoir choisir des documents en fonction du degré de couverture des outils et non en fonction des capacités du public cible ou du niveau que les apprenants doivent atteindre.

Ainsi, de nombreux efforts ont été déployés dans le domaine du TAL, avec des progrès de niveau très inégal en fonction des sous-domaines. Les do-maines les plus utilisés dans l’ALAO sont par conséquent la synthèse (§3.1.4) et la reconnaissance vocale (§3.1.3), l’étiquetage (§3.1.2), les concordanciers (§3.1.7), les applications lexicales et, dans une moindre mesure, l’analyse syntaxique et la détection d’erreurs (§3.3). De manière un peu pessimiste, Bailin (1995) souligne que les coûts de production de systèmes d’ALIAO sont considérables et qu’ils apportent encore peu de bénéfices et d’acquis pour l’enseignement. Quant à Goodfellow et al. (2001), ils constatent que l’analyse de bas niveau au niveau lexical peut constituer une bonne alter-native à la trop faible qualité des outils de TAL disponibles pour l’ALAO.

Ils proposent de se concentrer sur les mots de vocabulaire utilisés par les apprenants en se basant sur les fréquences de mots.

Par contre, dans un bilan des projets parus dans le domaine du traite-ment des langues appliqué à l’ALIAO de 1978 à 2004, Heift et Schulze (2005) constatent que les programmes affichent des ambitions plus réalistes. L’ac-cent est désormais mis sur la modélisation de l’apprenant et la remédiation, tout en poursuivant la tâche initiale de repérer les erreurs des apprenants.

Des agents intelligents qui ciblent des tâches précises valent mieux que de grands systèmes qui visent une couverture étendue de la langue.

Pour notre part, nous soulignons que des progrès significatifs ont été faits dans la plupart des domaines évoqués. L’ALAO et le TAL sont des disciplines encore jeunes qui n’ont pas encore atteint la maturité du fait de la complexité de la langue. Les techniques utilisées sont encore expérimen-tales. C’est pourquoi nous n’avons présenté pratiquement que des prototypes de recherche, à l’exception de certains correcteurs commerciaux, du logiciel Herr Kommissar (§B.3.5) et de logiciels basés sur la reconnaissance vocale.

Nous préférons pourtant montrer un optimisme relatif et pointer les béné-fices potentiels ou réels plutôt que d’insister sur les faiblesses des outils et

leur caractère inachevé.

Comme pistes de recherche pour l’avenir, mentionnons d’abord l’utili-sation de ressources de bas niveau comme aides à l’élaboration d’exercices, comme le fait le projetMIRTO(§B.2.21). Ces ressources permettent un gain de temps appréciable pour les concepteurs d’exercices et peuvent apporter une aide à l’apprentissage pour les apprenants. Les techniques de correction basées sur les étiqueteurs sont aussi une approche intéressante, qui permet assez rapidement à des non-informaticiens de bâtir des règles d’erreurs.

Par ailleurs, à partir d’un certain niveau, les apprenants peuvent se mon-trer des alliés efficaces pour aider les outils de diagnostic. En répondant à des questions simples, ils peuvent préciser leurs intentions et aider la dé-sambiguïsation. Il faut toutefois éviter que l’apprenant perde trop de temps dans ce processus.

Enfin, didacticiens, informaticiens, linguistes et psychologues doivent tra-vailler ensemble pour améliorer l’efficacité des interfaces et des diverses re-présentations des phrases, afin d’améliorer l’apprentissage. L’informatique permet de présenter rapidement de nombreuses informations sur la struc-ture des phrases et sur les mots, ce qu’un correcteur humain n’a pas le temps de faire sur le papier. De plus, des mises en évidence par des animations rem-placent avantageusement les dessins au tableau noir ou au rétroprojecteur.