• Aucun résultat trouvé

Utiliser un ordinateur pour apprendre est devenu aujourd’hui banal. Dans la plupart des cas, loin d’être un remplaçant des enseignants, l’ordinateur doit être considéré comme un complément utile et une aide à l’apprentis-sage. On trouve des programmes pour enseigner des compétences variées, de qualité et de prix très variables. L’essor de ce type de logiciel a été facilité par la démocratisation de l’informatique, alors qu’il est courant de nos jours de trouver un ordinateur ou davantage dans les ménages. Un ordinateur a l’avantage de pouvoir présenter les notions à acquérir à travers diverses formes, notamment du texte, des animations et même des jeux ; par ailleurs, l’ordinateur est plus disponible qu’un enseignant et peut corriger de manière fiable certaines erreurs commises lors d’évaluations. Les élèves peuvent pro-gresser à leur propre rythme et répéter les exercices à l’envi ; ils sont moins inhibés face à une machine que face à une classe et un enseignant chargé de les évaluer (Garrett, 1995; Levy, 1997; Nerbonne, 2003; Hubbard et Levy, 2006).

La convivialité et la simplicité d’utilisation des ordinateurs facilite l’em-ploi de didacticiels dans de multiples circonstances, que ce soit dans un cadre institutionnel (école, université, . . . ), professionnel ou privé. Les élèves travaillent tantôt seuls, tantôt à plusieurs, parfois en classe, parfois dans d’autres lieux (centres de documentation, salles d’informatique, en dépla-cement, à domicile etc.), tantôt en complément de l’enseignement classique en classe (blended learning), tantôt comme unique outil d’apprentissage. Les concepts enseignés sont très variés, que ce soit la géographie, la mécanique, la finance, la biologie, etc. Les niveaux sont aussi variés, selon les publics

cible, de l’introduction au contenu extrêmement spécialisé et pointu.

Les institutions tirent également profit de l’utilisation de tels logiciels, tant des didacticiels commerciaux prévus pour une utilisation autonome privée que des produits spécialement conçus pour une salle d’ordinateurs ou pour l’enseignement à distance. Par ailleurs, les enseignants utilisent les produits tels quels ou les adaptent à leurs propres besoins. Les enseignants disposent parfois d’outils très utiles pour suivre le travail des élèves : résultats des tests, traces, parcours dans le logiciel etc. Ainsi, les enseignants peuvent se consacrer à d’autres aspects de leur travail en se débarrassant de tâches répétitives (Bailin et Levin, 1989).

La suite de cette section est organisée comme suit. Dans un premier temps, nous abordons l’apprentissage des langues assisté par ordinateur (§1.1.1). Puis nous nous penchons sur le traitement des langues par or-dinateur (§1.1.2).

1.1.1 Apprentissage des langues assisté par ordinateur L’Apprentissage des Langues Assisté par Ordinateur (ALAO)2 est un domaine très prolifique de l’utilisation de l’ordinateur pour la didactique.

Pour souligner le rôle plus actif des élèves et le rôle central qu’ils ont dans le processus d’apprentissage, on utilisera dorénavant le terme d’apprenant 3.

La didactique des langues est un domaine en constante évolution, à l’in-tersection de la linguistique, de la psychopédagogie et de la sociologie ; l’ap-prentissage des langues, lui, se situe au carrefour de la langue, de la culture et de la communication (Defays et Deltour, 2003). Les apprenants doivent ap-prendre à utiliser la langue, à travers de structures de plus en plus complexes et variées et à l’aide d’un vocabulaire de plus en plus riche, dès le niveau débutant, à l’oral comme à l’écrit. La majeure partie des logiciels traitent des langues dominantes et peu sont consacrés à des langues minoritaires.

Il y a trois types d’utilisation de l’ALAO, selon Nerbonne (2003): (i)

aca-2. Autrefois, le sigle d’EAO (Enseignement Assisté par Ordinateur) était très populaire.

Nous choisissons le terme d’apprentissage plutôt que d’enseignement, pour souligner le rôle plus actif des élèves. En anglais, le terme le plus répandu actuellement est Computer-Assisted Language Learning(CALL). On trouve aussi TELL (Technology-Enhanced Lan-guage Learning), qui inclut les autres technologies que l’ordinateur, CBI (Computer Based Instruction), CAI (Computer-Assisted ouComputer-Aided Instruction), ITS (Intelligent Tutoring System), CALLLT (CALL using Language Technologies) et NBLT (Network-based language teaching).

3. En anglais,learner.

démique et scolaire, avec manque de moyens en matériel et logiciels et ensei-gnants parfois réticents ; (ii) industrie, avec beaucoup de moyens, pour un enseignement spécialisé ; (iii) les autodidactes qui apprennent sans aide, un marché en expansion parfois qualifié d’edutainment. Sur le plan du niveau de la langue, plus le public-cible est avancé, plus la question de l’évaluation automatique se pose, comme nous aurons largement l’occasion de l’aborder dans cet ouvrage.

Apprendre une langue est surtout apprendre à communiquer, c’est-à-dire transmettre un contenu porteur de sens à un destinataire. Le but de ces actes de langage est d’agir sur l’environnement du locuteur à travers des mots ; ces buts peuvent être d’informer, d’affirmer, d’inciter, de convaincre, de promettre, etc. (Austin, 1962; Searle, 1969).

La communication est toutefois sujette à des erreurs. Comme tout si-gnal, le langage peut être perturbé par du bruit (bruit sonore, illisibilité de l’écriture, etc.), mais surtout, les langues sont extraordinairement ambigües : les mots ont souvent plusieurs significations, que nous distinguons générale-ment sans problème grâce au contexte de l’énoncé et à notre connaissance générale du monde, très souvent de manière immédiate, inconsciente et sans difficulté. En général, lorsqu’ils communiquent, les êtres humains négocient sans cesse le sens, par exemple grâce à des précisions durant la conversation.

Les apprenants d’une langue étrangère sont souvent handicapés par des la-cunes en vocabulaire et en syntaxe, qui nécessitent l’emploi de stratégies de substitution comme l’emploi de périphrases. De plus, ils commettent de nombreuses fautes lexicales, orthographiques, morphologiques, syntaxiques, etc.

Pour apprendre, il est indispensable que les apprenants manipulent la langue. Il existe des exercices traditionnels comme les textes à trous, les questionnaires à choix multiples, les exercices d’appariement de mots, de remise en ordre de mots etc. Ces exercices sont facilement corrigés par l’or-dinateur. Ces exercices sont également utiles pour vérifier la bonne compré-hension d’un texte par les apprenants. Toutefois, très tôt, il est nécessaire que les apprenants produisent des phrases complètes, dont la complexité va croissant au fil de leur progression. Des techniques basiques peuvent corriger des fautes simples, comme la comparaison de chaînes et la reconnaissance de patrons, mais la complexité et la variété des erreurs commises nécessitent un traitement plus intelligent.

1.1.2 Traitement automatique des langues

Le Traitement Automatique des Langues (TAL)4 est un domaine de l’Intelligence Artificielle (IA) qui traite divers aspects de la langue et du discours, à tous les niveaux, lexical, morphologique, syntaxique, sémantique ou pragmatique. Parmi les applications du TAL, le grand public connaît es-sentiellement la correction orthographique et syntaxique, la reconnaissance de la parole et la synthèse vocale. Pour identifier les erreurs des apprenants, en poser le diagnostic et proposer une correction ou une stratégie de remé-diation, le TAL fournit une aide précieuse et indispensable.

Par contre, le TAL est lui-même très sensible aux erreurs, du fait qu’une application attend en principe une entrée sans erreurs pour lui appliquer un traitement. Une application robuste est capable de fournir un résultat au moins partiel, même en cas d’entrées incorrectes ou inconnues5 (Van-deventer Faltin, 2003). Le second problème rencontré avec les applications de TAL est la surgénération des propositions – avant tout, des structures syntaxiques – qu’il faut trier pour en sélectionner les meilleures. Enfin, le troisième problème est posé par la surdétection des erreurs et les er-reurs de diagnostic, comme les apprenants n’ont pas un jugement aussi af-futé que les locuteurs natifs et se méfient moins des erreurs. Tout au long de cet ouvrage, nous décrirons abondamment les possibilités d’application du TAL à l’ALAO. Pour souligner l’emploi des techniques intelligentes du TAL, on parle alors d’ApprentissageIntelligemment Assisté par Ordinateur (ALIAO).

Levin et Evans (1995, p. 90) constatent que grâce aux outils de TAL, les concepteurs d’exercices peuvent se concentrer sur le contenu, sans avoir à anticiper chaque erreur potentielle des apprenants. Les techniques de TAL sont pourtant loin d’êtres parfaites. A tous les niveaux, les ambiguïtés de la phrase sont nombreuses (Bouillonet al., 1998). Souvent, un mot peut avoir plusieurs catégories syntaxiques, ce que l’on nomme ambiguïté lexicale: en anglais, un mot peut souvent être un verbe (man, homme ; to man équiper [un navire]) ; en français,belle est un nom et un adjectif,voile est un verbe conjugué ou un nom, etc. L’ambiguïté sémantique réside dans l’homonymie

4. On trouvera aussi le terme de TALN (Traitement Automatique du Langage Naturel).

En anglais, le terme le plus répandu est NLP (Natural Language Processing).

5. Il existe de nombreux mots inconnus, qui sont souvent correctement orthographiés et employés dans une phrase, mais ne sont pas listés dans le lexique de l’application informatique. Une application robuste cherchera alors à pallier ces lacunes, comme nous le verrons au chapitre 3. Dans le domaine syntaxique, un analyseur robuste devinera la catégorie lexicale d’un mot et cherchera à fournir des morceaux d’analyses quand il ne peut donner une analyse complète. Pour la synthèse vocale, les mots dont on n’a pas la prononciation devront être phonétisés par le système grâce à des règles.

et la polysémie : lentille peut signifier un objet d’optique, une espèce de plante ou la partie comestible de celle-ci. On rencontre également les ambi-guïtés syntaxiques: certains éléments de la phrase peuvent être liés à plu-sieurs autres éléments, ce qui implique des changements d’interprétation6. Examinons les phrases suivantes :

(1) a. Jean regarde l’homme sur la colline avec ses jumelles.

b. La soupe de légumes du restaurant.

En (1a), nous avons deux syntagmes prépositionnelssur la colline etavec ses jumelles. Ces syntagmes peuvent tous deux être rattachés soit au syn-tagme nominal l’homme, soit au syntagme verbal regarde l’homme et donc se rapporter au sujetJean. Le syntagme avec ses jumelles peut même être attaché à colline; cet attachement est difficilement interprétable au niveau sémantique, mais tout à fait valable du point de vue syntaxique. En outre, jumellesdénote soit deux individus de sexe féminin, soit un instrument d’op-tique. Le pronom possessifses peut se rapporter àJean, àl’homme ou à un tiers mentionné auparavant dans le discours. Ainsi, avec dix mots seulement, on atteint déjà un nombre important d’interprétations. De même, en (1b), les deux groupes prépositionnels de légumes et du restaurant doivent être rattachés à soupe comme complément du nom. Cependant, avec la même préposition de,légumes désigne le type de soupe et est un complément du nom de matière tandis querestaurantest un complément du nom possessif7. Les ordinateurs ne sont capables de comprendre qu’une fraction du lan-gage et les résultats de leur traitement ne sont pas parfaits. Traiter la langue automatiquement par ordinateur est un processus difficile qui, à vrai dire, est loin d’être résolu pour une couverture large de la langue. La difficulté de la tâche d’analyse est considérable. Au niveau syntaxique, une phrase peut avoir un grand nombre de structures correctes8.

Lorsque le but d’un logiciel d’ALAO est un apprentissage en autonomie – c’est-à-dire sans supervisation d’un enseignant – de nombreuses erreurs

6. On trouve également des ambiguïtés sémantiques et pragmatiques (Sabah, 2000), qui varient fortement selon les langues et les cultures (Warga, 2007).

7. On peut pronominaliser ce complément parsa soupe de légumes, quandleur soupe du restaurant ne permet pas de relier leur à légumes. L’autre indice est qu’on ne peut dire soupe du restaurant de légumes. Ce test fonctionne aussi pour étudiant en linguistique, verre à vin, etc.

8. Plus une grammaire prend en compte des structures complexes, plus l’analyseur produit de structures possibles pour une même phrase. Cependant, de nombreuses structures cor-rectes n’ont aucune plausibilité linguistique ni sémantique et leurs interprétations seraient rejetées par des humains. Il existe diverses méthodes de filtrage des analyses, notamment au moyens d’heuristiques ou de méthodes statistiques.

doivent être détectées, correctement marquées et, si possible, des explications de remédiation – voire une correction – fournies. Les attentes vis-à-vis des ordinateurs sont immenses et la déception face à des résultats mitigés – voire médiocres – est à la mesure de la tâche qui reste à accomplir. Les apprenants commettent de nombreuses erreurs, qu’il est parfois difficile à anticiper, d’autant plus lorsque les productions de l’apprenant sont libres, sans restrictions de structures ni de vocabulaire.

L’intégration du TAL dans l’ALAO n’est pas encore très répandue. Kraif et al.(2004) voient trois raisons pour expliquer ce phénomène : (i) ces tech-niques manquent encore de fiabilité ; (ii) ces ressources sont difficiles et chères à développer ; (iii) les utilisateurs (éditeurs, apprenants, enseignants, concep-teurs...) sont peu au courant des possibilités offertes par ces techniques. Jager (2001, p. 103) fait en revanche preuve d’un optimisme prudent, en considé-rant les technologies du TAL comme suffisamment avancées, du moins pour les apprenants qui ont un niveau suffisamment élevé pour juger de la qua-lité des diagnostics. Borin (2002), quant à lui, suggère que les enseignants utilisent les applications de TAL pour corriger les textes et réponses à des exercices. Les erreurs seraient alors mises en évidences et les enseignants pourraient formuler leur propre rétroaction. Cette manière de faire éviterait les problèmes dus aux feedbacks erronés. Les locuteurs natifs bénéficient du soulignement d’erreurs potentielles mais restent libres de prendre en compte ou non les suggestions de correction, alors que les apprenants n’ont pas encore cette intuition de la langue.