• Aucun résultat trouvé

Le projet FreeText

4.1 Présentation générale

Dans cette section, nous décrivons le projetFreeText dans son ensemble.

Le logiciel est basé sur une approche communicative (§2.3) et se concentre sur les marques linguistiques qui distinguent et organisent différents types de textes qui ont diverses intentions énonciatives (Hamel et Girard, 2004).

FreeText contient quatre tutoriels2 présentant 16 documents multimédias authentiques, qui servent à illustrer divers actes de langage et autour des-quels des activités sont proposées. Les textes choisis proviennent de diverses régions de la francophonie. Les quatre tutoriels sont :

(s’)informer: les textes de type informatif sont destinés à donner une information au destinataire. On y trouve un curriculum vitæ, un re-portage télévisé, un article de magazine et un article d’encyclopédie sur la francophonie ;

(faire) réagir: les textes argumentatifs sont destinés à faire acheter un produit ou à faire adhérer le destinataire à l’opinion qui y est présentée.

On y trouve un extrait de site web d’un mouvement politique, un

2. Un cinquième tutoriel,(se) parler, devait aborder le dialogue, notamment les marques de l’oral dans les textes écrits. Le consortium a renoncé à produire ce tutoriel, notamment en l’absence d’un logiciel de reconnaissance vocale (§3.1.3) et de la difficulté de produire une rétroaction intelligente à l’aide de cette technique. Nous pouvons ajouter qu’il aurait été difficile de tenir la comparaison avec des logiciels commerciaux disponibles sur le mar-ché, qui bénéficient de moyens sans commune mesure avec ceux d’un projet de recherche.

éditorial de quotidien, un extrait de film de fiction et une publicité télévisée ;

(se) raconter: les textes narratifs sont destinés à rapporter des événe-ments réels ou fictifs qui ont eu lieu dans un passé proche ou lointain.

On y trouve un extrait de roman, un extrait de siteweb, un extrait de film et un article de presse sur un fait divers ;

(faire) agir; les textes injonctifs ou persuasifs sont destinés à trans-mettre des conseils, des ordres, des recommandations, etc. On y trouve un extrait de site web, un article d’hebdomadaire, un extrait de guide touristique et un extrait de film.

Les différents documents sont présentés par une capture d’écran, un fac simileou une vidéo. Une transcription interactive, y compris des documents écrits, permet à l’apprenant de visualiser une version écrite augmentée et standardisée des documents et de disposer d’aides lexicales. Les enseignants ont également la possibilité d’introduire de nouveaux documents dans un tutoriel personnalisé et de créer de nouveaux exercices. Autour de chaque texte, de nombreuses activités sont proposées. Au total, FreeText compte 550 exercices de 16 types différents. Les activités appartiennent à quatre domaines :

Compréhension: les activités concernent le sens du texte :

Contexte de production: l’apprenant doit identifier l’auteur, son intention, le public auquel le texte s’adresse, le médium (sous quelle forme le document est transmis), le motif pour lequel le document a été produit et la fonction du document. Il doit ré-pondre aux questions par un court texte à l’aide des outils à disposition et une ébauche de solution lui est fournie lorsqu’il demande l’affichage de la solution.

Vocabulaire: l’apprenant doit donner une définition de certains termes qui apparaissent dans les textes, également sous forme de textes libres.

Jeux de mots: divers jeux sont proposés, comme des mots croisés.

Dictée: l’apprenant doit retranscrire un texte audio enregistré par un locuteur natif.

Culture: l’apprenant peut consulter divers documents explicatifs en relation avec le texte présenté.

Exploration: à travers le texte, l’apprenant doit découvrir divers points de grammaire et identifier certains contenus à l’aide de questionnaires à choix multiples. Les points à identifier sont le destinateur, le destina-taire, la mise en contexte pour remplir la fonction du texte (emploi des

modes, adjectifs, adverbes, etc.), l’organisation de la phrase (phrases simples ou complexes, ponctuation, etc.) et celle du texte (structure globale, repères spatio-temporels).

Manipulation: ici, on trouve les exercices traditionnels des tutoriels (QCM, textes à trous, etc.).

Création: l’apprenant doit écrire des textes de longueur moyenne en pastichant le texte présenté.

Un corpus d’erreurs authentiques d’apprenants du français (French In-terlanguage Database, FRIDA, Grangeret al., 2001; Granger, 2003) a éga-lement été récolté, avec des erreurs d’apprenants anglophones, néerlando-phones et d’autres provenances, avec différents niveaux de langue et niveaux d’étude (universitaires ou écoles secondaires). Ce corpus contient 492 808 mots. Les erreurs ont été partiellement balisées sous la forme de balises XML3 d’après une typologie précise des erreurs. Au total, 322 964 mots ont été inclus dans le corpus balisé, dont 46 241 comportaient une erreur, soit 14,3%.

Les dix erreurs les plus fréquentes sont, par catégories d’erreur :

– Erreurs de forme :

– erreurs d’orthographe autres que les diacritiques, la casse, l’ag-glutination et les homonymes ;

– erreurs de diacritiques ; – erreurs de casse.

– Erreurs de grammaire : – erreurs de genre ; – erreurs de nombre ;

– erreurs de classe : confusion de catégories ou sous-catégories lexi-cales.

– Erreurs lexicales :

– erreurs de signification.

– Erreurs de syntaxe : – mots manquants ; – mots redondants.

– Erreurs de ponctuation : – oubli de ponctuation.

3. V. §2.7.5. Les documents ne sont toutefois pas conformes aux spécifications de validité du formalismeXML.

Ce corpus a été utilisé dans le projet de deux manières :

– création d’outils de référence et d’exercices ciblés vers les erreurs fré-quemment commises par les apprenants ;

– adaptation des outils de diagnostic d’erreurs vers les erreurs les plus fréquentes et création d’un corpus de test pour évaluer l’efficacité de ces outils.

Remarquons pour terminer que ce projet a bénéficié d’une approche pluri-disciplinaire (§2.2) et a fait l’objet d’une phase d’évaluation comme préconisé au paragraphe §2.5. Nous reviendrons sur ces aspects en fin de chapitre.