• Aucun résultat trouvé

De l’aide à la rédaction aux applications didactiques

Entre 2003 et 2007, nous avons concentré nos recherches sur des applications didactiques. Dans Kraif (2004), nous proposions un certain nombre de pistes de recherche pour une application générique des outils du TAL à l’apprentissage des langues assisté par ordinateur (ALAO, ou CALL en anglais). Ces idées ont ensuite été développées avec le projet MIRTO (Antoniadis et al., 2005). En 2006 nous avons collaboré avec des partenaires de Louvain-la-Neuve, notamment Sylviane Granger, pour travailler sur un corpus de productions d’apprenants (FRIDA), et développer un outil d’exploration de ce corpus, baptisé Exxelant (Granger et al., 2007) – ce type de concordancier spécialisé pouvant être utile à l’analyse des erreurs et à la remédiation, comme le montre Rézeau (2007). Par la suite, nous nous sommes plus particulièrement intéressé à l’utilisation de corpus textuels à des fins didactiques, dans la perspective du Data Driven Learning (DDL), définie par Johns (1991) en ces termes comme « l’utilisation en salle de classe de concordanciers afin que les étudiants explorent les régularités des structures (patterns) de la langue cible, et le développement d’activités et d’exercices basées sur les sorties de ces concordanciers. »39

Dans son travail de pionnier, Tim Johns (1986) a été le premier à systématiser l’usage du concordancier en classe de langue. L’approche didactique est ici résolument constructiviste, l’apprenant devant prendre une place active dans la construction de ses connaissances, par des activités relativement autonomes. Comme le note Landure (1991 : 166), entre l’approche constructiviste en didactique et le DDL, on remarque des similitudes, notamment « au niveau des rôles ; dans ces deux approches, l’apprenant est défini comme un constructeur actif, un collaborateur et un chercheur et l’enseignant se voit attribuer les rôles de guide, facilitateur et conseiller. » La métaphore du « chercheur » a été proposée d’emblée, et avec certaine audace par Johns (1991) :

Ce qui est nouveau dans le travail décrit dans cet article, est le parti-pris que « la recherche est une chose trop sérieuse pour être laissée aux seuls chercheurs » : que l’apprenant d’une langue est également, par essence, un chercheur dont l’apprentissage demande à être guidé par l’accès à des données langagières – d’où le terme d’apprentissage guidé par les données (data driven learning) pour désigner cette approche.40

39 "the use in the classroom of computer-generated concordances to get students to explore regularities of patterning in the target language, and the development of activities and exercises based on concordance output."

À cette idée de participation active de l’apprenant dans la construction de son savoir, vient s’ajouter la recherche d’authenticité : plutôt que de fabriquer des exemples artificiels destinés à illustrer telle ou telle propriété lexicale ou syntaxique, on préfère rechercher des usages réels dans les textes, en mettant l’accent sur la fréquence observée des phénomènes dans ces usages. Cette approche corpus driven est la transposition dans le domaine didactique de la linguistique de corpus telle qu’elle a été défendue par Sinclair (1991), les corpus de référence présentant l’avantage de contenir des données authentiques, complètes, abondantes et neutres vis-à-vis des théories ou systématisations linguistiques (Hunston & Francis, 2000 : 15). Pour l’étude du lexique, une caractéristique fondamentale de cette approche est de ne jamais isoler les mots de leurs contextes. C’est ce qu’illustre la technique de la CPA (Corpus Pattern Analysis), développée par Hanks (2004) en lexicographie, où les entrées lexicales sont décrites en fonction de leur contexte lexico-syntaxique. Par exemple, pour décrire un verbe, on associera ses différents sens à ses différentes constructions (valence) à et ses structures argumentales, en tenant compte aussi des valeurs sémantiques des actants potentiels. Parce que les unités de sens, pour reprendre le terme units of meaning de Sinclair (1994) n’ont pas toujours de frontière nette, et peuvent mêler à la fois des phénomènes collocationnels, colligationnels, ou des constructions (cf. l’exemple de « naked eye » donné par Sinclair, 2004), il nous paraît très intéressant d’embrasser les unités d’abord au sein de leurs contextes.

Dans cette optique, de nombreux travaux ont porté spécifiquement sur l’utilisation de bi-concordances. Par exemple St.John (2001) fournit une étude de cas autour d’activités centrées sur le lexique, pour un étudiant apprenant l’allemand. Cette étude est préliminaire, mais elle entend démontrer que les concordances peuvent être utiles même pour des débutants. Ici, pour réaliser les tâches demandées, l’étudiant sélectionne lui-même ses exemples pour constituer ses propres données. Dans d’autres contexte, les bi-concordances sont préparées par les enseignants et didactisées : les exemples sont sélectionnés, éventuellement annotés, puis intégrés dans diverses tâches. Le tableau 3.2 donne un exemple de bi-concordance didactisée, permettant d’illustrer les différents usages de la préposition pour :

40 "What is novel about the work reported in this paper is the perception that "research is too serious to be left to the researchers": that the language learner is also, essentially, a research worker whose learning needs to be driven by access to linguistic data hence the term "data driven learning" (DDL) to describe the approach."

Original text Translation

1. Ainsi, quand il aperçut POUR la première fois mon

avion […] 1. The first time he saw my aeroplane, for instance […] 2. Alors elle avait forcé sa toux POUR lui infliger

quand même des remords. 2. Then she forced her cough a little more SO THAThe should suffer from remorse just the same. 3. -Approche-toi que je te voie mieux, lui dit le roi qui

était tout fier d’être enfin roi POUR quelqu’un. 3. “Approach, so that I may see you better,” said theking, who felt consumingly proud of being at last a king OVER somebody.

4. Car, POUR les vaniteux, les autres hommes sont des

admirateurs. 4. For, TO conceited men, all other men are admirers. 5. C’est comme POUR la fleur. “ 5. It is just as it is WITH the flower.

6. C’est donc POUR ça encore que j’ai acheté une

boîte de couleurs et des crayons. 6. It is FOR THAT PURPOSE, again, that I havebought a box of paints and some pencils. 7. C’est le même paysage que celui de la page

précédente, mais je l’ai dessiné une fois encore POUR bien vous le montrer.

7. It is the same as that on page 90, but I have drawn it again TO impress it on your memory.

8. Elle ferait semblant de mourir POUR échapper au ridicule.

8. She would […] pretend that she was dying, TO avoid being laughed at.

9. et c’était bien commode POUR faire chauffer le

déjeuner du matin 9. and they were very convenient FOR heating hisbreakfast in the morning., 10. Il commença donc par les visiter POUR y

chercher une occupation et POUR s’instruire. 10. He began therefore, by visiting them, IN ORDERTO add to his knowledge. 11. Il me fallut longtemps POUR comprendre d’où il

venait. 11. It took me a long time TO learn where he camefrom. 12. J’avais le reste du jour POUR me reposer, et le

reste de la nuit POUR dormir…

12. I had the rest of the day FOR relaxation and the rest of the night FOR sleep.”

13. POUR toi je ne suis qu’un renard semblable à cent

mille renards 13. TO you, I am nothing more than a fox like ahundred thousand other foxes Tableau 3.2 : Un exemple de bi-concordance centrée sur "pour", extraite du Petit Prince

(Antoine de Saint Exupéry) (Lamy & Klarskov Mortensen, 2012)

Ces bi-concordances peuvent donner lieu à des activités de classement, de repérage (notamment pour repérer les traductions), voire à des exercices lacunaires, comme l’illustre l’exemple donné par Joseph Rézeau fourni en annexe (Annexe - 1., p. 166). Dans cette activité autour des différentes manières de rendre le pronom on en anglais, Rézeau propose une approche plutôt corpus based que corpus driven, pour reprendre la distinction établie par Tognini-Bonelli (2001) : il commence par énoncer un certain nombre de principes tirés d’une grammaire de Berland-Delépine, puis demande aux étudiants de classer le matériau empirique en fonction de ceux-ci. Dans un deuxième temps, les connaissances liées à cette catégorisation sont réinvesties dans des exercices lacunaires, où l’étudiant doit donner une traduction correcte de on en fonction du contexte.

On voit ici comment les approches corpus-driven et corpus-based sont en fait complémentaires : il peut être difficile pour un apprenant, qui n’est pas linguiste de formation,

de dériver lui-même une classification pertinente à partir des données. Cependant, le fait de confronter les données issues du corpus avec une classification pré-établie, permet de mieux intérioriser celle-ci, du fait de la multiplication des cas, et d’en saisir toutes les implications sur le plan syntaxique, sémantique, idiomatique et fonctionnel.

Prenons l’exemple ci-dessous, tiré de cette même activité : 19. - Comment peut-on posséder les étoiles?

"How is it possible for ____________ to own the stars ?"

On voit ici que la traduction de Comment peut … par How is it possible for…, qui correspond à des critères de nature idiomatique, impose le choix de someone ou somebody, one étant impossible pour des raisons syntaxiques (il est pronom sujet seulement). Or tous les exemples donnés illustrent cette propriété de one, sans que cette règle ait été explicitée. Le va-et-vient et la comparaison entre les exemples en contexte et l’exercice qui s’ensuit peut aider l’apprenant à intérioriser cette donnée, sans avoir à la formuler consciemment.

Wang (2001) relate une expérience conduite avec des apprenants chinois, là encore centrée sur l’apprentissage du lexique. Citant Rutherford, il souligne qu’un des intérêts du recours aux bi-concordances est de montrer que les langues peuvent recourir à des structures différentes, ce qui permet d’éveiller la conscience métalinguistique des apprenants :

The main research interest in this paper is in the use of parallel concordancing in the teaching of languages, specifically in its use as a form of consciousness-raising, of making learners aware of the differences between the target language and their own language (Wang, 2001 : 174).

Malgré les difficultés techniques liées au traitement des caractères chinois, l’expérience semble concluante. Étonnamment, l’auteur valorise le caractère exploratoire de l’activité, qui oblige l’enseignant à faire face à l’imprévu :

The distinctive feature of the Data-driven Learning approach to inductive language teaching is that the language data are primary, and the teacher does not know in advance exactly what rules or patterns the learner will discover.

Notons enfin que l’utilisation des bi-concordances, voire de simples concordances monolingues, n’est pas une panacée, et soulève de nombreuses questions. Chambers (2005), dans une étude qualitative sur l’usage direct de concordances avec des étudiants de licence (undergraduate), constate d’importantes variations concernant le style d’apprentissage, la

motivation, l’intérêt porté à ce type de travail en autonomie, les capacités d’analyse et la perception de la nature et des limitations du corpus :

In addition to the variation in analytical ability, there was also considerable variation in the students' ability to reflect on the nature and limitations of the corpus, an ability which came easily to some students, but was totally lacking in others. (Chambers, 2005 : 119).

Globalement les évaluations des étudiants sont positives : ils apprécient le caractère « authentique », « réel » et « en lien avec l’actualité » ("up to date") du corpus, ce qui peut faciliter la « mémorisation » ; le fait d’avoir de très nombreux exemples, ce qui permet de mieux comprendre les critères utiles pour effectuer certains choix ; et la motivation liée à la découverte par soi-même ("I discovered that achieving results from my concordance was a highly motivating and enriching experience ", ibid. : 120). Mais un certain nombre de critiques sont récurrentes : les concordances ne peuvent se substituer à un manuel de grammaire traditionnel, auquel les étudiants accordent d’ailleurs une plus grande confiance ; pour observer certains phénomènes le corpus est trop limité ; le fait que l’analyse soit souvent ennuyeuse, longue et laborieuse ("tedious, time-consuming, and laborious" , ibid. : 120) ; enfin, le fait que cette approche exige une formation appropriée et des capacités analytiques ("training and appropriate analytical skills", ibid. : 120) dépassant parfois le niveau des étudiants. Chambers (2005 : 122), s’appuyant sur une revue assez complète des évaluations effectuées dans ce domaine, conclut sur le fait que l’usage des concordanciers peut trouver sa place dans la globalité d’un dispositif d’apprentissage, sans se limiter à la salle de classe, car il paraît adapté à des activités autonomes ou collaboratives.

La technicité des outils et l’aspect expérimental des méthodes didactiques ont jusqu’à présent freiné le développement de ces approches originales, qui restent assez marginales dans les pratiques pédagogiques, tout spécialement en France : mais nous croyons qu’elles sont appelées à se développer avec l’évolution des pratiques, notamment du fait de la place importante promise au numérique. Nous reviendrons sur ces aspects dans la partie 4 de ce travail.