• Aucun résultat trouvé

Les quelques tentatives de constitution de grands corpus d’écrits scolaires en français

SYNTHESE des notions centrales du chapitre 4

5.1. Les corpus de productions écrites d’apprenants en français langue première : vers une meilleure représentativité première : vers une meilleure représentativité

5.1.2. Les quelques tentatives de constitution de grands corpus d’écrits scolaires en français

Plusieurs tentatives de constitution de grands corpus d’écrits scolaires ont vu le jour depuis les années 2000, le nombre de textes les composant augmentant significativement avec le temps. Nous nous proposons ici d’en faire une rapide revue qui ne prétend pas à l’exhaustivité.

Dans le domaine de la constitution de grands corpus, les précurseurs Elalouf & Boré (Elalouf & al., 2005 ; Elalouf & Boré, 2007), qui présentent pour la première fois une tentative de diffusion d’un corpus d’écrits d’élèves permettant d’observer un certain nombre de faits de langue et de discours de l’écrit entre 10 et 14 ans, via un CD-ROM. Le corpus publié présente l’ensemble des textes produits dans leurs différentes versions, pour chaque activité d’écriture (soit au total 728 textes). Dans ce projet, les chercheurs se sont appuyés sur des situations écologiques en observant une séquence d’apprentissage constituée de plusieurs séances reliées par un objectif d’apprentissage commun. Ainsi, les textes produits dans la séquence sont mis en relation avec les textes lus en classe, mais aussi avec les référents culturels explicitement convoqués ou simplement évoqués dans la situation d’écriture. Les textes produits sont également mis en relation avec les commentaires et interventions orales ou écrites de l’enseignant et/ou des pairs sur les textes (Boré & Elalouf, 2017). L’objectif premier de ce corpus était d’analyser les écrits en relation avec leur contexte de production. Toutefois, le fait que le corpus constitué soit mis à disposition de la communauté rend possibles des travaux ultérieurs sur des sujets aussi variés qu’une analyse selon différents

angles, par exemple la comparaison d’un sous-corpus, du niveau d’enseignement, du genre ou du dispositif d’écriture.

À la suite de ces travaux précurseurs, un groupement de chercheurs, le GDR sur la Production Verbale Ecrite43, s’est donné pour objectif un « travail d’étude approfondie d’écrits d’élèves sur la base d’un corpus textuel commun, construit pour permettre, à terme, à des enseignants d’en tirer parti. » (Auriac-Slusarczyk & al., 2008). S’appuyant sur ce corpus, les chercheurs ont étudié le rapport à l’écriture dans le développement des compétences du jeune scripteur en faisant varier notamment deux genres textuels : le récit et le compte-rendu. Ils se sont demandés quelles variations induisent ces deux genres dans la manière dont les élèves vont traiter la langue et s’il se dégage des invariants, susceptibles de mettre en évidence des difficultés types ou récurrentes chez de jeunes élèves (Gunnarsson-Largy, & Auriac-Slusarczyk, 2013). Pour répondre à ces questions, il est proposé à des élèves de 9 à 14 ans une tâche d’écriture suivi d’une réécriture. Pour le récit, les élèves doivent raconter une histoire en s’appuyant sur six images issues d’un album de jeunesse dont une grenouille est l’héroïne. Pour le compte-rendu, les élèves doivent écrire un texte pour présenter le cycle de vie de la grenouille, en s’appuyant sur six images issues d’un manuel de sciences. Ces supports d’écriture ont d’ailleurs participé à la dénomination de ce travail comme corpus

Grenouille.

L’objectif de ce travail est la constitution d’un corpus de textes d’élèves (plus de 400) dont la mise à disposition permette une meilleure vue d’ensemble des faits de langue étudiés, car, comme le résument les auteurs (Auriac-Slusarczyk & al., 2008) :

« il semble plus facile de comprendre comment les élèves produisent un texte, lorsqu’est auscultée une tâche identique, plutôt de que disposer d’études scientifiques isolées, qui montrent de manière alors plus parcellaire les mêmes éléments ».

En effet, le corpus Grenouille présente un intérêt méthodologique car il permet : « des observations croisées, des recoupements soit dans une même classe soit entre les classes, de dégager des régularités ou d’envisager des tendances » (Cappeau, 2013 : 42).

Plus récemment, dans le cadre d’une opération de recherche intitulée Analyse

linguistique de l’écriture scolaire, ECRISCOL44, le laboratoire Clesthia45 a commencé en        

2013 à constituer un grand corpus de textes scolaires, dont la taille et l’étendue en âge visent la représentativité (David & Doquet, 2016 ; Doquet & al., 2017b). En effet, les chercheurs ont recueilli à ce jour 1225 textes et les avant-textes correspondants (notes, brouillons…). Les écrits ont été réalisés à différents âges de la scolarité, correspondants aux trois paliers du socle commun de connaissances, de compétences et de culture, ainsi qu’à la fin de la scolarité secondaire : au CE1 (7-8 ans), au CM2 (10-11 ans), en 3°/début 2nde (14-15 ans), et en terminale/entrée à l’université (17-18 ans). Pour rester au plus près de la réalité des textes produits dans le cadre scolaire, les chercheurs ont fait le choix d’un corpus écologique, c’est-à-dire : « d’aller chercher dans les classes des écrits tels que le quotidien de l’enseignement permet de les faire émerger » (Doquet & al., 2017b : 136). Ils ont donc proposé aux élèves une tâche courante dans la scolarité : écrire la suite d’un récit. Toutefois, les enseignants restent libres de choisir le texte narratif amorce et les conditions didactiques afin que celles-ci puissent constituer des variables d’étude, dans la complémentarité d’une étude à la fois linguistique et didactique caractéristique des grands corpus de textes scolaires, comme nous l’avons vu supra (cf. section 4.1.1.). Comme l’expliquent Doquet & al., (2017b : 134), l’objectif de ce corpus est de :

« de recueillir un grand nombre d’écrits variés pour en analyser les caractéristiques linguistiques et discursives […] afin de tracer une cartographie des compétences selon les différentes variables (socio-culturelles, didactiques, identitaires) prises en compte. »

Encore plus récemment, le projet Scoledit, porté par le LIDILEM46, vise un autre changement d’échelle puisqu’il a pour objectif de réunir à terme plusieurs milliers de productions d’élèves (Wolfarth & al., 2017). Ce projet s’appuie sur le recueil de données provenant de 131 classes de CP (2507 textes) effectué dans le cadre du projet national IFE

Lire-Ecrire au CP 47. Pour le CP, toutes les classes ont un protocole expérimental commun : les élèves doivent raconter l’histoire d’un petit chat en s’appuyant sur quatre images présentant ses aventures. Le projet Scoledit, dans l’objectif d’une étude longitudinale, recueille les textes des mêmes élèves chaque année au mois de juin, à partir du CP (juin 2014) jusqu’à leur arrivée en CM2 (juin 2018). L’objectif de la constitution de ce grand corpus est

       

45 Clesthia – Langage, Systèmes, Discours. EA 7345. Université Paris 3.

46 LIDILEM – Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles, EA 609. Université de Grenoble Alpes.

47 Lire – Ecrire au CP, projet coordonné par Roland Goigoux, financé par la DGESCO, l’IFé, et le laboratoire de recherche Acté (Clermond-Ferrand). 

de « permettre de rendre compte des évolutions des procédés d’écriture à différents moments de la scolarisation de l’école primaire » (Wolfarth & al., 2017 : 187).

Les travaux exposés ici, que ce soit les corpus déjà constitués ou en cours de constitution, ont tous en commun l’objectif d’explorer et décrire les écrits des élèves. En effet, « réunir des corpus représentatifs, comparables, cumulables est un enjeu essentiel pour la production de connaissances en didactique du français. » (Elalouf, 2011 : 57). Cependant, pour réussir à exploiter au mieux ces corpus d’écrits d’apprenants, « l’outillage de l’analyse de corpus, confronté à la diffusion régulière d’écrits non standards, doit pouvoir s’appuyer sur des modules d’analyse adaptés aux écarts à la norme qui spécifient les différents corpus » (Doquet & al. 2017b : 152). En effet, les corpus d’écrits scolaires sont caractérisés par leur écart à la norme, rendant leur analyse outillée difficile. Toutefois, nous allons le voir, ce n’est pas la seule difficulté propre à ce type de corpus.

5.2. Quelques difficultés pour la constitution et le traitement de corpus

Outline

Documents relatifs