• Aucun résultat trouvé

FLEURON – un corpus du domaine universitaire

Chapitre 2 : Des données à analyser, des corpus à constituer

2.3. FLEURON – un corpus du domaine universitaire

Le corpus FLEURON (Français Langue Étrangère Universitaire – Ressources et Outils Numériques) est un corpus multimodal et concerne le domaine universitaire. Il est intégré à un dispositif d’apprentissage du français27 et présente des ressources audios et vidéos qui permettent aux étudiants étrangers qui souhaitent faire un séjour universitaire en France de se préparer, avant leur arrivée et pendant leur séjour, à interagir dans différentes situations (André 2016). Le corpus est constitué de situations de communication authentiques que les étudiants étrangers sont susceptibles de rencontrer dès leur arrivée pour gérer et organiser leur séjour. Le corpus a été élaboré (et ne cesse d’être enrichi) afin d’être un échantillon représentatif des interactions auxquelles les étudiants doivent ou

26 Des extraits du corpus ont par exemple été utilisés pour illustrer La Grande Grammaire du français (Abeillé, Godard à paraitre).

peuvent participer lors de leur séjour universitaire. Il est également constitué de ressources explicatives sur le fonctionnement de l’université française et de la vie universitaire. Il compte actuellement 160 enregistrements dont la durée est comprise entre 30 secondes et 15 minutes (30 enregistrements sont en cours de traitement). Concrètement, ce corpus est composé de trois types de ressources28 :

1. Des interactions naturelles authentiques

− entre étudiants et personnels administratifs de l’université, dans différents lieux : scolarité, secrétariat, bibliothèque, maison de l’étudiant, loge de l’appariteur, service des relations internationales, service délocalisé de la préfecture, centre de langues, service d’aide aux logements, service santé, service d’assistance sociale et médicale, service informatique, associations étudiantes, etc. ;

− entre étudiants et enseignants : choix de cours, constitution d’emplois du temps, etc. ;

− des conversations entre étudiants français et/ou étrangers ;

− des interactions de la vie quotidienne en dehors du campus universitaire : à la banque, à la gare, avec des voisins, à la piscine municipale, au cinéma, au musée, etc.

2. Des témoignages

− d’étudiants français et d’étudiants étrangers, des narrations (modalités et qualité de l’intégration, chocs culturels, etc.) ;

− de situations difficiles à filmer (le déroulement d’une visite médicale, d’un entretien à la préfecture, etc.).

3. Des explications sollicitées

− du fonctionnement de la vie universitaire : de la bibliothèque, de la carte du restaurant universitaire, des horaires d’ouverture, de la sécurité sociale, des cours informatiques, des aides au logement, des écoles doctorales, etc. − du fonctionnement de certains aspects de la vie en dehors du campus mais

utiles aux étudiants : la location des vélos de la ville, obtenir une carte de réduction dans des lieux culturels, comprendre les panneaux dans les gares, acheter un billet de train, etc.

28 Il existe quelques ressources audios dans le corpus FLEURON. Néanmoins, toutes les nouvelles ressources sont des vidéos, lorsque les situations le permettent.

Les situations concernent le domaine universitaire mais sont exclus les cours et les contenus disciplinaires. D’autres projets de recherche constituent des corpus de cours à des fins didactiques (voir par exemple Mangiante, Parpette 2004, 2011). Le corpus FLEURON est utilisé à des fins d’apprentissage de compétences socio-interactionnelles dans des situations de communication en dehors des cours. Je présenterai ce dispositif et l’exploitation du corpus dans les chapitres 4 et 5.

Le corpus FLEURON est constitué d’interactions entre des locuteurs natifs mais également de quelques interactions exolingues avec ce que nous avons appelé des « étrangers compétents » (André, Castillo 2005). Cette notion désigne des locuteurs non natifs mais qui réussissent à interagir de façon appropriée à la situation de communication à laquelle ils participent. Cette notion a été développée au sein du GREFSOC (groupe de réflexion sociolinguistique) qui s’est notamment intéressé aux relations de service (André 2008) et aux vertus communicatives (Cameron 1995 ; Marui et al. 1996) attendues dans ces situations, très culturellement marquées. L’étranger compétent remplace également, dans le domaine de la didactique des langues, le traditionnel modèle du locuteur natif. L’objectif pour un apprenant n’est pas de se transformer en natif mais d’apprendre à interagir en réussissant à s’appuyer sur les éléments pertinents de la situation de communication.

Le corpus FLEURON a bénéficié des réflexions menées dans le projet TCOF, notamment en ce qui concerne les aspects éthiques et juridiques, les modalités de recueil des données, la transcription et le traitement de données. Néanmoins, ce corpus présente quelques spécificités. Tout d’abord, toutes les situations, dans la mesure du possible, sont filmées. Tous les participants donnent leur accord pour participer aux captations. Ils signent une autorisation de diffusion de leur voix et de leur image dans le cadre du dispositif FLEURON. La captation vidéo fait l’objet de réflexions à chaque nouvelle situation (emplacement de la caméra, présentation et informations sur le projet, droit de rétractation, etc.). Ensuite, la transcription du corpus est également « nue » et respecte l’orthographe standard. Toutefois, elle est simplifiée par rapport à celle de TCOF étant donné qu’elle est avant tout destinée à être lue par des apprenants de français. Toutes les traces de l’élaboration du discours oral sont conservées (hésitations, répétitions, pauses remplies, etc.) mais les chevauchements ne sont pas signalés graphiquement. Ce choix s’explique par l’alignement transcription-vidéo. En effet, toutes les vidéos sont sous-titrées. Les sous-titres apparaissent sous la vidéo, il est donc aisé de se rendre compte des parties du discours qui sont prononcées simultanément par plusieurs locuteurs. En outre, l’objectif

didactique prime ici sur le marquage des chevauchements qui pourrait perturber la lecture des sous-titres par des apprenants.

Le corpus FLEURON est accessible ressource par ressource (ainsi que par un concordancier, j’y reviendrai). Les ressources sont classées par catégorie, en voici la liste :

• Démarches administratives • Démarches à la préfecture • Étudiants Erasmus • Aides sociales • Questions pédagogiques • Santé • Explications du système universitaire

• Utiliser les transports • Vie en dehors du campus • Étudiants en doctorat

Ces catégories sont évolutives et sont créées en fonction des besoins des utilisateurs du corpus, en l’occurrence des apprenants et des enseignants de FLE. Par exemple, la dernière catégorie de la liste a été créée pour répondre à des demandes de la part de doctorants étrangers à l’Université de Lorraine désireux d’avoir accès à ce type de ressources. De nombreuses interactions du corpus ont été recueillies à la suite de suggestions d’étudiants étrangers, notamment de la part de ceux qui ont participé au projet. Le corpus est sans cesse enrichi, par moi-même ainsi que par les étudiants du Master FLE de Nancy qui choisissent de s’investir dans le projet et par les contractuels que j’encadre (vacataires, ingénieurs d’études et contrat postdoctoral) recrutés dans le projet en fonction de ses différents financements.

Le corpus est également interrogeable par un concordancier, directement intégré au site29. Ce concordancier unique est aligné texte-son-vidéo. Il permet de faire des requêtes dans les transcriptions, d’afficher les résultats sous la forme de lignes de concordances et d’accéder aux occurrences prononcées dans les audios et les vidéos correspondants. Ce dispositif est incontestablement un outil puissant pour l’apprentissage du FLE, il sera au cœur de ce travail de synthèse dans le dernier chapitre.