• Aucun résultat trouvé

Les 33 questions portaient essentiellement sur les problématiques liées à la langue et

4.1.4 Premiers résultats de nos recherches

4.1.4.2 Terminologie contextualisée des essais cliniques

Les travaux concernant la construction de la terminologie en contexte des essais cliniques ont débuté par la construction d’un corpus spécialisé adapté. Pour construire ce corpus, nous avons pris en compte plusieurs critères :

- La représentativité :

Afin d'évaluer et de valider la représentativité de journaux à prendre en compte pour constituer le corpus, nous avons fait appel à des experts (médecins et traducteurs en biomédical). Pour chaque sous-domaine du projet (cardiologie, gastro-entérologie et pneumologie), nous avons choisi quelques revues de haut niveau scientifique et langagier : il était très important de disposer d’articles avec un très bon niveau de rédaction en anglais. Pour compléter, nous avons choisi plusieurs journaux généralistes du domaine des essais cliniques. Les détails de chaque journal ont été consignés selon les indications suivantes (Tableau 14) :

Identifiant Nom donné au journal, en 4 lettres minuscules. La 1ère lettre

correspond à la spécialité du journal : - Clinical Essays → ggas, ggan, gjoh, ghep, prcc, pcho, pchs, ptho, cacc, ccir, ecid, elan et ejam.

Nom du journal Nom en clair du journal.

Année de création Année de création du journal.

Sous-domaine Sous-domaine biomédical.

Périodicité Périodicité de parution du journal pour les derniers exemplaires.

Nombre moy. aprox. d'articles par numéro

Approximation du nombre d'articles scientifiques originaux dans chaque édition du journal, pour les derniers numéros.

104

Nombre moy. aprox. d'articles par année

Approximation du nombre d'articles scientifiques originaux dans la dernière année de parution du journal.

Formats Type de HTML téléchargé, c'est à dire la structure interne qui lui a été

donnée par l'éditeur (Eselvier, ...).

Années dans le corpus Indication abrégée de la période exacte des articles téléchargés, pour

retrouver quels sont les articles contenus dans le corpus.

Années dans le corpus (détails) Indication détaillée de la période exacte des articles téléchargés.

Nombre d'articles dans le corpus Nombre d'articles scientifiques originaux téléchargés dans ce corpus.

Formats téléchargés Formats des fichiers des articles téléchargés. Ces fichiers se trouvent

dans le dossier ayant l'identifiant du journal (ex. : 'ggas.zip'), dans les sous-dossiers 'table', 'html' et 'pdf' (et 'txt' pour quelques journaux).

Formats générés Cet emplacement est vide pour l'instant. Il indiquera les formats des

fichiers générés par le traitement des articles à partir de leurs formats HTMLs originaux téléchargés "bruts".

Rubrique des articles Indication présente dans le journal et sur laquelle est basée le choix des

articles téléchargés (ex. : 'original article').

Site web URL de la page web d'accès aux articles téléchargés.

Droits URL de la page web ou du PDF d'information sur les droits d'usage des

articles téléchargés.

Tableau 14 SARS : Description des journaux dans le corpus

Nous avons donc sélectionné au total 11 journaux de spécialité pour constituer le corpus de référence : 3 revues en gastroentérologie, 3 revues en pneumologie, 2 revues en cardiologie et 3 revues généralistes en essaie cliniques. Il était aussi important de disposer des articles récents pour qu’ils soient représentatifs d’une terminologie à jour (donc les années 2014 à 2016). Enfin, nous n’avons retenu que des articles originaux, c’est-à-dire des articles provenant de la rubrique « Recherche »des journaux concernés.

- La taille :

Pour s’assurer d’une taille de corpus suffisante, nous avons téléchargé au moins 100 articles par journal. Bien que nous ne disposons pas pour le moment des statistiques précises sur ce corpus, au moins 3 500 fichiers ont été manipulés pour le constituer (dans des différents formats, voir plus bas).

- L’accessibilité et le(s) format(s) :

Il s’agissait de considérations plus techniques, à savoir la possibilité d'avoir un accès soit à l’intégrité des articles scientifiques, soit à des articles en nombre suffisant (au moins 100), dans des formats exploitables par la suite. Chaque article a été sauvegardé en HTML et PDF (exceptionnellement .txt). Nous avons aussi pris en compte les droits d’utilisation, préférant télécharger les articles que nous pourrions utiliser librement pour la recherche et l’enseignement.

105 Dans l’état d’avancement des travaux, le corpus finalisé est brut, c'est à dire que les formats de documents originaux sauvegardés sont différents en fonction du journal (ex. : les structures des articles ne sont pas les mêmes pour tous les journaux, qu'il s'agisse des textes eux-mêmes ou du balisage HTML). Pour rendre le corpus plus utilisable, une étape ultérieure de transformation est nécessaire : les articles devront être convertis dans un standard pivot, à définir à l'aide de la norme XML DocBook83. Ce passage à un même standard pratique facilitera la mise en œuvre de traitements automatiques du corpus.

4.2 Plateforme d’apprentissage du lexique spécialisé

Concevoir des environnements informatiques pour enseigner (et non pour apprendre) semble un objectif nouveau, même si le besoin de donner à l’enseignant le rôle d’utilisateur principal des logiciels pédagogiques a déjà été identifié (RIOT 2004, PHO 2015)84. Cependant, il existe très peu d’outils logiciels centrés sur les besoins des enseignants de langues étrangères et encore moins de langues étrangères de spécialité. Pourtant, le besoin existe comme en témoigne le développement rapide de disciplines telles que LANSAD (Langue pour

Spécialistes d’Autres Disciplines) ou VOLL (Vocationally (and Professionally) Oriented Language Learning).

Il existe des systèmes de création d’exercices pour l’apprentissage des langues étrangères : MALAFEEV (2015) en énumère 15, portant sur les différentes langues (principalement anglais, mais aussi russe, basque et arabe), et comportant différents types d’exercices (phases à trous, recomposition de phrases, questions à choix multiples, etc.). Pourtant, aucun d’eux n’est adapté à l’apprentissage des langues spécialisées, ce qui prouve qu’elles n'ont pas encore attiré l'attention de chercheurs en ALAO (Apprentissage des Langues Assisté par Ordinateur). Nous n'avons d’ailleurs trouvé aucun système automatique d'aide à la création d’exercices d’apprentissage dédiés aux langues spécialisées. Partant de ce constat, nous nous sommes fixé comme objectif de concevoir une plateforme d'aide semi-automatisée à la création des matériels didactiques de langues étrangères de spécialité. Comparativement aux autres logiciels qui peuvent servir à produire des matériels didactiques pour les langues, nous nous orientons vers les objectifs suivants :

- mettre au point une plateforme qui répond d'abord aux besoins des enseignants (plutôt qu'à ceux des apprenants qui n'en sont pas utilisateurs directs mais bénéficiaires) ;

- prendre en compte des particularités des langues spécialisées de niveau académique dans la production didactique assistée par ordinateur ;

- structurer l'aspect générique de la plateforme, pour qu'elle puisse être réutilisable pour d'autres langues et d'autres spécialités.

Nous décrivons dans la suite de cette section la première étape dans la construction de cette plateforme, à savoir la conception et la mise en place d’un générateur automatique d’exercices d’apprentissage du vocabulaire spécialisé.

83www.docbook.org

106 Le fonctionnement que nous avons imaginé pour cet outil est le suivant. La plateforme dispose d'un vocabulaire spécialisé et d'un corpus de textes dans le domaine étudié. L'enseignant apporte un nouveau texte (que nous appellerons 'texte de référence') dans le même domaine à partir duquel il souhaite créer des exercices de vocabulaire. Il choisit les termes à étudier, soit à partir du texte, soit à partir de la liste du vocabulaire. Ces termes sont ensuite recherchés dans le texte de référence et dans le corpus, pour fournir à l'apprenant d'autres exemples d'utilisation du terme à apprendre que ceux du texte de référence. Ceci a pour objectif d'illustrer l'utilisation du même terme dans d'autres contextes, ainsi que d'aider l'apprenant à trouver le bon terme et renforcer l'apprentissage. Ainsi l’apprentissage est basé sur les exemples tirés d’un corpus de textes authentiques.

Pour mettre en place notre expérimentation, nous avons choisi le thème d'un cours de Master donné à l'Université de Franche-Comté, English for Geographers.