Corpus DORIS 60 - Choix méthodologiques pour notre étude

Pour une approche diachronique en langue de spécialité : éléments théoriques et

Chapitre 3 Méthodologie pour une analyse de l’évolution en corpus

3.2 Choix méthodologiques pour notre étude

3.2.2.2 Corpus DORIS 60

Le projet DORIS est un projet d’élaboration d‘un système d’orbitographie conçu et développé par le Cnes en collaboration avec le GRGS (Groupe de Recherches de Géodésie Spatiale) et l’IGN (Institut Géographique National). Ce système est

« utilisé pour déterminer au centimètre près l’orbite de satellites équipés de récepteurs Doris grâce à un réseau de stations terrestres, utilisées comme points de référence au sol. À l’inverse, le système permet le rattachement précis de points donnés au Système de référence terrestre international (ITRF). » (http://www.cnes.fr/web/CNES-fr/869-doris.php, consulté le 11 novembre 2008)

Le projet DORIS est un projet de longue durée qui a démarré à la fin des années 80 et est toujours en cours actuellement. Les premières stations DORIS au sol ont été déployées entre 1987 et 1990. Le premier récepteur a été lancé à bord du satellite Spot en 1990. Au milieu des années 90, une deuxième génération du système a vu le jour, puis fin 90, la troisième génération a été mise en place. Aujourd’hui, la quatrième génération est en cours d’élaboration et plusieurs lancements sont prévus entre 2009 et 2011, soit plus de 20 ans après le début du projet. Depuis le début du projet, l’instrument DORIS a été embarqué sur de nombreuses missions Cnes, telles que Topex-Poséidon, Spot 2 à 5, ENVISAT, Jason1, Jason2, etc.

Ce projet est intéressant dans la mesure où son évolution repose sur une succession de générations d’instruments qui sont le résultat entre autres d'évolutions techniques, telles que la miniaturisation, des nouvelles possibilités de mesure, etc. Il s’agit donc d’un contexte idéal

60 Le corpus que nous utilisons est une version redécoupée du corpus DORIS utilisé lors d’un projet intitulé « Méthodes et outils de data mining pour les projets spatiaux » mis en place au Cnes (2002-2004). Dans ce projet, le

pour apprendre à repérer linguistiquement les évolutions de connaissances en jeu dans un projet.

Dans un projet tel que DORIS, la documentation technique est nombreuse et variée : dossiers de définition, manuels utilisateur (ou maintenance), plans (de gestion, d'essai, planning), rapports (d'études, d'essais, d'avancement), budgets, contrats (appels d'offres, rapports de choix, de présentation, contrat, clauses techniques, doc financiers), cahiers des charges fonctionnel, documents de contrôle des interfaces, compte-rendus de réunion, dossiers industriel, demandes de modification, demandes d'utilisation, demandes de dérogation, fiches d'anomalie, listes (composants, matériaux, documentation, actions, tâches), livrets suiveur, notes techniques, procédures, registres de contrôle individuel, copies papier des transparents, demandes de déviation , etc.

Parmi ces documents, tous n’interviennent pas aux mêmes étapes du projet et surtout, tous appartiennent à des genres différents. Comme dans le cas du TTVS, il faut s’assurer de construire un corpus homogène dont on puisse dire que les variations présentes sont dues à une évolution du projet. Pour ce faire, le corpus construit pour cette recherche reprend les réflexions proposées par Condamines, Rebeyrolle et Soubeille (2004) dont les analyses étaient basées sur le projet DORIS. Les textes sélectionnés à l’époque étaient les rapports de spécification (c'est-à-dire les cahiers des charges) des trois premières générations de balises construites depuis le début du projet, documents que nous reprenons pour cette recherche. Ces derniers sont écrits par différents ingénieurs mobilisés sur le projet DORIS et ce, pour chacune des trois premières générations. Néanmoins, à la différence des travaux de Condamines et al. qui se basaient sur l’ensemble des trois générations, les textes de la

deuxième génération de balise sont exclus de notre analyse. Un nouveau corpus est reconstitué à partir des documents disponibles pour les première et troisième générations uniquement. En effet, la seconde génération est un peu particulière : comme la première et la troisième, l’application visée par le projet est la localisation des satellites et de points précis où sont placées les stations au sol. Mais les balises de deuxième génération visent en plus une application « de terrain » pour localiser de nouveaux points tels que le déplacement d’un glacier, un volcan, etc. où il n’y a pas d’infrastructure DORIS sur place. Pour ce faire, on a recours à des balises d’appui en laboratoire, et la balise DORIS est développée différemment

pour répondre à ces nouvelles contraintes de terrain : son boîtier est plus petit et consomme moins d’électricité, elle est équipée de batteries et panneaux solaires, etc. Cette application « de terrain » a été retirée des balises de troisième génération pour revenir à des objectifs plus proches de la première. Pour cette raison, ne seront comparés ici que des rapports de spécification des première et troisième générations.

Le corpus DORIS final est donc composé de 5 rapports de spécifications de la première génération et 6 rapports de spécification de la troisième génération, soit un total de 36 401 occurrences (Tableau 3.2).

Ce corpus est un très petit corpus, équilibré et idéal pour une exploration fine et qualitative des phénomènes d’évolution.

DORISGEN1 DORISGEN3 DORIS (Total)

17 544 occurrences 18 857 occurrences 36 401 occurrences

Tableau 3.2 – Nombre d'occurrences – Corpus et sous-corpus DORIS

Le Tableau 3.3 reprend les principales caractéristiques des deux corpus retenus par rapport aux contraintes identifiées supra en 3.2.1.3 (p.82).

TTVS DORIS

Intervalle 8 ans 11 ans

Période 1994-1998-2002 1989-2000

Diachronicité

Découpage 3 sous-corpus découpés tous les 4 ans

2 sous corpus (1989 et 2000)

Genre Cours édités et proposés en

vente libre Didactique

Rapports de spécification (cahiers des charges)

Technique

Textes 1 chapitre entier et plusieurs

sections de deux autres chapitres pour chacun des 3 sous-corpus

5 rapports de spécification de la première génération (1989) 6 rapports de spécification pour la troisième génération (2000)

Domaines Optique et optoélectronique

→ domaine de connaissance

Techniques et constitution de l’instrument DORIS

→ domaine d’activité (corpus projet)

Variété des rédacteurs Plus de 80 rédacteurs ingénieurs au Cnes

En moyenne 10 rédacteurs par chapitre du cours

1 rédacteur pour chaque rapport de spécification

Rédacteurs différents pour la quasi-totalité des rapports Une dizaine de rédacteurs en tout

Degré de spécialité Expert à semi-expert Expert à expert

Locuteurs natifs Majorité des auteurs Tous

Disponibilité des sources Sous droits d’éditeur (Cnes et Cépaduès Éditions)

Textes Cnes du projet DORIS

Experts disponibles 4 experts 1 expert

Nombre d’occurrences 234 609 36 401

Tableau 3.3 – Description des corpus en fonction des contraintes de constitution

3.2.3 Choix des outils et traitement des corpus

Nous présentons dans cette section les outils choisis et la manière dont les données ont été préparées pour notre analyse, en regard avec notre position dans une approche linguistique outillée.

Dans le document Diachronie en langue de spécialité. Définition d'une méthode linguistique outillée pour repérer l'évolution des connaissances en corpus. Un exemple appliqué au domaine spatial. (Page 107-110)