• Aucun résultat trouvé

Pour une approche diachronique en langue de spécialité : éléments théoriques et

Chapitre 3 Méthodologie pour une analyse de l’évolution en corpus

3.2 Choix méthodologiques pour notre étude

3.2.1.3 Contraintes de constitution des corpus diachroniques

Les corpus diachroniques doivent répondre à diverses contraintes pour assurer leur représentativité et leur pertinence, tel que le soulignent Condamines et al. (2004). À la suite de

principales afin de garantir le fait que les variations observées soient bien attribuables à une évolution dans le temps et non pas à un autre type de variation :

1. Contrainte de diachronicité : Les corpus construits doivent correspondre à des périodes clés dans le domaine spatial pour lequel est menée cette étude et à des intervalles courts (comparables à ceux rencontrés dans le cadre de projets spatiaux) afin d’observer l’évolution en diachronie courte. Ce point renvoie en grande part aux éléments présentés au §3.1.1.2 supra.

2. Contrainte d’homogénéité du genre et du degré de spécialisation : Les textes choisis doivent appartenir à un même genre et à un même degré de spécialisation pour neutraliser l’influence que ceux-ci pourraient avoir sur les variations repérées dans le corpus57.

3. Contrainte de variété des rédacteurs : Dans la mesure du possible, les textes qui constituent les corpus doivent être écrits par plusieurs auteurs différents afin de circonscrire au maximum les variations particulières à un seul individu (idiosyncrasie).

4. Contrainte de recours à des locuteurs natifs : Les productions de rédacteurs natifs de la langue étudiée sont privilégiées afin d’éviter que les phénomènes observables soient dus à un manque de compétence langagière du rédacteur. 5. Contrainte de disponibilité des sources : Les textes choisis pour composer les

corpus doivent provenir du Cnes, être accessibles et non protégés par le secret industriel.

6. Contrainte de disponibilité d’un expert : Dans la mesure où la collaboration avec des experts du domaine est primordiale dans notre recherche, pour chacun des corpus et des domaines qu’ils couvrent, des experts doivent être disponibles et accepter de nous aiguiller dans la description de l’évolution.

Ces contraintes sont strictes et font de la constitution des corpus une tâche ardue et de longue haleine. Il est de fait très difficile de satisfaire toutes ces contraintes. Néanmoins, avec l’aide

57 Notons cependant que le genre est susceptible lui aussi d’évoluer dans le temps, mais nous ferons l’hypothèse qu’il restera stable en diachronie courte.

du Centre de Documentation du Cnes, nous avons sélectionné deux corpus comparables qui les satisfont pleinement :

- un corpus de trois éditions du cours de Techniques et Technologies des Véhicules Spatiaux,

- un corpus de rapports de spécification des première et troisième générations des balises DORIS (Doppler Orbitography and Radiopositionning Integrated by Satellite ou Détermination d’Orbite et de Radiopositionnement Intégrés par Satellite).

Nous les présentons dans la section suivante et détaillons la manière dont ils répondent à ces six contraintes. En guise d’illustration, des extraits de chacun de ces deux corpus sont donnés en Annexe A (p.377sqq.).

3.2.2 Description des corpus sélectionnés

3.2.2.1 Corpus TTVS

Le premier corpus constitué est un corpus de cours de Techniques et Technologies des Véhicules Spatiaux (désormais TTVS) rédigés par des experts du Cnes. Le but de ce cours est

« de présenter l’ensemble des techniques et des technologies qui concourent à la constitution et au fonctionnement des véhicules spatiaux.

Il présente les caractéristiques et les contraintes de conception spécifiques à la technologie spatiale et décrit les techniques et les technologies des sous-systèmes et des équipements embarqués. Il s’adresse plus particulièrement aux ingénieurs débutants ou aux ingénieurs confirmés qui souhaitent élargir l’éventail de leurs connaissances pour acquérir une vision technique plus globale.

Les trois volumes fournis constitueront une référence pour tous ceux qui

exercent une activité technique dans le domaine spatial. »

(http://cnes.cborg.net/ttvs2009/, consulté le 11 novembre 2008)

Le TTVS est rédigé depuis 1994 par plus de 80 experts du Cnes appartenant à l’ensemble des spécialités métiers qui y sont présentes. Il s’agit du support écrit en 3 volumes d’un cours annuel de 10 jours organisé par le Cnes, disponible en librairie et publié par le Cnes et les

éditions Cépaduès. Ce cours est écrit par des experts à l’attention d’experts ou de semi-experts (Bowker & Pearson, 2002).

Si les sessions de cours sont annuelles, les trois volumes sont quant à eux publiés tous les 4 ans. Il s’agit là d’un aspect intéressant de ce corpus en lien avec sa périodisation dans la mesure où les intervalles de temps qui existent entre chaque sous-corpus58 n’ont pas été choisis arbitrairement, mais émanent directement des besoins du domaine et de son rythme d’évolution :

« Voici l'édition 2002 du cours de Techniques et Technologies des Véhicules Spatiaux. Le cycle de 4 ans se trouve ainsi institutionnalisé (94 – 98…) et le lien avec le cycle de vie de nos développements technologiques n'est pas fortuit. […] En quatre ans, des changements profonds de stratégie de développement des segments spatiaux sont intervenus. » (préface de D. Assémat (Cnes, 2002))

Le fait que le choix de l’intervalle et du découpage en périodes soit basé sur des critères externes identifiés par des experts du domaine revêt un intérêt particulier dans la mesure où, du point de vue de l’évolution des connaissances, ce type de découpage reflète une évolution ressentie par les acteurs du domaine eux-mêmes et dont la pertinence est le fruit d’un consensus entre eux.

L’autre aspect intéressant de ce corpus repose sur le fait que la diachronicité des textes est basée sur des rééditions d’un même support. Dans la mesure où chacune des rééditions est basée sur l’édition précédente, le corpus est construit selon une certaine « intertextualité », définie par Kristeva (1969) comme une interaction à l’intérieur d’un texte qui permet de saisir « les différentes séquences (ou codes) d’une structure textuelle précise comme autant de

transforms de séquences (de codes) prises à d’autres textes ». Cette notion littéraire

(développée entre autres par Barthes et Genette) n’est reprise ici que très partiellement et approximativement pour souligner le fait que chacune des éditions du cours se positionne par rapport aux précédentes. Certaines séquences ou commentaires présents dans les éditions les plus récentes trouvent alors un écho dans les éditions les plus anciennes. Cette propriété

58 À partir de maintenant, nous nommerons « corpus » l’ensemble des textes qui composent le corpus comparable et « sous-corpus » les textes qui correspondent à une période/date donnée dans ce corpus. Ainsi, nous traiterons du corpus TTVS, lui-même composé de trois sous-corpus (TTVS1994, TTVS1998 et TTVS2002).

est intéressante pour aider à construire une interprétation de l’évolution puisque, comme nous le verrons, elle est susceptible de rentrer en jeu dans la comparaison des différentes éditions.

Enfin, bien que ce corpus réponde à l’ensemble des contraintes définies pour leur constitution, la diversité des domaines de connaissances abordés dans ce cours impose de restreindre notre recherche à l’un des domaines présentés dans le TTVS. En effet, les éditions du TTVS présentent en quatorze chapitres l’ensemble des techniques et technologies spatiales mises à contribution au Cnes : aperçu des principales missions spatiales, composantes du système spatial et principales étapes du développement d’un véhicule spatial, lois fondamentales de la mécanique spatiale, contraintes de l’environnement spatial, effets des rayonnements, assurance produit et développement des systèmes orbitaux, charges utiles (télécommunications, observation, sciences, localisation-navigation), missions et charges utiles de radiolocalisation et radionavigation, physique de la mesure, caractéristiques de l’instrumentation optique et infrarouge et de l’instrumentation radiofréquence, techniques radioélectriques, techniques optique et technologies des détecteurs et des électroniques de détection, etc. (Cnes, 2002). La diversité des domaines et questions abordés dans ce cours introduit une trop grande complexité pour observer l’évolution des connaissances et il s’avère nécessaire de concentrer nos observations sur un seul domaine.

Pour circonscrire le domaine observé dans cette recherche, nous avons privilégié les domaines pour lesquels des experts étaient disponibles. Dans la mesure où, au moment de cette recherche, le Cnes travaillait avec des experts sur la mise en place d’une ontologie de l’optique et optoélectronique spatiales, notre choix s’est porté sur ce domaine. À l’aide d’un expert en optique qui a lui-même participé à la rédaction du TTVS, certaines sections des chapitres 5 et 7 et le chapitre 9 dans son intégralité ont été sélectionnées pour chacune des trois éditions afin de construire un corpus d’optique spatiale. La taille du corpus et de chacun des sous-corpus est présentée dans le Tableau 3.1. Au total, quatre experts d’optique ont accepté de participer à notre recherche, tous ayant contribué à au moins l’une des éditions du TTVS.

TTVS1994 TTVS1998 TTVS2002 TTVS (Total)

46 448 occurrences 78 656 occurrences 109 505 occurrences 234 609 occurrences

Tableau 3.1 – Nombre d'occurrences – Corpus et sous-corpus TTVS

À la lecture de ce tableau, une remarque doit être faite. Les trois sous-corpus apparaissent clairement déséquilibrés : la taille des sous-corpus augmente au fur et à mesure des éditions et le sous-corpus TTVS1994 est presque 3 fois plus petit que le TTVS2002. Il s’agit là d’une des difficultés majeures pour le traitement de ce corpus. Cependant, bien que cela entraine un déséquilibre certain, ce phénomène est révélateur d’évolutions dans le domaine : si celui-ci progresse, que de nouvelles techniques ou technologies voient le jour, des modifications viennent compléter le cours d’édition en édition. Néanmoins, une difficulté est que les auteurs peuvent également rectifier des erreurs, compléter des oublis ou autres lors de rééditions. Dans ce cas, il ne s’agit pas d’une évolution du domaine pertinente pour notre recherche, mais plus d’une évolution du cours en tant que manuscrit. Pour essayer de pallier ce phénomène, une possibilité aurait été de redécouper ce corpus pour l’équilibrer. Pour ce faire, plusieurs possibilités existent, telles que tronquer arbitrairement les sous-corpus pour que chacun contienne au plus 45 000 occurrences, faire une sélection aléatoire des textes ou des segments à conserver sur la base de calculs statistiques, etc. Nous avons envisagé chacun de ces cas, mais ce type de manipulations entraîne une perte importante d’informations sur l’évolution. On perd en particulier des informations sur la structure du texte en tant que discours construit et ainsi certaines sections « stratégiques » dans les textes qui contiennent beaucoup de connaissances évolutives (si l’on tronque la fin des textes : conclusions, sections de perspectives, comparaison des résultats, etc. et si l’on tronque le début : introductions, états de l’art, etc.). Au cours de nos recherches, nous avons cependant travaillé sur une version équilibrée du corpus DORIS obtenue par comparaison des sections stables d’une édition à l’autre (Picton, 2007). Le tri manuel que nous avons effectué a été guidé par le logiciel KDiff59. Au vu des limitations que l’équilibrage entraine, nous revenons pour cette recherche à une exploration du corpus dans son ensemble.

59 Développé par J. Eibl, http://kdiff3.sourceforge.net/doc/index.html (consulté le 10 novembre 2008) et conçu à l’origine pour aligner des corpus parallèles.

Un second corpus est choisi pour cette étude, constitué de textes du projet spatial DORIS. En effet, si le corpus TTVS se veut un corpus de connaissances scientifiques et techniques sur un court intervalle, nos observations doivent être complétées sur un « corpus projet ».