• Aucun résultat trouvé

Pour une approche diachronique en langue de spécialité : éléments théoriques et

Chapitre 3 Méthodologie pour une analyse de l’évolution en corpus

3.1 Principes méthodologiques généraux pour l’analyse de l’évolution

3.1.2.1 Linguistique outillée : de nouveaux moyens et de nouveaux besoins

Comme l’écrit Ho-Dac (2007 : 141)

« une étude linguistique en corpus décrit des fonctionnements linguistiques en se basant sur une interprétation de faits réellement observés. Cette approche repose sur l’idée de partir à la découverte, d’aller explorer des réalités langagières pour y découvrir des régularités linguistiques. »

C’est précisément dans ce cadre de découverte que nous concevons notre approche diachronique, à travers le repérage et l’observation de variations dans les textes que l’on peut

L’« exploration » de fonctionnements linguistiques en corpus va systématiquement de pair avec l’utilisation d’outils informatiques, donnant naissance à ce qu’Habert (2005 : 1) nomme une linguistique « à l’instrument ». L’auteur souligne en effet qu’à côté d’une linguistique

« sans instrument »48, s’impose clairement une linguistique qui utilise des outils49 (concordanciers, étiqueteurs, etc.) et des ressources (bases textuelles, corpus de textes, dictionnaires, etc.) pour construire des analyses. Dans cette perspective, se développe une coopération riche entre linguistique et Traitement Automatique des Langues (TAL), les travaux en linguistique ayant « beaucoup à gagner à intégrer les outils fournis par le TAL et par l’informatique en général » (Habert, 2004, suivi notamment par Gasiglia, 2004 ; Leroy, 2004 ou Méla 2004). C’est dans le champ de cette linguistique outillée, qui propose une collaboration entre outils de TAL et corpus, que nous inscrivons la méthode linguistique proposée dans notre étude50.

Bien que l’outillage ne soit pas « obligatoire » pour l’analyse des textes (Condamines, 2003 : 79), il est indéniable que le recours à des outils change le regard du linguiste sur les données et enrichit l’analyse sur plusieurs points. Tout d’abord, les outils permettent de traiter de plus grandes masses de textes, plus rapidement. Mais surtout, comme le note Condamines (ibidem), les outils assistent le travail du linguiste et offrent des angles d’observation

particuliers sur certains phénomènes langagiers en « délinéarisant » l’analyse du texte. Ils

48 Pour illustrer cette linguistique « sans instrument », dans une communication présentée à l’Inalco en 2006 (www.limsi.fr/Individu/habert/Paroles/BHabertInalco06InstrumentsEnLinguistique-psnup-l4.pdf, consulté le 1er

mai 2009), Habert cite Auroux (1998 : 170) : « L’une des particularités des sciences du langage,… c’est que le langage est sans médiation à disposition du lecteur : je puis produire, à volonté, des phrases, les tronquer, y introduire tel élément que je choisis, etc. Il se pourrait que ce soit le seul exemple d’une manipulation sans instrument, du moins le seul qui se soit maintenu dans un état développé d’une discipline scientifique. »

49 Nous n’adopterons pas ici la distinction proposée par Habert entre outil, instrument et utilitaire (2005 : 2-3) et

simplifions la vision de l’auteur en utilisant « linguistique instrumentée » et « linguistique outillée » comme équivalents.

50 Notons qu’il peut être difficile de trouver sa place dans le champ de la linguistique de corpus. En effet, comme le note entre autres Mayaffre (2005) « tout le monde utilise le terme corpus » et il peut être délicat de se positionner.

Dans notre cas, ce phénomène est accentué par le fait que les réflexions les plus poussées et solides dans ce champ sont celle de la linguistique de corpus telle qu'elle est définie depuis quelques années dans le monde anglo-saxon

(Biber, 1993 ; McEnery & Wilson, 2001 ; Tognini-Bonelli, 2001) où sont mis en avant les principes de quantification, de généralisation et ce qui implique la prise en compte de grosses masses de textes (Péry-Woodley, 2005). Ces aspects sont difficiles à appréhender, en particulier en langue de spécialité et en diachronie. Notre démarche repose en effet sur de petits corpus (comme c’est généralement le cas en langue de spécialité et en diachronie (Bowker & Pearson, 2002 : 45)), mais se veut assez représentative, bien que la quantification de données soit limitée par la taille des données construites. Il s’agit là certainement d’une piste de réflexion à développer.

permettent ainsi de rapprocher des éléments éloignés dans les textes mais qui partagent des fonctionnements linguistiques semblables (forme, distribution, etc.). Cette démarche permet de mettre en évidence des phénomènes que l’on n’aurait pu observer à l’œil nu. C’est ce que montre Habert lorsqu’il parle des outils comme des « créateurs de phénomènes »51, reformulé plus globalement par Valette (2008 : 11) qui place la coopération entre possibilités d’instrumentation et analyse linguistique dans un « cercle vertueux » :

« l’instrumentation, constitutive de la linguistique de corpus, donne lieu à ce que nous pourrions appeler son « cercle vertueux ». Les grandes masses de données textuelles ou documentaires nécessitent, pour être analysées et décrites, des dispositifs expérimentaux et des instruments ad hoc. Cette

instrumentation permet de construire de nouveaux observables qui seraient demeurés invisibles autrement. »

Nous l’avons vu dans les chapitres précédents, ce cercle vertueux se traduit par l’émergence de nouvelles propositions théoriques en terminologie, ainsi que par l’apparition de nouveaux besoins pour lesquels l’analyse de l’évolution est centrale. Ces besoins sont d’une part descriptifs, dans la mesure où l’on ne dispose que de très peu de descriptions diachroniques en langue de spécialité, et d’autre part applicatifs, puisque l’on peut envisager d’automatiser (au moins en partie) des tâches telles que la mise à jour de ressources, la veille, etc. La description de l’évolution en diachronie courte naît également en grande part de ce cercle vertueux dans la mesure où c’est la coopération entre connaissances linguistiques et outillage qui permet d’envisager aujourd’hui d’observer les phénomènes d’évolution très fins susceptibles de se manifester sur de courts intervalles.

De manière générale, la collaboration entre la prise en compte de données textuelles et analyses outillées est centrale dans une approche diachronique en langue de spécialité et ce, à double titre. Tout d’abord, dans une perspective historique et diachronique, le recours aux données attestées est primordial pour observer le changement. En effet, sur les états de langue anciens l’analyste ne possède pas de compétence de production, mais acquiert plutôt une compétence de reconnaissance à force de travailler sur les langues anciennes (Marchello-Nizia,

1995 citée par Lebel, 2003 : 56-57). Dans ce cadre, il n’est donc pas possible d’envisager une approche intuitive sur la langue, comme on peut le faire en linguistique synchronique. En langue de spécialité, le même type d’observation peut être fait à propos des connaissances du domaine étudié, dans lequel l’analyste n’a pas ou n’a que peu de compétence, que ce soit en synchronie ou, a fortiori, en diachronie. De fait, en langue de spécialité et en diachronie, les

outils permettent effectivement de mettre en évidence des phénomènes linguistiques centraux que les approches habituelles ne permettent pas de mettre au jour, soit parce que le locuteur n’a pas de compétence sur l’état de langue/connaissances observé, soit parce que les phénomènes observables sont trop fins et très peu décrits52.

Mais une fois ce constat fait, il reste à savoir comment mettre en œuvre une approche linguistique outillée pour la diachronie en langue de spécialité.