• Aucun résultat trouvé

Termes et textes : situation du problème

Partie I Descriptions linguistiques…

Chapitre 3 - Unités lexicales en texte

3.1 Des connaissances aux discours spécialisées

3.1.1 Termes et textes : situation du problème

Les implications de cette approche que je qualifierai de discursive sont multiples. Il s'agit de concevoir les termes, ces unités lexicales spécifiques d'un domaine de la connaissance ou de l'activité humaine, comme travaillés par le / les discours qui circule-nt dans le domaine en question et non comme de simples étiquettes pour des construits qui se formeraient hors la langue, ce qui serait une « conception mécanique du couplage concept/mot [qui ne prend] pas en compte la complexité des phénomènes langagiers » (Slodzian, 1995 : 10). Les phénomènes langagiers en question tiennent, dans les textes élaborés dans le domaine, à une dynamique liée à la mise en texte qui influe sur ces termes. Ainsi que je l'explicite plus loin, mon travail a consisté à mettre en lumière une part de cette dynamique, prenant ce faisant très au sérieux les conclusions de M. Slodzian, par lesquelles elle préconisait d'intégrer à l'étude terminologique « le syntagmatique, c'est-à-dire les termes en fonctionnement dans les textes » (Slodzian, 1995 : 17). On peut souligner sur ce point la convergence avec les diverses approches linguistiques qui considèrent que la description du lexique doit rendre compte de la combinatoire des unités en tant que participant à la construction du sens, par exemple la Théorie Sens-Texte d’I. Mel’cuk (1997) ou le Lexique-Grammaire de M. Gross (1975).

Une autre implication découle de cette intégration du syntagmatique : la construction de la terminologie d'un domaine, c'est-à-dire l'inventaire des termes et la description de leur système de relations, doit prendre pour substrat les textes produits dans le domaine, donc être textuelle. La terminologie textuelle, prônée par Bourigault et Slodzian (1999), est la marque du groupe TIA, « Terminologie et Intelligence Artificielle », qui rassembla en 1995 des chercheurs d'horizons variés, linguistes, informaticiens, linguistes informaticiens et informaticiens

linguistes, autour d'abord de l'élaboration des Bases de Connaissances Terminologiques (BCT), puis par la suite, autour des questions qui se posent à l’occasion de l’élaboration conjointe de terminologies et d'ontologies. Les BCT avaient comme objectif de dépasser les limitations des systèmes à base de connaissances de l'intelligence artificielle en offrant une prise conjointe sur la dimension linguistique et sur la dimension conceptuelle d'un domaine de la connaissance. L’intelligence artificielle, nous dit Otman (1995) dans l’introduction du numéro de la Banque des Mots qui collecte les textes de la rencontre fondatrice de TIA (Terminologie et Intelligence Artificielle), se pose alors la question de la connaissance et du modèle à construire. La modélisation d'un domaine que proposent les systèmes à base de connaissances trouve ses limites dans le fait d'être bâtie sur la représentation que livrent quelques experts interviewés, experts de la discipline mais pas toujours conscients de leurs propres usages des concepts et des termes. De ce fait, le produit obtenu s’avère être un système parfois déconnecté des réalités du champ et parfois même reflet d'une certaine vision de la discipline, non nécessairement consensuelle.

Le groupe TIA (Terminologie et Intelligence Artificielle), qui défendait ces nouvelles conceptions, était bien enraciné à Toulouse puisqu’en étaient membres Anne Condamines et Didier Bourigault, du laboratoire de recherche ERSS (Équipe de Recherches en Syntaxe et Sémantique), et Nathalie Aussenac-Gilles, de l’IRIT (Institut de Recherche en Informatique de Toulouse). C’est au milieu de cette effervescence intellectuelle stimulante qu'un projet piloté par A. Condamines m'a permis de mener un travail linguistique fondé sur des données attestées, collectées dans le « monde réel » et produites dans un cadre professionnel pour une vraie utilisation de travail. Si j'insiste ici sur l'authenticité de ces données, c'est parce qu'elle a consolidé mon orientation initiale26 de travail sur la langue « tout venant », non littéraire, ainsi que je l'ai explicité dans le chapitre 1, et qu’elle m’a plongée de plain-pied dans la problématique d’une description linguistique guidée par des objectifs applicatifs, problématique sur laquelle je reviendrai dans la partie II.

Le projet a fait collaborer l’ERSS et l’IRIT pour répondre à une demande de quatre acteurs de la Gestion des Déplacements sur l’agglomération toulousaine : la mairie de Toulouse, la DDE, la SEMVAT (qui était l'acteur des transports en commun : à l'époque bus), le SMTC (autorité organisatrice des transports). Il s’agissait pour ces acteurs d’anticiper la mise en place d’un système commun de gestion en harmonisant leurs terminologies, avec l’hypothèse que cette harmonisation leur permettrait d’éviter les malentendus et incompréhensions liés à des langages différents et de forger un système conceptuel et terminologique commun pour leur collaboration dans la gestion des déplacements.

Le travail auquel j’ai contribué consistait à extraire des textes fournis par ces acteurs institutionnels les unités terminologiques pertinentes, à repérer leurs relations, à construire le système conceptuel sous-jacent en exploitant l’environnement textuel de chaque terme et ce, afin de peupler une BCT (Base de Connaissances Terminologiques) développée par N. Aussenac-Gilles à l’IRIT. Cette exploration du corpus, que je désignerai ici sous le nom de Déplacements, a été l’occasion d’interroger le rapport entre langue et connaissance, j’y reviendrai dans la section 3.1.2.1. Elle a surtout constitué une plongée dans les textes spécialisés et une découverte de la malléabilité syntaxique et sémantique des unités dès lors qu’elles sont immergées dans les discours spécialisés. Deux exemples montreront cette malléabilité.

26 Mon mémoire de Maitrise de Sciences du Langage avait porté sur la description partielle d'une interaction enregistrée dans le train que je prenais quotidiennement.

J'ai pour le premier une tendresse particulière car il illustre à merveille la combinaison de glissement sémantique et d'altération formelle mises au service de la conceptualisation dans un domaine.

Il s'agit de l’utilisation très particulière de la forme « carrefour » dans les textes de ces acteurs. Dans son sens propre, un carrefour est un « Lieu relativement large (par opposition au simple croisement) où se rencontrent plusieurs routes, chemins ou rues venant de directions contraires. » (définition fournie par le TLFi27). Ce sens est activé dans :

(11) C'est l'exemple de l'aménagement de deux giratoires aux carrefours de la RN20 et de la RD4 qui, réalisé en 1992, a résorbé cette zone accidentogène tout en améliorant sensiblement l'écoulement des différents trafics. [Déplacements] Mais un énoncé tel que (12) manifeste un premier écart sémantique :

(12) Les exploitants de la Police Nationale doivent notamment avoir la possibilité [...] de mettre un carrefour ou un ensemble de carrefours au clignotant [Déplacements]

Notre connaissance du monde ordinaire rend cet énoncé pour le moins insolite : en principe, un lieu ne peut pas clignoter ! Il n'est pas besoin d'être un sémanticien très fin pour saisir qu'ici, ce que désigne carrefour n'est plus l'intersection mais une partie de celle-ci, le feu de signalisation, et ce par une synecdoque généralisante (le tout désigne la partie).

C'est une sorte encore différente de transformation qui produit (13) :

(13) Bouton permutation : Définit si le carrefour autorise la permutation de phase dans le cas de la micro-régulation "appel prioritaire". [Déplacements]

Aucun doute n'est permis, carrefour ne peut là désigner ni le lieu ni le feu de signalisation. Il est en fait considéré dans ce contexte comme un élément du système informatique qui assure la régulation du trafic par pilotage à distance des feux de carrefour, au moyen d'équipements associés aux feux en vue de les contrôler, équipements fort logiquement nommés contrôleurs

de carrefour. Un glossaire fourni par la mairie de Toulouse explicite d'ailleurs cette identité

(CAPITOUL-2 est le nom du système informatisé de régulation) :

(14) carrefour Du point de vue CAPITOUL-2, élément synonyme de contrôleur de

carrefour. Le carrefour est la vision utilisateur du contrôleur de carrefour,

ce qui permet de s'affranchir des implémentations différentes de ces contrôleurs. [Déplacements]

Cette dernière équivalence, carrefour = contrôleur de carrefour, repose tout à la fois sur une synecdoque généralisante du même type que celle qui construit l'équivalence carrefour = feu de

carrefour et sur un effacement formel de la tête du terme complexe contrôleur de carrefour,

effacement qui constitue le second exemple de malléabilité que je vais développer plus loin. Mais avant ce second exemple, un petit bilan sur la forme carrefour. Dans les textes de ce corpus, elle recouvre donc trois « significations » ou plutôt trois opérations de référence : vers un lieu, vers un élément implanté sur le lieu, le feu de carrefour, vers un constituant du système informatique de régulation, le contrôleur de carrefour. Une telle polysignifiance entre en contradiction avec les théories terminologiques bâties sur la conception « nomenclaturiste » du lexique, pierre angulaire de la « Vienna General Theory of Terminology » de Wüster (Slodzian, 1993), théories selon lesquelles le terme désigne de façon univoque un concept, et dont les 27 Trésor de la Langue Française Informatisé, accessible en ligne : http://atilf.atilf.fr/tlf.htm

chercheurs proches de TIA voudraient dégager la terminologie (par ex. Rastier, 1995). Cette polysignifiance a été pour moi le point d'accroche pour ce champ de recherches.

Le second exemple, qui présente une similitude partielle avec la faculté acquise par carrefour de pouvoir référer au feu de carrefour ou au contrôleur de carrefour, est emblématique des modifications formelles que subissent les termes au fil du texte. Les deux extraits suivants mettent le phénomène en évidence :

(15) L'équipe de conduite d'opération est responsable de la cohérence de l'opération et de la compatibilité des équipements. Elle rend compte en permanence au Comité de pilotage des conditions de réalisation de l'opération et se doit de l'informer de tout évènement susceptible de mettre en cause le planning ou le coût des travaux. [Déplacements]

(16) La conduite d'opération est responsable de la cohérence de l'opération et de la compatibilité des équipements. Elle rend compte en permanence aux maitres d'ouvrage des conditions de réalisation de l'opération et se doit de l'informer de tout évènement susceptible de mettre en cause le planning ou le coût des travaux. [Déplacements]

La quasi-identité des deux contextes manifeste l'équivalence des deux expressions équipe de

conduite d'opération et conduite d'opération. C'est là ce qu'à la suite de Collet (2000), j'ai

appelé réduction de termes complexes. Collet a travaillé sur cette réduction dans l'objectif d'en élaborer une grammaire, c'est-à-dire de décrire les règles qui rendaient ce phénomène de réduction possible (Collet, 2003). J'ai de mon côté adopté une approche résolument textuelle et discursive, comme on le verra dans la section 3.1.2.2.

L'élucidation du phénomène de réduction des termes complexes rencontre diverses questions. Une première question à traiter était celle de la rareté ou au contraire de l'abondance du phénomène : est-il reproduit dans des domaines variés, touche-t-il peu ou beaucoup de termes ? Une deuxième question concernait le déclenchement et les effets de la réduction : qu'est-ce qui fait qu'à un certain moment du texte, une partie d'un terme complexe peut être omise ? Est-ce que cette omission est « bloquée » par une éventuelle ambigüité résultante ? En d'autres termes, peut-on par exemple trouver des énoncés dans lesquels il serait impossible de décider ce à quoi réfère la forme carrefour ou la forme conduite d'opération ? Je me suis aussi au passage intéressée au versant cognitif de la réduction – quoique 'cognitif' apparaisse ici comme un mot un peu pompeux.

Pour traiter ces questions, un second corpus a été élaboré, dans un domaine et un genre délibérément différents. L'hypothèse était la suivante : si les mêmes phénomènes sont observables en ayant modifié les variables de domaine et de genre, alors on peut considérer que ces phénomènes tiennent à d'autres variables, qu'il faut élucider et décrire. Toutefois, puisque mon propos était de mettre en évidence des aspects du fonctionnement des termes dans leur « habitat naturel », ce second corpus devait être lui aussi un corpus de textes spécialisés, faisant usage de termes.

Comme de nombreux locuteurs, je pratique dans ma vie personnelle plusieurs activités qui construisent des connaissances spécifiques, donc des textes spécialisés, donc des termes. J'ai choisi le Vol Libre, en raison du fait que je savais déjà y trouver des attestations de réduction de termes. Deux magazines spécialisés, Parapente Mag et Vol Libre, m’ont gracieusement fourni une vingtaine d’articles décrivant les essais de voiles de parapente.

Armée de ces deux corpus que, pour les désigner plus facilement, je nommerai « Déplacements » pour le premier et « Vol Libre » pour le second, j'ai abordé ces recherches avec l'outillage qui était à ma disposition à l'ERSS. Grâce à D. Bourigault, j'ai pu bénéficier d'une extraction automatique des candidats-termes de ces corpus (Bourigault, 1994). J'ai ensuite mené une exploration systématique des textes en utilisant d'abord SATO, un logiciel élaboré par F. Daoust28, puis Yakwa, un outil développé par L. Tanguy (Rebeyrolle & Tanguy, 2001). J'ai aussi adopté, avant qu'Habert (2009) n'en décrive les avantages, l'usage de bases de données relationnelles pour stocker et enrichir les occurrences étudiées et leur contexte.

Le contexte dont il est ici question est double : le domaine, qui conceptualise ses objets et donc en considère certains plus centraux que d'autres pour ses activités, le texte, qui rend possibles voire impose certaines opérations. Avec le recul que me donne l'exercice actuel, je crois nécessaire de mieux distinguer que je ne l'avais fait dans ces recherches ces deux niveaux. Je vais donc reprendre les analyses menées sous cet éclairage.