• Aucun résultat trouvé

Chapitre 3. Terminologie et informatique : rétrospective des rapports entre

3.2. Un rapport basé sur un intérêt commun : les concepts 59

CABRÉ opère une distinction entre le type de rapport que la terminologie entretient avec des disciplines comme la linguistique, la logique et l’ontologie et le rapport qui la lie à l’informatique et à la documentation. Si, d’une certaine façon, la terminologie puise des principes théoriques dans les premières pour se constituer en domaine d’étude, elle entretient avec les secondes des relations qui sont plutôt des relations d’échange :

« La terminologie fournit à la documentation et à l’informatique sa réflexion sur les concepts ; celles-ci, en utilisant les éléments théoriques de la terminologie, élaborent des outils d’une très grande utilité pour la terminologie, surtout appliquée.

[…] D’une part, la terminologie ne peut plus se passer de l’informatique pour mener à bien son travail ; de l’autre, la terminologie fournit à l’informatique des éléments qui lui permettent de faire des progrès dans le domaine de l’intelligence artificielle, surtout dans la construction de systèmes-experts.

De fait, ce qui réunit la terminologie et l’informatique, ce sont les concepts. Les concepts sont les unités qui constituent […] la base des connaissances. […]Le concept est à la base tant de la théorie de la terminologie que de celle de l’intelligence artificielle. » (1998 : 101)

Cette réflexion sur les concepts couvre désormais des champs très vastes d’application, dont les plus importants sont sans doute la recherche d’informations (RI) et l’extraction d’informations (EI). La première nécessite une tâche préalable telle que l’indexation des documents, à laquelle on peut parvenir par le biais de différentes méthodes. Les types d’index produits peuvent être variés. En ce qui concerne la deuxième,

« [Elle] consiste […] à rechercher des éléments spécifiques, définis par la tâche d’extraction, dans des textes non structurés (en langage naturel) et à les caractériser selon les catégories définies au préalable. Ce processus peut être vu comme une étape de (pré)traitement destiné à produire un document plus propice au traitement automatique, ou au contraire, si les informations extraites constituent le résultat attendu, comme un aboutissement. » (KEVERS 2011 : 33)

CHAUDIRON situe la terminologie dans le champ plus vaste de l’ingénierie linguistique, dont l’objectif primaire est la conception et l’élaboration d’outils facilitant l’accès à l’information, devenu d’autant plus problématique avec l’avènement d’Internet :

« La question du traitement automatique de l’information textuelle sur Internet est une question clé. L’extension des réseaux induit un bouleversement des besoins informationnels, qui se caractérise par une nécessité accrue d’identifier et de traiter l’information en (presque) temps réel, de détecter les indices d’une modification de l’environnement, de filtrer l’information la plus adaptée au contexte d’usage, de naviguer facilement dans des volumes de données toujours plus imposants. » (2005 : 25)

Dans ce contexte, la terminologie recouvre une double fonction : elle permet de structurer l’information et de cerner ainsi des domaines de connaissance et aussi de rendre plus performants les logiciels conçus pour le traitement automatique de l’information. Il en ressort que la terminologie fait l’objet de

« […] deux approches complémentaires : une première approche qualifiée de vue

informationnelle qui considère les terminologies comme la ressource essentielle de la gestion

- 60 -

terminologie est considérée comme une ressource linguistique nécessaire au bon fonctionnement des logiciels d’ingénierie linguistique. » (CHAUDIRON 2005 : 26)

L’auteur représente le traitement informationnel comme un cycle constitué de trois éléments : l’univers informationnel, les terminologies spécialisées et les outils d’ingénierie linguistique. Dans ce cycle, les terminologies spécialisées décrivent des univers informationnels et les fournissent à l’ingénierie linguistique, qui les gère par le biais d’outils. Suivant les applications, la terminologie peut se configurer tant comme ressource linguistique indispensable – cela surtout dans le cas d’applications de TAL comme la traduction automatique, le filtrage d’informations ou le résumé automatique – que comme le produit d’outils d’ingénierie linguistique – comme les extracteurs de termes, que nous analyserons plus loin.

De son côté, KEVERS souligne que le problème de l’accès à l’information n’est pas spécifique de l’ère numérique, mais était déjà connu dans le domaine des sciences documentaires (2011 : 31). La continuité entre terminologie et documentation58 est d’autant plus évidente lorsque l’on passe en revue les applications, les techniques et les outils mis au point pour celles-ci : dans ce qui suit, nous aurons souvent l’occasion de constater que bon nombre de techniques utilisées dans les sciences documentaires ont ensuite été « recyclées » en terminologie.

3.3. Premiers outils informatiques de support à la discipline : les

banques de données terminologiques (années 1960-1970)

Comme le témoigne la première citation de Wüster que nous avons reportée plus haut (§3.1.), au milieu de la décennie 1970 le rôle des ordinateurs dans les travaux terminographiques n’allait guère au-delà du stockage de l’information. Les données terminologiques, sous forme de fiches, étaient stockées dans de grosses bases de données appelées banques de terminologie. Nées dans les années 1960, les banques de terminologie sont le fruit de l’avancement des techniques documentaires combiné aux progrès de l’informatique lourde.

Ce premier système de stockage des données terminologiques voit le jour en Europe avec le projet DICAUTOM (1963). Il s’agit d’un grand dictionnaire sur support électronique créé par la CECA (Communauté Européenne du Charbon et de l’Acier). Le deuxième projet de ce type, LEXIS, est développé dans la République Fédérale Allemande d’alors trois ans plus tard. Au début, ces systèmes sont réalisés surtout dans le cadre de projets gouvernementaux et institutionnels. Mais ils attirent bientôt l’intérêt de la part des entreprises, pour les avantages qu’ils offrent à la gestion de l’information : ainsi, en 1967, la société Siemens met au point sa propre banque de terminologie.

Les banques de terminologie connaissent un essor important dans le monde francophone dans la décennie suivante, des deux côtés de l’Océan. Au Québec, l’Université de Montréal crée le système BTUM en 1970, qui changera son nom en TERMIUM cinq ans plus tard. TERMIUM, qui existe encore de nos jours, est la banque de terminologie officielle de l’Office Québécois de la Langue française (OQLF)59

. En France,

58

« La documentation est la matière première de la recherche terminologique. » (DUBUC 1980 : 87).

- 61 -

on assiste à la création de NORMATERM en 1972 par l’Association française de normalisation.

Au niveau européen, le contexte de plus en plus plurilingue de la Communauté amène les institutions à reprendre le projet DICAUTOM – qui entretemps avait été délaissé – et à le transformer en EURODICAUTOM. Ce dernier a été fusionné avec d’autres banques de terminologies dans la grande base de données IATE60 (InterActive Terminology for Europe), qui aujourd’hui gère les données terminologiques des 27 pays de l’Union Européenne.

Comme on peut le constater, encore de nos jours les banques de terminologie ont un poids considérable dans la gestion de l’information.

Documents relatifs