• Aucun résultat trouvé

CHAPITRE II : LES BASES DE CONNAISSANCES TERMINOLOGIQUES

3. BCT ET ONTOLOGIES

3.4. BCT et linguistique

Pour l’ingénieur de la connaissance, il n’est pas trop difficile de se situer dans une des approches : ontologie générale ou ontologie régionale (même si la première correspond à la vision encore largement dominante) dans la mesure où l’évaluation de la pertinence de ces concepts se fait le plus souvent (ou devrait se faire) en termes d’efficacité.

Pour le linguiste, la question se pose de manière différente. La notion de système est fondamentale en linguistique : le repérage de régularités qui mettent de l’ordre dans le flux des phénomènes linguistiques est à l’évidence ce qui fonde la linguistique comme science et ce qui motive profondément le chercheur en linguistique. Mise en ordre va ici avec maîtrise : il s’agit de maîtriser des phénomènes qui menacent sans cesse d’échapper à notre contrôle. L’informatique vient parfaitement cadrer avec ce projet de maîtrise puisqu’il faut lui fournir des données parfaitement calibrées, parfaitement ordonnées et donc maîtrisées. L’informatisation vient parfois ainsi comme la confirmation du fantasme d’un contrôle possible du sens. La rencontre avec la terminologie « classique » s’est certainement faite, à l’origine, sur le même espoir de contrôle du sens. Comme le note Rey d’ailleurs (Rey, 1979),

définition et terme comportent le même trait de clôture, englobement que l’on peut, selon les

cas, interpréter comme limitation ou comme possibilité d’échange.

La rencontre entre IA et terminologie sur le concept de BCT menaçait de se transformer en justification réciproque d’illusions, la prise en compte des corpus, incontournable dans des

26

58

domaines spécialisés, est venue comme une réalité frustrante mais certainement salutaire qui a conduit à des interrogations majeures à la fois en ingénierie des connaissances et en linguistique.

Inévitable en terminologie, la question des corpus atteint maintenant la linguistique dans ce qu’elle a de plus essentiel : le sens. En effet, si l’on accepte de ne plus considérer la terminologie au mieux comme relevant de la linguistique appliquée, au pire comme une simple technique, alors, les questions qu’elle soulève viennent ébranler la linguistique théorique à tous les niveaux qu’elle aborde et particulièrement au niveau sémantique. En charriant avec elle une longue pratique des corpus (à défaut d’une théorisation), indispensable dans les domaines qu’elle a à traiter, la terminologie vient interpeller la linguistique sur un problème longtemps volontairement marginalisé : l’utilisation des corpus, c’est-à-dire d’usages réels de la langue. Corbin, dès 1980 (et sans doute avant lui, à leur manière, les sociolinguistes) avait pointé certains des abus d’une linguistique uniquement introspective. Ses inquiétudes sont maintenant d’une brûlante actualité.

Bien sûr, de nombreuses disciplines, et depuis longtemps, prennent les corpus pour matériau d’étude. On peut citer par exemple :

– la linguistique historique et comparative, – l’analyse littéraire,

– la sociolinguistique, – l’analyse de discours,

– le traitement automatique de la langue (en tout cas une partie des travaux).

Dans ces approches, le sens apparaît nécessairement en filigrane soit parce que, considéré comme stable, il soutient l’analyse syntaxique et morphologique et permet d’étudier la variation, soit parce que, insaisissable par hypothèse, il est toujours le fruit d’une construction et que seules les modalités de cette construction sont accessibles ; on ne perçoit donc du sens que ses effets, psychologiques ou sociaux.

Mais il est rare que le sens soit mis au cœur de la problématique et qu’une réflexion soit menée pour mettre en lumière la place du sens dans l’élaboration des résultats d’analyse à partir de corpus.

Il me semble que la compétence linguistique (j’entends, de locuteur) est construite à partir des expériences que peut avoir un individu en tant que locuteur/auditeur d’une langue ; cette compétence est sans doute hétérogène27 :

« …pour [Labov], nous sommes des sujets entendants, tout autant et peut-être plus que parlants : nous nous constituerions notre " compétence hétérogène " par les traces de nos confrontations constantes à des productions elles-même non unifiées » (Gadet, 1992, 10).

La compétence de linguiste me semble, quant à elle, relever d’une tentative pour essayer de comprendre quelle part de connaissance sémantique est convoquée a priori dans les études de corpus et quelle part est construite par ces études. Au fond, il ne s’agit pas d’opposer introspection (qui met en œuvre une connaissance pré-existante, relevant de la compétence de locuteur et de la compétence de linguiste) et construction par analyse de corpus mais d’examiner comment, pour chaque nouvelle étude, l’une et l’autre se mettent en œuvre.

La difficulté majeure dans l’analyse de corpus consiste à repérer les phénomènes qui fonctionnent sur un mode attendu et ceux qui sont propres à un corpus ou pertinents pour une certaine utilisation. L’analyse de corpus a ceci de particulier qu’elle nécessite à la fois de faire appel à son intuition, et à sa compétence de linguiste et à s’en méfier en permanence pour arriver à rendre compte au plus juste du fonctionnement linguistique propre à un corpus ou à un besoin en lien avec ce corpus.

27 Au sens où je l’entends, cela ne signifie pas qu’on ne peut pas faire l’hypothèse qu’elle est proche, d’un locuteur à l’autre, cf. chapitre IV, 1-3.

59

Finalement, le rôle du linguiste qui fait de l’analyse sémantique à partir de corpus me semble être de diverses natures :

– trouver des régularités pertinentes pour ce corpus et/ou une application donnée, en faisant appel à sa compétence de locuteur et de linguiste,

– essayer d’ouvrir les résultats et de voir comment le contexte, au sens large, influence la mise au jour de ces régularités,

– définir des méthodes permettant de repérer les fonctionnements propres à un corpus.

Je reviendrai sur ces questions à propos de la constitution effective de bases de connaissances terminologiques. En effet, la constitution de BCT met le linguiste au pied du mur puisqu’elle lui impose de se confronter avec la réalité des corpus et des utilisations réelles qui vont être faites des résultats qu’il produit, ce qui l’oblige à pratiquer une linguistique située. En retour, cette confrontation est riche d’enseignements et elle permet d’éclairer d’un jour nouveau nombre de phénomènes sémantiques.

4. Conclusion

Après la présentation du contexte théorique (sémantique) dans lequel je me place (chapitre 1), ce chapitre m’a permis de situer plus précisément ma réflexion, qui s’élabore dans la perspective de la constitution des bases de connaissances terminologiques à partir de corpus. Ce contexte suppose non seulement une réflexion sur l’élaboration d’une représentation à partir d’un corpus mais aussi sur les rapports entre terminologie textuelle et outils d’analyse et de représentation. Cette pluridisciplinarité est en effet incontournable lorsque l’on évoque les BCT mais il est aussi nécessaire d’étudier comment cette problématique commune prend sens du point de vue de chacune des disciplines concernées. Un autre mode d’interdisciplinarité dans la constitution de BCT se réalise dans la prise en compte des outils dans l’analyse de corpus. Ce thème constituera une des principales parties du prochain chapitre qui commencera à baliser le processus d’élaboration d’une BCT à partir d’un corpus.

60

Chapitre III