• Aucun résultat trouvé

Repérage de termes basé sur la notion de « déviance »

CHAPITRE IV : D’UN CORPUS A UNE BCT : NOUVEL ECLAIRAGE SUR DES PHENOMENES

1. R EPERAGE DES TERMES

1.1. Repérage de termes basé sur la notion de « déviance »

Dans mon ambition de rapprocher la terminologie de la linguistique, il m’a semblé opportun, dans une première analyse (je veux dire, première dans la réflexion que j’ai menée), de définir les termes par rapport aux mots ou groupes de mots « généraux ». Au-delà de la seule caractérisation d’un phénomène, il s’agissait, dans une vision opérationnelle, d’essayer de comprendre comment travaillent les terminologues lorsqu’ils identifient des termes. Cette tâche m’a semblé relever souvent de l’identification d’un dysfonctionnement par rapport à un fonctionnement langagier considéré comme régulier, c’est-à-dire normé par des contextes d’utilisation connus et fréquemment rencontrés, c’est-à-dire aussi un fonctionnement qui correspondrait à la compétence des terminologues considérés comme locuteurs moyens. A la suite de certains auteurs (voir ci-dessous), j’ai appelé ce dysfonctionnement « déviance », terme sans doute malencontreux car il suppose une norme valorisée, par rapport à laquelle on situe des fonctionnements non normés et donc dévalorisés. De mon point de vue, il s’agirait plutôt d’une norme produit d’une normaison, c’est-à-dire d’une régulation spontanée des locuteurs d’une langue.

86

En fait, cette notion de déviance apparaît dans différents travaux sur la langue. Je vais présenter quelques uns de ces travaux puis, je montrerai comment j’ai essayé de mettre en œuvre cette notion dans le repérage des termes.

1.1.1 Déviance et travaux sur la langue

La notion de déviance, d’écart par rapport à une norme, est assez couramment employée dans des travaux sur la langue apparemment très différents.

Déviance et rhétorique

Une des disciplines qui fait le plus appel à cette idée de déviance est certainement la rhétorique qui foisonne en termes exprimant le fait d’échapper à une norme : transgression,

écart, altération, délit, incorrection :

« Dans certains cas, (la métaphore notamment), la rhétorique transgresse visiblement le code lexical en même temps que la règle d’isotopie. » (groupe µ, 1982,38).

« Au sens rhétorique, nous entendons l’écart comme altération ressentie du degré zéro.» (ibid, 41). « L’écart dont nous venons de parler est une altération locale du degré zéro. Il ne présente aucun caractère systématique, et est donc toujours imprévu. Il s’oppose à un autre type d’altération, systématique celui-ci, qui est la convention.» (groupe µ, 1982, 42-43).

«Il est généralement admis que la métaphore repose crucialement sur une "incorrection" ou un "délit", mais ce trait, une fois dénommé et intégré, donne rarement lieu à une caractérisation satisfaisante. » (Kleiber, 1994, 177).

Dans ce type d’approche, l’effet de sens est donc clairement dû à un dysfonctionnement par rapport au code, dysfonctionnement voulu par le locuteur et reconnu comme tel par l’interlocuteur. C’est d’ailleurs le même type de décalage qui produit l’effet comique des mots d’esprits.

Déviance et néologie

On retrouve le recours à la même notion d’écart dans des travaux sur la néologie :

« Si un changement intervient dans une règle, il se produit au niveau de la performance, sous la forme d'une déviation, d'une "faute", et sa transformation en règle nouvelle implique un usage répété, une longue évolution... le changement des règles grammaticales échappe à la création consciente. Aucun locuteur, en effet, n'a un comportement linguistique naturel qui le conduit à faire volontairement des fautes... Les déviations qui, accumulées, constituent l'usage nouveau, échappent à sa volonté, mais créent la règle nouvelle. » (Guilbert, 1972, 29).

Dans ce cas cependant, il est question d’un écart qui, en se répétant, en n’étant pas le fait d’un locuteur dans un discours particulier, s’intègre peu à peu dans le code lui-même. Ce type de création, contrairement au précédent, n’est alors pas voulu par un individu, mais peu à peu accepté par un ensemble de locuteurs, de manière non-consciente. La déviation n’est alors perçue que par un analyste attentif, le lexicologue par exemple, qui peut repérer le moment où elle est apparue dans le code.

Déviance et terminologie

Généralement, terminologie et néologie ne sont pas considérées comme relevant du même type de processus créatif. En effet, la néologie est considérée comme relevant plutôt d’une évolution inconsciente du système d’une langue, évolution qui relève soit de l’apparition de nouvelles formes (évolution morphologique) soit de l’apparition de nouveaux contextes. En terminologie, dans une vision traditionnelle, la création se fait par un processus volontaire voire normé de nomination ; il ne concerne pratiquement que les lexèmes. Mais ce distinguo ne tient plus si l’on base l’étude sur des productions réelles, qui ne sont pas seulement des

87

listes de termes mais des textes spécialisés. On peut alors opposer la terminologie à la « langue générale » en décidant que sera considéré comme terme dans un corpus spécialisé tout ce qui est nouveau par rapport au fonctionnement généralement attendu dans cette langue. D’ailleurs il est connu qu’un certain nombre de termes se créent par métaphorisation, c’est-à-dire (si on globalise les propositions présentées ci-dessus de la rhétorique et de la néologie) par création d’un écart (probablement volontaire à un moment donné) puis intégration de cet écart par un ensemble de locuteurs.

On trouve cette idée de déviance dans la modélisation du lexique choisie dans le projet européen Eurotra (Mac Naught et al., 1991, 3) où cette notion, déclinée en trois modes, permet de rendre compte dans une même structure du lexique général et des lexiques spécialisés :

« In describing SL [Sublanguage] and GL [General Language] one should make use of three complementary points-of-view or modes.

- the restrictive mode: by excluding certain features of GL, SL can be described as a restricted form of language;

- the deviant mode: SL can show specific features which are not found in GL and therefore can be considered a deviant form of GL;

- the preferential mode: this approach of SL phenomena is complementary to the restrictive and deviant modes, and is expressed in terms of preferences. »

J’ai essayé d’exploiter cette idée d’un fonctionnement déviant non pour représenter le fonctionnement du lexique mais pour le repérer en corpus avec comme hypothèse que seraient considérés comme termes les éléments qui ne fonctionneraient pas conformément à la compétence d’un locuteur moyen.

1.1.2 Mise en œuvre de la notion de déviance

Cette étape de ma réflexion a consisté à donner une réalité linguistique et descriptive à cette idée de déviance. J’ai ainsi décrit 4 types de fonctionnements déviants.

Mots ou groupes de mots inconnus

Il s’agit de l’ « écart » le plus manifeste, qui attire immédiatement le lexicologue non spécialiste du domaine : par exemple, dans le corpus MMS : actionneur ou étagiste.

Hormis dans des corpus très spécialisés, ces cas sont rares et la difficulté est bien plus grande de repérer un fonctionnement « étrange » dans un corpus où la quasi totalité des mots sont connus (comme le corpus SGGD, par exemple).

Ces mots nouveaux peuvent aussi provenir de l’application de règles morphologiques connues, sur des bases connues, par exemple redocumenter dans MOUGLIS.

Fréquence anormale

Qu’ils s’agissent de mots simples ou de combinaisons, leur fréquence est parfois si élevée qu’ils attirent l’attention ; par exemple dossier de test dans MOUGLIS ou préparation de test dans MMS. C’est sur cette idée d’une fréquence élevée que se sont constitués les outils d’extraction de termes candidats fonctionnant à partir de segments répétés (cf. chapitre III).

Structures elliptiques

L’ellipse peut concerner

soit un « mot vide » : déterminant ou préposition : alarme système, service

88

– soit un mot plein par exemple l’objet d’un verbe comme dans l’énoncé issu du domaine bancaire : vous pouvez déposer librement sur votre compte.

Ce second type d’ellipse a été repéré par Noailly, qui ne travaille pas pourtant sur la terminologie :

« Par "emploi absolu" d'un verbe, on entend des emplois où le complément du verbe transitif, direct ou indirect, est absent, sans que cela implique que le verbe en question ait globalement changé de sens...cet objet, s'il est nécessairement existant dans l'univers de référence, est linguistiquement considéré comme sans pertinence. » (Noailly, 1996a, 74).

Pour Harris aussi :

« La forte probabilité d’un élément est aussi un point-clé de la contrainte de réduction. » (Habert et Zweigenbaum, 2002b).

On peut penser qu’un univers de référence récurrent, comme l’est par exemple une situation de travail, conduise à l’instauration régulière de l’ellipse, au point qu’elle fasse partie du code linguistique à l’œuvre dans cet univers de référence.

Combinaisons « anormales » de mots ou groupes de mots

– Relation entre verbe et arguments :

- apparition d’un nouvel argument (anomalie syntaxique) par exemple, dans MMS : geler un test (pas d’objet attendu).

- anomalie sémantique d’un argument :

par exemple, documenter un logiciel, dans MOUGLIS (argument humain attendu). Ces combinaisons seront considérées comme des termes.

– Coordination inattendue : Par exemple dans le corpus MMS :

Il n’y a pas pour ces équipements de chien de garde ou de logique de reconfiguration.

Dans ce cas, chien de garde est considéré comme un terme parce qu’il est coordonné à une combinaison considérée comme un terme.

Il y aurait sans doute d’autres caractérisations possibles mais je n’ai pas poursuivi dans cette direction. En effet, je me suis rapidement rendu compte que la mise en œuvre systématique de cette approche supposait le recours à une référence (à défaut d’une norme) et que cela paraissait très difficile à réaliser. On peut espèrer, comme le font Habert et Zweigenbaum que :

« Le recours désormais possible à des très gros volumes de données textuelles amène à questionner sur des bases partiellement renouvelées la validité de l’intuition d’acceptabilité […] » (Habert et Zweigenbaum, 2002b).

Mais il reste à mettre sur pied des études visant à comparer des corpus spécialisés avec des corpus équilibrés pour évaluer la pertinence de ce type d’approche.