• Aucun résultat trouvé

Lexicographie informatisée : de la rédaction à la consultation

II. Lexicographie synchronique : Notices du Dictionnaire du Moyen Français

1. Lexicographie informatisée : de la rédaction à la consultation

En 1982, alors que le tome 10 du TLF est sous presse, et dans le prolongement du projet

119

On trouvera la liste des notices que j’ai rédigées au t. 3, pp. 335-341 de la thèse ; elles sont consultables à

l’adresse : http://www.atilf.fr/dmf.

originel arrêté par P. Imbs, qui prévoyait plusieurs descriptions d’états de la langue française, fut

lancé sous l’impulsion de R. Martin le chantier du dictionnaire du moyen français. D’emblée, il

convient de souligner que c’est dans la conception même de chacun de ces dictionnaires, liée aux

possibilités qui s’ouvrent à la lexicographie grâce à l’informatique, que leur opposition semble la

plus marquante. En effet, comme l’affirme R. Martin « les choix sont résolument orientés du côté

de la lexicographie informatisée » et le balisage du DMF « s’opère au moment même de la

rédaction (…) au moyen d’instruments qui assistent le rédacteur dans sa tâche (…) et lui

permettent d’introduire directement les données et de les organiser à l’écran ». Grâce à

différents modules de contrôle, chacun des rédacteurs, après avoir réuni informatiquement dans

ses articles un ensemble fini de connaissances linguistiques, est en mesure de vérifier

l’adéquation au modèle et la conformité aux normes qui ont été fixées, ce qui donnera à

l’ensemble une homogénéité que ne pouvaient avoir les articles élaborés sans le soutien de

l’informatique. À la différence des notices du TLF conçues en fonction d’une classification

lexicographique moins formelle laissant à chaque rédacteur sa manière d’organiser les

informations linguistiques selon un point de vue qui lui est propre, l’ordonnancement des

contenus, l’articulation des données du DMF est classé dans un ordre strict, préétabli. Élaboré

d’emblée comme un dictionnaire informatisé, le DMF présente l’avantage appréciable de pouvoir

être à tout moment, et le plus facilement possible, remanié, soit pour être enrichi ou mis à jour,

soit pour être amélioré par des corrections. Mais, l’essentiel de cette informatisation, où chaque

élément a été rigoureusement balisé, et dont une description détaillée est donnée dans la

Présentation du DMF (pp. 10-17)

121

, réside dans le changement considérable de la méthodologie

du lexicographe

122

. La grammaire rédactionnelle structure désormais étroitement les notices et

systématise la manière d’introduire les informations. Ces informations doivent se suivre dans un

ordre obligatoire strict (au minimum : entrée, code grammatical, lemme, renvoi aux dictionnaires

qui traitent déjà le mot

123

[dans un ordre imposé], définition, référence normalisée) et selon le

respect d’éléments prédéfinis (marqueurs alphanumériques de niveau, balises métalinguistiques

préalablement listées, etc.), pour que le document soit valide. Ce procédé, nommé « masque de

saisie » par les informaticiens, guide le rédacteur dans sa saisie de données et l’assiste dans ses

choix en indiquant les possibles autorisés ou en lui interdisant la saisie de valeurs interdites ; à ce

titre, c’est un véritable garde-fou. Par ailleurs, le rédacteur est encore assisté par un « correcteur

lexicographique »

124

qui lui signale les erreurs survenues quant à l’ordre alphabétique des

entrées, non seulement celles du DMF mais aussi celles des dictionnaires de référence cités au

début de chaque notice ; il relève également les structures incohérentes, les citations qui ne sont

pas classées selon un ordre chronologique correct et, en outre, il contrôle simultanément la

justesse des balises et des références bibliographiques.

121

Voir aussi Martin 1999.

122

Cf. Martin 1999, 57-58.

123

Même si l’emploi propre au DMF n’est pas traité dans les dictionnaires cités.

Du point de vue du lexicographe, la rédaction assistée par ordinateur permet d’assurer la

cohérence de chaque notice et des notices entre elles et, de surcroît, entre les différents

rédacteurs. Le manque d’homogénéité si souvent reproché aux notices du TLF tend à

s’amenuiser, même s’il subsiste, ça et là, quelques cas où la présentation mériterait d’être

davantage unifiée : je pense, en particulier, aux conditions d’emploi, exprimées tantôt par une

formulation en clair placée dans des crochets droits, tantôt simplement intégrées, toujours par le

système des crochets droits, à la définition, comme on peut le voir dans l’article abattre qui

présente les deux possibilités.

ABATTRE

1

, verbe

[Le compl. d'obj. désigne une chose concr. ; suj. de l'animé] "Jeter à bas (ce qui est vertical)"

"Faire s'écrouler, renverser, détruire [un bâtiment, un mur, un pont, une statue...]" f

Un autre avantage de la lexicographie informatisée, et non des moindres, est que les

données, en libre accès sur Internet, peuvent être exploitées de manières différentes par les

utilisateurs, en fonction de leurs attentes spécifiques, et ce, par des procédures informatiques

modulables qui rendent possibles des interrogations multicritères. Outre la recherche simple

d’une entrée, d’un étymon, d’une locution, etc., il est, en effet, possible, grâce au balisage

systématique des données, de définir des recherches plus ciblées, qu’elles soient d’ordre

morphologique, sémantique, graphique ou géolinguistique, par exemple. S’il est vrai que

l’affichage d’un article fait apparaître à l’écran la redondance de certaines informations,

l’essentiel est que l’utilisateur puisse, par le biais d’une interrogation reposant sur des critères

complémentaires, rassembler un maximum de données répondant à sa requête. Prenons quelques

exemples destinés à montrer les types d’interrogations possibles grâce à des formulations de

requêtes spécifiques pour un maximum de résultat :

1) Pour réunir l’intégralité du lexique de l’armement de la période du moyen français, il suffit de

déclencher à la fois le domaine ARM. et toutes les définitions qui comportent le mot arme.

2) Pour recueillir l’intégralité du vocabulaire spécifiquement normand de l’époque du moyen

français, il suffit, dans le menu Recherche avancée, de saisir le mot Normandie dans ‘la région est’ (la

liste des régions est visible dans la partie réservée au balisage des informations). Le résultat ainsi obtenu

peut être complété ensuite par une recherche en plein texte de la suite <norm> qui fournira les données

susceptibles de figurer ailleurs dans les notices, notamment dans les remarques.

3) Pour étudier la présence ou non de la forme analogique en -e des adverbes issus d’adjectifs

épicènes (-andement / -amment / -ement / -mment), il suffit, dans Recherche d’une entrée, d’indiquer ces

formes recherchées dans le filtre ‘texte en fin’, pour obtenir des listes de mots exploitables.

On peut ajouter que certaines données du DMF sont mises en lien avec des informations

internes au dictionnaire : il est prévu qu’un « double clic » sur l’occurrence d’une citation

déclenche l’affichage de l’article correspondant du DMF (à condition bien sûr qu’il existe une

entrée de rattachement) ; de même, en cliquant sur la référence au texte abrégée, on obtient la

notice bibliographique complète, la localisation diatopique du texte et un lien avec la

bibliographie du DEAF. Plus intéressant encore, dans la mesure où l’on sort du cadre strict du

dictionnaire, le DMF, selon le même procédé du « double clic », peut être mis en lien avec les

dictionnaires de GD/GDC

125

, AND

2

et TLFi

126

. Pour finir, et avant d’examiner le contenu même

du DMF, on soulignera, en citant R. Martin, qu’ « informatisée, la lexicographie devient ainsi

évolutive » car à tout moment le dictionnaire reste ouvert aux améliorations souhaitables et « la

matière peut en être indéfiniment remodelée »

127

.