II. Lexicographie synchronique : Notices du Dictionnaire du Moyen Français
1. Lexicographie informatisée : de la rédaction à la consultation
En 1982, alors que le tome 10 du TLF est sous presse, et dans le prolongement du projet
119
On trouvera la liste des notices que j’ai rédigées au t. 3, pp. 335-341 de la thèse ; elles sont consultables à
l’adresse : http://www.atilf.fr/dmf.
originel arrêté par P. Imbs, qui prévoyait plusieurs descriptions d’états de la langue française, fut
lancé sous l’impulsion de R. Martin le chantier du dictionnaire du moyen français. D’emblée, il
convient de souligner que c’est dans la conception même de chacun de ces dictionnaires, liée aux
possibilités qui s’ouvrent à la lexicographie grâce à l’informatique, que leur opposition semble la
plus marquante. En effet, comme l’affirme R. Martin « les choix sont résolument orientés du côté
de la lexicographie informatisée » et le balisage du DMF « s’opère au moment même de la
rédaction (…) au moyen d’instruments qui assistent le rédacteur dans sa tâche (…) et lui
permettent d’introduire directement les données et de les organiser à l’écran ». Grâce à
différents modules de contrôle, chacun des rédacteurs, après avoir réuni informatiquement dans
ses articles un ensemble fini de connaissances linguistiques, est en mesure de vérifier
l’adéquation au modèle et la conformité aux normes qui ont été fixées, ce qui donnera à
l’ensemble une homogénéité que ne pouvaient avoir les articles élaborés sans le soutien de
l’informatique. À la différence des notices du TLF conçues en fonction d’une classification
lexicographique moins formelle laissant à chaque rédacteur sa manière d’organiser les
informations linguistiques selon un point de vue qui lui est propre, l’ordonnancement des
contenus, l’articulation des données du DMF est classé dans un ordre strict, préétabli. Élaboré
d’emblée comme un dictionnaire informatisé, le DMF présente l’avantage appréciable de pouvoir
être à tout moment, et le plus facilement possible, remanié, soit pour être enrichi ou mis à jour,
soit pour être amélioré par des corrections. Mais, l’essentiel de cette informatisation, où chaque
élément a été rigoureusement balisé, et dont une description détaillée est donnée dans la
Présentation du DMF (pp. 10-17)
121, réside dans le changement considérable de la méthodologie
du lexicographe
122. La grammaire rédactionnelle structure désormais étroitement les notices et
systématise la manière d’introduire les informations. Ces informations doivent se suivre dans un
ordre obligatoire strict (au minimum : entrée, code grammatical, lemme, renvoi aux dictionnaires
qui traitent déjà le mot
123[dans un ordre imposé], définition, référence normalisée) et selon le
respect d’éléments prédéfinis (marqueurs alphanumériques de niveau, balises métalinguistiques
préalablement listées, etc.), pour que le document soit valide. Ce procédé, nommé « masque de
saisie » par les informaticiens, guide le rédacteur dans sa saisie de données et l’assiste dans ses
choix en indiquant les possibles autorisés ou en lui interdisant la saisie de valeurs interdites ; à ce
titre, c’est un véritable garde-fou. Par ailleurs, le rédacteur est encore assisté par un « correcteur
lexicographique »
124qui lui signale les erreurs survenues quant à l’ordre alphabétique des
entrées, non seulement celles du DMF mais aussi celles des dictionnaires de référence cités au
début de chaque notice ; il relève également les structures incohérentes, les citations qui ne sont
pas classées selon un ordre chronologique correct et, en outre, il contrôle simultanément la
justesse des balises et des références bibliographiques.
121
Voir aussi Martin 1999.
122
Cf. Martin 1999, 57-58.
123
Même si l’emploi propre au DMF n’est pas traité dans les dictionnaires cités.
Du point de vue du lexicographe, la rédaction assistée par ordinateur permet d’assurer la
cohérence de chaque notice et des notices entre elles et, de surcroît, entre les différents
rédacteurs. Le manque d’homogénéité si souvent reproché aux notices du TLF tend à
s’amenuiser, même s’il subsiste, ça et là, quelques cas où la présentation mériterait d’être
davantage unifiée : je pense, en particulier, aux conditions d’emploi, exprimées tantôt par une
formulation en clair placée dans des crochets droits, tantôt simplement intégrées, toujours par le
système des crochets droits, à la définition, comme on peut le voir dans l’article abattre qui
présente les deux possibilités.
ABATTRE
1, verbe
[Le compl. d'obj. désigne une chose concr. ; suj. de l'animé] "Jeter à bas (ce qui est vertical)"
"Faire s'écrouler, renverser, détruire [un bâtiment, un mur, un pont, une statue...]" f
Un autre avantage de la lexicographie informatisée, et non des moindres, est que les
données, en libre accès sur Internet, peuvent être exploitées de manières différentes par les
utilisateurs, en fonction de leurs attentes spécifiques, et ce, par des procédures informatiques
modulables qui rendent possibles des interrogations multicritères. Outre la recherche simple
d’une entrée, d’un étymon, d’une locution, etc., il est, en effet, possible, grâce au balisage
systématique des données, de définir des recherches plus ciblées, qu’elles soient d’ordre
morphologique, sémantique, graphique ou géolinguistique, par exemple. S’il est vrai que
l’affichage d’un article fait apparaître à l’écran la redondance de certaines informations,
l’essentiel est que l’utilisateur puisse, par le biais d’une interrogation reposant sur des critères
complémentaires, rassembler un maximum de données répondant à sa requête. Prenons quelques
exemples destinés à montrer les types d’interrogations possibles grâce à des formulations de
requêtes spécifiques pour un maximum de résultat :
1) Pour réunir l’intégralité du lexique de l’armement de la période du moyen français, il suffit de
déclencher à la fois le domaine ARM. et toutes les définitions qui comportent le mot arme.
2) Pour recueillir l’intégralité du vocabulaire spécifiquement normand de l’époque du moyen
français, il suffit, dans le menu Recherche avancée, de saisir le mot Normandie dans ‘la région est’ (la
liste des régions est visible dans la partie réservée au balisage des informations). Le résultat ainsi obtenu
peut être complété ensuite par une recherche en plein texte de la suite <norm> qui fournira les données
susceptibles de figurer ailleurs dans les notices, notamment dans les remarques.
3) Pour étudier la présence ou non de la forme analogique en -e des adverbes issus d’adjectifs
épicènes (-andement / -amment / -ement / -mment), il suffit, dans Recherche d’une entrée, d’indiquer ces
formes recherchées dans le filtre ‘texte en fin’, pour obtenir des listes de mots exploitables.
On peut ajouter que certaines données du DMF sont mises en lien avec des informations
internes au dictionnaire : il est prévu qu’un « double clic » sur l’occurrence d’une citation
déclenche l’affichage de l’article correspondant du DMF (à condition bien sûr qu’il existe une
entrée de rattachement) ; de même, en cliquant sur la référence au texte abrégée, on obtient la
notice bibliographique complète, la localisation diatopique du texte et un lien avec la
bibliographie du DEAF. Plus intéressant encore, dans la mesure où l’on sort du cadre strict du
dictionnaire, le DMF, selon le même procédé du « double clic », peut être mis en lien avec les
dictionnaires de GD/GDC
125, AND
2et TLFi
126. Pour finir, et avant d’examiner le contenu même
du DMF, on soulignera, en citant R. Martin, qu’ « informatisée, la lexicographie devient ainsi
évolutive » car à tout moment le dictionnaire reste ouvert aux améliorations souhaitables et « la
matière peut en être indéfiniment remodelée »
127.
Dans le document
Lexicographie et lexicologie historique du français
(Page 113-116)