• Aucun résultat trouvé

Table ronde, «Lexicographie et informatique ». Barcelone, 2 juin 2004

N/A
N/A
Protected

Academic year: 2021

Partager "Table ronde, «Lexicographie et informatique ». Barcelone, 2 juin 2004"

Copied!
6
0
0

Texte intégral

(1)

« Lexicographie et informatique »

Barcelone, 2 juin 2004

Cette réunion, programmée dans l’après-midi du 2 juin, profitait de la présence à Barcelone des participants au Colloque sur la « Création verbale en latin médiéval ». De nombreuses équipes lexicographiques y étaient représentées, correspondant aux régions ou aux pays suivants : Allemagne-Autriche-Suisse, Belgique, Catalogne, France, Grande-Bretagne, Irlande (pour les pays celtes), Italie, Léon et Asturies, Pays-Bas, Pologne, République tchèque, Suède. M. Peter Stotz assurait la présidence des débats. M. Birger Munk Olsen, qui représentait le Danemark, avait dû quitter Barcelone avant cette séance, en laissant des informations sur l’avancement du dictionnaire de son pays.

A la demande du Comité d’organisation, en fin de matinée, M. Paul Tombeur avait donné un exposé liminaire sur une « Base dictionnairique pour l’étude du latin médiéval », actuellement constituée à Tumhout, dans le cadre du Centre « Traditio litte- rarum occidentalium » (ou CTLO), lié à la firme Brepols. Vers septembre-octobre 2004, on y prévoit la mise en ligne d’une base regroupant des dictionnaires imprimés, à la fois médiévaux et modernes. L’état initial comportera deux Dictionnaires latin-français, ceux d’Albert Biaise {Dictionnaire des auteurs chrétiens, corrigé et enrichi des sens clas­ siques omis par l ’auteur) et de Firmin le Ver (.Dictionarius, éd. B. Merrilees et W. Edwards). On pourra y faire des interrogations par lemme ou par forme, par traduc­ tion ou par références, les résultats étant communiqués avec des précisions sur les auteurs et leur chronologie. Chaque élément de la rubrique du dictionnaire est interro­ geable, comme, par exemple, les indications morphologiques ou les commentaires. Seront ensuite intégrés, sans doute vers 2005, le Glossarium de Du Cange, en mode image, puis le Totius Latinitatis Lexicon de Forcellini, le Dictionnaire latin-français des

auteurs du moyen Age de Biaise, le Latin Dictionary de Lewis et Short, ainsi que les dictionnaires médiévaux publiés dans la série in-4° du Corpus Christianorum, Conti­

nuado mediaevalis : Anonymi Montepessulanensis dictionarius, éd. A. Grondeux ; Glos­

sarium gallico-latinum, éd. B. Merrilees et J. Monfrin ; Dictionarius fam iliaris et

compendiosus de Guillaume le Talleur, éd. W. Edwards et B. Merrilees.

Ce qu’il faut souligner pour l’ensemble de ces projets, c’est la possibilité de passer des dictionnaires aux bases de données textuelles livrant exemples, références complètes et mémentos, et, à l’inverse, de passer automatiquement des bases de données textuelles vers les dictionnaires. Dans les bases de données textuelles sont prévues désormais les possibilités d’interrogation par siècles et par références d’œuvres. Quant à l’interroga­ tion à partir de formes concrètes, selon leurs diverses graphies, elle permet d’obtenir le ou les lemmes correspondants et de consulter ainsi les rubriques de dictionnaires tout autant que les textes. Ces bases de données doivent être utilisées sans négliger les autres outils lexicographiques que sont les « Instrumenta Lexicológica Latina », le « Thesaurus

(2)

Patrum Latinorum » et le « Thesaurus formarum totius latinitatis a Plauto usque ad saeculum XXum » publiés désormais par le CTLO. Des exemples concrets furent montrés pour illustrer comment il est possible de compléter ou de corriger si nécessaire les dictionnaires publiés grâce à tous ces instruments. Le projet dictionnairique présenté par Paul Tombeur appelle à une large collaboration internationale permettant d’associer les divers dictionnaires et d’aboutir ainsi à un dictionnaire des dictionnaires.

Pour susciter des réactions et nourrir le débat, un document élaboré par le Comité Du Cange avait été adressé aux différents comités vers la fin d’avril. Les questions suivantes y étaient posées : 1. Les équipes souhaitent-elles travailler ensemble à un instrument de travail sur le vocabulaire médiolatin, qui serait un jour en ligne et regrouperait l’en­ semble des dictionnaires régionaux et nationaux patronnés par l ’UAI ? 2. Sont-elles prêtes, malgré la faiblesse de leurs effectifs et de leurs budgets, à considérer comme prioritaire la digitalisation rétrospective de leurs fascicules publiés et à rechercher des financements à cette fin ? Ont-elles déjà une expérience directe en ce domaine ou des contacts avec des prestataires de services ? 3. Quel serait le marquage minimal à prévoir pour assurer des liens entre les différents champs d’un dictionnaire donné et une éven­ tuelle compatibilité entre les diverses entreprises ?

La table ronde proprement dite a été ouverte par François Dolbeau, au nom des orga­ nisateurs. Depuis la réunion de Bruxelles en 2000, les éditions électroniques et les consultations d’ouvrages sur le Web ont progressé de façon spectaculaire. Désormais, par des exemples comme celui de Godefroy (Dictionnaire de Vancienne langue fra n ­

çaise et son Supplément), on voit ce qu’apporte la mise en ligne d’un dictionnaire par rapport à un livre traditionnel : visualisation rapide des lemmes, interrogations par formes, par traductions modernes, par catégories grammaticales, etc. On conçoit mieux aussi comment cette formule s’adapte avec souplesse à des entreprises encore inache­ vées, à des « works in progress », par exemple la « Base des lexiques en Moyen Fran­ çais » (BLMF). L’idéal serait évidemment de mettre à la disposition des chercheurs, grâce à un portail et sur un site unique, le plus grand nombre possible de dictionnaires médiolatins nationaux ou régionaux. Il ne s’agirait pas de fusionner les résultats, mais d’en permettre la consultation quasi simultanée. Cela implique naturellement une entente préalable sur les normes de codage. Chaque équipe serait alors libre, en fonction de sa situation propre, de se fixer un calendrier pour parvenir à l ’objectif commun.

Les représentants des différents comités ont expliqué ensuite où en étaient leurs travaux et cherché à répondre aux questions posées. Le résumé qui suit respecte l ’ordre même de leurs interventions durant le tour de table.

Irlande et p ays celtes

Anthony Harvey présente le futur Dictionary o f M edieval Latin from Celtic Sources, un dictionnaire complémentaire de la base textuelle Archive o f C eltic-Latin Literature (ACLL, lié à Brepols et à la méthodologie du CTLO), dont le premier tome (un Lexicon du vocabulaire non classique, A-H) est le fruit d’un travail de six ans. Chaque article comporte un lemme, des précisions sur l’étymologie, des traductions anglaises selon les différents sens, et les occurrences repérées, par ordre chronologique, sous la forme d’une liste de sigles d’éditions (correspondant à ceux de M. Lapidge et R. Sharpe, dans la

Bibliography o f Celtic-latin Literature) ; des lettres précisent la provenance de la source : A (Bretagne romane, pays de Galles et Comouailles), B (Irlande), C (celtes du conti­ nent), D (Bretagne continentale), E (Écosse). Les exemples ne sont pas reproduits, mais sont accessibles par interrogation de la base ACLL ; la version électronique du Lexicon,

(3)

qui se prépare en même temps que la version sur papier, et qui apparaîtra dans une fenêtre sur le même écran que le texte, contiendra des liens directs à cette base.

Grande-Bretagne

David Howlett a reçu une subvention de la firme Packard, qui devrait permettre d’achever le D ictionary o f medieval latin from British sources (rendu actuellement à Pi-) dans un délai de sept ans. La version imprimée est protégée par un copyright détenu par la British Academy ; Packard possède un copyright non exclusif pour une version digi­ talisée. L’équipe anglaise souhaiterait offrir un accès complètement libre sur Internet, et serait d’accord pour collaborer à un projet commun.

France

Caroline Heid rappelle que le Novum Glossarium Mediae Latinitatis couvre actuel­ lement la section alphabétique L-Pingo, et que les fichiers correspondant à P sont dispo­ nibles sous forme électronique. Des expériences de numérisation sont en cours en France ; d’autres équipes de l’Université ou du CNRS seraient susceptibles d’apporter une aide technique (notamment à Lyon II). Bruno Bon présente la base de l’ATILF (anciennement INALF, à Nancy), regroupant des lexiques du moyen français, qui est un exemple dont on pourrait s’inspirer.

Pays-Bas

Mariken Teeuwen et Marijke Gumbert indiquent que l’édition sur papier du Lexicon

latinitatis nederlandicae medii aevi (environ 2500 pages imprimées) sera achevée au printemps 2005. L’éditeur Brill, sollicité pour en assurer une publication électronique, ne semble pas vouloir donner suite, car les clients du dictionnaire, interrogés, désirent un produit peu onéreux. L’équipe souhaiterait donc réaliser, d’ici à cinq ans, un accès ‘on line’ qui serait libre. La stratégie globale de l’Institut Huygens est d’ailleurs de stimuler la numérisation.

Léon et Asturies

Maurilio Pérez Gonzalez précise que ce dictionnaire a été lancé lors du Io Congreso hispánico de latín medieval (Léon, décembre 1993), dans un cadre universitaire et selon un plan d’ensemble qui devait initialement couvrir le Portugal et d’autres régions d’Es­ pagne. Le dictionnaire pour les deux provinces de Léon et des Asturies devrait être terminé dans un délai de six à huit ans, sans être lié à un éditeur quelconque. Sa publi­ cation électronique, envisagée dès l’origine, pourrait être accompagnée d’une édition sur papier. L’équipe, après autorisation des responsables de l’Université de Léon, serait inté­ ressée par un rapprochement avec les équipes travaillant sous les auspices de l’UAI.

Catalogne

Pere J. Quetglas signale que, pour le Glossarium Mediae Latinitatis Cataloniae, la lettre G (fascicule 12) sera publiée fin 2004. Il existe aussi un projet de mettre en ligne sur Internet le corpus des textes correspondants. D ’autre part, on prévoit la réédition mise à jour du premier volume du glossaire.

(4)

Suède

Le dictionnaire suédois est achevé depuis 2002. Cependant, Eva Odelman indique qu’un fascicule de supplément est en cours de rédaction et qu’effectivement la Suède doit penser à une publication électronique. Elle se demande si le glossaire ne devrait pas, pour ce faire, demander un financement et du personnel aux Archives nationales : celles- ci patronnent déjà la publication d’une collection de textes, qui forme la majeure partie du matériel utilisé pour la rédaction du dictionnaire (Diplomatarium Sueciae). L’autre partie est formée des Révélations de sainte B rigitte, dont la publication sur Internet est en cours. E. Odelman prévoit de discuter de ces questions aves ses collègues du Dane­ mark et de Norvège.

Allemagne-Autriche-Suisse

Le Mittellateinisches Wörterbuch (Allemagne-Autriche-Suisse) est paru jusqu’à la fin de D, et la lettre E est en cours de rédaction. Johannes Staub estime que la mise en ligne va devenir indispensable, même si, pour l ’instant, ce n’est pas le projet prioritaire de la rédaction. L’achèvement de la lettre E correspond à la fin du premier tiers du diction­ naire, qui doit impérativement être achevé dans un délai de vingt-cinq ans environ, c’est- à-dire en 2030. Pour cette raison, l’équipe ne peut actuellement libérer du temps de travail pour la numérisation des fascicules parus : en ce qui concerne la préparation de ceux à paraître pour une publication électronique simultanée, elle sera facilitée considé­ rablement, étant donné qu’à partir du lemme « coniugium » les articles existent sous forme électronique. Pourtant il faudra donc trouver un financement extérieur pour les deux démarches, la numérisation complète du début et le traitement pour la mise en ligne. A titre d’information, le Thesaurus Linguae Latinae est paru en 2004, chez Saur, sous forme de CD-Rom (pour les lettres F à P).

République tchèque

Zuzana Silagiovà pense que son dictionnaire doit exister en deux versions, l’une sur papier, l’autre électronique. Le Latinitatis medii aevi lexicon Bohemorum a atteint en 2002 le terme lapidea avec son fascicule 18. Il possède les lemmata automatisés depuis le premier fascicule, sous deux formes (Wordperfect et Word) ; l ’équipe rédactionnelle de cinq personnes pourrait éventuellement bénéficier des avis d’un informaticien suscep­ tible de concevoir le programme. Quoi qu’il en soit, le dictionnaire se doit d’être facile­ ment consultable par l ’utilisateur. Parmi les fiches utilisées pour la rédaction des articles, un tiers provient de manuscrits ; aussi, pour des raisons de conservation, serait-il très souhaitable que ces matériaux précieux soient aussi scannés, mais cette opération est impossible à réaliser actuellement vu les moyens de l’équipe. D ’un autre côté, les éditions principes de la série Fontes Latini Bohemorum sont déjà numérisées.

Pologne

Michal Rzepiela rappelle que le Lexicon mediae et infimae latinitatis Polonorum en est au lemme « Remunerado ». Depuis la lettre P, les fichiers sont récupérables pour la numérisation, sous ChiWriter. Mais on se demande comment procéder pour les lettres antérieures. Pour leur plus grande partie, les sources exploitées ne sont pas non plus numérisées. La rédaction qui compte six personnes ne peut se charger d’un tel travail. L’on pourrait envisager de demander une aide à l ’Institut de la langue polonaise.

(5)

Italie

Antonio De Prisco, qui parle au nom du Latinitatis italicae medii aevi lexicon, précise que ce dictionnaire est terminé. La rédaction en est à sa deuxième série d’Ad­ denda, « caballarius-covix », parue dans ALMA, t. 61, 2003, où sont enregistrées seule­ ment les nouveautés absentes de Porcellini. Il donne son accord de principe au projet, et se demande s’il faut envisager une fusion du matériel. Aucun fichier n’est informatisé pour ce Lexicon. Comme exemple de numérisation de sources, il cite la base ‘Archivio elettronico della latinità italiana del Medioevo’, d’ores et déjà interrogeable. Pour financer une digitalisation rétrospective, il serait envisageable de s’adresser au Ministère italien de l’Université.

Belgique

Paul Tombeur rappelle que, dès 1973, Y Index scriptorum operumque latino-belgi-

corum recensait de façon automatisée les textes narratifs du territoire belge et en offrait un « Thesaurus linguae » informatisé ; quant aux textes diplomatiques, la base en est le

Thesaurus diplom aticus, édité en 1997, qui renferme le texte complet des actes, les iden­ tifications et une reproduction d’un corpus d’originaux. La Belgique a choisi de publier non un dictionnaire, mais des outils pour un dictionnaire : des index, des concordances (de formes et de lemmes) et des bases de données (y compris un index fontium mis à jour), mais il n’y aura pas de dictionnaire en tant que tel qui ferait nécessairement double emploi avec les dictionnaires allemand et néerlandais (où beaucoup de sources du territoire belge sont traitées). La collaboration du comité belge avec le CTLO a l’avantage de développer les bases de données dictionnairiques, et la Belgique pourrait jouer un rôle de coordination afin de parvenir à un véritable dictionnaire des diction­ naires latins médiévaux. Paul Tombeur propose l’aide du comité belge aux équipes qui en auraient besoin et insiste sur le temps nécessaire pour réaliser une véritable base de données dictionnairiques distinguant les champs.

Peter Stotz, en tant que modérateur des débats, se réjouit du consensus que manifes­ tent ces différentes interventions. François Dolbeau propose qu’une demande conjointe des équipes soit transmise au nouveau président et au bureau de l’UAI : l’objectif serait d’obtenir un encouragement officiel pour l’étape de numérisation et l’objectif final d’un portail commun ‘on line’, afin qu’ensuite chaque équipe puisse se tourner vers les auto­ rités de son pays. J. Hamesse indique qu’à Strasbourg un organisme européen (European Science Foundation) subventionne de telles initiatives, à condition que trois réunions aient lieu dans des villes qui ne soient pas capitales. Pour commencer, les équipes qui ont déjà des sites Web devront créer des liens entre elles. Les équipes non représentées à Barcelone recevront le compte rendu de cette table ronde. Il faudra aussi trouver une solution pour intégrer les dictionnaires déjà publiés de Finlande et de l’ex-Yougoslavie (qui intéresse surtout la Croatie et la Slovénie). Benoît Tock, en tant qu’utilisateur, souligne l’intérêt de faire passer des informations sur le site de l ’UAI. Paul Tombeur estime qu’il faudrait aussi intégrer la Medieval Latin Word-list de Latham, très précieuse par ses dates d’occurrences, dans la base des dictionnaires médiolatins d’Europe, ainsi que bien d’autres listes de vocabulaire.

Concrètement, les champs communs à prévoir (les plus nombreux possibles, même s’ils ne sont pas remplis dans tous les dictionnaires) seront les suivants :

- lemme,

- variantes graphiques (pour accéder, par un hyperlemme, à toutes les formes), - catégorie grammaticale,

(6)

- étymon, étymologie,

- domaine (exemples : zoologie, botanique, diplomatique...), - traduction moderne,

- exemples,

- références (avec renvois aux Index des sources), - bibliographie.

A chacun désormais d’évaluer financièrement le coût de la numérisation de son dictionnaire. On prévoit de se réunir avant quatre ans, dans plusieurs rencontres inter­ médiaires. Les équipes souhaitent un soutien officiel de l’Union Académique Internatio­ nale ; elles voudraient que soient précisés au plus vite les champs utilisés et être assu­ rées de la compatibilité des solutions retenues.

Références

Documents relatifs

Pourquoi ne pas envisager plusieurs petits dictionnaires très maniables répondant cha-. Ajoutons les formes ver- bales invariables, une liste des prénoms, si

Pierre Jacquiez, alias Tabusset, métrai de Dompierre-le-Grand, pour le duc de Savoie, co-seigneur de Vallon, et Jacques Borquinet, châtelain pour Messieurs de Fribourg, seigneurs

Franchise : Somme qui reste à la charge d'une personne ayant souscrit un contrat d'assurance en cas de sinistre ou Accord par lequel une entreprise, le franchiseur, accorde à

Liste avec allocation dynamique par enregistrement et organisati Liste avec allocation dynamique par enregistrement et organisation on chaî cha în n ée simple é e simple (ou

On utilise un dictionnaire pour connaître l’orthographe d’un mot, sa nature, sa prononciation et ses différents sens.. Dans le dictionnaire, les mots sont classés selon

J’ai un dictionnaire en

* Pour chercher un mot dans le dictionnaire, je regarde la première lettre du mot, puis la seconde, puis la troisième..... Exemple : Si l’on cherche le mot « brouette », on cherche

Définition: Le dictionnaire décrit et explique un ensemble de mots qui sont classés par ordre alphabétique ou rangés par familles de mots. Des abréviations renvoient