• Aucun résultat trouvé

Rétroconversion automatique du Französisches Etymologisches Wörterbuch (FEW)

N/A
N/A
Protected

Academic year: 2021

Partager "Rétroconversion automatique du Französisches Etymologisches Wörterbuch (FEW)"

Copied!
1
0
0

Texte intégral

(1)

Rétroconversion automatique

du Französisches Etymologisches Wörterbuch (FEW)

Pascale RENDERS

sous la direction d' Éva BUCHI, ATILF (CNRS/Nancy-Université) et Marie-Guy BOUTIER, Université de Liège pascale.renders@atilf.fr

3 Logiciel de rétroconversion automatique

➢ article par article

➢ information par information

➢ via interface web ou en ligne de commande ➢ permettant des corrections manuelles

à chaque étape

4 Exploitation du résultat

➢ FEW informatisé, consultable sur le web

➢ Lecture des articles facilitée : - mise en évidence d'informations spécifiques à la demande du lecteur

- résolution des abréviations : ex. "Mfr.", "nfr.", "saint.", "Monstr", "Rhlitt" - liens hypertextes (renvois vers d'autres articles)

➢ Recherches transversales (i.e. dans tous les articles du dictionnaire)

➢ Recherches complexes (combinant des critères chronologiques, géographiques, sémantiques, morphologiques etc.)

Ex. "Quels lexèmes sont attestés pour la première fois au 17e siècle et proviennent d'un étymon grec?"

<b>completus</b> vollständig;<lb/> vollkommen.<lb/>

<p>I. 1. a. Vollständig. — Mfr. nfr. <i>complet</i> „à<lb/> quoi il ne manque aucune des parties nécessaires“<lb/> (seit ca. 1300, Monstr; Rhlitt 6, 464), saint. St-<lb/> Seurin <i>compiet</i> [...]. —<lb/>

Übertragen. Nfr. <i>complet</i> „(pop.) tout à fait ivre“<lb/> (seit Flick 1802).

➢ 25 volumes publiés

depuis 1922

1 Le FEW

➢ Analyse d'un point de vue

génétique

➢ Présentation selon une

structure complexe

➢ Ensemble du lexique

galloroman du 9e au

20e siècles

➢ Texte électronique

(codage Unicode, dont 125 caractères phonétiques non standard)

2 Le FEW informatisé

<art> <entry> <etymon>cellula</etymon> </entry> <doc> <p> <unit> <geoling>afr.</geoling> <form>ciaule</form> <gram>f.</gram> <def>cellule de moine</def> <date>13.-14.jh.</date> </unit> <unit> ... </unit> ... ➢ Étiquetage sémantique

via balises XML de chaque information "cible" (i.e. susceptible de requêtes)

This poster includes icons from the Tango library (http://tango.freedesktop.org/), under Creative Commons Attribution Share-Alike license.

<entry><b><etymon>completus</etymon></b> vollständig;<lb/>vollkommen.<lb/></entry> <doc><p><pnum id="I 1 a">I. 1. a.</pnum> <title>Vollständig.</title> —

<unit><geoling>Mfr.</geoling> <geoling>nfr.</geoling> <form><i>complet</i></form> <def>

„à<lb/>quoi il ne manque aucune des parties nécessaires“</def><lb/> <precisions>(seit <date>ca. 1300</date>, <biblio>Monstr</biblio>; <biblio>Rhlitt 6, 464</biblio>)</precisions></unit>,

<unit><geoling>saint.</geoling> <geoling>St-<lb/>Seurin</geoling> <form><i>compiet</i> </form></unit> [...]. —<lb/><title>Übertragen.</title>

<unit><geoling>Nfr.</geoling> <form><i>complet</i></form> <def>„(pop.) tout à fait ivre“</def><lb/><precisions>(seit <biblio>Flick 1802</biblio>)</precisions></unit>.

XML (balises de mise en forme)

XML (balises sémantiques) ➢ séquence de 35 algorithmes de rétroconversion

➢ étiquetant chacun un type d'information "cible" ➢ selon des critères - textuels (mots-clés)

- contextuels (expressions régulières) - structurels (balisages préalables

de mise en forme et sémantiques)

Références

Documents relatifs

a - Choisir des 7 mots de telle sorte qu'ils ontiennent tous les aratères aentués possibles. b - Erire une page HTML ontenant une ou deux phrases onstitués des

[r]

[r]

I, Elda de Carvalho, as the coordinator of Moris Foun Group, which weave Tais in Uani Uma Village, declare that our group is surely ready that we agree to the government’s program and

[r]

[r]

[r]

dans la balise du paragraphe (méthode sans fichier css) pour changer la couleur du mot test en rouge… puis affecter la classe soustitrecolor à la balise. &lt;p&gt; en