• Aucun résultat trouvé

Comme nous l’avons mentionn´e en 5.2.4, les tables disponibles ainsi que les diff´erents lexiques auxquels elles ont ´et´e converties (LGLex etLGLex-Lefff) font partie de la ver-sion 3, qui a ´evolu´ee depuis septembre 2008. La version 3.3 est disponible depuis le 31 mars 2011 sur le site http://infolingu.univ-mlv.fr/ (Donn´ees Linguistiques >

Auteurs Nom des tables Format Table Lexique Lexique Excel des classes LGLex LGLex-Lefff (a) Verbes distributionnels (simples)

M. Gross 1 `a 18 OK OK OK OK

J.-P. Boons, A. Guillet, 32A ... 39 OK OK OK OK

C. Lecl`ere (BGL)

J.-P. Boons, A. Guillet, 31H ... 35R OK OK OK OK

C. Lecl`ere (BGL)

A. Guillet, 36DT ... 38LR OK OK OK OK

C. Lecl`ere (BGL)

C. Lecl`ere, A. Borillo (BGL) 36S OK OK OK OK

C. Lecl`ere (BGL) 35RR et 38RR OK OK OK OK

(b) Noms pr´edicatifs (simples et compos´es)

J. Giry-Schneider F1A `a F91 OK OK OK OK

J. Giry-Schneider FN `a FNPNN OK OK OK OK

A. Meunier AN01 ... ANSY OK OK OK OK

G. Gross AA ... IS2 OK OK OK OK

J. Giry-Schneider, AN07 `a AN10 OK OK OK OK

A. Balibar-Mrabti

J. Giry-Schneider ANDN et ANSN OK OK OK OK

D. de N´egroni-Peyre PSY et SYM OK OK OK OK

R. Viv`es APE1 `a APP3 OK OK OK OK

J. Labelle ANA ... ANSU OK OK OK OK

L. Pivaut FD1 `a FD4 En cours En cours En cours En cours

(c) Expressions fig´ees (principalement verbales et adjectivales)

J.-P. Boons, A. Guillet, 31I OK OK OK En cours

C. Lecl`ere (BGL)

M. Gross A1 ... YA OK OK OK En cours

M. Gross EAPC ... EPA OK OK OK En cours

M. Gross EPAC `a EPDETC OK OK OK En cours

M. Gross E1 ... EDN OK OK OK En cours

J. Giry-Schneider FC `a FCPNN OK OK OK En cours

L. Danlos Z `a ZS En cours En cours En cours En cours

(d) Adverbes (simples et (semi-)fig´es)

C. Molinier, F. Levrier ADVMF `a ADVPS OK OK OK /

M. Gross PAC `a PVCO OK OK OK /

(e) Adjectifs pr´edicatifs (simples)

L. Picabia ADJ1 `a ADJ13 / / / /

J. Giry-Schneider ADJ01 `a ADJSYM En cours / / /

(f) Adjectifs non pr´edicatifs (simples)

E. Laporte ADJLOCTABLE OK / / /

J. Giry-Schneider DEDJA et DADJI En cours / / /

Table 9.1: Inventaire des tables du Lexique-Grammaire et avancement des travaux de conversion vers des formats ´electroniques exploitables

9.2 ´Evolution de la version 3 Lexique-Grammaire > T´el´echargement), accompagn´ee des outils de conversion (LGEx-tract et LGLex2ilex). La Tab. 9.2 r´ecapitule l’´evolution de la version 31.

Les cat´egories couvertes par les tables, au format CSV2, et par le lexique LGLex, au format texte et XML, sont les verbes, les noms pr´edicatifs, les expressions fig´ees et les adverbes. Des entr´ees suppl´ementaires de verbes, expressions fig´ees et adjectifs pr´edicatifs ont ´et´e extraites de certaines tables (cf. section 6.6). De plus, les verbes et les noms pr´edicatifs sont au format LGLex-Lefff (intensionnel et extensionnel).

Parmi les informations s´emantiques cod´ees dans les tables, le format LGLex-Lefff garde celle qui est la plus compl`ete, `a savoir si un syntagme nominal peut ˆetre humain et/ou non humain (macros @SujNhum, @Obj`aN-hum, etc.).

De plus, un README est disponible pour chacun des deux formats de lexique en fran¸cais et en anglais (voir les annexes A et C), de mˆeme que pour chacun des deux outils de conversion (voir les annexes B et D), et enfin pour les tables afin de pr´esenter leur format, leur codage, ainsi que celui de la table des classes, et d’y inclure toutes les r´ef´erences compl`etes. On sp´ecifie ´egalement pour chacune des r´ef´erences, le nombre de tables concern´ees, ainsi que la liste compl`ete des tables (cf. la Tab. 5.1).

Enfin, en plus des tables, nous avons ´egalement une table des classes par cat´egorie, ainsi que pour les verbes, la documentation de toutes les propri´et´es syntaxico-s´emantiques en fran¸cais et en anglais (voir l’annexe E), l’ordre de priorit´e dans le classement des verbes accompagn´e des formules d´efinitoires de chaque table (voir l’annexe F) et l’arbre de classement (voir l’annexeG).

Les entr´ees verbales ont subit un grand nombre de modifications, notamment lors de la mise en correspondance des tables et de l’index ´el´ectronique, tout en tenant compte des fiches cartonn´ees (cf. 5.5.2), puis de la conversion au format Lefff qui a permis la d´etection d’erreurs (cf. 8.1.4). Nous avons effectu´e une comparaison entre les entr´ees verbales de la premi`ere version de septembre 2008 (provenant de l’ensemble des tables, contrairement `a ce qui a ´et´e diffus´e) et celles de la version 3.3 de mars 2011. En 2008, nous avions 13 327 entr´ees verbales pour 5 714 verbes distincts (dans 59 tables3), ce qui totalise 540 nouvelles entr´ees verbales, dont 24 verbes distincts par rapport `a la version 3.3. Parmi ces verbes distincts, pr´esent´es `a la Tab. 9.3, on distingue 9 verbes supprim´es (ayant ´et´e corrig´es et correspondant pour la plupart `a un verbe d´ej`a existant), 8 verbes corrig´es et 33 verbes ajout´es.

1. Signalons que le site http://www-igm.univ-mlv.fr/~tolone/recherche.php contient

´

egalement la derni`ere version diffus´ee, ainsi que l’ensemble des versions pr´ec´edentes de la version 3 pr´esent´ees `a la Tab.9.2.

2. Le format CSV (voir http://fr.wikipedia.org/wiki/Comma-separated_values) permet de repr´esenter les tables ind´ependamment du logiciel utilis´e (Microsoft Excel, OpenOffice.org Calc, Li-breOffice Calc, Gnumeric, etc.). Le logiciel doit cependant g´erer l’Unicode, sinon des caract`eres in-corrects peuvent apparaˆıtre. L’avantage est que c’est un format texte, il est donc facile de comparer diff´erentes versions, ce qui n’est pas possible avec le format Excel.

3. Rappelons que les nouvelles tables sont : 2T, provenant de la division de la table 2 ; 32D, cr´ee parall`element `a la table 32A ; 35LD, 35LS et 35LR, provenant de la division de la table 35L ; 38LHD, 38LHS et 38LHR, provenant de la division de la table 38LH.

Versions Tables LGLex LGLex-Lefff

3.3 Format CSV : Format texte/XML Format intensionnel/

(31-03-2011) avec README (FR/EN) : extensionnel

avec README (FR/EN) :

verbes (100%) verbes(100%) verbes (100%)

noms pr´edicatifs(100%) noms pr´edicatifs(100%) noms pr´edicatifs(100%)

expressions fig´ees(100%) expressions fig´ees(100%)

adverbes(100%) adverbes(100%)

4 tables des classes

OutilLGExtract OutilLGLex2ilex Ajouts verbes : Entr´ees suppl. :

ajout de propri´et´es verbes(100%)

doc. propri´et´es expressions fig´ees(100%)

formules d´efinitoires adj. pr´edicatifs(100%)

arbre classement Ajouts adverbes :

propri´et´es paraphrases

3.2 Format Excel : Format texte/XML Format intensionnel/

(30-06-2010) avec README (FR/EN) : extensionnel

avec README (FR/EN) :

verbes (60%) verbes(60%) verbes (60%)

noms pr´edicatifs(60%) noms pr´edicatifs(60%) noms pr´edicatifs(60%)

expressions fig´ees(60%) expressions fig´ees(60%)

adverbes(100%) adverbes(100%)

Ajouts : Entr´ees suppl. : Ajouts verbes :

changements d’intitul´es verbes(60%) macros@SujNhum, Ajouts verbes : expressions fig´ees(80%) @Obj`aN-hum, etc.

ajout d’entr´ees adj. pr´edicatifs(100%) = syntagme nominal

codage de pr´epositions humain et/ou non humain

3.1 Format Excel : Format texte/XML Format intensionnel :

(27-11-2009) avec README (FR/EN) :

verbes (60%) verbes(60%) verbes(60%)

noms pr´edicatifs(60%) noms pr´edicatifs(60%)

3.0 / Format texte/XML : /

(18-12-2008) verbes(60%)

noms pr´edicatifs(60%)

3.alpha / Format XML : /

(08-09-2008) verbes(60%)

noms pr´edicatifs(60%)

Table 9.2: ´Evolution de la version 3

9.2 ´Evolution de la version 3

Verbes supprim´es Verbes corrig´es Verbes ajout´es

bailler balloterballotter affrioler

cafeter fossoyeurfossoyer aponter

charge godeliserodeliser approximer

´

enupler lib´ellerlibeller attitrer

fiche pied££au-cuterpied-au-cuter av´erer fouire sous-payersous-tendre barbifier qoranniser th´eatrˆaliserth´atraliser bicher rencontre vert££de-griservert-de-griser coraniser

sous-employer courser

cuveler egotter esaccoupler droper

´ebaubir enchrister gasconner infibuler ins´ecuriser institutionnaliser iodler

molarder narrer n-upler raper raplatir rassurer reconstruire renauder rossignoler rouscailler skier ventriloquer zieuter

Table 9.3: Comparaison entre les verbes distincts de la premi`ere version de 2008 avec ceux de la version 3.3

9.3 Extraits de la table 31R dans tous les formats

Documents relatifs