Comme nous l’avons mentionn´e en 5.2.4, les tables disponibles ainsi que les diff´erents lexiques auxquels elles ont ´et´e converties (LGLex etLGLex-Lefff) font partie de la ver-sion 3, qui a ´evolu´ee depuis septembre 2008. La version 3.3 est disponible depuis le 31 mars 2011 sur le site http://infolingu.univ-mlv.fr/ (Donn´ees Linguistiques >
Auteurs Nom des tables Format Table Lexique Lexique Excel des classes LGLex LGLex-Lefff (a) Verbes distributionnels (simples)
M. Gross 1 `a 18 OK OK OK OK
J.-P. Boons, A. Guillet, 32A ... 39 OK OK OK OK
C. Lecl`ere (BGL)
J.-P. Boons, A. Guillet, 31H ... 35R OK OK OK OK
C. Lecl`ere (BGL)
A. Guillet, 36DT ... 38LR OK OK OK OK
C. Lecl`ere (BGL)
C. Lecl`ere, A. Borillo (BGL) 36S OK OK OK OK
C. Lecl`ere (BGL) 35RR et 38RR OK OK OK OK
(b) Noms pr´edicatifs (simples et compos´es)
J. Giry-Schneider F1A `a F91 OK OK OK OK
J. Giry-Schneider FN `a FNPNN OK OK OK OK
A. Meunier AN01 ... ANSY OK OK OK OK
G. Gross AA ... IS2 OK OK OK OK
J. Giry-Schneider, AN07 `a AN10 OK OK OK OK
A. Balibar-Mrabti
J. Giry-Schneider ANDN et ANSN OK OK OK OK
D. de N´egroni-Peyre PSY et SYM OK OK OK OK
R. Viv`es APE1 `a APP3 OK OK OK OK
J. Labelle ANA ... ANSU OK OK OK OK
L. Pivaut FD1 `a FD4 En cours En cours En cours En cours
(c) Expressions fig´ees (principalement verbales et adjectivales)
J.-P. Boons, A. Guillet, 31I OK OK OK En cours
C. Lecl`ere (BGL)
M. Gross A1 ... YA OK OK OK En cours
M. Gross EAPC ... EPA OK OK OK En cours
M. Gross EPAC `a EPDETC OK OK OK En cours
M. Gross E1 ... EDN OK OK OK En cours
J. Giry-Schneider FC `a FCPNN OK OK OK En cours
L. Danlos Z `a ZS En cours En cours En cours En cours
(d) Adverbes (simples et (semi-)fig´es)
C. Molinier, F. Levrier ADVMF `a ADVPS OK OK OK /
M. Gross PAC `a PVCO OK OK OK /
(e) Adjectifs pr´edicatifs (simples)
L. Picabia ADJ1 `a ADJ13 / / / /
J. Giry-Schneider ADJ01 `a ADJSYM En cours / / /
(f) Adjectifs non pr´edicatifs (simples)
E. Laporte ADJLOCTABLE OK / / /
J. Giry-Schneider DEDJA et DADJI En cours / / /
Table 9.1: Inventaire des tables du Lexique-Grammaire et avancement des travaux de conversion vers des formats ´electroniques exploitables
9.2 ´Evolution de la version 3 Lexique-Grammaire > T´el´echargement), accompagn´ee des outils de conversion (LGEx-tract et LGLex2ilex). La Tab. 9.2 r´ecapitule l’´evolution de la version 31.
Les cat´egories couvertes par les tables, au format CSV2, et par le lexique LGLex, au format texte et XML, sont les verbes, les noms pr´edicatifs, les expressions fig´ees et les adverbes. Des entr´ees suppl´ementaires de verbes, expressions fig´ees et adjectifs pr´edicatifs ont ´et´e extraites de certaines tables (cf. section 6.6). De plus, les verbes et les noms pr´edicatifs sont au format LGLex-Lefff (intensionnel et extensionnel).
Parmi les informations s´emantiques cod´ees dans les tables, le format LGLex-Lefff garde celle qui est la plus compl`ete, `a savoir si un syntagme nominal peut ˆetre humain et/ou non humain (macros @SujNhum, @Obj`aN-hum, etc.).
De plus, un README est disponible pour chacun des deux formats de lexique en fran¸cais et en anglais (voir les annexes A et C), de mˆeme que pour chacun des deux outils de conversion (voir les annexes B et D), et enfin pour les tables afin de pr´esenter leur format, leur codage, ainsi que celui de la table des classes, et d’y inclure toutes les r´ef´erences compl`etes. On sp´ecifie ´egalement pour chacune des r´ef´erences, le nombre de tables concern´ees, ainsi que la liste compl`ete des tables (cf. la Tab. 5.1).
Enfin, en plus des tables, nous avons ´egalement une table des classes par cat´egorie, ainsi que pour les verbes, la documentation de toutes les propri´et´es syntaxico-s´emantiques en fran¸cais et en anglais (voir l’annexe E), l’ordre de priorit´e dans le classement des verbes accompagn´e des formules d´efinitoires de chaque table (voir l’annexe F) et l’arbre de classement (voir l’annexeG).
Les entr´ees verbales ont subit un grand nombre de modifications, notamment lors de la mise en correspondance des tables et de l’index ´el´ectronique, tout en tenant compte des fiches cartonn´ees (cf. 5.5.2), puis de la conversion au format Lefff qui a permis la d´etection d’erreurs (cf. 8.1.4). Nous avons effectu´e une comparaison entre les entr´ees verbales de la premi`ere version de septembre 2008 (provenant de l’ensemble des tables, contrairement `a ce qui a ´et´e diffus´e) et celles de la version 3.3 de mars 2011. En 2008, nous avions 13 327 entr´ees verbales pour 5 714 verbes distincts (dans 59 tables3), ce qui totalise 540 nouvelles entr´ees verbales, dont 24 verbes distincts par rapport `a la version 3.3. Parmi ces verbes distincts, pr´esent´es `a la Tab. 9.3, on distingue 9 verbes supprim´es (ayant ´et´e corrig´es et correspondant pour la plupart `a un verbe d´ej`a existant), 8 verbes corrig´es et 33 verbes ajout´es.
1. Signalons que le site http://www-igm.univ-mlv.fr/~tolone/recherche.php contient
´
egalement la derni`ere version diffus´ee, ainsi que l’ensemble des versions pr´ec´edentes de la version 3 pr´esent´ees `a la Tab.9.2.
2. Le format CSV (voir http://fr.wikipedia.org/wiki/Comma-separated_values) permet de repr´esenter les tables ind´ependamment du logiciel utilis´e (Microsoft Excel, OpenOffice.org Calc, Li-breOffice Calc, Gnumeric, etc.). Le logiciel doit cependant g´erer l’Unicode, sinon des caract`eres in-corrects peuvent apparaˆıtre. L’avantage est que c’est un format texte, il est donc facile de comparer diff´erentes versions, ce qui n’est pas possible avec le format Excel.
3. Rappelons que les nouvelles tables sont : 2T, provenant de la division de la table 2 ; 32D, cr´e´ee parall`element `a la table 32A ; 35LD, 35LS et 35LR, provenant de la division de la table 35L ; 38LHD, 38LHS et 38LHR, provenant de la division de la table 38LH.
Versions Tables LGLex LGLex-Lefff
3.3 Format CSV : Format texte/XML Format intensionnel/
(31-03-2011) avec README (FR/EN) : extensionnel
avec README (FR/EN) :
−verbes (100%) −verbes(100%) −verbes (100%)
−noms pr´edicatifs(100%) −noms pr´edicatifs(100%) −noms pr´edicatifs(100%)
−expressions fig´ees(100%) −expressions fig´ees(100%)
−adverbes(100%) −adverbes(100%)
−4 tables des classes
OutilLGExtract OutilLGLex2ilex Ajouts verbes : Entr´ees suppl. :
−ajout de propri´et´es −verbes(100%)
−doc. propri´et´es −expressions fig´ees(100%)
−formules d´efinitoires −adj. pr´edicatifs(100%)
−arbre classement Ajouts adverbes :
−propri´et´es paraphrases
3.2 Format Excel : Format texte/XML Format intensionnel/
(30-06-2010) avec README (FR/EN) : extensionnel
avec README (FR/EN) :
−verbes (60%) −verbes(60%) −verbes (60%)
−noms pr´edicatifs(60%) −noms pr´edicatifs(60%) −noms pr´edicatifs(60%)
−expressions fig´ees(60%) −expressions fig´ees(60%)
−adverbes(100%) −adverbes(100%)
Ajouts : Entr´ees suppl. : Ajouts verbes :
−changements d’intitul´es −verbes(60%) −macros@SujNhum, Ajouts verbes : −expressions fig´ees(80%) @Obj`aN-hum, etc.
−ajout d’entr´ees −adj. pr´edicatifs(100%) = syntagme nominal
−codage de pr´epositions humain et/ou non humain
3.1 Format Excel : Format texte/XML Format intensionnel :
(27-11-2009) avec README (FR/EN) :
−verbes (60%) −verbes(60%) −verbes(60%)
−noms pr´edicatifs(60%) −noms pr´edicatifs(60%)
3.0 / Format texte/XML : /
(18-12-2008) −verbes(60%)
−noms pr´edicatifs(60%)
3.alpha / Format XML : /
(08-09-2008) −verbes(60%)
−noms pr´edicatifs(60%)
Table 9.2: ´Evolution de la version 3
9.2 ´Evolution de la version 3
Verbes supprim´es Verbes corrig´es Verbes ajout´es
bailler balloter→ballotter affrioler
cafeter fossoyeur→fossoyer aponter
charge godeliser→g¨odeliser approximer
´
enupler lib´eller→libeller attitrer
fiche pied££au-cuter→pied-au-cuter av´erer fouire sous-payer→sous-tendre barbifier qoranniser th´eatrˆaliser→th´eˆatraliser bicher rencontre vert££de-griser→vert-de-griser coraniser
sous-employer courser
cuveler d´egotter d´esaccoupler droper
´ebaubir enchrister gasconner infibuler ins´ecuriser institutionnaliser iodler
molarder narrer n-upler raper raplatir rassurer reconstruire renauder rossignoler rouscailler skier ventriloquer zieuter
Table 9.3: Comparaison entre les verbes distincts de la premi`ere version de 2008 avec ceux de la version 3.3