9.6 Discussion
9.6.2 Travaux apparent´ es
Nous comparons maintenant notre approche aux propositions ant´erieures d’utilisation de la
r´e´ecriture dans des syst`emes de TAL, `a l’interface entre syntaxe et s´emantique. Nous commentons
ici quelques propositions qui semblent les plus proches de nos travaux.
9.6. Discussion 171
– Crouch et King [CK06] calculent des structures s´emantiques `a partir de f-structures LFG
`
a l’aide d’un calcul de r´e´ecriture de termes, dont les r`egles sont strictement ordonn´ees. Le
calcul employ´e ne permet pas de g´erer les ambigu¨ıt´es de port´ee de quantificateurs.
– Spreyer et Frank [SF05] utilisent le mˆeme calcul de r´e´ecriture de termes que Crouch et
King pour produire des structures mrs`a partir du corpus annot´e en d´ependancesTIGER
Dependency Bank pour l’allemand.
– Bedaride et Gardent [Bed10] proposent un syst`eme de r´e´ecriture de graphes appliqu´e selon
une strat´egie d’ordre total sur les r`egles de r´e´ecriture. Cet ordre total est construit de fa¸con
`
a appliquer les r`egles de motif plus sp´ecifique avant les r`egles de motif plus g´en´eral. Ainsi,
la r`egle du passif long (avec agent) doit ˆetre appliqu´ee avant la r`egle du passif court (sans
agent). L’utilisation conjointe des motifs n´egatifs et des modules nous permet d’´eviter une
telle rigidit´e. De plus, le syst`eme de Bedaride et Gardent est confluent et ne produit donc
qu’une seule structure s´emantique par phrase.
– Chaumartin et Kahane [CK10] proposent d’apprendre automatiquement, `a partir d’exemples,
des r`egles d’interface syntaxe - s´emantique qui mettent en correspondance un fragment
d’arbre de d´ependance et un fragment de graphe s´emantique de la TST. Cette approche
est plus automatis´ee que la nˆotre et l’int´egration de ressources, notamment de lexiques et
d’analyseurs, est plus ais´ee. Cette proposition diff`ere de la nˆotre par le mod`ele de r´e´ecriture
de graphes utilis´e et par les structures s´emantiques produites (graphes s´emantiques de la
TST d’un cˆot´e, structuresdmrsde l’autre).
Conclusion
Dans ce chapitre, nous avons d´efini un calcul de r´e´ecriture de graphes modulaire `a base de
commandes et nous avons propos´e un programme de r´e´ecriture qui produit des structures s´
e-mantiques sous-sp´ecifi´ees au formatdmrs`a partir d’arbres de d´ependance syntaxique de surface
enrichis de relations grammaticales. Nos exp´erimentations sur les phrases du guide d’annotation
duftb sont concluantes et montrent en tout cas la viabilit´e de notre approche.
La vocation principale de ce programme de r´e´ecriture de graphes ´etait cependant d’illustrer
la flexibilit´e de notre calcul. Ce calcul peut ˆetre utilis´e pour d’autres formats d’entr´ee et de
sortie que ceux que nous avons utilis´es ; il est d’ailleurs adapt´e `a la conversion entre diff´erents
formats. L’approche modulaire facilite le d´eveloppement et la maintenance de grands ensembles
de r`egles. Il est par exemple facile d’´etendre un programme par l’ajout de nouveaux modules ou
par le raffinement de modules d´ej`a pr´esents, pour obtenir une analyse s´emantique plus pr´ecise.
Nous exploitons cette flexibilit´e au prochain chapitre. Nous proposons en effet un programme
de r´e´ecriture qui peut ˆetre appliqu´e avant le programme pr´esent´e dans ce chapitre. Ce programe
permet d’enrichir automatiquement des arbres de d´ependance syntaxique de surface au format
ftb avec les relations grammaticales d´efinies dans notre format ´etendu. La composition des
deux programmes de r´e´ecriture permet de produire une structure dmrs `a partir d’un arbre de
Chapitre 10
Enrichissement de structures de
d´ependance syntaxique de surface
Dans le chapitre pr´ec´edent, nous avons pr´esent´e un calcul de r´e´ecriture de graphes et nous
avons montr´e comment calculer, au moyen de ce calcul, une repr´esentation s´emantique d’une
phrase au formatdmrs`a partir d’une structure de d´ependance syntaxique de surface au format
ftb enrichie de relations grammaticales. Nous poursuivons cette ligne de recherche dans ce
chapitre en proposant une m´ethode qui ajoute aux structures de d´ependance syntaxique de
surface du ftb les relations grammaticales n´ecessaires et nous appliquons cette m´ethode au
French Treebank. Ces r`egles, en combinaison avec celles du chapitre 9, permettent d’obtenir
automatiquement une structure s´emantique dmrs `a partir d’une structure de d´ependance de
surface annot´ee selon le sch´ema duftb.
Les relations grammaticales que nous ajoutons permettent de repr´esenter les ant´ec´edents
d’anaphores syntaxiquement d´etermin´es et les arguments profonds syntaxiquement d´etermin´es
des verbes `a l’infinitif, des participes et des adjectifs. Dans la section 10.1, nous revenons sur
cette extension du sch´ema d’annotation `a l’aide d’un exemple. Dans la section10.2, nous donnons
l’intuition de l’interd´ependance de ces relations grammaticales, encore une fois sur un exemple.
Nous d´ecrivons ensuite, dans la section 10.3, le programme de r´e´ecriture de graphes que nous
utilisons pour produire, `a partir d’une structure de d´ependance dans le sch´ema d’annotation du
ftb, une structure dans le sch´ema ´etendu. Ce programme de r´e´ecriture de graphes est constitu´e
d’un ensemble de r`egles grammaticales et lexicales. Les r`egles lexicales utilisent une information
de contrˆole extraite du lexique des verbes fran¸caisDicovalence. Les diff´erents modules sont pr´
e-sent´es en section10.4. Dans la section 10.5, nous validons exp´erimentalement notre programme
de r´e´ecriture en l’appliquant auftbannot´e en d´ependances syntaxiques de surface. Enfin, dans
la section10.6, nous discutons des limites et perspectives de ce programme de r´e´ecriture.
10.1 Position du probl`eme
Les analyseurs syntaxiques profonds sont capables de fournir deux types de relations qui ne
font pas partie du sch´ema d’annotation en d´ependances de surface duftbmais qui sont utiles au
calcul de la s´emantique, profonde ou superficielle [CFL
+02,CHS02,RCS09,BFOZ11]. Le premier
type de relations concerne les ant´ec´edents d’anaphores syntaxiquement d´etermin´es : pronoms
relatifs, pronoms personnels r´efl´echis et pronoms personnels r´ep´etitions de sujets. Le deuxi`eme
type de relations porte sur les arguments profonds des adjectifs et des verbes `a l’infinitif, au
participe pass´e ou au participe pr´esent, lorsque ces arguments se trouvent dans la phrase et
qu’ils sont d´etermin´es par la syntaxe.
L’exemple donn´e figure 10.1 contient de telles relations manquantes. La phrase est annot´ee
par, en noir, les d´ependances syntaxiques du guide d’annotation en d´ependances de surface du
ftb[CCDG09,CCF11]
20et, en vert, les relations `a ajouter.
l' élève que Jean dit qu' on a présenté comme difficile à gérer
DET SUJ OBJ AUX_TPS ATO OBJ A-OBJ OBJ
SUJ MOD_REL OBJ OBJ ANT_REL SUJP OBJP
Figure 10.1 – Exemple d’enrichissement des d´ependances de surface
Dans le document
Étiquetage grammatical symbolique et interface syntaxe-sémantique des formalismes grammaticaux lexicalisés polarisés
(Page 185-189)