• Aucun résultat trouvé

9.6 Discussion

9.6.2 Travaux apparent´ es

Nous comparons maintenant notre approche aux propositions ant´erieures d’utilisation de la

r´e´ecriture dans des syst`emes de TAL, `a l’interface entre syntaxe et s´emantique. Nous commentons

ici quelques propositions qui semblent les plus proches de nos travaux.

9.6. Discussion 171

– Crouch et King [CK06] calculent des structures s´emantiques `a partir de f-structures LFG

`

a l’aide d’un calcul de r´e´ecriture de termes, dont les r`egles sont strictement ordonn´ees. Le

calcul employ´e ne permet pas de g´erer les ambigu¨ıt´es de port´ee de quantificateurs.

– Spreyer et Frank [SF05] utilisent le mˆeme calcul de r´e´ecriture de termes que Crouch et

King pour produire des structures mrs`a partir du corpus annot´e en d´ependancesTIGER

Dependency Bank pour l’allemand.

– Bedaride et Gardent [Bed10] proposent un syst`eme de r´e´ecriture de graphes appliqu´e selon

une strat´egie d’ordre total sur les r`egles de r´e´ecriture. Cet ordre total est construit de fa¸con

`

a appliquer les r`egles de motif plus sp´ecifique avant les r`egles de motif plus g´en´eral. Ainsi,

la r`egle du passif long (avec agent) doit ˆetre appliqu´ee avant la r`egle du passif court (sans

agent). L’utilisation conjointe des motifs n´egatifs et des modules nous permet d’´eviter une

telle rigidit´e. De plus, le syst`eme de Bedaride et Gardent est confluent et ne produit donc

qu’une seule structure s´emantique par phrase.

– Chaumartin et Kahane [CK10] proposent d’apprendre automatiquement, `a partir d’exemples,

des r`egles d’interface syntaxe - s´emantique qui mettent en correspondance un fragment

d’arbre de d´ependance et un fragment de graphe s´emantique de la TST. Cette approche

est plus automatis´ee que la nˆotre et l’int´egration de ressources, notamment de lexiques et

d’analyseurs, est plus ais´ee. Cette proposition diff`ere de la nˆotre par le mod`ele de r´e´ecriture

de graphes utilis´e et par les structures s´emantiques produites (graphes s´emantiques de la

TST d’un cˆot´e, structuresdmrsde l’autre).

Conclusion

Dans ce chapitre, nous avons d´efini un calcul de r´e´ecriture de graphes modulaire `a base de

commandes et nous avons propos´e un programme de r´e´ecriture qui produit des structures s´

e-mantiques sous-sp´ecifi´ees au formatdmrs`a partir d’arbres de d´ependance syntaxique de surface

enrichis de relations grammaticales. Nos exp´erimentations sur les phrases du guide d’annotation

duftb sont concluantes et montrent en tout cas la viabilit´e de notre approche.

La vocation principale de ce programme de r´e´ecriture de graphes ´etait cependant d’illustrer

la flexibilit´e de notre calcul. Ce calcul peut ˆetre utilis´e pour d’autres formats d’entr´ee et de

sortie que ceux que nous avons utilis´es ; il est d’ailleurs adapt´e `a la conversion entre diff´erents

formats. L’approche modulaire facilite le d´eveloppement et la maintenance de grands ensembles

de r`egles. Il est par exemple facile d’´etendre un programme par l’ajout de nouveaux modules ou

par le raffinement de modules d´ej`a pr´esents, pour obtenir une analyse s´emantique plus pr´ecise.

Nous exploitons cette flexibilit´e au prochain chapitre. Nous proposons en effet un programme

de r´e´ecriture qui peut ˆetre appliqu´e avant le programme pr´esent´e dans ce chapitre. Ce programe

permet d’enrichir automatiquement des arbres de d´ependance syntaxique de surface au format

ftb avec les relations grammaticales d´efinies dans notre format ´etendu. La composition des

deux programmes de r´e´ecriture permet de produire une structure dmrs `a partir d’un arbre de

Chapitre 10

Enrichissement de structures de

d´ependance syntaxique de surface

Dans le chapitre pr´ec´edent, nous avons pr´esent´e un calcul de r´e´ecriture de graphes et nous

avons montr´e comment calculer, au moyen de ce calcul, une repr´esentation s´emantique d’une

phrase au formatdmrs`a partir d’une structure de d´ependance syntaxique de surface au format

ftb enrichie de relations grammaticales. Nous poursuivons cette ligne de recherche dans ce

chapitre en proposant une m´ethode qui ajoute aux structures de d´ependance syntaxique de

surface du ftb les relations grammaticales n´ecessaires et nous appliquons cette m´ethode au

French Treebank. Ces r`egles, en combinaison avec celles du chapitre 9, permettent d’obtenir

automatiquement une structure s´emantique dmrs `a partir d’une structure de d´ependance de

surface annot´ee selon le sch´ema duftb.

Les relations grammaticales que nous ajoutons permettent de repr´esenter les ant´ec´edents

d’anaphores syntaxiquement d´etermin´es et les arguments profonds syntaxiquement d´etermin´es

des verbes `a l’infinitif, des participes et des adjectifs. Dans la section 10.1, nous revenons sur

cette extension du sch´ema d’annotation `a l’aide d’un exemple. Dans la section10.2, nous donnons

l’intuition de l’interd´ependance de ces relations grammaticales, encore une fois sur un exemple.

Nous d´ecrivons ensuite, dans la section 10.3, le programme de r´e´ecriture de graphes que nous

utilisons pour produire, `a partir d’une structure de d´ependance dans le sch´ema d’annotation du

ftb, une structure dans le sch´ema ´etendu. Ce programme de r´e´ecriture de graphes est constitu´e

d’un ensemble de r`egles grammaticales et lexicales. Les r`egles lexicales utilisent une information

de contrˆole extraite du lexique des verbes fran¸caisDicovalence. Les diff´erents modules sont pr´

e-sent´es en section10.4. Dans la section 10.5, nous validons exp´erimentalement notre programme

de r´e´ecriture en l’appliquant auftbannot´e en d´ependances syntaxiques de surface. Enfin, dans

la section10.6, nous discutons des limites et perspectives de ce programme de r´e´ecriture.

10.1 Position du probl`eme

Les analyseurs syntaxiques profonds sont capables de fournir deux types de relations qui ne

font pas partie du sch´ema d’annotation en d´ependances de surface duftbmais qui sont utiles au

calcul de la s´emantique, profonde ou superficielle [CFL

+

02,CHS02,RCS09,BFOZ11]. Le premier

type de relations concerne les ant´ec´edents d’anaphores syntaxiquement d´etermin´es : pronoms

relatifs, pronoms personnels r´efl´echis et pronoms personnels r´ep´etitions de sujets. Le deuxi`eme

type de relations porte sur les arguments profonds des adjectifs et des verbes `a l’infinitif, au

participe pass´e ou au participe pr´esent, lorsque ces arguments se trouvent dans la phrase et

qu’ils sont d´etermin´es par la syntaxe.

L’exemple donn´e figure 10.1 contient de telles relations manquantes. La phrase est annot´ee

par, en noir, les d´ependances syntaxiques du guide d’annotation en d´ependances de surface du

ftb[CCDG09,CCF11]

20

et, en vert, les relations `a ajouter.

l' élève que Jean dit qu' on a présenté comme difficile à gérer

DET SUJ OBJ AUX_TPS ATO OBJ A-OBJ OBJ

SUJ MOD_REL OBJ OBJ ANT_REL SUJP OBJP

Figure 10.1 – Exemple d’enrichissement des d´ependances de surface