HAL Id: inria-00186754
https://hal.inria.fr/inria-00186754
Submitted on 12 Nov 2007
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Formalisation de la dynamique du langage à travers les grammaires d’interaction
Mathieu Morey
To cite this version:
Mathieu Morey. Formalisation de la dynamique du langage à travers les grammaires d’interaction.
2007. �inria-00186754�
D´epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine´ UFR STMIA
Formalisation de la dynamique du langage ` a travers les grammaires
d’interaction
M´ EMOIRE
pr´esent´e et soutenu publiquement le 25 juin 2007 dans le cadre du
Master Informatique de l’Universit´ e Henri Poincar´ e – Nancy 1
(sp´ecialit´e Traitement Automatique des Langues) par
Mathieu Morey
Composition du jury
Examinateurs : Dominique M´ery Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 No¨elle Carbonell Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Didier Galmiche Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Claude Godart Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Guy Perrier Professeur `a l’Universit´e Nancy 2
Encadrant : Guy Perrier Professeur `a l’Universit´e Nancy 2
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503
Les grammairesd'interation sont unformalisme permettant defaire del'analyse syntaxique et sé-
mantiquedelalangue naturelle.Lesobjetssyntaxiquesdebase sontdesdesriptionsd'arbrespolarisées
quispéientpartiellementdesarbressyntaxiques.
DynamiSyntax estunformalisme d'analysesémantique,danslequellasyntaxeontraintlaroissane
d'unestruturesémantique.Lesobjetssémantiquessontdesdesriptionsd'arbresavedesressouresqui
spéientpartiellementdesarbressémantiques.
Alorsquelesgrammairesd'interationn'ontpasenorededimensionsémantiquexée,DynamiSyntax
soured'uneformulationproéduraledondiileàmanipuler.Nousproposonsdonunepremièreten-
tativedeformulationdélarativepourDynami Syntaxengrammairesd'interation.
Cettetentativemetenlumière plusieurstypesdediérenesentreles deuxformalismes, dontertaines
semblentsurmontables. Nousonluons surlessolutionspossiblesetles perspetivesouvertesparette
étude.
Mots-lés:grammairesd'interation,DynamiSyntax, desriptionsd'arbres,analysesémantique
Remeriements
Jetiensàremerier:
GuyPerrier pour sadisponibilité, sonéoute, sarigueursientique et lalibertéqu'ilm'a laissée
dansetravaildereherhe
BrunoGuillaume,JosephLeRouxetYannikParmentierpourleursréponsestoujoursjudiieuses,
àlafoissurleslogiielsqu'ilsdéveloppent(LeoparetXMG) etsurmonsujetd'étude
RuthKempsonetClaireBeyssade,quiontréponduàmesnombreusessolliitationsetyontfourni
desréponsesaussiomplètesquepossible
l'ensembledesmembresduprojetCalligramme,quim'aaueillietformeunenvironnementsien-
tiqueethumaindegrandequalité
Introdution 1
1 Les grammairesd'interation 3
1.1 Grammairesd'interationetanalysesyntaxique . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Analyseenonstituants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Analyseengrammairesatégorielles . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Analyseengrammairesd'interation . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Desriptionsd'arbrespolariséeset reherhedemodèles . . . . . . . . . . . . . . . . . . . 5
1.2.1 Desriptionsd'arbres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Polarités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.3 Reherhedemodèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Fontionnementonret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 XMG,leompilateurdemétagrammaires . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2 Leopar,l'analyseursyntaxiqueéletrostatique . . . . . . . . . . . . . . . . . . . . . 8
2 DynamiSyntax 10 2.1 Intuitiongénéraleetmotivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Prinipesetdéroulementd'uneanalyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1 Pointdedépartet prinipesgénéraux . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2 Déroulementd'uneanalysesimple:Mariedort.. . . . . . . . . . . . . . . . . . 13
2.2.3 Complémentspourtraiterdesphénomènesplusomplexes. . . . . . . . . . . . . . 16
2.3 Outilsformels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.1 Lalogiqued'arbresnis(LOFT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.2 L'epsilon-alul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 DynamiSyntax à la modedes grammairesd'interation 20 3.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 D'uneformulationproéduraleàuneformulationdélarative . . . . . . . . . . . . . . . . 21
3.2.1 Intuitionet premièreapprohe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.2 Exemple:analysedeMariedort . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2.3 Leproblèmederedondane,sessolutionsetleursonséquenes . . . . . . . . . . . 26
3.3 Fatorisationdulexiqueparéritured'uneméta-grammaire . . . . . . . . . . . . . . . . . 28
3.4 Limites del'expérimentationonrètedeetteapprohe . . . . . . . . . . . . . . . . . . . 28
3.4.1 Problèmesd'implantation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4.2 Couverturedelagrammaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4 EntreDynami Syntax etgrammairesd'interation :marges de progrès, divergenes
forteset questionsen suspens 30
4.1 Desriptionsd'arbres:LOFTversusIG . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2 LinéaritédeDynamiSyntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Leszonesd'ombredeDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Conlusion 33
A Arbres intermédiaires de l'analyse de Marie dort 34
Bibliographie 36
Le but ultime du Traitement Automatique des Langues(i-aprèsTAL) est de donner àlamahine
laapaitéde langage,qui est desavoirassoier àune forme(un énonéoral ouérit) unsensouplus
exatementune représentationdusens.Cetteapaitéest traditionnellementséparéeendeux proessus
inverses: l'analyseet lagénération.L'analyseorrespondàl'appliationdetraitementsàunénonéen
languenaturellepourobtenirune représentationdesonsensmanipulableparlamahine,donformelle
etsipossiblenon-ambiguë.Lagénérationorrespondàlatransformationd'informations formellesenun
énonéenlanguenaturelle quivéhiuleesinformations.Lepassagedel'énoné àlareprésentationfor-
melleetréiproquementsefaitparunesuitedetraitementsquionernentdiérentsniveaux:phonétique
(pour simplier,les sons),morphologie (les mots),syntaxe(les groupesde mots),sémantique(lesens)
et pragmatique(l'universréel) 1
.Plus partiulièrement, lestrois derniersniveaux apparaissenttrès liés
entreeux,danslesensoù,premièrement,àlasuitedeMontaguedenombreusesthéoriesonsidèrentque
lasémantiquepeutêtredéduitepassivementdelasyntaxe,deuxièmement,denombreuxphénomènes
sontonsidérésommesesituantàl'interfaeentresyntaxeetsémantique,troisièmement,lasémantique
requiertfréquemmentdesinformationsdelapragmatique.
Atuellement, de nombreux formalismes grammatiaux portent sur la syntaxe, 'est-à-dire sur les
relationsgrammatiales existant entre des motsou groupesde mots. Le prinipe de ompositionnalité
établitquelesensd'ungroupedemotsestfontiondusensdehaundesmots.Ceprinipeestunpostulat
ommun à tous les formalismes, mais il peut être réalisé de diérentes façons plus ou moins rigides.
En onséquene l'analyse syntaxique, terminée ou en ours, guide plus ou moins fortement l'analyse
sémantiquedanslaplupartdesextensionssémantiquesproposéespourlesformalismesexistants.
Parmi es formalismes, les grammaires d'interation [Per03℄ (i-après IG pour Interation Grammars)
sontsurtoutonçues,développéeset expérimentéesenanalysesyntaxique,etleurdimensionsémantique
n'estpasenorelairementxée[Per05℄.Lesgrammairesd'interationsontfondéessurdeuxidéesfores:
unegrammaireestunsystèmedeontraintes,etlaompositionsyntaxiqueestontrléeparunsystème
depolarités.
Cesdeuxnotionssontauoeurd'unautreformalismegrammatialappeléDynamiSyntax[KMVG01℄
(i-aprèsDS),qui permet de fairedel'analyse sémantiqueet de lagénération.Ce formalisme est fondé
psyholinguistiquementet viseàêtre leplusdèlepossibleàl'essene mêmede laapaitéde langage,
dontunedesaratéristiquesestlalinéarité.Lapenséen'estpaslinéaire:lesoneptssontorganiséset
reliéslesunsauxautres,equel'onmodélisesousformedegraphe.Maislelangage,lui,estlinéaire:un
énoné,qu'il soit oralou érit, est unesuession de mots(oud'unités de sens).À l'oral,les sonssont
produitsetentenduslesunsaprèslesautres;àl'érit lesmotssonttraéset luslesunsaprèslesautres
(degauheàdroite,dedroiteàgauhe,dehautenbasvoiredebasenhautselonlesultures).Dynami
Syntaxreprendetteidéedelinéaritéenfaisantémergerprogressivement,aufuretàmesuredelaleture
d'un énoné, une struture sémantique. En fait, 'est l'appliationsuessive de règlesnon lexialisées
etd'ationslexialesquifaitroîtreetenrihitlastruturesémantiqueorrespondantàl'énonélu.Ces
règles et es ations lexiales enrihissent la struture émergente ave deux types d'information : des
ontraintessursaformenaleetdesrequêtesouapportsd'informations,avepourimpératifqu'auune
requêted'informationneresteinsatisfaite danslastruturenale.
1
Pour unpanoramalair et plusomplet,voirl'introdution au TAL deJean Véronis,disponibleà http://www.up.
univ-mrs.fr/~veronis/our s/I NFZ1 8/ve ron is-INFZ 18.p df.
On retrouve bien ii les deux idées fores des IG, et 'est justement ette proximité qui motive le
présenttravail.
Après avoirprésenté les IG dans le hapitre 1 et DS dans le hapitre 2, nous tentons dans le
hapitre 3delesfaireonverger(surlabase deleurssimilarités)an demieux formaliserDSennous
appuyantsurleadrefourniparlesIG.Assez vite,nousonstatonsqu'unepremièreapprohenaïve
nesut paset nousenexpliquonslesraisonsdanslehapitre 4.
Les grammaires d'interation
1.1 Grammaires d'interation et analyse syntaxique
Lesgrammairesd'interation(IG)sontunformalismegrammatialinitialementonçupourmodéliser
lasyntaxedeslangues[Per02℄.Pluspréisément,lesIGsontunranementdesgrammairesatégorielles
(i-aprèsCG pour CategorialGrammars), ranement doublé d'un hangement depointde vue. Alors
quelesCGappartiennentàequePullumet SholzappellentlaGenerative-EnumerativeSyntax [PS01℄
(unénonéestorretsiunesuitededérivationsàpartird'axiomespermet delegénérer),lesIGappar-
tiennentàlaModel-Theoreti Syntax (unénonéest orrets'il enexisteunmodèlequi satisfaittoutes
lesontraintesdelagrammaire).PourelalesIGutilisentlanotiondedesription d'arbre suivantainsi
l'idée développée par Vijay-Shanker[VS92℄ pourles grammaires d'arbres adjoints(i-après TAG pour
TreeAdjoiningGrammars).
L'analysesyntaxique est l'étude desrelations grammatiales existantentre des motsou groupesde
mots.Ilexistedenombreuxformalismesd'analysesyntaxiqueplusoumoinsomplexesetplusoumoins
étroitementliésàdiérentesthéorieslinguistiques,aussinousontenterons-nousd'illustrernotrepropos
dansettesetionparunexemplesimple:JeanaimeMarie.
1.1.1 Analyse en onstituants
Lafaçonla plussimplede traiteret exempleest d'eetuerune (traditionnelle) analyseen onsti-
tuants.
Soit la grammaire hors-ontexte dénie par les règles de la gure1.1, où NP signie Noun Phrase
(groupe nominal), VP Verb Phrase (groupe verbal), tV transitive Verb (verbe transitif), S sentene
(phrase).Cettegrammairefaitpartiedesgrammairesditesde onstituants,danslesquelles desrèglesde
S → NPVP
VP → tVNP
NP → Jean
tV → aime
NP → Marie
Fig.1.1Règlesdegrammairehors-ontextepourJeanaimeMarie
grammaire(souventnombreuses)indiquentquelleatégoriepeutseombineravequelleautreatégorie
pourformerunetroisièmeatégorie.
PourlaphraseexempleJeanaimeMarie,onadonl'arbred'analysesyntaxiquehors-ontextede
lagure1.2.
CetteanalysearboresentemetenévidenequeJeanestenpositiondesujetetMaried'objet
duverbetransitifaime.
S
NP VP
Jean tV NP
aime Marie
Fig.1.2Arbred'analyse syntaxiquehors-ontextepourJeanaimeMarie
1.1.2 Analyse en grammaires atégorielles
Leproblème majeurdesgrammaires hors-ontexteest laprésenede règlesnonlexialisées,'est-à-
direde règles qui ne ontiennent que desnon-terminaux. Si la grammaire est omplètementlexialisée
(unmotpouvantlexialiserplusieursrègles),pourunénonédonnéonpeutalulerlenombremaximum
d'analysespossiblesenfaisantle produit dunombrederèglesassoiées àhaquemotparlenombrede
motsdel'énoné.Silagrammairen'estpaslexialisée(enfait,siellen'estpaslexialisable),onnepeut
plusêtreertaindunombred'analysespossibles,aronnepeutpassavoiravantl'analysedequellesrègles
delagrammaireonaurabesoinauoursdeelle-i.Lanon-lexialisationintroduit del'indéterminisme.
La solutionest don d'érire des grammaires lexialisées.Pour ela, Bar-Hillelet Adjukiewiz [Adj35℄
ontdéveloppélesgrammairesatégorielles,dontleprinipeestd'assoieràhaqueentréelexialeuneou
plusieursatégoriessyntaxiques.Uneatégorieestvueommeunefontionquis'appliqueàuneatégorie
pourenformerunetroisième. Toute l'informationsurlespossibilitésdeombinaisondehaquemotest
donontenueintégralementdanslaoulesatégoriesquiluisontaetées,entenantomptede l'ordre
desmotsdanslaphrase.
Corollairement, lesCGet 'est ette aratéristiquequi enguide leproessus de omposition
onsidèrentlessyntagmesommedesressouresonsommables,ertainesressouresétantattendues(on
modéliseelaparunepolariténégative)etd'autresdisponibles(polaritépositive).Dansetteperspetive,
unephraseestbienforméesitouteslesressouresattenduesparhaundessyntagmesquilaomposent
sont rendues disponibles par les autres syntagmes, et si toutes les ressoures oertes par haun des
syntagmessontonsomméesparlesautressyntagmes.Alors,labonneformationd'unephraseserésume
àlaneutralisationdespolaritésopposées.Intuitivement,unverbetransitif diretabesoin,pourformer
unephraseorrete,d'ungroupenominal(i-aprèsGN)àgauheetunàdroite.Don,siunephraseest
onstituéed'un verbe transitif diret et de deux GN (l'un àgauhe et l'autre à droite), les ressoures
fournies par es GN sont onsommées par le verbe transitif diret et les ressoures attendues par e
derniersontdisponibles:lespolaritéssontneutralisées.
EnCG,ondénitlaatégoriedehaquemotàpartirdesatégoriesdebasespoursentene(phrase),
nppournounphrase (groupenominal),ainsiquen pournoun(dontnousn'avonspasbesoinpournotre
exemple).Onadonpourlesmotsdenotreexemplelesatégories:
aime (np\ s)/ np
Jean np
Marie np
UnverbetransitifommeaimedoitseombineràsadroiteaveunGN(/ np),puisàsagauhe
aveunautreGN(np\),pourdonnerunephrase(s).
Jean aime Marie
np (np\ s)/ np np
np (np\ s)
s
Fig.1.3AnalyseatégorielledeJeanaimeMarie
1.1.3 Analyse en grammaires d'interation
Les IG reprennent ette idée de polarités en la desendant du niveau des syntagmes à elui des
traits grammatiaux utilisés pour dérire les syntagmes (les parties du disours, le genre, la fontion
syntaxique...).
Ainsidansl'exemplepréédent,haundesdeuxGNdemandeunefontionsyntaxique(f unct←?),etle
verbedemandedeuxGNet fournitàl'unlafontionsujet(f unct→subj)et àl'autre lafontionobjet
(f unct→obj).C'estequiest représentéparlesdesriptionsd'arbresrassembléesdanslagure1.4,le résultatdel'analyseétantl'arbreneutralisé1.5.Danslasetionquisuit,nousprésentonsunpeuplusen
détaillanotiondedesriptiond'arbreetlesystèmedepolarités.
1.2 Desriptions d'arbres polarisées et reherhe de modèles
1.2.1 Desriptions d'arbres
Une desription d'arbreest unensemble de noeuds et de relations de domination et de préédene
entreesnoeuds.Dansleasd'unarbresyntaxique,lesnoeudsreprésententdessyntagmesetlesrelations
desontraintesrelativesentre es syntagmes.Les propriétés morphosyntaxiques de es syntagmes sont
expriméespardesstruturesdetraitsattahéesauxnoeuds, ommenousl'avonsfaitdanslagure1.4.
Lesrelationsentrelesnoeudsd'unedesriptionpeuventêtredequatretypes,distinguésgraphiquement
parlestyledetraitslesreprésentant:
dominationimmédiate: A > B signiequelenoeudAestlepèredunoeudB,equiestreprésenté
paruntraitontinu.Syntaxiquement,elasigniequelesyntagmeB estunonstituantimmédiat
deA.Onpeutgerl'ensembledeslsd'unnoeudAàl'aidedelarelationA > A1, A2, . . . , Ap.Cette
relationsigniequelenoeudAaexatementpls, etdonsyntaxiquementqueAaexatementp
onstituantsimmédiats.
dominationsous-spéiée: A >∗B signieque lenoeud B est dansle sous-arbreissude A àune
profondeurindéterminée,equiestreprésentéparuntraitdisontinu.Àlalimite,Bpeuts'identier
àA.Syntaxiquement,elasigniequelesyntagmeB est inlus dansA àune profondeurindéter-
minée, e qui permet d'exprimer àlafois une dépendane syntaxique nonbornéeet lapossibilité
d'appliquerdesmodieursàunsyntagme.Deplusamplesdétailssontexposésdans[Per05℄.
préédene immédiate: A ≺ B signie que le noeud A préède immédiatement le noeud B dans
l'ordre linéaire des noeuds, e qui est représenté par une èhe ontinue. Syntaxiquement, ela
signiequelesyntagmeApréèdeimmédiatementlesyntagmeB dansl'ordrelinéairedesmotsde
laphrase.
préédene sous-spéiée: A≺∗B signiequelenoeud ApréèdelenoeudB dansl'ordrelinéaire
des noeuds, e qui est représenté par une èhe disontinue. Syntaxiquement, elasignie que le
syntagmeA préèdelesyntagmeB dansl'ordrelinéairedesmotsdelaphrase.