• Aucun résultat trouvé

Formalisation de la dynamique du langage à travers les grammaires d'interaction

N/A
N/A
Protected

Academic year: 2021

Partager "Formalisation de la dynamique du langage à travers les grammaires d'interaction"

Copied!
42
0
0

Texte intégral

(1)

HAL Id: inria-00186754

https://hal.inria.fr/inria-00186754

Submitted on 12 Nov 2007

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Formalisation de la dynamique du langage à travers les grammaires d’interaction

Mathieu Morey

To cite this version:

Mathieu Morey. Formalisation de la dynamique du langage à travers les grammaires d’interaction.

2007. �inria-00186754�

(2)

epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine´ UFR STMIA

Formalisation de la dynamique du langage ` a travers les grammaires

d’interaction

M´ EMOIRE

pr´esent´e et soutenu publiquement le 25 juin 2007 dans le cadre du

Master Informatique de l’Universit´ e Henri Poincar´ e – Nancy 1

(sp´ecialit´e Traitement Automatique des Langues) par

Mathieu Morey

Composition du jury

Examinateurs : Dominique M´ery Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 No¨elle Carbonell Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Didier Galmiche Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Claude Godart Professeur `a l’Universit´e Henri Poincar´e - Nancy 1 Guy Perrier Professeur `a l’Universit´e Nancy 2

Encadrant : Guy Perrier Professeur `a l’Universit´e Nancy 2

Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503

(3)

Les grammairesd'interation sont unformalisme permettant defaire del'analyse syntaxique et sé-

mantiquedelalangue naturelle.Lesobjetssyntaxiquesdebase sontdesdesriptionsd'arbrespolarisées

quispéientpartiellementdesarbressyntaxiques.

DynamiSyntax estunformalisme d'analysesémantique,danslequellasyntaxeontraintlaroissane

d'unestruturesémantique.Lesobjetssémantiquessontdesdesriptionsd'arbresavedesressouresqui

spéientpartiellementdesarbressémantiques.

Alorsquelesgrammairesd'interationn'ontpasenorededimensionsémantiquexée,DynamiSyntax

soured'uneformulationproéduraledondiileàmanipuler.Nousproposonsdonunepremièreten-

tativedeformulationdélarativepourDynami Syntaxengrammairesd'interation.

Cettetentativemetenlumière plusieurstypesdediérenesentreles deuxformalismes, dontertaines

semblentsurmontables. Nousonluons surlessolutionspossiblesetles perspetivesouvertesparette

étude.

Mots-lés:grammairesd'interation,DynamiSyntax, desriptionsd'arbres,analysesémantique

(4)

Remeriements

Jetiensàremerier:

GuyPerrier pour sadisponibilité, sonéoute, sarigueursientique et lalibertéqu'ilm'a laissée

dansetravaildereherhe

BrunoGuillaume,JosephLeRouxetYannikParmentierpourleursréponsestoujoursjudiieuses,

àlafoissurleslogiielsqu'ilsdéveloppent(LeoparetXMG) etsurmonsujetd'étude

RuthKempsonetClaireBeyssade,quiontréponduàmesnombreusessolliitationsetyontfourni

desréponsesaussiomplètesquepossible

l'ensembledesmembresduprojetCalligramme,quim'aaueillietformeunenvironnementsien-

tiqueethumaindegrandequalité

(5)

Introdution 1

1 Les grammairesd'interation 3

1.1 Grammairesd'interationetanalysesyntaxique . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.1 Analyseenonstituants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.2 Analyseengrammairesatégorielles . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.3 Analyseengrammairesd'interation . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Desriptionsd'arbrespolariséeset reherhedemodèles . . . . . . . . . . . . . . . . . . . 5

1.2.1 Desriptionsd'arbres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2.2 Polarités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.3 Reherhedemodèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3 Fontionnementonret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3.1 XMG,leompilateurdemétagrammaires . . . . . . . . . . . . . . . . . . . . . . . 8

1.3.2 Leopar,l'analyseursyntaxiqueéletrostatique . . . . . . . . . . . . . . . . . . . . . 8

2 DynamiSyntax 10 2.1 Intuitiongénéraleetmotivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Prinipesetdéroulementd'uneanalyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2.1 Pointdedépartet prinipesgénéraux . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2.2 Déroulementd'uneanalysesimple:Mariedort.. . . . . . . . . . . . . . . . . . 13

2.2.3 Complémentspourtraiterdesphénomènesplusomplexes. . . . . . . . . . . . . . 16

2.3 Outilsformels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.1 Lalogiqued'arbresnis(LOFT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.2 L'epsilon-alul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 DynamiSyntax à la modedes grammairesd'interation 20 3.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.2 D'uneformulationproéduraleàuneformulationdélarative . . . . . . . . . . . . . . . . 21

3.2.1 Intuitionet premièreapprohe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.2.2 Exemple:analysedeMariedort . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2.3 Leproblèmederedondane,sessolutionsetleursonséquenes . . . . . . . . . . . 26

3.3 Fatorisationdulexiqueparéritured'uneméta-grammaire . . . . . . . . . . . . . . . . . 28

3.4 Limites del'expérimentationonrètedeetteapprohe . . . . . . . . . . . . . . . . . . . 28

(6)

3.4.1 Problèmesd'implantation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4.2 Couverturedelagrammaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 EntreDynami Syntax etgrammairesd'interation :marges de progrès, divergenes

forteset questionsen suspens 30

4.1 Desriptionsd'arbres:LOFTversusIG . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.2 LinéaritédeDynamiSyntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.3 Leszonesd'ombredeDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Conlusion 33

A Arbres intermédiaires de l'analyse de Marie dort 34

Bibliographie 36

(7)

Le but ultime du Traitement Automatique des Langues(i-aprèsTAL) est de donner àlamahine

laapaitéde langage,qui est desavoirassoier àune forme(un énonéoral ouérit) unsensouplus

exatementune représentationdusens.Cetteapaitéest traditionnellementséparéeendeux proessus

inverses: l'analyseet lagénération.L'analyseorrespondàl'appliationdetraitementsàunénonéen

languenaturellepourobtenirune représentationdesonsensmanipulableparlamahine,donformelle

etsipossiblenon-ambiguë.Lagénérationorrespondàlatransformationd'informations formellesenun

énonéenlanguenaturelle quivéhiuleesinformations.Lepassagedel'énoné àlareprésentationfor-

melleetréiproquementsefaitparunesuitedetraitementsquionernentdiérentsniveaux:phonétique

(pour simplier,les sons),morphologie (les mots),syntaxe(les groupesde mots),sémantique(lesens)

et pragmatique(l'universréel) 1

.Plus partiulièrement, lestrois derniersniveaux apparaissenttrès liés

entreeux,danslesensoù,premièrement,àlasuitedeMontaguedenombreusesthéoriesonsidèrentque

lasémantiquepeutêtredéduitepassivementdelasyntaxe,deuxièmement,denombreuxphénomènes

sontonsidérésommesesituantàl'interfaeentresyntaxeetsémantique,troisièmement,lasémantique

requiertfréquemmentdesinformationsdelapragmatique.

Atuellement, de nombreux formalismes grammatiaux portent sur la syntaxe, 'est-à-dire sur les

relationsgrammatiales existant entre des motsou groupesde mots. Le prinipe de ompositionnalité

établitquelesensd'ungroupedemotsestfontiondusensdehaundesmots.Ceprinipeestunpostulat

ommun à tous les formalismes, mais il peut être réalisé de diérentes façons plus ou moins rigides.

En onséquene l'analyse syntaxique, terminée ou en ours, guide plus ou moins fortement l'analyse

sémantiquedanslaplupartdesextensionssémantiquesproposéespourlesformalismesexistants.

Parmi es formalismes, les grammaires d'interation [Per03℄ (i-après IG pour Interation Grammars)

sontsurtoutonçues,développéeset expérimentéesenanalysesyntaxique,etleurdimensionsémantique

n'estpasenorelairementxée[Per05℄.Lesgrammairesd'interationsontfondéessurdeuxidéesfores:

unegrammaireestunsystèmedeontraintes,etlaompositionsyntaxiqueestontrléeparunsystème

depolarités.

Cesdeuxnotionssontauoeurd'unautreformalismegrammatialappeléDynamiSyntax[KMVG01℄

(i-aprèsDS),qui permet de fairedel'analyse sémantiqueet de lagénération.Ce formalisme est fondé

psyholinguistiquementet viseàêtre leplusdèlepossibleàl'essene mêmede laapaitéde langage,

dontunedesaratéristiquesestlalinéarité.Lapenséen'estpaslinéaire:lesoneptssontorganiséset

reliéslesunsauxautres,equel'onmodélisesousformedegraphe.Maislelangage,lui,estlinéaire:un

énoné,qu'il soit oralou érit, est unesuession de mots(oud'unités de sens).À l'oral,les sonssont

produitsetentenduslesunsaprèslesautres;àl'érit lesmotssonttraéset luslesunsaprèslesautres

(degauheàdroite,dedroiteàgauhe,dehautenbasvoiredebasenhautselonlesultures).Dynami

Syntaxreprendetteidéedelinéaritéenfaisantémergerprogressivement,aufuretàmesuredelaleture

d'un énoné, une struture sémantique. En fait, 'est l'appliationsuessive de règlesnon lexialisées

etd'ationslexialesquifaitroîtreetenrihitlastruturesémantiqueorrespondantàl'énonélu.Ces

règles et es ations lexiales enrihissent la struture émergente ave deux types d'information : des

ontraintessursaformenaleetdesrequêtesouapportsd'informations,avepourimpératifqu'auune

requêted'informationneresteinsatisfaite danslastruturenale.

1

Pour unpanoramalair et plusomplet,voirl'introdution au TAL deJean Véronis,disponibleà http://www.up.

univ-mrs.fr/~veronis/our s/I NFZ1 8/ve ron is-INFZ 18.p df.

(8)

On retrouve bien ii les deux idées fores des IG, et 'est justement ette proximité qui motive le

présenttravail.

Après avoirprésenté les IG dans le hapitre 1 et DS dans le hapitre 2, nous tentons dans le

hapitre 3delesfaireonverger(surlabase deleurssimilarités)an demieux formaliserDSennous

appuyantsurleadrefourniparlesIG.Assez vite,nousonstatonsqu'unepremièreapprohenaïve

nesut paset nousenexpliquonslesraisonsdanslehapitre 4.

(9)

Les grammaires d'interation

1.1 Grammaires d'interation et analyse syntaxique

Lesgrammairesd'interation(IG)sontunformalismegrammatialinitialementonçupourmodéliser

lasyntaxedeslangues[Per02℄.Pluspréisément,lesIGsontunranementdesgrammairesatégorielles

(i-aprèsCG pour CategorialGrammars), ranement doublé d'un hangement depointde vue. Alors

quelesCGappartiennentàequePullumet SholzappellentlaGenerative-EnumerativeSyntax [PS01℄

(unénonéestorretsiunesuitededérivationsàpartird'axiomespermet delegénérer),lesIGappar-

tiennentàlaModel-Theoreti Syntax (unénonéest orrets'il enexisteunmodèlequi satisfaittoutes

lesontraintesdelagrammaire).PourelalesIGutilisentlanotiondedesription d'arbre suivantainsi

l'idée développée par Vijay-Shanker[VS92℄ pourles grammaires d'arbres adjoints(i-après TAG pour

TreeAdjoiningGrammars).

L'analysesyntaxique est l'étude desrelations grammatiales existantentre des motsou groupesde

mots.Ilexistedenombreuxformalismesd'analysesyntaxiqueplusoumoinsomplexesetplusoumoins

étroitementliésàdiérentesthéorieslinguistiques,aussinousontenterons-nousd'illustrernotrepropos

dansettesetionparunexemplesimple:JeanaimeMarie.

1.1.1 Analyse en onstituants

Lafaçonla plussimplede traiteret exempleest d'eetuerune (traditionnelle) analyseen onsti-

tuants.

Soit la grammaire hors-ontexte dénie par les règles de la gure1.1, NP signie Noun Phrase

(groupe nominal), VP Verb Phrase (groupe verbal), tV transitive Verb (verbe transitif), S sentene

(phrase).Cettegrammairefaitpartiedesgrammairesditesde onstituants,danslesquelles desrèglesde

S NPVP

VP tVNP

NP Jean

tV aime

NP Marie

Fig.1.1Règlesdegrammairehors-ontextepourJeanaimeMarie

grammaire(souventnombreuses)indiquentquelleatégoriepeutseombineravequelleautreatégorie

pourformerunetroisièmeatégorie.

PourlaphraseexempleJeanaimeMarie,onadonl'arbred'analysesyntaxiquehors-ontextede

lagure1.2.

CetteanalysearboresentemetenévidenequeJeanestenpositiondesujetetMaried'objet

duverbetransitifaime.

(10)

S

NP VP

Jean tV NP

aime Marie

Fig.1.2Arbred'analyse syntaxiquehors-ontextepourJeanaimeMarie

1.1.2 Analyse en grammaires atégorielles

Leproblème majeurdesgrammaires hors-ontexteest laprésenede règlesnonlexialisées,'est-à-

direde règles qui ne ontiennent que desnon-terminaux. Si la grammaire est omplètementlexialisée

(unmotpouvantlexialiserplusieursrègles),pourunénonédonnéonpeutalulerlenombremaximum

d'analysespossiblesenfaisantle produit dunombrederèglesassoiées àhaquemotparlenombrede

motsdel'énoné.Silagrammairen'estpaslexialisée(enfait,siellen'estpaslexialisable),onnepeut

plusêtreertaindunombred'analysespossibles,aronnepeutpassavoiravantl'analysedequellesrègles

delagrammaireonaurabesoinauoursdeelle-i.Lanon-lexialisationintroduit del'indéterminisme.

La solutionest don d'érire des grammaires lexialisées.Pour ela, Bar-Hillelet Adjukiewiz [Adj35℄

ontdéveloppélesgrammairesatégorielles,dontleprinipeestd'assoieràhaqueentréelexialeuneou

plusieursatégoriessyntaxiques.Uneatégorieestvueommeunefontionquis'appliqueàuneatégorie

pourenformerunetroisième. Toute l'informationsurlespossibilitésdeombinaisondehaquemotest

donontenueintégralementdanslaoulesatégoriesquiluisontaetées,entenantomptede l'ordre

desmotsdanslaphrase.

Corollairement, lesCGet 'est ette aratéristiquequi enguide leproessus de omposition

onsidèrentlessyntagmesommedesressouresonsommables,ertainesressouresétantattendues(on

modéliseelaparunepolariténégative)etd'autresdisponibles(polaritépositive).Dansetteperspetive,

unephraseestbienforméesitouteslesressouresattenduesparhaundessyntagmesquilaomposent

sont rendues disponibles par les autres syntagmes, et si toutes les ressoures oertes par haun des

syntagmessontonsomméesparlesautressyntagmes.Alors,labonneformationd'unephraseserésume

àlaneutralisationdespolaritésopposées.Intuitivement,unverbetransitif diretabesoin,pourformer

unephraseorrete,d'ungroupenominal(i-aprèsGN)àgauheetunàdroite.Don,siunephraseest

onstituéed'un verbe transitif diret et de deux GN (l'un àgauhe et l'autre à droite), les ressoures

fournies par es GN sont onsommées par le verbe transitif diret et les ressoures attendues par e

derniersontdisponibles:lespolaritéssontneutralisées.

EnCG,ondénitlaatégoriedehaquemotàpartirdesatégoriesdebasespoursentene(phrase),

nppournounphrase (groupenominal),ainsiquen pournoun(dontnousn'avonspasbesoinpournotre

exemple).Onadonpourlesmotsdenotreexemplelesatégories:

aime (np\ s)/ np

Jean np

Marie np

UnverbetransitifommeaimedoitseombineràsadroiteaveunGN(/ np),puisàsagauhe

aveunautreGN(np\),pourdonnerunephrase(s).

(11)

Jean aime Marie

np (np\ s)/ np np

np (np\ s)

s

Fig.1.3AnalyseatégorielledeJeanaimeMarie

1.1.3 Analyse en grammaires d'interation

Les IG reprennent ette idée de polarités en la desendant du niveau des syntagmes à elui des

traits grammatiaux utilisés pour dérire les syntagmes (les parties du disours, le genre, la fontion

syntaxique...).

Ainsidansl'exemplepréédent,haundesdeuxGNdemandeunefontionsyntaxique(f unct←?),etle

verbedemandedeuxGNet fournitàl'unlafontionsujet(f unctsubj)et àl'autre lafontionobjet

(f unctobj).C'estequiest représentéparlesdesriptionsd'arbresrassembléesdanslagure1.4,le résultatdel'analyseétantl'arbreneutralisé1.5.Danslasetionquisuit,nousprésentonsunpeuplusen

détaillanotiondedesriptiond'arbreetlesystèmedepolarités.

1.2 Desriptions d'arbres polarisées et reherhe de modèles

1.2.1 Desriptions d'arbres

Une desription d'arbreest unensemble de noeuds et de relations de domination et de préédene

entreesnoeuds.Dansleasd'unarbresyntaxique,lesnoeudsreprésententdessyntagmesetlesrelations

desontraintesrelativesentre es syntagmes.Les propriétés morphosyntaxiques de es syntagmes sont

expriméespardesstruturesdetraitsattahéesauxnoeuds, ommenousl'avonsfaitdanslagure1.4.

Lesrelationsentrelesnoeudsd'unedesriptionpeuventêtredequatretypes,distinguésgraphiquement

parlestyledetraitslesreprésentant:

dominationimmédiate: A > B signiequelenoeudAestlepèredunoeudB,equiestreprésenté

paruntraitontinu.Syntaxiquement,elasigniequelesyntagmeB estunonstituantimmédiat

deA.Onpeutgerl'ensembledeslsd'unnoeudAàl'aidedelarelationA > A1, A2, . . . , Ap.Cette

relationsigniequelenoeudAaexatementpls, etdonsyntaxiquementqueAaexatementp

onstituantsimmédiats.

dominationsous-spéiée: A >B signieque lenoeud B est dansle sous-arbreissude A àune

profondeurindéterminée,equiestreprésentéparuntraitdisontinu.Àlalimite,Bpeuts'identier

àA.Syntaxiquement,elasigniequelesyntagmeB est inlus dansA àune profondeurindéter-

minée, e qui permet d'exprimer àlafois une dépendane syntaxique nonbornéeet lapossibilité

d'appliquerdesmodieursàunsyntagme.Deplusamplesdétailssontexposésdans[Per05℄.

préédene immédiate: A B signie que le noeud A préède immédiatement le noeud B dans

l'ordre linéaire des noeuds, e qui est représenté par une èhe ontinue. Syntaxiquement, ela

signiequelesyntagmeApréèdeimmédiatementlesyntagmeB dansl'ordrelinéairedesmotsde

laphrase.

préédene sous-spéiée: AB signiequelenoeud ApréèdelenoeudB dansl'ordrelinéaire

des noeuds, e qui est représenté par une èhe disontinue. Syntaxiquement, elasignie que le

syntagmeA préèdelesyntagmeB dansl'ordrelinéairedesmotsdelaphrase.

Références

Documents relatifs

Nous pouvons constater sur les deux tableaux ci-dessous que les corrélations dans l’ensemble des phases baissières sont plus fortes que dans les phases haussières

A l’issue de l’expérience de formation hybride que nous proposions à nos étudiants de 1ère année de DUT Gaco, nous leur administrâmes un questionnaire sur le

Comme nous l’avons vu, positionner le squelette d’animation revient `a d´efinir sa position dans le rep`ere monde et l’orientation de tous ses joint.. Il existe plusieurs

Dans ce chapitre nous allons donner deux formalismes théoriques pour calculer la section efficace triplement différentielle (SETD) de l’ionisation d’une cible atomique dans la

Dans le module d‟indexation, nous avons utilisé le modèle ontologique afin d‟associer les termes à leurs concepts, d‟extraire les relations entre eux à partir des documents,

Nous avons donc démonté, « déconstruit » le langage en quatre registres qui répondent aux quatre plans de la théorie de la médiation : la grammaticalité, l’écriture,

3 L’article propose d’abord une périodisation de l’orthographe française et se penche ensuite sur les grammaires retenues pour chaque période, en les

1 Cet article propose une réflexion sur les exercices contenus dans les grammaires de l’italien à l’usage des Français de Niccolò Giosafatte Biagioli (1772 †1830), publiées