HAL Id: tel-01752899
https://tel.archives-ouvertes.fr/tel-01752899v2
Submitted on 5 Nov 2007
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Joseph Le Roux
To cite this version:
Joseph Le Roux. La coordination dans les grammaires d’interaction. Génie logiciel [cs.SE]. Institut
National Polytechnique de Lorraine - INPL, 2007. Français. �NNT : 2007INPL063N�. �tel-01752899v2�
Institut National Polytechnique de Lorraine
D´ epartement de formation doctorale en informatique Ecole doctorale IAEM Lorraine ´
La coordination dans les grammaires d’interaction
TH` ESE
pr´esent´ee et soutenue publiquement le 17 octobre 2007
pour l’obtention du
Doctorat de l’Institut National Polytechnique de Lorraine
(sp´ ecialit´ e informatique)
par
Joseph Le Roux
Composition du jury
Rapporteurs : Professeur Alain Lecomte, Universit´e de Paris 8 Professeur Aarne Ranta, Universit´e de G¨oteborg
Examinateurs : Professeur Denys Duchier, Universit´e d’Orl´eans Professeur Owen Rambow, Universit´e de Columbia Professeur Fran¸coise Simonot-Lion, Ecole des Mines de Nancy ´
Professeur Guy Perrier, Nancy Universit´e (directeur de th`ese)
Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503
Cette thèse présente une modélisation des prinipaux aspets syntaxiques de la o-
ordination dans les grammaires d'interation de Guy Perrier [
Per03
℄
. Les grammaires
d'interation permettent d'expliiter la valene des groupes onjoints. C'est préisément
sur ette notion qu'est fondée notre modélisation.
Nousprésentonségalementtous lestravauxautourde ettemodélisationquinousont
permis d'aboutir à une implantation réaliste : le développement du logiiel Xmg et son
utilisation pour l'ériture de grammaires lexialisées, le ltrage lexial par intersetion
d'automateset l'analysesyntaxique.
Mots-lés: linguistique omputationnelle, traitement automatique des langues, syntaxe
formelle, oordination, grammaires d'interation, analyse syntaxique, théorie des auto-
mates
Abstrat
This thesispresents amodelisationofthe mainsyntatialaspetsof oordination
using Guy Perrier's Interation Grammars
[Per03℄
as the target formalism. Interation
Grammars make it possible to expliitly dene onjunts' valenies. This is preisely
whatour modelisationisbased upon.
We also present work around this modelisation that enabled us toprovide a realisti
implementation: lexializedgrammar development (using our tool Xmg), lexialdisam-
biguationbased onautomata intersetion and parsing.
Keywords: omputationallinguistis,natural languageproessing,formalsyntax, oor-
dination,interation grammars, parsing,automata theory
Je tiens à remerier en premier lieu mon enadrant, Guy Perrier, qui m'a toujours
soutenuetenouragé durant es quatre années. Il m'abeauoup aidédans mes réexions
et je lui dois beauoup. Je le remerie également d'avoir relu ave attention les versions
suessives de e doument et d'avoir à haque fois supporter les approximations, les
erreurset lesfautes d'orthographe.
Jeremerieégalementlesrapporteurs,AlainLeomteetAarne Ranta,d'avoiraepté
des'intéresser àmontravailetd'avoirindiquéaveune granderigueurleursobservations.
Je veux aussi remerier les autres membres du jury. En partiulier, je remerie Denys
Duhier qui a initié le travail sur Xmg. Son trop bref passage à Nany a donné lieu à
troisthèses,dontelle-i.JeremerieOwenRambowd'avoirspontanémentjouélerlede
obayeeninstallanteten utilisantXmg.Sesourrielsnousontsouvent permisdetrouver
etdans laplupartdes as, de orriger des bogues.
Durantquatreans,j'aipuappréierlaompagniedesmembresduprojetCalligramme.
Je remerie en partiulier les développeurs de leopar de première génération : Bruno
Guillaume,Sylvain Pogodalla et Guillaume Bonfante. C'est en utilisant leur logiiel que
j'aiomprislaméaniquedesgrammairesd'interation.Lehapitre6etl'annexeAdoivent
énormément àGuillaumeBonfante.
Au ours de e dotorat, j'ai partiipé au développement de deux logiiels. Je tiens
à remerier haleureusement les personnes ave qui j'ai ollaboré étroitement : Yannik
Parmentier, ledéveloppement de Xmg a vraiment été fait en tandem, et Jonathan Mar-
hand,quis'estoupédelapartievraimentdiilede l'algorithmede Earley(lagestion
des environnements).
Une thèse, 'est aussi des disussions et des éhanges passionnants ave les autres
dotorants ouingénieurs. Je tiens don àsaluer tous eux qui m'ont fait aimer Nanyet
leLORIA :Sylvain, Benjamin, Benoît, Eri, Haène,Laïka,Sébastien, Dmitry,Mathieu,
Sarah,Karen... et tous eux que j'oublie.
Je remerie mes amis, là bas en Bretagne, dont laompagnie m'a si souvent manqué
durant es long hivers lorrains, pour leur joie de vivre ommuniative et leur amitié
toujoursintate àhaque visitemalgré lesannées etla distane.
Je remerie mes parents qui ont toujours ru en moiquand moi même je n'y royais
plus.
Enn, je remerie Gwen de merendre heureux en omplétantl'irréalitédu réel.
have alwaysfound the best solutionof the diulties. Still Ithought it better to give my
own attempts forwhat they areworth than to shirk the task.
Otto Jespersen, Analyti Syntax
Introdution
1 La oordination :pourquoi? . . . . . . . . . . . . . . . . . . . . . . . . 1
2 La modélisationproposée . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1 Le prinipe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 Extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Travauxrelatifs àl'implantation. . . . . . . . . . . . . . . . . . . . . . 5
3.1 Ériture de grammaires lexialisées . . . . . . . . . . . . . . . . 5
3.2 Filtragelexial . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Analyse syntaxique . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 Plan de lathèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Chapitre 1 Les grammaires d'interation 1.1 Un formalismepolarisé . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.1 La notion de valene en syntaxe . . . . . . . . . . . . . . . . . . 12
1.1.2 La logique linéaireintuitionnisteimpliative . . . . . . . . . . . 13
1.1.3 Grammaires d'interation primitives . . . . . . . . . . . . . . . 14
1.2 Les desriptionsd'arbres polarisées . . . . . . . . . . . . . . . . . . . . 15
1.2.1 Utilisation de desriptions . . . . . . . . . . . . . . . . . . . . . 15
1.2.2 Polarités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.3 Traits, valeurs etenvironnements . . . . . . . . . . . . . . . . . 17
1.2.4 Les desriptions d'arbres . . . . . . . . . . . . . . . . . . . . . . 20
1.2.5 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.3 Modèles et interprétations des desriptions . . . . . . . . . . . . . . . . 25
1.3.1 Modèles saturés . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.2 Modèles minimaux . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4 Langageengendré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.5 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Partie I Éritureetmaintenane desgrammaireslexialisées 31 Chapitre 2 Des règles lexiales à Xmg 2.1 Introdution. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Lebesoinde produtionautomatique . . . . . . . . . . . . . . . . . . . 34
2.3 L'approhe métagrammatiale . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.1 Un problème majeur :la redondane . . . . . . . . . . . . . . . 36
2.3.2 Héritage ouréutilisation . . . . . . . . . . . . . . . . . . . . . . 37
2.3.3 Règles lexiales . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4 Unesolution :la métagrammaire . . . . . . . . . . . . . . . . . . . . . 39
2.4.1 Laproposition originale . . . . . . . . . . . . . . . . . . . . . . 40
2.4.2 Unepremière révision . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.3 Uneapprohe orientée besoinset ressoures . . . . . . . . . . . 43
2.4.4 Lanouvelle éole :MgComp etXmg . . . . . . . . . . . . . . 43
2.5 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Chapitre 3 Xmg 3.1 Prinipesgénéraux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.1.1 Relationave laprogrammationlogique . . . . . . . . . . . . . 48
3.1.2 Types d'informations etdimensions . . . . . . . . . . . . . . . . 52
3.1.3 Post-traitement de dimension . . . . . . . . . . . . . . . . . . . 52
3.2 Langagenoyau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2.1 Combinaison de fragments . . . . . . . . . . . . . . . . . . . . . 53
3.2.2 Contenu des dimensions . . . . . . . . . . . . . . . . . . . . . . 54
3.3 Unearhiteture modulaire inspiréede la programmationlogique . . . 56
3.3.1 Des modules dédiés . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3.2 Extensibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4 Compilation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.6 Un résolveur extensible . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6.1 Prinipedu résolveur d'arbres . . . . . . . . . . . . . . . . . . . 60
3.6.2 Contraintes additionnelles . . . . . . . . . . . . . . . . . . . . . 61
3.6.3 Implantation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.7 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Chapitre 4 Une petite métagrammaire de la oordination 4.1 Version initiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.1 Délaration des traits . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.2 La première lasse . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2 Héritage etorganisation des lasses . . . . . . . . . . . . . . . . . . . . 68
4.2.1 La superlasse . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2.2 Ajout de traits . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2.3 Spéialisationet disjontion . . . . . . . . . . . . . . . . . . . . 69
4.3 Utilisationd'une lasse paramétrée . . . . . . . . . . . . . . . . . . . . 70
4.4 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Partie II Analyse de la oordination 75 Chapitre 5 Modélisation de la oordination 5.1 Introdution. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.2 Les phénomènesétudiés . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2.1 Coordination de onstituants . . . . . . . . . . . . . . . . . . . 79
5.2.2 Coordination de non-onstituants . . . . . . . . . . . . . . . . . 80
5.2.3 Cironsription des phénomènestraités . . . . . . . . . . . . . . 84
5.3 Modélisation dans lesgrammaires d'interation . . . . . . . . . . . . . 84
5.3.1 Les diérentes approhes du phénomène . . . . . . . . . . . . . 84
5.3.2 Le prinipe de superposition des interfaes . . . . . . . . . . . . 86
5.3.3 Les oordinations de onstituantssimples . . . . . . . . . . . . 89
5.3.4 La oordination de modiateurs . . . . . . . . . . . . . . . . . 90
5.3.5 La oordination de non-onstituants . . . . . . . . . . . . . . . 92
5.3.6 Laoordination ave ellipse ougapping. . . . . . . . . . . . . . 99
5.3.7 Remarquessur lesoordinations
n
-aires . . . . . . . . . . . . . 1005.4 Extensionpour laoordination disparate . . . . . . . . . . . . . . . . . 101
5.4.1 Struture des domaines de valeurs. . . . . . . . . . . . . . . . . 102
5.4.2 Révision de la notionde modèle . . . . . . . . . . . . . . . . . . 104
5.4.3 Modélisationde laoordination disparate . . . . . . . . . . . . 105
5.4.4 Limites de laproposition . . . . . . . . . . . . . . . . . . . . . . 106
5.5 Comparaisonave d'autres modélisations . . . . . . . . . . . . . . . . . 108
5.5.1 Grammairesatégorielles ombinatoires . . . . . . . . . . . . . 108
5.5.2 Hpsg etapprohe elliptique . . . . . . . . . . . . . . . . . . . . 113
5.5.3 Hpsg etapprohe par fatorisation . . . . . . . . . . . . . . . . 117
5.5.4 lfg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.6 Implantation de la grammaire . . . . . . . . . . . . . . . . . . . . . . . 121
5.6.1 Organisationdes lasses . . . . . . . . . . . . . . . . . . . . . . 122
5.6.2 Forme générale des DAP . . . . . . . . . . . . . . . . . . . . . . 122
5.6.3 Coordination nominale . . . . . . . . . . . . . . . . . . . . . . . 123
5.6.4 Coordination verbale . . . . . . . . . . . . . . . . . . . . . . . . 124
5.6.5 Séquenes et trou verbal . . . . . . . . . . . . . . . . . . . . . . 124
5.6.6 Bilande l'implantation . . . . . . . . . . . . . . . . . . . . . . . 124
5.7 Bilan. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Partie III Filtrage lexial et oordination 129 Chapitre 6 Automates de ltrage lexial 6.1 Introdution. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
6.2 Automatesà états nis déterministesayliques . . . . . . . . . . . . . 134
6.2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.2.2 Opérationd'intersetion . . . . . . . . . . . . . . . . . . . . . . 134
6.2.3 Automatesde segmentation . . . . . . . . . . . . . . . . . . . . 135
6.3 Automatesde polarités. . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.3.1 Séletions lexiales . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.3.2 Critèrede orretion . . . . . . . . . . . . . . . . . . . . . . . . 137
6.3.3 Arithmétiqued'intervalles . . . . . . . . . . . . . . . . . . . . . 139