Relation avec la programmation logique - Une solution : la m´etagrammaire

Partie I Ecriture et maintenance des grammaires lexicalis´ ´ ees 31

2.4 Une solution : la m´etagrammaire

3.1.1 Relation avec la programmation logique

Même si la notion de réutilisation et d’alternative aurait pu être exprimée de diverses manières, nous avons choisi d’utiliser le paradigme de la programmation logique qui nous semblait être en adéquation avec la problématique de l’organisation d’une grammaire.

Cette description concise, que l’on appelle métagrammaire, est à mettre en relation avec un programme logique. Il existe une analogie entre les deux. Au niveau de l’écriture de cette description, la syntaxe concrète est influencée par celle des langages de program-mation logique. Il n’y a pas d’affectation, uniquement de l’unification.

Dans un programme logique l’unité de base est la clause et on retrouve cette notion dans la métagrammaire sous la forme de fragment nommé et réutilisable, ou classe dans la terminologie de Xmg. Les clauses peuvent énoncer un axiome ou être construites à partir d’autres clauses tandis que dans la métagrammaire on aura des fragments indépendants ou construits à partir d’autres fragments. Ces constructions sont dans les deux cas similaires.

On peut indiquer grâce à la conjonction et à la disjonction de clauses/fragments deux types de constructions différentes :

la conjonction : elle permet de dire que l’on réutilise tous les fragments opérandes de la conjonction pour construire le fragment résultat.

la disjonction : elle indique que l’un des fragments opérandes doit être réutilisé pour obtenir le fragment résultat.

Enfin, certaines classes sont annotées pour indiquer qu’elles représentent une structure linguistique complète. C’est l’équivalent des requêtes que l’on peut formuler dans un progamme logique et qui déclenchent une évaluation.

On le voit, dans Xmg, le nombre de primitives pour la combinaison de fragments est limité : il n’en existe que deux. La métagrammaire peut donc se représenter

graphi-3.1. Principes généraux quement comme un graphe et/ou, ou de manière plus compacte comme une grammaire hors-contexte. Les structures complètes correspondent à la réunion des fragments contenus dans les classes rencontrées lors d’un parcours dans un tel graphe ou de manière analogue à une dérivation dans la grammaire correspondante. Le squelette de la métagrammaire peut donc être vu comme une grammaire hors-contexte dont les terminaux ne sont pas des mots mais des fragments de structures. Dans Xmg, c’est plus particulièrement l’analogie avec les grammaires de clauses définies (Dcg) (équivalentes aux Cfg dans la version simple où les clauses n’ont pas d’argument) qui a été retenue pour sa notion d’accumulateur et pour la place prépondérante de l’opération d’unification. À chaque fois qu’une classe est

évaluée, on accumule le fragment qu’elle contient et on réalise les unifications indiquées.

A la fin de l’évaluation, on dispose d’un accumulateur contenant tous les fragments des` classes rencontrées lors d’une évaluation, dont certaines parties ont été unifiées.

Cette fa¸con de voir les m´etagrammaire, cette interpr´etation, nous permet de rester dans un cadre formel connu avec des algorithmes de traitement efficaces.

Combinaisons de classes

Par exemple, considérons l’arbre syntaxique associé à une entrée lexicale telle quevoit (i.e. un verbe transitif). Disposant des fragments d’arbres Sujet, Actif et Objet, nous pouvons réécrire l’arbreV erbeT ransitif comme la conjonction de ces 3 fragments :

VerbeTransitif Sujet Actif Objet

N V N

⇐

N V

+

V N

Ce qui s’´ecrit ´egalement comme suit¹¹ :

VerbeTransitif → Sujet∧Actif∧Objet (3.1) Nous nous ramenons ainsi au formalisme des grammaires de clauses définies (Dcg), dans lequel les terminaux ne seraient pas des mots mais des fragments d’arbres. La conjonction permet donc d’exprimer la construction par réutilisation de fragments. Ces fragments sont nommées. Ce nom permet de réutiliser cet ensemble, d’y référer de manière univoque.

Les Dcg fournissent également une autre opération, la disjonction. Elle va nous permettre d’établir les alternances, et plus généralement de nommer des ensembles de constructions alternatives. Plus précisément, la disjonction permet de créer des classes d’équivalences que l’on peut nommer et donc réutiliser. Elles servent à expliciter les al-ternances. Ainsi, nous pouvons préciser l’exemple précédent de l’arbre associé aux verbes transitifs en spécifiant que le sujet peut être sous forme canoniqueou sous forme relative.

Cela s’´enonce via la r`egle suivante :

Sujet → SujetCan∨SujetRel (3.2)

11. Attention, dans le cas d’une utilisation r´eelle avecXmg, il faudrait indiquer que les nœudsS et les nœudsV doivent s’unifier.

En réalité, la conjonction et la disjonction sont des coquilles vides : rien n’a encore été dit au sujet la sémantique de la ¡¡réutilisation¿¿. Elles permettent uniquement de décrire l’organisation des classes entre elles, en terme de réutilisation et d’alternance.

La conjonction va être selon le contexte instanciée vers une certaine opération logico-algébrique (nous parlerons de la notion de dimension plus-bas) comme par exemple l’uni-fication ou encore la conjonction d’une certaine logique. Il n’y a pas de mécanisme de croisement implicite – en tout cas, dans le langage noyau. Le grammairien doit spécifier tous les croisements¹², ce qui lui donne un grand contrôle sur la grammaire produite, per-met d’éviter de générer des structures non-voulues (problème de la surgénération) mais peut s’avérer fastidieux. La section 3.1.3 présente une solution à ce problème pour rendre implicite une partie des croisements ou des unifications.

Gestion des identifiants

Un soin tout particulier a été pris pour assurer la facilité du développement de gram-maires importantes. Un des problèmes évoqués au chapitre précédent est celui de la col-lision de noms qui est inévitable dans les formalismes où les noms sont globaux. Dans Xmg, nous avons choisi une approche radicalement différente : les noms n’ont de portée qu’au sein d’une classe.

Dans ce cas, les collisions ne peuvent donc se produire qu’entre identifiants d’une mˆeme classe, ce qui n’arrive pas en pratique. Cependant, cette solution est trop restrictive.

L’utilisateur a souvent besoin quand il réutilise des classes (par conjonction ou disjonction) de faire explicitement référence à des nœuds qui sont désignés par des variables pour leur ajouter de l’information, les unifier, ou pour toute autre opération. Il convient donc de pouvoir accéder à l’intérieur d’une classe aux nœuds définis dans une autre classe.

Nous avons mis en place un m´ecanisme d’import ou d’export de noms entre classes.

Une classe déclare donc explicitement quelles sont les variables qui seront accessibles aux classes qui la réutiliseront. Quand une classe A réutilise une classe B, elle peut accéder aux variables exportées par B, par l’intermédiaire d’une notation pointée. Elle accède uniquement à ces variables exportées. Les conflits de noms sont donc rares dans Xmg. Héritage

D’autres opérations peuvent être construites à partir des deux primitives. Par exemple, la notion d’héritage entre fragments utilise la conjonction en lui ajoutant un import d’iden-tifiants qui est une opération que nous définirons plus bas.

Intuitivement, si la classe B définit un fragment b et hérite de la classe A qui, elle, définit un fragment a alors le contenu de B est la conjonction des fragments a et b et l’espace de nommage de A est fusionné à celui de B, c’est à dire que les variables locales de la classeAsont ajoutées aux variables locales deB. L’héritage permet de partager des variables entre plusieurs classes.

Xmg autorise l’h´eritage multiple. Une classe peut importer le contenu et l’espace de nommage de plusieurs autres classes. Si plusieurs classes exportent les mˆemes noms,

12. Nous appelons ici croisement tout emploi de la conjonction ou de la disjonction.

3.1. Principes généraux le système devrait échouer. Pour des raisons pratiques¹³, dans l’implantation seule la dernière classe importée exportera réellement ce nom et un message d’avertissement si-gnale le problème.

Evaluation´

Enfin, dans un programme logique, une exécution correspond à une requête. De manière analogue, on peut demander à évaluer un ou plusieurs fragments de la métagrammaire.

Cette évaluation va déclencher tous les croisements indiqués par les conjonctions et dis-jonctions, à partir du fragment soumis à évaluation. Comme notre métagrammaire est un programme logique, ceci revient à retrouver toutes les dérivations de la classe évaluée dans une Dcg.

Dans notre exemple si l’on demande l’évaluation de la classe associée aux verbes tran-sitifs (dans notre outilvalue VerbeTransitif), on va expliciter la classe en rempla¸cant chaque nom par son contenu. Ici, on va remplacer l’appel à Sujet par la disjonction as-sociée. Ceci nous donnera :

VerbeTransitif → (SujetCan∨SujetRel)∧Actif∧Objet (3.3) On calcule la forme normale disjonctive de la formule associée àVerbeTransitif et pour chaque membre de la disjonction on utilise la sémantique associée à la conjonction pour assembler les fragments.

VerbeTransitif → (SujetCan∧Actif∧Objet)∨(SujetRel∧Actif∧Objet) (3.4)

VerbeTransitif1 → SujetCan∧Actif∧Objet (3.5)

VerbeTransitif2 → SujetRel∧Actif∧Objet (3.6)

Xmg va ensuite pour chacune des formules inférées énumérer les modèles. Un modèle est un n-uplet (D1, . . . , Dn) où Di est la restriction d’un modèle pour un type d’infor-mation donné, ce que nous appelons une dimension. En pratique, Xmg permet d’écrire des classes à trois dimensions. Les modèles sont donc des triplets (D1, D2, D3) où D1 est une description d’arbres,D2 est une description de prédicats, et D3 est une structure de traits.

En pratique, on ne calcule pas la forme normale disjonctive, on utilise une méthode plus efficace. La recherche de modèles s’effectue selon la méthode de résolution qui fonde la programmation logique, définie par [Rob65]. En d’autres termes, on ne calcule pas explicitement la forme normale disjonctive mais on utilise le mécanisme de retour arrière (backtracking) pour factoriser les parties communes.

Le but de cette section était de présenter l’organisation des fragments dans notre formalisme et de montrer qu’il y a bien une interprétation dynamique de ces classes. Le comportement deXmg est donc très similaire à un interprète Prolog.

13. Nous avons consid´er´e que le compilateur ne devait pas imposer une politique de nommage aux utilisateurs. Ce choix est discutable, il est vrai.

Dans le document TH`ESE Lacoordinationdanslesgrammairesd’interaction (Page 64-68)