Système par transition - De l’étiquetage syntaxique pour les grammaires catégorielles de dépend

Le principe de l’analyse en dépendances par transition consiste à trouver une séquence de transitions permettant de construire une structure de dépendances correcte à partir d’une phrase donnée. Les transitions (opérations complexes) sont appliquées à des configurations (états). Un système par transition est donc équivalent à un automate dans lequel les configurations décrivent l’état de l’analyse (position dans la phrase et avancement dans la construction de la structure de dépen- dances) et les transitions permettent de passer d’une configuration à une autre. Procéder à une analyse équivaut à chercher un chemin dans l’automate à partir de la configuration initiale jusqu’à une configuration finale. Chercher la bonne analyse revient alors à chercher le chemin permettant d’atteindre la configuration finale contenant la bonne structure de dépendances.

Le système par transition que nous présentons dans ce chapitre résulte à l’origine de travaux conjoints entre Alexandre Dikovsky et Boris Karlov. Ce système par transition est décrit par un

quadruplet hT, C, c0, Cti où, suivant la définition présentée dans la section2.3.2du chapitre2:

• T est un ensemble de transitions ; • C est un ensemble de configurations ; • c0 ∈ C est la configuration initiale ;

• Ct ⊂ C est l’ensemble des configurations finales.

Nous présentons les détails des configurations et des transitions propres à ce système dans les sous- sections qui suivent. La finalité de ce système d’analyse par transition est de produire des structures de dépendances conformes à la représentation en dépendances des grammaires catégorielles de dépendances. Le système intègre donc des transitions standards, équivalentes aux transitions du

système arc-standard (Yamada et Matsumoto,2003), pour la gestion des dépendances projectives

1_{Ces travaux ne furent pas l’objet d’une publication. Seuls les premiers tests effectués avec ce système furent}

et des ancres, et s’étend à la gestion des dépendances non-projectives par l’ajout de transitions particulières inspirées de la notion de dualité entre les valences polarisées et par l’adaptation en conséquence des configurations.

6.2.1 Les configurations

Une configuration représente l’état dans lequel est l’analyseur au cours d’une l’analyse. Dans le cas de notre système, une configuration décrit la position de l’analyse par rapport à la phrase, i.e. l’état des mots (déjà parcourus ou non) n’étant pas encore rattachés à d’autres par des dépendances, et l’avancement de la construction de la structure de dépendances, i.e. les dépendances ayant déjà été trouvées.

Définition 14 Configuration

Une configuration est un quintuplet (σ, β, θ, k, A) où : • σ est une pile sauvegardant des mots ;

• β est une mémoire tampon comprenant des mots ; • θ est une liste de valences polarisées, nommée potentiel ; • k est un compteur ;

• A est un ensemble d’arcs.

Les mots empilés sur la pile σ ont été parcourus au moins une fois, ils peuvent être les gouverneurs d’autres mots (ceux-ci ont alors déjà été traités et n’appartiennent plus ni à σ ni à β) et ne sont pas encore des dépendants. Les mots déjà traités n’apparaissent plus dans la configuration. Ces mots apparaissent alors seulement en tant que dépendants dans des dépendances appartenant à l’ensemble d’arc A. Une dépendance est décrite par (i, l, a, j) où i est l’indice du gouverneur de la dépendance, j est l’indice du dépendant, l est l’étiquette de la dépendance et a est la sorte de l’arc (projectif, non-projectif ou ancre). D’autre part, les mots enregistrés dans β sont en attente de traitement. Ils sont insérés en début d’analyse dans la mémoire tampon dans l’ordre dans lequel ils apparaissent dans la phrase, puis traités les uns après les autres (de gauche à droite) lors de l’analyse. Le potentiel θ sauvegarde les valences polarisées prédites par le système dans l’ordre de leurs prédictions. Le compteur k permet de limiter la prédiction de ces valences polarisées de telle sorte qu’un mot de la phrase ne puisse être associé qu’à au plus une valence polarisée.

Pour une phrase W = w1w2...wn, la configuration initiale du système est ([w0] , [w1,...,wn] , [] , 1, ∅)

où w0 est une racine artificielle (dans la structure de dépendances résultante tout mot dépend di-

rectement ou indirectement de w0). Une configuration finale, quels que soient σ, θ et A0, est de la

forme : (σ, [] , θ, n + 1, A0_).

6.2.2 Les transitions

Une transition est une fonction t : C → C s’appliquant aux configurations. Notre système par

transition comprend 6 transitions différentes. Elles sont présentées dans le tableau6.1. Trois des

transitions du système que nous proposons sont équivalentes aux transitions employées par la

Transition Effets sur les configurations

Local-Left(l) (σ | wi, wj | β, θ, k, A) ⇒ (σ, wj | β, θ, k, A ∪ {(j, l, proj | ancre, i)})

Local-Right(l) (σ | wi, wj | β, θ, k, A) ⇒ (σ, wi | β, θ, next(k,j), A ∪ {(i, l, proj | ancre, j)})

Shift (σ, wi | β, θ, k, A) ⇒ (σ | wi, β, θ, next(k,i), A)

PutPotential(v1,...,vm) (σ, wi | β, θ, k, A) ⇒ (σ, wi | β, θv1k...vkm, k + 1, A)

Dist-Left(l) (σ, β, θ1 .li θ2 -lj θ3, k, A) ⇒ (σ, β, θ1θ2θ3, k, A ∪ {(j, l, non-proj, i)})

Dist-Right(l) (σ, β, θ1 %li θ2 &lj θ3, k, A) ⇒ (σ, β, θ1θ2θ3, k, A ∪ {(i, l, non-proj, j)})

Conditions Local-Left i 6= 0 Local-Right next(k,i)= k + 1 si k = i k sinon Shift PutPotential i = k

Dist-Left si .li _-lj _{est la paire la plus à gauche satisfaisant la condition FA}

Dist-Right si %li _&lj _{est la paire la plus à gauche satisfaisant la condition FA}

TABLE 6.1 – Définition des transitions du système d’analyse par transition.

Les transitions équivalentes aux transitions standards Left-Arc et Right-Arc sont renommées res- pectivement Local-Left et Local-Right étant donné qu’elles ne gèrent que les dépendances locales c’est à dire les dépendances projectives et les ancres. Elles permettent donc de lier par une dé- pendance gauche ou droite les deux mots en cours de traitement, i.e. le mot du haut de la pile σ et le premier mot de la mémoire tampon β. En outre, le mot subordonné dans la dépendance est

supprimé (car il ne peut plus recevoir de nouvelle dépendance), il s’agit donc du mot wi en haut

de la pile σ dans le cas de Local-Left et du premier mot wj de β dans le cas de Local-Right. De plus,

dans le cas de Local-Left, le mot wi du haut de la pile est passé dans β. La transition Shift (transition

standard) permet de supprimer le premier mot de β pour l’ajouter sur σ.

Les trois autres transitions intégrées au système permettent de gérer les dépendances non- projectives. La transition PutPotential ajoute une ou plusieurs valences polarisées dans le poten- tiel θ. Les valences polarisées correspondent aux extrémités des dépendances non-projectives, comme dans le cas des grammaires catégorielles de dépendances. Par exemple, PutPotential(.l) prédit une dépendance non-projective entrante étiquetée l et PutPotential(-l) prédit une dépen- dance non-projective sortante étiquetée l. Ces valences sont ajoutées à la liste θ dans l’ordre de leur prédiction. En outre, la transition PutPotential ne peut être appliquée qu’une seule fois pour chaque mot de la phrase (le compteur k dans la configuration permet de limiter l’emploi de cette transition). Si des valences duales apparaissent dans θ, les transitions Dist-Left et Dist-Right peuvent être appliquées. Dist-Left ajoute une dépendance non-projective gauche étiquetée l à l’ensemble A si une paire de valences (la plus à gauche dans le potentiel) . l - l satisfaisant la condition FA

apparaît dans le potentiel, i.e. si ni . l ni - l n’apparaissent dans θ1 ou dans θ2. Les valences

correspondantes sont alors retirées du potentiel. Dist-Right ajoute une dépendance non-projective droite étiqueté l à l’ensemble A si une paire de valences %l &l apparaît dans le potentiel dans les même conditions que celles définies pour Dist-Left.

Dans le document De l’étiquetage syntaxique pour les grammaires catégorielles de dépendances à l’analyse par transition dans le domaine de l’analyse en dépendances non-projective (Page 109-111)