a gauche dans la grammaire, et un seul 1
ercompagnon hypoth´etique `a droite qui est la polarit´e
composite ← attach´ee au traitcat : detdu nœud (0,3) de la description NC.
3.7 Utilisation des compagnons dans les chaˆınes d’analyse
syn-taxique
Nous concluons ce chapitre en montrant, dans cette section, l’int´erˆet concret des notions
que nous avons introduites (compagnons, compagnons potentiels et hypoth´etiques, r´eduction
et quasi-r´eduction des grammaires polaris´ees), pour les chaˆınes d’analyse syntaxique des
for-malismes grammaticaux polaris´es. Nous relions ces notions `a quatre applications : les tests de
correction et compl´etude d’une grammaire, l’am´elioration de la sp´ecificit´e des compagnons
hy-poth´etiques d’une grammaire pour l’analyse syntaxique, la d´etection d’incoh´erences dans une
grammaire et enfin l’int´egration des compagnons hypoth´etiques `a l’´etiquetage grammatical et `a
3.7. Utilisation des compagnons dans les chaˆınes d’analyse syntaxique 57
l’analyse syntaxique.
3.7.1 Correction et compl´etude d’une grammaire
Les compagnons hypoth´etiques fournissent un moyen de v´erification et d’exploration d’une
grammaire. Pour chaque objet polaris´e de la grammaire, les d´eveloppeurs de la grammaire
peuvent v´erifier quels sont ses compagnons hypoth´etiques `a gauche, `a droite ou des deux cˆot´es
indiff´eremment.
Cette possibilit´e est d’une grande aide lors des tests de correction et de compl´etude de la
grammaire. Les tests de compl´etude ont pour objectif de garantir que la grammaire produit
toutes les analyses attendues pour un ensemble de phrases. Dans l’id´eal, cet ensemble comprend
toutes les phrases du langage ; dans la r´ealit´e, on utilise une suite de tests repr´esentative comme
la TSNLP [LORP
+96]. Au cours de ces tests, lorsque la grammaire ne produit pas une analyse
attendue pour une phrase, il peut s’av´erer difficile d’isoler la cause de cet ´echec.
Les tests de correction ont pour objectif de garantir que la grammaire ne produit pas d’analyse
incorrecte. Cela signifie que la grammaire ne reconnaˆıt pas comme grammaticale une phrase qui
ne l’est pas et qu’elle n’attribue `a une phrase grammaticale que les structures attendues.
3.7.2 Sp´ecificit´e des compagnons hypoth´etiques pour l’analyse syntaxique
V´erifier la liste des compagnons hypoth´etiques d’une polarit´e est ´egalement utile pour am´
elio-rer lasp´ecificit´edes compagnons hypoth´etiques d’une grammaire par rapport aux compagnons,
c’est-`a-dire au processus d’analyse. En statistique, la validit´e d’un test est d´etermin´ee par deux
valeurs. Lasensibilit´e est la capacit´e du test `a donner un r´esultat positif dans tous les cas r´
eel-lement positifs. La sp´ecificit´e est la capacit´e du test `a donner un r´esultat n´egatif dans tous les
cas r´eellement n´egatifs.
Dans notre cas, le test correspond au calcul des compagnons hypoth´etiques :
– lesvrais positifs(V P) sont les compagnons hypoth´etiques d’une polarit´e qui sont ´egalement
ses compagnons potentiels,
– les vrais n´egatifs (V N) sont les polarit´es qui ne sont pas des compagnons hypoth´etiques
et qui ne sont pas des compagnons potentiels,
– les faux positifs (F P) sont les compagnons hypoth´etiques d’une polarit´e qui ne sont pas
ses compagnons potentiels,
– lesfaux n´egatifs (F N) sont les polarit´es qui ne sont pas des compagnons hypoth´etiques et
qui sont des compagnons potentiels.
La sensibilit´e d’un test est
10:
sensib= V P
V P+F N
La sp´ecificit´e d’un test est :
specif = V N
V N +F P
La d´efinition des compagnons hypoth´etiques implique que leur calcul ne produit aucun faux
n´egatif. Ce test a par cons´equent une sensibilit´e de 100%. A contrario, la sp´ecificit´e du
cal-cul des compagnons hypoth´etiques n’est pas garantie car les compagnons hypoth´etiques d’une
grammaire peuvent contenir plus ou moins de faux positifs.
Une fa¸con na¨ıve mais sˆure de d´etecter les faux positifs est d’examiner les ensembles de
compa-gnons hypoth´etiques des polarit´es de la grammaire, `a la recherche de compagnons hypoth´etiques
inattendus au regard des principes linguistiques qui sous-tendent la grammaire. Souvent, les faux
positifs sont produits par des structures initiales qui sont moins contraintes que dans l’intention
du grammairien. Deux cas de figure se pr´esentent alors :
– soit les autres structures de la grammaire compensent ce manque local de contrainte, et
la grammaire ne surg´en`ere pas,
– soit les autres structures ne compensent pas ce manque local de contrainte, et la grammaire
surg´en`ere.
Dans le premier cas, mˆeme si le manque de contrainte n’a pas d’impact sur le r´esultat, il a
un impact clair sur les performances du processus d’analyse car il augmente inutilement la taille
de l’espace de recherche. Dans les deux cas, il est possible que le grammairien ait ´et´e limit´e par
l’expressivit´e du formalisme qu’il utilise.
Le relev´e des faux positifs dans les compagnons hypoth´etiques d’une grammaire permet, dans
le meilleur des cas, de corriger la grammaire. Le cas ´ech´eant, ces observations peuvent ´egalement
sugg´erer des modifications dans la d´efinition du formalisme, afin par exemple d’en augmenter
l’expressivit´e.
3.7.3 D´etection d’incoh´erences dans une grammaire
Les compagnons hypoth´etiques permettent de calculer, pour toute grammaire lexicalis´ee
polaris´eeG, la grammaire quasi-r´eduiteG
0qui lui est fortement ´equivalente. La grammaire
quasi-r´eduite est le sous-ensemble de la grammaire, tel que toute polarit´e de toute structure a au moins
un compagnon hypoth´etique dans la grammaire.
Or, il est rare qu’un linguiste ´ecrive intentionnellement une grammaire qui contienne des
structures orphelines, c’est-`a-dire une grammaire qui ne soit pas d’embl´ee quasi-r´eduite. Souvent,
ce cas de figure t´emoigne d’un oubli ou d’une erreur. Ces oublis ou erreurs sont d’autant plus
fr´equents, et la proc´edure de quasi-r´eduction de la grammaire est d’autant plus utile, que la
grammaire est de grande taille : plusieurs milliers de structures initiales pour les grammaires
LTAG [XTA95] et IG [Per07]. L’´ecriture de grammaires de cette taille peut ˆetre facilit´ee par
l’utilisation d’un compilateur de m´eta-grammaires [Can96,DLP05a]. Cependant, ce compilateur
ne v´erifie pas, et donc ne garantit aucunement, que la grammaire produite est quasi-r´eduite.
3.7. Utilisation des compagnons dans les chaˆınes d’analyse syntaxique 59
ressources linguistiques. Une v´erification automatique de la quasi-r´eduction est effectu´ee pour
toute nouvelle version de la grammaire FRIGRAM du fran¸cais. Cette v´erification s’est av´er´ee
ˆetre un indicateur fiable d’oubli ou d’erreur dans la grammaire.
3.7.4 Int´egration `a l’´etiquetage grammatical et `a l’analyse syntaxique
Les compagnons hypoth´etiques permettent ´egalement de guider l’´etiquetage grammatical et
l’analyse syntaxique. En particulier, toutes les polarit´es d’un ´etiquetage qui n’ont qu’un seul
com-pagnon hypoth´etique dans cet ´etiquetage peuvent ˆetre syst´ematiquement associ´ees ou compos´ees
avec ce compagnon. Ces compositions d´eterministes r´eduisent d’autant l’espace de recherche du
mod`ele.
Dans la deuxi`eme partie de ce manuscrit, nous utiliserons les notions de compagnons
hypo-th´etiques et de quasi-r´eduction d’une grammaire polaris´ee pour concevoir de nouvelles m´ethodes
de filtrage des ´etiquetages grammaticaux.
Conclusion
Dans ce chapitre, nous avons d´efini les notions de compagnon hypoth´etique d’une polarit´e
dans une grammaire et de grammaire polaris´ee quasi-r´eduite. Des notions similaires, plus fortes,
existent pour les formalismes GES codables en RCG. Les notions que nous d´efinissons sont
valables et peuvent ˆetre utilis´ees dans tout formalisme grammatical lexicalis´e polaris´e. Nous
avons pr´esent´e quelques utilisations possibles de ces notions pour la conception et la maintenance
de grammaires, ainsi que pour l’analyse syntaxique.
Dans la partieII, nous utiliserons ces notions pour concevoir de nouvelles m´ethodes de filtrage
des ´etiquetages grammaticaux, applicables l`a encore `a tout formalisme grammatical lexicalis´e
polaris´e. Dans la partieIII, nous proposerons une interface syntaxe - s´emantique g´en´erique pour
les formalismes grammaticaux lexicalis´es dans laquelle les polarit´es joueront un rˆole moindre.
Dans le document
Étiquetage grammatical symbolique et interface syntaxe-sémantique des formalismes grammaticaux lexicalisés polarisés
(Page 71-75)