• Aucun résultat trouvé

Utilisation des compagnons dans les chaˆınes d’analyse syntaxique

a gauche dans la grammaire, et un seul 1

er

compagnon hypoth´etique `a droite qui est la polarit´e

composite ← attach´ee au traitcat : detdu nœud (0,3) de la description NC.

3.7 Utilisation des compagnons dans les chaˆınes d’analyse

syn-taxique

Nous concluons ce chapitre en montrant, dans cette section, l’int´erˆet concret des notions

que nous avons introduites (compagnons, compagnons potentiels et hypoth´etiques, r´eduction

et quasi-r´eduction des grammaires polaris´ees), pour les chaˆınes d’analyse syntaxique des

for-malismes grammaticaux polaris´es. Nous relions ces notions `a quatre applications : les tests de

correction et compl´etude d’une grammaire, l’am´elioration de la sp´ecificit´e des compagnons

hy-poth´etiques d’une grammaire pour l’analyse syntaxique, la d´etection d’incoh´erences dans une

grammaire et enfin l’int´egration des compagnons hypoth´etiques `a l’´etiquetage grammatical et `a

3.7. Utilisation des compagnons dans les chaˆınes d’analyse syntaxique 57

l’analyse syntaxique.

3.7.1 Correction et compl´etude d’une grammaire

Les compagnons hypoth´etiques fournissent un moyen de v´erification et d’exploration d’une

grammaire. Pour chaque objet polaris´e de la grammaire, les d´eveloppeurs de la grammaire

peuvent v´erifier quels sont ses compagnons hypoth´etiques `a gauche, `a droite ou des deux cˆot´es

indiff´eremment.

Cette possibilit´e est d’une grande aide lors des tests de correction et de compl´etude de la

grammaire. Les tests de compl´etude ont pour objectif de garantir que la grammaire produit

toutes les analyses attendues pour un ensemble de phrases. Dans l’id´eal, cet ensemble comprend

toutes les phrases du langage ; dans la r´ealit´e, on utilise une suite de tests repr´esentative comme

la TSNLP [LORP

+

96]. Au cours de ces tests, lorsque la grammaire ne produit pas une analyse

attendue pour une phrase, il peut s’av´erer difficile d’isoler la cause de cet ´echec.

Les tests de correction ont pour objectif de garantir que la grammaire ne produit pas d’analyse

incorrecte. Cela signifie que la grammaire ne reconnaˆıt pas comme grammaticale une phrase qui

ne l’est pas et qu’elle n’attribue `a une phrase grammaticale que les structures attendues.

3.7.2 Sp´ecificit´e des compagnons hypoth´etiques pour l’analyse syntaxique

V´erifier la liste des compagnons hypoth´etiques d’une polarit´e est ´egalement utile pour am´

elio-rer lasp´ecificit´edes compagnons hypoth´etiques d’une grammaire par rapport aux compagnons,

c’est-`a-dire au processus d’analyse. En statistique, la validit´e d’un test est d´etermin´ee par deux

valeurs. Lasensibilit´e est la capacit´e du test `a donner un r´esultat positif dans tous les cas r´

eel-lement positifs. La sp´ecificit´e est la capacit´e du test `a donner un r´esultat n´egatif dans tous les

cas r´eellement n´egatifs.

Dans notre cas, le test correspond au calcul des compagnons hypoth´etiques :

– lesvrais positifs(V P) sont les compagnons hypoth´etiques d’une polarit´e qui sont ´egalement

ses compagnons potentiels,

– les vrais n´egatifs (V N) sont les polarit´es qui ne sont pas des compagnons hypoth´etiques

et qui ne sont pas des compagnons potentiels,

– les faux positifs (F P) sont les compagnons hypoth´etiques d’une polarit´e qui ne sont pas

ses compagnons potentiels,

– lesfaux n´egatifs (F N) sont les polarit´es qui ne sont pas des compagnons hypoth´etiques et

qui sont des compagnons potentiels.

La sensibilit´e d’un test est

10

:

sensib= V P

V P+F N

La sp´ecificit´e d’un test est :

specif = V N

V N +F P

La d´efinition des compagnons hypoth´etiques implique que leur calcul ne produit aucun faux

n´egatif. Ce test a par cons´equent une sensibilit´e de 100%. A contrario, la sp´ecificit´e du

cal-cul des compagnons hypoth´etiques n’est pas garantie car les compagnons hypoth´etiques d’une

grammaire peuvent contenir plus ou moins de faux positifs.

Une fa¸con na¨ıve mais sˆure de d´etecter les faux positifs est d’examiner les ensembles de

compa-gnons hypoth´etiques des polarit´es de la grammaire, `a la recherche de compagnons hypoth´etiques

inattendus au regard des principes linguistiques qui sous-tendent la grammaire. Souvent, les faux

positifs sont produits par des structures initiales qui sont moins contraintes que dans l’intention

du grammairien. Deux cas de figure se pr´esentent alors :

– soit les autres structures de la grammaire compensent ce manque local de contrainte, et

la grammaire ne surg´en`ere pas,

– soit les autres structures ne compensent pas ce manque local de contrainte, et la grammaire

surg´en`ere.

Dans le premier cas, mˆeme si le manque de contrainte n’a pas d’impact sur le r´esultat, il a

un impact clair sur les performances du processus d’analyse car il augmente inutilement la taille

de l’espace de recherche. Dans les deux cas, il est possible que le grammairien ait ´et´e limit´e par

l’expressivit´e du formalisme qu’il utilise.

Le relev´e des faux positifs dans les compagnons hypoth´etiques d’une grammaire permet, dans

le meilleur des cas, de corriger la grammaire. Le cas ´ech´eant, ces observations peuvent ´egalement

sugg´erer des modifications dans la d´efinition du formalisme, afin par exemple d’en augmenter

l’expressivit´e.

3.7.3 D´etection d’incoh´erences dans une grammaire

Les compagnons hypoth´etiques permettent de calculer, pour toute grammaire lexicalis´ee

polaris´eeG, la grammaire quasi-r´eduiteG

0

qui lui est fortement ´equivalente. La grammaire

quasi-r´eduite est le sous-ensemble de la grammaire, tel que toute polarit´e de toute structure a au moins

un compagnon hypoth´etique dans la grammaire.

Or, il est rare qu’un linguiste ´ecrive intentionnellement une grammaire qui contienne des

structures orphelines, c’est-`a-dire une grammaire qui ne soit pas d’embl´ee quasi-r´eduite. Souvent,

ce cas de figure t´emoigne d’un oubli ou d’une erreur. Ces oublis ou erreurs sont d’autant plus

fr´equents, et la proc´edure de quasi-r´eduction de la grammaire est d’autant plus utile, que la

grammaire est de grande taille : plusieurs milliers de structures initiales pour les grammaires

LTAG [XTA95] et IG [Per07]. L’´ecriture de grammaires de cette taille peut ˆetre facilit´ee par

l’utilisation d’un compilateur de m´eta-grammaires [Can96,DLP05a]. Cependant, ce compilateur

ne v´erifie pas, et donc ne garantit aucunement, que la grammaire produite est quasi-r´eduite.

3.7. Utilisation des compagnons dans les chaˆınes d’analyse syntaxique 59

ressources linguistiques. Une v´erification automatique de la quasi-r´eduction est effectu´ee pour

toute nouvelle version de la grammaire FRIGRAM du fran¸cais. Cette v´erification s’est av´er´ee

ˆetre un indicateur fiable d’oubli ou d’erreur dans la grammaire.

3.7.4 Int´egration `a l’´etiquetage grammatical et `a l’analyse syntaxique

Les compagnons hypoth´etiques permettent ´egalement de guider l’´etiquetage grammatical et

l’analyse syntaxique. En particulier, toutes les polarit´es d’un ´etiquetage qui n’ont qu’un seul

com-pagnon hypoth´etique dans cet ´etiquetage peuvent ˆetre syst´ematiquement associ´ees ou compos´ees

avec ce compagnon. Ces compositions d´eterministes r´eduisent d’autant l’espace de recherche du

mod`ele.

Dans la deuxi`eme partie de ce manuscrit, nous utiliserons les notions de compagnons

hypo-th´etiques et de quasi-r´eduction d’une grammaire polaris´ee pour concevoir de nouvelles m´ethodes

de filtrage des ´etiquetages grammaticaux.

Conclusion

Dans ce chapitre, nous avons d´efini les notions de compagnon hypoth´etique d’une polarit´e

dans une grammaire et de grammaire polaris´ee quasi-r´eduite. Des notions similaires, plus fortes,

existent pour les formalismes GES codables en RCG. Les notions que nous d´efinissons sont

valables et peuvent ˆetre utilis´ees dans tout formalisme grammatical lexicalis´e polaris´e. Nous

avons pr´esent´e quelques utilisations possibles de ces notions pour la conception et la maintenance

de grammaires, ainsi que pour l’analyse syntaxique.

Dans la partieII, nous utiliserons ces notions pour concevoir de nouvelles m´ethodes de filtrage

des ´etiquetages grammaticaux, applicables l`a encore `a tout formalisme grammatical lexicalis´e

polaris´e. Dans la partieIII, nous proposerons une interface syntaxe - s´emantique g´en´erique pour

les formalismes grammaticaux lexicalis´es dans laquelle les polarit´es joueront un rˆole moindre.