• Aucun résultat trouvé

4.4 Etiquetage symbolique par comptage de polarit´ ´ es

4.4.2 Filtrage par bilan de polarit´ es

L’invariant de van Benthem a ´et´e red´ecouvert et g´en´eralis´e `a tous les objets polaris´es, au

travers des travaux sur lefiltrage par bilan de polarit´es [BGP04,BLRP06]. Dans les formalismes

grammaticaux polaris´es, le comptage peut ˆetre d´efini de fa¸con plus directe que pour les types

compos´es.

D´efinition 4.4.2 (Comptage des objets polaris´es). Pour tout type d’objet polaris´ex, on d´efinit

le comptage de x, not´e #

x

(a), de toute structure a d’une grammaire comme le r´esultat de la

somme suivante :

– chaque objet de aqui est de type x et polaris´e positivement (+) compte pour +1,

– chaque objet de aqui est de type x et polaris´e n´egativement (−) compte pour −1,

– tout autre objet de acompte pour 0.

Les travaux sur le filtrage par bilan de polarit´es font essentiellement cinq contributions.

Premi`erement, le cadre d’application de la m´ethode de filtrage est agrandi pour inclure

diff´erents formalismes grammaticaux. Il suffit en effet, pour pouvoir appliquer le filtrage par

bilan de polarit´es `a un formalisme, de d´efinir unmorphisme de polarisation pour ce formalisme

grammatical.

Deuxi`emement, la m´ethode de filtrage est g´en´eralis´ee afin de pouvoir s’appliquer `a d’autres

objets que de simples multi-ensembles d’objets polaris´es. Il est possible de d´efinir diff´erents

morphismes d’abstraction pour chaque formalisme, qui conservent une plus ou moins grande

partie de l’information contenue dans les structures du formalisme. Le filtrage par bilan de

polarit´es«classique»implique alors l’application pr´ealable d’un morphisme de destructuration,

not´edestr, qui oublie l’information structurelle et transforme les structures de la grammaire en

multi-ensembles d’objets polaris´es.

Troisi`emement, le comptage est g´en´eralis´e `a tous les types d’objets polaris´es. Par exemple,

dans le cadre des IG, ce ne sont pas seulement les cat´egories qui sont polaris´ees, mais tous les

traits.

Quatri`emement, afin de g´erer l’ind´eterminisme, le comptage utilise une arithm´etique

d’in-tervalles. Par exemple, la valeur d’un trait dans une DAP de IG peut ˆetre une disjonction de

valeurs atomiques, comme dans le trait polaris´e cat → n|np|s. Ce trait contribue alors, aux

trois comptages de polarit´es pour les traitscat : n,cat : npetcat : s, un intervalle [0,+1]

qui indique que, selon la valeur de trait qui sera s´electionn´ee par l’analyse (n,npou s), ce trait

contribuera +1 dans un comptage et 0 dans les deux autres.

Cinqui`emement, l’implantation des comptages est faite sur automates. Ainsi, chaque

comp-tage est fait non pas sur un ´etiquetage grammatical, mais sur l’ensemble des ´etiquetages

gram-maticaux, et le comptage global correspond alors `a l’intersection des automates de comptage de

4.4. ´Etiquetage symbolique par comptage de polarit´es 75

chaque polarit´e.

Note La notion de morphisme, et en particulier demorphisme d’abstraction pr´esente dans le

deuxi`eme point, est importante. Un morphisme d’abstraction permet en effet de transformer

une grammaireGen une autre grammaireG

0

plus simple et qui engendre un langage strictement

plus grand :L

G

⊆ L

0

G

. Nous exploiterons de nouveau cette possibilit´e dans le prochain chapitre.

Conclusion

Dans ce chapitre, nous avons abord´e le probl`eme pos´e par la phase d’´etiquetage

grammati-cal dans les formalismes lexigrammati-calis´es. Nous avons d´evelopp´e l’approche symbolique dans laquelle

l’´etiquetage grammatical d’une phrase est un probl`eme de filtrage de l’ensemble des ´etiquetages

possibles. Nous avons enfin pr´esent´e les m´ethodes d’´etiquetage symbolique existantes pour les

formalismes polaris´es. Ces m´ethodes comptent les polarit´es afin d’´eliminer tous les ´etiquetages

d´es´equilibr´es, qui n’ont aucune chance de produire une analyse. Dans les deux prochains

cha-pitres, nous pr´esenterons de nouvelles m´ethodes de filtrage des ´etiquetages grammaticaux pour

les formalismes polaris´es. Ces m´ethodes exploitent la notion de compagnon hypoth´etique d’une

polarit´e dans une grammaire que nous avons pr´esent´ee au chapitre 3.

Chapitre 5

Filtrage bool´een des ´etiquetages

grammaticaux fond´e sur les

compagnons

Au chapitre3, nous avons introduit la notion de compagnon hypoth´etique et nous l’avons

uti-lis´ee pour d´efinir la quasi-r´eduction d’une grammaire polaris´ee. Nous avons vu au chapitre4que

la premi`ere phase de l’analyse syntaxique, l’´etiquetage grammatical, correspond `a la selection

d’une grammaire restreinte. Dans ce chapitre, nous utilisons cette correspondance entre ´

etique-tage grammatical et s´election d’une grammaire, pour d´eriver de l’id´ee de quasi-r´eduction d’une

grammaire polaris´ee un principe de filtrage des ´etiquetages grammaticaux pour les formalismes

lexicalis´es polaris´es : le principe du compagnonnage.

En section5.1, nous formulons le principe du compagnonnage et nous montrons que ce

prin-cipe peut ˆetre utilis´e pour filtrer les ´etiquetages grammaticaux. Nous montrons en section 5.2

que ce principe permet un filtrage efficace, car il d´efinit un langage r´egulier qui est une

approxi-mation surensembliste des ´etiquetages grammaticaux qui ont une solution. Nous montrons enfin

comment utiliser concr`etement le principe du compagnonnage pour filtrer les ´etiquetages

gram-maticaux, en utilisant des bool´eens. Pour cela, nous proposons deux implantations sur automates

du filtrage des ´etiquetages fond´e sur le principe du compagnonnage : une m´ethode exacte dans

la section5.3 et une m´ethode approxim´ee dans la section5.4.

5.1 Principe du compagnonnage