4.4 Etiquetage symbolique par comptage de polarit´ ´ es
4.4.2 Filtrage par bilan de polarit´ es
L’invariant de van Benthem a ´et´e red´ecouvert et g´en´eralis´e `a tous les objets polaris´es, au
travers des travaux sur lefiltrage par bilan de polarit´es [BGP04,BLRP06]. Dans les formalismes
grammaticaux polaris´es, le comptage peut ˆetre d´efini de fa¸con plus directe que pour les types
compos´es.
D´efinition 4.4.2 (Comptage des objets polaris´es). Pour tout type d’objet polaris´ex, on d´efinit
le comptage de x, not´e #
x(a), de toute structure a d’une grammaire comme le r´esultat de la
somme suivante :
– chaque objet de aqui est de type x et polaris´e positivement (+) compte pour +1,
– chaque objet de aqui est de type x et polaris´e n´egativement (−) compte pour −1,
– tout autre objet de acompte pour 0.
Les travaux sur le filtrage par bilan de polarit´es font essentiellement cinq contributions.
Premi`erement, le cadre d’application de la m´ethode de filtrage est agrandi pour inclure
diff´erents formalismes grammaticaux. Il suffit en effet, pour pouvoir appliquer le filtrage par
bilan de polarit´es `a un formalisme, de d´efinir unmorphisme de polarisation pour ce formalisme
grammatical.
Deuxi`emement, la m´ethode de filtrage est g´en´eralis´ee afin de pouvoir s’appliquer `a d’autres
objets que de simples multi-ensembles d’objets polaris´es. Il est possible de d´efinir diff´erents
morphismes d’abstraction pour chaque formalisme, qui conservent une plus ou moins grande
partie de l’information contenue dans les structures du formalisme. Le filtrage par bilan de
polarit´es«classique»implique alors l’application pr´ealable d’un morphisme de destructuration,
not´edestr, qui oublie l’information structurelle et transforme les structures de la grammaire en
multi-ensembles d’objets polaris´es.
Troisi`emement, le comptage est g´en´eralis´e `a tous les types d’objets polaris´es. Par exemple,
dans le cadre des IG, ce ne sont pas seulement les cat´egories qui sont polaris´ees, mais tous les
traits.
Quatri`emement, afin de g´erer l’ind´eterminisme, le comptage utilise une arithm´etique
d’in-tervalles. Par exemple, la valeur d’un trait dans une DAP de IG peut ˆetre une disjonction de
valeurs atomiques, comme dans le trait polaris´e cat → n|np|s. Ce trait contribue alors, aux
trois comptages de polarit´es pour les traitscat : n,cat : npetcat : s, un intervalle [0,+1]
qui indique que, selon la valeur de trait qui sera s´electionn´ee par l’analyse (n,npou s), ce trait
contribuera +1 dans un comptage et 0 dans les deux autres.
Cinqui`emement, l’implantation des comptages est faite sur automates. Ainsi, chaque
comp-tage est fait non pas sur un ´etiquetage grammatical, mais sur l’ensemble des ´etiquetages
gram-maticaux, et le comptage global correspond alors `a l’intersection des automates de comptage de
4.4. ´Etiquetage symbolique par comptage de polarit´es 75
chaque polarit´e.
Note La notion de morphisme, et en particulier demorphisme d’abstraction pr´esente dans le
deuxi`eme point, est importante. Un morphisme d’abstraction permet en effet de transformer
une grammaireGen une autre grammaireG
0plus simple et qui engendre un langage strictement
plus grand :L
G⊆ L
0G
. Nous exploiterons de nouveau cette possibilit´e dans le prochain chapitre.
Conclusion
Dans ce chapitre, nous avons abord´e le probl`eme pos´e par la phase d’´etiquetage
grammati-cal dans les formalismes lexigrammati-calis´es. Nous avons d´evelopp´e l’approche symbolique dans laquelle
l’´etiquetage grammatical d’une phrase est un probl`eme de filtrage de l’ensemble des ´etiquetages
possibles. Nous avons enfin pr´esent´e les m´ethodes d’´etiquetage symbolique existantes pour les
formalismes polaris´es. Ces m´ethodes comptent les polarit´es afin d’´eliminer tous les ´etiquetages
d´es´equilibr´es, qui n’ont aucune chance de produire une analyse. Dans les deux prochains
cha-pitres, nous pr´esenterons de nouvelles m´ethodes de filtrage des ´etiquetages grammaticaux pour
les formalismes polaris´es. Ces m´ethodes exploitent la notion de compagnon hypoth´etique d’une
polarit´e dans une grammaire que nous avons pr´esent´ee au chapitre 3.
Chapitre 5
Filtrage bool´een des ´etiquetages
grammaticaux fond´e sur les
compagnons
Au chapitre3, nous avons introduit la notion de compagnon hypoth´etique et nous l’avons
uti-lis´ee pour d´efinir la quasi-r´eduction d’une grammaire polaris´ee. Nous avons vu au chapitre4que
la premi`ere phase de l’analyse syntaxique, l’´etiquetage grammatical, correspond `a la selection
d’une grammaire restreinte. Dans ce chapitre, nous utilisons cette correspondance entre ´
etique-tage grammatical et s´election d’une grammaire, pour d´eriver de l’id´ee de quasi-r´eduction d’une
grammaire polaris´ee un principe de filtrage des ´etiquetages grammaticaux pour les formalismes
lexicalis´es polaris´es : le principe du compagnonnage.
En section5.1, nous formulons le principe du compagnonnage et nous montrons que ce
prin-cipe peut ˆetre utilis´e pour filtrer les ´etiquetages grammaticaux. Nous montrons en section 5.2
que ce principe permet un filtrage efficace, car il d´efinit un langage r´egulier qui est une
approxi-mation surensembliste des ´etiquetages grammaticaux qui ont une solution. Nous montrons enfin
comment utiliser concr`etement le principe du compagnonnage pour filtrer les ´etiquetages
gram-maticaux, en utilisant des bool´eens. Pour cela, nous proposons deux implantations sur automates
du filtrage des ´etiquetages fond´e sur le principe du compagnonnage : une m´ethode exacte dans
la section5.3 et une m´ethode approxim´ee dans la section5.4.
5.1 Principe du compagnonnage
Dans le document
Étiquetage grammatical symbolique et interface syntaxe-sémantique des formalismes grammaticaux lexicalisés polarisés
(Page 89-92)