Recherche de l’assignement optimal des segments

4.2 Patrons Structurels Flous pour la repr´esentation de symboles

4.2.3 Exploitation des PSF

4.2.3.3 Recherche de l’assignement optimal des segments

Les points de segmentation potentiels qui ont été définis au paragraphe précédent par l’application des modèles spatiaux définissent une suite de N éléments indivisibles S|xy = s1...sN. La mise en correspondance de ces éléments avec les composants du psf

impose la résolution d’un problème d’optimisation combinatoire. Il s’agit de trouver σ∗, le meilleur assignement possible des N segments vers les n composants (le terme d’assignement est utilisé abusivement, car comme nous l’avons présenté à la section 4.2.2.2, la fonction σ peut être non couvrante et incomplète). Les assignements sont évalués par la fonction d’adéquation s dont le calcul a été schématisé à la figure 4.9.

Nous proposons de résoudre le problème combinatoire par un algorithme bien connu de séparation et évaluation (aussi souvent appelé en anglais : branch and bound ). Le principe de l’algorithme est de construire l’arbre des assignements possibles progressivement, en éli- minant dynamiquement certaines branches dont on peut affirmer qu’elles ne conduisent pas `

a la meilleure solution. Le calcul d’une fonction d’évaluation (fonction de bounding) permet d’estimer une borne supérieure sur le score qu’il est possible d’atteindre dans chaque branche inexplorée. Si le résultat de cette estimation optimiste de l’exploration d’une branche est moins bon que le score d’une solution réelle déjà trouvée, l’exploration de toute la branche peut être abandonnée. La phase de séparation (ou branching) consiste à subdiviser le pro- blème d’assignement en sous-problèmes, c’est-à-dire à compléter un assignement partiel avec une nouvelle association (tracé, composant).

Fonction de bounding La fonction de score que l’on cherche à optimiser est le résultat global s(_{S, T , r}x, rx, σi) déterminé par le mécanisme de fusion complet (voir la figure 4.9).

La fonction de bounding doit v´erifier les conditions suivantes : 

   

g(Hi)as(S, T , (rx, rx), Hi∗) pour tout nœud Hi de l’arbre

g(Hi) = s(S, T , (rx, rx), Hi) pour toute feuille Hi de l’arbre

g(Hi)ag(Hj) si Hj est le nœud p`ere de Hi,

avec H_i∗ le meilleur assignement possible obtenu dans le sous-arbre de Hi. La fonction g

estime donc une borne supérieure du score s qu’il est possible d’atteindre en explorant la branche portée par un assignement partiel Hi. Supposons qu’à un moment donné de

l’exploration de l’arbre, on a déjà trouvé une solution admissible σ1 dont le score vaut

s1 = s(S, T , (rx, rx), σ1). Si pour un nœud Hi dont le sous-arbre n’a pas encore été exploré,

on a g(Hi) < s1, alors on sait que l’exploration du sous-arbre de Hi peut être évitée.

La fonction de bounding doit constituer un bon compromis entre la précision de l’estimation qu’elle fournit et le coût de son calcul. Si elle est trop grossière, elle sera moins efficace et ne permettra pas d’élaguer de grandes parties de l’arbre de recherche. A l’inverse, si elle est très précise, son calcul risque de générer une complexité élevée.

Le probl`eme est donc de construire, `a partir d’un assignement partiel Hi, un majorant

simple et aussi proche que possible du score du meilleur assignement complet H_i∗ au sens de la fonction de fusion globale présentée au paragraphe 4.2.2.2. On se sert du fait que l’opérateur de combinaison⊗ est monotone vis-à-vis de l’ordre total ≺a défini par (4.12),

c’est-`a-dire :

∀a, b, c ∈ L, a ≺ab => a⊗ c ≺a b⊗ c. (4.16)

De la même fa¸con, on peut exploiter la propriété suivante pour l’opérateur• :

∀a, b ∈ L, λ ∈ R, a ≺ab => λ• a ≺aλ• b. (4.17)

Ces propri´et´es garantissent que la recherche d’un majorant global pour s(S, T , (rx, rx), Hi∗)

peut se limiter `a majorer chacun de ses termes dans le calcul de la fusion globale (d´ecrit au paragraphe 4.2.2.2). Pour un assignement partiel Hi = {i1.., im,−1.. − 1}, les m premiers

éléments de tracés sont déjà assignés à des composants du psf. Les N−m éléments restants à assigner sont attribués au composant pour lequel leur score d’adéquation de positionnement est le meilleur. Toutefois, si ce score est inférieur à la constante de pénalisation c0 pour

un tracé résiduel, le tracé n’est pas assigné. Le score de fusion globale est majoré en ne tenant pas compte des pénalisations pour les éléments non assignés, ni pour les modèles non couverts (le poids de ces éléments dans la fusion est reversé vers le composant ayant le meilleur score si). Enfin, tous les scores d’étendue E sont majorés par leur valeur maximale

théorique, c’est-à-dire le score bipolaire < 1; 0 >. Ceci retarde l’évaluation des scores E uniquement aux feuilles de l’arbre, lorsque l’assignement Hi est complètement défini. La

raison de ce choix est que les scores E ne sont pas additifs : cela signifie que l’on ne peut pas donner un bon estimateur de E(_{Si, Sj}) `a partir de E({Si}). En revanche, les scores

effectifs des positionnements et des étendues des références comme des rva sont utilisés dans tous les calculs de g(Hi), puisqu’ils ne dépendent pas de l’assignement σ cherché.

Finalement, pour l’évaluation d’une feuille de l’arbre, la fonction g est équivalente à la mise en œuvre de la fusion globale.

Recherche d’une solution initiale La performance de l’algorithme dépend en partie de sa capacité à définir une bonne solution initiale σ0. Dans le cas particulier de la recon-

naissance de symboles par psf, l’algorithme est déroulé successivement sur différents choix de références rx, ry et sur différents prototypes de psf (pour la recherche du meilleur score

global de correspondance). Le score de la meilleure solution trouvée pour tous les choix de références et tous les psf est connu et l’algorithme se contente donc d’explorer les branches de l’arbre potentiellement meilleures que cette meilleure solution. De ce fait, on dispose à

toutes les exécutions de l’algorithme (sauf la première) d’un score faisable de bonne qualité. Par ailleurs, une partie du calcul de g repose sur les informations des scores des références qui sont déjà connus avant le déroulement de l’algorithme. Ces éléments participent donc `

a l’élagage des branches de l’arbre. En particulier un score de références très faible peut conduire rapidement à élaguer de grandes parties de l’arbre, voire tout l’arbre (c’est alors un rejet implicite de ce choix de références).

4.2.3.4 Synth`ese

La stratégie de recherche de la meilleure segmentation d’un symbole par rapport à un psf permet de mettre en œuvre la formalisation du calcul présenté à la section4.2.2. Les points essentiels de cette mise en œuvre résident dans la méthode originale consistant à guider les hypothèses de segmentation des tracés à partir des modèles de leur positionnement qui sont développés sur les hypothèses de références choisies. Cette segmentation se fait donc en fonction du modèle appris et en respectant la forme particulière des références du symbole. Le guidage de la segmentation s’appuie aussi sur une vision globale de la structure du symbole, par opposition aux méthodes de détection de points singuliers qui sont plus locales. Il en découle une capacité à détecter des points de segmentation indétectables par l’analyse de forme du tracé. La fonction d’assignement des segments permet d’associer différents segments au même composant d’un psf, ce qui autorise par exemple la gestion de tracés en pointillés. Par ailleurs, une souplesse est introduite afin de tolérer le calcul de scores de correspondance même en l’absence de certains composants ou en présence d’éléments surnuméraires.

Dans le document Méta-modèles de positionnement spatial pour la reconnaissance de tracés manuscrits (Page 146-148)