• Aucun résultat trouvé

4.2 Patrons Structurels Flous pour la repr´esentation de symboles

4.2.3 Exploitation des PSF

4.2.3.1 Hypoth`eses de r´ef´erences

Consid´erons un symboleS que l’on cherche `a reconnaˆıtre, repr´esent´e par son signal en- ligne. S est constitu´e de N trac´es naturels : S = t1..tN, o`u chaque trac´e est une suite de

points ti = p1i, p2i, .., pkii. L’extraction d’hypoth`eses de r´ef´erences consiste `a trouver dans S

des portions de trac´es qui forment de « bonnes » r´ef´erences pour d´ecrire le positionnement des ´el´ements de sa structure. Pour cela, nous d´etectons d’abord un certain nombre de points d’int´erˆet du trac´e, puis nous trions les portions de trac´e d´elimit´ees par ces points en fonction du crit`ere exprim´e `a l’´equation (4.1).

Extraction de points d’int´erˆet A partir du trac´e de S, nous cherchons `a extraire certains points particuliers du trac´e : ce sont des points suppos´es d´elimiter des portions de trac´es constituant de « bonnes » r´ef´erences. La recherche des points particuliers est faite ind´ependamment pour la recherche de r´ef´erences horizontales d’une part, verticales d’autre part. Les points de d´ebut et de fin de chaque trac´e naturel constituent un premier ensemble de points d’int´erˆet (il s’agit des points p1i et pki

i ). Nous extrayons aussi les points du symbole

d’abscisse et d’ordonn´ee minimales et maximales. Enfin, nous appliquons sur chaque trac´e naturel tiun algorithme d’approximation polygonale (directement appliqu´e d’apr`es [PV93]).

L’approximation polygonale `a n segments de droite du trac´e ti d´etermine n− 1 sommets

internes au trac´e qui d´efinissent des points d’int´erˆet de ti. Le nombre de segments de droite

dans l’approximation est d´etermin´e par un seuil relatif sur l’erreur d’approximation du trac´e. n est donc augment´e progressivement jusqu’`a ce que la r´eduction de l’erreur par rapport `

a l’approximation `a n− 1 segments soit inf´erieure au seuil fix´e. En moyenne le nombre n retenu varie entre 1 (lorsque ti est suffisamment rectiligne) et 5 environ pour les trac´es les

plus complexes constat´es. Cette m´ethode de d´etection de points singuliers s’est av´er´ee plus stable par rapport `a des essais conduits avec des m´ethodes bas´ees sur des variations locales de formes (obtenus par exemple par la m´ethode de Rosenfeld [RJ73]).

L’ensemble de tous les points d’int´erˆet extraits pour la recherche de r´ef´erences horizon- tales et verticales sont not´es {qx

i} et {qiy}, respectivement. Si plusieurs points qi extraits

sont identiques ou trop proches, ils sont fusionn´es en un seul point d’int´erˆet moyen. Constitution d’hypoth`eses de r´ef´erences Les combinaisons de points d’int´erˆet pris deux `a deux d´efinissent des portions de trac´es qui sont des hypoth`eses de r´ef´erences ho- rizontales ou verticales. Pour limiter le nombre d’hypoth`eses, toutes les combinaisons de points de{qi} ne sont pas autoris´ees. Si le point d’int´erˆet qacorrespond au point pjiaa (point

d’indice ja sur le trac´e tia) et qb au point p

jb

ib (point d’indice jb sur un autre trac´e tjb), on

d´efinit la r´ef´erence associ´ee par le plus court chemin reliant les deux points ind´ependamment de l’ordre des trac´es. Certaines hypoth`eses de r´ef´erence sont alors exclues si le chemin qui les relie emprunte des sauts trop importants entre les trac´es. Si ia = ib, les deux points

proviennent du mˆeme trac´e naturel tia et la paire (qa, qb) d´efinit une portion de tia qui est

consid´er´ee comme une hypoth`ese de r´ef´erence acceptable. Sinon, on v´erifie que la somme des distances entre les extr´emit´es des trac´es constituant le meilleur chemin de qa `a qb est

inf´erieure `a un seuil Dmax. Enfin, on interdit `a une portion de trac´e de r´ef´erence de com-

mencer sur une fin de trac´e naturel ou de terminer sur un d´ebut de trac´e naturel. Toutes les paires de points qui respectent ces quatre conditions d´efinissent les hypoth`eses de r´ef´erences admissibles.

Tri et s´election des hypoth`eses Les hypoth`eses de r´ef´erences {qx

a, qbx} sont tri´ees selon

qui couvrent le reste du symbole dans toute sa dimension horizontale ou verticale. Les deux listes d’hypoth`eses de r´ef´erences horizontales Lx et verticales Ly sont tri´ees selon ce crit`ere

et limit´ees `a un nombre maximal d’hypoth`eses.

Exemples Le tableau de la figure 4.10pr´esente quelques exemples de r´ef´erences horizon- tales et verticales extraites pour diff´erents exemples de symboles manuscrits et tri´ees de gauche `a droite par score d´ecroissant. Les portions de trac´es r´ef´erences sont repr´esent´ees en rouge. Les exemples mis en ´evidence par un encadr´e illustrent la capacit´e de la m´ethode `a isoler des r´ef´erences en fragmentant ou en connectant plusieurs trac´es naturels.

4.2.3.2 Segmentation guid´ee par les mod`eles spatiaux

Etant donn´e un couple de trac´es de r´ef´erences (rx, ry)∈ Lx×Ly, on noteS|xy le reste du

trac´e du symboleS. S|xy contient tous les ´el´ements de trac´e deS qui ne sont pas couverts

par l’une des deux r´ef´erences rx et ry.

Supposons que l’on cherche `a calculer la valeur d’ad´equation entreS muni des deux r´e- f´erences rxet ry et un psfT comportant n composants. Pour pouvoir assigner les ´el´ements

de S|xy aux diff´erents composants de T , il est d’abord n´ecessaire de d´eterminer une seg-

mentation possible des trac´es deS|xy. En effet, `a ce stadeS|xy contient des trac´es naturels

(tels qu’ils ont ´et´e saisis par le scripteur), ainsi que d’´eventuels r´esidus de trac´es r´esultant de l’extraction des r´ef´erences rx et ry. L’objectif de cette ´etape est d’identifier dans S|xy

des points de segmentation potentiels. A cause de la variabilit´e des habitudes d’´ecriture, un mˆeme trac´e naturel doit parfois ˆetre segment´e car il correspond `a la saisie de plusieurs ´el´ements de la structure connect´es entre eux. Il faut donc d´eterminer en quels points deS|xy

les trac´es peuvent ˆetre segment´es. Classiquement, la recherche de points de segmentation passe par la d´etection de points d’int´erˆet dans la forme des trac´es. Ce type de m´ethode repose sur une analyse locale des formes, sans prise en compte du contexte de leur posi- tionnement. Dans notre approche, au contraire, nous exploitons la capacit´e pr´edictive des m´eta-mod`eles de positionnement pour formuler ces hypoth`eses de segmentation : on parle alors de segmentation guid´ee par le contexte spatial des trac´es.

Etant donn´ee la s´election au pr´ealable d’un couple de r´ef´erences (rx, ry), il est possible

d’appliquer les m´eta-mod`eles spatiaux des diff´erents composants du psf sur ces r´ef´erences. Ils d´efinissent n mod`eles spatiaux bipolaires µMi({r

x, ry}), i = 1..n qui peuvent ˆetre ´evalu´es

en tout point de l’espace du trac´e. Pour rappel, en un point p du plan, µMi({r

x, ry})(p)

exprime le degr´e (bipolaire) d’ad´equation de p avec la relation spatiale Mi. Ce score est

´elev´e si p est positionn´e par rapport `a (rx, ry) conform´ement au i`eme composant dans le

mod`ele de psf.

En supposant que S|xy corresponde bien au trac´e du symbole repr´esent´e par le psf,

il doit ˆetre possible de localiser des ´el´ements de trac´es dans chacune des zones de « bon » positionnement d´efinies par les m´eta-mod`eles appliqu´es aux r´ef´erences. En s’appuyant sur ce principe, la recherche des fronti`eres entre les diff´erents ´el´ements `a segmenter dansS|xy peut

se concentrer sur les zones du trac´e o`u l’on constate un changement de mod`ele dominant. On peut calculer l’ad´equation de chaque point p du trac´e deS|xy avec chaque mod`eleMi.

Le mod`ele j avec lequel p a le meilleur degr´e d’ad´equation est le mod`ele dominant au point p, on note alorsM∗(p) =Mj.

hypoth`eses de r´ef´erences horizontales hypoth`eses de r´ef´erences verticales

Figure 4.10: Visualisation des 5 meilleures hypoth`eses de r´ef´erences horizontales et verti- cales pour diff´erents exemples de symboles. Les trac´es r´ef´erences sont repr´esent´es en rouge. Les exemples encadr´es illustrent diff´erents cas de r´ef´erences constitu´ees par segmentation ou connexion des trac´es originaux.

Si en parcourant les points d’un trac´e de S|xy on observe un changement du mod`ele

dominant, on peut faire la supposition que le trac´e t est constitu´e en r´ealit´e de plusieurs ´el´ements de la structure qu’il faut segmenter. Le point estim´e de changement du mod`ele dominant est alors consid´er´e comme un point de segmentation potentiel.

Soit t = p1..pk un trac´e de S|xy, on consid`ere que le point pi de t est un point de

segmentation potentiel si les conditions suivantes sont v´erifi´ees :      M∗(pi−δ) =M(pi−..) =M(pi−1) =Ma

M∗(pi+1) =M(pi+..) =M(pi+δ) =M b

a6= b,

(4.14)

avec δ∈ {2, 3, ..}. Le param`etre δ permet de contrˆoler la stabilit´e du changement de mod`ele dominant (sa valeur minimale est de 2). Selon cette strat´egie, un point de segmentation potentiel est envisag´e d`es qu’un changement durable de mod`ele spatial dominant est d´etect´e. Les points de d´ebut et de fin de trac´e naturel (p1, pk) sont ´egalement consid´er´es comme des points de segmentation potentiels.

(a) (b) (c)

(d) (e) (f)

Figure 4.11: Exemple de trac´e `a segmenter (a) et application des 3 mod`eles spatiaux du psf correspondant sur une paire de r´ef´erences (surimpos´ees en violet) (b). Les 3 mod`eles spatiaux sont repr´esent´es isol´ement (d, e, f). La figure (c) repr´esente une carte des mod`eles dominants, en trois niveaux de gris diff´erents pour les trois mod`eles. Les ´el´ements de trac´e `

a segmenter sont color´es selon le mod`ele dominant en chaque point.

La figure 4.11 d´ecrit le principe de segmentation des trac´es guid´es par les mod`eles spatiaux sur un exemple de caract`ere chinois `a reconnaˆıtre (image (a)). Le psf correspondant comporte trois composants, qui sont repr´esent´es par trois m´eta-mod`eles de positionnement spatial. La figure (b) repr´esente l’union des trois mod`eles spatiaux obtenus par application de ces m´eta-mod`eles sur une paire de r´ef´erences. Le reste du caract`ere est compos´e de

deux trac´es manuscrits. La repr´esentation de l’image (c) permet de mettre en ´evidence en diff´erents niveaux de gris les zones de dominance des trois mod`eles. Les portions de trac´es sont color´ees en fonction du mod`ele dominant en chacun de leur point. Les points de segmentation obtenus sont dans ce cas les extr´emit´es des trac´es et le point de changement de couleur du trac´e (c).

L’avantage de cette strat´egie de segmentation est la prise en compte du contexte de positionnement des trac´es. Les hypoth`eses de segmentation sont formul´ees en fonction de la forme des r´ef´erences et de mod`eles spatiaux, appris `a partir de donn´ees, qui traduisent la variabilit´e du positionnement des diff´erents ´el´ements de la structure. En pratique, cela se traduit par une extraction de points de segmentation diff´erents en fonction du psf qui est appliqu´e sur un mˆeme symbole `a reconnaˆıtre. Le principe de segmentation revient en effet `a laisser chaque mod`ele spatial d’un psf appris s´electionner les ´el´ements de trac´es qui semblent lui revenir, d’apr`es leur positionnement. L’information utilis´ee pour segmenter les trac´es repose donc sur une vision globale du symbole et de sa structure, plutˆot que sur une information locale relative `a la forme des trac´es.