• Aucun résultat trouvé

D´efinition du r´ef´erentiel de positionnement

4.2 Patrons Structurels Flous pour la repr´esentation de symboles

4.2.1 D´efinition du r´ef´erentiel de positionnement

Tel que nous l’avons d´efini de fa¸con informelle, un psf est un mod`ele structurel reposant sur un ensemble de m´eta-mod`eles spatiaux qui d´ecrivent l’organisation relative des com- posants de la structure. Nous avons introduit en d´etail dans le chapitre 3 les principes de construction et d’exploitation des m´eta-mod`eles spatiaux qui permettent de mod´eliser le positionnement relatif d’un objet par rapport `a un autre. Pour l’apprentissage comme pour l’exploitation d’un m´eta-mod`ele spatial, nous avions jusqu’ici toujours consid´er´e que la d´e- finition de l’objet de r´ef´erence ´etait connue et qu’elle n’´etait pas remise en cause. Nous nous int´eressons ici `a la d´efinition du r´ef´erentiel de description du positionnement des ´el´ements de la structure des symboles. Diff´erents choix sont `a faire pour d´efinir sur quel(s) objet(s) de r´ef´erence les m´eta-mod`eles spatiaux doivent ˆetre construits et appliqu´es au sein du psf. 4.2.1.1 R´ef´erentiel concret

Dans le cas des psf, qui ont vocation `a repr´esenter la structure de n’importe quel type de symbole, il faut d´efinir une strat´egie pour d´eterminer dans quel r´ef´erentiel va ˆetre d´ecrit le positionnement des ´el´ements de la structure. La qualit´e de description permise par les m´eta-mod`eles spatiaux provient en premier lieu de leur adaptation aux formes des trac´es manuscrits. Comme nous l’avons d´ej`a mis en ´evidence, cette propri´et´e permet de ne pas sacrifier la forme des objets dans la description de leur positionnement relatif et de prendre

en compte les particularit´es du trac´e manuscrit. De plus, un mod`ele de positionnement sera d’autant plus pr´ecis et informatif que la forme de la r´ef´erence est riche et singuli`ere. Pour ces raisons, il apparaˆıt que le choix du r´ef´erentiel de positionnement au sein d’un psf doit n´ecessairement se porter vers des portions du trac´e r´eel saisi par le scripteur. Les objets d´efinissant la r´ef´erence de positionnement doivent ˆetre des ´el´ements du symbole manuscrit : on parle de r´ef´erence concr`ete, par opposition `a un r´ef´erentiel virtuel qui pourrait ˆetre d´efini par des ´el´ements tels que la boˆıte englobante du trac´e ou encore des axes d´efinissant un rep`ere sur le centre de gravit´e du symbole.

Nous avons montr´e en fin de chapitre 3 que les m´eta-mod`eles spatiaux permettent de d´ecrire un large spectre de cat´egories de relations spatiales. En particulier, le positionne- ment relatif de trac´es simples peut ˆetre pr´ecis´ement d´ecrit, y compris dans des situations d’intersection ou d’adjacence des deux objets, lorsqu’ils sont distants ou encore quand l’un est entour´e par l’autre. . . Cette capacit´e permet donc de consid´erer que les r´ef´erences sont partie prenante du symbole, et ce quelle que soit la complexit´e de la structure ou l’intrication de ses ´el´ements manuscrits.

Enfin, contrairement `a certains descripteurs spatiaux qui ne peuvent ˆetre exploit´es que sur des trac´es rectilignes ou en arc de cercle, la capacit´e des m´eta-mod`eles spatiaux `a s’adapter `a toute forme d’objet permet de ne pas imposer de contrainte de forme, de taille ou encore de complexit´e graphique dans le choix des r´ef´erences. Cela autorise donc une parfaite g´en´ericit´e dans les possibilit´es de symboles d´ecrits.

4.2.1.2 Choix d’un r´ef´erentiel global

La question du nombre et de la s´election des ´el´ements manuscrits de r´ef´erence, ainsi que du nombre de mod`eles spatiaux, se pose ´egalement. Il s’agit de d´ecider si le positionnement des ´el´ements de structure doit ˆetre d´ecrit pour tous par rapport `a une r´ef´erence unique (globale), ou bien par rapport `a tous les autres ´el´ements, ou encore par rapport `a certains ´el´ements s´electionn´es (par exemple les plus proches, les plus grands, les plus stables. . .).

Il convient de limiter la complexit´e de la repr´esentation tout en garantissant une bonne description du positionnement de tous les ´el´ements de la structure. La solution la plus com- pl`ete, qui consiste `a d´ecrire le positionnement de tous les ´el´ements par rapport `a tous les autres, est ´ecart´ee d’embl´ee car elle conduit `a une complexit´e d´eraisonnable pour l’exploita- tion des psf et surtout `a une repr´esentation inadapt´ee de la structure. En effet, le nombre d’´el´ements pouvant se chiffrer `a une dizaine (voire plus), l’explosion combinatoire engendr´ee par la recherche du meilleur appariement entre une structure `a reconnaˆıtre et un psf de- vient difficile `a g´erer. Surtout, la description compl`ete de toutes les relations spatiales entre les ´el´ements pris deux `a deux n’est en g´en´eral pas pertinente. En effet, il existe souvent des ´el´ements pr´egnants, qui exercent un rˆole dominant pour la perception de la structure. Les autres ´el´ements sont alors positionn´es avant tout par rapport `a ces ´el´ements pr´egnants, plutˆot que par rapport `a tous les autres.

Le caract`ere chinois (e) de la figure 4.1 comporte deux ´el´ements pr´egnants particuli`e- rement ´evidents dans sa structure : un long trac´e vertical qui s´epare le caract`ere en deux moiti´es, gauche et droite, et un long trac´e horizontal qui le coupe en deux dans sa hauteur. Ces deux ´el´ements d´efinissent en quelque sorte un rep`ere de positionnement pour les autres ´el´ements de la structure.

Dans notre approche, nous cherchons `a identifier ces ´el´ements pr´egnants et les consi- d´erons comme les r´ef´erences globales pour le positionnement des autres ´el´ements. Le choix intuitif d’appuyer la description des relations spatiales sur les ´el´ements pr´egnants rejoint l’une des r`egles formul´ee dans le mod`ele psychologique de Clark [CPM73] pour la percep- tion des relations spatiales. Cette r`egle est cit´ee par Freeman dans ses travaux [Fre75]. Elle stipule simplement que « si un objet dans une image est perceptuellement pro´eminent, il sera utilis´e comme r´ef´erence pour toute relation de positionnement avec un autre objet ». Sous l’angle du probl`eme de reconnaissance de formes, les objets saillants d’une structure offrent l’avantage d’ˆetre faciles `a identifier parmi un ensemble de trac´es manuscrits car ils sont g´en´eralement de grande dimension par rapport aux autres ´el´ements. De plus, ils pr´e- sentent des caract´eristiques relativement stables. Par d´efinition, leur forme, leur orientation et leur position jouent un rˆole fortement structurant pour la perception du symbole. Il est donc naturel de constater une certaine stabilit´e de ces ´el´ements entre diff´erentes variantes manuscrites d’un mˆeme symbole.

4.2.1.3 Optimisation du pouvoir descriptif du r´ef´erentiel

Puisque le champ d’application vis´e concerne des symboles de nature bidimensionnelle, il est n´ecessaire que le choix du r´ef´erentiel de positionnement puisse couvrir efficacement le positionnement d’´el´ements dans les deux dimensions. Pour cela, nous proposons de faire re- poser l’expression des mod`eles de positionnement spatial sur un couple de r´ef´erences, l’une not´ee rx et dite horizontale, l’autre not´ee ry et dite verticale. Chaque r´ef´erence est une

portion de trac´e manuscrit, avec rx (respectivement ry) qui est une portion de trac´e suppo-

s´ement horizontale (respectivement verticale). Les notions d’horizontalit´e et de verticalit´e dans la recherche des r´ef´erences rxet ry sont souples et n’imposent aucune restriction. Elles

se traduisent simplement par l’int´egration d’un crit`ere d’horizontalit´e dans la recherche de la meilleure r´ef´erence rx et de verticalit´e dans la recherche de ry. En pratique, si un sym-

bole n’est compos´e que de trac´es horizontaux, la r´ef´erence ry sera fatalement une portion

de trac´e horizontale. N´eanmoins, dans le cas g´en´eral, la recherche de l’orthogonalit´e des r´ef´erences permet de garantir une bonne description du positionnement de tout ´el´ement. En effet, la position d’un ´el´ement donn´e pourra ainsi ˆetre d´ecrite conjointement par deux m´eta-mod`eles spatiaux li´es `a deux r´ef´erences offrant un angle de vue diff´erent sur l’´el´ement. Pour toute portion S extraite du trac´e d’un symbole, on peut calculer un score exprimant la qualit´e de la description offerte par ce trac´e s’il est utilis´e comme r´ef´erence horizontale ou verticale pour le positionnement des autres ´el´ements du symbole. L’id´ee est simplement d’exprimer que S est une bonne hypoth`ese de r´ef´erence horizontale si tout autre point de trac´e du symbole peut ˆetre d´ecrit comme ´etant situ´e soit au-dessus, soit en-dessous de S. Les notions en-dessous et au-dessus sont d´ecrites `a l’aide d’op´erateurs morphologiques flous de directions classiques (selon la repr´esentation admise pr´ec´edemment pour les descriptions de relations directionnelles par rapport `a une r´ef´erence, voir par exemple `a la section2.2.3.2). Ainsi, le score du choix de S comme r´ef´erence horizontale d´epend de la mesure suivante :

X

p∈S\S

max (µhaut(S)(p), (µbas(S)(p)), (4.1)

o`uS est l’ensemble des points du trac´e. Le trac´e S est vu comme l’ensemble de ses points ; µhaut(S) et µbas(S) sont les paysages flous directionnels d´efinis par les ´el´ements structurants

(a) µhaut(Sx) (b) µbas(Sx) (c) µgauche(Sy) (d) µdroite(Sy)

Figure 4.2: Evaluation de la qualit´e d’une portion de trac´e Sx prise comme r´ef´erence

horizontale (a,b) et Sy comme r´ef´erence verticale (c,d)

.

de direction haut et bas appliqu´es sur la r´ef´erence S. Une d´efinition similaire reposant sur les directions `a gauche et `a droite est utilis´ee pour estimer la qualit´e de description offerte par le choix de S comme r´ef´erence verticale. La fonction de score ainsi d´efinie permet d’optimiser la qualit´e de la description ult´erieure du positionnement, en s´electionnant les r´ef´erences permettant de d´ecrire facilement le positionnement de tout autre point du trac´e. La figure 4.2 repr´esente les deux mod´elisations directionnelles morphologiques haut et bas pour un choix de r´ef´erence horizontale Sx dans le premier caract`ere de l’exemple (e) de la

figure 4.1. De mˆeme, les directions `a gauche et `a droite sont appliqu´ees sur un trac´e Sy

pris comme hypoth`ese de r´ef´erence verticale. Ces deux ´el´ements de trac´es constituent les meilleures r´ef´erences au sens du score de l’´equation 4.1 car ils permettent de « couvrir » presque parfaitement les autres trac´es par ces quatre directions.

Les deux r´ef´erences sont s´electionn´ees ind´ependamment l’une de l’autre, ce qui peut conduire au choix de la mˆeme portion de trac´e pour les deux r´ef´erences. Cela se produirait par exemple dans le cas du symbole « % », pour lequel il est bien naturel de s´electionner le segment diagonal comme unique r´ef´erence pour d´ecrire le positionnement des deux petits cercles.

4.2.1.4 Positionnement absolu du r´ef´erentiel par R´ef´erence Virtuelle Absolue (RVA)

Comme expliqu´e au paragraphe 4.2.1.1, il est crucial pour la qualit´e et la finesse de la description offerte par les m´eta-mod`eles spatiaux de choisir des objets manuscrits comme r´ef´erences de positionnement plutˆot que des ´el´ements virtuels. Cependant, le choix de r´ef´e- rences manuscrites pose le probl`eme de la segmentation et de l’extraction des bonnes por- tions de trac´e parmi le dessin du symbole complet. Cette tˆache est difficile et ne peut pas ˆetre r´esolue de fa¸con d´efinitive a priori : il sera donc n´ecessaire d’extraire plusieurs hypoth`eses de r´ef´erences horizontales et verticales `a partir d’un trac´e `a reconnaˆıtre. Il est indispensable d’extraire les « bonnes » r´ef´erences pour exploiter correctement un psf, puisque tous les mod`eles de positionnement relatif reposent sur elles. Afin de faciliter la recherche des trac´es de r´ef´erence, nous proposons d’introduire dans la mod´elisation une part de positionnement par rapport `a un r´ef´erentiel absolu et virtuel (d´efini par des objets non concrets) qui offre

(a) (b) (c) (d)

Figure 4.3: La figure (a) repr´esente trois candidats (en rouge) pour constituer la r´ef´erence horizontale de positionnement. Les figures (b),(c) et (d) d´emontre que ces r´ef´erences peuvent ˆetre distingu´ees en fonction de la position du bord gauche de la boˆıte englobante par rapport `

a elles-mˆemes.

l’avantage d’ˆetre directement disponible : la boˆıte englobante du symbole. Le principe n’est pas de construire des mod`eles en s’appuyant sur ce r´ef´erentiel virtuel, pour les raisons d´ej`a ´evoqu´ees au paragraphe4.2.1.1, mais tout au contraire de d´ecrire comment les quatre seg- ments d´efinissant la boˆıte englobante du trac´e du symbole sont positionn´es par rapport aux hypoth`eses de r´ef´erence rx et ry. En d’autres mots, il s’agit de positionner des ´el´ements du

r´ef´erentiel absolu par rapport aux r´ef´erences manuscrites choisies, plutˆot que le contraire. De ce fait, on conserve le pouvoir d’expressivit´e des mod`eles spatiaux qui sont toujours d´evelopp´es sur des r´ef´erences concr`etes, tout en permettant de stabiliser et d’identifier plus facilement ces r´ef´erences grˆace aux ´el´ements virtuels.

La figure4.3illustre sur un simple exemple l’int´erˆet de positionner les bords de la boˆıte englobante pour aider au choix d’une bonne r´ef´erence de trac´e. L’image (a) pr´esente un caract`ere dans lequel trois ´el´ements de trac´es apparaissent comme de bons candidats pour constituer la r´ef´erence horizontale (ils sont repr´esent´es en rouge). Les images (b),(c) et (d) montrent que la description de la position du bord gauche de la boˆıte englobante est tr`es diff´erente par rapport `a ces trois r´ef´erences. Le bord gauche est en bas `a gauche de la premi`ere hypoth`ese de r´ef´erence (image (a)), `a gauche de la seconde hypoth`ese (image (b)) et en haut `a gauche de la troisi`eme (image (c)). La description de la position des bords de la boˆıte englobante dans le mod`ele permettra donc de faciliter la recherche de ces bonnes r´ef´erences.

Dans la suite, nous d´esignons les quatre segments d´efinissant les cot´es de la boˆıte englo- bante du trac´e sous le nom de R´ef´erence Virtuelle Absolue (ou rva). Il est `a noter que ces ´el´ements virtuels seront d´ecrits par des m´eta-mod`eles spatiaux en tout point comparables `

a ceux utilis´es pour d´ecrire le positionnement des composants du symbole par rapport aux r´ef´erences et seront int´egr´es dans la fusion d’informations de fa¸con homog`ene.