• Aucun résultat trouvé

5.2 Evaluation des PSF pour la repr´esentation de symboles structur´es

5.2.3 Exp´erimentations sur la base CaracDB

Comme nous l’avons pr´ecis´e, c’est principalement `a l’aune de la base de symboles Ca- racDB que nous allons valider la capacit´e de la repr´esentation par psf `a conduire la tˆache de reconnaissance de symboles. Outre l’´evaluation de la qualit´e de la repr´esentation struc- turelle, nous profitons de ce nouveau cadre exp´erimental pour confirmer les contributions de l’int´egration de la distance et de l’apport de l’´etendue aux m´eta-mod`eles spatiaux.

0 1 2 3 4 5 6 7 8 9 10 11 0 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 poidsγ % er re u r + + + + + + + + + b γ∗= 0.5

Figure 5.4: Evolution du taux d’erreur mesur´e sur la base de validation de CaracDB en fonction du poids γ des scores d’´etendue par rapport aux scores de positionnement.

5.2.3.1 Importance de la mod´elisation de l’´etendue

Dans un premier temps, nous pr´esentons les exp´erimentations permettant d’optimiser le poids donn´e aux scores d’´etendue par rapport aux score de positionnement issus des m´eta- mod`eles spatiaux. En r´ef´erence au paragraphe4.2.2.2, nous rappelons que le score bipolaire d’ad´equation d’un trac´e avec un composant structurel auquel il est assign´e est exprim´e par la combinaison de son score de positionnement, pond´er´e par un facteur α et de son score d’´etendue, pond´er´e par β, avec α+β = 1. Pour fixer ces param`etres, nous cherchons la valeur optimale du rapport γ = β/α sur la base de validation. Suite `a l’apprentissage des mod`eles de psf pour toutes les classes de la base CaracDB `a l’aide des bases d’apprentissage et de validation, nous appliquons la tˆache de reconnaissance `a la base de validation. La courbe pr´esent´ee `a la figure 5.4 exprime le taux d’erreur mesur´e sur pour diff´erentes valeurs du rapport β/α entre 0 et 2.

Ce test permet de v´erifier tout d’abord l’importance de la mod´elisation de l’´etendue pour la reconnaissance de ces caract`eres. Si le poids de l’´etendue est nul, le taux d’erreur augmente de fa¸con tr`es importante. La valeur retenue pour γ suite `a cette optimisation est γ∗ = 0, 5. On attribuera donc au score d’´etendue un poids deux fois inf´erieur au poids des scores de positionnement dans la fusion globale.

Sur la base de test, les r´esultats de reconnaissance mesur´es sont en phase avec les r´e- sultats de la base de validation. Le tableau5.26 pr´esente les taux d’erreurs obtenus sur la base de test, d’abord sans int´egration des scores d’´etendue (γ = 0), puis avec pond´eration des scores d’´etendue par le facteur γ∗.

Table 5.26: Taux d’erreur sur la base de CaracDB avec et sans utilisation des scores d’´etendue.

base % erreur (γ = 0) % erreur (γ = γ∗)

Table 5.27: Les trois classes de symboles prises en exemple dans ce tableau illustrent la r´eduction des confusions permise par l’introduction de l’´etendue dans la fusion. Pour chaque cas (a,b,c), la premi`ere colonne repr´esente une classe de symbole A et la seconde colonne une classe concurrente B. Les deux derni`eres colonnes pr´esentent le taux d’erreur pour la classe A lorsque le score d’´etendue n’est pas pris en compte et lorsqu’il est int´egr´e avec un poids γ∗.

symbole A symbole B % erreur classe A (γ = 0) % erreur classe A (γ = γ∗) (a) 31,6 5,26 (b) 21,05 10,53 (c) 42,11 15,79

Ce r´esultat confirme l’apport de l’´etendue pour la mod´elisation des relations spatiales, d´ej`a mis en ´evidence au paragraphe5.1.3.4. En analysant finement les r´esultats, on remarque que certaines classes sont particuli`erement affect´ees par l’apport des mod`eles d’´etendue. Le tableau5.27 pr´esente trois cas particuliers de classes qui b´en´eficient nettement de l’intro- duction de l’´etendue dans la fusion.

Les deux cas (a) et (b) du tableau illustrent chacun des paires de classes de symboles qui sont mal reconnues en l’absence de mod`ele d’´etendue car elles ne se distinguent que par la pr´esence ou non d’une intersection entre des ´el´ements. L’apport du score d’´etendue est alors tr`es nettement visible sur la r´eduction du taux d’erreur (derni`ere colonne). La notion d’´etendue a ´et´e initialement introduite comme un rem`ede contre les faiblesses des descriptions de positionnement pur notamment dans ces situations d’intersections de trac´es (voir au paragraphe3.5).

Le cas (c) ne correspond pas `a des classes qui sont confondues `a cause de la pr´esence d’intersection. Il s’agit plutˆot de la forme d’un des ´el´ements de la structure qui diff`ere entre les deux symboles A et B. Le gain apport´e par l’´etendue sur cette classe montre que celle-ci permet ´egalement d’aider `a distinguer ces deux caract`eres par la description de comment un objet occupe l’espace.

5.2.3.2 Apport de la distance

La reconnaissance de symboles par psf permet de reproduire un des tests d´ej`a effectu´es dans la premi`ere partie exp´erimentale afin de v´erifier l’apport de la distance dans les m´eta- mod`eles spatiaux. Nous comparons donc ici simplement la performance de reconnaissance des psf sur la base de test dans le cas o`u leurs m´eta-mod`eles spatiaux ne comportent pas d’information de distance et dans le cas o`u ils int`egrent une mod´elisation de la distance embarqu´ee. Cette mod´elisation s’est av´er´ee sup´erieure `a l’int´egration d’une distance globale, lors des tests de classification de relations spatiales.

Le tableau5.28pr´esente ces deux taux d’erreurs mesur´es sur la base de test, en int´egrant les scores d’´etendue pond´er´es d’apr`es le r´esultat de l’optimisation pr´esent´ee pr´ec´edemment.

Table 5.28: Taux d’erreur sur la base de test de CaracDB avec et sans mod´elisation de la distance.

% erreur sans distance % erreur avec distance

5,41 4,03

Le r´esultat confirme dans ce contexte de reconnaissance de symboles l’apport significatif de l’int´egration des mod`eles de distance au sein des m´eta-mod`eles de positionnement qui constituent les psf. Le gain en reconnaissance est ventil´e assez uniform´ement sur les classes de la base de donn´ees et il est d´elicat de mettre en avant des situations pr´ecises qui b´en´e- ficient de fa¸con significative de l’apport de la distance. Toutefois, le gain de la qualit´e de description offert par la consid´eration de la distance dans les mod`eles spatiaux se traduit de fa¸con perceptible sur les repr´esentations des cartes de segmentation des symboles (qui permettent de visualiser les zones de dominance des mod`eles spatiaux associ´es aux compo- sants des mod`eles). Ces cartes servent `a conduire la segmentation des trac´es et jouent par cons´equent un rˆole majeur dans le proc´ed´e de reconnaissance.

Le tableau5.29illustre des cartes de segmentations obtenues avec des mod`eles spatiaux purement directionnels (premi`ere colonne) et qui int`egrent une information de distance (deuxi`eme colonne).

Il apparaˆıt nettement sur ces deux exemples que l’information de distance apporte une pr´ecision suppl´ementaire dans les zones de dominance des mod`eles. Elle renforce donc la pr´ecision de l’´etape de segmentation des trac´es par les m´eta-mod`eles spatiaux.

5.2.3.3 Validit´e de la repr´esentation structurelle

Le taux de reconnaissance avec la meilleure configuration (mod`eles de distance embar- qu´ee et poids de l’´etendue optimis´e) permet d’atteindre une performance de bonne recon- naissance de pr`es de 96% (voir le tableau5.29). Cela signifie que les psf sont bien adapt´es `

a la description des symboles de la base CaracDB (les radicaux de caract`eres chinois) et sont capables de les reconnaˆıtre efficacement parmi 50 classes.

Ce r´esultat confirme tout d’abord le rˆole fondamental jou´e par l’information spatiale dans ces symboles. Aucun ´el´ement de forme n’a en effet ´et´e mod´elis´e, ce qui n’empˆeche pas d’atteindre une performance acceptable sur cette base. Le proc´ed´e d’apprentissage des psf a ´et´e bien capable de construire des repr´esentations adapt´ees des caract`eres, qui sont de plus suffisamment pr´ecises pour r´ealiser la tˆache de reconnaissance. La strat´egie de

Table 5.29: Cartes de segmentation de symboles d´ecrits par des m´eta-mod`eles sans distance (a) et (c) ou avec distance (b) et (d). Les cartes repr´esentent par diff´erents niveaux de gris les zones de dominance des mod`eles spatiaux attach´es aux composants structurels du psf. Les trac´es en couleur repr´esentent les r´ef´erences et les trac´es en blanc sont les ´el´ements `a assigner aux composants.

(a) (b)

(c) (d)

Table 5.30: Exemples correctement reconnus pour quatre classes de symboles. Le symbole en gras repr´esente `a chaque fois un prototype standard de la classe.

(a) (b)

(c) (d)

choix d’un r´ef´erentiel de positionnement s’av`ere efficace sur cette base de donn´ees, puisqu’il est toujours possible d’extraire des trac´es r´epondant aux crit`eres que nous avons mis en avant : trac´es plus ou moins rectilignes, verticaux ou horizontaux, de grande ´etendue par rapport au symbole. Le proc´ed´e d’exploitation a ´egalement montr´e sa capacit´e `a surmonter correctement les variantes de segmentations qui existent dans la base.

Le tableau 5.30repr´esente ainsi quelques exemples de symboles correctement reconnus malgr´e d’importantes variations de formes et diff´erentes variantes de segmentation.

Le tableau5.31 illustre quant `a lui quelques cas d’erreurs de classification, qui mettent en ´evidence deux types d’erreurs `a distinguer.

Les cas d’erreurs (a) et (b) sont dˆus `a la mod´elisation insuffisante de certaines relations spatiales. En effet, les caract`eres confondus doivent pouvoir ˆetre distingu´es par la description des relations spatiales entre certains ´el´ements de leur structure. Cela montre une premi`ere

Table 5.31: Exemples de caract`eres mal reconnus. La premi`ere colonne repr´esente le sym- bole mal reconnu, la seconde colonne pr´esente la classe r´eelle du symbole et la troisi`eme la classe attribu´ee par erreur.

(a)

(b)

(c)

(d)

limite de la repr´esentation et en particulier du choix que nous avons fait de d´ecrire toutes relations de positionnement par rapport `a un r´ef´erentiel unique.

Les deux cas (c) et (d) mettent plutˆot en ´evidence la limite intrins`eque de la descrip- tion purement spatiale. En effet, la confusion entre ces symboles provient de l’absence de description de la forme. Ces cas particuli`erement ambigus d´efient la repr´esentation par psf. Malgr´e le gain en pr´ecision apport´e par la mesure de l’´etendue des objets, que nous avons montr´e au tableau 5.27, cette mesure ne permet pas de distinguer ces cas difficiles.