• Aucun résultat trouvé

5.2 Evaluation des PSF pour la repr´esentation de symboles structur´es

5.2.4 Limitations de la repr´esentation

Nous avons d´ej`a constat´e des limitations de la repr´esentation par psf pour la recon- naissance de symboles sur la base CaracDB. Pour ´eprouver plus en profondeur les limites de la repr´esentation purement spatiale des symboles, nous exp´erimentons dans cette partie les psf face aux bases de donn´ees PictoDB et ArchiDB. La base PictoDB va d’abord nous permettre de sonder les limites de la tol´erance des psf face `a des symboles qui pr´esentent de plus grandes distorsions de forme et de segmentation de leurs trac´es. Ensuite, une ex- p´erimentation sur la base ArchiDB testera la description sur des symboles graphiquement plus complexes.

5.2.4.1 Limites de la tol´erance aux distorsions de segmentation

La base de symboles PictoDB constitue un d´efi pour construire une repr´esentation structurelle des caract`eres. La reconnaissance de ces symboles par psf permet toutefois d’atteindre une performance de 83% de bonne reconnaissance. Le tableau5.32 donne plus en d´etail les scores de reconnaissance atteints pour chacune des 14 classes de symboles de la base PictoDB.

Table 5.32: Taux d’erreur pour chaque classe de la base PictoDB.

classe % erreur classe % erreur classe % erreur

34 32 2

4 2 18

0 66 2

8 2 12

54 2 Total 17

Les mauvais taux de reconnaissance atteints pour certaines classes sont `a mettre au compte de la grande difficult´e pour l’algorithme d’apprentissage `a converger vers des mo- d`eles stables de psf. Cette difficult´e provient en premier lieu de la grande distorsion des trac´es et au caract`ere tr`es cursif de certains exemples, la strat´egie d’extraction de r´ef´erence ´etant peu adapt´ee `a la gestion de trac´es courbes. Par exemple, en pr´esence de cercles, les r´ef´erences extraites sont assez instables car elles r´esultent d’une proc´ed´e d’approximation polygonale qui est peu pertinent sur ces formes. Cela explique notamment le mauvais taux de reconnaissance pour la classe repr´esent´ee en bas `a gauche du tableau 5.32. La classe la plus mal reconnue (au centre du tableau) cumule deux difficult´es. D’abord, la cursivit´e des trac´es rend difficile l’extraction de r´ef´erences stables. Ensuite, elle a la particularit´e d’avoir un nombre d’´el´ements de structure variable, tr`es difficile `a d´eterminer de fa¸con stable par l’algorithme d’apprentissage.

La figure5.5 illustre les difficult´es que posent certaines classes pour construire des mo- d`eles stables de leur structure.

Pour les symboles de la premi`ere ligne, le caract`ere tr`es cursif de leur ´ecriture pose un d´efi pour la m´ethode d’extraction des r´ef´erences qui est peu adapt´ee notamment `a la gestion des trac´es circulaires. Les symboles de la seconde ligne ont la particularit´e tr`es marqu´ee d’ˆetre fortement variables en fonction des styles d’´ecriture. Cette classe de symboles pourrait ˆetre d´efinie par : trois trac´es non rectilignes, descendants, plus ou moins parall`eles. On comprend ais´ement en regardant ces exemples que la m´ethode d’apprentissage des psf, qui a ´et´e con¸cue de fa¸con `a pouvoir d´etecter par exemple la pr´esence de crochets `a l’extr´emit´e de trac´es dans des caract`eres chinois, est mise `a mal par ce type de formes instables. L’algorithme ´echoue en fait `a d´eterminer des r´ef´erences et des ´el´ements de structure de fa¸con stable. Le r´esultat est donc un psf mal d´efini, qui reconnaˆıt mal les trac´es de cette classe et qui perturbe la reconnaissance des autres classes.

Figure 5.5: Illustration des difficult´es pos´ees par deux classes de symboles de la base PictoDB.

balement de maintenir un niveau de reconnaissance de 83%, ce qui montre une certaine capacit´e `a g´erer des cas de segmentation beaucoup plus difficiles que dans la base CaracDB. Lorsque l’algorithme d’apprentissage parvient `a apprendre des repr´esentations suffisamment stables, leur exploitation permet de proc´eder `a la reconnaissance avec une pr´ecision raison- nable. La limite qui apparaˆıt clairement sur cette base de donn´ees vient avant tout de la strat´egie d’extraction de points particuliers pour g´en´erer les hypoth`eses de r´ef´erences, qui s’applique mal `a plusieurs de ces classes.

5.2.4.2 Limites de la pr´ecision de la repr´esentation par PSF

La base de donn´ees ArchiDB comporte 21 classes, dont certaines correspondent `a des symboles nettement plus complexes que les deux bases pr´ec´edentes, puisque certains exemples sont constitu´es de pr`es d’une vingtaine de trac´es. Ces symboles posent alors un d´efi `a la repr´esentation par psf. D’abord, la complexit´e combinatoire engendr´ee est nettement aug- ment´ee car elle croˆıt de fa¸con exponentielle avec le nombre de trac´es ´el´ementaires constituant les symboles. Il semble qu’un vingtaine de trac´es soit la limite maximale acceptable pour les algorithmes d´evelopp´es. Ensuite, cette complexit´e permet de pointer du doigt les limites de la pr´ecision de la description spatiale. Un choix de conception des psf a ´et´e de s´electionner un r´ef´erentiel unique par rapport auquel tous les autres ´el´ements de trac´es sont position- n´es. Lorsque de nombreux ´el´ements de structure constituent les symboles, il apparaˆıt que cette description est insuffisante et qu’il est n´ecessaire de d´ecrire le positionnement rela- tif des ´el´ements entre eux et pas seulement par rapport `a une r´ef´erence centralis´ee. C’est d’ailleurs le choix que font Mas, Sanchez et al.[MSLL07] pour reconnaˆıtre ces mˆemes classes de symboles.

Une exp´erimentation sur cette base de 21 classes donne un taux de bonne reconnais- sance de l’ordre de 70% seulement. La figure 5.6 donne trois exemples de classes qui sont particuli`erement mal reconnues par l’approche psf.

Ce qui caract´erise ces symboles est qu’il ne pr´esentent pas d’´el´ements de structure saillants constituant des r´ef´erences naturelles pour d´ecrire le positionnement de tous les ´el´ements de la structure. Ils sont constitu´es d’un nombre assez important d’´el´ements qu’il est difficile de positionner pr´ecis´ement par rapport `a un r´ef´erentiel unique. L’analyse des psf appris pour ces classes montre que la convergence est bien r´eussie, mais que les mod`eles spatiaux sont peu pr´ecis et qu’en particulier la carte de segmentation est peu efficace pour

Figure 5.6: Exemples de classes mal reconnues dans la base ArchiDB.

segmenter certains trac´es trop ´eloign´es des ´el´ements de r´ef´erence. On atteint donc avec ces exemples la limite de la capacit´e de description de symboles par les psf tels qu’ils ont ´et´e d´efinis.