Limitations de la repr´esentation - Evaluation des PSF pour la repr´esentation de symboles stru

5.2 Evaluation des PSF pour la repr´esentation de symboles structur´es

5.2.4 Limitations de la repr´esentation

Nous avons déjà constaté des limitations de la représentation par psf pour la reconnaissance de symboles sur la base CaracDB. Pour éprouver plus en profondeur les limites de la représentation purement spatiale des symboles, nous expérimentons dans cette partie les psf face aux bases de données PictoDB et ArchiDB. La base PictoDB va d’abord nous permettre de sonder les limites de la tolérance des psf face à des symboles qui présentent de plus grandes distorsions de forme et de segmentation de leurs tracés. Ensuite, une ex- périmentation sur la base ArchiDB testera la description sur des symboles graphiquement plus complexes.

5.2.4.1 Limites de la tol´erance aux distorsions de segmentation

La base de symboles PictoDB constitue un défi pour construire une représentation structurelle des caractères. La reconnaissance de ces symboles par psf permet toutefois d’atteindre une performance de 83% de bonne reconnaissance. Le tableau5.32 donne plus en détail les scores de reconnaissance atteints pour chacune des 14 classes de symboles de la base PictoDB.

Table 5.32: Taux d’erreur pour chaque classe de la base PictoDB.

classe % erreur classe % erreur classe % erreur

34 32 2

4 2 18

0 66 2

8 2 12

54 2 Total 17

Les mauvais taux de reconnaissance atteints pour certaines classes sont à mettre au compte de la grande difficulté pour l’algorithme d’apprentissage à converger vers des mo- dèles stables de psf. Cette difficulté provient en premier lieu de la grande distorsion des tracés et au caractère très cursif de certains exemples, la stratégie d’extraction de référence étant peu adaptée à la gestion de tracés courbes. Par exemple, en présence de cercles, les références extraites sont assez instables car elles résultent d’une procédé d’approximation polygonale qui est peu pertinent sur ces formes. Cela explique notamment le mauvais taux de reconnaissance pour la classe représentée en bas à gauche du tableau 5.32. La classe la plus mal reconnue (au centre du tableau) cumule deux difficultés. D’abord, la cursivité des tracés rend difficile l’extraction de références stables. Ensuite, elle a la particularité d’avoir un nombre d’éléments de structure variable, très difficile à déterminer de fa¸con stable par l’algorithme d’apprentissage.

La figure5.5 illustre les difficult´es que posent certaines classes pour construire des mo- d`eles stables de leur structure.

Pour les symboles de la première ligne, le caractère très cursif de leur écriture pose un défi pour la méthode d’extraction des références qui est peu adaptée notamment à la gestion des tracés circulaires. Les symboles de la seconde ligne ont la particularité très marquée d’être fortement variables en fonction des styles d’écriture. Cette classe de symboles pourrait être définie par : trois tracés non rectilignes, descendants, plus ou moins parallèles. On comprend aisément en regardant ces exemples que la méthode d’apprentissage des psf, qui a été con¸cue de fa¸con à pouvoir détecter par exemple la présence de crochets à l’extrémité de tracés dans des caractères chinois, est mise à mal par ce type de formes instables. L’algorithme échoue en fait à déterminer des références et des éléments de structure de fa¸con stable. Le résultat est donc un psf mal défini, qui reconnaˆıt mal les tracés de cette classe et qui perturbe la reconnaissance des autres classes.

Figure 5.5: Illustration des difficult´es pos´ees par deux classes de symboles de la base PictoDB.

balement de maintenir un niveau de reconnaissance de 83%, ce qui montre une certaine capacité à gérer des cas de segmentation beaucoup plus difficiles que dans la base CaracDB. Lorsque l’algorithme d’apprentissage parvient à apprendre des représentations suffisamment stables, leur exploitation permet de procéder à la reconnaissance avec une précision raison- nable. La limite qui apparaˆıt clairement sur cette base de données vient avant tout de la stratégie d’extraction de points particuliers pour générer les hypothèses de références, qui s’applique mal à plusieurs de ces classes.

5.2.4.2 Limites de la pr´ecision de la repr´esentation par PSF

La base de données ArchiDB comporte 21 classes, dont certaines correspondent à des symboles nettement plus complexes que les deux bases précédentes, puisque certains exemples sont constitués de près d’une vingtaine de tracés. Ces symboles posent alors un défi à la représentation par psf. D’abord, la complexité combinatoire engendrée est nettement aug- mentée car elle croˆıt de fa¸con exponentielle avec le nombre de tracés élémentaires constituant les symboles. Il semble qu’un vingtaine de tracés soit la limite maximale acceptable pour les algorithmes développés. Ensuite, cette complexité permet de pointer du doigt les limites de la précision de la description spatiale. Un choix de conception des psf a été de sélectionner un référentiel unique par rapport auquel tous les autres éléments de tracés sont position- nés. Lorsque de nombreux éléments de structure constituent les symboles, il apparaˆıt que cette description est insuffisante et qu’il est nécessaire de décrire le positionnement rela- tif des éléments entre eux et pas seulement par rapport à une référence centralisée. C’est d’ailleurs le choix que font Mas, Sanchez et al.[MSLL07] pour reconnaˆıtre ces mêmes classes de symboles.

Une exp´erimentation sur cette base de 21 classes donne un taux de bonne reconnaissance de l’ordre de 70% seulement. La figure 5.6 donne trois exemples de classes qui sont particuli`erement mal reconnues par l’approche psf.

Ce qui caractérise ces symboles est qu’il ne présentent pas d’éléments de structure saillants constituant des références naturelles pour décrire le positionnement de tous les éléments de la structure. Ils sont constitués d’un nombre assez important d’éléments qu’il est difficile de positionner précisément par rapport à un référentiel unique. L’analyse des psf appris pour ces classes montre que la convergence est bien réussie, mais que les modèles spatiaux sont peu précis et qu’en particulier la carte de segmentation est peu efficace pour

Figure 5.6: Exemples de classes mal reconnues dans la base ArchiDB.

segmenter certains tracés trop éloignés des éléments de référence. On atteint donc avec ces exemples la limite de la capacité de description de symboles par les psf tels qu’ils ont été définis.

Dans le document Méta-modèles de positionnement spatial pour la reconnaissance de tracés manuscrits (Page 192-195)