• Aucun résultat trouvé

Synth`ese sur la repr´esentation de symboles par PSF

5.2 Evaluation des PSF pour la repr´esentation de symboles structur´es

5.2.5 Synth`ese sur la repr´esentation de symboles par PSF

Les exp´erimentations conduites dans cette deuxi`eme partie ont permis de mettre en ´evi- dence en premier lieu la bonne capacit´e des psf `a repr´esenter de fa¸con pr´ecise des caract`eres chinois simples. Les r´esultats de reconnaissance obtenus sur la base CaracDB valident la d´emarche purement spatiale que nous avons adopt´ee : l’information sur la structure interne de ces symboles est intrins`equement assez riche pour pouvoir les reconnaˆıtre de fa¸con effi- cace. Du mˆeme coup, il est confirm´e que les m´eta-mod`eles spatiaux offrent une description fid`ele de cette information. De plus, leur pouvoir de pr´ediction exploit´e ici pour segmenter les trac´es en fonction de leur positionnement relativement `a des r´ef´erences est efficace et permet de faire face `a diverses situations de segmentation. Les apports obtenus par l’intro- duction dans les mod`eles de l’information de distance et des scores d’´etendue permettent en outre de consolider les conclusions de la premi`ere partie exp´erimentale.

Plusieurs limitations ont ´egalement ´et´e mises en ´evidence dans ces exp´erimentations, en particulier `a l’aide des deux bases PictoDB et ArchiDB. Tout d’abord, par d´efinition, les psf n’ont pas ´et´e entraˆın´es et optimis´es pour maximiser leur capacit´e `a reconnaˆıtre des symboles. Une meilleure performance pourrait donc ˆetre esp´er´ee non pas en modifiant leur d´efinition, mais par exemple en optimisant les poids de leurs ´el´ements de structure dans la fusion dans un cadre discriminant.

Ensuite, la premi`ere limitation r´eelle des psf a ´et´e constat´ee dans le cadre de symboles `

a la segmentation tr`es chaotique et en particulier lorsque les trac´es sont tr`es cursifs. L’ex- traction de r´ef´erences stables au cours de l’apprentissage est alors difficile et la strat´egie d’extraction de r´ef´erences s’av`ere inadapt´ee `a traiter les trac´es circulaires. Cette limitation pourrait donc ˆetre contourn´ee en red´efinissant une strat´egie plus g´en´erale pour extraire des r´ef´erences stables y compris en l’absence de portions rectilignes de trac´es.

La seconde limitation constat´ee provient du choix de positionner tous les ´el´ements par rapport `a un r´ef´erentiel de positionnement unique. Ce choix limite la capacit´e de description `

a des symboles `a la complexit´e assez r´eduite. D´epasser cette limitation en expressivit´e de- manderait de mod´eliser des relations spatiales suppl´ementaires entre les ´el´ements de trac´es et non pas seulement par rapport aux r´ef´erences globales. Un coˆut combinatoire plus im- portant serait alors engendr´e par une telle repr´esentation et une adaptation des algorithmes serait n´ecessaire (il faudrait en particulier am´eliorer la fonction de bounding utilis´ee dans la recherche du meilleur assignement).

Il est int´eressant de noter que ces limitations ne proviennent pas du choix de repr´esen- tation purement spatiale des symboles. Ce n’est donc pas en premier lieu la restriction `a l’information spatiale qui limite l’approche de repr´esentation de symboles par psf, mais plutˆot les choix que nous avons fait pour simplifier cette information (en particulier le choix d’un r´ef´erentiel unique de positionnement).

C

h

a

p

i

t

6

Conclusion

6.1

Bilan

Dans ces travaux, nous nous sommes int´eress´es au probl`eme de la description de l’infor- mation spatiale entre objets manuscrits pour aider `a l’interpr´etation des documents de cette nature. Faisant le constat d’un certain manque dans la litt´erature, nous avons propos´e une mod´elisation pour les relations spatiales qui soit transversale aux besoins rencontr´es dans l’analyse de documents manuscrits, c’est-`a-dire avec l’objectif de pouvoir s’appliquer `a des situations de positionnement vari´ees, entre objets de diff´erentes natures et diff´erents niveaux de complexit´e. L’id´ee conductrice de nos recherches est que les relations spatiales renferment une importance majeure quant au sens `a interpr´eter et qu’elles ne sont probablement pas exploit´ees dans toute leur richesse par les techniques de description existantes.

Les m´eta-mod`eles spatiaux que nous avons introduit reposent sur les fondements de la perception cognitive de relations spatiales et offrent une repr´esentation intuitive pour juger du positionnement relatif de deux objets. L’int´erˆet majeur de cette approche est de per- mettre la conduite d’un raisonnement spatial au sein mˆeme de l’espace de perception ce qui autorise une prise de d´ecision tenant compte de la situation de positionnement sans simplification ni approximation des formes ou des relations entre les objets concern´es. Cette caract´eristique se traduit aussi par la capacit´e de la repr´esentation `a pr´edire, ´etant donn´e un objet de r´ef´erence, quelles zones du plan sont acceptables pour la relation apprise.

La formalisation des m´eta-mod`eles spatiaux a ´et´e guid´ee par les objectifs de g´en´ericit´e et d’expressivit´e de la mod´elisation. La s´election de directions de raisonnement et l’incorpo- ration de distance dans les mod`eles ont ´et´e abord´es dans cette optique. L’expressivit´e et la pr´ecision de la m´ethode de description reposent sur deux aspects fondamentaux. D’abord, l’analyse de la relation est conduite en consid´erant la combinaison de plusieurs points de vue qui sont choisis afin d’offrir une bonne couverture des positionnements relatifs possibles. En- suite, l’apprentissage automatique de la description selon chaque point de vue est essentielle

et permet d’appr´ehender des relations spatiales complexes dans toute leur richesse. L’origi- nalit´e de la prise en compte du caract`ere bipolaire de l’information spatiale permet en outre de mod´eliser finement des nuances d’acceptabilit´e et d’inacceptabilit´e de positionnement. Enfin, la consid´eration d’un score d’´etendue de l’objet cible, d´ecrivant comment l’objet oc- cupe l’espace, s’est av´er´ee capable d’apporter `a la mod´elisation une capacit´e suppl´ementaire `

a distinguer des situations qui ne peuvent pas l’ˆetre au seul regard du positionnement strict des objets. La possibilit´e d’apprendre automatiquement les m´eta-mod`eles spatiaux dispo- sant de ces qualit´es est essentielle pour appr´ehender les relations spatiales non-linguistiques qui se pr´esentent entre les objets manuscrits. Elle constitue aussi, sur le plan th´eorique, une r´eelle nouveaut´e conceptuelle au regard des m´ethodes existantes s’inspirant du raisonnement par mod`eles spatiaux.

Les r´esultats obtenus par exploitation de cette mod´elisation ont permis de v´erifier, tant qualitativement que quantitativement, que la pr´ecision de la description du positionnement relatif offerte surpasse les familles de m´ethodes classiquement utilis´ees pour cela, sur diff´e- rents jeux de donn´ees pr´esentant diverses natures de relations spatiales.

La deuxi`eme partie de nos travaux a permis d’approfondir la d´emarche de mise en ´evidence du rˆole de l’information spatiale pour l’interpr´etation du manuscrit. Si l’information spatiale joue effectivement un tel rˆole, et puisque nous avons d´efini une mod´elisation permettant de la d´ecrire plus fid`element que les m´ethodes existantes, dans quelle mesure n’est-il pas possible d’interpr´eter le sens de certaines structures manuscrites en se limitant `a la description de cette connaissance ?

Nous avons d´efini une repr´esentation structurelle nouvelle pour d´ecrire les symboles ma- nuscrits, `a partir de la combinaison de m´eta-mod`eles spatiaux mod´elisant le positionnement relatif des ´el´ements de la structure. Les enjeux suppl´ementaires par rapport `a la descrip- tion du positionnement de deux objets pr´ed´efinis concernent la d´etermination d’objets de r´ef´erence et la recherche de la segmentation des ´el´ements de la structure. Des strat´egies coh´erentes avec le mode de description des relations spatiales ont ´et´e d´efinies pour r´esoudre ces deux probl`emes. La recherche d’un r´ef´erentiel de positionnement est faite avec l’objectif d’optimiser le pouvoir descriptif offert par ce r´ef´erentiel au regard du reste de la structure du symbole. La segmentation des ´el´ements de trac´es est quant `a elle guid´ee par les mod`eles spatiaux appris qui d´ecrivent leur positionnement attendu par rapport au r´ef´erentiel. La propri´et´e de combinaison des mod`eles spatiaux est aussi exploit´ee pour construire des rela- tions de positionnement plus pr´ecises, exprim´ees par rapport `a une paire de r´ef´erences. Cette seconde partie de nos travaux permet donc ´egalement de mettre en ´evidence les contribu- tions que peuvent apporter les m´eta-mod`eles spatiaux aux syst`emes d’analyse d’expressions manuscrites.

La qualit´e de la repr´esentation structurelle ainsi d´efinie a ´et´e ´evalu´ee en proc´edant `a une tˆache de reconnaissance automatique de diff´erentes types de symboles. Les r´esultats obtenus sur une base de symboles chinois prouvent que dans ce contexte, cette repr´esen- tation purement spatiale des symboles est suffisamment pr´ecise pour permettre leur bonne reconnaissance. Cela confirme `a la fois la richesse de l’information de positionnement relatif que renferment ce type de formes et la qualit´e des m´eta-mod`eles spatiaux `a bien repr´esenter cette information. La bonne tol´erance face `a diff´erentes situations de segmentation conforte par ailleurs la strat´egie de segmentation guid´ee par les mod`eles de positionnement. D’autres

exp´erimentations sur des symboles posant des d´efis par la plus grande variabilit´e de leur segmentation ou par la plus grande complexit´e de leur composition ont mis en ´evidence les limites de notre repr´esentation. Les limites identifi´ees ne sont paradoxalement pas im- putables en premier lieu `a l’absence de description des formes individuelles des trac´es qui constituent les symboles. Au contraire, ce sont encore certaines caract´eristiques spatiales qui pourraient ˆetre int´egr´ees `a la description pour en enrichir la pr´ecision (en particulier le positionnement relatif de tous les ´el´ements de structure relativement les uns aux autres).

Il serait, pour conclure, inappropri´e de se risquer `a formuler une limite absolue `a la richesse comport´ee par l’information spatiale d’une expression manuscrite : nous n’avons fait dans cette th`ese qu’en sonder la profondeur au moyen de ces nouveaux outils que sont les m´eta-mod`eles spatiaux. D’autre part, chercher `a quantifier la plus-value d’une description des formes des ´el´ements de trac´es tient de la gageure. En effet, l’importance de l’information de forme des primitives structurelles semble s’amenuiser `a mesure que ces primitives sont d´efinies comme des portions de trac´es plus petites, plus ´el´ementaires, aux formes plus simples. A l’inverse, l’information spatiale revˆet alors une part d’importance croissante. Un ´el´ement de r´eponse qui semble ´emerger est la limite pratique pos´ee par la complexit´e combinatoire engendr´ee lorsque le mod`ele de structure s’enrichit d’un grand nombre de relations spatiales.