• Aucun résultat trouvé

Difficultés pour comparer les approches

Chapitre I Reconnaissance structurelle de formules mathématiques : état de l’art

8.2 Difficultés pour comparer les approches

La reconnaissance des notations mathématiques dans un document est un problème si- gnificatif dans la reconnaissance de documents composites (documents composés de textes, graphiques, photographies, schémas, notations mathématiques, etc.). Durant les trente der- nières années, des études ont été effectuées sur le sujet avec des approches diverses. Mais la reconnaissance et l’interprétation de ces notations est complexe, il est difficile de com- parer les différentes méthodes ou techniques développées pour résoudre le problème. Il est

[1] HA J., HARALICK R.M. & PHILLIPSI.T., Understanding mathematical expressions from document images (1995).

aussi à signaler qu’aucune implémentation de ces méthodes n’a pu être obtenue auprès des auteurs, ce qui ne facilite pas cette tâche de comparaison. Nous avons dû nous contenter des publications comme seule et unique source d’informations. Mais d’autres facteurs sont aussi à prendre en compte si l’on parle de difficultés à comparer les différentes approches.

8.2.1 Diversité dans les données traitées

Comme nous avons pu le voir dans les paragraphes précédents, la première difficulté pro- vient de la diversité et de la variété des données à traiter. Les travaux effectués concernent aussi bien la reconnaissance de notations manuscrites capturées en temps réel, le plus sou- vent à l’aide d’une tablette à digitaliser, que des notations typographiées, en ayant recours à la numérisation. Certains systèmes se contentent de récupérer une liste de symboles déjà re- connus et leurs positions, ou bien intègrent la reconnaissance des symboles, avec une partie effectuant un traitement de l’image plus ou moins poussé (suppression du bruit, réorienta- tion, etc.). Enfin, la dernière caractéristique des applications est la nécessité ou non de devoir isoler la formule du reste du document, dans le cas où celle-ci serait incluse dans un texte par exemple. Cette grande diversité dans la définition du problème ne permet pas d’effectuer une comparaison sérieuse sur l’efficacité de ces systèmes hétéroclites.

8.2.2 Grande diversité des approches

De nombreuses méthodes ont été étudiées pour la reconnaissance des expressions ma- thématiques. L’analyse syntaxique met en œuvre une grammaire de type bidimensionnelle, comme c’est le cas dans les grammaires de coordonnées. La reconnaissance des symboles est un pré-requis à l’application de cette méthode. Elle fournit une représentation claire et ex- plicite des notations mathématiques reconnues, même si l’analyseur a une complexité élevée et nécessite donc des temps de calculs parfois importants. Le découpage par projections, ho- rizontales et verticales, détermine la structure de l’expression en subdivisant récursivement l’image en sous-régions. La reconnaissance des symboles peut être effectuée a posteriori. La stratégie procédurale n’utilise pas de méthodologie bien définie et sans une organisation stricte des règles, le programme devient rapidement confus et difficile à étendre à d’autres notations.

Autant d’approches différentes, qu’il est difficile de comparer à la fois quantitativement et qualitativement.

8.2.3 Diversité des notations mathématiques

Les systèmes de reconnaissance ne considèrent pas tous les mêmes classes de notations mathématiques. La plupart d’entre eux se sont concentrés sur la reconnaissance des nota- tions arithmétiques, ou même ont spécialisé leurs recherches sur une classe très particulière

9. Conclusion

de notations. C’est le cas de R. Fateman [?][1], [?][2] qui étudie les solutions pour la recon-

naissance des intégrales, dans le but de développer un logiciel capable d’analyser des tables d’intégrales déjà imprimées dans un document. Assez peu de recherches ont été effectuées sur les notations matricielles et très peu de systèmes sont suffisamment généralistes, dans la méthodologie employée, pour être capables de reconnaître une nouvelle classe de notations mathématiques. C’est tout particulièrement le cas de la méthode procédurale, où il serait nécessaire de réécrire presque complètement l’analyseur.

Une recherche est nécessaire pour clarifier la définition des notations et des “dialectes” mathématiques. Une telle définition permettrait de disposer d’une base solide de comparai- son des différents systèmes de reconnaissance de notations mathématiques.

9

Conclusion

Une étude approfondie de la bibliographie concernant la reconnaissance structurelle des formules mathématiques met en évidence l’engouement récent pour ce domaine de re- cherche. En effet, plus de 75% des références datent de moins de 10 ans et plus de 50% de moins de 5 ans ; c’est tout dire quant à l’intérêt porté au sujet. Le nombre important de ces travaux peut s’expliquer par deux facteurs. Tout d’abord, la capacité de traitement des ordinateurs rend possible une application directe des résultats obtenus ; le faible coût des périphériques nécessaires (scanner ou tablette à digitaliser) favorise l’utilisation par le plus grand nombre. D’autre part, les applications multiples que nous avons décrites comme une interface plus intuitive pour l’utilisateur ou la possibilité de reconnaître automatiquement les documents scientifiques, ouvrent des perspectives nouvelles dans plusieurs domaines. C’est particulièrement le cas d’une indexation automatique des documents scientifiques, avec la possibilité de faire des recherches sur une base de données de formules mathématiques.

Dans ce chapitre, nous avons tenté de décrire les difficultés inhérentes à la reconnais- sance des notations mathématiques. Nous avons répertorié les différentes approches utilisées jusqu’à présent pour effectuer la reconnaissance structurelle de formules mathématiques à partir de leur représentation. Sur la base de ce constat, nous allons dégager les aspects les plus importants que doit intégrer un système dédié à la reconnaissance d’expressions mathé- matiques. Ces points seront développés dans les chapitres suivants en mettant l’accent sur les solutions retenues.

[1] FATEMANR.J. & TOKUYASUT., Progress in recognizing typeset mathematics (1996).

[2] FATEMAN R.J., TOKUYASU T., BERMAN B.P. & MITCHELL N., Optical character recognition and parsing of typeset mathematics (1996).

Chapitre II

Concepts pour la reconnaissance de

formules

Ce chapitre présente de façon assez générale les idées mises en pratique durant la réali- sation d’OFR. Sa lecture doit permettre une compréhension globale des problèmes que nous avons abordés et donc fournir un cadre pour les chapitres suivants. La méthode utilisée pour la reconnaissance structurelle proprement dite sera développée dans le chapitre suivant. Les thèmes abordés ici sont approfondis dans les chapitres consacrés à la méthode choisie et à l’implémentation.

Les nombreuses applications possibles que nous avons présentées dans le chapitre I, pa- ragraphe 2, montrent bien la nécessité d’un tel système de reconnaissance. Dans ce chapitre, nous avançons les éléments qui nous semblent essentiels à un système de reconnaissance structurelle des notations mathématiques. Peu de justifications et de conclusions sont don- nées, ces développements étant réservés aux chapitres suivants.

Les trois caractéristiques essentielles sont la réutilisabilité, l’évolutivité, et la communi- cation avec d’autres systèmes indépendants. Nous allons détailler pour chacune d’elles les points qui nous semblent actuellement avoir été oublié dans les diverses solutions proposées.

1

Réutilisabiblité

Le premier point que nous tenons à mettre en évidence est la nécessité d’avoir un système qui soit suffisamment paramétrable pour être réutilisé dans le cadre des diverses applications que nous avons déjà pu présenter. Parmi ces applications, nous focaliserons nos efforts sur deux d’entre elles :

– l’utilisation du système en tant qu’interface à un système manipulant des formules mathématiques,

– la possibilité de récupérer les expressions mathématiques présentes dans un certain nombre de documents imprimés.

Cette double optique de travail, qui ouvre de larges champs d’application, nécessite la mise en place d’un système suffisamment adaptable à ces différentes réalisations.

Un bon système de reconnaissance structurelle requiert un effort important de conception et d’implémentation. Il serait donc profitable de pouvoir bénéficier d’un composant facile- ment intégrable et paramétrable, qui fournirait les fonctions de base de l’analyse géométrique et syntaxique de l’expression à reconnaître.