Caractères manuscrits - Reconnaissance structurelle de formules mathématiques : état de l’art

Chapitre I Reconnaissance structurelle de formules mathématiques : état de l’art

6.2 Caractères manuscrits

Même si quelques méthodes adaptées à la reconnaissance de l’écriture manuscrites sont similaires à celles employées dans le cas de la reconnaissance de symboles typographiés, plusieurs différences sont à souligner.

– La méthode utilisée pour l’acquisition des données :

– les données capturées en direct à l’aide d’une tablette graphique sont disponibles sous la forme d’une séquence temporelle de position du stylet sur la tablette, préser- vant ainsi la manière dont les caractères ont été dessinés (vitesse, accélération, etc). A noter que sur certains modèles de tablette, l’information de pression du stylet est disponible.

– l’acquisition des données s’effectue comme dans le cas d’un document typographié, c’est à dire en ayant recours à un scanner.

– Le processus de segmentation utilisé pour isoler chaque caractère individuellement est un des composants majeurs de la reconnaissance de l’écriture cursive.

– Les modes d’écriture d’un texte sont potentiellement illimités : un même texte écrit par un même utilisateur à deux moments différents est très rarement identique en tout point.

Dans le cas de l’acquisition des données en temps réel, un des éléments prépondérant est l’information temporelle disponible (l’ordre dans lequel les gestes ont été effectués, ainsi que la vélocité relative des différents mouvements composant ce geste). Ce type d’information facilite quelque peu la segmentation.

Plusieurs approches ont été utilisées pour effectuer la reconnaissance des caractères ma- nuscrits ; les plus anciennes utilisaient des méthodes syntaxiques [?][1]_{, alors que d’autres}

études ont été développées spécialement pour la reconnaissance d’une classe particulière d’éléments comme les chiffres [?][2]. Les travaux les plus récents concernant la reconnaissance de l’écriture manuscrite sont basés sur la théorie des chaînes de Markov cachées.

[1] BERTHODM., Une Méthode Syntaxique de Reconnaissance des Caractères Manuscrits en Temps Réel avec un Apprentissage Continu, PhD Thesis (1975).

[2] BAPTISTAG. & KULKARNIK.M., A high accuracy algorithm for recognition of handwritten numerals (1988).

6. Segmentation et reconnaissance des symboles

La théorie des chaînes de Markov (HMM : Hidden Markov Model) a été introduite à la fin des années 1960 par Baum. La reconnaissance est obtenue par calcul de la probabilité a posteriori de la classe de la forme. Ce calcul fait intervenir plusieurs termes qui, suivant certaines hypothèses de dépendances liées à l’application traitée, peuvent se décomposer en probabilités conditionnelles élémentaires. Peu de temps après son introduction, cette mé- thode a été utilisée dans le cadre de la reconnaissance de la parole, chez IBM par exemple, et plus récemment, dans des domaines comme la reconnaissance de formes, la poursuite de cibles, l’identification de signaux de sonars, etc. L’engouement pour cette méthode s’ex- plique tout simplement par sa grande capacité d’intégration du contexte et d’absorption du bruit. Elle s’est imposée dans de nombreux domaines et a donc été tout naturellement uti- lisée dans les applications de reconnaissance de l’écriture manuscrite. Beaucoup de travaux sur ce sujets sont à noter ([?][3]_{, [?]}[4]_{, [?]}[5]_{, [?]}[6]_{, [?]}[7]_{), [?]}[8] _{et plusieurs d’entres eux}

concernent exclusivement la segmentation et la reconnaissance de symboles mathématiques ([?][9]). Cette méthode à même été utilisée dans le cadre de la reconnaissance de caractères typographiés [?][10].

6.3 Conclusion

La reconnaissance de symboles proprement dite n’est pas spécifique à l’identification des notations mathématiques. C’est un domaine de recherche à part entière pour lequel nous ne prétendons pas donner un aperçu exhaustif en deux paragraphes. Nous n’avons présenté que les principales caractéristiques et les principales approches existantes pour les cas typogra- phiés et manuscrits.

La diversité des symboles utilisés dans les notations mathématiques implique quelques spécificités ; l’importance des petits symboles, ainsi que la grande variété de taille des ca- ractères doivent être prises en compte dans le processus de classification et d’identification des symboles. Dans le chapitre IV, nous reviendrons plus amplement sur les conséquences de cette diversité et les répercussions sur les méthodes et algorithmes pour un logiciel de reconnaissance des caractères, plus spécifiquement dédié aux caractères entrant dans la com-

[3] BELAÏDA. & SAONG., Utilisation des processus markoviens en reconnaissance de l’écriture (1997). [4] GUYON I., SCHENKELM. & DENKERJ., Overview and synthesis of on-line cursive handwritten re-

cognition techniques (1997).

[5] KUNDUA., Handwritten word recognition using hidden markov model (1997).

[6] ANQUETILE., G.LORETTE& GENTRICP., Reconnaissance en ligne d’écriture cursive par chaînes de markov cachées (1995).

[7] WINKLERH.J., Hmm-based handwritten symbol recognition using on-line and off-line features (1996). [8] Pattern Recognition (1999).

[9] LEHMBERGS., WINKLERH.J. & LANGM., A soft-decision approach for symbol segmentation within handwritten mathematical expressions (1996).

[10] ELMS A.J., The Representation and Recognition of Text Using Hidden Markov Models, PhD Thesis (1996).

position des formules mathématiques. Pour ne citer ici qu’un exemple, le système à base de chaînes de Markov pour la reconnaissance des caractères manuscrits doit tenir compte de la diversité de taille des caractères, en introduisant des modèles pour les différents types de caractères :

– modèle à 12 états pour les grands symboles (grandes parenthèses, Σ, Π, etc) et les lettres majuscules,

– modèle à 8 états pour les minuscules,

– modèle à 3 états pour les petits symboles (point, virgule, etc).

Une réflexion a été faite sur la possibilité d’améliorer la reconnaissance des caractères dans le contexte spécifique des formules. Nous n’avons toutefois pas trouvé de solution concrète, l’absence de redondance de l’information dans une notation étant un obstacle ma- jeur à l’utilisation des heuristiques du type de celles mises en œuvre dans le cas de documents textuels (utilisation de dictionnaires ou de statistiques par exemple). En conséquence, nous avons opté pour une architecture logicielle constituée de modules que nous présenterons plus en détail dans le chapitre II. Mais présentons tout d’abord le dernier aspect du processus de reconnaissance : la reconnaissance structurelle.

7 Reconnaissance de la structure

La reconnaissance des symboles ayant été effectuée, nous disposons alors d’un ensemble de caractères avec leurs propriétés respectives, à savoir principalement la localisation mais aussi éventuellement la taille, le style, etc. Le problème devient alors : comment construire l’arbre de syntaxe abstraite à partir des données géométriques caractérisant la notation que l’on souhaite reconnaître. La figure 9 illustre la transition nécessaire entre la représentation géométrique de la notation et son arbre de syntaxe.

b x x + 2 * * c a _^

a x

b x

c

FIG. 9 – Arbre syntaxique de l’expression ax2+ bx + c

Pour effectuer ce traitement, plusieurs phases sont indispensables, comme l’identification des relations spatiales et logiques entre les symboles, ainsi que l’analyse de ces différents liens, pour en déduire l’arbre de syntaxe de la formule.

7. Reconnaissance de la structure

Dans le document Reconnaissance Structurelle de Formules Mathématiques Typographiées et Manuscrites (Page 55-58)