• Aucun résultat trouvé

Organisation générale d’un SREM

I. 5.3.1.2 Comparaison de chaînes

II.2. Organisation générale d’un SREM

La RdF se considère comme une science d‟élaboration d‟algorithmes permettant de classer des objets dans l‟aspect varie par rapport à un objet type. Elle s‟intéresse à la conception et à la réalisation des systèmes (Matériels ou logiciels) capable de percevoir à une certaines mesure d‟interpréter des informations captées dans le monde physique [BEL 92].

Depuis plusieurs années, de nombreux travaux de recherche ont porté sur les systèmes de reconnaissances hors-ligne ont vue une progression remarquable. Ainsi plusieurs méthodes ont été développé en sorte d‟aider à atteindre des systèmes satisfaisants qui sont existés dans des domaines d‟applications variés tels que la lecture automatique des adresses postales, les chèques bancaires et le traitement des documents ; etc. Il faut distinguer deux types d'écriture manuscrite hors-ligne. Dans le premier cas, chaque caractère est séparé par l'utilisateur. Dans le deuxième cas, les caractères sont écrits normalement, c'est à dire, les caractères se sont touchés. C'est le système qui doit séparer ces caractères. Le problème devient plus difficile. Dorénavant, quand on parle d'écriture manuscrite, on aborde le deuxième cas.

On s'appuie sur le schéma classique d'un processus de reconnaissance de l‟écriture hors-ligne pour décrire les principaux traitements à effectuer. La construction d‟un SREM comprend plusieurs étapes distinctes. Les étapes sont représentées par la figure suivante [SOU 06]. Dans un premier temps une phase d‟acquisition est réalisée afin de numériser l‟information manuscrite à reconnaitre, suivi d‟un ensemble de prétraitements permettant de réduire au maximum la variabilité intrinsèque à l‟écriture ainsi que les bruits introduits lors de l‟acquisition. Une seconde étape optionnelle, est celle de la segmentation. Ensuite une étape d‟extraction des caractéristiques sera

réalisée ; son but est la réduction de la quantité d‟information et d‟extraction des caractéristiques les plus pertinentes pour la reconnaissance. Nous passons à la phase d‟apprentissage. Elle permet d‟estimer les différents paramètres de la modélisation choisie, à partir du corpus de données d‟apprentissage. Cette étape permet d‟obtenir un dictionnaire d‟hypothèses possibles. Un module de post-traitement peut-être ajouté, en introduisant des informations supplémentaires et : ou complémentaires, pouvant être de différentes nature : contextuelles, lexicale, syntaxique, sémantique. Elle a pour but d‟améliorer le taux de la reconnaissance.

Figure II.1. Schéma général d'un système de reconnaissance de l’écriture hors-ligne.

Pour arriver à concevoir un bon SREM, il faut bien saisir et comprendre le rôle de chacune des composants qui sont illustrés dans la figure II.1. Il est bon de noter : • qu'il n'y a pas nécessairement de composants fonctionnels dans tous les SREM. Un SREM peut prendre charge de la fonction de classification sans avoir auparavant explicitement extrait les caractéristiques au moyen, par exemple, d'une certaine forme quelconque d'appariement par référence.

• que des composants fonctionnels ne sont pas toujours mis en place à titre de composants incompatibles. Ainsi, un objet logiciel peut extraire des caractéristiques et les classifier simultanément.

• que des composants fonctionnels n'interviennent pas nécessairement en séquence. De fait, dans de nombreuses applications, un nombre important d'extractions de caractéristiques sont effectuées avant la segmentation.

I.2.1. Phase d’Acquisition d'image

L‟opération d‟acquisition constitue l‟interface entre le système et le monde réel. Cette étape consiste à capter l‟image d‟un texte au moyen des capteurs physiques (scanner,

caméra,…) et de la convertir en grandeurs numériques adaptés au système de traitement, avec un minimum de dégradation possible.

Cette étape est assez simple mais très importante car elle influence sérieusement les étapes suivantes. Il y a deux paramètres important :

 Résolution: la résolution normale est 300 dpi. Pourtant, quand la taille de l'écriture est petite, il faut augmenter la résolution. La résolution du scanner (nombre de points par pouce : ppp ou dots per inch: dpi) désigne sa capacité à digitaliser les traits fins.

 Niveau d'éclairage : si on ajuste le scanneur pour que l'image soit plus claire, le bruit est réduit mais des traits minces disparaissent aussi.

II.2.2. Phase de Prétraitement

L‟étape de prétraitement présente un niveau de complexité plus important en mode d‟acquisition hors-ligne que pour le mode en-ligne. Elle a pour but de réduire au maximum les bruits dans l‟image et d‟éliminer autant que possible les variabilités liées au style d‟écriture [BEL 92], qui peuvent provenir de différentes sources : le matériel, le scripteur ou encore le contexte [BRO 83]. En ce qui concerne le matériel, certains sont dû, d‟une part au positionnement du papier sur le scanner, créant des inclinaisons, des bombages et des pliures du papier, et d‟autre part à son contenu hétérogène, le processus de vieillissement fait apparaître des tâches d‟humidité, la transparence de l‟encre sur les rectos, la fragmentation des contours fins, ... etc. Pour toutes ces raisons la phase de prétraitement est indispensable dans un SREM.

Cette phase consiste à préparer les données issues du capteur à la phase suivante. Il inclut toutes les fonctions effectuées avant l'extraction des caractéristiques pour produire une version « nettoyée » de l'image d'origine. Il s‟agit essentiellement de réduire le bruit superposé aux données et essayer de ne garder que l‟information significative de la forme représentée, de corriger les erreurs, d‟homogénéiser, normaliser et réduire les données [BEL 92].

Figure II.2. Effets de certaines opérations de prétraitement. II.2.2.1. Réduction du bruit

Le bruit se manifeste par la présence d‟informations résiduelles qui perturbent les données appartenant à la forme. Il est souvent dû aux capteurs (appareils de mesure …). L‟atténuation du bruit est un traitement préliminaire souvent difficile à effectuer car il n‟est pas forcément bien localisé.

Dans le cas des images, parmi les méthodes de suppression de bruit les plus courantes, on retrouve le seuillage et le lissage.

Documents relatifs