• Aucun résultat trouvé

Fig. 2.19: Taux d'erreur du modèle par classe

2.5 Conclusion

Un modèle CAC 2D pour l'extraction de structures de documents manuscrits non

contraints a été proposé et discuté dans ce chapitre. Cette approche montre que si nous

disposons de données étiquetées, il est possible d'apprendre et d'extraire les blocs d'un

document. Dans cette approche, nous avons utilisé de simples caractéristiques de textures

et de positions (graphiques et spatiales). Un avantage de cette modélisation est de

pou-voir combiner des informations de natures diérentes décrivant les structures physique et

logique du document. Les premières expériences sur la base de données RIMES montrent

de bons résultats même avec peu de caractéristiques.

Le modèle proposé ici est une extension 2D des modèles CACs 1D proposé dans

[Laf-ferty 01]. Ces modèles peuvent être facilement réalisés à partir de classieurs discriminants.

La complexité de ces modèles intervient principalement dans les méthodes d'inférence et

d'apprentissage. Nous avons pu voir des diérences de résultats selon les méthodes

d'infé-rence et d'apprentissage utilisées. Il apparaît cependant que le modèle que nous proposons

en utilisant un apprentissage par maximisation de la vraisemblance conditionnelle à

par-tir de pseudo-marginales demeure le plus performant. Ces pseudo-marginales ainsi que

l'inférence peuvent être obtenues de manière ecace par l'algorithme Loopy Belief

Pro-pagation.

Les résultats de notre modèle CAC 2D obtenus sur la tâche d'extraction de

struc-tures dans les courriers manuscrits de la base RIMES montrent des résultats similaires

aux meilleurs modèles de l'état de l'art. De plus, notre modèle présente de nombreux

avantages : il est doué d'apprentissage, il n'utilise aucun a priori sur la tâche ou sur les

documents traités, il combine l'extraction des structures physique et logique, il

contex-tualise les décisions, il permet de combiner des informations de diérentes natures. Il

reste cependant des erreurs d'étiquetage dans les régions où le niveau de caractérisation

n'est plus susant. En eet, des confusions apparaissent aux frontières des blocs mitoyens

lorsque les caractéristiques de texture et de position ne sont plus susantes pour

discri-miner les étiquettes. Pour corriger cela, il apparaît nécessaire d'augmenter le nombre et

la pertinence des caractéristiques utilisées. Comme décrit dans [Crasson 04] : le

ma-nuscrit est un objet complexe à la fois textuel, graphique et topographique ... qui lie de

manière entrelacée et inséparable des informations graphiques, spatiales et textuelles . Il

apparaît intéressant d'envisager l'utilisation de ces trois sources d'informations véhiculées

par un document manuscrit. Nous avons utilisé dans notre modélisation des informations

graphiques et spatiales qui font apparaître des zones d'indécision. Nous nous proposons

pour corriger cela d'ajouter des informations textuelles qui renseignent sur le contenu

sé-mantique du document. Ces informations doivent nous permettre de abiliser l'étiquetage

des zones, de corriger les mauvais étiquetages et de converger plus rapidement vers un

meilleur résultat.

87

Chapitre 3

Apport d'informations textuelles pour

l'analyse de structures de documents

3.1 Introduction

Les premières expérimentations menées dans le chapitre 2 ont montré la capacité

des modèles CACs à extraire les structures physique et logique de documents. Il

appa-raît cependant encore un certain nombre d'erreurs principalement dues aux informations

considérées dans la prise de décision. Ces informations restent peu nombreuses et très

locales. En eet, la modélisation par CAC que nous avons proposée dans le chapitre

pré-cédent n'utilise que des informations graphiques et spatiales à bas niveau (niveau pixel).

Ces caractéristiques essentiellement physiques ne nous renseignent que sur la disposition

physique des entités du document ; elles ne nous permettent pas d'extraire correctement la

structure logique. D'après [LeBourgeois 00], l'extraction de la structure logique nécessite

en eet, la prise en considération de diérentes sources d'informations textuelles qui vont

d'un niveau dit typographique, jusqu'à un niveau plus sémantique.

L'idée d'utiliser des informations de plus haut niveau comme une information

tex-tuelle apparaît comme un moyen ecace de corriger les erreurs de typage introduites par

l'utilisation exclusive des informations graphiques et spatiales. La tâche d'extraction de

structures physiques et logiques dans des documents manuscrits est une tâche encore

ré-cente voire inexistante. Aucun des travaux proposés pour résoudre cette tâche n'utilise

d'informations textuelles. Ceci est principalement dû à la complexité d'analyse de cette

information textuelle. Nous trouvons cependant des travaux sur l'extraction de blocs

fonc-tionnels dans des documents imprimés qui ont recours à une information textuelle. Les

bonnes performances obtenues dans ces travaux nous incitent à étendre cette idée à

l'ex-traction de structures dans des documents manuscrits.

La première partie de ce chapitre détaille les principaux travaux ayant recours à

l'uti-lisation d'information textuelle pour extraire des structures de documents. Nous nous

ins-pirons des travaux réalisés en recherche d'information pour sélectionner ces informations

textuelles. Pour cela, nous rappelons dans une deuxième partie, les diérentes méthodes

classiquement utilisées en recherche d'information pour sélectionner les informations

per-tinentes à une requête. Nous verrons que l'utilisation de ces méthodes nous permettra

d'automatiser la recherche d'information textuelle. Enn, nous présentons dans une

der-nière partie, le processus de détection et d'intégration de l'information textuelle dans

notre modèle CAC. Les performances de cette nouvelle modélisation seront évaluées sur

la même base de test que dans le chapitre précédent, avec le même protocole

expérimen-tal, an de pouvoir mesurer l'apport de cette information de haut niveau. Cela va nous

permettre de montrer l'intérêt d'intégrer des informations textuelles de haut niveau dans

notre modélisation CAC initiale pour abiliser l'extraction des structures de documents,

en particulier la structure logique.