Fig. 2.19: Taux d'erreur du modèle par classe
2.5 Conclusion
Un modèle CAC 2D pour l'extraction de structures de documents manuscrits non
contraints a été proposé et discuté dans ce chapitre. Cette approche montre que si nous
disposons de données étiquetées, il est possible d'apprendre et d'extraire les blocs d'un
document. Dans cette approche, nous avons utilisé de simples caractéristiques de textures
et de positions (graphiques et spatiales). Un avantage de cette modélisation est de
pou-voir combiner des informations de natures diérentes décrivant les structures physique et
logique du document. Les premières expériences sur la base de données RIMES montrent
de bons résultats même avec peu de caractéristiques.
Le modèle proposé ici est une extension 2D des modèles CACs 1D proposé dans
[Laf-ferty 01]. Ces modèles peuvent être facilement réalisés à partir de classieurs discriminants.
La complexité de ces modèles intervient principalement dans les méthodes d'inférence et
d'apprentissage. Nous avons pu voir des diérences de résultats selon les méthodes
d'infé-rence et d'apprentissage utilisées. Il apparaît cependant que le modèle que nous proposons
en utilisant un apprentissage par maximisation de la vraisemblance conditionnelle à
par-tir de pseudo-marginales demeure le plus performant. Ces pseudo-marginales ainsi que
l'inférence peuvent être obtenues de manière ecace par l'algorithme Loopy Belief
Pro-pagation.
Les résultats de notre modèle CAC 2D obtenus sur la tâche d'extraction de
struc-tures dans les courriers manuscrits de la base RIMES montrent des résultats similaires
aux meilleurs modèles de l'état de l'art. De plus, notre modèle présente de nombreux
avantages : il est doué d'apprentissage, il n'utilise aucun a priori sur la tâche ou sur les
documents traités, il combine l'extraction des structures physique et logique, il
contex-tualise les décisions, il permet de combiner des informations de diérentes natures. Il
reste cependant des erreurs d'étiquetage dans les régions où le niveau de caractérisation
n'est plus susant. En eet, des confusions apparaissent aux frontières des blocs mitoyens
lorsque les caractéristiques de texture et de position ne sont plus susantes pour
discri-miner les étiquettes. Pour corriger cela, il apparaît nécessaire d'augmenter le nombre et
la pertinence des caractéristiques utilisées. Comme décrit dans [Crasson 04] : le
ma-nuscrit est un objet complexe à la fois textuel, graphique et topographique ... qui lie de
manière entrelacée et inséparable des informations graphiques, spatiales et textuelles . Il
apparaît intéressant d'envisager l'utilisation de ces trois sources d'informations véhiculées
par un document manuscrit. Nous avons utilisé dans notre modélisation des informations
graphiques et spatiales qui font apparaître des zones d'indécision. Nous nous proposons
pour corriger cela d'ajouter des informations textuelles qui renseignent sur le contenu
sé-mantique du document. Ces informations doivent nous permettre de abiliser l'étiquetage
des zones, de corriger les mauvais étiquetages et de converger plus rapidement vers un
meilleur résultat.
87
Chapitre 3
Apport d'informations textuelles pour
l'analyse de structures de documents
3.1 Introduction
Les premières expérimentations menées dans le chapitre 2 ont montré la capacité
des modèles CACs à extraire les structures physique et logique de documents. Il
appa-raît cependant encore un certain nombre d'erreurs principalement dues aux informations
considérées dans la prise de décision. Ces informations restent peu nombreuses et très
locales. En eet, la modélisation par CAC que nous avons proposée dans le chapitre
pré-cédent n'utilise que des informations graphiques et spatiales à bas niveau (niveau pixel).
Ces caractéristiques essentiellement physiques ne nous renseignent que sur la disposition
physique des entités du document ; elles ne nous permettent pas d'extraire correctement la
structure logique. D'après [LeBourgeois 00], l'extraction de la structure logique nécessite
en eet, la prise en considération de diérentes sources d'informations textuelles qui vont
d'un niveau dit typographique, jusqu'à un niveau plus sémantique.
L'idée d'utiliser des informations de plus haut niveau comme une information
tex-tuelle apparaît comme un moyen ecace de corriger les erreurs de typage introduites par
l'utilisation exclusive des informations graphiques et spatiales. La tâche d'extraction de
structures physiques et logiques dans des documents manuscrits est une tâche encore
ré-cente voire inexistante. Aucun des travaux proposés pour résoudre cette tâche n'utilise
d'informations textuelles. Ceci est principalement dû à la complexité d'analyse de cette
information textuelle. Nous trouvons cependant des travaux sur l'extraction de blocs
fonc-tionnels dans des documents imprimés qui ont recours à une information textuelle. Les
bonnes performances obtenues dans ces travaux nous incitent à étendre cette idée à
l'ex-traction de structures dans des documents manuscrits.
La première partie de ce chapitre détaille les principaux travaux ayant recours à
l'uti-lisation d'information textuelle pour extraire des structures de documents. Nous nous
ins-pirons des travaux réalisés en recherche d'information pour sélectionner ces informations
textuelles. Pour cela, nous rappelons dans une deuxième partie, les diérentes méthodes
classiquement utilisées en recherche d'information pour sélectionner les informations
per-tinentes à une requête. Nous verrons que l'utilisation de ces méthodes nous permettra
d'automatiser la recherche d'information textuelle. Enn, nous présentons dans une
der-nière partie, le processus de détection et d'intégration de l'information textuelle dans
notre modèle CAC. Les performances de cette nouvelle modélisation seront évaluées sur
la même base de test que dans le chapitre précédent, avec le même protocole
expérimen-tal, an de pouvoir mesurer l'apport de cette information de haut niveau. Cela va nous
permettre de montrer l'intérêt d'intégrer des informations textuelles de haut niveau dans
notre modélisation CAC initiale pour abiliser l'extraction des structures de documents,
en particulier la structure logique.
Dans le document
Extraction de structures de documents par champs aléatoires conditionnels : application aux traitements des courriers manuscrits
(Page 104-107)