Contribution à l’interprétation de fonds documentaires

9.1.1 Rappel des objectifs

Les fonds documentaires anciens et dégradés sont des données difficiles à traiter. Les systèmes existants se basent sur deux sources de connaissance pour interpréter les images : les connaissances extraites de ces dernières, et des connaissances à priori fournies par le concepteur. Toutefois, ces systèmes échouent à produire des résultats fiables face à l’in- certitude, à la variabilité et au volume des fonds d’archives. De plus, leur conception peut devenir complexe dans ces circonstances.

Notre objectif a donc été de chercher comment permettre une diminution de l’effort manuel nécessaire à la correction des résultats produits par ces systèmes, sans augmenter la difficulté de leur conception.

Nous avons montré que de nouvelles sources de connaissance devaient être utilisées : le contexte documentaire, et les opérateurs humains, que l’on a proposé de regrouper sous le terme « d’environnement » lors de l’interprétation d’une page. Ces sources de connaissances doivent être utilisées pendant les traitements, pour permettre au système de prendre de meilleures décisions, et corriger au plus tôt ses erreurs.

Six contraintes fondamentales découlent de ces observations.

1. Un mécanisme itératif est nécessaire à la mise en place d’une interprétation contex- tuelleet assistée, afin de permettre un apport incrémental d’informations au système, et la réinterprétation des pages à mesure que de nouvelles connaissances sont disponibles. Ce mécanisme permet un échange à double sens entre une page et d’autres pages, mais aussi entre un module d’interprétation de page et un opérateur humain, à mesure que le système progresse dans l’interprétation.

2. Un niveau global doit permettre la gestion de la circulation d’informations entre les pages du fonds documentaire, et avec les opérateurs humains.

3. L’interaction entre les parties du systèmes doit être asynchrone pour éviter de faire attendre les opérateurs humains, ou bloquer les modules de traitement automatiques. 4. Au niveau de la page, l’information externe doit être fusionnée avec l’information extraite de l’image, afin de permettre la remise en cause des résultats produits précé- demment, et la génération de nouveaux résultats plus fiables.

5. Afin de minimiser la sollicitation des opérateurs humains, il est nécessaire de permettre au système de réclamer l’information qui lui manque. Toutefois, dans la mesure où la mise en place de mécanismes de détection d’erreurs n’est pas toujours possible, il faut laisser aux opérateurs humains la possibilité de détecter spontanément les erreurs et les corriger.

6. La conception doit rester simple et centralisée. La description de la page ne doit pas être perturbée par des considérations temporelles ou des échanges d’information avec son environnement. Elle ne doit pas non plus être fragmentée entre plusieurs modules. La gestion de la circulation au sein du système doit donc être gérée automatiquement.

9.1.2 Points forts de nos travaux

Nous avons proposé une architecture et une méthode pour transformer un système existant et lui permettre de répondre aux besoins exprimés précédemment.

Le modèle de système que nous proposons permet au concepteur de s’appuyer, lors de la description du contenu de la page, sur des connaissances qui seront extraites globalement, sans avoir à savoir comment elles seront produites. Pour bénéficier de ces connaissances, il n’a qu’à exprimer :

– au niveau de la page : des propriétés à propos des contraintes de cohérence des conte- nus, et identifier les parties de la description impactées par les erreurs qu’il peut anticiper ;

– au niveau du fonds documentaire : un scénario décrivant la circulation de l’information entre les modules utilisés.

Au prix de cette perturbation minime de la description de page, notre mise en œuvre d’un mécanisme itératif global permet de gérer automatiquement :

– l’interruption de l’interprétation en cas d’erreur ;

– l’échange d’informations entre le module d’interprétation de page et son environnement ;

– la réintégration d’informations contextuelles au niveau de la page, leur validation, et la production de nouveaux résultats plus fiables.

Ces opérations, presque invisibles pour le concepteur, permettent une correction des erreurs, détectées automatiquement ou par un opérateur humain, au cours des différentes itérations du traitement global.

Notre approche permet donc, pour des scénarios bien écrits par le concepteur, une di- minutionde la quantité de travail manuel nécessaire pour atteindre un objectif de qualité donné, par rapport aux approches où les corrections sont effectuées après les traitements, et ce sans augmenter l’effort de conception nécessaire. La description de la page reste exempte de considérations temporelles, et unitaire. Grâce au niveau de décision matérialisé par le module de stratégie globale, il est également possible de gérer en un point unique la quan- tité de travail manuel qui sera nécessaire pour le traitement d’un fonds.

9.1.3 Intérêt pour la communauté scientifique

Pour la communauté scientifique du traitement de documents, nos propositions ont trois avantages majeurs.

Elles ont, tout d’abord, été validées rigoureusement à quatre niveaux :

Formel Nous avons montré auchapitre 6la cohérence intrinsèque de nos travaux.

Pratique Nous avons montré auchapitre 7la réalisation effective d’un système global et son application à des cas concrets.

Expérimental Nous avons montré auchapitre 8la validation numérique de scénarios mise en œuvre à l’aide de nos outils sur des cas artificiels avec des données significatives : 1 637 vignettes de nombres, dans le cas du problème de sous-segmentation, et plus de 11 000 vignettes de patronymes, dans le cas du problème de transcription.

Productif Nous avons exploité les outils que nous avons réalisés pour construire un sys- tème capable de traiter les documents fournis par les Archives départementales des Yvelines, dans le cadre du partenariat que nous avons évoqué en introduction. Ceci représente, à l’heure où nous écrivons ces lignes, plus de 1 200 pages.

Nos propositions sont, par ailleurs, faciles à transposer dans un autre contexte. En effet, la formalisation de notre approche la rend indépendante d’un système existant, et nous avons montré qu’elle pouvait être appliquée pour étendre la méthode DMOS-P. Les mécanismes à la base de la mémoire visuelle sont mis en œuvre à l’aide de structures de données simples à reconstruire. L’extension du langage de description que nous avons proposés s’appuie quant à elle sur des mécanismes standards de continuation, qui sont disponibles dans la plupart des langages de programmation. La transformation d’un système existant en vue de le rentre interactif, et capable de s’intégrer dans une architecture globale itérative, peut donc être réalisée relativement simplement.

Finalement, notre architecture globale facilite l’intégration de travaux de diverses ori- gines. Grâce à une communication asynchrone entre les modules du système, et au principe selon lequel le module d’interprétation de page ne fait pas d’hypothèse sur l’origine des données qu’il exploite, il est facile d’ajouter de nouveaux modules et de les composer pour réaliser des traitement globaux complexes. D’un point de vue plus pragmatique, cela permet d’utiliser simplement, au niveau du traitement de la page, des outils réalisés par plusieurs personnes.

Dans le document Interprétation contextuelle et assistée de fonds d'archives numérisées : application à des registres de ventes du XVIIIe siècle (Page 192-194)