• Aucun résultat trouvé

4.2 Traitements initiés par la machine

5.1.1 Base de données centrale

Le système est organisé autour d’une base de données qui contient une connaissance globale, qui croît progressivement au cours de l’interprétation, à propos du fonds docu- mentaire. Cette base autorise l’exploitation de propriétés globales nécessitant de considérer l’information extraite de plusieurs pages afin d’améliorer la fiabilité de certains résultats ; et le regroupement d’éléments similaires avant de soumettre ces derniers à un opérateur humain. Elle permet également une communication asynchrone entre les différentes parties du système.

5.1.1.1 Données stockées et utilisation à l’exécution

Les données stockées par cette base de données centrale peuvent être de deux types. Informations spécifiques à une image Pour ces informations, une localisation précise au

sein de l’image est possible. Un exemple de telle donnée peut être l’emplacement de la colonne « numéro de vente » dans une image représentant un tableau ; ou encore

la transcription d’un mot précisément localisé. Ces données sont produites grâce à l’interprétation du contenu des images.

Informations relatives à un ensemble d’images Ces informations disposent d’une portée documentaire pouvant aussi bien concerner une seule image (par exemple le type de page concerné), quelques images (par exemple la taille des cadres d’un lot de formu- laire précis), ou le fonds documentaire entier (par exemple le lexique des patronymes connus). Ces données peuvent être fournies au système avant son lancement sur un lot, ou acquises en cours de traitement, et peuvent évoluer en fonction des contenus détectés dans les images interprétées.

La nécessité de pouvoir reproduire l’organisation du fonds documentaire afin de tirer profit de ses propriétés, ainsi que la grande variabilité des données qui peuvent être stockées, imposent l’utilisation d’un schéma peu contraignant pour le concepteur. Ce dernier doit en effet, lors de la phase de conception du système, définir quelles seront les données à stocker et à manipuler au niveau global du système. Ces choix dépendent du fonds documentaire traité, et de l’approche choisie. Il faut dont permettre un stockage et un échange automatique des informations précédemment décrites entre les modules du système, tout en laissant une grande liberté au concepteur.

Lors de l’exécution, l’accès aux données de cette base peut être fait de deux façons : 1. en fonction des images concernées (portée documentaire) : c’est typiquement le cas

lorsque qu’on cherche à collecter les informations à propos d’une image à traiter ; 2. en fonction de la nature des données (fonction logique) : c’est le cas lorsqu’on sou-

haite procéder à des regroupements de données similaires, par exemple tous les nu- méros de page d’un livre afin de valider leur cohérence, ou tous les patronymes d’un document afin de regrouper ceux qui sont visuellement similaires.

5.1.1.2 Représentation des données

De nombreux types de bases de données offrent la possibilité de stocker facilement ces informations, de façon relativement flexible, et permettent ces modes d’accès. Certains systèmes non-relationnels1 rendent en effet possible un accès intéressant à un ensemble

d’éléments de la forme suivante :

( clé1, clé2, valeur ) (5.1)

et autorisent des requêtes qui ne spécifient qu’un préfixe des clés pour accéder à l’informa- tion.

À l’aide d’un système de ce type, une représentation semblable à celle illustrée en table 5.1peut être mise en place. Dans cet exemple, nous regroupons les données par pre- mière puis seconde clé pour permettre une représentation tabulaire. Ce type d’approche per- met d’accéder facilement aux informations relatives à une page, ou à un ensemble de pages, et également de regrouper facilement des éléments selon leur type, comme par exemple des numéros de ventes ou des patronymes.

Dans l’exemple de latable 5.1, deux informations sont associées à l’élément livre_1 : une information relative au lexique des patronymes utilisés, et une autre indiquant les pa- ramètres du modèle utilisé pour reconnaître les tableaux contenus dans les images. Ces

1. Nous reviendrons sur ce point dans le chapitre 7 consacré à la mise en œuvre effective du système proposé.

Entité documentaire Géométrie Données . . .

livre_1 lexique_patronymes = pat1.dic

taille_cadres = dim1.par

livre_1/page_1 page_type = page_vide

livre_1/page_2 page_type = registre_ventes

livre_1/page_2/annot_1 zone/coor_1 = {150, 210} colonne_no_ordre zone/coor_2 = {505, 1720}

livre_1/page_2/annot_2 zone/coor_1 = {165, 216} numero_vente/val_finale = 15 zone/coor_2 = {204, 470} numero_vente/lst_hypo

= [(15, 0.87), . . . ] . . .

TABLE5.1 – Exemple de données contenues dans la base de connaissance centrale.

informations peuvent être mises à jour au cours du traitement, si nécessaire : par exemple, lorsqu’un nouveau patronyme est validé par un opérateur humain. Au niveau de l’élément livre_1/page_2, plusieurs informations sont stockées :

1. une information relative à la nature de la page, qui peut permettre de déterminer l’outil d’interprétation à utiliser ;

2. une information à propos d’une colonne contenant des numéros de ventes, qui est localisée dans l’image ;

3. une information à propos d’un numéro de vente, lui aussi localisé dans l’image, pour lequel on dispose d’une valeur finale, et de la liste des hypothèses de reconnaissance. Une extension utile de cette représentation serait d’ajouter des métadonnées pour facili- ter la gestion des données, afin d’indiquer, par exemple, quel module a produit une certaine donnée et quand, à quel lot appartient chaque image, etc. Par rapport à l’exemple de la table 5.1, cela consiste à ajouter de nouvelles colonnes à notre représentation.

Une autre extension pourrait être d’ajouter une information de dépendance entre les données calculées, pour permettre une remise en cause en cascade lors de la modification d’un élément. Cela ne nous a pas semblé nécessaire dans nos premiers travaux, car comme nous le verrons auchapitre prochain, nous nous basons sur le modèle de page pour remettre en cause les résultats au niveau de l’interprétation de l’image.

Pour finir, on peut noter que ce type de base se prête bien à l’indexation des contenus et pourrait éventuellement être utilisé pour l’étape de diffusion auprès des utilisateurs fi- naux. Ceci éviterait les problèmes de recopie entre bases, fréquents lors de la livraison des résultats du traitement.