2-6 Exemples de systèmes de recherche d’images

Les systèmes complets permettant la recherche d’images basée sur le contenu peuvent être classifiés en deux groupes bien distincts: les sys-tèmes généraux qui permettent l’indexation d’images de type quelconque et les systèmes spécifiques à un domaine bien définis.

Dans la suite de cette section, plusieurs systèmes parmi les plus repré-sentatifs vont être présentés. Ils ont été choisis car ils sont complets, opé-rationnels et accessibles par le World-Wide Web.

Le plus connu de tous les systèmes d’archivage et de recherche d’images par le contenu est celui développé par IBM [31]. Leur produit commercial Query by Image Content (QBIC) permet la recherche d’images basée sur la couleur, la texture et la forme. La technologie utili-sée permet de retrouver des images possédant de une à cinq couleurs do-minantes. En ce qui concerne les requêtes portant sur la texture, l’algorithme utilisé se base sur le caractère plus ou moins aléatoire des textures ainsi que sur leur contraste. Pour retrouver une image selon une forme, un menu permet à l’utilisateur de sélectionner l’une des formes élémentaires prédéterminées. Pour préciser la requête, l’utilisateur a la possibilité de personnaliser une de ces formes. L’algorithme de recherche

Figure 2.6 : Interface pour accéder au logiciel QBIC depuis le Web.

d’après la forme (shape retrieval) nécessite la réduction des images dans les dimensions de 64 par 64 pixels ainsi que leur binarisation (représen-tant les contours). Un ensemble de 22 caractéristiques est ensuite calculé sur ces vignettes. Les caractéristiques utilisées pour représenter les images sont l’aire, la circularité, l’eccentricité, l’orientation de l’axe prin-cipal et un ensemble des premiers moments invariants. La structure d’in-dexation utilisée est un arbre-R^* et la similarité des vecteurs représentant les caractéristiques est estimée par une fonction de distance euclidienne pondérée dans l’espace des paramètres [14]. De plus, QBIC permet à l’uti-lisateur d’annoter les images par l’introduction de mots-clés. Ceux-ci sont par la suite utilisés par le moteur de recherche comme clé d’accès. Ce sys-tème, initialement proposé sur les machines AIX ou Windows est aussi accessible directement depuis le Web mais dans une version simplifiée.

QBIC a été utilisé par plusieurs organismes pour des applications bien spécifiques. On peut signaler le site permettant la recherche de timbre postaux américain, détaillé dans la deuxième colonne du tableau 2.9 [148], le site du ministère français de la culture [143] ou encore celui du Fine Arts Museums de San Francisco [137].

Un autre système très connu, appelé VIR pour Visual Information Re-trieval, est commercialisé par Virage [3][40]. Ce système est basé sur les mêmes principes que QBIC; il a par contre la particularité de pouvoir ac-céder aisément au SGBD Illustra. En outre, une interface conviviale offre la possibilité à l’utilisateur de tracer un dessin approximatif du contour de l’objet qu’il désire retrouver (figure 2.7.d). Virage est un système complet permettant l’archivage, la gestion, la recherche et la manipulation d’images de différents formats (une quinzaine de format est supporté).

Malgré le fait que le produit de Virage n’offre pas les possibilités d’accès directement à travers un butineur standard, ce système offre de très bonnes performances, que ce soit au niveau de la simplicité d’utilisation du produit, que de la qualité des résultats obtenus.

Le système VisualSEEk, proposé par l’Université de Columbia [154][105], est un prototype fonctionnel permettant la recherche d’images suivant trois modules: WebSEEk permet la recherche d’images ou de vi-déos sur le Web, CBVQ (content-based visual query system) retrouve les images suivant la couleur, la texture ou la composition des couleurs et SaFe permet la recherche d’images suivant le contenu spatial. L’origina-lité de SaFe réside dans la manière d’effectuer les requêtes basées sur la

couleur. L’utilisateur a la possibilité de tracer des régions colorées en uti-lisant l’interface écrite en Java. La disposition spatiale des régions les unes par rapport aux autres est prise en compte lors de la recherche par similarité. SaFe propose deux modes de fonctionnement: soit la position des régions est considérée en valeur absolue, soit le moteur de recherche considère les régions les unes relativement aux autres. Ce système permet donc de retrouver les images qui contiennent approximativement les mêmes régions de même couleur que le modèle. La figure 2.8 présente l’interface permettant la création des régions de différentes couleurs.

En ce qui concerne les bases de données d’images spécialisées possé-dant un outil de recherche par le contenu, elles sont généralement plus

Figure 2.7 : Interface pour accéder au logiciel VIR. (a) Interface principale per-mettant la gestion de la base de données. (b) Ajout d’une nouvelle image dans la base. (c) Recherche d’une image suivant des caracté-ristiques générales. (d) Interface permettant de dessiner approximati-vement le contour de l’objet que l’on désire retrouver.

(a) (b) (c) (d)

Figure 2.8 : Interface pour accéder au logiciel SaFe..

performantes en terme de la qualité des résultats obtenus car dédiées à une application bien spécifique.

Plusieurs systèmes permettant la recherche de marques de fabriques (trademark) ont été développés. On peut citer celui pour l’office des bre-vets anglais (UK Patent Office) [24][25][26], pour les brebre-vets américains [120][50] et pour les brevets japonais [56].

Le domaine médical est une science où la reconnaissance visuelle est une technique souvent utilisée pour aider le praticien à établir un diagnos-tic. Un diagnostic médical est facilité si le médecin possède une image qu’il a déjà rencontrée de la même pathologie. Le domaine médical a la particularité de produire de nombreuses images du patient (scanner, rayon X, etc.) et de plus de tailles très élevées. Ceci conduit au problème de ma-nipulation de très grandes bases de données. La difficulté supplémentaire intervient lorsqu’il s’agit d’attacher à l’image une description détaillée de la pathologie rencontrée. Dans cette optique, l’utilisation de systèmes au-tomatiques de reconnaissance devient alors évident [38].

Finalement, nous conclurons cette section par présenter un tableau présentant les caractéristiques de divers systèmes de recherche d’images par le contenu. Une case vide signifie que l’information n’a pas pu être déterminée.

Table 2.9 : Comparaison de différents systèmes de gestion de base de données d’images accessibles par le contenu.

Virage QBIC Excalibur Yurimage CBS

(C-Bird) SaFe Jacob MIR SWIC

Caractéristiques générales

Nombre d’images ~2.000 ~28.000 ~100.000 ~100 ~12.000 ~1.500 ~1.200 ~4.000

Format d’images 15 GIF 7 GIF JPG GIF? GIF

Taille du vecteur

représentatif 22 (forme) 2.304 8+16+8

Accès par réseau non oui oui oui oui oui oui oui oui

Temps d’accès lent ~10 s. ~10 s. ~20 s. lent très lent lent très lent ~30 s.

SDK (Soft. Dev.

Toolkit) non non C/C++ non Visual

C++ non non non non

Référence [152] [148] [136] [155] [135] [154] [142] [144] [150]

Critères de recherche visuels

couleurs oui Position de

régions

oui non non non non non oui

Recherche d’images

similaires oui oui oui oui oui non non oui oui

Sketch oui non non non non non non non oui

Gestion de la base Base de données Illustra DB2 non Illustra

Ajout d’images non non non non non non non non oui

Suppression d’images non non non non non non non non oui

Gestion des données

textuelles oui oui oui oui oui non non non oui

2-7 Conclusion

Dans ce chapitre, nous avons détaillé toutes les caractéristiques qu’un système de recherche d’images par le contenu devait posséder. Les diffé-rentes possibilités de formuler une requête ont aussi été détaillées. Dans la section 2-3, les différents critères de recherche ont été énumérés. Nous avons vu que pour l’essentiel des systèmes de recherche, les requêtes sont basées principalement sur l’information colorimétrique, la texture ou la forme; ces différents critères pouvant être combinés. La description in-terne et exin-terne des éléments composant un tel système a été énumérée.

La section 2-5 décrit les méthodes d’évaluation d’un moteur de recherche par le contenu. Les valeurs de correct/false/missed match/non-match per-mettant d’évaluer et de comparer les systèmes sont décrites. Nous avons vu que ces seules valeurs ne suffisaient pas à décrire les performances d’un tel système, mais qu’il fallait prendre en compte le rapport entre le nombre total d’images, le nombre d’images retournées, le nombre d’images similaires et le nombre d’images effectivement retrouvées.

Dans le document Acquisition, archivage et recherche de documents accessibles par le contenu : application à la gestion d'une base de données d'images de filigranes (Page 54-60)