• Aucun résultat trouvé

Tous les utilitaires de recherche d’images selon le contenu permettent de définir un ou plusieurs critères de recherche. Les primitives principales caractérisant une image sont:

Table 2.1 : Différences entre l’information-retrieval et le data-retrieval.

Attributs Information Retrieval Data Retrieval Modèle de recherche Probabiliste Déterministe Indexation Dérivée du contenu Items complets Matching/Retrieval Partiel ou meilleure

correspondance Appariement exact Types de Requêtes Langage naturel Structuré

Critères des résultats Relevance Tous les éléments Ordonnancement des

résultats Trié Arbitraire

• l’information textuelle;

• les caractéristiques globales;

• la couleur, la composition des couleurs;

• la texture;

• la forme (contour des objets);

• les régions ainsi que leurs positions absolues ou relatives.

L’utilisation de l’information textuelle est la manière la plus simple et la plus ancienne de procéder pour retrouver des images. La recherche textuelle porte sur le nom du fichier contenant l’image, ou sur une infor-mation accompagnant chacune des images. La recherche par nom de fi-chier est de loin la plus simple, et ne nécessite pas l’introduction manuelle du descriptif accompagnant les images. L’avantage de cette méthode est sa simplicité et sa rapidité lors de la recherche. Les inconvénients majeurs de cette manière de procéder se situent surtout sur le type d’information sur lequel se base cette requête. En effet, le nom du fichier d’une image est généralement sommaire et ne reflète pas en détail le contenu de l’image. Cette méthode permet néanmoins de retrouver des images simples dont le contenu peut facilement être représenté par le nom de l’image (par exemple les images de planètes, de voitures, etc.).

Si on associe un descriptif avec chacune des images, il devient pos-sible d’effectuer des requêtes textuelles plus complexes incluant les opé-rateurs or, not et and. La recherche de toutes les voitures de couleur rouge, de marque Porsche et datant de 1980 est dès lors possible. Pour effectuer une requête de ce type, il faut évidemment que toutes les images de la base de données soient stockées avec un descriptif complet. Ce principe est uti-lisé, par exemple, pour stocker les images d’anciens documents provenant de l’archive nationale du Musée Suisse du Papier à Bâle. Dans [37], une description détaillée d’une quinzaine de systèmes de recherche d’infor-mations textuelle à travers le Web peut être trouvée.

Les caractéristiques globales sont les paramètres extraits des images de manière automatique et qui décrivent des critères globaux. Ces critères permettent surtout de classifier les images de type différent dans de

grandes classes communes et permettent donc de contraindre la recherche à un sous-ensemble d’images. Ces caractéristiques sont typiquement:

• La taille de l’image (hauteur et largeur): ce critère permet de contraindre le système à rechercher des images d’une taille prédé-terminée.

• Le format de l’image (GIF, TIFF, JPEG,..): l’utilisateur désire re-trouver les images d’un certain format, car il ne dispose pas d’outils lui permettant d’afficher d’autres formats.

• Le type de l’image: les images peuvent être catégorisées suivant le nombre de couleurs qu’elles contiennent, telles les images en noir/

blanc (codées sur un bit), les images à niveaux de gris (de 0 à 255), les clip-arts, les images de type bande-dessinées (peu de couleurs sur de grandes plages) et les images naturelles (24 bits). Par exemple, si l’utilisateur n’a qu’un écran noir/blanc, il peut donc op-ter pour une recherche ne portant que sur des images à niveaux de gris.

D’autres critères globaux peuvent être définis [32], mais d’une ma-nière générale ces critères sont très aisés à calculer et permettent simple-ment d’effectuer un tri grossier sur une grande base de données avant d’effectuer une requête plus complexe.

L’information de couleur conduit à la définition de critères très utili-sés pour retrouver des images. Ces critères sont bautili-sés sur les composantes rouge/vert/bleu (domaine RGB), HLS, ou encore d’autres domaines de re-présentation colorimétrique. Certains systèmes permettent de spécifier la couleur de certaines plages ainsi que leurs positions respectives [111][112]. Le système WebSafe [153] accessible depuis Netscape permet de spécifier interactivement la position de zones de couleurs.

L’information de texture permet de décrire la variation locale des ni-veaux de gris dans les images [11]. La définition des différentes textures et la manière de les quantifier et de les représenter est un sujet de re-cherche toujours d’actualité. L’analyse de textures s’effectue suivant deux méthodes distinctes: les méthodes structurelles et les méthodes sta-tistiques [42]. Les méthodes structurelles consistent à décrire les textures en identifiant des structures primitives répétitives ainsi que leur

disposi-tion relative. Ces méthodes ne sont appropriées que dans le cas où les tex-tures sont très régulières, et n’ont pratiquement pas d’intérêt dans les autres cas. Les méthodes statistiques sont basées sur différents principes, pouvant par exemple utiliser le spectre de Fourier [97], des matrices de coocurences [66], des modèles fractaux, le modèle Markovien [72], la transformée de Gabor [22][51], les transformées en ondelettes (wavelet transform) [77].

Les informations portant sur la forme de l’objet permettent de définir des méthodes intuitives pour décrire une image en termes visuels. La cou-leur et la texture sont très utiles pour représenter les objets, la scène ou le fond de l’image. Mais pour retrouver un objet parmi une collection d’images, il faut posséder des primitives permettant de décrire un objet.

Les propriétés morphologiques les plus importantes pour indexer, et par la suite pour retrouver, un objet, sont les contours, la taille, la position ain-si que l’orientation de l’objet.

Les contours des objets peuvent être représentés par des splines [18], par des segments de droites, par les premiers moments d’inertie [131], par les contours globaux ou locaux [56], etc. La position de l’objet est plus facile à définir, car généralement le centre de gravité de l’objet est pris comme coordonnées; il est cependant nécessaire pour cela de séparer les objets du fond de l’image [67]. Pour calculer l’orientation d’un objet oblong, l’approche classique consiste à utiliser l’orientation de son plus long axe d’inertie.

L’utilisation de critères de forme nécessite une segmentation préa-lable de l’image. Cette opération difficile conduit en général à une sura-bondance de primitives extraites, dont l’utilisation est délicate [87]. Dans ce qui suit, nous n’utiliserons comme source que des images dans les-quelles les objets sont clairement séparés du fond (dessins au trait de fili-granes). L’information de forme se réduira alors aux seuls contours.

2-4 Caractéristiques des systèmes de recherche