• Aucun résultat trouvé

Utilisation de méthodes de segmentation d'images

2.2 Analyse automatique du contenu artistique

3.1.5 Utilisation de méthodes de segmentation d'images

Rappelons qu'un certain nombre de méthodes spéciquement appliquées aux arts vi- suels ont été présentées à la Section 2.2.5. La plupart de ces méthodes sont des méthodes utilisant une segmentation ou un partitionnement de l'image.

Un certain nombre de travaux s'intéressent à l'agencement relatif de groupes de pixels dans une image, obtenus souvent par des méthodes de segmentation ou manuellement en laissant l'utilisateur indiquer les régions d'intérêt. L'agencement relatif étudié peut se traduire tout d'abord par des relations topologiques analysées à partir des intersections des espaces délimités par les formes [Egenhofer and Franzosa, 1991]. Des relations symboliques de type au dessus de ou au Nord-Ouest de, sont aussi souvent exploitées, par exemple par projection des régions sur les axes de l'espace dans la méthode 2D-strings [Chang et al., 1987]. Nous avons présenté une de ces méthodes à la Section 2.2.5 qui a été appliquée aux ÷uvres d'art [Berretti et al., 2003]. Ces méthodes s'intéressent à l'agencement spatial relatif des régions entre elles, indépendamment de leur position globale dans l'image et souvent indépendamment de leur surface, par le biais de termes de normalisation. Il s'agit donc d'une problématique diérente de celle l'étude de l'OSC.

Plusieurs méthodes de partitionnement d'images en un nombre restreint de régions rectangulaires ont été aussi proposées à partir de 1995 pour essayer de saisir la composition spatiale globale de l'image. Elles peuvent être statiques [Flickner et al., 1995,Gong et al.,

1996,Stricker and Dimai, 1997,Lipson et al., 1997] ou dynamique [Yamamoto et al., 1999]

(voir Figure 3.4). Chaque région peut être représentée par sa couleur moyenne ou son histogramme couleur. Ces méthodes de découpage de l'image utilisent une distance région à région de même position ou de même niveau, et intègrent donc aucune information de dépendance mutuelle. De même elles sont peu robustes à la stratégie de partitionnement ou au pas de quantication.

Plus récemment, les approches de découpage en régions homogènes ou RBIR2 utilisent

des méthodes de segmentation automatique d'images. Ces méthodes eectuent d'abord une segmentation de l'image en régions qui sont ensuite utilisées pour comparer deux

a) b) c)

Fig. 3.4: Diérentes méthodes de partitionnement d'images a) Partitionne- ment dynamique et construction d'un arbre binaire de régions inclues les unes dans les autres [Yamamoto et al., 1999]. b) Partitionnement ou en 5 régions dont une ré- gion centrale [Stricker and Dimai, 1997]. c) Partitionnement statique de type imagette Qbic 9 × 12 pixels [Holt et al., 1997].

images. De nombreuses méthodes de segmentation ont été utilisées, par exemple [Rugna

and Konik, 2002,Prasad et al., 2004,Aggarwal et al., 2002]. Ces méthodes sourent souvent

d'un grand nombre de paramètres. Par ailleurs les erreurs de segmentation sont très fréquentes et ont souvent une incidence sur l'indexation. Pour résoudre cet inconvénient, deux niveaux de segmentation ou description sont parfois utilisés [Dai and Zhang, 2005]. Le modèle Blobworld segmente l'image sous la forme de mélanges de Gaussiennes mul- tidimensionnelles [Carson et al., 2002]. Le nombre de Gaussiennes (appelées blobs dans ce contexte) est un paramètre important et xé par une méthode MDL (Minimum Descrip- tion Lenght). La technique MDL est issue de la théorie de l'information [Rissanen, 1978]. Elle consiste à chercher le meilleur compromis entre un minimum de paramètres utilisés (le nombre de blobs) pour réprésenter un ensemble de données (l'image) et un maximum de délité aux données. La mesure de similarité pour comparer deux distributions de blobs est une distance de Mahalanobis.

[Wang et al., 2001] ont proposé le système appelé SIMPLicity. Ce système utilise un

algorithme de segmentation k-moyennes appliqué aux bloc 4 × 4 pixels de l'images et où k est le nombre de régions recherchées. Pour xer k, l'algorithme utilise des valeurs croissantes de k jusqu'à ce que la distance quadratique entre les blocs et les centres des clusters trouvées soit inférieure à un seuil xe. Chaque bloc de 16 pixels est caractérisé par 6 descripteurs correspondant à la couleur moyenne du bloc dans l'espace LUV, et 3 descripteurs issus d'une analyse en ondelettes. La mesure de similarité entre deux groupes de régions est une distance de Mahalanobis.

Plusieurs approches utilisent une méthode de segmentation conjointement avec la dis- tance EMD vue à la Section 3.1.3. [Liu et al., 2005] utilise la segmentation JSEG [Deng

and Manjunath, 2001] avec un étiquetage sémantique des couleurs de chaque région trou-

vée. Ils utilisent la région EMD pour comparer deux ensembles de régions où chacune est pondérée par la surface relative de la région par rapport à l'image. [Jing et al., 2004] utilisent également la méthode de segmentation JSEG avec l'EMD. Ils ajoutent de plus un schéma de contrôle de pertinence (Relevance Feedback).

Recherche d'images selon l'organisation spatiale des couleurs

[Greenspan et al., 2000,Dvir et al., 2002] utilisent la segmentation BlobWorld décrite

ci-dessus et l'EMD pour comparer deux distributions de blobs. La distance au sol utilisée pour comparer deux blobs entre eux est une distance de Fréchet [Fréchet, 1906]. Les au- teurs illustrent cette méthode pour deux applications. La première est une problématique de recherche d'images. Nous utiliserons cette méthode pour la comparer à notre métho- dologie. La deuxième application est celle de l'adaptation du modèle d'une image requête en fonction d'une cible. Pour adapter une possible sur-segmentation ou sous-segmentation introduite par la méthode BlobWorld dans la requête, les auteurs suggèrent une straté- gie itérative de fusion ou scission de blobs lorsque l'EMD indique que des blobs ont été eectivemment fusionnés ou scindés lors du transport optimal vers une image cible.

[Gousseau, 2003] a proposé une comparaison de l'organisation spatiale de deux images

en noir et blanc en utilisant leurs ensembles de niveaux. Soit une image u, les ensembles de niveaux dit inférieurs sont les ensembles χλ(u) = {x ∈ R2, u(x) ≤ λ} où λ parcourt

le spectre des niveaux de gris. En considérant ces ensembles de niveaux comme des réali- sations d'ensembles fermés aléatoires, et en utilisant un test topologique d'indépendance entre ces réalisations pour deux images, il introduit une mesure de l'indépendance topo- logique et spatiale entre deux images. Plus deux images ont leurs ensembles de niveaux dépendants, plus elle ont une organisation spatiale similaire. Cette méthode peut dicile- ment se généraliser aux images couleurs, car les relations d'inclusions sont alors perdues.

3.2 Comparaison de l'OSC sous la forme d'un problème