• Aucun résultat trouvé

Relations visuelles 2D globales

2.2 Analyse automatique du contenu artistique

2.2.5 Relations visuelles 2D globales

Dans cette section, les relations visuelles 2D globales correspondent à l'organisation spatiale des régions dans une image. Dans le cadre des arts visuels 2D, cette organisation est très proche du concept de composition artistique picturale. Cette composition est le témoin de l'agencement des régions homogènes réalisé durant l'élaboration de l'÷uvre. Cet aspect est également lié aux notions d'équilibre visuel étudié par [Arnheim, 1954].

Nous proposerons dans les deux chapitres suivants une méthode étudiant les relations visuelles 2D globales. C'est pourquoi nous détaillerons un peu plus certaines des méthodes présentées dans cette section.

Tanaka et al. étudient en 1999 la composition géométrique des tableaux [Tanaka et al.,

1999,Tanaka et al., 2000]. Leur outil extrait la proportion et la localisation des diérentes

formes. Ces formes sont tout d'abord issues d'une segmentation par ux de contours [Ma

and Manjunath, 1997]. La segmentation est suivie d'une étape de sélection automatique

des régions en utilisant des critères de contraste, texture et couleur. L'organisation spatiale des gures ainsi retenues est ensuite analysée selon des critères d'équilibre et de position- nement. Cet outil est utilisé comme outil d'aide à la création de support multimédia attrayants.

État de l'art des méthodes manuelles et automatiques d'analyse des ÷uvres d'art 2D Corridoni et al. ont étudié en 1996 et 1997 les relations visuelles liées aux couleurs [Cor-

ridoni et al., 1996,Corridoni et al., 1997]. Ils proposent une grammaire faisant le lien

entre l'ensemble chromatique bas niveau et quelques concepts hauts niveaux comme la température, l'accordance et l'harmonie, fondée sur la sémantique développée par Itten en 1961 [Itten, 1961]. Ils étudient aussi l'organisation spatiale des régions colorées après une segmentation K-moyennes dans l'espace CIE-Luv des couleurs. Le plus gros inconvé- nient de ce type d'approche est qu'en créant un pont entre les attributs bas niveaux et quelques concepts hauts niveaux comme les couleurs chaudes et froides ou le clair-obscur, les requêtes ont un champ d'application limité à la grammaire développée.

IBM a conçu au début des années 1990 un système appelé QBIC4 utilisant la distribu-

tion des couleurs indépendamment de leur position spatiale et quelques informations sur la texture de l'image [Flickner et al., 1995]. Il fut amélioré en 1997 en intégrant la position des pixels sur un partitionnement de l'image en 108 régions [Holt et al., 1997,Bird et al., 1999]. Il est utilisé encore aujourd'hui au musée de l'Hermitage à Saint-Pétersbourg.

[Del Bimbo et al., 1998] ont proposé le système PICASSO. Ce système intègre une des-

cription spatiale globale des couleurs utilisant une segmentation multi-niveaux de l'image en régions colorées. Cette représentation multi-niveaux permet de proposer ensuite à l'uti- lisateur plusieurs échelles de descriptions de l'image selon son intérêt de recherche. Les régions segmentées à chaque niveau sont regroupées dans un graphe G, où chaque région Ri est décrite par sa surface relative, sa couleur moyenne, la position globale de son cen-

troïde, les 13 moments centraux, et un vecteur cRi 1 , . . . , c Ri 128  où cRi j vaut 1 si la jeme

couleur est présente dans la région ou 0 sinon (les couleurs sont exprimées dans l'espace CIE-Luv quantié sur 128 couleurs). La distance utilisée pour comparer deux images se fonde sur le coût minimal entre les deux graphes pour comparer chaque région requête à l'ensemble des régions candidates, à l'aide d'une distance pondérée entre les diérents descripteurs de chaque région.

Dans d'autres travaux Del Bimbo et Vicario ont également proposé une mesure de similarité de l'agencement spatiale relatif de deux ensembles de pixels non nécessairement connexes [Del Bimbo and Vicario, 1998,Berretti et al., 1999,Berretti et al., 2003]. Pour deux points a et b il y a neuf directions possibles (appelées walkthroughs) représentées par les couples < i, j > avec i, j ∈ {−1, 0, 1} pour aller du point a au point b. La distance entre deux ensembles de points A et B proposée par Del Bimbo et Vicario utilise tout d'abord le calcul des poids wi,j(A, B) avec i, j ∈ {−1, 0, 1}. Ces poids sont les intégrales

sur l'ensemble des points de A et B : wi,j(A, B) = Kij(A, B)

Z

A

Z

B

Ci(xb− xa)Cj(yb− ya)dxbdybdxadya (2.1)

où Ci, i ∈ {−1, 0, 1}est la fonction caractéristique de l'ensemble R−∗, {0}, R+∗ respective-

ment. Les facteurs Kij(A, B)sont des facteurs de normalisation. Les auteurs construisent

ensuite une distance métrique DS(w, w0) permettant de comparer l'organisation spatiale

de deux paires d'ensembles de points. Ils montrent que cette distance est plus représen- tative vis à vis de la perception de l'organisation spatiale entre objets que des distances utilisant les centroïdes des régions par exemple. Cette distance a été ensuite utilisée au sein d'un système générique de recherche d'images [Berretti et al., 2002,Berretti et al., 2003]. Chaque image dans ce système est modélisée par un graphe relationnel où chaque noeud représente une région de l'image non nécessairement connexe. Chaque noeud qi

peut être associé à plusieurs attributs comme la couleur moyenne ou des indices de tex- tures. Ce système utilise une distance globale entre deux images Q et D représentées par leurs graphes relationnels [Berretti et al., 2000]. Les auteurs illustrent les performances de µΓ∗

(Q, D) par deux applications. La première application utilise une segmentation manuelle de l'image, et la deuxième utilise la méthode de segmentation proposée dans le système PICASSO présenté dans le paragraphe précédent. Cette méthodologie per- met principalement de comparer l'agencement relatif des régions entre elles, ce qui est diérent d'une étude de l'organisation spatiale globale des régions.

De même, [Onkarappa and Guru, 2007] ont étudié les relations visuelles relatives des primitives géométriques dans les dessins et schéma à base de traits. L'objectif visé est de permettre la recherche automatique de dessins similaires selon ce critère. Ils proposent une modication des matrices 9DLT [Chang, 1991]. Ces matrices traduisent de manière symbolique l'agencement spatial relatif d'éléments présents dans une image.

Auteur Techniques utilisées

[Tanaka et al., 1999,Tanaka et al., 2000] Segmentation de l'image par ux de contours

[Holt et al., 1997,Bird et al., 1999] QBIC : distance pixel à pixel d'une image sous-échantillonnée

[Del Bimbo et al., 1998] Segmentation pyramidale par K-moyennes

[Berretti et al., 2003] Distance walkthrough sur une segmentation manuelle ou auto-

matique de l'image

[Onkarappa and Guru, 2007] Matrice 9DLT modiée pour l'étude de l'agencement relatif

de primitives 1D dans un dessin

Tab. 2.7: Récapitulatif des méthodes ciblant les relations visuelles 2D globales.