• Aucun résultat trouvé

La divergence de Kullback-Leibler

1.8 Mesure de similarit´e

1.8.5 La divergence de Kullback-Leibler

La divergence de Kullback-Leibler est une mesure souvent utilis´ee en th´eorie de l’information. Soit Q = {qi} et V = {vi} deux jeux de donn´ees, on a :

KL (Q|V ) =X i qiln qi vi (1.12) Dans sa forme originale, KL (Q|V ) n’est pas ´egal `a KL (V |Q). Des versions sym´etriques ont ´et´e propos´ees par [Jeffreys, 1946] et [Hetzel et al., 2001].

Version sym´etrique de [Jeffreys, 1946] : KLj(Q|V ) =

KL (Q|V ) + KL (V |Q)

Version sym´etrique de [Hetzel et al., 2001] : KLh(Q|V ) = X i (qi− vi) ln qi vi . (1.14)

1.8.6

Divergence du χ

2

Le test du χ2 est une m´ethode formelle statistique pour obtenir la dissimilarit´e

entre deux distributions de probabilit´e. La divergence χ2 est utilis´ee dans le test du χ2

pour d´eterminer si les jeux de donn´ees proviennent de la mˆeme distribution ou non. La divergence du χ2 est employ´ee pour comparer deux histogrammes Q et V [Hetzel

et al., 2001] : χ2(Q, V ) =X i (qi− vi)2 qi+ vi (1.15)

1.8.7

Distance de Hausdorff

La distance de Hausdorff est la “distance maximale entre un ensemble de points et le point le plus proche d’un autre ensemble de points” :

h (Q, V ) = max

q∈Q{minv∈V{d (q, v)}} (1.16)

o`u d (q, v) est la distance entre les points q et v.

1.8.8

Intersection d’histogrammes

L’intersection d’histogramme est une technique qui a ´et´e introduite pour l’indexa- tion d’histogrammes couleur [Swain and Ballard, 1990]. Soient deux histogrammes couleur I = {Ij} (image) et M = {Mj} (mod`ele), de tailles N , l’intersection d’histo-

grammes H(I, M ) est d´efinie par : H(I, M ) =

N

X

j=1

min(Ij, Mj) (1.17)

Le r´esultat repr´esente la quantit´e de pixels du mod`ele M ayant des pixels correspon- dants de la mˆeme couleur dans l’image I.

Afin d’obtenir une valeur normalis´ee entre 0 et 1, on norme l’histogramme par le nombre de pixels du mod`ele :

HN(I, M ) = PN j=1min(Ij, Mj) PN j=1Mj (1.18) En reconnaissance des formes, on a adapt´e l’approche par intersection d’histogrammes `a d’autres types de signatures.

1.9 Approches 2D

De plus, si les histogrammes sont de mˆeme dimension PN

i=jMj =PNi=jIj = T , on obtient 4 : 1 − HN(I, M ) = 1 − PN j=1min(Ij, Mj) T = 1 2T N X j=1 |Ij− M j|, (1.19)

la fonction 1 − HN(I, M ) est alors la distance m´etrique L1.

1.9

Approches 2D

Dans certains cas de figures il peut s’av´erer int´eressant d’utiliser des approches sp´ecifiques `a la recherche par le contenu d’image 2D `a des fins de recherche 3D. Par exemple :

1. Les mod`eles 3D peuvent ˆetre accompagn´es d’images 2D dont on peut extraire des profils de l’objet, et dans ce cas les techniques d’appariement de forme 2D peuvent ˆetre utilis´ees.

2. Des cartes de texture 2D associ´ees `a la surface des objets peuvent ˆetre stock´ees avec les mod`eles 3D. Bien qu’il peut y avoir des probl`emes de d´eformation g´eom´etrique au sein de l’image de texture, il est possible d’utiliser des techniques 2D de comparaison de texture pour retrouver des mod`eles 3D textur´es.

3. En consid´erant les vid´eos au format Quicktime 5 comme des repr´esentations 3D,

on peut appliquer des algorithmes de recherche d’image 2D sur ces vid´eos. En prenant comme exemple des vid´eos d’objets en rotation sur une table tournante, une image requˆete d’une simple vue 2D d’un objet pourrait ˆetre utilis´ee pour retrouver la vid´eo Quicktime ayant l’image la plus proche de la requˆete.

4. Il est aussi possible de g´en´erer de multiple vues 2D d’un mod`eles 3D et d’effec- tuer des recherches sur ces images 2D pour retrouver l’objet 3D correpondant, de la mˆeme fa¸con que pour l’approche avec les images 2D extraites des vid´eos Quicktime [Chen et al., 2003,Ansary et al., 2004].

Les algorithmes 2D qui peuvent ˆetre utilis´es pour ces applications de recherche par le contenu sont trop nombreux pour ˆetre expos´es ici. On distingue cependant les approches bas´ees sur la couleur, la texture, et la forme. On peut trouver dans la litt´erature des articles r´ecents qui sont de bons ´etats de l’art du domaine [Smeulders et al., 2000,Eakins and Graham, 1999].

Les cartes de texture des mod`eles 3D sont des images 2D repr´esentant des infor- mations d’apparence qui sont `a r´etroprojeter sur la surface des mod`eles 3D. Ces cartes ´etant d´efinies dans un espace rectangulaire 2D, elles pr´esentent de nombreuses distor- sions g´eom´etriques locales dues aux projections 3D-2D.

4On se sert de la relation min(a, b) = |a+b| 2 −

|a−b| 2 5http ://www.apple.com/quicktime

En particulier les couleurs ou textures de mod`eles similaires peuvent ˆetre d´eform´ees de diff´erentes mani`eres dans l’espace 2D. Il en r´esulte que les algorithmes de comparai- son bas´e sur la texture ne pourront pas fournir de tr`es bons r´esultats, s’ils ne tiennent compte que des cartes de texture g´eom´etriquement d´eform´ees.

Cependant il est possible d’´eviter ce probl`eme en utilisant malgr´e tout des algo- rithmes 2D d’appariement de texture ou de cartes de texture, qui permettent d’obtenir des r´esultats int´eressants. Les sections suivantes d´ecrivent succintement les algorithmes 2D impl´ement´es dans SCULPTEUR [F.Schmitt and T.Tung, 2003] par l’´equipe de recherche de Southampton et qui ont ´et´e d´evelopp´es dans le cadre du projet AR- TISTE [Addis et al., 2002].

1.9.1

Histogramme de couleur

On utilise souvent des histogrammes de couleur (RVB, Lab, YDrDb, etc.) pour rechercher des images similaires en se basant sur la distribution g´en´erale des cou- leurs de l’image requˆete. L’histogramme contient les fr´equences d’occurence (c.-`a-d. le nombre de pixels) des couleurs contenues dans l’image. Plus une couleur de l’image sera pr´edominante, plus sa fr´equence sera forte dans l’histogramme (cf. Figure 1.14). Notons que l’utilisation d’un histogramme entraˆıne un compromis entre la vitesse et

Fig. 1.14 – L’histogramme 3D dans un espace de couleur (RVB, Lab, YDrDb, etc.) une image par la distribution g´en´erale de ses couleurs [Addis et al., 2002].

la pr´ecision : plus l’histogramme contient d’intervalles, plus les comparaisons d’histo- grammes prendront de temps, mais plus aussi les r´esultats deviendront discriminants. Les histogrammes sont normalis´es avant d’effectuer les comparaisons, tels que leur aire soit unitaire (division par le nombre de pixels de l’image). Ainsi, la taille de l’image requˆete n’affecte pas le processus de comparaison (si on n´eglige les probl`emes de sous- ´echantillonnage). La m´ethode est bonne lorsque la requˆete est une image connue et que l’on souhaite retrouver les images ayant une distribution de couleur similaire. Elle n’est pas adapt´ee aux requˆetes bas´ees sur des extraits d’images. On note par ailleurs l’influence de la couleur du fond sur les histogrammes dans le cas particulier d’une

1.9 Approches 2D

requˆete o`u l’image repr´esente un objet 3D. C’est le principal inconv´enient de cette m´ethode pour notre domaine d’application.

1.9.2

Histogramme monochrome

L’histogramme monochrome permet d’effectuer des recherches bas´ees sur la distri- bution g´en´erale de l’intensit´e des pixels des images `a niveaux de gris. L’histogramme contient les fr´equences d’occurence (i.e. le nombre de pixels) de chaque niveau d’in- tensit´e (cf. Figure1.15). La m´ethode est adapt´ee aux images monochrome, comme les photographies en noir et blanc ou les radiographies.

Fig. 1.15 – L’histogramme monochrome caract´erise une image par la distribution g´en´erale de l’intensit´e des pixels.

Les histogrammes monochromes sont n´ecessaires lorsque la base de donn´ees contient des images monochromes car les histogrammes couleur ne sont pas assez discriminants avec ces images. Par exemple, un histogramme couleur `a 64 = 43 intervalles de va-

leur ne contient que 4 intervalles d´edi´es aux valeurs de niveaux de gris (cf. Figure1.16).

Fig. 1.16 – A nombre d’intervalles de valeur identique, l’histogramme monochrome (`a droite) est plus discriminant que l’histogramme couleur (`a gauche) pour les images monochromes. [Addis et al., 2002]

Les images en couleur sont converties en monochrome en convertissant les valeurs RVB en un intensit´e moyenne (R + V + B)/3 ou en une valeur de luminance par une combinaison lin´eaire des composantes RVB d´ependant de l’espace colorim´etrique de r´ef´erence.

1.9.3

R´egion de couleur CCV

La recherche d’images similaires par r´egion de couleur (Colour Coherence Vector ou CCV) est bas´ee sur la distribution g´en´erale des couleurs de l’image, avec une discrimi- nation sur l’homog´en´eit´e des couleurs ind´ependament de la taille variable des r´egions color´ees. Une couleur dans une image est dite coh´erente lorsqu’il existe dans l’image une r´egion de cette couleur qui est plus grande qu’un certain seuil. On cherche ici les images qui ont la mˆeme distribution de couleurs coh´erentes.

Pour cela on g´en`ere un histogramme pour les couleurs coh´erentes, et un histo- gramme pour les couleurs incoh´erentes. Ces deux histogrammes sont utilis´es s´epar´ement lors des recherches. La taille totale d’un vecteur caract´eristique d’un CCV sera par exemple 64 ∗ 2 nombres entiers. La coh´erence et l’incoh´erence sont arbitrairement d´efinis par rapport `a une surface respectivement de plus ou moins 5% de la surface totale de l’image. Ainsi, une r´egion de couleur dont la taille est inf´erieure `a 5% de la taille totale de l’image contribuera `a l’histogramme des couleurs incoh´erentes du CCV ; et une r´egion de couleur dont la taille est sup´erieure `a 5% de la taille totale de l’image contribuera `a l’histogramme des couleurs coh´erentes du CCV.

Fig. 1.17 – Histogrammes d’incoh´erence (centre) et de coh´erence (droite) de deux images (gauche) ayant des r´egions de couleur de tailles diff´erentes. En haut, les cou- leurs sont “incoh´erentes” car les r´egions associ´ees sont de trop petite taille et l’his- togramme de coh´erence (`a droite) est donc nul, alors qu’en bas les couleurs sont “coh´erentes” car les r´egions associ´ees ´etant de grande taille et l’histogramme d’in- coh´erence est donc nul.

La figure 1.17 repr´esente deux images ayant la mˆeme quantit´e de couleur : 50% de noir et 50% de blanc. L’image du haut est un ´echiquier contenant 32 cases blanches et 32 cases noires. Chaque case repr´esente donc 1/64e, soit 1.5%, de la taille totale de

l’image. Toutes les couleur de cette image sont donc incoh´erentes et seul l’histogramme des couleurs incoh´erentes sert `a la caract´eriser. Inversement, la seconde image contient deux r´egions couvrant chacune 50% de la taille totale de l’image. Ces r´egions sont donc coh´erentes et seul l’histogramme des couleurs coh´erentes sert `a caract´eriser l’image.

1.9 Approches 2D

Lorsque l’on compare les histogrammes d’incoh´erence et de coh´erence des images, on obtient bien une grande distance entre les deux images, alors que des histogrammes classiques retourneraient une diff´erence nulle comme si les deux images ´etaient simi- laires.

Comme pr´ec´edemment la m´ethode convient pour des requˆetes sur des images enti`eres mais n’est pas adapt´ee aux requˆetes bas´ees sur des extraits d’images.