• Aucun résultat trouvé

6.2 Analyse de l’intérêt du transport pour la comparaison d’histogrammes globaux

7.1.2 Distances inter-bins

On trouve dans la littérature quelques exemples d’utilisation de distances inter-bins en tant que me- sure de dissimilarité entre descripteurs SIFT.

Tout d’abord, dans l’étude comparative de descripteurs locaux réalisée dans [MS05], Mikolajc- zyk et Schmid proposent d’utiliser la distance de Mahalanobis pour des descripteurs locaux obtenus par des filtres tels que les Steerable Filters [FA91] ou par le calcul de moments invariants. En s’ins- pirant de cette étude, Moreels et Perona comparent dans [MP05] la distance euclidienne à la distance de Mahalanobis pour plusieurs descripteurs construits à partir d’histogrammes locaux (SIFT [Low04], PCA-SIFT [KS04], et Shape Context [BMP02]).

La distance de Mahalanobis entre deux descripteurs SIFT a et b est définie ainsi dans [MP05] :

DM(a, b) := p (a− b)tC−1(a− b) =   M X m,m′=1 N X n,n′=1 (am[n]− bm[n]) ωm,n,m′,n′ am′[n′]− bm′[n′]    1 2 (7.5) avec ||a||2 = ||b||2 = 1, et où C est une matrice de covariance de SIFTs, qui est en pratique estimée

empiriquement sur une base d’images. Par ce procédé, la comparaison de deux histogrammes n’est plus seulement limitée à la comparaison des bins de même indice, mais potentiellement étendue à l’ensemble des autres bins. Afin que la distance ait du sens, la matrice de covariance inverse C−1est utilisée pour

pondérer chacune des comparaisons (donnant les poids ωm,n,m′,n′). On retrouve ainsi la distance L2 en

remplaçant cette matrice par la matrice identité. Si la distance obtenue est bien « inter-bins », elle diffère grandement d’une distance de transport car les poids ωm,n,m′,n′, au lieu de dépendre des histogrammes

a et b, sont appris sur une base de descripteurs et sont ensuite fixés pour toutes les comparaisons de descripteurs, quels que soient a et b. C’est la raison pour laquelle cette distance en pratique ne présente pas de véritable intérêt par rapport à la distance L2. C’est d’ailleurs la conclusion à laquelle aboutissent

les auteurs de [MP05] : comme on peut le constater sur la figure7.1, les performances sont pour la plupart des descripteurs inchangées, et dans le cas des SIFTs, les performances sont même très en deçà de celles obtenues avec la distance euclidienne.

FIG. 7.1 – Comparaison de la distance euclidienne (DL2, figure de gauche) et de la distance de Ma-

halanobis (DM, figure de droite) pour différents descripteurs locaux pour la mise en correspondance

d’images (graphiques extraits des figures 9 et 10 de [MP05]). Dans le cas des SIFTs (courbes de perfor- mance en trait bleu interrompu), la distance euclidienne donne de meilleurs résultats que la distance de Mahalanobis.

Notons qu’une distance appelée quadratic distance à été proposée dans [NBE+93], dont l’expression est très proche de la distance de Mahalanobis. La seule différence réside dans le fait que la matrice de pondération C−1est directement définie par l’utilisateur.

Distance de transport Une alternative plus intéressante, afin de répondre au problème de la quanti-

fication, est de considérer une mesure de dissimilarité fondée sur le transport, telle que celle formalisée par l’EMD (Earth Mover Distance) [RTG00]. Dans [LO07], Ling et Okada proposent de comparer les descripteurs SIFT en utilisant la distance EMD. Rappelons que les descripteurs SIFT peuvent être vus

comme des histogrammes tridimensionnels, normalisés, représentant à la fois une orientation de gradient ainsi que la position spatiale des régions desquelles ils sont extraits. Dans leurs expériences, les perfor- mances obtenues avec l’EMD sont alors bien meilleures qu’avec la distance euclidienne, ce qui montre l’intérêt de l’utilisation du transport en terme de robustesse.

Ling et Okada présentent un nouvel algorithme de calcul de l’EMD dans le cas où la distance au sol est la distance L1(appelé EMD-L1), ce qui permet d’en réduire la complexité et de gagner deux ordres

de grandeur en temps de calcul pour les SIFTs. Néanmoins, le temps de calcul nécessaire à la compa- raison de descripteurs SIFT par l’algorithme EMD-L1 est en pratique trop prohibitif pour envisager son

utilisation pratique. En effet, d’après le tableau VII dans [LO07], la distance EMD-L1est empiriquement

720 fois plus longue à calculer que la distance euclidienne.

De plus, les auteurs de cette étude ne mentionnent pas deux aspects critiques du transport en vue de la comparaison des descripteurs SIFT :

– Circularité L’une des trois dimensions de l’histogramme 3D est circulaire (orientation du gra- dient), et par conséquent la distance au sol utilisée doit théoriquement prendre en compte cet aspect afin que le transport ait du sens ; or, la validité de l’algorithme proposé dans [LO07] n’a pas été montrée dans le cas où l’une des dimensions est circulaire.

– Normalisation Les descripteurs SIFT construits à l’aide du code original de Lowe [Low] sont normalisés avec la norme L2. Les auteurs ne précisent pas si les descripteurs sont renormalisés

selon la norme L1.

Une autre distance inter-bins a été également proposée par Ling et Okada dans [LO06]. Cette distance de diffusion (diffusion distance) est fondée sur la convolution de la différence des deux histogrammes à comparer. Cette convolution est réalisée à différentes échelles, et la distance mesure à quelle vitesse la différence des histogrammes tend vers le vecteur nul 0. Dans les expériences réalisées sur des SIFTs, les performances sont similaires à celle de l’EMD, mais le temps de calcul est beaucoup plus rapide (un facteur d’environ 6 dans le tableau 3 donné dans [LO06]) Cependant, la distance de diffusion nécessite la définition de plusieurs paramètres contrairement à l’EMD : le choix du noyau de convolution (et en particulier les différentes échelles utilisées), ainsi que le nombre d’itérations. Par ailleurs, la question de la circularité des SIFTs n’est pas abordée.

Nous allons dans la section suivante proposer une mesure de dissimilarité fondée sur la distance

CEMD, présentée à la section6.1, qui permet d’exploiter la structure circulaire des histogrammes d’orien-

tation du gradient, tout en en limitant la complexité par la comparaison d’histogrammes unidimension- nels. Notons que des travaux similaires ont été récemment publiés dans [PW08], dont nous ferons par la suite une étude plus approfondie.