• Aucun résultat trouvé

5.2 Applications du transport optimal et précédents travaux

5.2.1 Comparaison d’histogrammes

Il existe de nombreuses applications qui nécessitent la comparaison d’histogrammes de caracté- ristiques, notamment en reconnaissance d’objets (voir la première partie de ce manuscrit). On appelle « bin », une cellule de quantification d’un histogramme. Pour comparer des histogrammes, on peut dis- tinguer deux catégories de mesure de dissimilarité :

– les distances « bin-à-bin » (bin to bin), qui limitent la comparaison de deux histogrammes à des opérations sur les valeurs en des positions (ou indices) identiques. C’est le cas par exemple des normes Lp, ou encore de la divergence de Kullback-Leibler ;

– les distances « inter-bins » (cross bin), qui au contraire permettent de comparer des valeurs de positions différentes, à l’image de la distance de Monge-Kantorovich, ou de l’EMD.

Comme l’illustre le schéma de la figure5.1, une mesure de dissimilarité définie dans le cadre du transport optimal est beaucoup plus robuste que les distances usuelles bin-à-bin à certaines classes de per- turbations, comme l’erreur de quantification ou les translations des modes principaux des histogrammes.

FIG. 5.1 –Illustration des différents types de perturbations affectant un histogramme.

Pour cette raison, l’utilisation du transport optimal en tant que mesure de dissimilarité a connu un essor spectaculaire, en particulier à la suite des travaux de [RTG00]. Voici quelques exemples d’applica- tions :

– Reconnaissance de formes à partir de graphes bipartites [WPR85], et d’histogrammes [LO07] ; – Recherche d’images par comparaison de signatures de couleurs ou de textures [RTG00] ; – Détection de contours et de jonctions [RT01] ;

– Recherche d’images par analyse de l’organisation spatiale des couleurs [HGS08] ; – Reconnaissance d’objets par mise en correspondance de descripteurs locaux [LO07] ; – Détection d’objets par sac de mots (Bag of features) [ZMLS07].

Une des limitations pratiques du transport est son estimation numérique lorsque la dimension de l’espace est supérieure ou égale à 2. Dans la majorité des travaux précédemment cités, le coût du transport optimal est estimé en utilisant un algorithme du simplexe, qui permet de définir la solution exacte dans le cas discret. En utilisant une distance au sol euclidienne, la complexité de cet algorithme est –de manière

empirique– entre O(N3) etO(N4), où N désigne le nombre de bins des histogrammes. Kaijser [Kai98]

montre que l’on peut réduire la complexité de cet algorithme à O(N2) en utilisant une distance au sol

c(x, y) =kx−yk1à la place de la distance euclidienne. Ce principe est utilisé par Ling et Okada [LO07]

qui proposent un algorithme pour le calcul de l’EMD avec cette distance au sol. Toutefois, le temps de calcul reste prohibitif lorsque l’on souhaite utiliser ce type de distance sur une grande base de données ou comparer des histogrammes de grandes tailles.

Approximation de l’EMD Pour remédier à ce problème de complexité, plusieurs approximations

ont été proposées.

Une première catégorie d’approximation concerne l’approche dite de « plongement métrique » (me- tric embedding). Son principe consiste à estimer de manière approchée une distance à partir d’un autre espace métrique, en contrôlant la distorsion de l’estimation. Dans [IT03], la mesure de dissimilarité EMD est calculée par plongement dans L1. Cette estimation est obtenue par des grilles de quantifica-

tion de l’espace à différentes échelles qui sont translatées aléatoirement. Les auteurs de [IT03] utilisent cette approximation pour accélérer de deux ordres de grandeur la recherche d’image dans une base avec les descripteurs définis par [RTG00]. Une approche analogue est proposée dans [LCL04]. Ce principe a ensuite été repris dans [GD04,GD05] pour la reconnaissance de formes et d’objets respectivement.

Très récemment, deux autres approches ont été suggérées pour calculer l’EMD de manière approchée en complexité linéaire. Shirdhonkar et Jacobs [SJ08] utilisent une formalisation duale de la distance de Monge-Kantorovich. Ils montrent qu’elle peut être approximée par un calcul de coefficients d’ondelettes. Dans [PW09], Pele et Werman utilisent une distance au sol tronquée, c’est-à-dire constante au-delà d’une certaine distance cmax: c(x, y) = min{|x−y|, cmax}, ce qui leur permet de diminuer le temps de calcul.

Une dernière possibilité consiste à considérer le transport en une dimension. En effet, dans le cas particulier 1D, le coût du transport s’exprime dans certains cas de manière analytique, ce qui réduit considérablement le temps de calcul. Pour se ramener à des comparaisons 1D, il est possible de modifier la définition de la mesure de dissimilarité, comme nous le proposons dans le chapitre7pour la comparai- son de descripteurs SIFT. Une autre solution, indépendamment proposée par Pitié et Kokaram [PKD07] et par Marc Bernot, repose sur des projections aléatoires 1D. La mise en œuvre de ce principe est dé- taillée au chapitre8.

Ceci nous amène au cas particulier du transport entre histogrammes unidimensionnels.

Transport sur la droite Soient f et g deux distributions continues unidimensionnelles, dont on note

respectivement F et G les fonctions de répartition. Si le coût c(x, y) est la distance |x − y|, un résultat bien connu est que le coût du transport optimal MK1(f, g) s’exprime simplement comme||F − G||1,

la norme L1de la différence entre les fonctions de répartition F et G. Ce résultat, désigné par le terme

match distance dans [RTG00, LB01], est lié au fait que le transport de Monge-Kantorovich préserve l’ordre des points sur R [Vil03] lorsque le coût c est une fonction convexe de |x − y| (par exemple lorsque p ≥ 1 dans l’équation (5.2)).

Transport sur le cercle Nous nous intéressons dans le chapitre6au cas particulier du transport entre

des histogrammes circulaires, c’est-à-dire des distributions empiriques de variables périodiques 1D. Il existe plusieurs applications où l’on rencontre des histogrammes périodiques (non nécessairement 1D) : – comparaison de descripteurs globaux : par exemple, les histogrammes d’orientation du gradient (reconnaissance de caractères avec [CS02]), et les histogrammes en espace HSV [LCL04] où la teinte est définie sur le cercle ;

– comparaison de descripteurs locaux : par exemple les SIFTs [Low04], composés d’histogrammes d’orientation du gradient, ou encore les descripteurs “Shape Context” [BMP02], histogrammes de contours en coordonnées polaires.

Dans le cas d’histogrammes circulaires, la distance au sol c(., .) est définie comme le plus court che- min sur le cercle. La propriété de préservation de l’ordre valable sur R n’a donc plus de sens. Dans le

prochain chapitre, nous allons montrer que la distance de Monge-Kantorovich peut cependant s’expri- mer de manière très simple à partir des fonctions de répartition des distributions considérées. La distance obtenue, que l’on appelleCEMD, sera utilisée pour comparer des descripteurs d’images globaux et cir-

culaires dans le cas unidimensionnel (histogrammes de teinte, d’orientation du gradient). Une analyse générale de l’intérêt du transport pour la comparaison d’histogrammes sera ensuite réalisée. Nous ver- rons au chapitre7comment exploiterCEMDpour la comparaison de descripteurs locaux dans le cadre de

la reconnaissance d’objets, que nous avons présentée dans la première partie de ce manuscrit.