• Aucun résultat trouvé

Les performances des SRIC dépendent largement de la mesure de similarité/dissimilarité utilisée pour la comparaison des descripteurs des images. L’un des attributs les plus utilisés dans les SRIC est la couleur, et le descripteur le plus courant et le plus rencontré dans la

littérature est l’histogramme couleur. De très nombreux auteurs ont proposé diverses manières d’utiliser l’histogramme comme descripteur, ainsi que diverses distances associées qui permettent de mesurer la similarité entre deux histogrammes.

La distance Euclidienne est le plus souvent utilisée pour mesurer la similarité entre les histogrammes, mais malheureusement cette distance n’est pas optimale pour la comparaison de ce type de signature. Parmi les nombreuses techniques de calcul de similarités qui ont été proposées, on trouve l’intersection des histogrammes [Swa 91]. Cette mesure est équivalente à une distance L si les histogrammes sont normalisés. Une deuxième manière de mesurer la 1

similarité entre les histogrammes est de voir l’histogramme comme une distribution, et ainsi utiliser l’entropie comme similarité [Kul 59]. Une version symétrique de mesure par l’entropie est aussi proposée [Puz 97], ainsi qu’une mesure probabiliste au sens de Chi−2 [Set 95]. Malheureusement ces techniques comparent indépendamment les valeurs des histogrammes sans prendre en considération la corrélation entres les composantes. Ceci pose des problèmes en termes de robustesse puisqu’elles sont sensibles à certaines transformations, notamment la translation. Des mesures plus robustes sont proposées, comme les distances sur les distributions cumulées [Str 95], l’Earth Mover’s Distance [Rub 99], ou les distances quadratiques généralisées. Ces méthodes sont efficaces pour la mesure de similarité mais elles ne traitent pas le problème de la non linéarité des données, de plus elles sont coûteuses au niveau temps de calcul particulièrement dans le cadre de l’apprentissage.

En fait, dans les SRIC, les images ne sont pas représentées par un unique vecteur relatif à un attribut, mais un ensemble de vecteurs se rapportant aux différents espaces de caractéristiques (couleur, texture, forme, etc.). Le problème qui se pose alors, est de savoir comment combiner plusieurs mesures définies souvent sur des domaines différents et éventuellement avec des importances variables différentes. Néanmoins, les résultats expérimentaux montrent, de manière évidente, que la prise en compte simultanée de plusieurs attributs donne toujours de meilleurs résultats par apport à l’utilisation d’un seul et unique attribut [Pic 96b].

Généralement, on va être amené à combiner des mesures établies indépendamment les unes des autres. Les difficultés sont au moins de trois ordres :

* Les domaines de définition des attributs sont différents.

* Les attributs ne sont pas toujours indépendants les uns des autres. * Leurs importance n’est pas la même.

La littérature présente plusieurs formes de combinaison entre différentes mesures de similarité plus au moins justifiées. Nous citons uniquement les techniques les plus fréquemment utilisées dans les SRIC.

Une des techniques courante consiste à concaténer les différents types de vecteurs puis d’uniformiser les échelles avec une distance de Mahalanobis. Les systèmes CANDID [Kel 95], QBIC [Nib 93] et Netra [Man 96b] offrent la possibilité de combiner facilement les descripteurs

de texture et de forme en calculant séparément les mesures de similarité pour chaque type de descripteurs puis en dérivant une mesure composée de similarité globale. Les descripteurs couleur peuvent également être intégrés dans la combinaison. Ce type de distance demeure confronté aux problèmes du choix des pondérations et de la non linéarité des données.

Quand les composantes sont indépendantes, des mesures plus simples suffisent. VISUALSEEK [Smi 96] utilise une simple somme entre la distance spatiale (elle-même une simple somme) et la distance de couleurs (une distance quadratique adaptée). Cha et Chung [Cha 98] proposent encore une somme des différences absolues entre la moyenne et l’écart-type respectivement sur les quatre quadrants et trois canaux d’images RVB2. Une somme des différences quadratiques,

pondérée par l’inverse de la variance correspondante, est utilisée pour la texture (granularité, contraste et direction) et la forme dans QBIC [Fal 94].

Il est généralement difficile de faire un choix parmi toutes les techniques de mesure de similarité. Le choix d'une mesure particulière dépend non seulement de l'application, mais également de plusieurs facteurs tels que la distribution des données, le temps de calcul, la complexité, etc. Chaque mesure présente des propriétés différentes, et l’intérêt d’une mesure de similarité par rapport à une autre, notamment dans un SRIC, réside dans sa capacité à s’adapter aussi bien à l’application visée, qu’à la nature des données utilisées pour la description des images.

A la différence des mesures de similarité présentée dans les paragraphes précédents, les fonctions noyaux offrent de nombreux avantages pour l’analyse et l’exploitation des descripteurs d’images. Comme nous allons le voir, les fonctions noyaux définissent, le produit scalaire dans l’espace multidimensionnel à travers une fonction de base φ par :

> Φ Φ =< ( ), ( ) ) , (V1V2 V1 V2

k . L’intérêt de l’approche noyau vient du fait que seul le noyau k doit

être défini alors que la fonction de base φ n’est jamais explicitement calculée. Ceci offre un grand choix d’utilisation des fonctions de bases non linéaires, possédant des capacités pour s’adapter à la diversité des caractéristiques des descripteurs. Avec l’approche noyau, on peut également obtenir un cadre mathématique formel à partir duquel une seule mesure de similarité pour différents types de données peut être établie. Ceci, permet ainsi de faciliter le processus d’indexation et de contourner les problèmes liés à la combinaison de plusieurs mesures de similarité exposés dans les paragraphes précédents.

4 Similarité par approche noyau

Dans le paragraphe suivant, nous nous intéressons à la notion de similarité par approche noyau. Nous présentons d’abord le principe du "Kernel Trick", qui permet de transformer une méthode basée sur le produit scalaire en une méthode à noyau. Nous aborderons ensuite les exemples de fonctions noyaux les plus utilisées dans la littérature. Enfin, nous détaillerons la généralisation de la notion de distance par des fonctions noyaux.

2 ( , ) ( ) ( ) ( ) ( ) 2 , 1 , 4 3 2 , 1 , 2

1V moy V moy V ecart V ecart V

V