Recherche d’images - Modélisation par hypergraphe

6.3 Modélisation par hypergraphe

6.3.3 Recherche d’images

Smeulders et al. [238] distinguent trois paradigmes dans la recherche d’images selon les objectifs de l’utilisateur :

– Recherche associative : Les utilisateurs de la recherche associative n’ont pas de but véri-tablement défini. L’objectif de ce paradigme de recherche d’images consiste à aider les utilisateurs à explorer la base d’images. La recherche associative implique souvent le raf-finement, via des interactions, de l’ensemble des images présenté initialement à l’utilisa-teur.

– Recherche de cibles : Ce paradigme concerne les utilisateurs qui ont pour but la recherche d’une image spécifique, par exemple la recherche de l’image d’un objet bien précis dans une collection de musée.

– Recherche de catégories : Ce paradigme consiste à rechercher le maximum d’images appartenant à une classe spécifique définie par l’utilisateur. Il peut correspondre au cas où l’utilisateur a un exemple (image) et cherche d’autres images de la même classe. Les catégories peuvent être dérivées à partir d’étiquettes ou à partir de la base de données en utilisant des mesures de similarité adéquates.

En ce qui concerne les graphes, l’interrogation d’un ensemble de graphes consiste, générale-ment, à rechercher les graphes les plus semblables à une requête donnée. Cette tâche de recherche trie les distances entre la requête et les graphes de la base dans un ordre croissant. Ce type de recherche correspond au second paradigme de Smeulders et al. lorsque l’utilisateur a pour ob-jectif la recherche d’une image précise (représentée en graphe). Dans ce cas, l’image recherchée correspond à l’image ayant le graphe le plus proche de la requête. Par ailleurs, l’interrogation classique d’un ensemble de graphes correspond aussi au troisième paradigme de Smeulders et al.. Ceci est le cas quand l’utilisateur a pour but la recherche des images (représentées en graphes) les plus similaires à sa requête. Néanmoins, l’omniprésence de bruit dans les images ne favorise pas l’utilisation de l’interrogation classique des graphes pour la recherche de catégories. En effet, le bruit dans les images entraîne des transformations dans les graphes correspondants ce qui occasionne souvent des résultats faux positifs. Dans la figure 6.4, nous illustrons un exemple des faux positifs résultant d’une recherche d’images représentées sous forme de graphes. Dans cet exemple l’image requête appartient à la classe “Glass” de la base Shape. Parmi les 10 images retrouvées par la recherche classique, six images uniquement appartiennent à la classe “Glass”. Les quatre autres images constituent des résultats faux positifs parce qu’elles n’appartiennent pas à la classe “Glass”. Ceci est dû au bruit dans les images de la base Shape qui influe sur la similarité entre les graphes des images retrouvées et le graphe de l’image requête. Dans la lit-térature, certains auteurs [205, 221, 224, 227] considèrent ce problème comme une conséquence 124

6.3. Modélisation par hypergraphe

FIGURE6.4 – Une interface graphique de recherche classique d’images représentées sous forme de graphe

du manque d’une exploitation efficace de la distribution des distances entre les graphes. En effet, afin d’améliorer les performances de la recherche de catégories, quelques travaux (e.g. [205]) proposent des techniques de recherche basées sur le clustering de graphes pour bien exploiter la distribution de distances. Dans ces travaux, les images similaires à la requête sont recherchées dans le cluster le plus proche de l’image requête au lieu de les rechercher dans toute la base. Ceci nécessite alors une phase préalable de clustering de la base d’images à interroger.

Dans la même veine, nous introduisons une procédure qui implique le modèle de l’hyper-graphe proposé précédemment. L’idée principale est de trouver le centroïde (parmi tous les cen-troïdes des hyperarêtes) le plus proche d’une requête donnée. Puis, nous recherchons les graphes les plus similaires au sein de l’hyperarête. Nous décrivons la procédure de recherche dans le modèle de l’hypergraphe comme suit :

1. Pour un graphe de requête g_q, calculer l’ensemble des distances entre g_qet le centroïde de chaque hyperarête.

2. Initialiser à vide l’ensembleRde graphes à retrouver, i.e.R=∅.

3. Déterminer le plus proche centroïde p_ià g_q. Soit h_il’hyperarête avec le centroïde p_i. 4. Récupérer l’ensembleR=R ∪ {g_j}de graphes les plus similaires à g_q, où g_j ∈h_i. 5. Si le nombre de graphes retrouvés n’est pas suffisant ou si le graphe recherché n’est pas

retrouvé, aller à l’étape suivante. Sinon, fin de l’algorithme.

6. Déterminer le centroïde suivant p_j le plus proche à g_qet h_j l’hyperarête avec le centroïde p_j. Retourner à l’étape 3 en passant à l’hyperarête suivante (h_j), i.e. h_i←h_j.

La figure 6.5 présente une illustration de cette méthode de recherche. En effet, pour une requête donnée (Figure 6.5(a)), le plus proche centroïde est repéré (Figure 6.5(b) et 6.5(c)). Ensuite, la recherche s’effectue dans l’hyperarête contenant ce centroïde (Figure 6.5(d)). Dans

Chapitre 6. Indexation d’images à base des graphes

(a) (b)

FIGURE6.5 – Illustration de la recherche de lettrines avec le modèle d’hypergraphe

cet exemple, nous considérons que la réponse à la requête est satisfaite par les images de la première hyperarête (rouge). Par ailleurs, si ce n’était pas le cas, l’algorithme va récupérer aussi les images dans la deuxième hyperarête.

Notre contribution peut être aussi utilisée dans un contexte de recherche associative d’im-ages. Nous rappelons que ce paradigme de recherche d’images consiste à aider les utilisateurs à explorer la base d’images. Pour permettre aux utilisateurs de naviguer (explorer) dans la base d’images, nous utilisons une technique de parcours en profondeur modifié de l’hypergraphe. Notre méthode consiste à utiliser les centroïdes des hyperarêtes comme les images de départ de la navigation. L’utilisateur choisit alors l’hyperarête à exploiter en sélectionnant le centroïde correspondant. Ensuite, la navigation correspond à un parcours en profondeur de l’hypergraphe. Ce parcours consiste à visiter les images appartenant à des hyperarêtes connexes. Il faut noter ici que le parcours de l’hypergraphe dépend du choix de l’utilisateur. En effet, à une étapeei de la navigation, le parcours est défini à partir d’une imageimchoisie par l’utilisateur. Ainsi, à l’étape suivantee_i₊₁, la partie explorée de l’hypergraphe consiste aux images voisines deim21. Con-crètement, la navigation de l’hypergraphe est réalisée à travers une interface graphique. Dans cette interface, l’utilisateur fait son parcours de l’hypergraphe en cliquant sur les images qui l’intéressent. Dans la figure 6.13 les clusters (hyperarêtes) sont représentés par des ellipses qui se chevauchent. Dans cette figure, l’utilisateur a sélectionné la lettrine avec la lettre D et, en cli-quant sur les lettrines voisines, a pu explorer une partie de la base liée à sa requête. Les images au centre de chaque hyperarête sont les centroïdes.

21. Les images voisines d’une imageicorrespondent aux images appartenant aux hyperarêtes qui contiennent l’imagei

Dans le document Indexation de masses de documents graphiques : approches structurelles (Page 143-146)