• Aucun résultat trouvé

Recherche d’images basée sur le clustering et la recommandation

3.3 Description des couches d’Emergsem

3.3.3 Recherche d’images basée sur le clustering et la recommandation

La recherche d’images est une technique qui permet de retrouver les images avec des des-cripteurs. Pour rechercher les images, les systèmes de recherche comparent les descripteurs fournis dans la requête aux descripteurs ayant servi à annoter les images. La première tech-nique de recherche est basée sur la similarité des caractéristiques physiques des images. Les utilisateurs proposent une requête image. Le système calcule la similarité entre les caractéris-tiques physiques de la requête image et les caractériscaractéris-tiques physiques des images de la base, puis sélectionne les meilleures images. C’est une technique qui utilise la relation d’image à image. Comme les techniques basées sur la similarité entre les caractéristiques physiques ne par-viennent pas à satisfaire les attentes des utilisateurs, la technique syntaxique est proposée. La technique syntaxique est basée sur la relation de mots − clés à image. Elle consiste à comparer les mots-clés proposés dans la requête aux mots-clés décrivant les images. Mais vu les limites liées à l’utilisation de la technique syntaxique, comme nous l’avons annoncé dans la problématique générale, les recherches basées sur la sémantique des images sont proposées. La démarche orientée vers les sémantiques permet de rechercher les images à partir des res-sources permettant d’extraire les concepts et les propriétés. La recherche sémantique repose sur

Figure 3.8 – Les couches de l’approche de recherche d’images

l’intuition suivant laquelle la sémantique des images dépend des relations conceptuelles entre les objets auxquels elles font référence plutôt que des relations linguistiques et contextuelles trouvées dans leur contenu. Partant de ce fait, la recherche sémantique d’une image ne serait possible que par l’existence et l’utilisation de ressources décrivant explicitement l’information correspondant aux objets.

Dans cette section, nous présentons une technique de recherche d’images basée sur le clustering et la recommandation. Elle est composée de quatre couches : l’extraction des sé-mantiques représentatives, l’extraction des sésé-mantiques voisines, le clustering des images et la recommandation comme le montre la figure 3.8.

3.3.3.1/ Extraction des sémantiques représentatives

L’extraction des sémantiques représentatives permet d’afficher les sémantiques les plus proches de la requête de mots-clés proposée par l’utilisateur. Le principe d’extraction des sémantique représentatives est le suivant. L’utilisateur propose des mots-clés. Les sémantiques représentatives sont extraites grâce à une mesure de similarité qui compare le vecteur des

Figure 3.10 – Extraction des sémantiques voisines

mots-clés proposés au vecteur des instances de chaque sémantique du corpus. Les similarités des vecteurs des sémantiques du corpus par rapport au vecteurs de mots-clés sont affichés. Un seuil est fixé et seules les sémantiques qui respectent ce seuil deviennent les sémantiques les plus représentatives de la requête de l’utilisateur comme le montre la figure 3.10.

3.3.3.2/ Extraction des sémantiques voisines

Une fois les sémantiques les plus représentatives sont obtenues, le système procède ensuite à l’extraction des sémantiques voisines de chaque sémantique représentative. L’extraction des sémantiques voisines est basée sur la même technique que celle utilisée pour extraire les séman-tiques représentatives à la seule différence que cette fois-ci, ce sont les sémanséman-tiques représen-tatives qui sont comparées aux sémantiques du corpus. L’objectif est de créer des ensembles des sémantiques voisines à partir des sémantiques les plus représentatives de la requête de l’utilisateur comme le montre la figure 3.10.

3.3.3.3/ Clustering

Le clustering est une technique de regroupement d’un ensemble d’objets de telle sorte que les objets du même cluster (groupe) soient plus proches les uns des autres que ceux des autres groupes. Dans les systèmes de recherches d’images par le contenu, le clustering permet de grou-per les images similaires. Cette similarité peut être mesurée par la comparaison des descripteurs physiques ou sémantiques des images. Dans notre travail, nous proposons une technique de recherche d’images basée sur le cluster d’images. Le but est de grouper les images afin de permettre aux utilisateurs de disposer d’une collection d’images similaires. Contrairement au système CBIR, qui propose des clusters d’images de toute la collection d’une base de données à l’utilisateur, nous proposons des clusters d’images basés non pas sur la requête de l’utilisateur, mais sur les sémantiques voisines obtenues. La technique de clustering est composée méthodes : la formation des groupes de sémantiques au sein de chaque ensemble de sémantique voisines et la formation des clusters de sémantiques.

La première méthode est la formation des groupes de sémantiques similaires au sein de chaque ensemble de sémantiques voisines. Ces groupes de sémantiques voisines sont obtenus

Figure 3.11 – La recommandation

grâce à la comparaison de la granularité des sémantiques. La granularité est une mesure qui permet de déterminer la similarité de la structure des ontologies ayant servi à décrire les séman-tiques. L’objectif est de grouper les sémantiques au sein de chaque ensemble de sémantiques voisines en comparant leur granularité

La deuxième méthode est la formation des clusters de sémantiques. Elle permet d’évaluer la similarité entre les différents groupes de sémantiques pour observer les différences entre les regroupements. Elle est basé sur la matrice de confusion et la fonction de correspondance. La matrice de confusion est utilisée pour comparer deux groupes de sémantiques appartenant à deux ensembles et la fonction de correspondance permet de vérifier si un groupe de séman-tique appartenant à un ensemble de sémanséman-tiques voisines est similaire à un autre groupe de sémantiques se trouvant dans un autre ensemble. Les images décrites par les sémantiques du cluster de sémantiques sont proposées à l’utilisateur. La figure présente deux ensembles de sémantiques voisines contenant chacun des groupes de sémantiques similaires et un cluster des sémantiques les plus pertinentes.

3.3.3.4/ Recommandation

Les systèmes de recommandation sont une forme spécifique de filtrage de l’information vi-sant à présenter les éléments qui sont susceptibles d’intéresser l’utilisateur. Généralement, un système de recommandation permet de comparer le profil d’un utilisateur à certaines carac-téristiques de référence, et cherche à prédire le comportement d’un utilisateur3. Le système de recommandation que nous proposons vise à recommander des sémantiques aux utilisateurs en leur suggérant des sémantiques basées leurs préférences. Ceci sous-entend que l’historique des sémantiques préférées par les utilisateurs doit être pris en compte. Le système de recom-mandation que nous proposons est basé sur trois points essentiels : l’acquisition des profils des utilisateurs, la classification des profils et la génération des listes de recommandation comme le montre la figure 3.11.

L’acquisition des profils est une technique qui consisté à stocker les profils de la

Figure 3.12 – Architecture d’Emergsem

munauté d’utilisateurs. Lorsqu’un utilisateur s’inscrit, il fournit des informations nécessaires à son identification (identifiant, email, mot de passe, etc.). Ces informations représentent les informations statiques de l’utilisateur. Statiques parce que ces informations sont fournies une seule fois (même si elles peuvent être modifiées) et n’ont aucune influences sur le système de recherche d’images. Lorsqu’un utilisateur sélectionne une image dans le cluster d’images, la sémantique associée à l’image sélectionnée est également stockée. C’est la préférence de l’utili-sateur, son profil dynamique. Dynamique parce que la préférence de l’utilisateur peut changer, c’est-à-dire peut varier d’une recherche à une autre.

La classification des profils est une techniques qui permet de regrouper les profils similaires. Elle est basée sur les profils dynamiques que les utilisateurs ont en commun. Pour créer les groupes de profils dynamiques, nous avons utilisé l’algèbre de Galois. L’algèbre de Galois per-met de regrouper les objets de manière exhaustive dans les classes, appelé ”concept f ormel”, en utilisant leurs propriétés partagées. Il est généralement basé sur une matrice booléenne, appelé contexte de la matrice et noté C, dont les lignes représentent un ensemble d’objets O qu’on veut décrire et en colonnes, un ensemble d’attributs A que ces objets ont ou n’ont pas. Lorsque les groupes de profils dynamiques sont constitués, un ou plusieurs d’entre eux peuvent être recommandés aux utilisateurs. Étant donné qu’un profil dynamique peut appar-tenir à deux groupes, la génération des recommandations permet d’éliminer les doublons et de faire des recommandations personnalisées aux utilisateurs.