• Aucun résultat trouvé

Mise à jour du profil utilisateur et évolution des intérêts

2.3. Gestion de l’évolution du profil utilisateur

2.3.2. Mise à jour du profil utilisateur et évolution des intérêts

L’approche par mise à jour du profil utilisateur consiste, à partir d’un profil utilisateur existant, à « ajuster » les intérêts dans le profil utilisateur selon les variations des intérêts réels ou les

besoins d’informations de l’utilisateur afin de conserver un profil à jour et pertinent. L’objectif est, sans recalculer l’ensemble du profil, de pouvoir retirer des intérêts du profil, en ajouter de nouveaux ou modifier des pondérations d’intérêts. La mise à jour du profil utilisateur permet également d’extraire de nouvelles informations et ainsi d’extraire et de compléter les intérêts existants dans le profil. Généralement, la mise à jour du profil utilisateur se fait en se basant sur le feedback de l’utilisateur de façon explicite ou implicite. Ces deux approches sont décrites dans les deux sous-sections suivantes.

2.3.2.1. Mise à jour explicite du profil utilisateur

La mise à jour explicite du profil utilisateur se base sur le feedback explicite de l’utilisateur. Plusieurs travaux (Papadogiorgaki et al., 2008 ; Pon et al., 2011 ; Wang et al., 2013) se basent sur l’algorithme de Rocchio (Rocchio, 1971) qui est utilisé en RI pour adapter la requête de l’utilisateur selon le retour (positif ou négatif) sur le résultat de ses précédentes recherches. Lors de la mise à jour du profil de l’utilisateur, l’ensemble de ses intérêts est actualisé selon ses jugements à propos des derniers contenus proposés. Les intérêts liés aux contenus que l’utilisateur a jugés pertinents seront ajoutés à son profil tandis que les intérêts liés aux contenus jugés non pertinents seront supprimés de son profil. Dans cette méthode, la participation de l’utilisateur est nécessaire.

2.3.2.2. Mise à jour implicite du profil utilisateur

La mise à jour implicite se fait automatiquement sans avoir besoin de feedback de l’utilisateur. Il s’agit donc de profiler l’utilisateur en prenant en compte l’aspect temporel. Les techniques citées précédemment dans la phase de construction du profil peuvent être appliquées/adaptées dans ce contexte :

- L’approche basée sur une fenêtre temporelle peut être utilisée pour sélectionner, à

chaque mise à jour, seulement les informations du dernier intervalle de temps Dt, afin de ne conserver que les informations considérées les plus récentes et les plus importantes. Les informations anciennes seront donc exclues à chaque mise à jour du profil.

- L’approche pondérée peut être appliquée pour pondérer les informations dans la

fenêtre temporelle choisie afin de privilégier les informations les plus récentes. Nous citons par exemple, le travail de (Mezghani, 2015) dans notre équipe, qui propose une approche d’enrichissement temporel du profil utilisateur à partir de tags. Cette approche s’appuie principalement sur l’analyse du comportement d’annotations des utilisateurs dans une

période de temps Dt pour sélectionner les tags les plus significatifs pour l’enrichissement du

profil. Dans cette approche, le profil utilisateur est construit de façon implicite, en utilisant la liste des tags assignés par les utilisateurs. Le profil utilisateur est enrichi par des tags à chaque

période de temps Dt. La division en période Dt a pour but de pouvoir analyser une partie des

informations selon une période prédéfinie afin de réduire le spectre d’analyse et ainsi d’essayer de ne garder que les informations les plus représentatives pour une période donnée. Dans ce contexte, le choix du Dt est important. La taille de chaque Dt doit être cohérente avec la quantité de données.

L’enrichissement du profil est effectué à chaque Dt afin de refléter les intérêts actuels de l’utilisateur. Le processus d’enrichissement comprend trois principales étapes (cf. la Figure 2.10) :

-

Etape 1 : calcul de la température des ressources : Le terme « ressource » dans ce

Une ressource peut être une image, une URL, du texte. La température d’une ressource reflète sa popularité à un moment donné. Ce calcul permet de refléter

l’importance d’une ressource pour un utilisateur donné dans chaque Dt. La

température d’une ressource est calculée en combinant les trois paramètres suivants : o La fraîcheur des tags associés à la ressource : plus les tags sont récents

plus la ressource est intéressante pour l’utilisateur. La fraîcheur d’une ressource r est calculée avec la fonction suivante :

9*Rî(ℎ+)*(*) = 1 <1(#O) M OUV ℎ ( 2.12 ) Où h représente le nombre de tags associés à la ressource r. p1(ti) représente

la distance entre l’heure d’annotation du tag ti et l’heure actuelle.

o La similarité des utilisateurs (qui ont annoté la ressource) : si deux utilisateurs ont annoté la même ressource avec des tags semblables, cela reflète leur similarité en termes d’intérêts. Ils sont donc considérés comme des personnes proches. La similarité cosinus est exploitée pour calculer la similarité entre deux utilisateurs.

o La popularité (de la ressource) qui est le nombre de tags associés à la ressource.

Pour une période ∆# et étant donné une ressource r, les trois paramètres sont

combinés pour obtenir la température !∆8 * selon la formule suivante :

!∆8 * = ] ∗ 9*Rî(ℎ+)* + ^ ∗ _:`:4R*:#é + b ∗ <'<)4R*:#é

( 2.13 ) ], ^ et b sont des constantes qui reflètent le degré d’influence de chaque paramètre et sont fixées dans l’expérimentation.

- Etape 2 : calcul du poids des tags. Après le calcul de la température de chaque

ressource, seules les ressources dont les valeurs de température augmentent entre deux périodes successives de temps (Dt-1 et Dt), sont considérées. En fait, l’augmentation de la température reflète l’intérêt de l’utilisateur envers ces ressources. Ainsi, les auteurs proposent de garder les ressources annotées les plus pertinentes, en considérant seulement les métadonnées qui reflètent le contenu de chaque ressource telles que le titre, les mots-clés et la description de la ressource. L’étape suivante consiste à attribuer un poids pour les tags associés aux ressources. Ce poids est calculé selon le degré de correspondance de chaque tag avec les métadonnées de la ressource associée.

- Etape 3 : ajout des tags pertinents. Après le calcul du poids des tags associés aux

ressources les plus pertinentes, le profil utilisateur est enrichi avec les tags les plus pertinents. Plus le tag a un poids important, plus il reflète le contenu de la ressource et donc les intérêts de l’utilisateur. Un tag est considéré comme un intérêt potentiel s’il a un poids supérieur à un certain seuil fixé lors de l’expérimentation.

Figure 2.10 Le processus d’enrichissement du profil utilisateur social pour une période Dt (Mezghani, 2015)

Différents travaux proposent de faire cohabiter les informations récentes et les plus anciennes en privilégiant les informations liées à l’activité́ courante de l’utilisateur et les informations « à plus long terme » concernant l’utilisateur. Le principe est d’utiliser deux types de profils pour le même utilisateur :

- le profil à court terme qui contient les informations récentes liées à l’activité courante

de l’utilisateur (dernière fenêtre temporelle),

- le profil à long terme qui contient des informations qui reflètent les besoins à long

terme de l’utilisateur, généralement cumulées dans le temps.

Cette approche se retrouve souvent dans les travaux du domaine de RI qui se basent sur les sessions de recherche : considérer la dernière session de recherche pour extraire le profil à court terme et les informations des sessions précédentes pour extraire le profil à long terme (Li et al. 2007), (Zemirli et Tamine-lechani, 2007), (Sugiyama, Hatano et Yoshikawa, 2004). Pour montrer le principe, nous détaillons par la suite le travail de (Sugiyama, Hatano et Yoshikawa, 2004).

Dans le contexte de la RI, (Sugiyama, Hatano et Yoshikawa, 2004) proposent une approche pour adapter automatiquement les résultats de recherche de l’utilisateur selon ses besoins. Le principe du système proposé est de détecter automatiquement les changements de préférences de l’utilisateur, sans avoir besoin de son intervention. Pour cela, le système se base sur la sélection des résultats lors des précédentes recherches et de l’historique de navigation pour mettre à jour le profil utilisateur. Quand l’utilisateur soumet à nouveau une requête au moteur de recherche, le résultat de recherche sera adapté en se basant sur son profil utilisateur mis à jour (voir la Figure 2.11).

Figure 2.11 Vue globale du système de mise à jour du profil utilisateur proposé par (Sugiyama, Hatano et Yoshikawa, 2004)

Ce système distingue deux types de préférences : les préférences à long-terme et les préférences à court terme. Les préférences à long-terme sont cumulées par l’utilisateur dans le temps. Les préférences à court terme sont extraites à partir des activités de recherches actuelles. Le profil à long terme (persistant) noté Pper contient des préférences extraites de l’historique de navigation de l’utilisateur pendant les N jours précédents. Le poids de chacune de ces préférences est la somme des poids sur les N jours. Le poids des préférences pour chaque jour est calculé avec une fonction temporelle (forgetting factor) pour donner plus de poids aux

préférences apparaissant plus récemment (cf. section 2.3.1.2.b). Le profil à court terme Ptoday

contient des préférences à partir des activités de navigation du jour actuel. Le profil à court terme est lui, calculé en se basant sur les profils partiels construits le jour même : P(cur) se basent sur les activités de session actuelle et P(br) représente le profil contenant des préférences qui se basent sur les activités des sessions précédant la session actuelle. Finalement le profil à court terme est obtenu en combinant le P(br) et le P(cur) avec la formule ( 2.14 ) suivante :

d8?efg = ; dhi + j dkNi

( 2.14 ) Où x et y sont des constantes tels que x + y = 1. Les auteurs attribuent plus de poids à y qu’à x pour donner plus d’importance à la session de recherche actuelle.

Finalement, le profil à long terme Pper et le profil à court terme Ptoday sont combinés selon la formule ( 2.15 ):

d = R dECi + j d8?efg= R dECi+ l; dhi + lj dkNi

( 2.15 )