• Aucun résultat trouvé

Extraction des donn´ ees par p´ eriode temporelle

4.2 Principes de l’approche d’enrichissement

4.2.1 Extraction des donn´ ees par p´ eriode temporelle

comportement social . . . 99 4.2.3 Recommandation dynamique . . . 104 4.3 M´ethodologie de validation . . . 105 4.4 Exp´erimentations r´ealis´ees . . . 106 4.4.1 Evaluation de l’approche d’enrichissement´ . . . 106 4.4.2 Evaluation des recommandations´ . . . 111 4.5 Discussion . . . 119 4.6 Conclusion . . . 120

4.1

Positionnement

Un m´edia social est caract´eris´e par l’´evolution constante des informations qu’il contient. De ce fait, les ressources, les interactions entre les utilisateurs et les tags pr´esents peuvent fluctuer d’importance au cours du temps. Le besoin de d´etecter les int´erˆets

les plus importants pour une p´eriode donn´ee, nous am`ene `a analyser ces informations comme suit :

– Utilisateur : La motivation d’utiliser cette information est la mˆeme que celle ex- pliqu´ee section3.1, sauf que nous consid´erons une personne proche d’un utilisateur donn´e comme l’utilisateur ayant annot´e les mˆemes ressources dans la mˆeme p´eriode de temps que l’utilisateur. Ce choix est bas´e sur l’hypoth`ese que des utilisateurs annotant la mˆeme ressource ont des int´erˆets semblables [Kim et al., 2011], [Guy et al.,2010] et [Cabanac,2011].

– Tag : Un tag est important pour l’enrichissement des profils comme d´ej`a mentionn´e section 2.3.4.1. Mais il peut ˆetre ambigu. Les travaux enrichissant le profil par des tags ne prennent pas en compte cette caract´eristique. Nous allons donc essay´e de g´en´erer des tags compr´ehensibles et d’´eviter ainsi l’ambigu¨ıt´e associ´e. Cela nous permet donc d’enrichir le profil utilisateur avec des int´erˆets (tags) compr´ehensibles [Meo et al.,2010].

– Ressource : Cette information a ´et´e utilis´ee pour l’enrichissement du profil sec- tion 2.3.4.2. Nous nous concentrons sur des ressources semi-structur´ees/textuelles et leurs m´etadonn´ees (description, titre et contenu) associ´es puisqu’elles fournissent des informations compr´ehensives sur le contenu de la ressource. En fait, dans le chapitre pr´ec´edent et aussi dans [Mezghani et al.,2014a], nous avons d´emontr´e que plus le tag d´ecrit le contenu de la ressource plus le tag refl`ete vraiment les int´erˆets de l’utilisateur.

– Temps : Nous ajoutons `a notre analyse du comportement d’annotation, l’informa- tion temporelle. Cette information est importante car elle permet de r´ecup´erer au fil du temps des informations sur le comportement des utilisateurs, des informations de cr´eation de liens entre deux utilisateurs, etc. Ceci permet de limiter le spectre d’analyse en analysant `a chaque fois une partie seulement des informations. Nous analysons l’information temporelle par rapport `a la ressource et le tag de la fa¸con suivante : i) pour la ressource, nous adoptons le concept de la temp´erature (propos´e par [Manzat et al., 2010] dans la section 2.3.4.2) et nous l’associons `a la ressource pour refl´eter son importance `a chaque p´eriode de temps. Nous exami- nons les ´el´ements de la relation de comportement d’annotation (tag, utilisateur et ressource) pour calculer la temp´erature de la ressource. ii) pour l’information tag, l’enrichissement est bas´e sur la contrainte temporelle qui donne plus d’importance aux tags r´ecents et populaires.

Pour r´ecapituler, l’approche d’enrichissement analyse le comportement d’annotation de chaque utilisateur `a chaque p´eriode de temps pour d´etecter les int´erˆets les plus si- gnificatifs `a utiliser pour l’enrichissement (voir figure4.1). Aussi, l’approche d’enrichis- sement consid`ere la pertinence du tag par rapport `a la ressource associ´ee pour essayer d’´eviter l’ambigu¨ıt´e associ´ee `a ces annotations sociales. L’enrichissement n’est pas une accumulation des int´erˆets trouv´es `a partir des enrichissements dans les p´eriodes pr´ec´edentes de temps.

Figure 4.1: Un aper¸cu sur l’information utilis´e pour l’approche de l’enrichissement Cette contribution d´eveloppe le sous module ”update” du module ”user modelling” de l’architecture d´etaill´ee dans l’annexe A.

Le reste de ce chapitre est structur´e comme suit. Dans la section4.2, nous pr´esentons et d´ecrivons l’approche propos´ee qui s’appuie principalement sur l’analyse du compor- tement d’annotation des personnes proches d’un utilisateur dans une p´eriode de temps pour s´electionner les tags les plus significatifs `a utiliser pour l’enrichissement. Dans la section4.3, nous expliquons la m´ethodologie de validation adopt´ee. Dans la section

4.4, nous pr´esentons et commentons les r´esultats de notre exp´erimentation sur la base sociale Delicious. Dans la section 4.5, nous discutons des principaux probl`emes trait´e par notre approche. Dans la section 4.6, nous concluons et pr´esentons les perspectives de notre travail.

4.2

Principes de l’approche d’enrichissement

Le profil utilisateur individuel est construit d’une fa¸con implicite, en utilisant la liste des tags assign´es par l’utilisateur. Le profil utilisateur est enrichi par des tags

(consid´er´e comme ses int´erˆets) dans chaque p´eriode de temps. L’approche d’enrichis- sement du profil est effectu´ee selon chaque p´eriode de temps ∆t afin de refl´eter les int´erˆets actuels de l’utilisateur. Cet enrichissement permet de d´etecter les int´erˆets de l’utilisateur actuel afin de les utiliser dans des buts comme par exemple fournir des recommandations dynamiques.

Afin d’exposer notre approche d’enrichissement, nous commen¸cons par expliquer la pr´eparer des donn´ees `a utiliser dans la section4.2.1. Ensuite, nous expliquons le pro- cessus d’enrichissement dans la section4.2.2. Ce processus est effectu´e selon les ´etapes suivantes : 1) calcul de la temp´erature des ressources, 2) calcul du poids des tags, 3) enrichissement.

Finalement, nous expliquons comment cette approche d’enrichissement peut servir pour proposer des recommandations dynamiques dans la section 4.2.3.

4.2.1 Extraction des donn´ees par p´eriode temporelle

`

A partir d’une base de donn´ees sociale, cette ´etape consiste `a diviser la base de donn´ees selon chaque p´eriode ∆t (voir figure4.2). La division a pour but de pouvoir analyser une partie des informations dans le r´eseau social selon une p´eriode pr´ed´efinie. Ceci, afin de r´eduire le spectre d’analyse et afin d’essayer de ne garder que les informations les plus repr´esentatives pour une p´eriode donn´ee.

Le choix du ∆t est important dans notre contexte. En fait, cette p´eriode nous permet de d´etecter l’´evolution des int´erˆets de l’utilisateur entre deux p´eriodes successives. Cette p´eriode devrait ˆetre coh´erente avec la quantit´e de donn´ees contenues dans le r´eseau social. La valeur de la p´eriode ∆t sera fix´ee dans l’exp´erimentation.

Figure 4.2: Pr´eparation des donn´ees

L’information temporelle est associ´ee aux informations reli´ees aux comportements sociaux : 1) l’information du comportement d’annotation (la date de l’association

d’un tag `a une ressource par un utilisateur). 2) l’information de personnes proches (la date `a laquelle deux utilisateurs sont devenus explicitement amis).

4.2.2 Processus d’enrichissement du profil utilisateur `a partir du