Adaptation aux items de natures différentes

3.3 Résultats de la modélisation temporelle de la diversité

a∈A_cu t∩A_cu t−j

a∈A_cu t∩A_cu t−j

i₁.a−i₂.a maxa−mina

Adaptation aux items de natures différentes

3.3 Résultats de la modélisation temporelle de la diversité

3.3.3 Adaptation aux items de natures différentes

3.4 Discussion . . . . 71

Comme nous l’avons vu dans l’état de l’art présenté dans le Chapitre 1, et notamment à

travers les travaux de [Castagnos et al., 2010], le besoin en diversité des utilisateurs n’est pas

une dimension statique. Cette dimension évolue en fonction du contexte des utilisateurs, en

fonction de l’intention d’achat. Par exemple, proposer un niveau de diversité adapté dans les

recommandations améliore l’utilité de ces dernières. Malgré les conclusions apportées par ces

travaux concernant la prise en compte du besoin en diversité, nous n’avons pas trouvé d’approche

dans la littérature proposant de modéliser l’évolution en diversité au cours du temps à l’échelle

des consultations des utilisateurs.

Dans ce chapitre, nous présentons le modèle que nous avons développé afin de répondre à cette

problématique. Nous illustrons tout d’abord le principe de notre modèle avant de présenter

son formalisme. Les résultats de modélisation obtenus sur les différents corpus que nous avons

introduits dans le Chapitre2 sont ensuite explicités. Enfin, nous clôturons cette partie par une

discussion à propos des atouts et des limites de notre modèle, mais surtout des perspectives

offertes que nous mettrons en application dans les chapitres suivants.

3.1 Principe

Calcul de la diversité

La diversité telle que nous l’utilisons dans la suite de ce manuscrit correspond à la définition

de [Smyth and McClave, 2001] que nous avons présenté dans la Section1.3.1 p.37. Cette

diver-sité est définie comme étant l’inverse de la similarité. Ainsi, connaissant une valeur de similarité,

nous pouvons calculer la diversité correspondante. Nous entendons calculer cette similarité sur la

base de l’ensemble des attributs des items indépendamment, mais également calculer la moyenne

des valeurs de similarité. Ne pas nous contenter de conserver uniquement la moyenne de la

simila-rité nous offre l’avantage d’obtenir une mesure de similasimila-rité possédant autant de dimensions que

les items comportent d’attributs. Ainsi, si les items possèdent x attributs, la diversité entre deux

items pourra être représentée sur au moins x dimensions. Alors que la moyenne de l’ensemble des

valeurs de diversité pourra servir d’indicateur général de la variation de diversité, les diversités

de chaque attribut permettront une analyse détaillée de l’évolution de la diversité.

Évolution temporelle

Le modèle que nous avons conçu s’inspire de certains algorithmes de traitement du langage

naturel [Bonnin et al., 2012] dans lesquels il est question de représenter un problème sous la

forme d’un N-gramme ou encore selon une représentation Markovienne d’ordre n. Cependant,

dans notre cas, nous n’entendons pas calculer des probabilités d’apparition du prochain item

mais utiliser le principe d’une fenêtre glissante afin de calculer la diversité apportée par un item

par rapport à un historique de petite taille constitué par les items consultés précédemment. La

Figure3.1 illustre le principe de notre modèle.

Figure 3.1 – Illustration du fonctionnement de notre modèle

Sur la Figure 3.1nous appelons l’item courant cible et les n consultations précédentes

im-pliquées dans le calcul de la diversité historique. Ainsi, à chaque nouvelle consultation d’un

utilisateur, la cible et l’historique changent et une nouvelle valeur de diversité est alors calculée.

Dans cet exemple, la diversité est calculée sur la base de 5 attributs qui sont le genre, la

du-rée, l’énergie, l’ambiance et la popularité des musiques. Nous avons également représenté deux

situations qui correspondent à des historiques de tailles différentes, un historique de taille 3 et

un historique de taille 4.

3.2. Formalisme

3.2 Formalisme

Afin de calculer l’évolution de la diversité au cours du temps, nous avons défini un formalisme

générique qui peut être utilisé sur n’importe quel corpus de données. La seule contrainte à

respecter étant que les items doivent posséder des attributs à partir desquels une mesure de

similarité (et donc de diversité) peut être calculée et qu’ils soient consultés en séquence.

Les notations que nous avons utilisées sont les suivantes :

I ={i

, i

,...,im} est l’ensemble des items qui sont consultés par les utilisateurs.

U ={u

, u

,..., u

} est la liste des utilisateurs et u représente l’utilisateur courant.

T ={t

,...,t

, t

} est à la liste des pas de temps. t

représente le temps courant,t

le pas de

temps précédent,etc.

C={c

, c

,...,c

} est l’ensemble des consultations. Une consultation correspond à un item i∈I

ayant été consulté à un pas de temps donné t∈T par un utilisateur u∈U.

C

représente l’historique récent de taille kau pas de temps t ∈T de l’utilisateuru ∈U. Cet

historique peut également être représenté sous la forme d’une séquence de consultations< c

,

...,c

,c

,c

Figure ^{3.1 – Illustration du fonctionnement de notre modèle}

z ^sinon

s ^sinon