Les méthodes de diversification - Les méthodes d’introduction de la nouveauté

Au-del`a de la pr´ecision

3.1 Les méthodes d’introduction de la nouveauté

3.2.2 Les méthodes de diversification

Dans cette partie, nous allons parler des différentes méthodes pour produire des listes de recommandations diversifiées. Pour proposer de la diversité, le système doit trouver un compromis entre la similarité et la diversité [Smyth et McClave, 2001], les préférences et la diversité [Zhang et Hurley, 2008], ou la popularité et la précision [Celma et Cano, 2008]. La sélection d’articles divers est un problème NP-difficile. Une solution est d’utiliser une approche gloutonne en maximisant une fonction objectif submodulaire [Ashkan et al., 2015; Carbonell et Goldstein, 1998]. Le gain que l’on obtient en ajoutant un élément à la liste de recommandation peut être estimée de manière implicite ou explicite que nous verrons ensuite. Dans le processus implicite, le but est de pénaliser les articles trop semblables aux articles se trouvant déjà dans la liste. Cette méthode maximise la distance moyenne entre les paires prises deux à deux [Carbonell et Goldstein, 1998; Parambath et al., 2016]. Le processus explicite cherche à maximiser dans la liste la présence des différents thèmes qui intéressent l’utilisateur, tout en évitant les thèmes

3.2. Les méthodes de diversification

redondants [Wasilewski et Hurley, 2016]. Nous notons que ces deux techniques qui cherchent à ajouter de la diversité dans les recommandations reclassent les résultats obtenus par un premier système de recommandation. Outre ces deux méthodes, il existe aussi des méthodes qui exploitent les techniques de partitionnement afin de proposer des listes diverses (section 3.2.2.3).

3.2.2.1 Les méthodes implicites

Une des premières méthodes de diversité provient de la recherche d’information [Carbonell et Goldstein, 1998]. Cette méthode est utilisée pour réduire les informations redondantes dans les résultats pertinents retournés par le système. Cette méthode s’appelle Maximal Marginal Relevance(MMR), et utilise une approche gloutonne pour créer la liste de recommandation en cherchant un compromis entre la pertinence d’un document et la quantité d’information que ce document apporte par rapport aux documents déjà sélectionnés. Dans les systèmes de recommandation, pour chaque produit, MMR fait la combinaison linéaire de la similarité entre le profil de l’utilisateur et le produit à insérer dans la liste et la similarité maximale entre le produit à insérer et tous les produits déjà sélectionnés (formule 3.9).

MMR = argmax

i2I\Iu[S

λsim1(u, i) − (1 − λ) max_j2S sim2(i, j) (3.9) Une autre méthode analogue à MMR a été proposée par Borodin et al. [2012], la Max-Sum Diversificationqui comme MMR est une combinaison linéaire d’une fonction qui mesure la pertinence d’un article pour un utilisateur g(S ) et une fonction qui mesure la différence entre les articles sélectionnés (formule 3.10).

MSD = argmax S ✓I\Iu g(S ) − (1 − λ)^X i2S X j2S −{i} Dist(i, j) s.t |S |  k (3.10) Ces deux fonctions objectif utilisent le paramètre λ 2 [0, 1] pour faire le compromis entre diversité et pertinence.

3.2.2.2 Les méthodes explicites

Les méthodes explicites proviennent aussi des systèmes de recherches d’informations. Elles cherchent avant tout à identifier les thèmes et sous thèmes d’une requête en utilisant des méthodes de reformulation de la requête ou en utilisant des catégorisations. Les documents sont sélectionnés en maximisant la couverture des thèmes inférés. La méthode xQuaD (formule 3.11) [Santos et al., 2010] a donné de meilleurs résultats que la méthode implicite [Carbonell et Goldstein, 1998].

xQuAD(i|S ) = (1 − λ)p(i|u) + λp(i, ¬S |u) (3.11) L’adaptation de cette formule aux systèmes de recommandation, peut se faire ainsi : p(i|u)

Partie I, Chapitre 3 – Au-delà de la précision

la probabilité que l’article i soit observé connaissant le profil de l’utilisateur et p(i, ¬S |u) la probabilité d’observer l’article i mais non les articles qui sont déjà dans la liste S [Vargas, 2015].

Toujours dans la recherche d’information, Agrawal et al. [2009] font l’hypothèse qu’il existe une taxonomie de thèmes (C) qui modélise les sous-thèmes possibles c des requêtes de sorte que les documents et les requêtes appartiennent à plusieurs thèmes. Les auteurs font aussi l’hypothèse que des statistiques d’usage ont été collectées sur les thèmes. Connaissant les catégories auxquelles appartiennent les requêtes et les documents, les caractéristiques d’usage permettent de déterminer la probabilité qu’une catégorie appartienne à un document. Ils ont introduit IA-Select(intent aware), un algorithme glouton qui sélectionne des documents à partir d’une première liste de documents retournés par un algorithme de l’état de l’art. Ici aussi,la formule a été adaptée aux systèmes de recommandation (formule 3.12) [Vargas, 2015].

IA-Select(i|S ) = ^X

p(c|u)ˆrnorm(u, i)p(c|i)^Y

i02S

(1 − p(c|i0)ˆrnorm(u, i0)) (3.12)

3.2.2.3 Clustering et autres méthodes pour la diversification

Certaines méthodes utilisent les techniques de partitionnement (clustering) pour apporter de la diversité dans les systèmes de recommandation. Des méthodes de filtrage collaboratif ont été détournées dans le but de produire des recommandations diverses [Boim et al., 2011; Li et Murata, 2012]. Boim et al. [2011] ont identifié des articles représentatifs des partitions de manière à ce que la distance moyenne entre les articles de la partition et leur « représentant » soit minimisée. Li et Murata [2012] utilisent une méthode de partitionnement multidimensionnelle et sélectionnent des partitions d’articles en utilisant un algorithme des plus proches voisins comme articles candidats à recommander à l’utilisateur actif.

D’autres travaux ont plutôt appliqué la méthode de clustering au profil de l’utilisateur. Dans ces travaux, les auteurs modélisent le profil des utilisateurs afin de connaitre sa propension à apprécier des articles diversifiés [Noia et al., 2017]. Abbassi et al. [2009] ont étudié les profils des utilisateurs, et ont créé une méthode qui permet d’aller au-delà de ce profil, en sortant l’utilisateur des sentiers déjà connus. Ils ont aussi identifié des ensembles d’articles peu connus des utilisateurs permettant de faire des découvertes intéressantes. Vargas et Castells [2013] ont identifié la diversité qu’il y avait dans le profil d’un utilisateur et ont généré des recommandations en se basant sur les différents aspects du profil de l’utilisateur. Ils ont combiné ensuite les recommandations pour produire une liste finale.

3.3. Perception de la diversité et de la nouveauté par les utilisateurs

3.3 Perception de la diversité et de la nouveauté par les

utili-sateurs

Les théories sur la bulle de filtre, la personnalisation accrue, et l’uniformisation de goûts ont poussé la recherche sur les systèmes de recommandation à s’intéresser à des concepts tels que la diversité, la nouveauté et la sérendipité. Des algorithmes ont été proposés pour rendre les recommandations diverses, et enclines à proposer des contenus nouveaux aux utilisateurs. Des études ont été réalisées par la suite avec des utilisateurs pour mesurer l’impact de ces algorithmes sur leur satisfaction. L’algorithme de diversification de thèmes présenté par Ziegler et al. [2005] propose de faire un compromis entre la pertinence et la diversité. Une étude sur les utilisateurs a permis de voir que les utilisateurs apprécient un certain degré de diversité dans les listes fournies. La position des articles dans la liste de recommandations a aussi été étudiée [Ge et al., 2010, 2012]. Les auteurs ont constaté que le fait de grouper les articles à fort degré de diversité -les artic-les peu similaires au profil de l’utilisateur - dans la liste de recommandations réduisait la perception de la diversité par l’utilisateur. Le mieux était de disperser ces types d’articles dans la liste. Sur ce même thème Hu et Pu [2011] ont travaillé sur le rôle de l’interface sur la perception de la diversité. Les résultats ont permis de voir qu’un partitionnement par catégorie était préférable pour favoriser la perception de la diversité. Aussi, Castagnos et al. [2013] ont réalisé une expérience sur 250 utilisateurs, et les résultats de cette étude ont permis de confirmer l’impact positif de la diversité sur la satisfaction de l’utilisateur. Ils ont vu que les modèles de préférence divers avaient un impact positif pendant la phase de démarrage à froid. Enfin, ils ont montré que la diversité bien que bénéfique doit être utilisée avec parcimonie, car elle peut susciter la méfiance et l’incompréhension chez l’utilisateur. Les utilisateurs peuvent avoir différents besoins en diversité et nouveauté. Les travaux présentés par Maccatrozzo et al. [2017] ont prouvé qu’en fonction du profil et de la curiosité d’un utilisateur, il fallait adapter le degré de diversité et de nouveauté à ajouter dans les recommandations.

Partie I, Chapitre 3 – Au-delà de la précision

Chapitre 4

Dans le document Système de recommandation équitable d'oeuvres numériques. En quête de diversité (Page 53-58)