4.5 Performance des algorithmes de bandits-manchots pour la recommandation
4.5.2 Analyses basées sur la diversité
Le critère de diversité n’est pas le plus fréquemment employé dans le cadre d’évaluation
d’algorithmes de MAB et de CMAB en général. En revanche, concernant les systèmes de
recommandation, ce critère est l’un des éléments important à prendre en compte afin d’éviter
les redondances auprès des utilisateurs [Hu+17], ou encore afin de satisfaire le fournisseur
d’élément à recommander (p.ex., dans le cadre de recommandations publicitaires).
Dans cette sous-section nous analysons ainsi les résultats de diversité que nous avons
obtenus pour les sept algorithmes de MAB/CMAB expérimentés (ε-Greedy,UCB2,TS,EXP3,
EXP4, LinUCB, CTS) et ce l’ensemble des jeux de données étudiés pour les différents cas
cités précédemment (voir Sous-section 4.4.3). Notons que pour chaque jeu de données, le
test KW indique qu’il existe des différences significatives entre les résultats de diversité
(Ta-bleaux C.2 et C.1) des différents algorithmes et ce pour chacun des jeux de données (p <0,01,
H0 est rejeté).
Afin de faciliter la lecture, nous résumons les analyses sur la diversité pour chacun des cas
et reportons les analyses détaillées en annexe de ce mémoire (Annexe B). De même, nous y
reportons également l’ensemble des tableaux de résultats (Annexe C).
4.5.2.1 MABsversusCMABssur jeux de données avec vecteur complet
Nous analysons les résultats de diversité que nous avons obtenus pour les sept algorithmes
deMAB/CMABexpérimentés (ε-Greedy,UCB2,TS,EXP3,EXP4.P,LinUCB,CTS) et ce sur les
douze jeux de données étudiés. Les résultats de ces expérimentations sont disponibles au
Ta-bleau C.2 et au TaTa-bleau C.1. Les analyses détaillées de ces expérimentations sont consultables
dans les annexes à la Section B.5. Nous résumons la conclusion de ces analyses ci-après.
Résumé des expérimentions se focalisant sur la diversité concernant le cas avec
vecteur de contexte complet. De manière générale, nous remarquons l’avantage significatif
d’utiliser un algorithme deCMAB basé sur un modèle linéaire plutôt qu’une méthode de MAB
ou de sélection de politiques quand le contexte fourni est suffisamment pertinent ou optimal.
4.5. Performance des algorithmes de bandits-manchots pour la recommandation
Sans contexte permettant de différencier chaque action à effectuer (c.-à-d., éléments à
recom-mander) selon une situation donnée, les algorithmes de MAB peinent à diversifier et restent
incapables de recommander un autre élément que celui calculé comme étant le plus optimal
pour l’ensemble de la population d’utilisateurs. Néanmoins, si nous devions choisir parmi les
al-gorithmes deMAB,ε-Greedyoffrirait une diversification plus satisfaisante que ses compétiteurs
dans la plupart des cas. Ainsi concernant la capacité de diversification des recommandations
de chacun des algorithmes, notons que :
— si les caractéristiques du contexte fournies en entrée sont suffisamment pertinentes
pour que les algorithmes de CMAB basés sur un modèle linéaire puissent diversifier,
alors ceux-ci auront un net avantage face à leurs homologues non contextuels ;
— si les caractéristiques du contexte fournies en entrée ne sont pas pertinentes, un
algo-rithme deMAB possédant un mécanisme d’exploration aléatoire commeε-Greedy sera
plus avantageux afin de diversifier. Notons néanmoins qu’une diversification aléatoire
peut coûter lourdement à la précision globale des recommandations.
Enfin, notons queEXP4.P bien que supérieur en termes de diversité aux algorithmes deMAB,
reste dans la majorité des cas nettement inférieur face aux CMABs basés sur un modèle
li-néaire.
4.5.2.2 MABsversusCMABssur jeux de données avec vecteur tronqué
L’objectif de ces expérimentations est d’observer l’effet de la restriction de contexte sur
la diversité des recommandations produites par les algorithmes de CMAB. De même, nous
observerons ce que produit l’effetYule-Simpsonsur la diversité via le jeu de donnéesYSE (vt).
Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.2 et au
Ta-bleau C.3. Les analyses détaillées de ces expérimentations sont consultables dans les annexes
à la Section B.6. Nous résumons la conclusion de ces analyses ci-après.
Résumé des expérimentions se focalisant sur la précision globale concernant le cas
avec vecteur de contexte tronqué.Nous remarquons de nouveau l’avantage significatif
d’uti-liser un algorithme de CMAB basé sur un modèle linéaire plutôt qu’une méthode de MAB ou
de sélection de politiques. Sur le critère de diversité, ceux-ci résistent mieux aux contraintes
de restriction de contexte et à l’effet Yule-Simpson. En revanche, au même titre que pour la
précision globale ces résultats restent à nuancer du fait d’un niveau de restriction (troncature)
relativement peu important. Plus le vecteur de contexte sera tronqué, plus il y aura un impact
négatif sur la diversité des recommandations produites par les algorithmes deCMAB.
4.5.2.3 MABsversusCMABsdans le cas non-stationnaire
Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.4. Les
ana-lyses détaillées de ces expérimentations sont consultables dans les annexes à la Section B.7.
Nous résumons la conclusion de ces analyses ci-après.
Résumé des expérimentions se focalisant sur la diversité, menées sur le jeu de
impact sur la diversité pour les algorithmes de CMAB. En revanche la non stationnarité a un
impact en termes de diversité sur les algorithmes de MAB qui doivent ré-explorer et ainsi
mo-difier les bras optimaux qu’ils exploitent entre chaque période stationnaire. Ceci résulte en une
plus grande diversification des recommandations effectuées par les algorithmes deMABen
en-vironnement non stationnaire. Malgré tout, les algorithmes deCMAB restent plus performants
en termes de diversité que les algorithmes deMAB.
4.5.2.4 MABsversusCMABssur jeux de données dépourvu de contexte
Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.5. Les
ana-lyses détaillées de ces expérimentations sont consultables dans les annexes à la Section B.8.
Nous résumons la conclusion de ces analyses ci-après.
Résumé des expérimentions se focalisant sur la diversité, menées sur le jeu de
données non contextuel Jester. Nous remarquons que les algorithmes de CMAB restent
contre-performants lorsqu’ils n’ont plus aucune information de contexte sur laquelle s’appuyer.
Concernant les algorithmes deMAB, nous relevons qu’EXP3 permet de mieux diversifier les
recommandations par rapport aux autres algorithmes de sa catégorie.
4.5.2.5 Conclusion sur les analyses concernant la diversité
Lorsque que nous disposons d’informations de contexte suffisamment pertinentes, nous
observons que les algorithmes deCMABobtiennent une diversité significativement supérieure
aux algorithmes de MAB. En revanche, dans le cas où ces informations de contexte sont trop
restreintes, il peut alors devenir plus pertinent d’employer des algorithmes deMAB possédant
un mécanisme d’exploration adapté. De plus,EXP4.P bien que de même niveau queLinUCB
etCTS sur des jeux de données de artificiels, ne semble pas passer à l’échelle sur des jeux
de données du monde réel.
Parmi les algorithmes deCMAB, on observe que LinUCB etCTS obtiennent de meilleurs
résultats dans la majorité des cas. Il en est de même pour ε-Greedy voire EXP3 pour les
algorithmes deMAB.
Ainsi, dans un cadre applicatif, choisir entreLinUCB etCTS serait cornélien. En effet,
Li-nUCB surpasse significativement CTS dans un seul cas : RS-ASM (vc). De même CTS ne
surpasse significativementLinUCB que dans un seul cas également : RS-ASM (vt). Dans les
autres expérimentations, même s’il y a un avantage non significatif à utiliserLinUCB, les deux
algorithmes obtiennent des résultats similaires. Notons que pour certains jeux de données –
Food etPoker Hand –EXP4.P etε-Greedy dépassentLinUCBetCTS.
Sur cet aspect de la diversité, ces considérations posent de nouveau la question de choisir
le bon algorithme pour le bon jeu de données. Il est d’autant plus important de considérer cette
question dans le cadre d’évaluations en ligne où nous ferons face à de véritables utilisateurs
pour lesquels la diversité des recommandation prendra tout son sens.
De ce fait, la question d’apporter un mécanisme de diversification aux meilleures
algo-rithmes (commeLinUCB) se pose, au même titre que d’utiliser une sélection automatique des
4.5. Performance des algorithmes de bandits-manchots pour la recommandation
algorithmes les plus pertinents sur les deux critères de précision globale et de diversité. Nous
traiterons ces questions aux chapitres 5.
Dans le document
Recommandation contextuelle de services : application à la recommandation d'évènements culturels dans la ville intelligente
(Page 139-142)