• Aucun résultat trouvé

4.5 Performance des algorithmes de bandits-manchots pour la recommandation

4.5.2 Analyses basées sur la diversité

Le critère de diversité n’est pas le plus fréquemment employé dans le cadre d’évaluation

d’algorithmes de MAB et de CMAB en général. En revanche, concernant les systèmes de

recommandation, ce critère est l’un des éléments important à prendre en compte afin d’éviter

les redondances auprès des utilisateurs [Hu+17], ou encore afin de satisfaire le fournisseur

d’élément à recommander (p.ex., dans le cadre de recommandations publicitaires).

Dans cette sous-section nous analysons ainsi les résultats de diversité que nous avons

obtenus pour les sept algorithmes de MAB/CMAB expérimentés (ε-Greedy,UCB2,TS,EXP3,

EXP4, LinUCB, CTS) et ce l’ensemble des jeux de données étudiés pour les différents cas

cités précédemment (voir Sous-section 4.4.3). Notons que pour chaque jeu de données, le

test KW indique qu’il existe des différences significatives entre les résultats de diversité

(Ta-bleaux C.2 et C.1) des différents algorithmes et ce pour chacun des jeux de données (p <0,01,

H0 est rejeté).

Afin de faciliter la lecture, nous résumons les analyses sur la diversité pour chacun des cas

et reportons les analyses détaillées en annexe de ce mémoire (Annexe B). De même, nous y

reportons également l’ensemble des tableaux de résultats (Annexe C).

4.5.2.1 MABsversusCMABssur jeux de données avec vecteur complet

Nous analysons les résultats de diversité que nous avons obtenus pour les sept algorithmes

deMAB/CMABexpérimentés (ε-Greedy,UCB2,TS,EXP3,EXP4.P,LinUCB,CTS) et ce sur les

douze jeux de données étudiés. Les résultats de ces expérimentations sont disponibles au

Ta-bleau C.2 et au TaTa-bleau C.1. Les analyses détaillées de ces expérimentations sont consultables

dans les annexes à la Section B.5. Nous résumons la conclusion de ces analyses ci-après.

Résumé des expérimentions se focalisant sur la diversité concernant le cas avec

vecteur de contexte complet. De manière générale, nous remarquons l’avantage significatif

d’utiliser un algorithme deCMAB basé sur un modèle linéaire plutôt qu’une méthode de MAB

ou de sélection de politiques quand le contexte fourni est suffisamment pertinent ou optimal.

4.5. Performance des algorithmes de bandits-manchots pour la recommandation

Sans contexte permettant de différencier chaque action à effectuer (c.-à-d., éléments à

recom-mander) selon une situation donnée, les algorithmes de MAB peinent à diversifier et restent

incapables de recommander un autre élément que celui calculé comme étant le plus optimal

pour l’ensemble de la population d’utilisateurs. Néanmoins, si nous devions choisir parmi les

al-gorithmes deMAB,ε-Greedyoffrirait une diversification plus satisfaisante que ses compétiteurs

dans la plupart des cas. Ainsi concernant la capacité de diversification des recommandations

de chacun des algorithmes, notons que :

— si les caractéristiques du contexte fournies en entrée sont suffisamment pertinentes

pour que les algorithmes de CMAB basés sur un modèle linéaire puissent diversifier,

alors ceux-ci auront un net avantage face à leurs homologues non contextuels ;

— si les caractéristiques du contexte fournies en entrée ne sont pas pertinentes, un

algo-rithme deMAB possédant un mécanisme d’exploration aléatoire commeε-Greedy sera

plus avantageux afin de diversifier. Notons néanmoins qu’une diversification aléatoire

peut coûter lourdement à la précision globale des recommandations.

Enfin, notons queEXP4.P bien que supérieur en termes de diversité aux algorithmes deMAB,

reste dans la majorité des cas nettement inférieur face aux CMABs basés sur un modèle

li-néaire.

4.5.2.2 MABsversusCMABssur jeux de données avec vecteur tronqué

L’objectif de ces expérimentations est d’observer l’effet de la restriction de contexte sur

la diversité des recommandations produites par les algorithmes de CMAB. De même, nous

observerons ce que produit l’effetYule-Simpsonsur la diversité via le jeu de donnéesYSE (vt).

Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.2 et au

Ta-bleau C.3. Les analyses détaillées de ces expérimentations sont consultables dans les annexes

à la Section B.6. Nous résumons la conclusion de ces analyses ci-après.

Résumé des expérimentions se focalisant sur la précision globale concernant le cas

avec vecteur de contexte tronqué.Nous remarquons de nouveau l’avantage significatif

d’uti-liser un algorithme de CMAB basé sur un modèle linéaire plutôt qu’une méthode de MAB ou

de sélection de politiques. Sur le critère de diversité, ceux-ci résistent mieux aux contraintes

de restriction de contexte et à l’effet Yule-Simpson. En revanche, au même titre que pour la

précision globale ces résultats restent à nuancer du fait d’un niveau de restriction (troncature)

relativement peu important. Plus le vecteur de contexte sera tronqué, plus il y aura un impact

négatif sur la diversité des recommandations produites par les algorithmes deCMAB.

4.5.2.3 MABsversusCMABsdans le cas non-stationnaire

Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.4. Les

ana-lyses détaillées de ces expérimentations sont consultables dans les annexes à la Section B.7.

Nous résumons la conclusion de ces analyses ci-après.

Résumé des expérimentions se focalisant sur la diversité, menées sur le jeu de

impact sur la diversité pour les algorithmes de CMAB. En revanche la non stationnarité a un

impact en termes de diversité sur les algorithmes de MAB qui doivent ré-explorer et ainsi

mo-difier les bras optimaux qu’ils exploitent entre chaque période stationnaire. Ceci résulte en une

plus grande diversification des recommandations effectuées par les algorithmes deMABen

en-vironnement non stationnaire. Malgré tout, les algorithmes deCMAB restent plus performants

en termes de diversité que les algorithmes deMAB.

4.5.2.4 MABsversusCMABssur jeux de données dépourvu de contexte

Les résultats de ces expérimentations sont disponibles en annexe au Tableau C.5. Les

ana-lyses détaillées de ces expérimentations sont consultables dans les annexes à la Section B.8.

Nous résumons la conclusion de ces analyses ci-après.

Résumé des expérimentions se focalisant sur la diversité, menées sur le jeu de

données non contextuel Jester. Nous remarquons que les algorithmes de CMAB restent

contre-performants lorsqu’ils n’ont plus aucune information de contexte sur laquelle s’appuyer.

Concernant les algorithmes deMAB, nous relevons qu’EXP3 permet de mieux diversifier les

recommandations par rapport aux autres algorithmes de sa catégorie.

4.5.2.5 Conclusion sur les analyses concernant la diversité

Lorsque que nous disposons d’informations de contexte suffisamment pertinentes, nous

observons que les algorithmes deCMABobtiennent une diversité significativement supérieure

aux algorithmes de MAB. En revanche, dans le cas où ces informations de contexte sont trop

restreintes, il peut alors devenir plus pertinent d’employer des algorithmes deMAB possédant

un mécanisme d’exploration adapté. De plus,EXP4.P bien que de même niveau queLinUCB

etCTS sur des jeux de données de artificiels, ne semble pas passer à l’échelle sur des jeux

de données du monde réel.

Parmi les algorithmes deCMAB, on observe que LinUCB etCTS obtiennent de meilleurs

résultats dans la majorité des cas. Il en est de même pour ε-Greedy voire EXP3 pour les

algorithmes deMAB.

Ainsi, dans un cadre applicatif, choisir entreLinUCB etCTS serait cornélien. En effet,

Li-nUCB surpasse significativement CTS dans un seul cas : RS-ASM (vc). De même CTS ne

surpasse significativementLinUCB que dans un seul cas également : RS-ASM (vt). Dans les

autres expérimentations, même s’il y a un avantage non significatif à utiliserLinUCB, les deux

algorithmes obtiennent des résultats similaires. Notons que pour certains jeux de données –

Food etPoker Hand –EXP4.P etε-Greedy dépassentLinUCBetCTS.

Sur cet aspect de la diversité, ces considérations posent de nouveau la question de choisir

le bon algorithme pour le bon jeu de données. Il est d’autant plus important de considérer cette

question dans le cadre d’évaluations en ligne où nous ferons face à de véritables utilisateurs

pour lesquels la diversité des recommandation prendra tout son sens.

De ce fait, la question d’apporter un mécanisme de diversification aux meilleures

algo-rithmes (commeLinUCB) se pose, au même titre que d’utiliser une sélection automatique des

4.5. Performance des algorithmes de bandits-manchots pour la recommandation

algorithmes les plus pertinents sur les deux critères de précision globale et de diversité. Nous

traiterons ces questions aux chapitres 5.