Passage ` a l’´ echelle - Dimensions ` a ´ evaluer

4.2 Dimensions ` a ´ evaluer

4.2.13 Passage ` a l’´ echelle

a des attaques [SMB07]. Une attaque d´esigne l’injection d’informations frauduleuses visant `a

promouvoir ou rabaisser certains items. La robustesse du système est mesurée par la quantité de données frauduleuses nécessaires avant que les changements ne soient effectifs. Il est par-fois possible de mesurer la robustesse théoriquement, autrement, il est possible de simuler des attaques afin d’effectuer la mesure.

4.2.12 Adaptation

Il s’agit ici de mesurer la vitesse d’adaptation du syst`eme aux nouvelles donn´ees. Les

nou-velles donn´ees concernent soit les items (les nouveaux items peuvent par exemple prendre la

place de leurs prédécesseurs qui deviennent obsolètes) soit les nouvelles données fournies par l’utilisateur cible. L’adaptation peut être mesurée en comparant les recommandations avant et après l’application des changements.

4.2.13 Passage `a l’´echelle

Le passage à l’échelle est un point crucial dans les systèmes de recommandation. En effet, les systèmes de recommandation traitent d’importantes quantités de données, il est donc important de rester réactif face à elles. Les recommandations étant censées être proposées en temps réel, la mesure du passage à l’échelle repose sur le calcul du temps de construction du modèle

hors-ligne, du temps de réponse entre l’envoi d’une requête et la réception des recommandations

et du nombre de recommandations générées par unité de temps (par exemple le nombre de

recommandations par seconde).

Nous avons recensé dans ce chapitre les diverses fa¸cons d’évaluer les performances d’un sys-tème de recommandation. L’idéal, si l’on dispose d’une quantité suffisante de données concer-nant les interactions des utilisateurs avec le système (des notes d’items, etc.), est d’effectuer une évaluation hors-ligne. Une évaluation hors-ligne va permettre d’avoir une idée globale du

comportement du syst`eme et de l’am´eliorer avant de le diffuser au grand public. Quant aux

evaluations en ligne, il en existe deux types : les tests en ligne et les études utilisateurs. Le test en ligne est une évaluation à risque. En effet, il s’agit d’évaluer toute l’application sur de vrais utilisateurs. Si le système de recommandation n’est pas au point, il y a un risque que l’utilisateur soit dissuadé de réutiliser l’application dans le futur.

Il vaudrait donc mieux, dans le meilleur des scénarios, effectuer une évaluation hors-ligne, suivie d’une étude utilisateur, qui permet une interaction directe avec les utilisateurs, pour enfin procéder à la mise en ligne et donc au test à grande échelle.

Ces trois types d’évaluations permettent uniquement de récolter des données. Ces dernières doivent être ensuite analysées pour pouvoir être interprétées. Pour ce faire, plusieurs dimensions `

a évaluer ont été identifiées. Le choix de ces dimensions se fait en fonction des objectifs du système de recommandation. Par exemple, si l’objectif du système est de fidéliser l’utilisateur, la mesure de la confiance de l’utilisateur sera plus appropriée (voir section 4.2.6), si l’on doit travailler avec une très grande quantité de données, il faut mesurer la capacité du système à passer à l’échelle (section 4.2.13), etc.

Chapitre 5

Conclusion

Dans cette partie consacrée à l’état de l’art, nous avons étudié les différentes étapes de la création d’un système de recommandation. Premièrement, il est nécessaire de définir le modèle utilisateur. Ensuite, vient le choix et l’implémentation de l’approche de recommandation. Enfin, la validation de l’approche de recommandation est effectuée.

La modélisation utilisateur souligne que les données fournies explicitement par l’utilisateur ne sont pas les seules données utilisables afin de construire son profil. En effet, des données implicites provenant des actions de l’utilisateur sur le système peuvent également être analysées et interprétées. De ce fait, [Koc01] classe les modèles utilisateurs selon leur utilisation de données explicites ou implicites entre autres. Nous utilisons cette caractérisation non pas pour classer les modèles utilisateurs, mais pour classer les utilisateurs eux-mêmes. En effet, nous distinguons entre les utilisateurs explicites et implicites afin de mieux exploiter les données disponibles à leur propos.

Dans le chapitre 3, nous avons présenté les différentes approches de recommandation

exis-tantes et les diff´erentes techniques d’hybridation possibles. Les syst`emes de recommandation

hybrides pr´esentent de meilleures performances que les syst`emes de recommandation simples.

C’est pourquoi l’hybridation repr´esente un objectif majeur dans l’´elaboration de notre

sys-t`eme. Pour ce faire, nous utilisons un module de recommandation collaboratif et un module

de recommandation bas´e sur le contenu. Les approches collaboratives ont l’avantage de ne pas

n´ecessiter de connaissances sur les items et donc sur le domaine. Ces approches sont donc

fa-cilement réutilisables dans d’autres domaines. Les approches basées sur le contenu (ainsi que les approches basées sur la connaissance ou sur l’utilité) sont quant à elles fortement liées au domaine auquel elles sont destinées. Par conséquent, ce type d’approches est dépendant du do-maine et nécessite d’y apporter des modifications majeures afin de pouvoir être réutilisé dans

d’autres domaines. Nous nous sommes donc fix´e comme objectif la d´efinition d’une approche

de recommandation totalement ind´ependante du domaine. En effet, les donn´ees du

système étant décrites dans une ontologie, nous nous basons uniquement sur la structure de

l’ontologie afin de raisonner sur les items.

modules de recommandation ainsi que deux mesures s´emantiques pouvant ˆetre incluses dans le

processus de recommandation. Ces modules et mesures ne sont pas syst´ematiquement appliqu´es

de la même manière pour tous les utilisateurs. En effet, nous préconisons l’adaptation du

processus de recommandation `a l’utilisateur [MA00, IH07]. Pour ce faire, le profil de

l’utilisateur est analysé afin de le classer dans une catégorie et cette dernière détermine le

processus de recommandation `a utiliser. Par ailleurs, les modules de recommandation et les

mesures s´emantiques d´efinis permettent d’expliquer les recommandations aux utilisateurs

afin de gagner en transparence et de permettre aux utilisateurs de corriger les raisonnements expliqu´es qui ne leur sont pas adapt´es.

Le chapitre 4 résume, quant à lui, les différentes techniques d’évaluation possibles ainsi

que les dimensions `a mesurer lors de ces ´evaluations. Nous retenons dans notre approche deux

techniques d’évaluation qui sont applicables à notre système : l’évaluation hors-ligne qui permet

dans un premier temps de tester l’approche sur un ensemble de donn´ees et d’affiner les

para-mètres utilisés ; puis l’étude utilisateur où de vrais utilisateurs testent et interagissent avec le système défini. Le test en ligne n’est, quant à lui, pas applicable à notre système car il concerne les systèmes existant et accueillant fréquemment de vrais utilisateurs.

Deuxi`eme partie

DOMINOS : DOMain INdependent

recOmmender System

Chapitre 1

Introduction

Durant ces dernières années, le problème de la recommandation s’est de plus en plus focalisé sur l’utilisateur en mettant en évidence le caractère unique de celui-ci. De ce fait, de nouvelles

di-mensions `a prendre en compte sont apparues. L’explication de la recommandation en fait partie

[TM08]. En effet, expliquer à l’utilisateur pourquoi un item lui a été recommandé rend la recom-mandation plus personnelle. Il ne s’agit plus, dans ce cas de figure, de noyer l’utilisateur devant

un ensemble d’items recommand´es mais de lui proposer des items tout en expliquant pourquoi

ils pourraient l’int´eresser. Les explications permettent, entre autres, de s’adresser directement `

a l’utilisateur, de susciter sa curiosit´e et de gagner sa confiance.

Les utilisateurs étant différents les uns des autres, les satisfaire à l’aide d’un processus de

recommandation identique pour tout le monde est une tˆache d´elicate. Il est donc important

de prendre en compte les diff´erences entre utilisateurs et de mettre en place un syst`eme de

recommandation qui s’adapte pour pouvoir r´epondre aux besoins sp´ecifiques de chacun [MA00,

IH07, DPH⁺09].

Dans cette partie, nous pr´esentons DOMINOS (DOMain INdependent recOmmendation

System), un syst`eme de recommandation hybride, adaptatif, ind´ependant du domaine et

expli-quant les recommandations. DOMINOS propose une approche de recommandation adaptative

telle que le processus de recommandation s’adapte `a chaque utilisateur. Les utilisateurs sont

classés par catégories suite à l’analyse de leurs profils et chaque catégorie se voit appliquer un

processus de recommandation diff´erent. Celui-ci peut-ˆetre hybride ou simple. Les

recomman-dations résultantes sont également expliquées dans un effort de transparence et d’interactivité

avec l’utilisateur. Par ailleurs, DOMINOS se veut ind´ependant du domaine, dans la mesure o`u

la méthodologie appliquée est générique et applicable à des domaines différents. Pour ce faire,

la connaissance du domaine est contenue dans une ontologie donnée en entrée au système et

la recommandation se fait à l’aide de raisonnements basés sur la structure de l’ontologie. De ce fait, le domaine est déterminé par l’ontologie donnée en entrée du système et le changement de domaine nécessite seulement le changement de l’ontologie à condition que celle-ci respecte le

langage d’expression utilis´e qui est OWL-DL.

de deux parties : (i) l’apprentissage de la cat´egorie de l’utilisateur, (ii) le moteur de recomman-dation.

L’apprentissage des catégories d’utilisateurs est défini dans le chapitre 3. Cet apprentissage est une étape très importante dans l’approche que nous présentons. En effet, l’adaptation du processus de recommandation repose entièrement sur le résultat de cette catégorisation. Les données récoltées sur les utilisateurs sont dans un premier temps analysées, ce qui permet de détecter le caractère implicite et/ou explicite de l’utilisateur. Les données à utiliser sont ensuite sélectionnées et analysées une seconde fois afin d’attribuer une catégorie à l’utilisateur.

Une fois la catégorie de l’utilisateur détectée, le processus de recommandation adéquat est sélectionné. Les différents processus sont décrits dans le chapitre 6. Ces processus utilisent les mesures sémantiques définies dans le chapitre 4 et les modules de recommandation définis dans le chapitre 5.

Chapitre 2

L’architecture du syst`eme

L’architecture du syst`eme de recommandation est illustr´ee sur la Figure 2.2.1. Cette

ar-chitecture permet à la fois d’avoir un système hybride, adaptatif, indépendant du domaine et pouvant expliquer la recommandation.

Figure 2.2.1 – L’architecture du syst`eme de recommandation

Nous allons dans un premier temps d´ecrire les donn´ees sur lesquelles nous travaillons,

2.1 Description des donn´ees

Les items du système sont décrits dans une ontologie (voir chapitre 2, définition 3). Dans la suite, une ontologie sera notée O(C, R, X , A) où C est l’ensemble des concepts, R l’ensemble

des propri´et´es (relations), X l’ensemble des axiomes (subclassOf, domain, range, etc.) et A

l’ensemble des axiomes sur les instances et leurs relations (typage et relations). Nous notons I l’ensemble des instances de concepts de C.

Ainsi, les items qui sont concernés par la recommandation sont des instances. Notons Item ∈ C le concept représentant les items et It ⊆ I l’ensemble des instances de type Item du système : i ∈ It ⇒ Item(i).

De plus, le système prend en entrée l’ensemble des profils des utilisateurs U , parmi lesquels le profil de l’utilisateur cible noté u. Un profil contiendra notamment des informations pouvant ˆ

etre exploitées afin de déterminer les préférences des utilisateurs en termes d’items. Parmi ces informations, l’historique de l’utilisateur qui est constitué d’items pour lesquels nous disposons de notes explicites ou implicites de l’utilisateur. L’historique de l’utilisateur u est défini par :

u ∈ U historique(u) ⊆ It (2.1)

Les notes des items de l’historique seront repr´esent´ees par une fonction note telle que :

u ∈ U , i ∈ historique(u) note(u, i) ∈ [bmin, bmax] (2.2)

où bmin et bmax sont respectivement les bornes inférieure et supérieure de l’échelle de notation.

Le traitement de ces informations mène à la recommandation et est décrit dans le moteur de recommandation.

Dans le document Système hybride d'adaptation dans les systèmes de recommandation (Page 54-63)