Cat´ egorie des nouveaux utilisateurs - Système hybride d'adaptation dans les systèmes de recom

le module collaboratif et le module s´emantique. Contrairement au processus de recommandation

des utilisateurs hybrides, les recommandations issues du module collaboratif ne seront pas filtr´ees

par la mesure de filtrage s´emantique afin de maximiser le nombre de recommandations. Ce qui

permettra d’explorer de nouveaux items qui seraient susceptibles d’int´eresser l’utilisateur et

donc de mieux le cerner.

Figure 2.6.4 – Le processus de recommandation adapté à un utilisateur imprévisible

6.4.2 Explication de la recommandation

L’explication de la recommandation pour les utilisateurs imprévisibles est similaire en tout point à l’explication des recommandations de la catégorie des utilisateurs hybrides (voir section 6.3).

6.5 Cat´egorie des nouveaux utilisateurs

Les nouveaux utilisateurs sont les utilisateurs ayant une faible fr´equentation et peu de

notes à leur actif. Étant donné qu’on ne dispose que d’une quantité insuffisante de données à propos de ces utilisateurs, les modules de recommandation définis ne peuvent être appliqués. Ces utilisateurs se verront donc appliquer un module de recommandation de type Top N (liste des N items les plus populaires : les mieux notés ou les plus consommés). Au fur et à mesure de leur fréquentation du système, leur profil sera enrichi et ils pourront être reclassés dans une des catégories sus-citées.

Chapitre 7

Conclusion

Cette partie a été consacrée à l’approche que nous avons définie. DOMINOS, DOMain

IN-dependant recOmmender System est un syst`eme de recommandation qui est `a la fois adaptatif,

hybride, ind´ependant du domaine et permet d’expliquer les recommandations.

DOMINOS opère en deux temps : l’apprentissage des catégories d’utilisateurs et le calcul de la recommandation. L’apprentissage des catégories d’utilisateurs représente la première étape de l’adaptation du processus de recommandation à l’utilisateur. Il consiste à déterminer si l’utilisateur est explicite dans son interaction avec le système, implicite ou nouveau (celui-ci est traité séparément). Si l’utilisateur est explicite ou implicite, les données adéquates sont sélectionnées et analysées afin d’attribuer une catégorie finale à cet utilisateur. Une catégorie

d´etermine le type de recommandations auquel l’utilisateur est le plus sensible. Chaque type de

recommandation correspond donc à une catégorie d’utilisateurs. Cette étape est essentielle pour

adapter le processus de recommandation `a l’utilisateur.

Une fois la catégorie de l’utilisateur déterminée, le calcul de la recommandation est effectué grâce à l’application d’un processus de recommandation adapté à sa catégorie. Un tel processus

peut ˆetre compos´e d’un seul module de recommandation ou d’une hybridation de plusieurs

modules.

Nous avons d´efini deux mesures s´emantiques intervenant dans la recommandation : une

mesure de similarit´e et une mesure de filtrage. Ces deux mesures se basent uniquement sur la

structure de l’ontologie afin d’effectuer les calculs de similarité et d’intérêt. De ce fait, elles sont

ind´ependantes du domaine.

La mesure de similarité sémantique calcule les instances similaires de l’ontologie, telles que deux instances sont considérées comme similaires si elles sont reliées à des instances communes ou à des instances elles-mêmes similaires. Ceci étend la définition des mesures de similarité classiques qui ne prennent en compte que les instances communes. De ce fait, de nouvelles instances similaires peuvent être découvertes. Cette mesure ne dépend pas de l’utilisateur et peut être calculée hors-ligne.

pour des items candidats à la recommandation. Ces items peuvent, par exemple, être issus du module de recommandation collaboratif (voir chapitre 5.1). Cette mesure permet donc de filtrer les items candidats à la recommandation qui ne sont pas pertinents pour l’utilisateur.

La mesure de similarité sémantique est la plus importante du système. En effet, elle inter-vient dans la définition de la mesure de filtrage sémantique, mais également dans l’extension des règles d’association du module collaboratif (voir chapitre 5.1.4) et le calcul des recommandations du module sémantique (voir chapitre 5.2).

Nous avons ´egalement d´efini deux modules de recommandation : un module collaboratif

et un module sémantique. Le module collaboratif se base sur des règles d’association étendues grâce à la mesure de similarité sémantique. Le module sémantique repose essentiellement sur cette même mesure. La mesure de similarité sémantique étant indépendante du domaine, elle

garantit l’ind´ependance du domaine des modules dans lesquels elle intervient ´egalement.

Ces deux modules peuvent être utilisés indépendamment ou combinés afin d’obtenir un mo-dule hybride. La mesure de filtrage sémantique peut également être incluse dans le processus de

recommandation. Le choix des modules et mesures `a utiliser dans le processus de

recommanda-tion dépend de la catégorie de l’utilisateur apprise dans le chapitre 3. Cette catégorie détermine le type de recommandations auquel l’utilisateur est le plus sensible (collaboratif, basé sur le contenu, hybride). Le processus de recommandation adéquat pour l’utilisateur est sélectionné tel que défini dans le chapitre 6.

Les modules et mesures définis permettent de conserver une trace du raisonnement ayant été effectué afin d’aboutir à une recommandation. De ce fait, il est possible d’expliquer les recom-mandations proposées aux utilisateurs. Les explications renforcent la confiance que portent les

utilisateurs au syst`eme et servent `a les convaincre de la pertinence des recommandations qui

leur sont pr´esent´ees. De plus, nous permettons aux utilisateurs de valider les explications des

recommandations, ce qui permet de valider le processus de recommandation utilis´e pour

abou-tir à ces items recommandés. Un utilisateur qui n’est pas d’accord avec les explications qui lui sont présentées est un utilisateur qui a été classé dans la mauvaise catégorie. Celui-ci est donc reclassé en écartant ce qu’il n’aura pas validé.

Nous procédons dans la partie suivante à l’expérimentation de l’approche proposée. Nous expérimentons la mesure de similarité sémantique dans le domaine des publications scientifiques et des films. Nous expérimentons et évaluons ensuite tout le système de recommandation dans le domaine des films. Cette évaluation est effectuée en deux temps : une évaluation hors-ligne et une étude utilisateur en ligne.

Troisi`eme partie

Chapitre 1

Introduction

Nous décrivons dans cette partie les expérimentations et évaluations menées afin de valider

DOMINOS, le syst`eme de recommandation que nous proposons.

Deux aspects sont évalués dans cette expérimentation : l’indépendance du domaine du

système et la satisfaction des utilisateurs vis-à-vis des recommandations calculées par le système. Afin d’évaluer l’indépendance du domaine, nous expérimentons le système dans deux do-maines différents : celui des publications scientifiques ainsi que dans celui des films.

L’expérimentation dans le domaine des publications scientifiques consiste à expérimenter la mesure de similarité sémantique que nous avons définie. Le reste du système ne peut être ´

evalué en l’absence de données d’apprentissage nécessaires à l’exécution du module collaboratif. En effet, le calcul des règles d’association est basé sur les items consommés par les utilisateurs,

information dont on ne dispose pas dans l’ensemble de donn´ees utilis´e. La satisfaction des

utilisateurs n’a donc pas été évaluée dans le domaine des publications scientifiques.

L’expérimentation dans le domaine des films a été, quant à elle, complète. En effet, après avoir expérimenté la mesure de similarité sémantique et calculé les règles d’association, le sys-tème a été évalué en effectuant une validation croisée à partir de l’ensemble de données utilisé. Une étude utilisateur a également été conduite afin d’évaluer la satisfaction des utilisateurs.

Nous décrivons dans le chapitre 2, l’expérimentation conduite dans le domaine des publica-tions scientifiques. Le chapitre 3 détaille le déroulement de l’expérimentation et de l’évaluation dans le domaine des films. Enfin, nous analysons les résultats obtenus dans le chapitre 4.

Chapitre 2

Exp´erimentation dans le domaine

des publications scientifiques

Ce chapitre décrit l’expérimentation menée dans le domaine des publications scientifiques sur la mesure de similarité sémantique. L’évaluation par des utilisateurs n’a pas été possible car l’application du module collaboratif se base sur des données d’apprentissage qui ne sont pas disponibles dans le domaine des publications scientifiques.

Après avoir présenté les données utilisées, nous présenterons l’expérimentation de la mesure de similarité sémantique suivie d’une analyse des résultats obtenus.

2.1 Donn´ees utilis´ees

Nous avons utilis´e le Semantic Web Dog Food Corpus¹ qui met `a disposition des

informa-tions sur des articles scientifiques publi´es dans des conf´erences et workshops dans le domaine

du web s´emantique. Chaque publication est en relation avec une conf´erence, a un ou plusieurs

sujets et une liste d’auteurs. De plus, chaque auteur est affilié à un établissement. La figure 3.2.1 représente un extrait de l’ontologie décrivant ces informations.

Les données utilisées proviennent des 17e et 18e conférences internationales World Wide

Web. Les donn´ees sont compos´ees de 209 publications (Paper), 1282 auteurs (Author), 216

affiliations (Affiliation) et 726 sujets (Subject) qui repr´esentent les th´ematiques de recherche.

Dans le document Système hybride d'adaptation dans les systèmes de recommandation (Page 98-106)