• Aucun résultat trouvé

Calcul des recommandations du module s´ emantique

Etant donn´e S, le nombre maximum d’items similaires `a un item donn´e, si nous analysons

l’algorithme 5.2, nous pouvons remarquer que le calcul effectu´e dans la boucle de la ligne 6 est de complexit´e constante, la complexit´e de cette boucle est donc le nombre d’it´erations, soit P . Le calcul du produit cart´esien de tous les ensembles d’items similaires aux pr´emisses de la r`egle (ligne 10) est de l’ordre de P × S.

La boucle de la ligne 12 est de complexit´e constante, sa complexit´e est donc le nombre

d’it´erations, soit C.

Ces op´erations sont effectu´ees pour chaque r`egle d’association existante, soit N fois. La complexit´e au pire de l’algorithme de calcul des r`egles d’association ´etendues est donc

N × (P + P × S + C), soit de l’ordre de N × P × S car P et C sont du mˆeme ordre de grandeur.

5.2 Le module s´emantique

La recommandation, dans le module s´emantique, consiste `a pr´esenter des items s´ emantique-ment similaires `a ceux appr´eci´es par l’utilisateur u. Un item est appr´eci´e par l’utilisateur si sa note implicite ou explicite est sup´erieure `a un seuil β fix´e par l’expert. Deux items sont similaires si leur similarit´e s´emantique est sup´erieure `a un certain seuil α. Ce dernier peut ˆetre fix´e par l’expert ou appris par le syst`eme en adaptant le seuil en fonction du retour de l’utilisateur. ´Etant donn´es It, l’ensemble des items et K, le plus grand rang atteint lors du calcul de la similarit´e s´emantique, l’algorithme 5.4 pr´esente le calcul de la recommandation pour l’utilisateur u.

Algorithme 5.4 Calcul des recommandations du module s´emantique

fonction Semantic Rec(u, It, α, β, K)

Rec ← {i | ∃i0 ∈ It note(u, i0) ≥ β ∧ simK(i, i0) ≥ α} retourner Rec

fin fonction

Les recommandations obtenues peuvent ˆetre ordonn´ees. ´Etant donn´es un rang K, le plus

item i0 et ´etant donn´e i similaire `a i0, le score de l’item i pour l’utilisateur u est :

score(u, i) = simK(i, i0) × note(u, i0) (5.3)

o`u note(u, i) est la note implicite ou explicite de l’item i par l’utilisateur u.

La recommandation des items pour l’utilisateur u est effectu´ee en fonction de l’ordre d´ e-croissant de score.

Exemple 7. Soit l’utilisateur u pr´ec´edent, le film F1 : “Sacr´e Graal” et un seuil β = 3. score(u, F1) = sim10(F1, ”La vie de Brian”) × note(u, ”La vie de Brian”)

= 0.79 × 5 = 3.95

Chapitre 6

L’hybridation et l’explication de la

recommandation

L’hybridation des modules est effectu´ee en ad´equation avec la cat´egorie de l’utilisateur. Les cat´egories d´efinies dans la partie apprentissage (voir chapitre 3) sont les utilisateurs bas´es sur le contenu, les utilisateurs collaboratifs, les utilisateurs hybrides, les utilisateurs impr´evisibles, et enfin les nouveaux utilisateurs. Dans ce chapitre, nous allons d´efinir le processus de recom-mandation appliqu´e `a chaque cat´egorie d’utilisateurs. De plus, nous allons aborder la partie explication fournie aux utilisateurs `a l’issue de la recommandation.

6.1 Cat´egorie des utilisateurs collaboratifs

6.1.1 Processus de recommandation

Un utilisateur sensible aux recommandations collaboratives est un utilisateur qui va ˆetre

int´eress´e par des items qui auront d´ej`a ´et´e appr´eci´es par des utilisateurs au comportement similaire. Ces items peuvent ˆetre tr`es diff´erents les uns des autres. De ce fait, le module s´ e-mantique et la mesure de filtrage s´emantique ne pourraient pas convenir car ceux-ci limitent la diversit´e des items lors de la recommandation. C’est pourquoi, l’utilisateur collaboratif se voit appliquer un processus de recommandation comprenant uniquement le module collaboratif (voir Figure 2.6.1).

6.1.2 Explication de la recommandation

L’explication d’une recommandation du module collaboratif consiste `a se r´ef´erer aux items de l’historique de l’utilisateur ayant ´et´e appr´eci´es par d’autres utilisateurs et ayant abouti `a cette recommandation.

Figure 2.6.1 – Le processus de recommandation adapt´e `a un utilisateur collaboratif

Exemple 8. Soit un utilisateur ayant appr´eci´e Pulp Fiction et Psychose. Soit la r`egle d’asso-ciation :

{Psychosel, Pulp Fictionl} ⇒ {Shiningl}

Shining va donc ˆetre recommand´e `a l’utilisateur. L’explication de la recommandation fournie sera :

Shining vous est recommand´e car les personnes ayant appr´eci´e Pulp Fiction et Psychose ont

´

egalement appr´eci´e Shining.

6.2 Cat´egorie des utilisateurs bas´es sur le contenu

6.2.1 Processus de recommandation

Contrairement aux utilisateurs collaboratifs, les items appr´eci´es par un utilisateur bas´e sur le contenu ne sont pas tr`es divers. En effet, l’utilisateur bas´e sur le contenu a des centres d’int´erˆets pr´ecis que l’on retrouve dans les items qu’il aura appr´eci´es. C’est pourquoi le processus de recommandation qui lui est r´eserv´e repose essentiellement sur le module s´emantique comme illustr´e sur la Figure 2.6.2.

6.2.2 Explication de la recommandation

Pour justifier une recommandation issue d’un raisonnement bas´e sur le contenu, le ou les

items se trouvant dans l’historique de l’utilisateur et similaires `a ladite recommandation sont mis en avant.

6.3 Cat´egorie des utilisateurs hybrides 85

Figure 2.6.2 – Le processus de recommandation adapt´e `a un utilisateur bas´e sur le contenu

le film F1 : “Sacr´e Graal” et un seuil β = 3.

score(u, F1) = sim10(F1, F2) × note(u, F2) = 0.79 × 5

= 3.95

Le score obtenu ´etant sup´erieur `a β, F1 sera recommand´e `a u. L’explication fournie `a l’utilisateur sera :

Sacr´e Graal vous est recommand´e car vous avez appr´eci´e La vie de Brian qui est similaire `a Sacr´e Graal.

6.3 Cat´egorie des utilisateurs hybrides

6.3.1 Processus de recommandation

Un utilisateur ´epars est ouvert aux recommandations issues de la communaut´e mais il

ap-pr´ecie ´egalement les recommandations proches de ses goˆuts. C’est pourquoi, le raisonnement

collaboratif est utilis´e pour la diversit´e. Les r´esultats sont filtr´es en calculant l’int´erˆet de l’utili-sateur pour chaque item issu du module collaboratif. Enfin, le module s´emantique est ex´ecut´e ind´ependamment et ses r´esultats sont ajout´es aux pr´ec´edents.

La Figure 2.6.3 illustre l’hybridation d´ecrite.

6.3.2 Explication de la recommandation

Expliquer une recommandation hybride revient `a expliquer une recommandation issue du

Figure 2.6.3 – Le processus de recommandation adapt´e `a un utilisateur hybride

Exemple 10. Soit un utilisateur ayant appr´eci´e les films Pulp Fiction et La vie de Brian. Soit la r`egle d’association :

{Pulp Fictionl, La Vie de Brianl} ⇒ {Sacr´e Graall}

Sacr´e Graal sera donc recommand´e `a l’utilisateur par le module collaboratif, mais ´egalement par le module s´emantique (voir exemple pr´ec´edent). De ce fait, l’explication de la recommanda-tion fournie sera :

Sacr´e Graal vous est recommand´e car vous avez appr´eci´e La vie de Brian qui est similaire `a Sa-cr´e Graal. De plus, les personnes ayant appr´eci´e Pulp Fiction et La Vie De Brian ont appr´eci´e Sacr´e Graal.

6.4 Cat´egorie des utilisateurs impr´evisibles

6.4.1 Processus de recommandation

L’utilisateur impr´evisible est un utilisateur qui ne semble ni sensible aux recommandations

bas´ees sur le contenu ni aux recommandations collaboratives. L’objectif du processus de

recom-mandation des utilisateurs impr´evisibles est de diversifier les recommandations dans le but de

d´ecouvrir ce qui int´eresse l’utilisateur et donc pouvoir le reclasser dans l’une des 3 cat´egories pr´ec´edentes.

6.5 Cat´egorie des nouveaux utilisateurs 87

le module collaboratif et le module s´emantique. Contrairement au processus de recommandation

des utilisateurs hybrides, les recommandations issues du module collaboratif ne seront pas filtr´ees

par la mesure de filtrage s´emantique afin de maximiser le nombre de recommandations. Ce qui

permettra d’explorer de nouveaux items qui seraient susceptibles d’int´eresser l’utilisateur et

donc de mieux le cerner.

Figure 2.6.4 – Le processus de recommandation adapt´e `a un utilisateur impr´evisible

6.4.2 Explication de la recommandation

L’explication de la recommandation pour les utilisateurs impr´evisibles est similaire en tout point `a l’explication des recommandations de la cat´egorie des utilisateurs hybrides (voir section 6.3).

6.5 Cat´egorie des nouveaux utilisateurs

Les nouveaux utilisateurs sont les utilisateurs ayant une faible fr´equentation et peu de

notes `a leur actif. ´Etant donn´e qu’on ne dispose que d’une quantit´e insuffisante de donn´ees `a propos de ces utilisateurs, les modules de recommandation d´efinis ne peuvent ˆetre appliqu´es. Ces utilisateurs se verront donc appliquer un module de recommandation de type Top N (liste des N items les plus populaires : les mieux not´es ou les plus consomm´es). Au fur et `a mesure de leur fr´equentation du syst`eme, leur profil sera enrichi et ils pourront ˆetre reclass´es dans une des cat´egories sus-cit´ees.

Chapitre 7

Conclusion

Cette partie a ´et´e consacr´ee `a l’approche que nous avons d´efinie. DOMINOS, DOMain

IN-dependant recOmmender System est un syst`eme de recommandation qui est `a la fois adaptatif,

hybride, ind´ependant du domaine et permet d’expliquer les recommandations.

DOMINOS op`ere en deux temps : l’apprentissage des cat´egories d’utilisateurs et le calcul de la recommandation. L’apprentissage des cat´egories d’utilisateurs repr´esente la premi`ere ´etape de l’adaptation du processus de recommandation `a l’utilisateur. Il consiste `a d´eterminer si l’utilisateur est explicite dans son interaction avec le syst`eme, implicite ou nouveau (celui-ci est trait´e s´epar´ement). Si l’utilisateur est explicite ou implicite, les donn´ees ad´equates sont s´electionn´ees et analys´ees afin d’attribuer une cat´egorie finale `a cet utilisateur. Une cat´egorie

d´etermine le type de recommandations auquel l’utilisateur est le plus sensible. Chaque type de

recommandation correspond donc `a une cat´egorie d’utilisateurs. Cette ´etape est essentielle pour

adapter le processus de recommandation `a l’utilisateur.

Une fois la cat´egorie de l’utilisateur d´etermin´ee, le calcul de la recommandation est effectu´e grˆace `a l’application d’un processus de recommandation adapt´e `a sa cat´egorie. Un tel processus

peut ˆetre compos´e d’un seul module de recommandation ou d’une hybridation de plusieurs

modules.

Nous avons d´efini deux mesures s´emantiques intervenant dans la recommandation : une

mesure de similarit´e et une mesure de filtrage. Ces deux mesures se basent uniquement sur la

structure de l’ontologie afin d’effectuer les calculs de similarit´e et d’int´erˆet. De ce fait, elles sont

ind´ependantes du domaine.

La mesure de similarit´e s´emantique calcule les instances similaires de l’ontologie, telles que deux instances sont consid´er´ees comme similaires si elles sont reli´ees `a des instances communes ou `a des instances elles-mˆemes similaires. Ceci ´etend la d´efinition des mesures de similarit´e classiques qui ne prennent en compte que les instances communes. De ce fait, de nouvelles instances similaires peuvent ˆetre d´ecouvertes. Cette mesure ne d´epend pas de l’utilisateur et peut ˆetre calcul´ee hors-ligne.

pour des items candidats `a la recommandation. Ces items peuvent, par exemple, ˆetre issus du module de recommandation collaboratif (voir chapitre 5.1). Cette mesure permet donc de filtrer les items candidats `a la recommandation qui ne sont pas pertinents pour l’utilisateur.

La mesure de similarit´e s´emantique est la plus importante du syst`eme. En effet, elle inter-vient dans la d´efinition de la mesure de filtrage s´emantique, mais ´egalement dans l’extension des r`egles d’association du module collaboratif (voir chapitre 5.1.4) et le calcul des recommandations du module s´emantique (voir chapitre 5.2).

Nous avons ´egalement d´efini deux modules de recommandation : un module collaboratif

et un module s´emantique. Le module collaboratif se base sur des r`egles d’association ´etendues grˆace `a la mesure de similarit´e s´emantique. Le module s´emantique repose essentiellement sur cette mˆeme mesure. La mesure de similarit´e s´emantique ´etant ind´ependante du domaine, elle

garantit l’ind´ependance du domaine des modules dans lesquels elle intervient ´egalement.

Ces deux modules peuvent ˆetre utilis´es ind´ependamment ou combin´es afin d’obtenir un mo-dule hybride. La mesure de filtrage s´emantique peut ´egalement ˆetre incluse dans le processus de

recommandation. Le choix des modules et mesures `a utiliser dans le processus de

recommanda-tion d´epend de la cat´egorie de l’utilisateur apprise dans le chapitre 3. Cette cat´egorie d´etermine le type de recommandations auquel l’utilisateur est le plus sensible (collaboratif, bas´e sur le contenu, hybride). Le processus de recommandation ad´equat pour l’utilisateur est s´electionn´e tel que d´efini dans le chapitre 6.

Les modules et mesures d´efinis permettent de conserver une trace du raisonnement ayant ´et´e effectu´e afin d’aboutir `a une recommandation. De ce fait, il est possible d’expliquer les recom-mandations propos´ees aux utilisateurs. Les explications renforcent la confiance que portent les

utilisateurs au syst`eme et servent `a les convaincre de la pertinence des recommandations qui

leur sont pr´esent´ees. De plus, nous permettons aux utilisateurs de valider les explications des

recommandations, ce qui permet de valider le processus de recommandation utilis´e pour

abou-tir `a ces items recommand´es. Un utilisateur qui n’est pas d’accord avec les explications qui lui sont pr´esent´ees est un utilisateur qui a ´et´e class´e dans la mauvaise cat´egorie. Celui-ci est donc reclass´e en ´ecartant ce qu’il n’aura pas valid´e.

Nous proc´edons dans la partie suivante `a l’exp´erimentation de l’approche propos´ee. Nous exp´erimentons la mesure de similarit´e s´emantique dans le domaine des publications scientifiques et des films. Nous exp´erimentons et ´evaluons ensuite tout le syst`eme de recommandation dans le domaine des films. Cette ´evaluation est effectu´ee en deux temps : une ´evaluation hors-ligne et une ´etude utilisateur en ligne.

Troisi`eme partie

Chapitre 1

Introduction

Nous d´ecrivons dans cette partie les exp´erimentations et ´evaluations men´ees afin de valider

DOMINOS, le syst`eme de recommandation que nous proposons.

Deux aspects sont ´evalu´es dans cette exp´erimentation : l’ind´ependance du domaine du

syst`eme et la satisfaction des utilisateurs vis-`a-vis des recommandations calcul´ees par le syst`eme. Afin d’´evaluer l’ind´ependance du domaine, nous exp´erimentons le syst`eme dans deux do-maines diff´erents : celui des publications scientifiques ainsi que dans celui des films.

L’exp´erimentation dans le domaine des publications scientifiques consiste `a exp´erimenter la mesure de similarit´e s´emantique que nous avons d´efinie. Le reste du syst`eme ne peut ˆetre ´

evalu´e en l’absence de donn´ees d’apprentissage n´ecessaires `a l’ex´ecution du module collaboratif. En effet, le calcul des r`egles d’association est bas´e sur les items consomm´es par les utilisateurs,

information dont on ne dispose pas dans l’ensemble de donn´ees utilis´e. La satisfaction des

utilisateurs n’a donc pas ´et´e ´evalu´ee dans le domaine des publications scientifiques.

L’exp´erimentation dans le domaine des films a ´et´e, quant `a elle, compl`ete. En effet, apr`es avoir exp´eriment´e la mesure de similarit´e s´emantique et calcul´e les r`egles d’association, le sys-t`eme a ´et´e ´evalu´e en effectuant une validation crois´ee `a partir de l’ensemble de donn´ees utilis´e. Une ´etude utilisateur a ´egalement ´et´e conduite afin d’´evaluer la satisfaction des utilisateurs.

Nous d´ecrivons dans le chapitre 2, l’exp´erimentation conduite dans le domaine des publica-tions scientifiques. Le chapitre 3 d´etaille le d´eroulement de l’exp´erimentation et de l’´evaluation dans le domaine des films. Enfin, nous analysons les r´esultats obtenus dans le chapitre 4.

Chapitre 2

Exp´erimentation dans le domaine

des publications scientifiques

Ce chapitre d´ecrit l’exp´erimentation men´ee dans le domaine des publications scientifiques sur la mesure de similarit´e s´emantique. L’´evaluation par des utilisateurs n’a pas ´et´e possible car l’application du module collaboratif se base sur des donn´ees d’apprentissage qui ne sont pas disponibles dans le domaine des publications scientifiques.

Apr`es avoir pr´esent´e les donn´ees utilis´ees, nous pr´esenterons l’exp´erimentation de la mesure de similarit´e s´emantique suivie d’une analyse des r´esultats obtenus.

2.1 Donn´ees utilis´ees

Nous avons utilis´e le Semantic Web Dog Food Corpus1 qui met `a disposition des

informa-tions sur des articles scientifiques publi´es dans des conf´erences et workshops dans le domaine

du web s´emantique. Chaque publication est en relation avec une conf´erence, a un ou plusieurs

sujets et une liste d’auteurs. De plus, chaque auteur est affili´e `a un ´etablissement. La figure 3.2.1 repr´esente un extrait de l’ontologie d´ecrivant ces informations.

Les donn´ees utilis´ees proviennent des 17e et 18e conf´erences internationales World Wide

Web. Les donn´ees sont compos´ees de 209 publications (Paper), 1282 auteurs (Author), 216

affiliations (Affiliation) et 726 sujets (Subject) qui repr´esentent les th´ematiques de recherche.

2.2 Calcul de la similarit´e s´emantique

La table 3.2.1 recense les concepts s´electionn´es par l’expert ainsi que le nombre de paires d’instances issues de chaque concept. Ces paires sont utilis´ees comme entr´ee de l’algorithme de

Figure 3.2.1 – Extrait de l’ontologie de publications scientifiques 1 <o w l : C l a s s r d f : I D=”Paper ”> <o w l : d i s j o i n t W i t h r d f : r e s o u r c e=”#P e r s o n ”/> 3 </ o w l : C l a s s> 5 <o w l : O b j e c t P r o p e r t y r d f : I D=” h a s S u b j e c t ”> <r d f s : d o m a i n r d f : r e s o u r c e=”#Paper ”/> 7 < r d f s : r a n g e r d f : r e s o u r c e=”#S u b j e c t ”/> <o w l : i n v e r s e O f r d f : r e s o u r c e=”#S u b j e c t I n ”/> 9 </ o w l : O b j e c t P r o p e r t y> 11<p a p e r o n t o : P a p e r r d f : a b o u t=” h t t p : // d a t a . s e m a n t i c w e b . o r g / c o n f e r e n c e /www/ 2 0 0 9 / p a p e r /62 ”> < r d f s : l a b e l>L a r g e S c a l e I n t e g r a t i o n o f S e n s e s f o r t h e S e m a n t i c Web</ r d f s : l a b e l> 13 <p a p e r o n t o : i n C o n f e r e n c e r d f : r e s o u r c e=”#WWW2009”/> <p a p e r o n t o : h a s S u b j e c t r d f : r e s o u r c e=”#s e m a n t i c −d a t a ”/> 15 <p a p e r o n t o : h a s S u b j e c t r d f : r e s o u r c e=”#s e m a n t i c −web ”/> <p a p e r o n t o : h a s A u t h o r r d f : r e s o u r c e=” h t t p : // d a t a . s e m a n t i c w e b . o r g / p e r s o n / eduardo−mena ”/> 17 <p a p e r o n t o : h a s A u t h o r r d f : r e s o u r c e=” h t t p : // d a t a . s e m a n t i c w e b . o r g / p e r s o n / mathieu−d a q u i n ”/ > <p a p e r o n t o : h a s A u t h o r r d f : r e s o u r c e=” h t t p : // d a t a . s e m a n t i c w e b . o r g / p e r s o n / j o r g e −g r a c i a ”/> 19</ p a p e r o n t o : P a p e r> 21<p a p e r o n t o : S u b j e c t r d f : I D=” s e m a n t i c −web ”> < r d f s : l a b e l>s e m a n t i c web</ r d f s : l a b e l> 23</ p a p e r o n t o : S u b j e c t>

2.2 Calcul de la similarit´e s´emantique 97

Concepts Nombre de paires d’instances

Paper 21 945

Author 206 403

Subject 66 066

Affiliation 23 436

Total 317 850

Table 3.2.1 – Nombre de paires d’instances par concept dans le domaine des publications scientifiques

calcul des similarit´es s´emantiques.

Figure 3.2.2 – Distribution des similarit´es par rang pour les instances du concept Paper dans

le domaine des publications scientifiques

La figure 3.2.2 repr´esente la sortie de l’algorithme de calcul de similarit´es, soit le nombre de paires d’instances par plage de valeurs de similarit´e et ce, pour chaque rang. Les chiffres montrent que les valeurs de la similarit´e s´emantique entre les instances des concepts s´electionn´es ´evoluent entre les rangs 1 et 10. En d’autres termes, la similarit´e se propage entre les paires d’instances, jusqu’`a atteindre un point fixe.

La figure 3.2.3 indique des valeurs ´elev´ees au niveau des valeurs maximales de la similarit´e,

tandis que les valeurs de la moyenne et de l’´ecart type sont plus basses. Ceci signifie, d’une

part, que les valeurs des similarit´es sont propag´ees dans le syst`eme, et que, d’autre part, les paires d’instances qui ne sont pas tr`es similaires ont une valeur de similarit´e basse, tandis que les paires similaires voient la valeur de leur similarit´e augmenter de fa¸con significative.

Nous avons, dans ce chapitre, exp´eriment´e la mesure de similarit´e s´emantique dans le do-maine des publications scientifiques. Cette exp´erimentation a permis de valider l’ind´ependance du domaine de la mesure de similarit´e s´emantique. En effet, celle-ci op`ere de fa¸con g´en´erique si les donn´ees d’entr´ee sont d´ecrites dans une ontologie.

La validation de la recommandation n’a pas ´et´e effectu´ee dans le domaine des publications scientifiques mais est ´evalu´e en profondeur dans le domaine des films dans le chapitre suivant.

Chapitre 3

Exp´erimentation dans le domaines

des films

L’exp´erimentation dans le domaine des films a ´et´e plus compl`ete que celle du domaine

des publications scientifiques. En effet, nous disposons des donn´ees n´ecessaires `a la conduite de l’exp´erimentation grˆace au jeu de donn´ees mis `a disposition par MovieLens (d´ecrit dans

le chapitre 3.1), le syst`eme de recommandation de GroupLens. Les donn´ees contenues dans le