le module collaboratif et le module s´emantique. Contrairement au processus de recommandation
des utilisateurs hybrides, les recommandations issues du module collaboratif ne seront pas filtr´ees
par la mesure de filtrage s´emantique afin de maximiser le nombre de recommandations. Ce qui
permettra d’explorer de nouveaux items qui seraient susceptibles d’int´eresser l’utilisateur et
donc de mieux le cerner.
Figure 2.6.4 – Le processus de recommandation adapt´e `a un utilisateur impr´evisible
6.4.2 Explication de la recommandation
L’explication de la recommandation pour les utilisateurs impr´evisibles est similaire en tout point `a l’explication des recommandations de la cat´egorie des utilisateurs hybrides (voir section 6.3).
6.5 Cat´egorie des nouveaux utilisateurs
Les nouveaux utilisateurs sont les utilisateurs ayant une faible fr´equentation et peu de
notes `a leur actif. ´Etant donn´e qu’on ne dispose que d’une quantit´e insuffisante de donn´ees `a propos de ces utilisateurs, les modules de recommandation d´efinis ne peuvent ˆetre appliqu´es. Ces utilisateurs se verront donc appliquer un module de recommandation de type Top N (liste des N items les plus populaires : les mieux not´es ou les plus consomm´es). Au fur et `a mesure de leur fr´equentation du syst`eme, leur profil sera enrichi et ils pourront ˆetre reclass´es dans une des cat´egories sus-cit´ees.
Chapitre 7
Conclusion
Cette partie a ´et´e consacr´ee `a l’approche que nous avons d´efinie. DOMINOS, DOMain
IN-dependant recOmmender System est un syst`eme de recommandation qui est `a la fois adaptatif,
hybride, ind´ependant du domaine et permet d’expliquer les recommandations.
DOMINOS op`ere en deux temps : l’apprentissage des cat´egories d’utilisateurs et le calcul de la recommandation. L’apprentissage des cat´egories d’utilisateurs repr´esente la premi`ere ´etape de l’adaptation du processus de recommandation `a l’utilisateur. Il consiste `a d´eterminer si l’utilisateur est explicite dans son interaction avec le syst`eme, implicite ou nouveau (celui-ci est trait´e s´epar´ement). Si l’utilisateur est explicite ou implicite, les donn´ees ad´equates sont s´electionn´ees et analys´ees afin d’attribuer une cat´egorie finale `a cet utilisateur. Une cat´egorie
d´etermine le type de recommandations auquel l’utilisateur est le plus sensible. Chaque type de
recommandation correspond donc `a une cat´egorie d’utilisateurs. Cette ´etape est essentielle pour
adapter le processus de recommandation `a l’utilisateur.
Une fois la cat´egorie de l’utilisateur d´etermin´ee, le calcul de la recommandation est effectu´e grˆace `a l’application d’un processus de recommandation adapt´e `a sa cat´egorie. Un tel processus
peut ˆetre compos´e d’un seul module de recommandation ou d’une hybridation de plusieurs
modules.
Nous avons d´efini deux mesures s´emantiques intervenant dans la recommandation : une
mesure de similarit´e et une mesure de filtrage. Ces deux mesures se basent uniquement sur la
structure de l’ontologie afin d’effectuer les calculs de similarit´e et d’int´erˆet. De ce fait, elles sont
ind´ependantes du domaine.
La mesure de similarit´e s´emantique calcule les instances similaires de l’ontologie, telles que deux instances sont consid´er´ees comme similaires si elles sont reli´ees `a des instances communes ou `a des instances elles-mˆemes similaires. Ceci ´etend la d´efinition des mesures de similarit´e classiques qui ne prennent en compte que les instances communes. De ce fait, de nouvelles instances similaires peuvent ˆetre d´ecouvertes. Cette mesure ne d´epend pas de l’utilisateur et peut ˆetre calcul´ee hors-ligne.
pour des items candidats `a la recommandation. Ces items peuvent, par exemple, ˆetre issus du module de recommandation collaboratif (voir chapitre 5.1). Cette mesure permet donc de filtrer les items candidats `a la recommandation qui ne sont pas pertinents pour l’utilisateur.
La mesure de similarit´e s´emantique est la plus importante du syst`eme. En effet, elle inter-vient dans la d´efinition de la mesure de filtrage s´emantique, mais ´egalement dans l’extension des r`egles d’association du module collaboratif (voir chapitre 5.1.4) et le calcul des recommandations du module s´emantique (voir chapitre 5.2).
Nous avons ´egalement d´efini deux modules de recommandation : un module collaboratif
et un module s´emantique. Le module collaboratif se base sur des r`egles d’association ´etendues grˆace `a la mesure de similarit´e s´emantique. Le module s´emantique repose essentiellement sur cette mˆeme mesure. La mesure de similarit´e s´emantique ´etant ind´ependante du domaine, elle
garantit l’ind´ependance du domaine des modules dans lesquels elle intervient ´egalement.
Ces deux modules peuvent ˆetre utilis´es ind´ependamment ou combin´es afin d’obtenir un mo-dule hybride. La mesure de filtrage s´emantique peut ´egalement ˆetre incluse dans le processus de
recommandation. Le choix des modules et mesures `a utiliser dans le processus de
recommanda-tion d´epend de la cat´egorie de l’utilisateur apprise dans le chapitre 3. Cette cat´egorie d´etermine le type de recommandations auquel l’utilisateur est le plus sensible (collaboratif, bas´e sur le contenu, hybride). Le processus de recommandation ad´equat pour l’utilisateur est s´electionn´e tel que d´efini dans le chapitre 6.
Les modules et mesures d´efinis permettent de conserver une trace du raisonnement ayant ´et´e effectu´e afin d’aboutir `a une recommandation. De ce fait, il est possible d’expliquer les recom-mandations propos´ees aux utilisateurs. Les explications renforcent la confiance que portent les
utilisateurs au syst`eme et servent `a les convaincre de la pertinence des recommandations qui
leur sont pr´esent´ees. De plus, nous permettons aux utilisateurs de valider les explications des
recommandations, ce qui permet de valider le processus de recommandation utilis´e pour
abou-tir `a ces items recommand´es. Un utilisateur qui n’est pas d’accord avec les explications qui lui sont pr´esent´ees est un utilisateur qui a ´et´e class´e dans la mauvaise cat´egorie. Celui-ci est donc reclass´e en ´ecartant ce qu’il n’aura pas valid´e.
Nous proc´edons dans la partie suivante `a l’exp´erimentation de l’approche propos´ee. Nous exp´erimentons la mesure de similarit´e s´emantique dans le domaine des publications scientifiques et des films. Nous exp´erimentons et ´evaluons ensuite tout le syst`eme de recommandation dans le domaine des films. Cette ´evaluation est effectu´ee en deux temps : une ´evaluation hors-ligne et une ´etude utilisateur en ligne.
Troisi`eme partie
Chapitre 1
Introduction
Nous d´ecrivons dans cette partie les exp´erimentations et ´evaluations men´ees afin de valider
DOMINOS, le syst`eme de recommandation que nous proposons.
Deux aspects sont ´evalu´es dans cette exp´erimentation : l’ind´ependance du domaine du
syst`eme et la satisfaction des utilisateurs vis-`a-vis des recommandations calcul´ees par le syst`eme. Afin d’´evaluer l’ind´ependance du domaine, nous exp´erimentons le syst`eme dans deux do-maines diff´erents : celui des publications scientifiques ainsi que dans celui des films.
L’exp´erimentation dans le domaine des publications scientifiques consiste `a exp´erimenter la mesure de similarit´e s´emantique que nous avons d´efinie. Le reste du syst`eme ne peut ˆetre ´
evalu´e en l’absence de donn´ees d’apprentissage n´ecessaires `a l’ex´ecution du module collaboratif. En effet, le calcul des r`egles d’association est bas´e sur les items consomm´es par les utilisateurs,
information dont on ne dispose pas dans l’ensemble de donn´ees utilis´e. La satisfaction des
utilisateurs n’a donc pas ´et´e ´evalu´ee dans le domaine des publications scientifiques.
L’exp´erimentation dans le domaine des films a ´et´e, quant `a elle, compl`ete. En effet, apr`es avoir exp´eriment´e la mesure de similarit´e s´emantique et calcul´e les r`egles d’association, le sys-t`eme a ´et´e ´evalu´e en effectuant une validation crois´ee `a partir de l’ensemble de donn´ees utilis´e. Une ´etude utilisateur a ´egalement ´et´e conduite afin d’´evaluer la satisfaction des utilisateurs.
Nous d´ecrivons dans le chapitre 2, l’exp´erimentation conduite dans le domaine des publica-tions scientifiques. Le chapitre 3 d´etaille le d´eroulement de l’exp´erimentation et de l’´evaluation dans le domaine des films. Enfin, nous analysons les r´esultats obtenus dans le chapitre 4.
Chapitre 2
Exp´erimentation dans le domaine
des publications scientifiques
Ce chapitre d´ecrit l’exp´erimentation men´ee dans le domaine des publications scientifiques sur la mesure de similarit´e s´emantique. L’´evaluation par des utilisateurs n’a pas ´et´e possible car l’application du module collaboratif se base sur des donn´ees d’apprentissage qui ne sont pas disponibles dans le domaine des publications scientifiques.
Apr`es avoir pr´esent´e les donn´ees utilis´ees, nous pr´esenterons l’exp´erimentation de la mesure de similarit´e s´emantique suivie d’une analyse des r´esultats obtenus.
2.1 Donn´ees utilis´ees
Nous avons utilis´e le Semantic Web Dog Food Corpus1 qui met `a disposition des
informa-tions sur des articles scientifiques publi´es dans des conf´erences et workshops dans le domaine
du web s´emantique. Chaque publication est en relation avec une conf´erence, a un ou plusieurs
sujets et une liste d’auteurs. De plus, chaque auteur est affili´e `a un ´etablissement. La figure 3.2.1 repr´esente un extrait de l’ontologie d´ecrivant ces informations.
Les donn´ees utilis´ees proviennent des 17e et 18e conf´erences internationales World Wide
Web. Les donn´ees sont compos´ees de 209 publications (Paper), 1282 auteurs (Author), 216
affiliations (Affiliation) et 726 sujets (Subject) qui repr´esentent les th´ematiques de recherche.