• Aucun résultat trouvé

`

a court terme et `a long terme dans la

per-sonnalisation du processus de recherche

L’hypoth`ese majeure de la personnalisation du processus de RI dans notre approche consiste `a exploiter le profil utilisateur qui traite le mˆeme besoin en information que la requˆete. L’importance de cette hypoth`ese dans notre ap-proche r´eside dans le fait que le profil utilisateur exploit´e, contient les concepts les plus ad´equats `a une recherche courante. Le syst`eme n’a pas `a identifier les concepts du profil les plus similaires `a chaque document r´esultat restitu´e par le syst`eme en r´eponse `a une requˆete donn´ee.

c1 c2 c3 c6 c5 c4 c7 c9 c14 c8 c9 c10 c13 c12 c11 c14 c 15 c0 g1 g2 MCS(g1, g2) c1 c2 c3 c6 c5 c4 c7 c9 c14 c8 c9 c10 c13 c12 c11 c14 c 15 c8 c9 c10 c13 c12 c11 c14 c 15 c0 g1 g2 MCS(g1, g2) c1 c2 c3 c6 c5 c4 c7 c9 c14 c8 c9 c10 c13 c12 c11 c14 c15 c0 g1 g2 MCS(g1, g2) mcs(g1*,g2*) Concepts activés

Concepts intermédiaires activés

Fig. 5.7 – (a) les deux graphes n’ont pas des liens de r´ef´erences entre eux, (b) les deux graphes ont des liens de r´ef´erence entre eux

Nous distinguons deux cas permettant d’exploiter le profil `a long terme ou `a court terme dans le processus de recherche en fonction de la requˆete ´emise : 1. Exploitation du profil `a long terme : dans ce cas, la requˆete initie une session de recherche traitant un besoin en information r´ecurrent. Le profil `a long terme le plus similaire `a la requˆete est identifi´e selon une mesure de similarit´e bas´e-graphe et sert `a l’initialisation du profil `a court terme au d´ebut de la session de recherche.

2. Exploitation du profil `a court terme : dans ce cas, la requˆete est inscrite dans une session de recherche et est pr´ec´ed´ee par une s´equence de requˆetes traitant le mˆeme besoin en information. Le profil `a court terme est ainsi construit sur la base de la s´equence des requˆetes pr´ec´edentes.

L’exploitation du profil dans le processus de recherche consiste `a r´e-ordonner les r´esultats de recherche de la requˆete par combinaison du score original du document et de score personnalis´e. Soit Ps

u, le profil utilisateur `a exploiter dans le processus de recherche de la requˆete qs+1, le syst`eme r´e-ordonne la liste des r´esultats retourn´es pour cette requˆete en combinant pour chaque document dk, son score initial, not´e Si avec son score personnalis´e, not´e Sp calcul´e comme suit :

Sf(dk) = γ ∗ Si(q, dk) + (1 − γ) ∗ Sp(dk, Gsu) (5.19) 0 < γ < 1

Si γ est ´egale `a z´ero, les r´esultats seront ordonn´ees selon le score personnalis´e bas´e seulement sur leur similitude avec le profil utilisateur. Si γ est ´egale `a 1, les r´esultats seront ordonn´ees selon leur score original issu du mod`ele de recherche classique du syst`eme. Si γ appartient `a l’intervalle [0 1], les r´esultats seront ordonn´es en tenant compte du score original du document et de son score personnalis´e en accordant un degr´e d’importance `a l’un au d´etriment de l’autre.

Le score personnalis´e du document est calcul´e selon une mesure de similarit´e cosine entre le document dk et les concepts du profil de l’utilisateur Ps

u. Sp(dk, Gsu) = 1 h. X j=1..h score(cj) ∗ cos( ~dk, ~cj) (5.20) O`u cj repr´esente un concept du profil, score(cj) est le poids du concept cj dans le profil et h est le nombre de concepts du profil consid´er´es dans le processus de personnalisation.

5.9 Conclusion

Nous avons pr´esent´e au cours de ce chapitre notre contribution portant sur la conception d’une approche de RI personnalis´ee bas´ee sur la construction, l’´evolution et l’exploitation des profils utilisateurs s´emantiques `a court et `a long terme dans le processus de RI. Ce mod`ele pr´esente les avantages suivants : – L’avantage du mod`ele de repr´esentation s´emantique du profil selon un graphe de concepts est li´e `a sa coh´erence et le niveau de sp´ecificit´e de ses concepts, servant ainsi `a r´epondre `a des besoins en information sp´ecifiques de l’utilisateur.

– La construction du profil utilisateur `a court et `a long terme permet respec-tivement de mod´eliser le contexte de recherche le plus ad´equat `a une tˆache de recherche pr´ecise et r´epondre `a des besoins en information r´ecurrents de l’utilisateur traduisant ainsi des centres d’int´erˆets persistants de l’uti-lisateur.

– Finalement, la personnalisation du processus de recherche consiste `a ex-ploiter le profil utilisateur dans le r´eordonnancement des r´esultats de recherche des requˆetes traitant du mˆeme besoin en information.

L’´evaluation de cette approche de personnalisation sera abord´ee selon deux cadres d’´evaluation orient´es-contexte pr´esent´es dans les deux derniers chapitre de ce m´emoire.

Evaluation bas´ee sur un cadre

d’´evaluation issu de TREC

Adhoc : mise en œuvre et

r´esultats

6.1 Introduction

Classiquement, l’´evaluation des syst`emes de recherche d’information suit le mod`ele de Cranfield [45] adopt´e g´en´eralement dans les campagnes d’´evaluation (TREC, CLEF, INEX, etc.). Ce mod`ele permet de mener une ´etude compara-tive entre diff´erents algorithmes de recherche sur la base des ressources com-munes et en utilisant les mˆemes m´etriques d’´evaluation (essentiellement bas´ees sur le rappel-pr´ecision). Toutefois, ce paradigme d’´evaluation n’est pas viable pour l’´evaluation des SRI en pr´esence du contexte. Le chapitre3pr´esent´e dans la premi`ere partie de cette th`ese a permis de cerner l’´evaluation des SRI en donnant un aper¸cu du paradigme d’´evaluation classique de Cranfield et de ses limitations en pr´esence du contexte, ainsi que l’´emergence des approches d’´evaluation orient´ees-contexte adapt´ees `a l’´evaluation des SRI personnalis´es. La probl´ematique de l’´evaluation est d’autant plus particuli`ere dans un SRI personnalis´e bas´e-session o`u le profil est construit sur la base d’un ensemble de requˆetes li´ees `a un besoin en information.

Nous nous int´eressons dans ce chapitre `a pr´esenter un cadre d’´evaluation par simulation des contextes, appel´e TREC Adhoc, pr´ealablement propos´e pour l’´evaluation de l’efficacit´e de la recherche personnalis´ee bas´ee sur l’utilisation d’un profil utilisateur, bas´e mots cl´es [180]. Nous ´etendons ce mˆeme cadre pour supporter un protocole d’´evaluation des profils utilisateurs s´emantiques,

repr´esent´es chacun par un ensemble de concepts issus d’une ontologie de do-maines Web [11]. Nous pr´esentons ensuite les r´esultats de l’´evaluation de notre approche de personnalisation `a court terme suivant ce cadre d’´evaluation, plus pr´ecis´ement, nous ´evaluons la qualit´e des profils appris ainsi que l’efficacit´e de la recherche personnalis´ee. Finalement, nous ´evaluons la pr´ecision d’identifica-tion des profils `a long terme ad´equats `a des requˆetes traitant le mˆeme besoin en information et l’efficacit´e des ces profils dans la personnalisation du processus de RI.

Ce chapitre est organis´e comme suit. La section6.2pr´esente les motivations pour la proposition du cadre d’´evaluation TREC Adhoc ainsi que ses compo-santes principales. La section6.3 pr´esente l’´evaluation de la qualit´e des profils selon selon les deux mod`eles de repr´esentation s´emantique du profil, propos´es dans notre approche. La section 7.4 pr´esente l’´evaluation de l’efficacit´e de la recherche personnalis´ee `a court terme. La section 6.5 pr´esente l’´evaluation de la recherche personnalis´ee `a long terme. La derni`ere section conclut le chapitre.