• Aucun résultat trouvé

court terme et à long terme dans la person-

nalisation du processus de recherche

L’hypothèse majeure de la personnalisation du processus de RI dans notre approche consiste à exploiter le profil utilisateur qui traite le même besoin en information que la requête. L’importance de cette hypothèse dans notre ap- proche réside dans le fait que le profil utilisateur exploité, contient les concepts

les plus adéquats à une recherche courante. Le système n’a pas à identifier les concepts du profil les plus similaires à chaque document résultat restitué par le système en réponse à une requête donnée.

Nous distinguons deux cas permettant d’exploiter le profil à long terme ou à court terme dans le processus de recherche en fonction de la requête émise : 1. Exploitation du profil à long terme : dans ce cas, la requête initie une session de recherche traitant un besoin en information récurrent. Le profil à long terme le plus similaire à la requête est identifié selon une mesure de similarité basé-graphe et sert à l’initialisation du profil à court terme au début de la session de recherche.

2. Exploitation du profil à court terme : dans ce cas, la requête est inscrite dans une session de recherche et est précédée par une séquence de requêtes traitant le même besoin en information. Le profil à court terme est ainsi construit sur la base de la séquence des requêtes précédentes.

L’exploitation du profil dans le processus de recherche consiste à ré-ordonner les résultats de recherche de la requête par combinaison du score original du document et de score personnalisé. Soit Ps

u, le profil utilisateur à exploiter dans

le processus de recherche de la requête qs+1, le système ré-ordonne la liste des

résultats retournés pour cette requête en combinant pour chaque document dk,

son score initial, noté Si avec son score personnalisé, noté Sp calculé comme

suit :

Sf(dk) = γ ∗ Si(q, dk) + (1 − γ) ∗ Sp(dk, Gsu) (5.19)

0 < γ < 1

Si γ est égale à zéro, les résultats seront ordonnées selon le score personnalisé basé seulement sur leur similitude avec le profil utilisateur. Si γ est égale à 1, les résultats seront ordonnées selon leur score original issu du modèle de recherche classique du système. Si γ appartient à l’intervalle [0 1], les résultats seront ordonnés en tenant compte du score original du document et de son score personnalisé en accordant un degré d’importance à l’un au détriment de l’autre.

Le score personnalisé du document est calculé selon une mesure de similarité cosine entre le document dk et les concepts du profil de l’utilisateur Pus.

Sp(dk, Gsu) = 1 h. X j=1..h score(cj) ∗ cos( ~dk, ~cj) (5.20)

Où cj représente un concept du profil, score(cj) est le poids du concept cj dans

le profil et h est le nombre de concepts du profil considérés dans le processus de personnalisation.

5.9

Conclusion

Nous avons présenté au cours de ce chapitre notre contribution portant sur la conception d’une approche de RI personnalisée basée sur la construction, l’évolution et l’exploitation des profils utilisateurs sémantiques à court et à long terme dans le processus de RI. Ce modèle présente les avantages suivants : – L’avantage du modèle de représentation sémantique du profil selon un graphe de concepts est lié à sa cohérence et le niveau de spécificité de ses concepts, servant ainsi à répondre à des besoins en information spécifiques de l’utilisateur.

– La construction du profil utilisateur à court et à long terme permet res- pectivement de modéliser le contexte de recherche le plus adéquat à une tâche de recherche précise et répondre à des besoins en information ré- currents de l’utilisateur traduisant ainsi des centres d’intérêts persistants de l’utilisateur.

– Finalement, la personnalisation du processus de recherche consiste à ex- ploiter le profil utilisateur dans le réordonnancement des résultats de recherche des requêtes traitant du même besoin en information.

L’évaluation de cette approche de personnalisation sera abordée selon deux cadres d’évaluation orientés-contexte présentés dans les deux derniers chapitre de ce mémoire.

Évaluation basée sur un cadre

d’évaluation issu de TREC

Adhoc : mise en œuvre et résultats

6.1

Introduction

Classiquement, l’évaluation des systèmes de recherche d’information suit le modèle de Cranfield [45] adopté généralement dans les campagnes d’évalua- tion (TREC, CLEF, INEX, etc.). Ce modèle permet de mener une étude com- parative entre différents algorithmes de recherche sur la base des ressources communes et en utilisant les mêmes métriques d’évaluation (essentiellement basées sur le rappel-précision). Toutefois, ce paradigme d’évaluation n’est pas viable pour l’évaluation des SRI en présence du contexte. Le chapitre3présenté dans la première partie de cette thèse a permis de cerner l’évaluation des SRI en donnant un aperçu du paradigme d’évaluation classique de Cranfield et de ses limitations en présence du contexte, ainsi que l’émergence des approches d’évaluation orientées-contexte adaptées à l’évaluation des SRI personnalisés. La problématique de l’évaluation est d’autant plus particulière dans un SRI personnalisé basé-session où le profil est construit sur la base d’un ensemble de requêtes liées à un besoin en information.

Nous nous intéressons dans ce chapitre à présenter un cadre d’évaluation par simulation des contextes, appelé TREC Adhoc, préalablement proposé pour l’évaluation de l’efficacité de la recherche personnalisée basée sur l’utilisation d’un profil utilisateur, basé mots clés [178]. Nous étendons ce même cadre pour supporter un protocole d’évaluation des profils utilisateurs sémantiques, repré- sentés chacun par un ensemble de concepts issus d’une ontologie de domaines Web [11]. Nous présentons ensuite les résultats de l’évaluation de notre ap-

proche de personnalisation à court terme suivant ce cadre d’évaluation, plus précisément, nous évaluons la qualité des profils appris ainsi que l’efficacité de la recherche personnalisée. Finalement, nous évaluons la précision d’identifica- tion des profils à long terme adéquats à des requêtes traitant le même besoin en information et l’efficacité des ces profils dans la personnalisation du processus de RI.

Ce chapitre est organisé comme suit. La section6.2 présente les motivations pour la proposition du cadre d’évaluation TREC Adhoc ainsi que ses compo- santes principales. La section 6.3 présente l’évaluation de la qualité des profils selon selon les deux modèles de représentation sémantique du profil, proposés dans notre approche. La section 7.4 présente l’évaluation de l’efficacité de la recherche personnalisée à court terme. La section 6.5 présente l’évaluation de la recherche personnalisée à long terme. La dernière section conclut le chapitre.