• Aucun résultat trouvé

Les défis majeurs en RI personnalisée concernent principalement le modèle de représentation du profil et la gestion de l’évolution du profil. Nos objectifs dans le cadre de notre approche de personnalisation s’articulent autour de la définition d’un profil utilisateur ayant une représentation sémantique, et la construction et l’évolution de ce profil à court et à long terme dans le but de répondre à la fois à des besoins en information spécifiques ou récurrents au cours de ses sessions de recherche. Nos motivations concernant les différents éléments de notre contribution s’articulent sur les points suivants :

– Représenter le profil utilisateur par un paquet des concepts sémantique- ment reliés traduisant ainsi un centre d’intérêt unique. L’objectif est dé- gager une représentation unique du besoin en information traitée par un ensemble de requêtes corrélées.

– Construire et faire évoluer le profil à court terme selon des mécanismes de collecte de l’information pertinente issue de l’évaluation des requêtes traitant du même besoin en information et de déploiement de ces infor- mations au niveau spécifique du besoin de l’utilisateur dans une tâche de recherche donnée.

– Construire et faire évoluer le profil à long terme selon des mécanismes de gestion de la diversité des centres d’intérêts de l’utilisateur et l’exploiter pour répondre à des requêtes traitant d’un besoin en information récur- rent. L’exploitation du profil à long terme est à la base de l’identification du centre d’intérêt le plus adéquat à une tâche de recherche initiée par une requête réccurrente donnée.

Plus précisément, nos contributions portent principalement sur la proposi- tion de deux modèles de représentation sémantiques du profil de l’utilisateur,

un mécanisme de délimitation des sessions de recherche pour l’évolution du profil à court terme dans une même session de recherche et l’utilisation d’une mesure de similarité basé-graphe pour l’identification d’un profil à long terme adéquat à une requête récurrente. Nous résumons notre orientation générale et la spécificité de notre contribution comparativement aux approches développées dans le domaine selon les deux aspects suivants :

1. Modèle de représentation du profil utilisateur :

notre approche intègre un modèle de représentation sémantique du profil de l’utilisateur basée sur l’ontologie de l’ODP. Dans les approches exis- tantes, le profil utilisateur est représenté par une instance de l’ontologie décrivant un ou plusieurs centres d’intérêts [162, 67, 122], des paires des concepts relativement spécifiques aux requêtes de l’utilisateur, et où la hiérarchisation principale de l’ontologie est ignorée [163], ou alors un en- semble de concepts issus des trois premiers niveaux de l’ontologie utilisée invariablement entre tous les utilisateurs [121]. Ces modèles de repré- sentation sont dans quelques approches très spécifiques à la requête en cours d’évaluation [163,162], soient contiennent une diversité des centres d’intérêts représentés de manière éparse dans l’ontologie [67, 122, 162]. Comparativement à ces approches, nous proposons une représentation sé- mantique du profil de l’utilisateur basée sur une liste de concepts ou un graphe de concepts sémantiquement corrélés à un même centre d’intérêt et issus d’une ontologie de domaine largement utilisée, notamment l’ODP (Open Directory Project).

(a) Le profil représenté par une liste de concepts de l’ontologie présente l’avantage de personnaliser la recherche à un niveau de spécificité commun pour l’ensemble des requêtes appartenant à une même ses- sion de recherche [6,7, 8].

(b) Le profil représenté par un graphe de concepts permet de grouper, dans une même structure, des concepts sémantiquement reliés et is- sus de différentes portions de l’ontologie, disposant ainsi de plusieurs niveaux de spécificité/généralité du profil [9, 10, 4]. Notre intuition de base concernant ce modèle consiste à renforcer la corrélation entre les concepts produisant ainsi un profil de précision élevée et répon- dant à des besoins en information spécifiques de l’utilisateur. 2. Évolution du profil utilisateur : notre modèle intègre la gestion de

l’évolution du profil à court et à long terme.

(a) L’évolution du profil utilisateur à court terme consiste à enrichir sa représentation sur la base des requêtes corrélées et elle est conjointe- ment liée à un mécanisme de délimitation des sessions de recherche permettant de scruter le changement des centres d’intérêts au cours du temps.

(b) L’évolution du profil à long terme est basée sur l’hypothèse de récur- rence des besoins en information au cours des sessions de recherche[177],

qui permet de traduire une diversité des centres d’intérêts de l’uti- lisateur. Selon cette hypothèse, nous adoptons le principe de l’évo- lution du profil à long terme basée sur son augmentation par des profils construits à court terme.

Les seules approches dans le domaine qui proposent une évolution du pro- fil à court terme dans une même session de recherche sont basées sur une mesure de similarité sémantique utilisant l’information mutuelle (Jensen- shanon similarity) entre des requêtes successives [160] ou une mesure statistique de changements de rangs des termes représentatifs entre des contextes de requêtes successifs en utilisant la mesure de kendall [177]. Quant à l’évolution du du profil à long terme, la plupart des approches d’évolution sont basées souvent sur l’accumulation de l’historique de re- cherche, comme dans Google Psearch1 et [179], ou à la mise à jour des

contextes (paire de concepts) qui sont relativement spécifiques à l’histo- rique des requêtes soumises [163].

Comparativement à ces approches, notre méthode d’évolution du profil se distingue par les points suivants :

(a) La détection du basculement des centres d’intérêts au cours des ses- sion de recherche est basée sur une similarité conceptuelle entre requêtes successives qui permet de scruter le changement de l’im- portance des concepts récurrents d’une requête à une autre. Une méthode statistique est déployée pour cela afin de détecter, en cours du temps, les différents changements des centres d’intérêts.

(b) L’initialisation du profil utilisateur à court terme adéquat à une requête utilisateur est à la base de l’utilisation d’une mesure de si- milarité basée-graphe entre la requête et un profil utilisateur appris à long terme. L’utilisation de telles mesures permet de dépasser les limites de la similarité basée-terme.