• Aucun résultat trouvé

5.5 Définition du profil sémantique d’un utilisateur de SRI : ap-

5.5.2 Principe de délimitation des sessions de recherche

5.5.3.1 Algorithme générique de définition du profil à

Nous détaillons le principe général de définition du profil à court et à long terme dans l’algorithme 5.5.3.1. Il s’agit de :

1. l’initilisation du profil à court terme au début d’une session de recherche traitant un nouveau centre d’intérêt.

2. la délimitation des sessions de recherche effectuée à la soumission d’une nouvelle requête. Ce test engendre un des deux cas possibles :

– un basculement vers un nouveau centre d’intérêt à apprendre, – un basculement vers un centre d’intérêt récurrent.

Dans cet algorithme, le système implique le scénario suivant pour chaque requête soumise par l’utilisateur : un utilisateur u soumet une requête qs à

l’instant s au moteur de recherche ; ce dernier retourne une liste de résultats Ds parmi lesquels l’utilisateur clique sur un ensemble de résultats Ds

r qui lui

semblent pertinents. Partant de ces documents, le système construit le profil de la requête selon un ensemble de concepts issus de l’ontologie de l’ODP. Nous considérons que le profil de l’utilisateur à long terme est représenté par un ensemble de profils unitaires, noté U = {P1

u, Pu2, ..., Pun}. Le seuil de délimitation

des sessions de recherche est fixé à σ∗, impliquant que deux requêtes successives

sont inscrites dans la même session si la corrélation est supérieure au seuil optimal.

1. Initialisation du profil à court terme : A l’issue de la soumission d’une première requête q0 d’une session traitant d’un nouveau besoin

en information, le système construit le profil de la requête à partir des documents pertinents Ds

r et initialise le profil de l’utilisateur par le profil

de cette première requête.

2. Test de délimitation des sessions de recherche : le système traite ensuite chaque nouvelle requête qs+1 soumise à un instant s + 1 dans un

mécanisme de délimitation des sessions de recherche. Ce dernier est basé sur la mesure de corrélation conceptuelle ∆I entre les concepts du profil utilisateur construit jusqu’à l’instant s, noté Ps

u et les concepts associés

à la nouvelle requête qs+1. Deux cas peuvent être envisagés : la nouvelle

requête traite le même centre d’intérêt que la session courante résultant ainsi l’évolution du profil à court terme, ou elle initie une nouvelle session de recherche résultant ainsi l’évolution du profil à long terme.

– la requête est inscrite dans la session courante : si la corrélation ∆I est supérieure à un seuil optimal σ∗, on considère que la requête qs+1 est considérée liée au profil utilisateur. Ceci induit les deux mécanismes suivants :

(a) Personnalisation du processus de recherche : le profil uti- lisateur est par la suite utilisé dans le ré-ordonnancement de ses résultats de recherche de la requête en cours d’évaluation,

(b) Évolution du profil à court terme : A partir du feedback de l’utilisateur, le système construit le profil de la nouvelle requête Pqs+1et est utilisé dans le processus d’évolution du profil utilisateur

Ps u.

Algorithme 1 Processus général de RI personnalisée intégrant un profil utili- sateur sémantique

Notations : U = {P1

u, Pu2, ..., Pun} le profil de l’utilisateur u à long terme,

σ∗ le seuil de corrélation optimal de délimitation des sessions de recherche,

d∗ est le seuil optimal de la distance sémantique requête-profil.

Traitement d’une nouvelle session de recherche Si initiée par la

requête q0 :

si U 6= ∅ alors

* Extraire les concepts associés à la requête à partir de l’ontologie de l’ODP, noté q0 c, * sélectionner P∗ = argmax Pi u∈Udg(q 0 c, Pui), si dg(qc0, P∗) ≺ d∗ alors

Il s’agit d’un profil préalablement découvert :

* Réinitialiser le profil utilisateur dans la session par le profil identifié : P0

u = P∗,

* réordonner les résultats de recherche de la requête qs+1 avec le profil

P0 u,

sinon

Il s’agit d’un nouveau profil à apprendre : * Construire le profil de la requête Pq0

* Initialiser le profil de l’utilisateur par le profil de cette requête :P0 u =

Pq0

finsi finsi

pour Chaque nouvelle requête qs+1 émise par l’utilisateur faire

Test de délimitation des sessions de recherche :

* calcul de la corrélation conceptuelle entre la requête et le profil ∆I = (qs+1◦ Ps

u)

si ∆I ≥ σ alors

La requête qs+1 est inscrite dans la même session

* Réordonner les résultats de recherche de la nouvelle requête qs+1 en

utilisant le profil utilisateur Ps u

* Construire le profil de la requête Pqs+1

* Mise à jour du profil utilisateur : Ps+1

u = Pus∪ Pqs+1

sinon

Détection d’une nouvelle session Si+1 :

* Augmenter le profil à long terme par le profil à court terme créé jusqu’à l’instant s : U = U ∪ PSi

u

Repartir au début du fonctionnement de l’algorithme. finsi

– Détection d’une nouvelle session de recherche : si la corrélation ∆I < σ∗, alors la requête initie une nouvelle session de recherche. Ceci

contribue à l’évolution du profil à long terme par addition du profil appris Ps

u au profil à long terme et l’identification de l’une des deux cas

suivants : la requête traite d’un centre d’intérêt récurrent à long terme ou un nouveau besoin en information à apprendre. L’identification de ces deux figures de cas se fait sur la base d’une mesure de similarité sémantique entre la requête et les profils préalablement appris dans U. Nous fixons un seuil de similarité optimal, noté d∗ au delà duquel le

profil utilisateur et la requête seront considérés non similaires.

(a) Traitement d’un centre d’intérêt récurrent : si la requête est corrélée à un profil utilisateur à long terme déjà appris P ∗, celui-ci sert à l’initialisation du profil de l’utilisateur à court terme dans cette nouvelle session et est utilisé dans le ré-ordonnancement des résultats de recherche de cette requête.

(b) Traitement d’un nouveau centre d’intérêt : si la requête n’est corrélée à aucun des profils utilisateurs déjà appris, nous consta- tons qu’un nouveau besoin en information est à apprendre dans la nouvelle session de recherche S1 en repartant à l’initiation d’une

session de recherche traité au début de l’algorithme.

La gestion du cycle de vie du profil à long terme est à la base de la récurrence des centres d’intérêts de l’utilisateur au cours de ses sessions de recherche d’une part et de leur fraîcheur d’autre part. Ces deux critères peuvent être pris en compte en calculant le nombre de sessions de recherche traitant un centre d’intérêt donné dans un intervalle de temps précis.