• Aucun résultat trouvé

5.5 Définition du profil sémantique d’un utilisateur de SRI : ap-

5.5.2 Principe de délimitation des sessions de recherche

5.5.3.2 Illustration

Dans le but d’illustrer l’algorithme de définition du profil, on suppose un scénario de recherche comportant trois itérations de recherche effectuées par un utilisateur u sur une collection de documents. Nous considérons deux requêtes successives traitant du même besoin en information suivies par une requête traitant un besoin en information différent. Selon ce scénario de recherche, nous détaillons le principe de définition du profil à court terme, à partir des requêtes corrélées ainsi que le principe de base du mécanisme de délimitation des sessions de recherche.

Première itération de recherche :

La première itération de recherche est définie par la soumission à l’instant s0

de la première requête qs0= "encephal mosquito spray" dans une session de

recherche. Dans cette première itération de recherche, le fonctionnement du système est décrit par les actions suivantes :

– Construction du profil de la requête qs0 :

1. A partir de l’ensemble de documents jugés pertinents par l’utilisa- teur, un vecteur de termes pondérés est construit, dont les termes les mieux pondérés sont représentatifs dans l’ensemble de ces docu- ments.

Kqs0={encephal 5.09, mosquito 4.12, spray 3.51, insecticid 2.37, ma-

lathion 2.36, state 2.16, louy 2.11, fever 2.07,outbreak 1.83, lethargy 1.78, headach 1.64}.

2. Le profil de la requête qs0 associé est obtenu en projetant le vecteur

Kqs0 sur l’ontologie de l’ODP suivi par une étape de désambiguï-

sation. La racine de l’ontologie est nommée "Top", sous laquelle se classifient les concepts hiérarchiquement. Le profil associé à la requête qs0, nommé Ps0

q est composé des concepts pondérés parmi

lesquels nous présentons les six premiers dans le tableau 5.1.

– Initialisation du profil de l’utilisateur : Le profil de l’utilisateur est initia- lisé par le profil de cette requête qs0, nommé Ps0

u ,

Concept Poids

Top/ Health/ Conditions and Diseases/ Infectious Diseases/ Viral/ West Nile Virus

0.30 Top/ Health/ Conditions and Diseases/ Neurological Disor- ders/Infections/Encephalitis

0.23 Top/ Health/ Conditions and Diseases/ Infectious Diseases/ Vector Borne

0.22 Top/ Recreation/ Outdoors/ Equipment/ Insect Repellent 0.22 Top/ Health/ Conditions and Diseases/ Infectious Diseases 0.22 Top/ Health/ Conditions and Diseases/ Infectious Diseases/ Viral

0.19 Tab.5.1 – Les premiers concepts associés à la requête encephal mosquito spray

Deuxième itération de recherche :

La deuxième itération de recherche est définie par la soumission d’une deuxième requête qs1= "state encephal nile" à l’instant s

1 traitant le même besoin en

information que la requête précédente. Dans cette itération, le fonctionnement du système est décrit par les actions suivantes :

– Test de délimitation des sessions de recherche : Dans le but de tester si la requête appartient à la session de recherche courante, le système projette la requête qs1 sur l’ontologie de l’ODP afin d’extraire les concepts les

plus similaires à la requête et les comparer à ceux du profil. La liste des premiers concepts pondérés les plus similaires à la requête sont présentés dans le tableau 5.2.

La valeur de corrélation (selon la mesure statistique de Kendall entre la requête qs1 et le profil de l’utilisateur Ps0

Concept Poids Top/ Health/Conditions and Diseases/ Infectious Diseases/ Vi-

ral/ West Nile Virus

0.54 Top/ Health/ Conditions and Diseases/ Neurological Disor- ders/ Infections/ Encephalitis

0.30 Top/ Health/ Conditions and Diseases/ Neurological Disor- ders/ Dementia/ AIDS Dementia Complex

0.28 Top/ Recreation/ Outdoors/ Equipment/ Insect Repellent 0.27 Top/ Science/ Biology/ Flora and Fauna/ Animalia/ Arthro- poda/ Insecta/ Diptera/ Mosquitoes

0.23 Top/ Health/ Conditions and Diseases/ Infectious Diseases/ Vector Borne

0.22 Tab. 5.2 – Les premiers concepts associés à la requête state encephal nile

seuil de délimitation des sessions de recherche égale à −0.34, la requête est inscrite dans la session de recherche courante.

– Personnalisation de la requête qs1 : Le profil de l’utilisateur Ps0

u est utilisé

dans le réordonnancement des résultats de recherche de la requête qs1.

Pour chaque document résultat de recherche, un score personnalisé est calculé basé sur la similarité du document avec les concepts du profil. Ce score est ensuite combiné avec le score original du document produisant ainsi le score final.

– Construction du profil de la requête qs1 :

1. A partir de l’ensemble de documents jugés pertinents par l’utilisa- teur restitués pour la requête qs1, un vecteur de termes pondérés est

construit contenant les termes suivants :

Kqs1={state 7.38, encephal 5.24, nile 3.94, mosquito 3.68, cdc 3.22,

viru 2.86, strain 2.41, spray 2.33, kunjin 2.22, pesticid 2.21, louy 2.05}.

2. le profil de la requête qs1 associé est obtenu en projetant le vecteur

Kqs1 sur l’ontologie de l’ODP suivi par une étape de désambiguïsa-

tion. Le profil obtenu, nommé Ps1

q est composé des concepts pondérés

parmi lesquels nous présentons les premiers dans le tableau 5.3. – Évolution du profil de l’utilisateur : Cette évolution se fait par combi-

naison du profil de la requête qs1 avec le profil Ps0

u produisant ainsi le

profil e l’utilisateur à l’instant s1, noté Pus1. La combinaison de ces deux

profils est à la base de l’accumulation des poids des concepts communs et l’addition des nouveaux concepts issus du profil de la requête au profil de l’utilisateur Ps1

u (cf. sect.5.6.3).

Troisième itération de recherche :

La troisième itération de recherche est définie par la soumission d’une troisième requête qs3= "earthquakes state" à l’instant s

3 par l’utilisateur traitant un

Concept Poids Top/ Health/ Conditions and Diseases/ Infectious Diseases/

Viral/ West Nile Virus

0.36 Top/ Health/ Conditions and Diseases/ Infectious Diseases/ Vector Borne

0.2535 Top/ Health/ Conditions and Diseases/ Infectious Diseases/

Viral

0.2534 Top/ Health/ Conditions and Diseases/ Infectious Diseases 0.2516 Top/ Recreation/ Outdoors/ Equipment/ Insect Repellent 0.21 Top/ Health/ Conditions and Diseases/ Neurological Disor- ders/ Infections/ Encephalitis

0.2049 Top/ Health/ Animal/ Mammals/ Equine/ Conditions and Di-

seases

0.2043 Tab.5.3 – Les premiers concepts associés au profil de la requête state encephal nile

est décrit par les actions suivantes :

– Test de délimitation des sessions de recherche :

le système projette la requête qs3 sur l’ontologie de l’ODP afin d’extraire

les concepts associés. La liste des premiers concepts obtenus sont présentés dans le tableau 5.4.

Concept Poids

Top/ Science/ Earth Sciences/ Geophysics/ Earthquakes 0.0865 Top/ Shopping/ Home and Garden/ Emergency Supplies/ Na-

tural Disasters

0.0861 Top/ Kids and Teens/ School Time/ Science/ The Earth/ Geo-

logy/Earthquakes

0.082 Top/ Science/ Earth Sciences/ Geophysics/ Earthquakes/ Seis-

micity Reports/ United States

0.081 Top/ Science/ Earth Sciences/ Geophysics/ Earthquakes/ Past

Earthquakes

0.079 Top/ Science/ Earth Sciences/ Geophysics/ Earthquakes/ Seis-

micity Reports/ United States

0.081 Top/ Science/ Earth Sciences/ Geophysics/ Earthquakes/ Past

Earthquakes/ Kashmir 2005

0.078 Tab. 5.4 – Les premiers concepts associés à la requête earthquakes state

La valeur de corrélation de Kendall entre la requête qs2 et le profil de

l’utilisateur Ps1

u est de −0.46. Étant donné un seuil de délimitation des

sessions de recherche égale à −0.34, la requête initie une nouvelle session de recherche traitant un nouveau besoin en information.

– Apprentissage d’un nouveau centre d’intérêt ou identification d’un centre d’intérêt récurrent adéquat à la requête.

5.6

Construction et évolution du profil de l’uti-