Description des ressources exp´erimentales

4.4 Evaluation exp´erimentale de la pr´ediction du type de besoin

4.4.1 Description des ressources exp´erimentales

Nous décrivons dans cette section, la collection de test utilisée pour l’évaluation de la classification des requêtes, les outils d’extraction des ca-ractéristiques des requêtes ainsi que le classifieur TiMBL adopté pour la clas-sification des requêtes par apprentissage supervisé.

4.4.1.1 Collection de test

Dans le but d’évaluer la classification des requêtes selon le type informa-tionnel, navigationnel ou transacinforma-tionnel, nous avons utilisé trois ensembles de requêtes issus des collections de TREC, présentés dans la table 4.4.1.1. Cette collection comporte comme indiqué dans le tableau des requêtes annotées par le type de besoin informationnel issues de la collection TREC-2001 et TREC-9

et des requˆetes de type navigationnel ou transactionnel issues de la collection TREC 2001.

Nous avons subdivisé l’ensemble des requêtes annotées chacune par un type de besoin en un sous-ensemble d’apprentissage et un sous-ensemble de test.

– Les requêtes d’apprentissage servent à calculer les taux d’utilisation opti-maux des termes de la requête dans les titres (τt∗) et les textes d’ancrage des hyperliens (τa∗) dans les pages Web de la collection WT10G. Ces taux sont définis dans le descripteur morphologique de la requête comme étant des propriétés des requêtes navigationnelles et transactionnelles (cf. chap.4.3.1.1 sect.4.3.1.1p.119). Elles servent également à l’apprentissage de la classification basée sur TiMBL.

– Les requêtes de test sont utilisées dans l’évaluation des méthodes de clas-sification.

Type de la requˆete Apprentissage Test Informationnel TREC-9 (th`eme

451-500)

TREC-2001 (th`eme 501-550)

Navigationnel TREC-2001 (th`eme 1-100)

TREC-2001 (th`eme 101-145)

Transactionnel TREC-2001 (th`eme 20001-20100)

TREC-2001 (th`eme 20101-20150)

Tab.4.2 – Choix des collections de requˆetes

4.4.1.2 Outils et ressources d’extraction des caract´eristiques de la requˆete

Nous spécifions dans cette section les outils utilisés pour extraire le des-cripteur morphologique de la requête (cf. chap.4.3.1.1 sect.4.3.1.1p.119). Pour chaque requête de la collection de test Q, exprimé en langage naturel, nous calculons le descripteur morphologique F (Q) comme suit :

F (Q) = (kQk , V b, T r, T i, τa, τt)

– kQk est calcul´e par le nombre des termes de la requˆete Q,

– Vb désigne l’apparition d’un verbe dans la requête. Nous avons utilisé Treetagger, un outil linguistique, écrit en Python, permettant d’analyser la syntaxe grammaticale d’une phrase ou d’une expression.

– les deux caractéristiques Tr et Ti sont identifiées respectivement sur la base d’une liste prédéfinie de termes transactionnels et de termes interro-gatifs. La présence ou l’absence d’un terme transactionnel (resp.interrogatif) dépend de la définition de ces listes.

– Les seuils des taux d’utilisation des termes de la requête dans les balises (τa et τt) sont calculés sur la collection WT10G, fournie dans le cadre d’évaluation TREC selon la formule 4.3.1.1 (cf. chap.4.3.1.1 sect.4.3.1.1

p.119).

Le tableau ci dessous décrit les caractéristiques de la collection WT10G indexée en utilisant le moteur de recherche Mercure [29].

Nombre de documents 1,557,918 Nombre de termes 3,199,772 Longueur moyenne du

docu-ment

338,6880 Nombre moyen de mots simples

par document

142,3035 Taille de la collection 10 Giga-octets

Tab.4.3 – Propri´et´es de la collection WT10G

4.4.1.3 Outil de classification des requêtes par apprentissage super-visé basé sur TiMBL

TiMBL [52] est un outil de classification par apprentissage supervisé per-mettant de classifier des objets dans des classes prédéfinies selon la méthode des K-plus proche voisins. Il implémente plusieurs algorithmes d’apprentissage basé sur le stockage de tous les exemples des classes des requêtes prédéfinies sous forme de vecteurs descriptifs. Sur la base de ces exemples, il classifie selon diverses mesures de similarité chaque nouvelle requête représentée également par un vecteur descriptif selon le type de besoin représenté par les exemples les plus proches.

4.4.2 Protocole d’´evaluation

Généralement, l’évaluation de la précision de classification consiste à compa-rer le type de la requête obtenu automatiquement au type annoté manuellement par des utilisateurs.

Notons que la classification par apprentissage supervisé basé sur TimBL ainsi que notre méthode de classification utilisant seulement la morphologie de la requête (QF) exploitent le descripteur morphologique de la requête. L’évaluation de ces deux méthodes de classification ne nécessite que la col-lection des requêtes d’apprentissage et de test. Cependant, l’évaluation de la précision de notre méthode de classification combinant la morphologie de la

requête et le profil de la session nécessite de simuler une séquence des sessions de recherche de différents types de besoins.

Le principe de l’évaluation est basé sur la méthode de la cross-validation qui consiste à subdiviser l’ensemble des requêtes en un sous-ensemble d’ap-prentissage et un sous-ensemble de test. Le protocole d’évaluation est basé sur deux phases : une phase d’apprentissage et une phase de test. Pour chacune des méthodes de classification, nous spécifions ces deux phases comme suit :

– ´Evaluation de la classification de la baseline selon TiMBL : étant donné l’ensemble des requêtes d’apprentissage et l’ensemble de requêtes de test. Le fonctionnement de TiMBL selon ces deux phases est décrit comme suit :

1. La phase d’apprentissage selon cette méthode consiste à sauvegarder des exemples de requêtes dans trois classes représentant les types de besoin informationnel, navigationnel et transactionnel. Chaque exemple d’une requête Q correspond à son descripteur morpholo-gique contenant les caractéristiques de la requête (F(Q)).

2. La phase de test consiste à créer le descripteur morphologique de chaque requête de test et la classifier selon son degré de simila-rité avec les exemples de requêtes d’apprentissage sauvegardés pour chaque type de besoin.

– Évaluation de la classification basée sur la morphologie de la requête (QF) :

1. La phase d’apprentissage consiste à identifier les seuils des taux d’utilisation des termes de la requête dans les titres des pages (τt∗ = 0.1021) et dans les textes d’ancrages des hyperliens des pages (τa∗ = 0.4419). Ces taux sont calculés sur la collection WT10G comme suit : – Pour chaque requête d’apprentissage Q, calculer les taux τt et τa

selon la formule 4.3.1.1(cf. sect.4.3.1.1 p.119),

– Pour chaque valeur τt (resp. τa), calculer la précision de classifi-cation P (τt) (resp. P (τa)) des requêtes d’apprentissage (de type navigationnel et transactionnel) en utilisant seulement la propriété définie par le taux d’utilisation des termes dans les titres des pages (resp. le taux d’utilisation des termes dans les hyperliens des pages) comme suit :

P (τt) = ^{k{Q ∈ N av/τ}^t^{(Q) ≥ τ}^t^{} ∪ {Q ∈ T rans/τ}^t^{(Q) < τ}^t^}k k{Q/Q ∈ N av ∪ T rans}k

P (τa) = ^{k{Q ∈ N av/τ}â^{(Q) ≥ τ}â^{} ∪ {Q ∈ T rans/τ}â^{(Q) < τ}â^}k k{Q/Q ∈ N av ∪ T rans}k

– Identifier les taux optimaux τa∗ et τt∗ comme suit : τa∗ = argmaxτaP (τa), τt∗ = argmaxτtP (τt),

2. La phase de test consiste à construire pour chaque requête de test deux vecteurs, navigationnel FN(Q) et transactionnel FT(Q), et cal-culer les valeurs de probabilités de classification de la requête dans chaque classe/type de besoin selon la morphologie selon la formule

4.1 (cf. sect.4.3.1.2 p.122). Les types attribués aux requêtes par le classifieur seront ensuite comparés aux types des requêtes prédéfinies dans la collection.

– Classification basée sur la combinaison de la morphologie de la requête et du profil de la session (QF+QP) : l’évaluation de cette méthode est basée sur une phase de test qui réutilise les valeurs de probabilités calculées dans la classification basée seulement sur la morphologie de la requête. La phase de test est basée sur les étapes suivantes :

1. Créer une séquence des sessions de recherche des trois types de be-soins, issue de la collection des requêtes de test. Nous avons alterné entre les trois types de requêtes (I, N, T) où chaque session est créée en alignant aléatoirement des requêtes de même type. Pour des buts expérimentaux, nous fixons tout au long de la séquence la longueur moyenne des sessions de type informationnel (wI), naviga-tionnel (wN) et transactionnel (wT) respectivement à 5, 3 et 5. Nous avons pris wN = 3 comme étant la longueur moyenne des sessions de recherche navigationnelles. Selon différentes études [89, 77], analy-sant le fichier log des moteurs de recherche, plus que 79% des sessions sont en effet composées de trois ou moins des requêtes. Puisque les sessions transactionnelles et informationnelles demandent plus d’ef-fort et du temps pour être accomplie [135], nous avons augmenté la longueur moyenne de ces types de sessions par rapport à celle des sessions navigationnelles en wI = wT = 5. La figure 4.2 montre un exemple d’une séquence des sessions de trois types informationnel, navigationnel et transactionnel.

2. Pour chaque requête de test sur la séquence, nous calculons sa proba-bilité de classification pour chaque type de besoin selon le profil de la session et selon la morphologie de la requête (formule 4.4, sect.4.3.3

p.126). Le type de besoin ayant la valeur de probabilité maximale est considéré la classe/type de besoin attribué à la requête.

Dans le document Accès personnalisé à l'information : approche basée sur l'utilisation d'un profil utilisateur sémantique dérivé d'une ontologie de domaines à travers l'historique des sessions de recherche (Page 149-153)