• Aucun résultat trouvé

Fusion de Requêtes

Dans le document Recherche d'Information Collaborative (Page 138-141)

2. Présentation de Notre Travail

5.4. Réalisation des Différents Types de Soutien

5.4.2. Fusion de Requêtes

A partir de l’ensemble QELtc de requêtes sélectionnées, nous construisons une seule requête en appliquant une opération de fusion sur les requêtes de QELtc. Dans cette étude, Nous voulons que la fusion soit la plus exhaustive possible. Afin d’établir cette fusion selon la structure de la requête nous envisagions la fusion de requêtes vectorielles (paragraphe 5.4.2.1) la fusion de requêtes booléennes (paragraphe 5.4.2.2) et la fusion mixte des requêtes vectorielles et booléennes (paragraphe 5.4.2.3). Une discussion sur l’intérêt de la fusion des requêtes est présentée dans le paragraphe 5.4.2.4.

5.4.2.1. Fusion des Requêtes Vectorielles

Nous définissons l’opération de fusion comme la somme de tous les vecteurs des requêtes extraites dans QELtc :

qfusion =

QEL1 tcqi∈QELtcqi [5.3]

où ∑ représente la somme des vecteurs. Ainsi la requête qfusion contient tous les termes Tqj qui apparaissent dans chacune des requêtes qj∈ QELtc.

5.4.2.2. Fusion des Requêtes Booléennes

La fusion des requêtes booléennes est plus difficile parce qu’il faut tenir compte de leurs structures logiques. Supposons que les termes qui apparaissent dans toutes les requête qu

appartiennent à l’ensemble (∪qj∈QELtc Tqj), cet ensemble de disjonction contient deux sous-ensembles de termes :

• le premier (∪qj∈QELtc Tqj)ACCORD : est un sous-ensemble de termes à propos duquel les requêtes sont en accord. A son tour ce sous ensemble est devisé en deux sous-ensembles :

- (∪qj∈QELtc Tqj)ACCORD-ET/OU : un sous-ensemble des termes désirés (liés par ET/OU) dans le résultat de toutes les requêtes. Les termes td de ce sous-ensemble sont inclus et liés par OU dans la requête fusionnée.

- (∪qj∈QELtc Tqj)ACCORD-NON : un sous-ensemble des termes non désirés (qui sont lié par NON dans les requêtes) dans le résultat de toutes les requêtes. Les termes tnd de ce sous-ensemble sont inclus et liés par NON dans la requête fusionnée.

• le deuxième (∪qj∈QELtc Tqj)DESACCORD : est un sous-ensemble de termes désirés (liés par ET/OU) dans certaine(s) requête(s) et non désirés (liés par NON) dans d’autre(s), c’est-à-dire les requêtes sont en conflit ou en désaccord à propos de ce sous-ensemble :

(∪qj∈QELtcTqj)DESACCORD = [∪qj∈QELtc (Tqj)ET/OU] ∩ [∪qj∈QELtc (Tqj)NON]

Où [∪qj∈QELtc (Tqj)ET/OU] contient les termes liés par ET/OU par n’importe quelle requête de l’ensemble QELtc. [∪qj∈QELtc (Tqj)NON] contient tous les termes liés par NON par n’importe quelle requête de l’ensemble QELtc.

Les termes de ce sous-ensemble (∪qj∈QELtc Tqj)DESACCORDsont omis dans la requête fusionnée.

Alors, la requête fusionnée qfusion et son ensemble de termes Tqfusion seront :

qfusion = (NON tnd1 NON tnd2 NON …) OU (td1 OU td2 OU …) [5.4]

où : tnd∈(∪qj∈QELtcTqj)ACCORD-NON, td∈ (∪qj∈QELtcTqj)ACCORD-ET/OU

Tqfusion = (∪qj∈QELtcTqj)ACCORD

5.4.2.3. Fusion des Requêtes Vectorielles et Booléennes

Dans le cas des requêtes vectorielles booléennes à fusionner, nous pouvons procéder de manière semblable au paragraphe 5.2.3.1.3 en transformant les requêtes afin d’obtenir des représentations homogènes de toutes les requêtes que ce soient vectorielles ou booléennes, puis nous pouvons appliquer la formule [5.3] ou [5.4] correspondant à la représentation uniforme des requêtes à fusionner.

5.4.2.4. Discussion

Nous avons choisi l’opération de fusion des requêtes comme un soutien collaboratif pour les raisons suivantes :

• La fusion des requêtes améliore la performance de recherche : l’étude présentée dans [Belkin 1993] (voir paragraphe 3.1) prouve que les combinaisons de différentes expressions du même besoin d’information ont, en général un effet positif sur la

performance de recherche4. Nous pensons que la fusion des requêtes de plusieurs utilisateurs peut être considérée comme une fusion de différentes expressions du même besoin d’information. Les données supplémentaires dont nous disposons (l’évaluation de la requête, la préférence, et la similarité …etc) sont utilisées comme des poids « optimaux » pour fusionner les différentes requêtes, et permettent de repérer les requêtes susceptibles d’optimiser la fusion, (par exemple les requêtes ayant obtenu le meilleur résultat, ou les requêtes d’un utilisateur compétent).

• La fusion des requêtes tire profit de la variété des termes utilisés par les utilisateurs : les auteurs dans [Xu 2000] insistent sur le problème de la « non-correspondance » de termes (word mismatch) comme un problème fondamental en recherche d’information, tel qu’il a été observé par [Furnas 1987] où dans moins de 20% des cas, deux personnes utilisent le même terme pour décrire un même but.

Une autre étude de [Vakkari 2001] démontre que l’exécution de la tâche de recherche est liée systématiquement aux tactiques de recherche et aux choix des termes utilisés pendant cette exécution, l’auteur pense que l’utilisateur a besoin d’aide5. Les résultats de son expérimentation suggèrent qu’une interface qui recommande aux utilisateurs d’introduire dans les requêtes des termes parallèles, reliés, synonymes, et spécifiques, peut les aider à trouver plus de références pertinentes.

En se basant sur ces études, nous pensons que la fusion des requêtes introduit des termes utilisés par les différents utilisateurs (termes synonymes, variété morphologique, …).

• La fusion élargie la requête en utilisant les connaissances des utilisateurs : en fait la fusion peut être vue comme une sorte d’expansion de la requête. L’expansion de requête est une approche qui a déjà été étudiée via l’utilisation d’un thesaurus où l’on élargit une requête à partir de la connaissance contenue dans un thesaurus. [Bruandet 2003] s’est intéressé à l’utilisation et la construction de bases de connaissances pour la recherche d’information :

« Les techniques d’expansion automatique de requêtes ont pour objectif de décharger l’utilisateur de l’effort cognitif qu’il doit fournir, que ce soit pour le choix des documents pertinents nécessaires pour le bouclage de pertinence ou le choix des termes de sa requête dans un thésaurus manuel en ligne. Les techniques d’expansion se veulent entièrement automatiques. Le problème est alors le choix des termes à ajouter à la requête. Les méthodes diffèrent selon le choix de ces termes, de la méthode de construction des thésaurus et/ou de leur provenance. »

Dans notre cas, au lieu d’utiliser un thesaurus, la fusion des requêtes a à sa disposition la mémoire collaborative et nous pouvons élargir une requête à partir des différentes connaissances des utilisateurs exprimées au travers de leurs requêtes. Ainsi, une telle expansion utilise les connaissances des spécialistes du domaine éventuellement non encore répertoriées dans un thesaurus.

4« Results show that progressive combination of query formulations leads to progressively improving retrieval performance. »

Dans le document Recherche d'Information Collaborative (Page 138-141)