• Aucun résultat trouvé

Méta-Moteur

Dans le document Recherche d'Information Collaborative (Page 80-85)

2. Présentation de Notre Travail

3.5. Méta-Moteur

Les méta-moteurs sont des techniques de présentation des résultats issus de plusieurs outils.

On peut les considérer comme des applications commerciales des techniques de fusion. Ils sont une des méthodes de recherche d’information commercialisées et opèrent en interrogeant pour chaque requête qui leur est soumise différents outils de recherche, afin de lui fournir la réponse la plus exhaustive. Pour leur fonctionnement, certains indexent l’information contenue dans différents annuaires et moteurs, d’autres les interrogent simultanément de façon dynamique. Le problème n’est pas simple car chaque outil de recherche a ses particularités. S’ils sont capables de repérer l’outil disponible le plus « fourni » sur un sujet et ils permettent une recherche rapide. Ils génèrent, en revanche, trop de bruit (réponses non-pertinentes), et ils ne profitent pas des particularités fournies par chaque outil.

Nous proposons à partir des travaux de Lardy [Lardy 2002] et Largouet [Largouet 2000] une synthèse des points importants relatifs aux moteurs (un tableau comparatif des méta-moteurs est proposé dans l’annexe A, le tableau.1).

• Choix des outils : certains méta-moteurs permettent de choisir les outils à interroger. Ainsi, DigiSearch7 offre le choix d’outils pour rechercher sur le web, les groupes de news et des adresses de messagerie.

• Requête : le fait d’interroger des outils de recherche différents implique que le choix des mots clés et leur combinaison avec des opérateurs soient adaptés en fonction du type d’outil utilisé. Donc, la requête doit en principe être simple. Les méta-moteurs ne permettent pas tous de formuler des requêtes complexes (utilisant différents opérateurs et des expressions parenthésées). Cependant certains outils adaptent la requête à la syntaxe de chaque outil et tentent en partie de remédier à la diversité des possibilités d’interrogation des différents outils mais leur travail n’est pas parfait. Par exemple, DogPile8 formule la requête pour chaque moteur interrogé et présente ensuite la façon dont la requête a été formulée à chaque moteur. On peut utiliser les opérateurs booléens et de proximité AND, OR, NEAR et NOT pour combiner des mots et des phrases. NEAR est remplacé par AND pour les outils ne le gérant pas. DogPile supprime l’opérateur NOT et les mots suivants pour les outils ne le gérant pas. L’opérateur AND est implicite. On peut utiliser les parenthèses et les guillemets et les opérateurs unaires comme « – » et « + ». Le résultat est classé uniquement par outil de recherche, sans traitement de doublons.

• Résultats : le traitement des résultats est très variable. Certains méta-moteurs limitent le nombre de réponses obtenues de chacun des différents outils interrogés (les 10 à 20

7 Site Web : http://www.digiway.com/digisearch/.

premières réponses fournies par chacun), ce qui devrait permettre, en principe, d’obtenir les réponses les plus pertinentes. Highway 619 permet de préciser le volume de résultats désirés. D’autres méta-moteurs ne synthétisent pas les résultats. Ainsi All4one10 affiche les résultats des différents outils dans des fenêtres indépendantes. D’autres, encore, font un classement par outils de recherche (DogPile). Enfin, certains méta-moteurs après avoir récupéré les différents résultats, les fusionnent avec élimination des doublons (Ixquick11) ou les classent par pertinence (MetaCrawler12).

• Temps : les temps de réponse des moteurs de recherche utilisés pouvant être très variables, certains méta-moteurs (Ixquick) utilisent une valeur d’expiration ou time out. Pour d’autres, l’utilisateur a un contrôle total sur la durée de la recherche (DogPile, Highway 61).

3.6. Conclusion

Nous avons essayé de donner une vision synthétique de la fusion de données. Après avoir dégagé la problématique qui y était attachée, nous avons décrit des travaux s’attachant à comprendre les raisons qui font que la fusion permet ou non d’améliorer les performances d’une recherche d’information, à trouver des critères de fusion et les conditions qui améliorent sa performance.

Les études dans ce domaine sont encourageantes, même si la fusion implantée ne conduit pas toujours au succès espéré. Toutes ces études s’appuient sur l’idée que la combinaison de multiples sources de pertinence augmente la performance de la recherche quelles que soient ces sources : des formulations de requête, des systèmes de recherches différents, ou différentes collections d’information. Ces études ont conduit à appliquer certains principes de fusion dans la pratique comme l’illustre les méta-moteurs disponibles sur le Web.

L’objectif de notre travail est de faire collaborer un groupe d’utilisateurs effectuant ensemble une session de recherche d’informations. Lors de cette session collaborative chaque utilisateur peut être vu comme une « source de pertinence », et donc une mise en commun des efforts de recherche par la fusion des résultats et/ou des requêtes individuelles doit être envisagée. Ce qui nous conduit à résumer les points intéressants de ce chapitre ainsi :

• Les études qui ont été faites dans le domaine de la fusion n’ont pris à aucun moment en compte l’utilisateur, et ne font donc intervenir aucun critère concernant l’utilisateur. Il en résulte que nous voulons concentrer notre travail autour de l’utilisateur et orienter la fusion dans cette direction.

• Il y a certaine structure des requêtes dans les moteurs de recherche, souvent sous forme des mots liés par des opérateurs booléens, de proximité…etc, ces opérateurs ne sont pas tous toujours gérés par le moteur. Au cas où les utilisateurs dans notre contexte utiliseraient des moteurs de recherche différents, et si nous leurs proposons une requête, on peut procéder de façon similaire à celle de certains méta-moteurs en adaptant la requête au moteur de recherche de chaque utilisateur.

9 Site Web : http://www.highway61.com/.

10 Site Web : http://www.all4one.com/.

11 Site Web : http://www.ixquick.com/.

• Le constat fait par Belkin [Belkin 1993] qu’il y a un effet de la personne qui effectue les requêtes sur la performance, nous pousse à étudier les effets des utilisateurs sur la performance de recherche non seulement en terme des requêtes effectuées mais aussi en terme des résultats obtenus et des différentes évaluations des résultats effectuées par les utilisateurs.

• En particulier, l’amélioration de la performance dans les cas de la fusion de plusieurs formulations de requête ou des résultats de plusieurs requêtes, nous amènent à penser que la performance peut être aussi améliorée en combinant les requêtes des différents utilisateurs, ou en combinant les résultats de ces requêtes.

CHAPITRE.4. Environnement de Soutien pour la

Recherche d’Information Collaborative

Notre objectif est de soutenir un groupe d’utilisateurs dans sa tâche de recherche d’information, ce qui nous a conduit à construire un environnement collaboratif de soutien. Un tel environnement doit aider les utilisateurs dans leurs tâches de recherche d’information et créer une synergie entre les différents acteurs de recherche collaborative de façon à augmenter leur satisfaction individuelle et collective. Leur satisfaction peut être due :

- à une meilleure qualité des résultats obtenus.

- à un gain de temps pour obtenir des résultats satisfaisants. - à une meilleure expression des besoins.

Si l’on reprend le schéma de la Figure 2.1 on doit aider l’utilisateur dans les différentes étapes : la définition de la problématique, l’expression de sa requête et sa formalisation liée au moteur de recherche utilisé.

Nous voulons que l’utilisateur puisse avoir lorsqu’il le désire des informations sur le fonctionnement de la session de recherche du groupe.

Nous avons adopté la démarche illustrée dans la Figure 4.1. Démarche adoptée pour la construction de l’environnement collaboratif de soutien, composée de trois modules. Le premier module présente l’ensemble d’informations stocké dans la mémoire collaborative à la disposition de l’environnement de soutien, ces informations sont les données primaires que l’environnement utilise pour effectuer l’aide. Le deuxième module définit une stratégie de soutien selon, d’une part, la typologie de l’utilisateur et, d’autre part, la typologie de groupe. Ces deux modules font l’objet de ce chapitre. Tandis que le troisième module clarifie la mise à jour et l’obtention du soutien personnalisé, ce dernier module fait l’objet du chapitre suivant.

Dans ce chapitre, nous définissons dans le paragraphe 4.1 les critères qui seront pris en compte ainsi qu’un certain nombre de mesures permettant d’évaluer le fonctionnement du groupe.

Nous donnons dans le paragraphe 4.2, une définition plus précise du soutien, en terme de tâches, de dimensions, et de données nécessaires pour obtenir un environnement de soutien. Nous faisons un paragraphe particulier 4.3 sur la typologie des utilisateurs lors d’une session de recherche, l’estimation de son efficacité et son comportement sont des éléments importants pour adapter le soutien (paragraphe 4.4).

Le paragraphe 4.5 propose un environnement collaboratif de soutien à partir d’une typologie de groupe et définit une stratégie de soutien selon cette typologie.

définition de soutien

instantiation

Stratégie de soutien

mémoire collaborative mise à jour

demande de soutien

soutien personnalisé utilisateur

typologies de : groupe & utilisateur

outil de recherche collection de recherche requête jugement résultat Module.2 Module.3 Module.1

Figure 4.1. Démarche adoptée.

Dans le document Recherche d'Information Collaborative (Page 80-85)