• Aucun résultat trouvé

Modèle de Soutien

Dans le document Recherche d'Information Collaborative (Page 85-90)

2. Présentation de Notre Travail

4.1. Modèle de Soutien

Lorsqu’un utilisateur veut obtenir de l’information pour un objectif de recherche donné, il va effectuer ce que nous appelons une session de recherche. En effet il est très rare que l’on obtient l’information recherchée en une seule étape c’est-à-dire en posant une seule requête. En général, l’on formule plusieurs requêtes afin d’essayer de trouver l’information que l’on estimera satisfaire notre objectif de recherche.

Nous pouvons donner les définitions suivantes :

• Définition d’une session individuelle de recherche : une session de recherche d’information est relative à un objectif de recherche donné effectuée avec un système donné. Elle est constituée d’un ensemble d’étapes.

• Définition d’une étape de recherche : une étape de recherche correspond à l’ensemble des documents évalués par l’utilisateur et retrouvés par le système en réponse à une requête donnée.

L’hypothèse restrictive à ces deux définition est que l’utilisateur au cours d’une session n’utilise qu’un seul moteur de recherche. S’il change de moteur de recherche, nous définissons une autre session de recherche.

Afin de pouvoir apporter un soutien personnalisé nous avons prévu des mesures permettant d’évaluer chaque session individuelle et chaque étape pour guider le processus de soutien, lors d’une session de recherche collaborative.

• Définition d’une session de recherche collaborative : une session de recherche collaborative est composée de l’ensemble des sessions individuelles des utilisateurs. L’hypothèse faite est qu’un groupe d’utilisateurs collabore pour trouver de l’information sur un sujet de recherche donné pouvant se décliner selon plusieurs objectifs.

Nous présentons la modélisation pour représenter et stocker les différents éléments dans la mémoire collaborative, ainsi que l’organisation de cette mémoire. Tout d’abord, nous présentons les principaux modèles de recherche collaborative : le modèle de session individuelle (paragraphe 4.1.1), et celui d’étape de recherche (paragraphe 4.1.2). Le modèle de session collaborative englobe naturellement les différentes sessions individuelles et il sera présenté ultérieurement (paragraphe 4.5.3.3).

4.1.1. Session Individuelle

Nous définissons une session individuelle (voir la Figure 4.2) de recherche d’information

Session-RII de l’utilisateur u, de façon ensembliste, où l’écriture (..)* désigne un groupe

multivalué d’élément ainsi :

Session-RII (ID-utilisateur, Rôle-utilisateur, Objectif, InfoGénérale-RII, NbEtape, Durée-RII, Eval-RII, Etape-R *)  

Statique Dynamique

Il existe de nombreuses formalisations et notations tel que OMT (Object Modeling Technique) [Rumbaugh 1995]. Les différents modèles que nous proposons peuvent être décrits à l’aide de concepts empruntés au UML (Unified Modeling Language) [Muller 2000].

Figure 4.2. Modèle d’une session individuelle. S ession-RII InfoGénérale-RII : string Rôle-utilisateur : string ID-utilisateur : string NbEtap e : integer Durée-RII : real Objectif * Etape-R N°-Etap e : integer qk : string Eval-RII ClassA Class1 * * Class2

Classe A : une composition des Classe1 et Classe2

ClassD ClassE

ClassD et ClassE sont associés (multiplication par défaut est 1).

Le contenu de la session individuelle comporte deux types d’informations : des éléments statiques sur la session (paragraphe 4.1.1.1) et des éléments dynamiques et relatifs au déroulement de la session (paragraphe 4.1.1.2).

Cette distinction est nécessaire à cause des notions de base d’un environnement ou d’une aide synchrone, personnalisé et adaptatif. Le fait de préciser quels sont les éléments dynamiques conduit à détecter les changements de ces éléments chaque fois ils sont utilisés, cette détection permet de tenir compte de ces changements et par conséquence elle permet l’évolution de la personnalisation et de l’adaptation aux données les plus récentes dont le système dispose. Par contre les éléments statiques sont stockés au début de la session et ils seront référencés et consultés lorsque le système en a besoin.

4.1.1.1. Eléments Statiques

Les éléments statiques d’une session collaborative sont fixés au début de la session et ne changent pas jusqu’à sa fin. Il y a deux catégories d’éléments :

• ID-utilisateur qui identifie l’utilisateur qui effectue la session par son nom, son prénom et son adresse e-mail.

• Rôle-utilisateur qui définit le rôle de l’utilisateur dans la recherche collaborative ; ce rôle ne dépend pas directement de l’utilisateur mais il s’agit un paramètre de la recherche collaborative. Cet attribut ne fait pas partie des attributs de l’utilisateur, mais appartient au modèle de session individuelle. Par exemple, un utilisateur peut avoir le rôle de créateur de session pour une session collaborative Session-RICx, et le même utilisateur peut avoir le rôle d’un simple membre de groupe chargé d’un objectif précis de recherche dans une autre session collaborative Session-RICy. Le rôle peut être : soit membre soit

administrateur.

• Objectif qui est l’objectif individuel de la recherche effectuée durant la session individuelle représenté par une chaîne de caractères qui décrit l’objectif.

• InfoGénérale-RII qui est défini par le triplet suivant :

InfoGénérale-RII (DateHeureDébut-RII, Info-Outil, Info-Collections). Où :

- DateHeureDébut-RII concerne le temps (date, et heure de début de la session).

- Info-Outil est une description générale de l’outil de recherche que l’utilisateur a choisi pour sa session. Ce peut être un outil commercial par exemple un moteur de recherche sur le Web ou un outil spécialisé, comme un moteur interne. Nous supposons que les utilisateurs ne travaillent pas forcément tous avec le même moteur de recherche. Ainsi chacun peut choisir son moteur. La description de l’outil est composée de son nom, de la façon d’y accéder par exemple le nom de moteur de recherche est « google » et son adresse est http://www.google.fr/.

- Info-Collections est une description générale de la collection de recherche (ou corpus) que l’utilisateur a choisi pour sa session. Nous supposons aussi que l’utilisateur peut

sélectionner la ou les collection(s) sur laquelle (ou lesquelles) il effectue sa recherche1.

4.1.1.2. Eléments Dynamiques

Les éléments dynamiques sont des éléments temporaires et relatifs qui changent progressivement au fur et à mesure du déroulement de la session individuelle. Ces éléments sont :

• NbEtape qui est le nombre des étapes de recherche que l’utilisateur a effectuées à un moment donné au cours de sa session.

• Durée-RII qui est la durée de la session depuis son début jusqu’à un moment donné ou à la fin explicite de la session individuelle.

• Eval-RII qui représente l’estimation du succès de la session individuelle, la procédure de calcul de cette estimation fait l’objet du paragraphe 4.3.2.2.2.

• Etape-R * : une session individuelle est une itération de NE étapes de recherche (NE ≥ 1).

4.1.2. Étape de Recherche

Une étape de recherche (voir la Figure 4.3), va de la formulation d’une requête jusqu’à sa reformulation ou la fin de la session individuelle, s’il s’agit de la dernière étape. Les éléments d’une étape sont tous non-statiques, une fois l’étape finie, elle sera évaluée à l’aide des mesures que nous proposons dans le paragraphe 4.3.2.2.1.

Etape-R N°-Etap e : integer qk : string Eval-Etape Doc ID-Doc : string Titre-Doc : string Descr-Doc : string TDoc : string DocJuge

Figure 4.3. Modèle d’une étape de recherche.

1 Généralement le choix d’outil de recherche implique le choix de(s) collection(s) de recherche.

ClassA

Class1

* *

Class2

Classe A : une composition des Classe1 et Classe2

ClassD ClassE

ClassD et ClassE sont associés (multiplication par défaut est 1).

Une étape de recherche Etape-R d’un utilisateur donné u est définie par le quadruplet suivant :

Etape-R (q  k, N°-Etape, (Doc, JugeDoc)*, Eval-Etapek)

Dynamique

où :

• qk est la requête formulée par l’utilisateur. Le modèle de la requête varie selon le modèle de recherche d’information utilisé :

- Pour le modèle vectoriel et le modèle probabiliste, la requête est un ensemble de mots clés éventuellement extraits d’une requête en langue naturelle.

- Pour le modèle booléen, la requête est une expression booléenne construite avec des mots clé et les opérateurs (OU, ET, NON).

- Pour un outil de recherche commercial, la requête est l’ensemble des mots clés combinés éventuellement par différents opérateurs qui varient selon l’outil commercial.

• N°-Etape est le numéro de l’étape (1, 2, …, NE).

• (Doc, JugeDoc)* est l’ensemble des doublets constitués des documents Doc sélectionnés par l’utilisateur parmi les documents retrouvés et de JugeDoc le jugement de qualité qui leur est associé.

Un document possède les attributs suivants :

Doc (ID-Doc, Titre-Doc, Descr-Doc, TDoc)

où :

- ID-Doc est l’identificateur du document. - Titre-Doc est le titre du document.

- Descr-Doc est une description concernent le document comme le(s) Auteur(s), la méthode d’accès (son URL), sa date, son format, etc …

- TDoc l’ensemble des termes apparus dans le document si l’on dispose du résultat de l’indexation, ou dans les autres cas on ne prend que l’ensemble des termes apparus dans le titre Titre-Doc.

• Eval-Etapek évalue la qualité de l’étape en termes de résultats pertinents pour la requête q selon les mesures que nous proposons au paragraphe 4.3.2.2.1.

Le déroulement de la session individuelle peut se schématiser ainsi :

q1 Etape-R→ 1 (Doc, JugeDoc)*, q2 …, qk Etape-R→ k (Doc, JugeDoc)*, …, qNE

On notera qu’à une étape i, est attachée une expression de la requête qi en début d’étape servant à rechercher des documents qui seront proposés au jugement de l’utilisateur.

Dans le document Recherche d'Information Collaborative (Page 85-90)