Endiguement Incertain avec Retenue

r 2P_probExt(L) 2. si

S;T

L alors

S

2;R

T

2P_probExt(L) avec L et S

L les langages precedemment denis.

Comme pour le cas de l'ajout des regles par defaut,

S

2;R

T

signie que la situation

S

est a-propos de la situation

T

avec un degre de plausibilite

. Ce dernier est determine par la connaissance incertaine utilisee.

Les trois regles suivantes remplacent ainsi les regles d'Endiguement Elementaire, d'Endiguement Faible et d'Endiguement avec Retenue du systeme de derivation de pertinenceS

Incertitude Elementaire

!^l r fg2;Rf g

Cette regle est une extension de l'Endiguement Elementaire a la prise en compte des connais-sances incertaines. Dans le cas ou la connaissance est valide, la plausibilite de la derivation est egale a 1.

La regle suivante est une extension de la regle d'Endiguement Faible aux cas ou les proprietes des relations ne sont pas forcement valides dans le domaine de l'application:

Endiguement Faible Incertain

!^l ;f r S2;RT[fg S2;RT[f g Dans ce cas,

!^l ;f

r exprime le fait que le relon est obtenu de

par une regle d'endiguement faible incertaine.

Enn, certaines compositions de relations sont plausibles, mais favorisent parfois l'obtention de plusieurs documents pouvant interesser l'utilisateur:

!^l ; r S2;RT[fg S2;RT[f g[fg 12:::n l! ; r ' S2;RT[f1;2;:::;ng S2;RT[f1;2;:::;ng[f'g Ici,

!^l ;

r stipule que le relon est ajoute a la situation

S

contenant le relon

quand il peut ^etre deduit de ce dernier avec une plausibilite

. Il s'agit d'etendre la regle d'Endiguement avec Retenuedenie pour les connaissances certaines.

3.5.2 Utilisation des Labels de Regles

Les labels peuvent s'averer utiles pour expliquer le processus de recherche ou pour prendre en compte les preferences des utilisateurs lors d'une session d'interrogation. Gr^ace aux labels, il est possible de pouvoir identier, pour un document donne, les regles que le systeme a applique pour etablir sa decision de pertinence. Nous rappelons en eet, qu'a chaque fois que le systeme de derivation de pertinence utilise une connaissance incertaine, il garde une trace de son label et tient compte de sa plausibilite pour le calcul du degre de pertinence (voir page 119). Le chemin de transformation PathMax incluant le plus de certitude possible etant choisi pour le calcul du degre de pertinence, nous aurons a la n une liste des labels correspondant aux regles que le systeme a applique lors de l'elaboration de ce chemin. Appelons, tracedi, la liste des labels correspondant au chemin PathMax d'un document

d

i. Pour chaque document juge pertinent par le systeme, il est ainsi possible de cerner les connaissances que ce dernier a utilise pour justier sa decision de pertinence.

Cette caracteristique de notre modele a expliquer ses decisions de pertinence rappelle les avan-tages des systemes experts [Bla86]. Generalement, ces systemes ne se contentent pas uniquement de fournir un diagnostic, mais ils sont souvent capables de le justier. Dans le domaine de la lo-gique, l'utilisation des labels (ou etiquettes) a ete largement discutee par Gabbay [Gab94]. Nous partageons ainsi avec d'autres [Con94], le fait qu'un systeme de recherche d'informations devrait fournir un minimum d'explications a l'utilisateur, surtout pour ce qui est des decisions de perti-nence plausibles. L'utilisateur pourra ainsi detecter les connaissances incertaines qui lui paraissent inadequates. Par consequent, il pourra ensuite demander explicitement au systeme d'ignorer ces connaissances lors de l'evaluation de ses prochaines requ^etes.

Par ailleurs, une forme de justication dans un systeme de recherche d'informations est egale-ment utile pour ses concepteurs. Ainsi, par rapport aux resultats prevus sur une collection test, il est possible de tirer des conclusions, quant aux problemes que poseraient certaines connaissances incertaines. Comme dans les systemes experts, les developpeurs pourraient se servir des traces d'execution du systeme pour attribuer des degres de conance aux diverses connaissances utilisees. Nous pouvons egalement imaginer une autre forme d'utilisation des labels en recherche d'in-formations. Prenons par exemple, le cas de la gure 3.8 suivante. Les degres de pertinence des documents

d

2 et

d

3 sont calcules par rapport a leur chemin de transformation PathMax. Consi-derons les traces tracedi associees a ces chemins. Il s'agit des traces suivantes:

Document trace

d_i

d

1 [

l

;l

d

2 [

l

;l

d

3 [

l

;l

Supposons que pour une requ^ete utilisateur donnee, ces trois documents sont juges pertinents par le systeme. Il sont par consequent aches a l'utilisateur selon leur ordre de pertinence. De plus, imaginons que l'interface du systeme est munie d'un procede de bouclage de pertinence (relevance feedback) [Jr.71], ou le systeme reformule la requ^ete en fonction du \feedback" fourni par l'utilisateur sur les documents retrouves. Il existe plusieurs \feedback" possibles. La forme la plus classique etant de demander a l'utilisateur de designer les documents pertinents et non pertinents de la reponse

Situation finale à certitude maximale (d1) Elar g i (d2) Elar g i (d3) Elar g i l1 l4 l3 l6 l6 l9 l2 l7 l2 l10

Figure 3.8.

Exemple de transformation d'index

(jugements de pertinence binaires). Le systeme demande ainsi a l'utilisateur de choisir parmi les documents aches ceux qu'il juge reellement interessants pour son besoin en informations.

Dans notre cas, nous supposons que le seul document juge pertinent par l'utilisateur est

d

1. Dans ce cas, nous devons analyser pour quelles raisons l'utilisateur semble rejeter deux documents, juges pourtant comme pertinents par le systeme. Les labels peuvent alors ^etre utilises pour donner une explication possible a ce cas de gure.

Ainsi, pour les deux documents rejetes par l'utilisateur, nous remarquons l'utilisation de la connaissance portant le label

l

2. Cette derniere n'appara^t pas dans la trace associee au document

d

1. Nous pouvons ainsi deduire qu'il est fort probable que l'utilisateur dans son contexte de recherche ne semble pas apprecier l'utilisation de cette connaissance. Le systeme peut alors utiliser ce constat lors de la reformulation de la requ^ete, en excluant la connaissance portant le label

l

2 de sa base de connaissances, durant tout le reste de la session de recherche. Cette approche pourra avoir deux consequences possibles sur la suite des evenements:

(1):

Le retrait de la connaissance portant le label

l

2 ne permettra plus au systeme de retrouver les deux documents en question (

d

2 et

d

3). Dans ce cas, les deux documents ne seront plus aches a l'utilisateur.

(2):

Le chemin PathMax n'etant qu'une possibilite parmi autres engendrant une situation perti-nente a la requ^ete, il se peut que le retrait de la connaissance ayant le label

l

2 n'aura pour consequence que la mise en relief d'un autre chemin a certitude plus petite. En d'autres termes, il peut exister un autre chemin de transformation pour les documents en question, n'utilisant pas la connaissance ayant le label

l

2 et aboutissant, quand m^eme, a une decision de pertinence positive.

Dans les deux cas, l'approche est beneque. Si pour le premier cas, son inter^et est evident, le cas (2) merite une explication plus poussee. Ainsi, supposons que, m^eme apres le retrait de la connaissance ayant le label

l

2, les documents

d

2 et

d

3 sont juges comme plausiblement pertinents par le systeme, a travers l'utilisation d'autres chemins de transformation. Le degre de pertinence de ces deux documents sera necessairement moindre par rapport a leur degre de pertinence avant le retrait de la connaissance

l

2 en question. En eet, PathMax est par denition le chemin ou les transformations du document associe sont les plus plausibles. Les documents

d

2 et

d

3 auront ainsi des degres de pertinence plus petits si d'autres chemins sont utilises. Apres la reformulation de la requ^ete, les documents

d

2 et

d

3 auront un degre de pertinence plus faible. Ils seront ainsi repousses plus bas dans l'ordre des documents pertinents, ou simplement ils peuvent ^etre supprimes si leur degre de pertinence ne depasse pas un seuil predeni par le systeme29. Dans ce cas, le systeme achera en premier lieu les documents susceptibles de mieux interesser l'utilisateur.

Le processus est ensuite repete, l'utilisateur designera toujours les documents

d

2 et

d

3 comme indesirables mais, cette fois-ci, d'autres documents peuvent s'acher a l'utilisateur, car la suppres-sion de la connaissance

l

2 pourrait les promouvoir a un degre de plausibilite superieur au seuil. Il est ainsi probable que l'utilisation de la connaissance

l

2 et de son degre de plausibilite font qu'en premier lieu, ces documents ne soient pas aches. Gr^ace a un autre retour de l'utilisateur, le sys-teme pourra detecter d'autres connaissances indesirables par l'utilisateur et les supprimer ensuite de la session de travail30.

Le lecteur se demandera certainement pourquoi nous continuons a acher des documents, juges pourtant indesirables par l'utilisateur. Nous voulons par ce fait, detecter toutes les connaissances jugees inadequates par l'utilisateur. Ainsi, si un document continue a s'acher alors que la connais-sance

l

2 est supprimee, c'est qu'il existe potentiellement une autre connaissance impertinente qui fait en sorte que le document soit toujours ache a l'ecran. En eet, la connaissance portant le label

l

2 peut faire partie de tout un ensemble de connaissances qui soient en contradiction avec les preferences d'un utilisateur. Par le procede que nous avons decrit au paragraphe precedent, cet ensemble a toutes les chances d'^etre detecte, en analysant les resultats derives par le systeme apres la suppression de la connaissance

l

2 et en demandant encore une fois son avis a l'utilisateur.

Plus formellement, la detection des connaissances non conformes aux preferences de l'utilisateur peut ^etre realisee de la maniere suivante:

Denition 3.5.6 (Elimination de Connaissances)

Supposons que nous avons

n

(resp.

m

) re-ponses jugees pertinentes (resp. non pertinentes) par l'utilisateur. Les labels LabRet des connais-sances a retirer de la base sont determines comme suit:

LabRet = \

i2mtracedi, [

j2ntracedj

Pour tous les

m

documents juges non pertinents par l'utilisateur, le systeme tente de retrouver les labels communs aux chemins de transformation PathMax qui leurs sont associes (c'est une intersection de listes de labels). Les connaissances relatives a ces labels sont considerees comme potentiellement non conformes aux preferences de l'utilisateur. Elles sont en eet utilisees dans tous

29:Dans la pratique, un seuil est generalement xe. Si le degre de pertinence du document est au-dessous de de ce seuil, le document correspondant n'est pas juge pertinent.

30:Une session de travail pourra comporter plusieurs requ^etes de la part du m^eme utilisateur. Il s'agit de la periode couvrant tout ce que fait l'utilisateur depuis l'instant ou il se connecte au systeme jusqu'a l'instant ou il le quitte.

les chemins de transformation des documents rejetes par ce dernier. Les connaissances reellement eliminees sont celles qui n'ont jamais ete utilisees dans les chemins de transformation des documents juges utiles par l'utilisateur (c'est une union de labels). En eet, si une connaissance a ete utilisee pour deduire un \bon" document selon l'utilisateur, et qu'elle appara^t en m^eme temps dans la liste des connaissances potentiellement non conformes a ce dernier, alors il n'y a pas de raisons particulieres pour la considerer comme etant a l'origine des mauvaises reponses obtenues.

Dans notre exemple, le label

l

2 fait partie des traces des documents rejetes par l'utilisateur (

d

1 et

d

2). Comme

l

2 ne fait pas partie de la trace de

d

1, la connaissance qui lui est associee est exclue de la base selon la denition ci-dessus introduite. Il est a remarquer toutefois, que notre contrainte de faire supprimer une connaissance de la base, uniquement dans le cas ou le label de celle-ci n'appara^t dans aucune trace des

n

documents pertinents, est assez forte. Nous pouvons alleger la contrainte de la facon suivante:

LabRet = \

i2mtraced_i, \

j2ntraced_j

Avec cette formule, une connaissance douteuse avec un label

l

sera supprimee de la base, sauf si

l

fait partie de tous les chemins de transformations des documents declares pertinents par l'utilisateur. Ainsi, m^eme si la connaissance a ete utilisee pour deriver certains \bons" documents, elle sera retiree de la base. Il est dicile de savoir quelle approche est la plus adequate pour le retrait des connaissances douteuses. Il revient en eet a l'experimentation de determiner laquelle des deux formules ci-dessus introduites est plus a m^eme a tenir compte des preferences de l'utilisateur. Dans cette section, nous avons juste mis l'accent sur l'utilitedes labels a favoriser une recherche interactive avec l'utilisateur.

3.5.3 Un Systeme Multifacette

Tout au long de ce chapitre, nous avons considere que l'index

(

d

) d'un document correspond a une situation unique formee d'un ensemble de relons. L'application des regles d'inference strictes ou plausibles permet de faire passer cette situation vers d'autres situations abstraites possibles pouvant correspondre a la representation de la requ^ete. Cette vue fut originellement adoptee par Nie [Nie90], puis suivie par d'autres comme Sembok & van Rijsbergen dans [SvR93], ou par Amati & Kerpedjiev dans [AK92]. Cependant, nous pensons que cette approche est inadaptee pour des documents complexes comme les images ou la video. Par exemple, la description d'une image par un ensemble de relons, implique souvent une perte d'informations, car il s'agit de remplacer une image riche en informations (couleurs, textures, etc.) par des descripteurs semantiquement incomplets, adressant le plus souvent un aspect particulier de l'image, a savoir son contenu semantique. Il existe en eet plusieurs autres interpretations possibles d'une image, rendant tres subjective sa description. Cela depend principalement de la perception d'un sujet dans un contexte d'application donne, ses connaissances generales et ses besoins particuliers de recherche. Les interpretations possibles sont nombreuses et chaque sujet peut donner une description de l'image dierente des autres. Une personne peut s'interesser par exemple a la forme des objets dans l'image, une autre appreciera les couleurs et leurs agencement, enn une autre pourrait trouver un contenu emotionnel dans l'image consideree. Il existe ainsi plusieurs points de vue a partir desquels un utilisateur peut estimer la valeur de pertinence fournie par le systeme. Ces points de vue sont relies au document lui-m^eme et correspondent a des dierentes vues de ce dernier. Dans ce qui suit nous les designerons par le terme facette [OC96b].

Dans le document Un modèle d'indexation relationnel pour les graphes conceptuels fondé sur une interprétation logique (Page 144-149)

Endiguement Incertain avec Retenue

S;T

S

T

S

T

S

T

Incertitude Elementaire

Endiguement Faible Incertain