• Aucun résultat trouvé

Comme cela a ete evoque dans le chapitre precedent, une recherche precise et ecace necessite le besoin de representer aussi bien les relations que leur proprietes. Le but de ce chapitre est de presenter un modele relationnel permettant d'inclure les caracteristiques syntaxiques et semantiques des relations dans les decisions des pertinence. Nous proposons de baser ce modele sur un systeme logique utilisant la theorie des situations comme langage de representation.

L'approche presentee dans ce chapitre est conforme a celle speci ee dans le modele logique de recherche d'informations [vR86]. Elle di ere cependant de celle-ci, ou des autres demarches logiques adoptees dans [CC92, Lal96], par le fait que nous ne partons pas d'une description d'un document pour aboutir a la description de la requ^ete via une certaine deduction logique. Nous partons d'un ensemble d'axiomes assertant qu'une information est pertinente a une autre, et etablissons a travers l'utilisation des proprietes des relations un ensemble de pas de deductions permettant de conclure qu'un document est pertinent a la requ^ete. Comme nous l'avons conclu dans le chapitre precedent, notre approche est similaire a celle adoptee dans [Hui96], a ceci pres que nous argumentons le fait que les decisions de pertinence (les pas de deductions) correspondent necessairement a des proprietes de relations. Par proprietes de relations, nous incluons leurs proprietes mathematiques, leurs liens semantiques avec d'autres relations (relations de specialisation/generalisation, preclusion, etc.), leurs compositions possibles avec d'autres relations et les raisonnements sur leurs arguments (raisonnements sur les concepts et les individus).

D'un point de vue logique, notre demarche s'appuie sur les travaux de Kraus, Lehman & Ma-gidor [KLM90]. Ces derniers presentent un cadre general dans lequel les systemes logiques non-monotones peuvent ^etre etudies et leurs caracteristiques speci ees. L'etude repose sur la de nition des proprietes que devrait supporter un systeme logique non-monotone. La theorie qu'ils deve-loppent est consideree actuellement comme un standard pour la caracterisation des relations d'in-ference non-monotones. Dans notre cas, on s'interesse a un standard caracterisant la relation de pertinence logique, ou les deductions s'appuient sur les proprietes des relations des index.

Nous presentons d'abord les grandes lignes du modele relationnel que nous proposons, et etablis-sons un certain nombre d'hypotheses utiles pour toute approche logique en recherche d'informations. Nous expliquons ensuite les raisons pour lesquelles la theorie des situations a ete choisie comme langage de representation. En conformite avec cette derniere, nous donnons une terminologie propre a notre approche. Nous formulons ensuite des postulats decrivant les proprietes des relations telles qu'elles sont utilisees en recherche d'informations. Notre demarche s'appuiera sur les exemples des

applications presentees dans le chapitre precedent. Nous introduisons alors un modele logique per-mettant de re eter chacun de ces postulats par une decision de pertinence. Nous concluons en n par des extensions possibles au modele propose permettant d'abord de l'enrichir par des raisonnements incertains sur les proprietes des relations puis par un raisonnement multifacette. Dans ce dernier cas, les documents peuvent ^etre indexes selon di erents points de vue.

3.1 Presentation de l'Idee du Modele

3.1.1 Hypotheses et Generalites

L'un des fondements d'un modele logique pour la recherche d'informations est de considerer que l'ensemble des documents

d

et des requ^etes

q

sont respectivement decrits par des formules logiques



(

d

) et



(

q

)1. Dans ce cas, la correspondance est basee sur une notion d'inference logique (



(

d

) !



(

q

)). L'idee de depart revient a Cooper [Coo71], qui fut le premier a la formaliser, en introduisant la notion de pertinence logique. Cooper distingue deux aspects de la pertinence:

L'utilite,

notion purement pragmatique, associee au fait de savoir si les documents retrouves par le systeme sont utiles pour l'utilisateur.

La pertinence logique,

notion decrivant si un document retrouve admet un theme en rapport avec la requ^ete formulee par l'utilisateur.

La di erence entre ces deux aspects est facile a saisir. En e et, un document logiquement pertinent pour un besoin en informations donne, peut ^etre juge inutile par l'utilisateur, vraisembla-blement parce qu'il n'a pas con ance dans l'exactitude de l'information que contient ce document (eg. document trop ancien, auteur inconnu, etc.). Cette these adressera uniquement le concept de la pertinence logique telle qu'elle a ete de nie par Cooper2:

A stored sentence is logically relevant to a representation of an information need if and only if it is a member of some minimal premise set of stored sentences for some component statement of that need.

Cette de nition fait ainsi allusion a la consequence logique. Si la requ^ete est une consequence logique du document, alors ce document est juge pertinent pour la requ^ete. Une telle de nition sous-tend que la requ^ete est une representation parfaite du besoin en informations et que nous pouvons exactement representer le contenu des documents du corpus. Cependant, la realite montre combien une telle hypothese est erronee. Une des questions adressee par van Rijsbergen dans [vR86] a trait a la facon dont le systeme doit se comporter quand la formule \



(

d

)!



(

q

)" n'est pas directement etablie. Les documents etant rarement decrits de facon exhaustive, il est fort probable que la requ^ete n'a pu ^etre inferee a cause de cette representation partielle. Ainsi l'ajout d'autres donnees sous la forme de formules logiques peut eventuellement rendre l'inference possible (ou plausible).

1:La requ^eteqpeut ^etre formulee dans un langage de requ^ete quelconque. Le systeme devra alors la transformer en une formule logique (q) conforme a la representation interne du systeme. Les documents etant bien entendu indexes conformement a cette m^eme representation interne.

L'evaluation de la pertinence est fonction du plus petit ajout qui rendrait l'inference possible. Cette idee fut exprimee dans le principe d'incertitude de Rijsbergen [vR86]:

\Given any two sentences x and y, a measure of the uncertainty of y!x relative to a given data set is determined by the minimal extend to which we have to add information to the data set in order to establish the truth of y!x"

Ce principe ne speci e ni la logique a choisir pour la modelisation de la recherche d'informations, ni le type d'inference a utiliser pour prouver que y!x:

(1)

y! x est vraie dans une interpretation particuliere de la logique choisie; i.e, y x.

(2)

x est une consequence logique de y dans la logique choisie; i.e, y j= x.

(3)

y! x est valide dans la logique choisie; i.e, j= yx.

(4)

x est derivable (ou peut ^etre prouvee) de y dans la logique choisie; i.e, y` x.

(5)

y! x est un theoreme de la logique choisie; i.e, `yx.

Ces notions ont des signi cations di erentes en logique, et il para^t ainsi adequat de preciser, chaque fois que l'on construit un modele logique de recherche d'informations, le sens adopte pour y!x. Comme nous l'avons mentionne dans [OC96b], il n'est pas facile de prouver qu'un type d'inference particulier est plus adequat qu'un autre dans une approche logique de recherche. Nous avons cependant enumere dans [Oun96], un certain nombre de parametres qui laissent a penser que les interpretations (4) et (5) ci-dessus introduites sont plus interessantes du point de vue de la recherche d'informations.

En e et, nous croyons qu'en recherche d'informations nous sommes moins concernes par les valeurs de verites que peuvent prendre des entites tels que les documents ou les requ^etes. Par contre nous sommes plus interesses par l'information vehiculee par ces entites et par le comportement inferentiel du systeme de recherche d'informations. Ceci est en parfaite harmonie avec l'aspect syntaxique d'une logique3 (derivabilite et theoremes) et donc avec la theorie des preuves. Cette derniere fait abstraction du sens et des valeurs de verite des symboles manipules, s'interessant exclusivement a leur forme et a la maniere de les demontrer. Plus precisement, nous pensons a la derivabilite comme interpretation adequate pour l'implication en recherche d'informations, ceci pour pouvoir utiliser un ensemble supplementaire de formules representant ainsi les connaissances du systeme. Nous partageons donc le point de vue formulee par Mounia Lalmas et Keith van Rijsbergen dans [LvR93], concernant l'opportunite de considerer des modeles logiques a valeurs de verite en recherche d'informations:

\A non truth-based logic is more appropriate because a model of an IR system is more concerned with information content rather than truth-values"

3:Une logique peut generalement ^etre consideree selon deux points de vue. Le premier a trait a l'aspect syntaxique de la logique, il examine des proprietes (et des relations), des expressions et des formules en faisant abstraction de leur signi cation. Le second point de vue est semantique, il traite des proprietes et relations des expressions qui reposent sur des rapports entre signi ant et signi e. De plus, comme nous le verrons dans le chapitre suivant, une logique peut egalement ^etre associee a une algebre.

Nous formulons ainsi, l'hypothese suivante:

Hypothese 3 (La Pertinence est une Derivation)

Nous faisons l'hypothese que pour qu'un document

d

soit pertinent a une requ^ete



(

q

), il existe une cha^ne de derivation ayant pour debut la description du document



(

d

) et pour n la requ^ete



(

q

).

Une semantique adequate et non ambigue reste cependant necessaire pour permettre de re eter le fonctionnement du mecanisme de derivation et d'expliquer eventuellement son comportement. Ainsi, un des resultats connus dans le domaine de la logique est le suivant: si l'ensemble des axiomes et des regles d'inference de la logique est strictement complet et correct vis-a-vis de sa semantique, alors la derivabilite (`) concide avec la consequence logique (j=) [GG90, Eps90, Eps94]. Nous rappelons qu'intuitivement, on dira que la completude d'une logique garantit que les regles de raisonnements formalisees par cette logique susent pour demontrer toutes les proprietes vraies exprimables dans son langage. Autrement dit, le systeme est dit complet s'il veri e la condition que toutes les tautologies (les formules toujours vraies) sont engendrees par le biais de ses regles et axiomes: Si

A

est une tautologie alors

A

est un theoreme (sij=

A

alors`

A

). L'adequation exprime le fait que le systeme n'engendre rien d'autre que les tautologies. Si cette condition est satisfaite, le systeme logique (avec ses axiomes et regles) est dit correct ou adequat. On dira alors que les regles de deductions syntaxiques preservent les principes de l'interpretation: si `

A

alors j=

A

. Plusieurs sens du mot completude sont a distinguer [GG90]. Ainsi, nous dirons qu'un systeme est strictement complet si, et seulement si, a toute relation de consequence entre une proposition

A

et un ensemble de propositions , correspond une relation de derivabilite, autrement dit: si ,j=

A

alors ,`

A

. Si l'ensemble , est vide, nous dirons que le systeme est faiblement complet ou complet4.

Dans [GG90], les theoremes suivants sont demontres: si le processus inferentiel (ensemble des axiomes et des regles d'inference) de la logique est correct et (faiblement) complet par respect a sa semantique, la notion de theoreme concide avec celle de la validite. En plus, si la logique est adequate et fortement complete, nous verrons aussi la derivabilite qui concide avec la consequence logique. Il est toujours interessant de demontrer qu'une logique est complete mais il est des cas ou c'est crucial. Ce sont les cas ou la satisfaisabilite n'est pas decidable, c'est-a-dire ou on ne dispose pas d'une procedure e ective, analogue a la methode des tables de verites pour le calcul des propositions, permettant de veri er apres un nombre ni d'operations si une formule admet un modele ou pas. Le calcul des predicats, par exemple, n'admet pas une telle procedure de decision pour la satisfaisabilite [GG90]. Par consequent, sa completude garantit que l'on puisse veri er qu'une formule est valide en demontrant qu'elle est un theoreme.

En recherche d'informations, si la completude de la logique est prouvee, cela revient au m^eme de prouver que la requ^ete



(

q

) est une consequence logique de la description du document



(

d

) ou de demontrer que



(

d

) !



(

q

) est une tautologie. Notre hypothese sera ainsi amplement justi ee, puisque tout ce qu'on fait avec la derivabilite a son equivalent (peut se justi er) avec la consequence logique. Prouver la completude nous permettra d'armer que tout ce qu'on derive a partir de nos regles et axiomes est valide (a un sens) par rapport a une semantique. Or pour traiter l'aspect semantique, il est necessaire de speci er la notion d'interpretation dans le cas de la recherche d'informations. En e et, l'interpretation d'une expression dans un index de document ne peut ^etre celle classique, a savoir \la proposition denote un fait qui est vrai dans cette interpretation" car un index n'a rien a voir avec les valeurs de verite du contenu des documents.

4:Dans la litterature, la completude faible est generalement utilisee comme la de nition standard de la comple-tude [GG90].

La seule facon raisonnable pour interpreter une expression d'indexation avec une valeur de verite est de considerer cette derniere comme associee au fait que \l'expression est une bonne representation du contenu du document". Par le fait qu'une expression est une bonne representation du document, nous voulons signi er que l'information vehiculee par cette expression est presente dans le document. Par exemple, dans le cas d'un document traitant des aventures de Tom & Jerry dans un parc public, l'expression \Tom poursuit Jerry dans un parc public" est une bonne representation de ce dernier, ou en termes de recherche d'informations, ce fait est present dans le document. Par contre, l'information representee par l'expression \Romeo aime Juliette" n'est pas vehiculee par ce document, elle ne peut ^etre donc une bonne representation du document en question. S'il existe un procede d'indexation automatique des documents, nous considerons que tout ce qu'extrait ce procede d'un document, comme expressions d'indexation, est une bonne representation du document5.

De nition 3.1.1 (Interpretation des Expressions d'Indexation)

Pour un document

d

, nous considerons que son index



(

d

) est exprime par un ensemble d'expressions f

e

ig construite a par-tir d'un langage L: si

e

i 2



(

d

) alors

e

i est assignee a vrai et est consideree comme une bonne representation du document.

Nous preferons adopter un raisonnement base sur un modele de monde ouvert, c'est-a-dire un monde ou toutes les expressions vraies ne sont pas forcement representees. Essentiellement, cela a pour consequence qu'une base de connaissances est seulement certaine pour les faits qu'elle contient ou qu'elle peut deriver. Tout ce qui echappe a son contenu est simplement considere comme inconnu. Une telle demarche est tres importante en recherche d'informations, car souvent il n'est pas possible de deduire directement si un document contient une information donnee ou pas. Ceci peut ^etre eventuellement demontre quand des nouvelles informations deviennent disponibles. Quand une information est absente dans un document, cela ne veut en aucun cas dire qu'elle est fausse, on considere seulement qu'a ce stade nous manquons de connaissances. Il s'agit d'une approche exactement opposee a celle qui est generalement consideree dans le modele booleen classique, base sur ce qu'on appelle la supposition des mondes fermes (close world assumption).

Le principe d'incertitude de Rijsbergen pourrait alors ^etre decrit par la semantique des mondes possibles [Nie90]. Quand une requ^ete



(

q

) ne peut ^etre directement derivee d'un index



(

d

), alors soit ce dernier devra ^etre elargi par des nouvelles expressions, soit certaines expressions de l'index doivent ^etre modi ees. Par rapport a la de nition 3.1.1 precedente, cette evolution est semantique-ment interpretee comme la precision de nouvelles valeurs de verite pour certaines expressions du langage L. Dans le cas d'un ajout d'expressions, certaines valeurs de verite passent de la valeur inconnuvers une valeur precise faux ou vrai. Par contre, la modi cation d'une expression de l'index du document revient a faire changer la valeur de verite de cette derniere.

L'analogie avec la semantique de Kripke [Kri63] appara^t en ces termes: imaginons que les documents correspondent a des mondes. Sur un document, nous appliquons un nombre de chan-gements, ces changements correspondent a une evolution de ce monde de son etat initial, vers un autre etat, appele alors un monde possible du premier. Ainsi, quand la correspondance entre un document et une requ^ete n'est pas etablie de facon directe, l'approche consiste a transformer l'etat initial de l'index vers des interpretations qui lui sont reliees et pouvant deriver la requ^ete. Chaque transformation a comme resultat une nouvelle interpretation logique des termes d'indexation,

la-5:Si l'indexation est manuelle, il revient a l'indexeur de decider ce qu'est une bonne representation du document. La decision sera di erente d'un individu a un autre, selon leur perception du contenu du document.

quelle correspond a un monde possible. Le processus prend n quand l'information recherchee est trouvee dans un monde possible ou quand il n'est plus possible d'appliquer des transformations. L'aspect intuitif de la semantique des mondes possibles et sa forte liaison avec la problematique de la recherche d'informations, justi ent le fait que de nombreuses approches aient recours a cette semantique pour modeliser une approche logique en recherche d'informations. L'idee initiee par Nie [Nie90], fut aussi adoptee dans [AK92, SvR93, vRL96, CvR95a, Seb94]. Reste a savoir quels types de transformations nous appliquons a un monde dans notre modele.

Comme nous nous interessons aux relations et a leurs proprietes, nous considerons que leur prise en compte nous permettra d'evoluer d'un monde a un autre. Les relations peuvent avoir plusieurs types di erents. Par exemple, elles peuvent exhiber un relation de position (dans, sur.

:::

), une action (imprime, supprime,

:::

), un relation d'association (avec, pour,

:::

), une relation logique (et, ou,

:::

), etc. Elles agissent comme des connecteurs d'expressions ayant un certain nombre de proprietes et agissant selon des comportements speci ques. Generalement, des relations de m^eme type presentent des proprietes communes et des comportements semblables. Nous nous proposons d'etablir ces proprietes et ces comportements a travers un ensemble d'axiomes et de regles. Le systeme de derivation ainsi construit devra ^etre complet vis-a-vis de la semantique adoptee. Les relations, correspondant ainsi a des connecteurs, doivent semantiquement operer comme des fonc-tions des valeurs de verite des constituants qu'elles lient. Cela veut dire que la valeur de verite (toujours par rapport a la de nition 3.1.1) d'une expression complexe est determinee par sa forme