• Aucun résultat trouvé

Une Vision Relationnelle des Graphes Conceptuels

4.2 Le Modele des Graphes Conceptuels et la RI

Il existe aujourd'hui de nombreux systemes fondes sur les graphes conceptuels integrant un module de recherche. Citons par exemple, le systeme KALIPSOS d'IBM [BDFL88, Far89] destine a la comprehension des textes ecrit en francais, le systeme MENELAS [MEN94, Za93, BZ92] dedie a la recherche medicale et le systeme de recherche de Myaeng [Mya92, ML93, MKL94]. Cependant, la plupart de ces systemes ne se situent pas dans le cadre particulier de la recherche d'informa-tions, mais sont plut^ot destines a la representation et a la gestion des connaissances. Autrement dit, ils ne suivent pas un modele theorique de recherche d'informations dans leur conception. Le systemeElen[Che92] deroge a cette regle puisqu'il propose une adaptation du modele des graphes conceptuels au domaine de la recherche d'informations. Il existe ainsi un lien entre le modele logique de van Rijsbergen [vR86] et le formalisme des graphes conceptuels. Ce lien est discute dans [Che92, Oun94, Oun95, HOC96].

Si l'on represente les documents et les requ^etes avec des graphes conceptuels, la relation de specialisation  de nie sur les graphes peut servir a modeliser la notion de pertinence. De plus, l'operateur de projection fournit la methode operationnelle de deduction. Ainsi, un document

d

indexe par un graphe conceptuel



(

d

) est pertinent pour une requ^ete

q

representee par un graphe conceptuel



(

q

) si, et seulement si,



(

d

) est une specialisation de



(

q

), c'est-a-dire



(

d

) 



(

q

).

Cette formalisation de la notion de pertinence repose sur un constat classique en recherche d'in-formations, a savoir qu'on cherche en general a veri er que les elements decrits dans la requ^ete gurent dans les documents pertinents sous une forme identique ou plus precise (plus speci que).

De nition 4.2.1 (Graphes Conceptuels et Pertinence)

SoitD l'ensemble des documents du

corpus, avec

d

2 D. Soit G un ensemble de graphes conceptuels, avec



(

q

) and



(

d

) 2G, ou



(

d

) et



(

q

) sont respectivement la representation du document et de la requ^ete. Nous avons alors,

d

est pertinent pour

q

si et seulement si



(

d

)



(

q

)

L'operateur de projection permet la mise en oeuvre d'un processus de recherche base sur cette notion de pertinence. Nous avons en e et montre dans la section precedente que la relation de spe-cialisation peut ^etre de nie par l'existence d'une projection d'un graphe sur sa spespe-cialisation. Ainsi, de part le theoreme 10, s'il existe une projection de



(

q

) sur



(

d

), la relation d'ordre



(

d

) 



(

q

) est etablie6. Il en decoule d'apres les proprietes de l'operateur



que



(



(

d

))



(



(

q

)). En d'autres termes la requ^ete est une consequence logique du document. Il existe ainsi une connexion expli-cite avec le modele logique. La projection se comporte comme le principal operateur de recherche: retrouver les documents impliquant logiquement la requ^ete de l'utilisateur revient a retrouver les documents qui contiennent une projection de cette requ^ete. Elle remplace ainsi un demonstrateur de preuves.

Seuls des graphes conceptuels normalises sont acceptables comme index dans le systemeElen(Cf. section 4.1.3), a n d'eviter que deux documents di erents ne soient indexes par des graphes equi-valents. Le systeme Elenn'utilise ainsi que des jointures maximales sur les graphes. Une jointure maximale consiste a appliquer l'operation de fusion de deux graphes, non pas sur un seul noeud, mais sur un sous-graphe commun. Cette operation s'exprime par une composition de jointures et de simpli cations et ne construit que des graphes normalises. De plus les relations des graphes sont toutes binaires.

Nous avons mentionne a maintes reprises dans les chapitres 2 et 3 que le formalismes des graphes conceptuels ne permet pas de raisonner sur les relations. D'une part a cause du fait que les proprietes des relations ne sont pas incluses dans la base de connaissances, et d'autre part du fait que la projection ne tient compte que des specialisations (restriction) de concepts. Par rapport au modele relationnel que nous avons propose, il est interessant a ce stade d'expliciter clairement les proprietes des decisions de pertinence du systemeElen. Cela permet de montrer les potentialites de ce formalisme, mais aussi de detecter ses limites a n d'y remedier.

En collaboration avec Huibers, nous avons degage les decisions de pertinence du systeme

Elen vis-a-vis du cadre logique neutre propose par ce dernier pour la comparaison des systemes de recherche d'informations existants. Les resultats obtenus sont presentes dans [HOC95, HOC96]. Ainsi, dans sa modelisation de la notion de pertinence en recherche d'informations, Huibers [HB94, Hui96] elabore un cadre logique formel permettant d'evaluer puis de comparer des systemes de re-cherche d'informations sans passer necessairement par des experimentations. L'idee est la suivante: expliciter des axiomes et des regles qui sous-tendent la notion de pertinence puis traduire le com-portement de chaque systeme particulier de recherche d'informations en leurs termes. Ainsi, il a ete montre, par exemple, que les modeles classiques de recherche d'informations (Booleen, vectoriel,

6:Cela correspond bien a ce que l'on entend en general par correspondance en recherche d'informations, si l'on prend le point de vue o ert par les formalismes de representation de connaissances fondes sur la notion de hierarchie generique/speci que.

...) peuvent ^etre speci es par une selection d'un sous-ensemble de ces axiomes et de ces regles. La theorie des situations a ete choisie pour modeliser la notion de pertinence, vu la grande liberte et la marge de manoeuvre importante qu'elle presente. On parle alors d'un cadre general pour la recherche d'informations base sur la theorie des situations. Ce cadre permet de comparer des systemes de recherche d'informations relativement aux axiomes et regles qu'ils supportent.

La demarche d'evaluation theorique d'un systeme de recherche d'informations consiste a le transformer vers ce cadre formel. Des fonctions de transformations completes doivent ^etre proposees a cet e et. La relation de pertinence etant alors de nie comme une relation entre situations, elle peut ^etre etablie par un systeme de derivation de pertinence compose d'un ensemble de postulats. Cet ensemble de postulats est presente comme une serie d'axiomes et de regles etablissant les proprietes de relation de pertinence entre situations. Les systemes de recherche d'informations peuvent ainsi ^etre compares par rapport aux postulats qu'ils satisfont.

Nous nous sommes base sur le travail d'evaluation du systeme Elen dans le cadre ci-dessus presente pour speci er les caracteristiques des graphes conceptuels en termes de notre modele relationnel. En e et, notre langage de representation dans ce modele etant la theorie des situations augmentee d'un ensemble de relations d'endiguement speci ques a notre demarche, il susait de retablir par rapport a ce dernier la translation e ectuee dans [HOC96]. L'analyse de Elen par rapport a notre modele relationnel sera presentee dans la section suivante.

4.2.1 Lien avec la Theorie des Situations

Dans Elen, un graphe conceptuel vehicule des informations. Il peut donc ^etre vu comme une situation dont il convient de speci er les relons. Il sut pour cela de comprendre comment est construit un graphe conceptuel. En e et, un graphe n'est autre qu'une collection de relations connec-tees entre elles par des concepts. Les concepts peuvent ^etre generiques ou individuels. Toutes les composantes d'un graphe ont un r^ole speci que. Par exemple, les concepts decrivent les classes d'objets, alors que les marqueurs denotent des elements particuliers. L'idee proposee est donc de transformer chaque composante du graphe (concepts, marqueur, relation) en un relon speci que. La seule contrainte qu'il faut respecter est de conserver les informations vehiculees par le graphe, en respectant essentiellement les connexions entre types de concepts et marqueurs d'une part, et entre les relations d'autre part.

La translation des graphes conceptuels en situations passe donc par la de nition de ces relons, associes a chaque composante du graphe. Par consequent, le langage des relons<(O

;

Param

;

R) du chapitre 3 (section 3.1.6, page 79) doit ^etre instancie:

De nition 4.2.2 (Le Langage de Relons des Graphes Conceptuels)

SoientTcun ensemble

de types de concepts et Mun ensemble de marqueurs. De plus, soient Tr un ensemble de types de relations et Param un ensemble de parametres. Nous denotons par C l'union de Tc et de M. Le langage de relons des graphes conceptuels <GCs(C

;

Param

;

Tr) est de ni comme etant le plus petit ensemble tel que:

{ si

r

2 Tr, etp_, q_ 2Param alors le relon hhr,p_, q_;1ii2 <GCs(C

;

Param

;

Tr)

{ si Typec 2 Tc , etp_ 2 Param alors le relon hhType,Typec, p_;1ii2 <GCs(C

;

Param

;

Tr) { si

m

2M, et p_ 2 Param alors le relon hhMarqueur, m, _p;1ii2 <GCs(C

;

Param

;

Tr)

Quand C, Param et Tr sont connus, nous denotons le langage <GCs(C

;

Param

;

Tr) simplement par <GCs.

Dans Elen, seuls des graphes simples sont utilises, c'est-a-dire que les noeuds concepts ne peuvent pas avoir pour marqueurs des graphes conceptuels. De ce fait, il n'est pas possible que les arguments des relons soient eux-m^emes des relons. Le langage d'indexation relationnelle L(<) du chapitre 3 (De nition 3.2.1 de la page 81) est ainsi confondu avec le langage <GCs. Nous notonsLGCs(<GCs) =<GCsle langage d'indexation relationnelle instancie aux graphes conceptuels. L'ensemble des situations est de ni pour ^etre l'ensemble S(<GCs) (ou simplementSGCs).

Chaque graphe conceptuel devra ^etre ainsi transforme en une situation de SGCs. Pour ce faire, une fonction de translation trans sur les graphes conceptuels est introduite: