• Aucun résultat trouvé

Malgre leur capacite a representer les relations semantiques tout en presentant des mecanismes d'inference tres utiles, les reseaux semantiques ne se sont jamais imposes comme un formalisme ope-rationnel pour la representation des connaissances. Le principal reproche qui leur a ete fait concerne leur semantique trop oue. Des re exions d'ordre epistemologiques furent alors menees. Aux ques-tions de Woods [Woo75] (\what's in a link"), se sont succede les reponses de Brachman [Bra77] (\what's in a concept"), et un compromis s'est forme autour de la necessite de preciser les notions fondamentales de ces reseaux. Par exemple, les types et les instances ne sont pas di erencies dans le reseau.

La relation \IS-A" a aussi fait l'objet de nombreuses critiques [Bra83]. Ainsi, il s'est avere que ce lien n'est pas assez primitif puisqu'il peut avoir plusieurs sens selon le type des concepts qui sont lies, et selon que ces derniers soient generiques (qu'ils s'appliquent a plusieurs individus) ou speci ques (qu'ils ne s'appliquent qu'a un seul individu). Le lien \IS-A" peut ainsi se referer a des inclusions ou a des appartenances ensemblistes, a des relations de generalisation/specialisation (e.g. un chien est un animal), ou encore a des relations de description (e.g. lien entre Roi de France et Roi). On s'est alors longtemps interroge sur la pertinence de placer la relation \IS-A" dans le reseau au m^eme titre que d'autres relations primitives. D'autant plus, qu'une propriete comme la transitivite n'est pas toujours valide \IS-A", cela depend entre autres du sens qui lui est attribue:

Exemple 2

On peut prendre pour exemple les schemas de derivation errones de la section 2.2.3 (page 26):

Mao IS-A CHINOIS IS-A NOMBREUX IS-A

Lien erroné

Figure 2.5.

La transitivite du lien IS-A n'est pas toujours valide

D'autre part, la quanti cation dans le reseau n'est pas claire, particulierement quand les liens impliquent deux concepts generiques. Par exemple, si nous avons \ETUDIANT!assister!COURS" dans un reseau semantique, on ne sait pas si chaque etudiant assiste a un cours di erent ou si

tous les etudiants assistent au m^eme cours. D'une facon generale, un lien entre deux entites X et Y dans un reseau semantique correspond a une relation R(X, Y) qui, selon qu'elle est precedee de 8

X

8

Y;

9

Y

8

X;:::

pourra donner lieu a 4 interpretations distinctes. Pour resoudre ce probleme, Simmons et Bruce [SB71] proposent d'introduire des liens primitifs comme: some, some-indef, all, no, not-all,

:::

en vue de rendre compte de toute combinaison possible de quanti cateurs logiques. Dans [Woo91], Woods enumere di erentes possibilites de quanti cations entre deux concepts et propose des \operateurs de formation de relations" permettant d'expliciter la quanti cation.

De nombreux travaux theoriques visent a preciser la semantique des reseaux. Ces travaux eta-blissent le besoin d'expliciter la semantique des liens dans le reseau, et de reconna^tre a quel niveau de representation se situe un modele. Des langages pour la representation des connaissances comme KL-ONE propose par Brachman [Bra79, BS85], les dependances conceptuelles de Schank ou encore les graphes conceptuels de Sowa sont issus de tels travaux. Partant du constat que les reseaux semantiques ne pouvaient constituer une theorie generale de la representation des connaissances, Brachman dans le systeme KL-ONE distingue trois axes dans les representations semantiques: le premier selon lequel s'organise la hierarchie des concepts en classes et sous-classes, le deuxieme permet d'expliciter d'autres rapports entre concepts par des liens attributs et le troisieme axe pre-cise les rapports entre les elements de description a l'aide d'un nombre ni de relations primitives. Les travaux de Brachman sur KL-ONE ont donne ensuite lieu a ce qu'on appelle aujourd'hui les logiques terminologiques ou les langages de description. Sowa, lui, concoit son modele des graphes conceptuels comme un langage intermediaire entre les langues naturelles et la logique. Il n'est donc pas surprenant que ce formalisme, dans sa version etendue, soit au moins aussi puissant que les logiques de premiers ordre, permettant de representer aisement les quanti cations.

Paradoxalement, si ces travaux ont permis de preciser la semantique des reseaux, ils ont eu des repercussions negatives sur l'inference des connaissances. Ainsi, que ce soit pour le cas des logiques terminologiques ou des graphes conceptuels, il n'est pas possible d'e ectuer des raisonne-ments du type de ceux que nous avons presente dans la section precedente [Sat96, RDBFPD96]. Par exemple, ces formalismes ne permettent pas de modeliser une propriete comme la transitivite, puisque leurs derivations se limitent le plus souvent a un raisonnement sur les concepts (specialisa-tion/generalisation, speci cation de concepts, etc.).

En recherche d'informations, nous avons autant besoin d'un modele de representation a se-mantique claire et precise que d'un mecanisme d'inference ecace permettant de bien gerer les proprietes des concepts et des relations. Malheureusement, les formalismes de representation de connaissances d'aujourd'hui veri ent la premiere condition, mais peu d'entre eux presentent des mecanismes d'inference adequats pour les besoins de recherche, principalement, a cause du manque de raisonnement sur les relations. Dans la litterature, il est souvent question d'ameliorer la capacite d'inference de ces formalismes. Par exemple, dans [LR95], le systeme Carin munit les logiques terminologiques de regles de derivation de la logique de premier ordre. Dans la section 2.4, nous donnons des types d'inference qui ne peuvent pas ^etre modelises par les logiques terminologiques et qui sont pourtant utiles en recherche d'informations.

Le systeme Rime est parmi les premiers systemes bases sur un formalisme semantique (les dependances conceptuelles de schank) a souligner l'importance de gerer les relations et d'explorer leurs structures. Dans la section suivante, nous donnons une presentation detaillee de ce systeme.

2.3.3 L'Approche de

Rime

Le systeme Rime est destine a des physiciens dont les besoins en informations sont tres precis incluant generalement des concepts complexes et structures. Ces utilisateurs ont ainsi besoin de communiquer avec un systeme de recherche d'informations pouvant representer et evaluer de tels concepts. Une consequence directe est que ce systeme devra ^etre en mesure de retourner des resultats dont la precision est au niveau de celle utilisee par les physiciens pour les requ^etes. En d'autres termes, le systeme devra ^etre oriente vers la precision des reponses et supporter ainsi un langage d'indexation expressif, precis et robuste. L'idee de base du systeme Rimeest que seule l'utilisation explicite des relations semantiques dans la construction des index des documents permet de remplir la contrainte de precision. Ceci est bien entendu en contraste avec les indexations classiques a base des mots-cles ou les relations entre termes ne sont pas prises en consideration.

a) La Representation des Connaissances dans

Rime

Le modele de representation interne de Rime a ete de ni en cooperation avec les specialistes competents du domaine de la radiologie [Ber88]. Il est issu d'un compromis entre les besoins ul-terieurs des utilisateurs et les possibilites de traitements envisageables. La de nition du modele fut inspiree des dependances conceptuelles de Shank [Sch72]. Elle est basee sur un modele se-mantique utilisant des representations arborescentes dans lesquelles les noeuds feuilles sont des concepts primitifs du domaine, et les noeuds non-terminaux sont des operateurs semantiques. Ces derniers denotent des relations semantiques et permettent la construction de concepts complexes. Les concepts primitifs representent le niveau le plus bas de representation des documents et des requ^etes. Les operateurs semantiques permettent l'expression de concepts structures en combinant soit les concepts primitifs, soit des concepts structures deja construits.

Dans Rime, le vocabulaire est precis et tres specialise. Les connaissances semantiques sont bien formalisees et determinees. Ainsi, le langage medical est beaucoup moins ambigue que la langue naturelle en sa totalite. Il est donc possible d'etablir une representation interne correspondant precisement a la semantique d'une phrase dans ce langage. De ce fait, nous pouvons totalement exprimer cette semantique par l'intermediaire d'une grammaire. Une representation possible des elements decrits par cette grammaire est une mise en forme arborescente.

Tous les arbres manipules sont le resultat d'une phase de comprehension traduisant le langage medical en des structures semantiques. Dans Rime, chaque concept, elementaire ou non, possede un type, comme par exemple lesion, organe, etc. Ces types sont organises dans une hierarchie. La grammaire xe ainsi a la fois la structure du langage et sa semantique.

Theoriquement un concept d'un type semantique donne peut toujours ^etre considere comme etant constitue par d'autres concepts plus ns relies entre eux par une certaine relation seman-tique [Ber88]. Ainsi, le concept \hypertrophie" peut ^etre vu comme une \augmentation" portant sur le \volume". Les termes \augmentation" et \volume" etant des concepts plus ns, et \porte-sur" etant la relation entre eux. La decomposition peut eventuellement se poursuivre de cette maniere. Cependant, dans Rime, en conformite avec la vision objectiviste (voir section 2.2.1, une limite a ete etablie par la de nition de certains concepts primitifs, dits concepts elementaires [Ber88] qui ne peuvent jamais ^etre decomposes dans l'application. L'approche adoptee est que des concepts plus ns ne doivent ^etre consideres que si les besoins de l'application l'exigent. A l'inverse de la notion de concept elementaire, les concepts qui sont composes a partir des concepts elementaires

mis en relations semantiques, ou qui peuvent ^etre decomposes en ceux-ci, sont appeles des concepts complexes.

Par exemple, le concept complexe suivant est derive de la phrase \Une hypertrophie de densite tissulaire du lobe gauche de la therode":

lobe droit thuroïde hypertrophie densité tissulaire [dû-à] [a-pour-val-loc] [a-pour-val-loc] [porte-sur] [a-pour-val] (SGN) (LOC) (ORG) (DETAIL) (Qual) (DETAIL) (DETAIL) (QUAL) (SGN) (SGN) (ORG)

Figure 2.6.

Une arborescence Rime pour la phrase \Une hypertrophie de densite tissulaire du lobe droit de la therode"

A l'image du modele des dependances conceptuelles de Shank, le systemes Rime inclue un nombre relativement restreint de relations. Ces dernieres se comportent comme des operateurs unaires ou binaires. il s'agit de relations primitives regroupees dans les types suivants:

booleen:

Ce type regroupe les operateurs logiques classiques tels que le ET (^), le OU (_) ou le NOT (:)

semantique:

Rime comporte sept relations semantiques, a savoir: i) \d^u-a" exprimant une relation de causalite

ii) \per-de-ded" pour \permet de deduire", exprimant une relation de deduction. iii) \montre-par" exprimant une relation de demonstration.

iv) \porte-sur", representant une relation de localisation.

v) \en-rel-avec" pour \en relation topologique avec" , representant une relation topo-logique.

vi) \a-pour-val" pour \a pour valeur" exprimant une relation d'evaluation.

vii) \a-pour-val-loc" pour \a pour valeur locative " exprimant une relation de position precise. La grammaire deRime speci e, entre autres, quels types de concepts peuvent ^etre lies par une relation primitive donnee et quel type de concept cela engendre. Par exemple, la relation semantique binaire \porte-sur" peut lier des concepts de type Sgn(pour signe) et Loc(pour localisation) ou des concepts de typeSgnetFct(pour fonction):

[porte-sur](Sgn,Loc) ou [porte-sur](Sgn,Fct)

Dans les deux cas, le concept construit par le biais de l'application de la relation porte-sur est de type Sgn.