Les étapes de la méthodologie - L'ingénierie des connaissances : développements, résultats et p

2.3 Quelques bons principes

Passés les questions de méthodologies fondamentales, un certain nombre de travaux proposent des principes de construction d’ontologies. Nous allons nous attarder sur deux d’entre eux, paradigmatiques, les travaux de Th. R. Gruber (1993) et ceux de M. Fernàndez et al. (1999).

Th. R. Gruber propose ainsi un certain nombre de principes à respecter pour construire une ontologie :

Clarté. Les ambiguïtés doivent être réduites, quand une définition peut être axiomati- sée, elle doit l’être. Dans tous les cas, des définitions en langage naturel doivent être fournies.

Cohérence. Une ontologie doit être cohérente. Les axiomes doivent être consistants. La cohérence des définitions en langage naturelle doit être vérifiée autant que faire se peut.

Extensibilité. L’ontologie doit être construite de telle manière que l’on puisse l’étendre facilement, sans remettre en cause ce qui a déjà été fait.

Biais d’encodage minimal. L’ontologie doit être conceptualisée indépendamment de tout langage d’implémentation. Le but étant de permettre le partage des connaissances (de l’ontologie) entre différentes applications utilisant des langages de re- présentation différents.

Engagement ontologique minimal. Une ontologie doit faire un minimum d’hypothèses sur le monde : elle doit contenir un vocabulaire partagé mais ne doit pas être une base de connaissances comportant des connaissances supplémentaires sur le monde à modéliser.

D’autres principes du même type sont proposés par d’autres auteurs (cf. article de A. Gómez-Pérez (2000)). Il est facile de voir que la méthodologie que nous avons décrite (cf. supra) fournit des moyens d’appliquer ces principes, au niveau sémantique ou au niveau formel selon les cas. Le dernier principe est moins clair qu’il n’y paraît : nous avons vu (cf. 2.2.3), en accord avec N. Guarino, qu’un engagement ontologique est le passage obligé vers l’ontologie formelle. La question du contenu de l’ontologie par rap- port à une base de connaissances est un problème qui n’est pas uniquement lié à la formalisation mais s’y surajoute (cf. § 3.2).

2 – Quelle méthodologie de construction ? 55

M. Fernàndez et al. proposent, dans la méthodologie METHONTOLOGY, de construire

une ontologie en respectant des activités de gestion de projet (planification, assurance qualité), de développement (spécification, conceptualisation, formalisation, implémen- tation, maintenance) et des activités de support (intégration, évaluation, documenta- tion). On retrouve là des problématiques de génie logiciel et de gestion de projet infor- matique qu’on a tout intérêt à voir s’appliquer à la construction de grandes ontologies, si on a une méthodologie réelle de construction, évidemment. Cette méthodologie rejoint

pour partie celle décrite par F. Gandon (2002) et développée au sein de l’équipe ACACIA

de l’INRIA.

Enfin, nous renvoyons à l’article de A. Gómez-Pérez (2000), pour une description plus complète d’ontologies et de méthodologies centrées sur des problématiques de cycle de vie des ontologies.

2.4 Une ontologie en médecine : M

ENELAS

MENELASest un projet européen piloté de 1992 à 1995 par le DIAM/SIM/DSI/AP-HP.

Le but du projet MENELAS était la conception et l’implémentation d’un système pilote

capable d’accéder à des rapports médicaux rédigés en langage naturel dans 3 langues, l’anglais, le français et le néerlandais : ce système devait pouvoir analyser le contenu de rapports médicaux (comptes rendus d’hospitalisation ou CRH) et l’archiver dans une base de données sous la forme d’un ensemble de structures conceptuelles (graphes conceptuels de Sowa (Sowa, 1984)). Ces structures, qui constituent la représentation de chaque CRH, devaient pouvoir ensuite être consultées pour accéder à des informations spécifiques contenues dans le CRH. Une partie des informations était encodée à l’aide de nomenclatures internationales, ce qui permettait leur échange à partir de CRH écrits

en différentes langues12_{(Zweigenbaum et al., 1995a).}

MENELASrepose sur l’hypothèse que la compréhension d’un CRH consiste à construire

une représentation conceptuelle de la situation du monde décrit dans le texte. Cette hypothèse peut être justifiée par le fait que nous nous intéressons à des rapports techniques qui décrivent ce qui est arrivé au patient durant son hospitalisation. Le

sous-système d’analyse du langage naturel inclus dans MENELASutilise un analyseur

morpho-syntaxique, un analyseur sémantique et un analyseur « pragmatique ». L’analyseur sémantique produit une représentation du sens sous forme de graphes conceptuels. Cette représentation correspond au sens littéral des phrases ; elle est construite à partir d’une phrase en associant des concepts à des mots grâce à un lexique séman- tique : on passe « du mot au concept ». La compréhension d’un texte repose sur l’utilisa- tion de connaissances médicales et de connaissances de sens commun qui permettent d’inférer de nombreuses informations implicites. Ces informations correspondent à des inférences effectuées naturellement par un spécialiste du domaine lorsqu’il lit un CRH. L’analyseur pragmatique a pour tâche d’obtenir un niveau de compréhension plus pro- fond en construisant un modèle de la situation décrite : il va « du concept au concept »

(Zweigenbaum et al., 1995a). La figure 4.2 montre un schéma de MENELAS avec l’ana-

lyseur pragmatique et ses bases de connaissances.

La question de la construction de l’ontologie de MENELAS a été abordée de façon

approfondie dans (Bouaud et al., 1994) et (Charlet et al., 1996a). Elle a amené la mise au point de la méthodologie (cf. § 2.2), principalement par B. Bachimont, et l’implémen- tation d’un système opérationnel, principalement par J. Bouaud (1992), se servant de cette ontologie. En dehors du fait que le pilote a bien fonctionné et que le projet a obtenu

12_{Le projet a été confronté aux problèmes habituels de la compréhension de textes en langage naturel. Il}

s’agit bien sûr des problèmes inhérents au langage, comme la paraphrase, l’ambiguïté, et de façon plus gé- nérale la description et la mise en œuvre de connaissances syntaxiques et sémantiques adéquates et d’une couverture suffisante. Il s’agit aussi des problèmes généraux de représentation du sens des énoncés et des connaissances à fournir au système. On rejoint alors des problématiques classiques en Intelligence artifi- cielle : acquisition, représentation, mise en œuvre, validation de connaissances complexes.

Connaissances pragmatiques

Base de données patients

d’hospitalisation

Compte rendu _{Texte original}

Représentation conceptuelle Codes de nomenclature Niveau conceptuel Lexique sémantique Sémantique Pragmatique Morphosyntaxe Niveau linguistique

Menelas : système d’analyse

Dans le document L'ingénierie des connaissances : développements, résultats et perspectives pour la gestion des connaissances médicales (Page 69-71)