• Aucun résultat trouvé

3.4.1 Prologue

En prologue à la réponse posée ici, il nous semble important de rappeler que la mé- decine, comme d’autres, fait bien partie des domaines où une modélisation ontologique est nécessaire à partir d’un matériau non formel, en l’occurrence linguistique. Comme montré préalablement (cf. chap. 3, § 1.1), la médecine est une pratique quotidienne où les informations se consignent dans des « dossiers », regroupements cohérents de documents essentiellement textuels et n’est une science que pour ses principes biochi- miques, physiques et ses protocoles d’études épidémiologiques. Cela n’a rien de péjoratif mais nous explique pourquoi le matériau n’est pas formel et nous annonce des diffi- cultés pour le formaliser. Enfin, et c’est le début de la réponse à la question de l’utilité, si l’on veut utiliser l’informatique pour améliorer un certain nombre de processus de partage de connaissances, de décision, la formalisation est nécessaire.

3.4.2 Addenda à l’utilité

L’utilité des ontologies en médecine découle évidemment de l’utilité des ontologies telle que nous l’avons décrite au paragraphe 1.4 mais elle se spécialise en fonction du contexte propre à la médecine. Évacuons rapidement les points, évidents, que sont les connaissances du domaine d’un SBC ou la spécification d’un système d’information : les problèmes y sont identiques dans un domaine ou un autre, même s’ils ne sont pas

aisés à résoudre, et la médecine ne fait pas exception à la règle. MENELAS(cf. § 2.4) est

un exemple paradigmatique de cet usage. Pour les systèmes d’information, l’usage est identique en médecine par rapport à un cas général mais il faut noter que les systèmes d’information prenant en charge de l’information médicale – avec la quantité d’objets que devrait avoir un référentiel dans ce domaine – ne sont pas légion et doivent plutôt être considérés encore comme prospectifs (cf. chap. 6, § 4.2.1).

En revanche, Pour la question de la communication (qui englobe l’interopérabilité ici), le contexte médical est très spécifique : la médecine a, depuis longtemps, cherché à

3 – Quelques questions autour des ontologies 63 normer la façon dont on parle de la pratique médicale, dont on l’écrit. Elle a de plus mis en œuvre depuis longtemps une politique d’indexation et de recherche d’information (RI). Elle a pour cela mis en place des thésaurus, souvent très grands, comme nous venons de le voir (cf. § 3.3). C’est vis-à-vis de l’existant et donc de ces thésaurus, que l’utilité des ontologies va apparaître en médecine, que ce soit pour « remplacer » les thésaurus ou être utilisées dans la même application (Rector, 1998; Dolin et al., 2001) : Communication entre êtres humains. Ici, les thésaurus sont utilisés pour que les êtres humains, en l’occurrence les praticiens, « parlent » la même langue pour décrire un patients, ses maladies, etc. Les ontologies doivent permettre de gérer les concepts utilisés, que ce soit au sein d’une écriture libre ou dans des interfaces intuitives.

Médiation (communication entre agents logiciel). Il est admis par les praticiens de l’informatique médicale qu’il est nécessaire d’avoir différents types de terminolo- gies, que ce soit pour l’analyse de données cliniques, pour des travaux de traite- ment du langage naturel, pour des systèmes d’aide à la décision. Ici, les ontologies doivent permettre de créer un pont applicatif que les thésaurus et terminologies, non conceptuels, ne peuvent assurer.

Indexation et Recherche d’informations. Des thésaurus comme UMLS ou le MeSH

ont d’abord été développés pour l’indexation et la RI. Leur mise sous forme numé- rique, dans le même élan que la mise sur support numérique de plus en plus de ressources documentaires ou d’informations médicales (articles, etc.), a fait naître de nouveaux besoins en RI avec des requêtes plus complexes, demandant des in- férences, elles aussi, plus complexes. Le remplacement de ces thésaurus par des ontologies, seules à même de servir de support à ces inférences, est envisagé en médecine, même si nous n’en sommes qu’au début des travaux de recherche dans ce domaine.

Élaboration et maintenance des terminologies. Les thésaurus médicaux sont telle- ment gros et complexes (cf. supra), qu’il n’est plus possible d’assurer leur main- tenance et cohérence dans un domaine en perpétuelle évolution. Une ontologie formant l’armature conceptuelle de ces thésaurus est une solution envisagée et

mise en œuvre par certaines équipes, en particulier autour du projet GALEN : ce

sont des serveurs de terminologie19.

3.4.3 Un serveur de terminologie, GALEN

Un serveur de terminologie est une plate-forme logicielle qui fournit, dans un do- maine d’expertise donné, un certain nombre de services, a minima conceptuels, en- suite linguistiques. Ces services sont à destination d’un utilisateur ou d’un programme (requêtes normalisées). La délégation de ces services au serveur permet une prise en charge centralisée des problèmes terminologiques pour une communauté de travail ou un ensemble d’applications. Ces services s’appuient d’abord sur une ontologie du do- maine et sont de différents types :

– Navigation dans l’ontologie,

– Édition/modification de l’ontologie (selon autorisation),

– Spécification et construction d’une expression conceptuelle complexe d’éléments de l’ontologie en fonction des signatures des relations (les contraintes de combi- naison),

– Vérifications portant sur une expression conceptuelle (validité, canonicité, mise sous forme canonique),

– Distance sémantique entre concepts.

19Le projet MENELAS, décrivant les diagnostics de la CIM-10 en se servant de son ontologie, poursuivait, à

Ces services nécessitent la mise en œuvre d’outils de classification et d’inférences sur les ontologies. Les logiques de descriptions sont des candidats privilégiés dans ce contexte. Les services linguistiques sont rendus par la mise en relation des concepts (ontologies) avec des terminologies ou des thésaurus du domaine et permettent, dans un premier temps, la maintenance, la comparaison ou la fusion de thésaurus.

Le projet GALEN, développé à l’université de Manchester, vise à mettre en place un

serveur de terminologie en médecine. Développé depuis une dizaine d’années (au sein de projets européens successifs), il est centré sur un common reference model, une ontologie de la médecine telle que nous l’entendons ici. Cette ontologie respecte une structure arborescente au niveau de ses types primitifs et est le cœur du système et des services qu’il propose (Rector, 1998). Nous n’allons pas décrire le système par le

menu20 et allons plutôt nous intéresser à son common reference model et à sa mise en

œuvre pour préciser quelques points :

– L’ontologie de la médecine ne couvre que les domaines dans lesquels le projet s’est développé, où des opportunités se sont créées. Ainsi, le département de santé pu- blique et d’informatique médicale de Saint-Étienne participe au développement de la classification commune des actes médicaux (CCAM) et justifie l’utilisation d’un tel outil pour le développement cohérent d’une terminologie médicale (Rodrigues

et al., 1998, 1999).

– Les promoteurs du projet sont confrontés au problème de l’évolution rapide de la médecine et donc des ontologies attenantes, au point qu’il est difficile d’avoir une

vue complète et cohérente d’une ontologie d’un domaine précis21.

– Confronté à la difficulté de compréhension des ontologies, le projet GALEN y a

répondu, même si ça n’était pas au début le but d’un tel module, par un générateur de langage naturel permettant de valider les représentations proposées avec les praticiens. Cela rejoint les problématiques d’indexation (cf. § 6).

– Enfin, les promoteurs du projet, s’ils proposent de construire – et construisent – des ontologies, ne proposent pas réellement de méthode argumentée et construc- tive. C’est ce que nous avons fait et allons compléter maintenant, en enrichissant la méthodologie décrite au paragraphe 2.2 de considérations sur les corpus et les outils d’analyse de corpus.

4 Acquérir des ontologies à partir de corpus