• Aucun résultat trouvé

L’architecture de niveaux de Berners Lee

Au d ´ebut des ann ´ees 90, les langages les plus repr ´esentatifs ´etaient Cycl cr ´e ´e en 1990 par Lenat et Guha [Len90], LOOM cr ´e ´e en 1991 par McGregor [Mac91], Ontolingua cr ´e ´e par Gruber en 1992 [Gru92], F-logic cr ´e ´e par Kifer en 1995 [Kif97], OCML cr ´e ´e par Motta en 1998 [Mot98, Mot00]. La plupart de ces langages suivent une syntaxe bas ´ee sur LISP et sont appel ´es ≪ langages classiques ≫. Plus r ´ecemment, l’ ´evolution de ces langages

s’est appuy ´ee sur un langage largement utilis ´e dans le web (XML - Extensible Markup

Language) pour donner de nouveaux langages pour les ontologies comme OML/CKML

[Ken00], RDF9(Ressource Description Framework ), RDF Schema10, SHOE11, OIL, DA- MIL + OIL [Hor02], ou OWL12(Ontologies Web language).

Les langages de description et de repr ´esentation des connaissances ´evoluent dans

9. RDF http://www.w3.org/2001/sw/wiki/RDF

10. RDF Schema http://www.w3.org/TR/PR-rdf-schema 11. SHOE http://www.cs.umd.edu/projects/plus/SHOE 12. W3C, OWL http://www.w3.org/2001/sw/wiki/OWL

tous les domaines. Ainsi, la connaissance du domaine, en particulier les ontologies, est repr ´esent ´ee en utilisant le formalisme des graphes conceptuels ou les logiques de des- cription. Depuis l’av `enement du web s ´emantique, la repr ´esentation des ontologies est en passe d’ ˆetre normalis ´ee par un langage : OWL qui int `egre nativement des fonctionna- lit ´es telles que la cr ´eation d’axiomes qui concernent la d ´efinition compl `ete ou partielle de concepts et de relations. Ce langage permet de manipuler et de sp ´ecifier des classes, les propri ´et ´es de ces classes et des restrictions sur ces propri ´et ´es (OWL-DL et OWL-Full deux variantes de OWL). OWL est bas ´e sur une sur-couche XML et sur les logiques de description provenant des graphes conceptuels [Gan02].

Par rapport `a la probl ´ematique de la repr ´esentation des connaissances issues de textes, XML devient le standard de fait de l’ing ´enierie documentaire textuel [W3C13]. De plus, il fournit avec une sur-couche comme RDF [Wei09], une fac¸on de d ´ecrire des m ´eta- donn ´ees permettant l’indexation et l’acc `es `a l’information [Cru04].

Les technologies, langages, outils et standards du Web S ´emantique (XML, RDF, OWL) jouent ´egalement aujourd’hui un r ˆole d ´eterminant dans tout type d’applications de do- maine qui ont des besoins r ´eels et concrets d’utilisation du web. Des enjeux importants sont de savoir si les langages standards d’ontologies du web permettront de r ´epondre `a ces principaux besoins [Gan02, Gan06].

2.2/

L

ES ONTOLOGIES DANS LE DOMAINE MEDICAL

´

Une ontologie m ´edicale est souvent conc¸ue pour assister l’analyse qualitative des d ´ecisions m ´edicales dans un domaine sp ´ecialis ´e. La mod ´elisation s’appuie sur deux sources compl ´ementaires [Sad12] :

la structure de l’observation m ´edicale informatis ´ee utilis ´ee dans l’unit ´e qui fournit direc- tement des concepts fondamentaux pour la prise en charge d’une maladie ou le suivi hospitalier (diagnostics des patients, dossiers m ´edicaux, m ´edicaments administr ´es, . . . ),

l’analyse terminologique des corpus qui permet d’enrichir et de structurer ce noyau ontologique.

La construction de ces types d’ontologie m ´edicale pour la recherche d’information est probl ´ematique au niveau de la terminologie et de la mod ´elisation ( `a la crois ´ee de plusieurs domaines tels que l’ing ´enierie des connaissances et la gestion pour l’optimisation des co ˆuts en m ´edecin) pour permettre l’interop ´erabilit ´e des documents et faciliter l’ ´elaboration de diagnostics plus pr ´ecis [Sta09].

Le d ´eveloppement d’une ontologie utilise obligatoirement des syst `emes terminologiques, bien que les ontologies aient un r ˆole normatif analogue aux terminologies. Pourtant, le recours `a des terminologies ou des corpus de textes, pour la cr ´eation d’ontologies est par- fois in ´evitable (par exemple si l’ontologie a pour int ´er ˆet `a ˆetre int ´egr ´ee `a un syst `eme de traitement automatique de documents), l’ontologie doit assurer la couverture terminolo- gique du domaine. Depuis de nombreuses ann ´ees, l’acc `es aux connaissances m ´edicales est un enjeu majeur pour les professionnels de la sant ´e et les chercheurs. Face `a la mul- tiplication des sources d’information potentiellement accessibles et `a l’augmentation ver- tigineuse de la production textuelle ´electronique et d’imagerie l’utilisation des ontologies s’est d ´evelopp ´ee.

Plusieurs communaut ´es d’ing ´enierie de connaissances travaillent depuis plus d’une dizaine d’ann ´ees sur le probl `eme de la construction de ressources terminologiques et ontologiques `a partir de corpus. Ils ont produit des r ´esultats tant th ´eoriques que m ´ethodologiques et logiciels, qui ont ´et ´e ´eprouv ´es dans plusieurs projets applicatifs. De- puis 2000, ces projets sont reconnus comme ´etant des avanc ´ees sur ces probl ´ematiques au niveau international [Aus05]. Le d ´eveloppement de ces ressources terminologiques et ontologiques facilite l’usage des terminologies nationales et internationales dispo- nibles notamment dans le domaine de la m ´edecine (aide au codage des diagnostics, r ´ealisation d’ ´etudes ´epid ´emiologiques et maladies, . . . ) et pour l’acc `es aux connais- sances m ´edicales (base de donn ´ees bibliographiques MEDLINE13, base de connais-

sance VIDAL14 sur les m ´edicaments, documents disponibles sur internet, . . . ). Les utilisateurs potentiels de ce type de ressources sont nombreux : les ´etudiants et les m ´edecins, les organismes et institutions publics ou priv ´ees, les services dans les h ˆopitaux, . . . . Dans le contexte du web s ´emantique, l’interop ´erabilit ´e des syst `emes d’in- formation de sant ´e passe par la constitution de ressources terminologiques et ontolo- giques [Char02, Ban05].

La quantit ´e de connaissance disponible dans les domaines de la m ´edecine, de la biologie et de la sant ´e publique s’accroˆıt [Saf00]. Les documents m ´edicaux num ´eris ´es constituent des sources multiples et diverses (texte, vid ´eo, audio, images, . . . ). Ces num ´erisations font esp ´erer des b ´en ´efices [Ash04] :

l’augmentation de la fiabilit ´e des donn ´ees (capture, enregistrement, transmission), • la compr ´ehension des m ´ecanismes d’interpr ´etation et de raisonnement m ´edical, • la s ´election des donn ´ees,

la rationalisation des choix au niveau individuel ou collectif par l’application de proto- coles,

le partage de l’information,

et la facilitation de l’acc `es `a la connaissance [Van11].

De la m ˆeme fac¸on, l’informatique m ´edicale s’attache `a d ´evelopper et `a ´evaluer des m ´ethodes et des syst `emes pour l’acquisition, le traitement et l’interpr ´etation des donn ´ees ( ´etude des patients), avec l’aide des connaissances issues de la recherche scientifique. La prolif ´eration des recherches scientifiques ne permet pas de r ´ealiser une carte exhaus- tive des ´equipes travaillant sur ce domaine m ´edical. Pourtant, les n ´ecessit ´es de l’activit ´e m ´edicale avec des dossiers informatis ´es, les n ´ecessit ´es d’indexation, les contraintes de codage, . . . obligent `a r ´efl ´echir `a des mod ´elisations puis `a des applications qui corres- pondent `a des prises en charge de l’information et des connaissances diff ´erentes. En particulier, la diversit ´e de l’activit ´e implique de s’int ´eresser, d’une part `a la question des documents et de leurs supports et des mod `eles d’information non structur ´es, et d’autre part `a des mod `eles formels des connaissances que sont les ontologies.

Des nombreux travaux de recherche visant `a proposer de nouvelles m ´ethodes de constructions d’ontologies, vont dans ce sens et enrichissent la d ´efinition de la notion d’ontologie m ´edicale. Il existe diff ´erents centres de recherche ontologiques rattach ´ees aux Universit ´es franc¸aises et au niveau international. Pour exemple, NCOR est le centre national de la recherche ontologique (National Center for Ontological Researche, Univer-

sity of Buffalo), et a ´et ´e cr ´e ´e en 2005 avec l’objectif de faire progresser la qualit ´e de la

recherche et du d ´eveloppement ontologique et l’assurance de qualit ´e. De la m ˆeme fac¸on,

13. MEDLINE http://www.medline.com 14. VIDAL http://www.vidal.fr

le centre national d’ontologie biom ´edicale (National Center for Biomedical Ontolgy ) qui est maintenant dans sa septi `eme ann ´ee, et HeTOP (The health Terminology/Ontology

Portal) d ´evelopp ´e par Stefan Darmoni, sont des centres qui visent (1) `a cr ´eer et mainte-

nir un r ´ef ´erentiel d’ontologies et de terminologies biom ´edicales, (2) `a construire des outils et des services web pour permettre l’utilisation des ontologies et terminologies dans la recherche clinique et translationnelle (disponibles principalement en franc¸ais ou en an- glais, mais aussi en allemand, italien, chinois, . . . ). La pi `ece maˆıtresse du centre national est une ressource en ligne continue sous le nom BioPortail, et HeTOP peut ˆetre utilis ´e par les humains et les ordinateurs via des services Web.

Au niveau national, le Groupe d’Informatique Biom ´edicale (GIB) a travaill ´e durant 15 ans dans divers domaines de l’informatique biom ´edicale sur entre autres : la prise de d ´ecision, le traitement d’images, les lignes directrices et protocoles cliniques, les ontolo- gies biom ´edicales, l’int ´egration de bases de donn ´ees, le data-mining, . . . L’exp ´erience ac- quise dans ces domaines se refl `ete dans le grand nombre de publications scientifiques, dans la participation `a diff ´erents projets de la Commission Europ ´eenne et dans les in- vestissements faits par les industriels. Le groupe a particip ´e `a de nombreux projets fi- nanc ´es par la Commission europ ´eenne, comme ACGT (essais cliniques post-genomique ax ´es sur le cancer) ; INFOBIOMED (R ´eseau d’excellence en informatique biom ´edicale) ; INFOGENMED (d ´eveloppement d’un laboratoire virtuel pour l’acc `es et l’int ´egration des informations g ´en ´etiques m ´edicales et les applications dans le domaine de la sant ´e) et BIOINFOMED (en mettant l’accent sur les relations et les synergies entre l’informatique m ´edicale et bio-informatique). En 2011, un projet d’action de soutien de type (ACTION- GRID) a ´et ´e n ´egoci ´e avec la Commission Europ ´eenne pour ´etendre les applications de la grille de la biom ´edecine pour les pays d’Am ´erique Latine, les Balkans et l’Afrique du Nord.

Pour le d ´eveloppement d’une ontologie m ´edicale, les ressources terminologiques sont utilis ´ees par les professionnels de la sant ´e dans le monde entier, dans le cadre de la communication des connaissances et des pratiques scientifiques, s’appuyant sur des ressources documentaires (cf. section 2.2.1). Ces ressources aident `a la construction d’ontologies dans le domaine biom ´edical. Elles sont bas ´ees sur un traitement automatis ´e de l’information de fac¸on intensive, standardis ´ee et g ´en ´eralis ´ee pour la repr ´esentation des connaissances (cf. section 2.2.2). La section 2.2.3 introduit les ontologies m ´edicales les plus reconnues et utilis ´ees dans le domaine de la pratique m ´edicale. Finalement, nous consid ´erons certaines des tendances en mati `ere de d ´eveloppement et traitement ontologique (cf. section 2.3) ainsi que l’ ´evaluation d’une ressource terminologique et on- tologique (cf. section 2.4).

2.2.1/ TAXONOMIES MEDICALES´

Il existe dans le domaine m ´edical un grand nombre de ressources terminologiques et ontologiques construites pour r ´epondre `a des besoins pr ´ecis et divers. L’utilisation de syst `emes terminologiques pour la cr ´eation d’ontologies ne va pas sans poser d’impor- tants probl `emes. Bien que les ontologies aient un r ˆole normatif analogue aux termino- logies, mettre en place un vocabulaire commun et faire usage de repr ´esentations et concepts partag ´es, permet l’interop ´erabilit ´e des documents et facilite l’ ´elaboration de connaissances.

des lexiques, des bases de donn ´ees ou des ontologies. Les lexiques sont constitu ´es d’une collection de mots enrichie d’informations pour leur compr ´ehension et leur utilisa- tion [Sch12]. Nous pouvons rencontrer aussi des terminologies, qui sont g ´en ´eralement consid ´er ´ees comme des lexiques sp ´ecialis ´es [Bod06b]. Les bases de donn ´ees se fondent sur le traditionnel mod `ele relationnel qui fournit un sch ´ema strict pour des ins- tances. D’autre part, les concepts sont repr ´esent ´es par des tables et les relations par des cl ´es ´etrang `eres entre les tables. Ce formalisme limite les d ´efinitions formelles pos- sibles des concepts et n’offre pas beaucoup de capacit ´es de raisonnement, m ˆeme s’il existe des approches pour stocker des ontologies dans des bases de donn ´ees [Lep08]. Les ontologies de domaine ont des objectifs plus pr ´ecis, alors que leurs administrateurs sont des applications informatiques plut ˆot que des personnes. Ainsi, les ontologies de domaine n’ont pas besoin de s’occuper des variantes et des cat ´egories syntaxiques sur les termes qui sont utilis ´es parce qu’elles sont g ´en ´eralement mod ´elis ´ees par un lan- gage de repr ´esentation. Nous identifions les formalismes simples comme les r ´eseaux s ´emantiques et les langages de repr ´esentation complexes qui permettent d’appliquer l’inf ´erence comme la structure logique ou la logique de description.