• Aucun résultat trouvé

Ontologies and knowledge integration for a polypathological monitoring | [Ontologies et intégration des connaissances pour un suivi polypathologique]

N/A
N/A
Protected

Academic year: 2021

Partager "Ontologies and knowledge integration for a polypathological monitoring | [Ontologies et intégration des connaissances pour un suivi polypathologique]"

Copied!
12
0
0

Texte intégral

(1)

Ontologies et intégration des connaissances pour un suivi polypathologique

Hicham Elasri1, Abderrahim Sekkaki1, Amir Hajjam2, Lamine Benmimoune2, Samy Talha3, Emmanuel Andrès4,5

1Faculté des Sciences Aïn Chock, université Hassan II Casablanca, BP 5366 Maarif, 20100 Casablanca, Maroc

<a.sekkaki@fsac.ac.ma>

2Université de technologie de Belfort-Montbéliard, 4, rue Thierry-Mieg 91000 Belfort Cedex, France

<amir.hajjam-el-hassani@utbm.fr>

3Service de physiologie et d’explorations fonctionnelles, hôpitaux universitaires de Strasbourg, 67091 Strasbourg cedex, France

<samy.talha@chru-strasbourg.fr>

4Service de médecine interne, diabète et maladies métaboliques, hôpitaux universitaires de Strasbourg, 67091 Strasbourg cedex, France

5Laboratoire de recherche en pédagogie des sciences de la santé, faculté de médecine de Strasbourg, 67091 Strasbourg cedex, France

<emmanuel.andres@chru-strasbourg.fr>

Pour apporter une solution cohérente dans le domaine de la télésurveillance médicale, les systèmes de suivi doivent prendre en compte différentes pathologies afin d’éviter la multipli- cation des équipements. Ils doivent être par conséquent ouverts et évolutifs pour permettre le partage et la prise en charge de connaissances hétérogènes. Les technologies du web sémantique offrent une bonne approche pour gérer ces connaissances et les processus qui y sont associés. Elles sont de plus en plus utilisées pour un large spectre d’applications au sein desquelles la connaissance du domaine est modélisée et formalisée (ontologie) afin de servir de support à des traitements très diversifiés (raisonnements) effectués par des machines. L’hétérogénéité produit plusieurs types de conflits, notamment les conflits détec- tables par la machine pouvant être syntaxiques ou structurels et les conflits sémantiques non détectables par celle-ci. Il s’agit de lever et résoudre ces conflits, notamment sémantiques, en utilisant, par exemple, des opérations sémantiques sur les ontologies. Afin d’unifier la vision aux médecins et d’avoir une seule vue pour les données issues de différents sys- tèmes, relatifs au suivi de différentes pathologies, sans duplication ni conflits, nous avons besoin de mécanismes et de techniques permettant d’intégrer, de fusionner et d’aligner ces données.

Mots clés :intégration ontologique, mesure de similarité, télémédecine, maladie chronique, polypathologique

Les principales causes de morbi- dité et de mortalité évoluent avec l’espérance de vie et plus de 70 % d’entre elles sont imputables aux maladies chroniques. La détection précoce, la prévention et le traite- ment des complications à long terme de telles maladies devraient contri- buer à limiter les dépenses, favoriser l’émergence de nouvelles organisa- tions plus efficaces et plus sécurisées que la pratique conventionnelle et

offrir une meilleure qualité de vie aux patients.

Ce constat a fait naître chez plusieurs constructeurs [1-5] et cher- cheurs [6-8], l’idée d’équiper les patients à leur domicile, dans le cas d’une surveillance simple ou d’une hospitalisation à domicile, de dispo- sitifs de mesures puis de transmission de paramètres vitaux selon plusieurs niveaux d’alertes vers un centre de surveillance, afin de détecter

doi:10.1684/met.2014.0449

mt

Tirés à part : A. Hajjam

(2)

précocement et de prendre en charge rapidement des situations à risque d’aggravation.

Par ailleurs, différents systèmes ont été validés dans plusieurs grandes études, incluant une méthodologie de qualité, publiée dans la littérature médicale dans des revues prestigieuses type NEJM, Circulation, Am J Med. La base de données COCHRANE, par exemple, reprend les principales études dans le domaine de l’insuffisance cardiaque dans l’article intitulé :«Structu- red telephone support or telemonitoring programmes for patients with chronic heart failure (Review) », signé par Inglis SC, Clark RA, McAlister FA, et al., et disponible dans la collection The Cochrane Library 2010, Issue 8 - http://www.thecochranelibrary.com.

Les objectifs de ces systèmes sont donc de permettre un diagnostic et une surveillance des malades à dis- tance en utilisant les technologies de communication et d’information les plus avancées. Leur technologie s’inscrit parfaitement dans l’optique des prestataires de santé qui doivent concilier à la fois qualité et continuité des soins avec des coûts de traitement toujours plus élevés tout en visant une réduction des budgets de santé [9]. Ces solu- tions de maintien à domicile tiennent compte en général aussi bien des aspects technologiques innovants que des aspects organisationnels nécessaires à la coordination des différents acteurs qui contribuent au maintien à domicile.

Ils ont été conc¸us, pour la plupart, pour le suivi d’une maladie chronique particulière et utilisent notamment un ensemble de capteurs conséquent en termes de coût. Or, la plupart des personnes âgées étant polypathologiques, souffrant à la fois de plusieurs de ces troubles chroniques liés à l’âge, il ne peut être envisagé de multiplier les sys- tèmes de suivi. Il est donc nécessaire de s’intéresser à l’interopérabilité de ces systèmes, de manière à mutua- liser le matériel commun pour réduire les différents coûts.

Dans la pratique, cette mutualisation et cette prise en compte polypathologiques seront traduites par des plate- formes de suivi forcément évolutives pouvant intégrer les connaissances relatives à différentes pathologies. Ces connaissances et les ressources utilisées sont forcément hétérogènes et rendent leur compréhension et leur ana- lyse très difficile. La préservation du sens de l’information échangée est alors un problème important. C’est ce que l’on appelle l’interopérabilité sémantique. Une définition est communément admise pour l’interopérabilité séman- tique :«Elle donne un sens aux informations échangées et s’assure que ce sens est commun dans tous les sys- tèmes entre lesquels des échanges doivent être mis en œuvre » [10-12]. Les technologies du web sémantique offrent une bonne approche pour gérer ces connaissan- ces et les processus qui y sont associés. Elles sont de plus en plus utilisées pour un large spectre d’applications au sein desquelles la connaissance du domaine est modéli- sée et formalisée (ontologie) afin de servir de support à des traitements très diversifiés (raisonnements) effectués

par des machines. L’utilisation effective d’une ontologie à des fins de raisonnement suppose que lui soit ajoutée une sémantique opérationnelle, sémantique qui précise la fac¸on dont les connaissances modélisées dans l’ontologie vont être utilisées pour raisonner et produire de nouvelles connaissances de manière automatique. Le raisonnement utilisé ici est basé sur la démarche décisionnelle du méde- cin issu de la confrontation de faits de l’interrogatoire, de l’examen clinique et des résultats d’examens complémen- taires connus, à des connaissances à la fois théoriques et empiriques construites au fur et à mesure de son expé- rience. Le projet e-Care nous a permis de valider ces différents points et l’utilisation des ontologies s’est avérée nécessaire dans une optique d’évolution de la plate-forme e-Care pour un suivi polypathologique.

Dans la section « Ontologies et concept d’intégration », nous présenterons les ontologies et les différents types d’intégration. Nous traiterons ensuite de l’hétérogénéité sémantique dans la section«Ontolo- gie et hétérogénéité sémantique ». Nous aborderons les mesures de similarité, outil essentiel pour l’alignement des ontologies, dans la section « Les mesures de similarité»avant de conclure.

Ontologies et concept d’intégration

L’ontologie est définie comme une spécification expli- cite d’une conceptualisation [13], autrement dit une ontologie est constituée par un vocabulaire spécifique utilisé pour décrire une certaine réalité, en plus d’un ensemble de propositions explicitant la signification sous-tendue par ce vocabulaire [14]. L’ontologie peut prendre la forme d’un thésaurus, de réseaux sémantiques, d’une taxonomie, d’un modèle conceptuel, d’un réper- toire de données, etc. [15]. Les ontologies sont utilisées pour la représentation des connaissances, la recherche, l’extraction, l’intégration et le partage d’information, etc.

L’ontologie exprime donc des connaissances qui sont vali- dées par une communauté donnée.

L’apport des ontologies pour la compréhension, le partage et l’intégration des connaissances n’est plus à démontrer. En effet, la recherche et la pratique dans ce domaine commencent à donner leurs fruits, surtout pour le web sémantique. Cependant, différentes problé- matiques restent encore ouvertes, d’autres apparaissent : méthode de conception des ontologies, représentation et raisonnement sur les ontologies, génération automatique d’ontologies, évolution et alignement d’ontologies, repré- sentation et persistance des données à base ontologique, systèmes d’intégration à base ontologique, conception de bases de données accessibles à partir d’ontologies, inté- gration du flou dans les ontologies, etc.

L’intégration sémantique, qui nous intéresse particu- lièrement, vise à donner une sémantique aux informations et aux services échangés afin d’assurer une bonne

(3)

interprétation. Plusieurs chercheurs ont constaté que le mot«intégration»faisait partie des solutions proposées dans la littérature et que ce mot est interprété de diffé- rentes fac¸ons. En particulier, Villalobos [16] a identifié trois niveaux différents de composition : l’intégration, la conne- xion et la coordination. Selon cet auteur, l’intégration est un niveau de la composition. Pour leur part, Chechik et al.[17] ont identifié trois types d’opération d’intégration : composition, tissage et fusion. Selon ces auteurs, la composition est une forme de l’intégration.

Les techniques d’intégration des ontologies sont sou- vent abordées par les experts du domaine de l’ingénierie des connaissances [18, 19]. Il s’agit pour eux d’un proces- sus d’élaboration d’un ensemble d’ontologies modulables et hautement réutilisables afin d’en créer d’autres plus glo- bales. Ces ontologies doivent bien entendu être modifiées et adaptées avant d’être assemblées. Dans ce cas, la fusion est intéressante car elle permet de réconcilier les diffé- rences entre les diverses sources de connaissance tout en maintenant leur autonomie.

Le terme«intégration» a donné lieu à de multiples définitions et interprétations. Parmi les définitions les plus citées dans la littérature nous proposons les suivantes :

integration: the creation of links between previously separated computer systems, applications, services or pro- cesses[20];

« un système d’intégration a pour but de fournir un schéma cohérent des données provenant de multiples sources d’informations autonomes, réparties et hétéro- gènes, de manière à faciliter aux utilisateurs l’accès et l’interrogation de ces données, comme s’ils accédaient à une seule source de données [21]».

Nous pouvons donc déduire, à partir des définitions ci- dessus, que l’intégration peut se définir comme la capacité de masquer l’hétérogénéité et de permettre la résolution des conflits entre les éléments initialement hétérogènes.

Elle peut avoir, selon les cas, comme finalité de produire un composant résultant unifié et cohérent sans duplication et sans ambiguïté sémantique.

Les différents types d’intégration

De nombreux chercheurs ont distingué plusieurs types d’intégration [22-24] : l’intégration syntaxique et l’intégration sémantique. Il existe d’autres types d’intégration comme l’intégration structurelle [25] ou encore l’intégration technique [26].

L’intégration sémantique

À travers la littérature nous retenons les définitions suivantes :

semantic integration is an active area of research in several disciplines, such as databases, information integra- tion, and ontologies[27];

semantic integration presented in AI Magazine[28], is a field in the intersection of Database and Artificial

Intelligence: schema integration in the earliest (during the 80s) attempts of the database community involves merging a set of given schemas into a global schema.

Translation between different databases or schema media- tion for a uniform query interface involves the supply of semantic matches between disparate schema elements.

Recent approaches study the manipulation of data models for model matching and integration;

semantic integration is the process by which a com- mon semantic “data model” or “object model” is created through transformation[29].

La sémantique constitue donc un aspect fondamen- tal de l’intégration, sa résolution nécessite la mise en place de mécanismes capables de comparer et reconnaître sémantiquement les similitudes et les différences entre les différents concepts manipulés.

L’intégration syntaxique

L’intégration syntaxique définit un format de représen- tation des connaissances commun dans lequel les ressour- ces sont ou peuvent être représentées. Plus l’intégration syntaxique est bien implémentée, plus nous avons un bon niveau d’intégration générale. La nature, le type et le for- mat des données sont employés dans l’opération«intégra- tion ». En d’autres termes, l’intégration syntaxique doit masquer l’hétérogénéité syntaxique. L’une des principales approches de l’intégration syntaxique est l’approche par conversion. Elle consiste à transformer la syntaxe.

L’intégration structurelle

La tâche d’intégration structurelle consiste à reforma- ter les structures des données en une nouvelle structure homogène. Cela peut être fait à l’aide d’un formalisme capable de construire une source d’information spécifique à de nombreuses autres sources d’information.

Un médiateur doit résoudre notamment l’hétérogénéité structurelle (hétérogénéité schéma- tique) et l’hétérogénéité sémantique (hétérogénéité des données) [30], ces hétérogénéités sont résolues en général par un ensemble de règles de médiation [31].

L’intégration technique

Ce type d’intégration peut être défini par la capacité de communication et d’échange d’informations entre les systèmesviaune infrastructure d’interconnexion. Celle-ci peut être physique (réseaux, protocoles, etc.) ou appli- cative (middleware, MOM, EAI, etc.). Autrement dit, l’intégration technique doit résoudre l’incompatibilité liée non seulement à l’infrastructure physique ou applicative, mais aussi à celle des technologies qu’elle implémente.

Ontologie et hétérogénéité sémantique

L’ontologie vise à constituer une représentation du monde réel qui puisse être acceptée par tous les membres

(4)

d’une communauté mais les possibilités de représen- tation sont variables et par conséquent les ontologies diffèrent malgré les efforts de normalisation. De plus, la normalisation n’est pas toujours souhaitable car la spécificité d’un domaine par rapport à un autre tient en partie à une représentation et à une conception différente des connaissances. Les différentes conceptua- lisations engendrent l’hétérogénéité des ontologies, une problématique de plus en plus explorée en raison de la multiplication de leur nombre et l’augmentation de leur accessibilité. Ces hétérogénéités limitent les possibilités d’interopérabilité entre les ontologies.

Pour traiter l’hétérogénéité sémantique, deux caté- gories d’approches à base d’ontologies pour la combi- naison et le partage des informations ont jusqu’ici été proposées :

les approches d’intégration des ontologies (mapping, fusion et alignement des ontologies). Ces approches néces- sitent souvent une intervention humaine ;

les approches de médiation des ontologies (mono- ontologie, multi-ontologies et hybride).

Le mapping d’ontologies

Le mapping d’ontologies a pour objectif la repré- sentation des correspondances entre les ontologies. Cela permet, par exemple, d’interroger des bases de connais- sances hétérogènes en utilisant une interface commune ou en transformant des données entre différentes repré- sentations [23]. De plus, Izza [22] insiste sur le fait que la correspondance entre les entités de deux ontologies est de type 1 à 1. Dans la littérature, nous trouvons d’autres définitions du mapping d’ontologies, la plus connue probablement est celle de Noy qui définit lemap- pingd’ontologies comme«un processus qui spécifie une convergence sémantique entre différentes ontologies afin d’en extraire des correspondances entre certaines entités» [27]. Ces correspondances sont exprimées en introduisant des axiomes formulés dans un langage spécifique.

Trois phases principales distinctes existent dans le pro- cessus demapping(cf. figure 1) :

la découverte dumapping; la représentation dumapping;

l’exploitation et l’exécution dumapping.

Nous pouvons citer les outils et les méthodologies les plus significatifs dans cette catégorie : ce sont ceux de Mafra [32], If-Map [33], RDFT [34], C-OWL [35] et Onto- Map [36].

La fusion d’ontologies

La fusion d’ontologies permet de créer une nouvelle ontologie, appelée l’ontologie fusionnée, qui repose sur la capture des connaissances des ontologies d’origine et les concepts supplémentaires nécessaires pour réaliser cette fusion [19, 22, 37].

O1 O2

O2

Détcouverte des mappings Représentation des mappings

Exploitation/Exécution des mappings O1

Figure 1.Lemappingdes ontologies [23].

Plusieurs approches mettant en œuvre la fusion d’ontologies ont été proposées telles que PROMPT [38], Chimaera [39], FCA-Merge [40], OntoMerge [41], et la méthode de Hakimpour [42] (figure 2).

L’alignement d’ontologies

L’alignement des ontologies a pour objectif d’établir des relations sémantiques entre différentes ontologies.

O1 O2

Fusion

O2 O1

Figure 2.Le principe de la fusion d’ontologies [23].

(5)

Il existe plusieurs définitions de la notion d’alignement d’ontologies, nous en proposons les suivantes :

«Étant donné deux ontologies O1 et O2 contenant chacune un ensemble (parfois hiérarchisé) de relations entre ces concepts, et un ensemble de propriétés de ces concepts et relations, aligner O1 et O2 consiste prin- cipalement à identifier des appariements (c1, c2) de concepts et des appariements (r1, r2) de relations d’O1 et O2. Ces appariements peuvent représenter des identités entre primitives conceptuelles (c’est-à-dire concepts et relations), mais également des subsomptions ou d’autres liens conceptuels (exclusion, incompatibilité, etc.). Les méthodes d’alignement permettent de découvrir ces appa- riements et de les évaluer en fonction de leur validité » [19] ;

«Given two ontologies, aligning one ontology with another one means that for each entity (concept, rela- tion, or instance) in the first ontology, we try to find a corresponding entity which has the same intended mea- ning, in the second ontology. An alignment therefore is a one-to-one equality relation. Obviously, for some entities no corresponding entity might exist.»[18].

L’alignement d’ontologies,consiste non seulement à découvrir des correspondances entre les ontologies mais aussi à établir des liens sémantiques entre les concepts et les relations inter-ontologies, comme l’illustre la défi- nition de Namyoun et al. [43] : « Ontology alignment

is the task of creating links between two original ontolo- gies. Ontology alignment is made if the sources become consistent with each other but are kept separate. Ontology alignment is made when they usually have complementary domains».

« L’alignement d’ontologies est le processus de mise en correspondance sémantique des entités qui le composent. Le processus est exécuté selon une stratégie ou une combinaison de techniques de calcul de mesures de similarité utilisant un ensemble de paramètres (ex.

paramètres de pondération, seuils, etc.) et un ensemble de ressources externes (ex. thésaurus, lexique. . .). Au final, nous obtenons un ensemble de liens séman- tiques reliant les entités qui composent les ontologies.

Ces derniers comprennent des relations d’équivalence, de généralisation/spécialisation, de chevauchement ou encore d’incompatibilité. De nombreux travaux ont été développés dans le domaine de l’alignement d’ontologies et portant sur les techniques de recherche de similarité ainsi que sur les outils ou sur les frameworks qui les intègrent»[19] (figure 3).

Afin de pouvoir mettre en relation des ensembles de concepts, il est nécessaire de disposer d’une mesure qui permettent d’évaluer de manière quantitative ou qualita- tive, la similitude et la dissimilitude. La notion de similarité sémantique est à la base de la définition de cette mesure.

Toutefois, il importe de distinguer entre la notion de

O1 O2 On

O1 O2 On

Alignement

Figure 3.L’opérateur MATCH [23].

(6)

relation sémantique et la notion de similarité. Deux concepts sont similaires s’ils atteignent un certain niveau de ressemblance ; des concepts dissimilaires peuvent également être liés sémantiquement par des relations lexi- cales : métonymie, antonymie, spécialisation, etc.

La fonction de similarité sémantique est définie par les éléments suivants [44] :

une représentation des concepts et le langage utilisé ; une représentation de la similarité ;

le contexte ou l’ensemble des connaissances sur l’univers de discours étudié ;

une fonction binaire de similarité.

De manière générale, la similarité entre deux entités est évaluée à partir du degré de chevauchement des entités en fonction de leurs propriétés. Pour des entités identiques, la similarité prend une valeur maximale.

Dans la suite, nous présentons un ensemble de concepts basés sur la terminologie proposée dans [19] et [45] :

processes of alignment : a matching process can be seen as a function f which tackles two ontologies O and O’, a set of parameters p and a set of oracles and resources r, and returns an alignment A between O and O’[45]. Le processus d’alignement prend en entrée deux ontologies O et O’, un ensemble de paramètres p et un ensemble de ressources r puis renvoi d’alignement a entre O et O’.

Un schéma de représentation pour ce processus est donné dans lafigure 4.

L’alignement d’ontologies, concernant la définition des correspondances entre les concepts des ontologies et les ontologies elles-mêmes ;

correspondence: a correspondence between an entity e belonging to ontology O and an entity e’ belonging to ontology O’ is a 5-tupe<id, e, e’, R, conf>where :

id is a unique identifier of the correspondence,

e and e’ are the entities (e.g. properties, classes, individuals) of O and O’ respectively,

R is a relation such as “equivalence”, “more general”, “disjointness”, “overlapping”, and holding between the entities e and e’,

conf is a confidence measure (typically in the [0,1] range) holding for the correspondence bet- ween the entities e and e’.

Une correspondance entre une entité e issue de l’ontologie O et une entité e’ issue de l’ontologie O’ est un 5triples<id, e, e’, R, conf>dont ses éléments sont définis comme suit :

idest un identifiant unique de la correspondance ;

eete’sont les entités (ex. propriétés, classes, indi- vidus) issues de O et O’ respectivement ;

Rest une relation telle que«l’équivalence»,«plus général»,«disjonction»,«chevauchement », entre les entités e et e’ ;

confest une mesure de confiance (typiquement dans l’intervalle [0,1]) de la correspondance entre les entités e et e’ ;

alignment: an alignment of ontologies O and O’ is a set of correspondence between entities of O and O’.

Un alignement des ontologies O et O’ est un ensemble des correspondances entre les entités de O et O’, un ali- gnement est le résultat d’un processus d’alignement des ontologies appelées aussi par ontologie de correspon- dance.

Dans la plupart du temps, l’activité principale d’une méthode d’alignement est de mesurer la similarité entre les entités et de calculer la meilleure adéquation entre elles.

Parmi les approches d’alignement d’ontologies, nous trouvons Anchor-PROMPT [27], [46], QOM [18] ou encore ASCO [47].

Resources Matching Parameters

O

a O’

Figure 4.Processus d’alignement. (D’après [45]).

(7)

Alignement des ontologies avec l’ontologie de background Le travail d’Aleksovskiet al.[48] a examiné les expé- riences effectuées pour adapter les portions liées par l’anatomie de CRISP (The Computer Retrieval of Infor- mation on Scientific Projects, http://crisp.cit.nih.gov/) et MeSH (The Medical Subject Headings, http://www.nlm.

nih.gov/mesh/) utilisent l’ontologie FMA (The Foun- dational Model of Anatomy ontology, http://sig.biostr.

washington.edu/projects/fm/) comme connaissances de support ou de background.

Aleksovski et al. ont effectué cinq expériences, en premier lieu un alignement direct du CRISP et MeSH est calculé, avec des méthodes basées sur une chaîne de caractère structurelle, en deuxième lieu le CRISP et MeSH sont alignés avec FMA tout en utilisant les mêmes méthodes accès sur une chaîne de caractère et structurelle.

Les alignements obtenus ont été utilisés pour induire un alignement entre le CRISP et MeSH. Les résultats obtenus par les auteurs ont montré que FMA fournit les connais- sances nécessaires pour trouver des relations.

« Using comprehensive background knowledge in form of ontology can boost the ontology matching process as compared to a direct matching of the two ontologies.» Des expériences similaires avec les mêmes résultats sont décrites dans [48, 49]. L’utilisation des ressources textuelles et lexicales, et en particulier le cas du WordNet, comme connaissances de support ou de back- ground ont été proposés par de nombreux chercheurs [46, 50-54]. Une proposition originale vient de [55]

qui analyse l’exploitation des ressources sémantiques disponibles en ligne. Dans [56] un graphe conceptuel ontologique est utilisé pour modéliser les concepts repré- sentant les termes clés extraits d’un document. Il effectue des tâches complexes de recherche de texte basé sur la sémantique des termes plutôt que sur la fréquence des termes classiques.

Par ailleurs, dans le projet Interop [57], Izza [22] a ajouté une autre technique d’intégration sémantique à savoir la transformation des ontologies que nous présen- tions dans la section suivante.

La transformation des ontologies

Ce type d’intégration sémantique aura un impact sur la structure d’une ontologie. La transformation consiste à changer la structure d’une ontologie en conservant sa sémantique, celle-ci se fait avec perte ou sans perte d’informations, qui sont baptisées respectivement, trans- formation sans perte (lossless) et transformation avec perte (lossy) [22].

La médiation des ontologies

Les ontologies sont des mécanismes très efficaces pour réaliser l’intégration sémantique entre les systèmes. La question qui s’impose est de savoir comment assurer

la communication ou plutôt l’intégration d’un ensemble d’ontologies dans un environnement multi-ontologies ?

Pour ainsi permettre à des systèmes utilisant des onto- logies différentes de s’intégrer de manière sémantique et de répondre à la question posée. Plusieurs solutions ont été proposées, et parmi ces solutions, se trouve la médiation des ontologies que nous étudions dans cette section.

Approche mono-ontologie

L’approche mono-ontologie (single-ontology approach) utilise une ontologie globale unique par- tagée entre les différents systèmes d’information. Elle fournit ainsi un vocabulaire partagé pour la spéci- fication de la sémantique. Toutes les sources sont reliées à l’ontologie globale [58]. Un exemple typique d’implémentation de cette approche est le projet SIMS [59] où un modèle indépendant de chaque source de données décrit pour ce système tout en reliant les objets de chaque source au modèle du domaine global. Les approches mono-ontologie sont les approches les plus simples à mettre en œuvre lorsque les sources de données se réfèrent à des domaines similaires. Dans le cas où les sources concernent des domaines hétérogènes, il devient difficile, voire impossible de concrétiser un engagement ontologique(figure 5).

Une autre limite importante de cette approche tient au fait que la modification des sources peut affecter l’ontologie globale [22, 58].

Approche multi-ontologies

L’approche multi-ontologies (multi-ontology approach) permet d’associer une ontologie locale à chaque source d’information distribuée [58]. Cette approche convient dans le cas où il est difficile de trouver une ontologie commune résultant des grandes diffé- rences sémantiques entre les systèmes [22]. L’exemple d’implémentation et le projet OBSERVER [60] qui s’inscrit

Ontologie globale

BD BD BD

Figure 5.Approche mono-ontologie [58].

(8)

dans cette approche. Il associe à chaque source de données une ontologie locale. L’intérêt de cette approche peut permettre de développer les sources de fac¸on indé- pendante. L’absence d’un vocabulaire commun conduit généralement à une difficulté extrême pour comparer différentes ontologies sources. Pour pallier cette difficulté, un formalisme de représentation additionnelle définissant lemappinginter-ontologie est utilisé. Ce dernier identifie sémantiquement les termes correspondants des différentes ontologies sources [22].

Approche hybride

L’approche hybride combine les deux approches pré- cédentes et utilise à la fois des ontologies locales et une ontologie partagée (parfois un vocabulaire commun) (cf. figure 6) [58]. L’ontologie partagée fournit un voca- bulaire commun et global ce qui rend les ontologies locales comparables. Cette ontologie partagée comprend les termes de base ou primitifs d’un domaine. Afin de construire des termes complexes, ces termes de base sont combinés par des opérateurs pouvant être ainsi comparés plus facilement que dans une approche multi-ontologies.

Par exemple le projet COIN [61] et le projet BUSTER [62, 31] qui utilisent respectivement la notion de contexte local, des mécanismes d’annotation et de raffinements d’une ontologie générale pour décrire localement les sources de données (figure 7).

Izza [22] et Wache et al. [58] ont présenté dans le tableau 1 les caractéristiques principales des différentes approches de médiation des ontologies.

Les mesures de similarité

La similarité, c’est-à-dire l’appréhension de la liaison entre deux concepts. Afin de pouvoir mettre en relation des ensembles de concepts, il est nécessaire de dispo- ser d’une mesure qui permet d’en évaluer, de manière quantitative ou qualitative, la similitude et la dissimilitude.

Ontologie locale

Ontologie locale

Ontologie locale

BD BD BD

Figure 6.Approche multi-ontologies [58].

Ontologie locale

Ontologie locale Vocabulaire

commun

Ontologie locale

BDBD BD BD

Figure 7.Approche hybride (adaptée de [58]).

La notion de similarité sémantique est à la base de la définition de cette mesure. Toutefois, il importe de dis- tinguer entre la notion de relation sémantique et la notion de similarité. Deux concepts sont similaires s’ils atteignent un certain niveau de ressemblance ; des concepts dissimi- laires peuvent également être liés sémantiquement par des relations lexicales : métonymie, antonymie, spécialisation, etc.

Les recherches sur ce sujet se font sur plusieurs domaines : intelligence artificielle, sciences cognitives, et ce depuis de nombreuses années. Les modèles de cal- cul de la similarité sémantique se retrouvent dans de multiples applications, avec pour but de donner à ces dernières des connaissances supplémentaires pour raison- ner sur leurs données. En bio-informatique, les bases de données génomiques et recherche des informations com- portent de très nombreuses annotations textuelles qu’il est possible d’utiliser lors de l’interrogation de ces bases en utilisant une ontologie.

Nous retrouvons plusieurs méthodes de calcul de la similarité entre les entités de plusieurs ontologies [63, 64].

Des classifications de celles-ci sont données dans [65, 66]

et [33]. Nous retenons :

les méthodes terminologiques [67, 68] : elles sont employées pour calculer la valeur de similitude des entités textuelles, telles que des noms, des métadonnées sur les noms, des étiquettes, des commentaires. . .;

les méthodes linguistiques utilisent des ressources externes (dictionnaires, taxonomies. . .) : la similarité entre deux entités représentées par des termes est calculée à par- tir des liens sémantiques déjà existants dans les ressources externes [69, 70] ;

les méthodes structurelles internes [71] : elles cal- culent la similarité entre deux concepts en exploitant les informations relatives à leur structure interne (restrictions et cardinalités sur les attributs, valeurs des instances, etc.) ;

(9)

Tableau 1. Évaluation des approches ontologiques [58].

Approche mono-ontologie Approche multi-ontologies Approche hybride

Effort d’implémentation Simple Élevé Raisonnable

Hétérogénéité sémantique Sémantique unifiée d’un domaine

Hétérogénéité sémantique Hétérogénéité sémantique Impact lors de l’ajout/

mise à jour d’applications

Besoin d’adaptation de l’ontologie globale

Ajouter une autre ontologie locale, mettre à jour l’ontologie locale associée à l’application mise à jour. Liaison avec les autres ontologies locales

Ajouter une autre ontologie locale, mettre à jour l’ontologie locale associée à l’application mise à jour

Comparaison d’ontologies Pas de comparaison d’ontologies (car il n’existe qu’une seule ontologie)

Difficile du fait qu’il n’existe pas d’ontologie partagée

Simple du fait qu’il existe une ontologie partagée

les méthodes structurelles externes ou conceptu- elles : elles se servent de la structure hiérarchique de l’ontologie et se basent sur des techniques de comptage d’arcs pour déterminer la similarité sémantique entre deux entités [72, 73] ;

les méthodes extensionnelles : elles résultent de la similarité entre deux entités qui sont notamment des concepts ou des classes tout en analysant ainsi leurs exten- sions (leurs ensembles d’instances). Chaque instance peut être représentée par un vecteur de noms et/ou de valeurs.

Des calculs de similarités entre vecteurs permettent de comparer les instances [64] ;

les méthodes hybrides : elles combinent plusieurs mesures lorsqu’une seule est insuffisante [74].

Ces méthodes sont intégrées dans des outils qui per- mettent la mise en correspondance d’ontologies. Nous retrouvons des outils qui combinent plusieurs méthodes de similarité ou qui intègrent des Frameworks implémen- tant plusieurs mesures. Ils permettent ainsi de suggérer à l’expert plusieursmappings.

Ces différentes méthodes de mesure de similarité pré- citées, notamment la méthode hybride, nous permettent de détecter les entités causant des conflits, syntaxiques ou sémantiques. Elles nous aident à accomplir les correspon- dances entre ces entités afin de résoudre ces conflits.

Discussion et conclusion

La détection précoce de toute évolution anormale de l’état d’un patient atteint d’une maladie chronique contri- bue à limiter les dépenses, favoriser la mise en place de nouvelles organisations plus efficaces et plus sécurisées que la pratique conventionnelle et offrir une meilleure qualité de vie aux patients [9]. Les systèmes de suivi à domicile de tels patients s’avèrent particulièrement inté- ressants. Cependant, la plupart des personnes âgées sont polypathologiques et il ne peut être envisagé de multiplier ces systèmes de suivi. Il est donc nécessaire de s’intéresser à l’interopérabilité de ces systèmes, de manière à mutua-

liser le matériel commun pour réduire les différents coûts.

Dans la pratique, cette mutualisation et cette prise en compte polypathologique seront traduites par des plate- formes de suivi forcément évolutives pouvant intégrer les connaissances relatives à différentes pathologies. Les équi- pements et les systèmes d’acquisitions des données utilisés sonta fortiorimultiples et différents, permettant aux méde- cins à la fois d’analyser et de suivre l’évolution de l’état des patients. Ces données collectées sont dans la plupart des cas, des données hétérogènes (images médicales, des sta- tistiques, des données de différents formats et type, etc.).

Afin d’homogénéiser ces données médicales issues de dif- férents systèmes sans duplication ni conflits et d’obtenir ainsi une seule vue d’ensemble, nous avons besoin de mécanismes et de techniques permettant d’intégrer, de fusionner et d’aligner ces données. Ces dernières années les techniques d’alignement des ontologies ont montré leurs efficacités pour exploiter les différents types, formats et natures de données par la mesure de la similarité et la détermination des liens de correspondances entre les différents concepts. Il est nécessaire et judicieux d’utiliser ces techniques pour aligner les données issues de diffé- rents systèmes puis de les intégrer et les représenter aux médecins.

L’utilisation des ontologies est nécessaire pour faciliter la structuration sémantique des buts et leurs relations ainsi que pour prendre en compte l’hétérogénéité des connais- sances dans un domaine en pleine expansion, le suivi des patients à domicile et particulièrement les patients atteints de maladies chroniques. L’utilisation croissante des ontologies, dans ce domaine, entraîne une disponi- bilité d’ontologies importante (OntoHTA, OntoPneumo, MeSH, etc.) qui nous pousse à réfléchir quant à leur réutilisation et par conséquent à leur intégration. Il est alors important de prendre en compte, d’une part, leur popularité et, d’autre part, la simplicité de leur mise en œuvre pour évaluer l’intérêt d’investiguer sur leur inter- opérabilité. Les techniques d’alignement des ontologies utilisent parfois des ontologies de support ou des ontolo- gies de background. Dans le cas de polypathologiques il

(10)

est nécessaire d’utiliser plusieurs ontologies de support, relativement à chacune des pathologies.

L’hétérogénéité produit plusieurs types de conflits, notamment les conflits détectables par la machine pouvant être syntaxiques ou structurels et les conflits sémantiques non détectables par celle-ci. Pour lever et résoudre ces conflits, notamment sémantiques, plusieurs travaux dans la littérature ont été proposés, que nous pouvons classer en deux grandes catégories :

les travaux qui se chargent de définir des normes, des standards et des modèles qui permettent l’accord entre les entités voulant communiquer, interagir ou plutôt s’intégrer entre elles. Ces dernières décident au préalable quelles sont les normes ou standards à adopter ;

les travaux qui se chargent de définir les mécanismes et les techniques déclenchés par l’intégration des entités.

Comme exemple, les techniques d’intégration des onto- logies (mapping, fusion, l’alignement, etc.) [22, 23]. Elles permettent de découvrir, de réaliser des liens ou de les transformer afin d’accomplir l’intégration entre elles. La médiation des ontologies [58] permet de faire communi- quer plusieurs ontologies car elle est souvent fondée sur un schéma global, modèle commun ou langage commun.

La deuxième catégorie nous permet particulière- ment de réaliser l’intégration sémantique en utilisant des opérations sémantiques sur les ontologies. Ce travail d’intégration va permettre, pour une plate-forme comme e-Care [75] conc¸ue pour le suivi de patients atteints d’insuffisance cardiaque, d’intégrer de nouvelles connais- sances pour un suivi polypathologique. Le domaine étant particulièrement sensible, l’intervention d’un expert de domaine dans le processus d’intégration s’avère essen- tielle pour éviter des incohérences.

Liens d’intérêts : les auteurs déclarent ne pas avoir de lien d’intérêt en rapport avec cet article.

Références

1., http://www.shl-telemedicine.com/.

2., http://www.aerotel.com/fr/.

3., http://www.bioheartinc.com/.

4., http://www.medtronic.fr/.

5., http://www.creer-hopitaux.fr/fr/home/les-reformes/tous-les- articles/?articles_id=538.

6.Schmidt SE, Holst-Hansen C, Graff C, Toft E, Struijk JJ. Detection of coronary artery disease with an electronic stethoscope. Computers in Cardiology2007.

7.Ki-Hyeon K, Ho-Jin Choi. Design of a clinical knowledge base for heart disease detection.In :CIT ’07 Proceedings of the 7th IEEE International Conference on Computer and Information Technology, 2007.

8.Alptekin O, Akan A. Detection of some heart diseases by the analysis of ECG signals.In :Signal Processing and Communications Applications Conference (SIU), 2010 (IEEE 18th).

9.Livre blanc Télémédecine 2020,«Modèles économiques pour le télésuivi des maladies chroniques», Nitem & Syntec Numérique, 2013.

10.Charlet J. L’Ingénierie des connaissances : développements, résultats et perspectives pour la gestion des connaissances médicales.

Habilitation à diriger des recherches. Paris : Université Paris 6, 2002.

11.Jouanot F. Un modèle sémantique pour l’interopérabilité de sys- tèmes d’information.In :INFORSID, 2000 (p. 347-364).

12.Williams G, Doughty K, Bradley DA. A systems approach to achieving CarerNet - an integrated and intelligent telecare system.

IEEE Trans Inf Technol Biomed1998 ; 2 : 1-9.

13.Gruber TR. Toward principles for the design of ontologies used for knowledge sharing. Int J Hum Comput Stud1995 ; 43 : 907928.

14.Guarino N. Formal ontology in information systems. In : Gua- rino N, ed. Formal ontology in information systems. Proceedings of FOIS’98. Amsterdam : IOS Press, 1998 (in press).

15.Brodeur J. Interopérabilité des données géospatiales : éla- boration du concept de proximité géosémantique. PhD Thesis.

Québec : Université Laval, 2004.

16.Villalobos J. Fédération de composants : une architecture logi- cielle pour la composition par coordination. Thèse de Doctorat.

Grenoble : Université Joseph Fourier, Grenoble I, 2003.

17.Chechik M, Nejati S, Sabetzadeh M. A relationshipbased approach to model integration. Innovations in Systems and Software Engineering2011 : 1-16. doi: 10.1007/s11334011-0155-2.

18.Ehrig M, Staab S. Qom quick ontology mapping.In :International SemanticWeb Conference (ISWC2004), 2004.

19.Euzenat J, Shvaiko P.Ontology matching, Library of Congress Control Number: 2007926257 ACM Computing Classification (1998): H.3, H.4, I.2, F.4, ISBN: 978-3-540-49611-3, Springer Berlin : Heidelberg New York, 2007.

20.Staikopoulos A, Bordbar B. Integration and interoperability in UML and Web services a comparative study of metamodel integration and interoperability in UML and Web Services. Model driven archi- tecture - foundations and applications.In :First European Conference, ECMDA-FA 2005. Nuremberg (Germany) : Springer, 2005 (ISBN: - 540-30026-0).

21.Giraldo-Gómez GL. Construction automatisée de l’ontologie des systèmes médiateurs. Thèse de Doctorat. Paris : Université Paris XI Orsay, 2005.

22.Izza S. L’intégration des systèmes d’information industriels. Thèse de Doctorat. Saint-Étienne : École Nationale Supérieure des Mines, 2006.

23.Mellal N. Réalisation de l’interopérabilité sémantique des sys- tèmes, basée sur les ontologies et les flux d’information. Thèse de Doctorat. Annecy Le Vieux : Polytech Savoie, 2007.

24.Visser U, Stuckenschmidt H, Schlieder C, Wache H, Timm I. Ter- minology integration for the management of distributed information resource. Kunstliche Intelligenz (KI)2001 ; 16.

25.Haddar N, Gargouri F, Ben Hamadou A. Une approche formelle pour l’intégration des aspects structuraux et comportementaux de représentations conceptuelles. ISDM Journal2002.

(11)

26.Touzi J. Aide à la conception de système d’information collabo- ratif support de l’interopérabilité des entreprises. Thèse de Doctorat.

Albi Carmaux : École des Mines, 2007.

27.Noy N. Semantic integration: a survey of ontology-based approaches. Standford Medical Informatics. Standford. SIGMOD Rec 2004 ; 33 : 65-70.

28.Noy NF, Sintek M, Decker S, Crubezy M. Creating semantic web contents with Protégé-2000. Intelligent Systems, IEEE2005 ; 16 : 60- 71.

29.Glushko B. Information integration and interoperability. INFO 2022008.

30.Kim W, Seo J. Classifying schematic and data heterogeneity in multidatabase systems. Computer1991 ; 24.

31.Visser U, Stuckenschmidt H. Interoperability in GIS enabling technologies. In : Ruiz M, Gould M, Ramon J, eds. Proceedings of 5th AGILE Conference on Geographic Information Science, 2002, p.

291-7.

32.Maedche A, Motik B, Silva N, Volz R. Mafra - A mapping framework for distributed ontologies. In :Proc. of 13th European Conference on Knowledge Engineering and Knowledge Management (EKAW), 2002.

33.Kalfoglou Y, Schorlemmer M. If-map: an ontology mapping method based on information flow theory. Journal on Data Semantics 2003 ; 1 : 98-127.

34.Omelayenko B. Rdft: a mapping meta-ontology for web service integration, 2003, p. 137-53.

35.Bouquet P, Giunchiglia F, Van Harmelen F, Serafini L, Stucken- schmidt H. Contextualizing Ontologies. Web Semantic: Science, Services and Agents on the World Wide Web2004 ; 1 : 325-43.

36.Angele J, Schnurr HP. Do not use this gear with a switching lever!

Automotive industry experience with semantic guides. GI Jahresta- gung2005 ; 1 : 48-52.

37.Kavouras M. A unified ontological framwork for semantic inte- gration. Cambridge, UK : International workshop on next generation geospatial information, 2003.

38.Noy NF, Musen M. Prompt: algorithm and tool for automated ontology merging and alignment, 2000 (pages 450-455).

39.Mcguinness D, Fikes R, Rice J, Wilder S. The chimaera ontology environment. AAAI Press/The MIT Press, 2000, 1123-4.

40.Stumme G, Maedche A. Fca-merge: bottom-up merging of onto- logies.In :IJCAI, 2001, 225-34.

41.Dou D, Mcdermott D, Qi P. Ontology translation by ontology merging and automated reasoning, 2001.

42.Hakimpour F, Geppert A. Resolving semantic heterogeneity in schema integration: an ontology based approach, 2001, www.ifi.

unizh.ch/dbtg/Projects/MIGI/publication/FOIS2001-final.pdf.

43.Namyoun C, Il-Yeol S, Hyoil H. A survey on ontology mapping.

SIGMOD Rec2006 ; 35 : 34-41.

44.Bisson G, Husain SF. Chi-sim: a new similarity measure for the co-clustering task.In :ICMLA, 2008, 211-7.

45.Mascardi V, Locoro A, Rosso P. Automatic ontology matching via upper ontologies: a systematic evaluation. IEEE Trans Knowl Data Eng2010 ; 5 : 609-23.

46.Giunchiglia F, Shvaiko P, Yatskevich M. Semantic schema mat- ching. In : Meersman R, Tari Z, Hacid MS,et al, eds.Proc. of CoopIS, DOA, and ODBASE 2005. Agia Napa (Cyprus) : Springer, 2005, p.

347-65.

47.Thanh Le B, Dieng-Kuntz R, Gandon F. On ontology matching problems - for building a corporate semantic web in a multicommu- nities organization. ICEIS, 4, 2004, 236-243.

48.Aleksovski Z, Klein MCA, ten Kate W, van Harmelen F. Matching unstructured vocabularies using a background ontology.In :Proc. of EKAW 2006. Podebrady, Czech Republic : Springer, 2006, p. 182-97.

49.Stuckenschmidt H, van Harmelen F, Serafini L, Bouquet P, Giun- chiglia F. Using C-OWL for the alignment and merging of medical ontologies. In : Hahn U, ed.Proc of KRMed’04, 2004, p. 88-101.

50.van Hage WR, Katrenko S, Schreiber G. A method to combine linguistic ontology-mapping techniques. In : Gil Y, Motta E, Benjamins VR, Musen MA, eds.Proc. of ISWC 2005. Galeway (Ire- land) : Springer, 2005, p. 732-44.

51.Gracia J, Lopez V, d’Aquin M, Sabou M, Motta E, Mena E. Sol- ving semantic ambiguity to improve semantic web based ontology matching. In : Shvaiko P, Euzenat J, Giunchiglia F, He B, eds.Proc.

of OM-2007, 2007.

52.Reynaud C, Safar B. Exploiting wordnet as background know- ledge. In : Shvaiko P, Euzenat J, Giunchiglia F, He B, eds.Proc. of OM-2007, 2007.

53.Bouquet P, Serafini L, Zanobini S. Peer-to-peer semantic coordi- nation. J Web Semant2005 ; 1.

54.Giunchiglia F, Shvaiko P, Yatskevich M. Discovering missing background knowledge in ontology matching. In : Brewka G, Corade- schi S, Perini A, Traverso P, eds.Proc. of ECAI 2006. Amsterdam (Netherlands) : IOS Press, 2006, p. 382-6.

55.Sabou M, d’Aquin M, Motta E. Using the semantic web as back- ground knowledge for ontology mapping. In : Shvaiko P, Euzenat J, Noy N, Stuckenschmidt H, Benjamins R, Uschold M, eds.Proc. of OM-2006, 2006.

56.Shehata S, Karray F, Kamel M. Enhancing search engine qua- lity using concept-based text retrieval.In :Web Intelligence. Silicon Valley, California : IEEE Computer Society, 2007, p. 26-32.

57.INTEROP. Deliverables of INTEROP Project, 2005, www.interop- ne.org.

58.Wache H, Vögele T, Visser U,et al. Ontology-based integration of information - a survey of existing approaches. In : Stuckenschmidt H, ed.IJCAI2001 Workshop on Ontologies and Information Sharing, 2001.

59.Arens Y, Chee CY, Hsu CN, Knoblock CA. Retrieving and integrating data from multiple information sources. Int J Intell Coop Info Sys1993 ; 2 : 127-58 [On Line] http://citeseer.ist.psu.edu/

arens93retrieving.html.

60.Mena E, Kashyap V, Sheth A, Illarramendi A. OBSERVER: an approach for query processing in global information systems base- dinteroperability across pre-existing ontologies. In : Proceedings 1st International Conference on Cooperative Information Systems (IFCIS), 1996.

61.Goh CH. Representing and reasoning about semantic conflicts in heterogeneous information sources. Phd Thesis. Cambridge (USA) MIT, 1997.

Références

Documents relatifs

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

In this paper, we propose an extension of the formalism of Distributed Description Logic (DDL) to repre- sent mappings between concepts as well as mappings between relations, and

In order to explain the roles of the main semiotic principles in meaning creation for e- learning, we start from an environment that has mechanisms for creation, communica- tion,

given a class of structures that captures the intended semantics of the signature of the domain ontology, provide an axiomatization of this class of structures such that the re-

In this paper, we propose a method to build a schema for Knowledge Graphs that leverages ontologies by integrating them in a single unified graph, enriched by an ontology

We have char- acterized contraction and revision for DLs, providing constructions, sets of rationality postulates and representation theorems for belief bases and belief sets. In

– Wikidata, the knowledge graph of Wikipedia, is natively using a graph-like data model that supports expressive annotations for capturing context [30].. Details are discussed in

User Requirements and Evaluation of Ontologies Mapping Tools An important output of this project was to specify the requirements for an Ontologies Mapping (OM) Tool. Three