L’ontologie - La représentation des connaissances par les ontologies appliquÉes

PARTIE 3 État de l’art

3.4 La représentation des connaissances par les ontologies appliquÉes

3.4.1 L’ontologie

3.4.1.1 L’ontologie en philosophie

Le terme « Ontologie » vient de la philosophie, où il conserve un sens précis.

En philosophie, l’ontologie est une branche de la philosophie concernant l'étude de l'être, de ses modalités et de ses propriétés. Le terme se réfère avant tout à l'étude de l'être en

tant qu'être (définition proposée par Aristote), c'est-à-dire l'étude de ce qui est, mais aussi

des propriétés générales de tout ce qui est, ainsi que la qualifie son auteur dans la Métaphysique : « Il y a une science qui étudie l'être en tant qu'être, et les accidents propres de l'être » (Aristote, traduction 1840).

L’ontologie vise à développer des théories sur le changement, l’identité, la classification et l’instanciation, la causalité etc. Les questions soulevées sont par exemple : « quelles sortes d’entités existent ? », « qu’est-ce qui différencie un objet d’un événement ? », « existe-t-il des types naturels d’entités (c'est-à-dire non déterminés par l’homme) ? »...

Au début du XXème siècle, le philosophe allemand Edmund Husserl a utilisé le terme d’ontologie formelle, par analogie à la logique formelle. Le développement de l’ontologie formelle en tant que discipline philosophique vise à développer un système de catégories et de relations, afin de rendre compte de théories sur la réalité. Ces problématiques incluent la théorie du tout et des parties, l’unité, l’identité, la dépendance entre des entités, les types et leurs instanciations… Par exemple, un universel est un type, une propriété, ou une relation. Le nom d’universel s'oppose à celui d’individu, tandis que l'adjectif universel s'oppose à particulier. Un universel peut avoir des instances (ou occurrence), connues comme ses particuliers. Ainsi, le type chien est un universel, comme la propriété rouge et la relation être entre. Tout chien particulier (Lassie, Rex), toute chose rouge, et tout objet posé au sol ne sont pas des universels, mais des instances d'un universel.

3.4.1.2 Ontologies en sciences de l’information

Depuis sa première utilisation en 1967 par Mealy, Le terme ontologie a été importé dans la communauté des chercheurs en Intelligence Artificielle (IA). L’intérêt a notablement cru pendant les années 90, motivé par le besoin de créer des modélisations de domaines réutilisables dans le contexte de l’IA, et a débouché sur la création de la série de conférences FOIS (Formal Ontology and Information Systems).

Les travaux sur la logique mathématique et ses liens avec l’IA ont montré que la création de nouvelles ontologies peut permettre une forme de raisonnement automatique, par le biais de modèles computationnels (c'est-à-dire de modélisations exploitables par une machine). Le terme ontologie se rapporte alors à la fois à une théorie sur des modèles du monde, et à un composant des systèmes à base de connaissance. Certains chercheurs, se référant à l’ontologie en philosophie, ont même vu dans les ontologies computationnelles une forme de philosophie appliquée.

Le problème de la tour de Babel et de l’interopérabilité

Dans le domaine des sciences de l’information, on rencontre ce qu’on peut appeler le problème de la tour de Babel : différents groupes collectent des données en utilisant chacun leurs propres termes idiosyncrasiques afin de représenter cette information (Smith 2004). Afin de pouvoir réunir et intégrer ces sources de données, des méthodes ont été recherchées pour résoudre les incompatibilités conceptuelles et terminologiques.

Première Définition : Tom Gruber

Dans les années 1990, la recherche d’une solution permettant un standard d’interopérabilité de l’information a identifié le niveau ontologique comme une technologie clef à cet effet. C’est dans ce contexte qu’a été formulée la définition extrêmement citée de Tom Gruber,: « Une ontologie est une spécification explicite d’une conceptualisation », c'est-à-dire « les objets, les concepts et les autres entités qu’on pense exister dans un domaine d’intérêt et les relations qui les relie entre eux » (Gruber 1993). Tom Gruber précisera plus tard les points essentiels de cette définition, à savoir (Gruber 2009):

- Une ontologie définit (spécifie) les concepts, les relations, et les autres distinctions utiles dans la modélisation d’un domaine.

- Cette spécification prend la forme de définitions dans un formalisme de représentation (classes, relations, etc.) qui donne un sens et des contraintes formelles au vocabulaire et à son usage.

En d’autres termes, la connaissance d’un domaine par des experts est décrite comme une conceptualisation, généralement assez stable et partagée. Cette conceptualisation peut être modélisée à l’aide du langage et de termes adaptés : c’est ce qu’on appelle sa spécification. Lorsque cette spécification est formelle, c'est-à-dire compatible avec une interprétation logique, alors l’ontologie peut être utilisée de façon automatique comme source de connaissance.

Selon Smith, le terme « ontologie » a été utilisé pour la première fois dans les sciences de l’information par S.H.Mealy, dans un travail sur les fondations de la modélisation des données de 1967 (Smith 2004). Mealy y distingue trois royaumes :

- le monde réel

- les idées des humains au sujet du monde

- les symboles sur le papier (ou tout autre medium)

Cette approche renvoi au triangle sémiotique, décrit pour plus de détail en Annexe D.

Malgré un développement plus important à la fin du XXème siècle, ce n’est que depuis le début des années 2000 que l’utilisation d’ontologies formelles en informatique a connu un réel intérêt (ce que j’appellerai aussi : « ontologie appliquée », par opposition à la discipline philosophique).

Ontologies et systèmes de représentation des connaissances

Les ontologies appliquées répondent au besoin de représenter de façon plus formelle des concepts plus complexes que dans le cadre de simples terminologies médicales (cf Annexe E). Pour prendre l’exemple de la télésurveillance d’un pacemaker, on va vouloir décrire les concepts de patient, de dispositif médical, de pacemaker, d’alerte, etc. de la même façon, il est nécessaire d’expliciter de façon formelle qu’un défibrillateur est un type de dispositif médical, qu’une alerte est envoyée par un défibrillateur et concerne patient donné, lui-même implanté du défibrillateur. Il est nécessaire d’utiliser un formalisme de représentation des connaissances, afin de décrire les informations médicales avec la granularité (niveau de détail) la plus fine possible.

Le cœur de ces représentations formelles est une hiérarchie de concepts (ou classes), associée à une hiérarchie de relations. Un certain nombre de contraintes sont parfois associées à la manière dont les relations relient les concepts.

L’utilisation d’une hiérarchie de concepts et de relations permet une classification automatique de ceux-ci. Ainsi, maladie cardiaque est définie comme une maladie survenant dans le cœur. Comme une valve cardiaque est explicitement définie comme

faisant partie du cœur, le système infère (classe automatiquement) que la maladie de valve

cardiaque est une maladie du cœur : on dit que le concept de maladie du cœur « subsume »

celui de maladie de valve cardiaque. Cette manière de représenter la connaissance autorise donc l’inférence basée sur des informations implicites (ici, que la valve cardiaque fait partie du cœur) afin de prendre en compte l’information de façon à mimer le raisonnement humain.

De multiples manières de formaliser ces « concepts » et leurs relations ont successivement permis l’émergence de la technologie utilisée dans ce travail, à savoir le langage d’ontologie appliqué OWL-DL.

Dans le document en fr (Page 92-96)