Raisonnement automatique basé ontologie - La représentation des connaissances par les ontologie

PARTIE 3 État de l’art

3.4 La représentation des connaissances par les ontologies appliquÉes

3.4.5 Raisonnement automatique basé ontologie

Dans le cadre de l’analyse de l’état de l’art préalable à ce travail de thèse initié en 2007, j’ai eu la surprise de constater la relative pauvreté des travaux utilisant les ontologies en OWL-DL à des fins de raisonnement automatique. Qu’on ne s’y trompe pas : de très nombreux travaux depuis le début des années 2000 propose l’usage d’ontologies à des fins de classification terminologique notamment ; en revanche, c’est l’aspect « raisonnement » en situation de soins, comme dans MYCIN, qui était alors peu usité.

En 2008, Olivier Bodenreider met en évidence deux intérêts majeurs dans l’utilisation des ontologies pour les systèmes d’aide à la décision médicale (Bodenreider 2008):

- Elles fournissent un vocabulaire standard pour intégrer les données issues de différentes sources ; par exemple, un logiciel de détection d’allergies médicamenteuses doit faire le lien entre une base d’allergies et un système de codage des traitements et de leur composition.

- Elles permettent de représenter les connaissances sous une forme directement exploitable par la machine (« computable »), le souvent en association avec des règles de production.

Ce second aspect qui était très clairement minoritaire en 2008 a vu des travaux comparables aux nôtres réalisés depuis 2008, qui seront abordés en discussion.

3.4.5.1 Utilisation d’ontologie OWL pour le raisonnement automatique

En 2007, un article issu de notre équipe de recherche proposait déjà l’utilisation d’ontologies en OWL pour raisonner sur la gradation de la sévérité de tumeurs gliales d’après leur caractéristique. Ce cas d’utilisation est intéressant, car il est très proche du nôtre : l’utilisation de critères symboliques notamment doit permettre d’attribuer un grade à une tumeur donnée (Marquet et coll. 2007). Constatant qu’il s’agit là d’une tâche de

classification, les auteurs ont pris le parti d’utiliser une ontologie en OWL. Comme pour notre travail, une recherche de l’existant a été réalisée se proposant d’utiliser des morceaux de terminologies existantes, en l’occurrence le NCI-Thesaurus.

Les auteurs soulignent la difficulté de réutiliser le NCI-Thesaurus en raison de 3 critères principaux :

- les classes représentant les grades de tumeur n’y sont pas définies sémantiquement (et n’ont pas de définition formelle) ; elles ne sont donc que des dénominations vides indifférenciées entre elles pour lesquelles une inférence automatique n’est pas possible.

- La hiérarchisation dans le NCI impose que le grade de tumeur dépende du type de tumeur (« si c’est un glioblastome, donc c’est un grade 4 »), tandis que l’objectif de ce travail était d’inférer le grade d’après les caractéristiques histologiques notamment (d’après la « vraie » définition du grade, du moins la manière dont il est défini par l’expert anatomopathologiste).

- Enfin, les relations dans le NCI étaient trop générales, ce qui gênait l’inférence du fait de l’hypothèse du monde ouvert utilisée dans une ontologie OWL (cette problématique est explicitée en détail p.189).

Tous ces éléments ont nécessité la création et surtout la définition formelle de classes dans l’ontologie pour permettre le raisonnement automatique sinon impossible.

Un article de la même équipe (INSERM U936) décrit une méthode identique : extraction de certains concepts du NCIT et redéfinition formelle en OWL dans l’éditeur Protégé, effective dans la classification de diagnostic de myélomes en fonction de leur gravité (Donfack Guefack et al. 2012). Pour ce domaine différent, un constat identique du caractère inapproprié des définitions du NCIT est porté. Ce travail incluait une évaluation de la classification sur 63 patients, avec un résultat de 90% de bonne classification, les 10% d’erreurs étant majoritairement dues à des caractéristiques non représentées dans l’ontologie.

Dans un troisième article issu de l’équipe de Standford, Olivier Dameron (qui a rejoint l’équipe U936 par la suite) présentait un autre cas de tâche de classification utilisant OWL

pour du raisonnement automatique en aide à la décision. L’objectif était en fonction de la connaissance de structures anatomiques du cœur atteintes lors de blessures par balle, de déduire la sévérité des blessures d’après la propagation du sang via les orifices créés par le trajet de l’ogive, ou l’importance de l’ischémie en fonction des artères coronaires lésées et du territoire de perfusion concerné (Rubin, Dameron, et al. 2005). Les auteurs soulignent que le principal d’utiliser une ontologie OWL dans la représentation des connaissances est que ce modèle en logiques de description permet de représenter à la fois la connaissance du domaine, et celle nécessaire au raisonnement automatique, rendu possible par les raisonneurs (Racer).

De façon intéressante, ce travail suggère que la réutilisation d’éléments en vue de créer une ontologie ou par la suite entre des ontologies est possible. En effet, la partie nécessaire à la description anatomique du cœur a réutilisé avec succès la taxonomie anatomique FMA, tandis que les deux ontologies créées pour les deux types de raisonnement (hémorragie et ischémie) avaient pu se baser sur la même ontologie de domaine comme source, avec un nombre de modifications modeste (Dameron et al. 2005). La limite principale reconnue à cette méthode était ici le caractère déterministe du raisonnement, par opposition à un raisonnement probabiliste. Ce travail ne proposait pas d’évaluation formelle des résultats, mais suggère une grande efficacité de l’approche utilisant OWL-DL.

3.4.5.2 Surveillance et diagnostic automatique dans une raffinerie de pétrole

Dans un article de 2005, Chan décrit l’implémentation d’un système d’alerte utilisé dans le cadre d’une raffinerie de pétrole. Cet exemple est intéressant à deux titres :

- contrairement aux apparences, il est relativement proche de l’exemple qui nous intéresse, puisque les raffineries de pétrole au Canada sont isolées, disposent de nombreux capteurs chargés de surveiller leur fonctionnement, et que ces capteurs produisent des alertes pour lesquels l’intervention doit si elle n’est pas gérée par le personnel sur place doit être organisée de façon très couteuse sur le plan logistique (avec le déplacement d’experts).

- Ce système d’alerte utilise les ontologies pour tenter de classer les causes possibles du problème de mesure qui constate des valeurs anormales au niveau des capteurs (valeurs

numériques de pression, débit, etc.), afin de proposer des actions de vérification pour le personnel sur place ; la Figure 31 propose un exemple des résultats du système.

Figure 31 – Exemple de résultats du système de diagnostic automatique SCADA et propositions d’actions diagnostiques complémentaires. In (Chan 2005).

Chan n’utilise pas OWL à proprement parler dans le développement de son application, mais un système propriétaire ontologique de sa conception (IMT), car il estime que les limitations de la gestion des données numériques en 2005 ne permettaient pas l’utilisation d’OWL dans leur cas d’utilisation. L’approche utilisée est signalée comme effective, mais n’est pas formellement évaluée dans l’article concerné.

3.4.5.3 Surveillance et déduction des causes de contamination pour le traitement des eaux usées

L’équipe de Fujitsu en association avec une équipe de recherche en Espagne a expérimenté l’utilisation d’ontologies dans l’optimisation d’un système de contrôle du traitement des eaux usées (Ceccaroni et coll. 2004). Ce cas d’utilisation implique la

surveillance de paramètres qui peuvent s’écarter de valeurs normales et la représentation de concepts utiles (ici : contamination des eaux, présences de micro-organismes, etc.). L’utilisation des ontologies est jugée comme le premier moyen « portable » (au sens réutilisation) de représentation des connaissances. L’ontologie est ici utilisée conjointement avec des systèmes plus basiques, à base de règles ou bien à base de cas similaires. L’évaluation du système amélioré par l’ontologie met en évidence une meilleure performance dans l’interprétation des événements indésirables, et le système global présente un taux de succès de 73% à 100% (57 cas). De façon plus précise, les auteurs suggèrent que le bénéfice de l’ontologie vient :

- de l’inférence des liens entre la présence d’une espèce microbactérienne et des conséquences qui peuvent lui être attribuées (relation de cause à effet). En effet, différents états de l’eau sont possibles, y compris la présence de dépôts de diverses sortes. Par ailleurs, la détection de micro-organismes fait souvent état de plusieurs espèces ; il existe en revanche une connaissance en termes de causalité associant tel dépôt à tel micro- organisme, permettant donc via l’ontologie de déduire l’implication d’un germe particulier dans une situation donnée, sélectivement par rapport aux autres espèces.

- de l’association entre un état donné du contenu des réservoirs d’eau, et les actions correctrices pouvant être entreprises pour rétablir un état normal (décontamination contre tel ou tel germe par exemple).

Même s’ils peuvent paraître éloignés de notre approche par le thème, ces articles mettent en évidence qu’une approche utilisant des ontologies appliquées est utilisable dans des conditions de production (par analogie aux conditions de soins dans notre scénario). Dans ces exemples, des alertes issues de systèmes automatiques sont raffinées à l’aide du raisonnement ontologique, de façon à fournir un cadre contextuel plus précis, voir même des propositions de solutions.

PARTIE 4

MATÉRIEL & MÉTHODES

Dans le document en fr (Page 112-117)