Dynamisme des ontologies et gestion des conséquences

2.2 La Recherche d’Information sémantique appliquée un domaine

2.2.3 Dynamisme des ontologies et gestion des conséquences

Même si nous avons déjà abordé en partie cette problématique en 1.3.4, nous souhaitons revenir plus en détail sur la conséquence de la nature évolutive des ontologies en termes de gestion des annotations sémantiques. Malgré l’importance de telles considérations dans le contexte du Web Sémantique et de l’utilisation croissante, la littérature correspondante est relativement peu abondante.

Si les premières études en rapport se fondaient sur un parallèle entre les ontologies et les bases de données (BD), les travaux de [Noy et Klein, 2004] démontrent que les deux types d’artefacts sont bien différents : contrairement aux BD, les ontologies incluent leur propre sémantique, elles sont construites et maintenues selon un processus fortement décentralisé. De plus, une ontologie se fonde sur un modèle beaucoup plus riche que celui d’une BD (avec notamment le mécanisme des méta-classes), et elle a plus souvent tendance à impor- ter/être importée par d’autres ontologies, ce qui rend une opération d’évolution bien plus délicate (nécessité de propagation). Les instances de la base de faits ainsi que l’ensemble des artefacts de l’ontologie doivent éventuellement être modifiés de façon à éviter l’apparition d’inconsistances logiques. En outre, les auteurs soulignent la nécessité de distinguer deux types d’opérations d’évolution sur une ontologie :

– une opération élémentaire correspond à une action atomique non décomposable (e.g. modification d’un label, ajout/suppression d’un concept ou d’une relation . . . )

– une opération composite est constituée d’une liste d’opération élémentaires (e.g. fu- sionner deux concepts, affecter le domaine d’une propriété à un père du concept domaine courant . . . )

A priori, on pourrait être tenté de considérer la catégorie de changement composite comme un ajout de sucre syntaxique mais ce n’est pas le cas. En effet, modéliser une opération d’évo- lution composite comme une simple succession d’opérations élémentaires pourrait entraîner une perte inutile d’informations : par exemple, si, pour affecter le domaine d’une propriété d’attribut à un de ses pères taxonomiques, on supprimait le lien avec la propriété et on en créait un nouveau pour le père, on perdrait les valeurs d’attribut affectées aux instances de l’ancien domaine. L’article de [Noy et Klein, 2004] envisage alors systématiquement les conséquences en termes de préservation d’informations que peut avoir chaque opération

de changement sur l’ontologie. Même si l’analyse proposée s’avère pertinente, les auteurs n’envisagent pas d’autre stratégie d’évolution que celle centrée sur la préservation des don- nées : par exemple, dans le cas d’ontologies de grande taille, il peut être plus intéressant de choisir une stratégie fondée sur la rapidité des traitements associés, auquel cas, après une modification de l’ontologie, il sera peut-être plus efficace de supprimer certaines instances plutôt que d’envisager pour elles une phase de redistribution.

Un autre point intéressant pour la gestion des conséquences d’évolution concerne son degré de synchronisme avec chaque changement. En effet, on peut envisager soit une phase systématique d’adaptation de l’ontologie et des systèmes utilisateurs après chaque modification opérée par l’utilisateur, soit une phase ultérieure qui peut se dérouler avec ou sans traces des opérations effectuées précédemment. Ce dernier cas est logiquement le plus difficile puisque le système doit au préalable comparer l’ontologie après modification avec son état initial de façon à retrouver les évolutions subies par chaque artefact de l’ontologie et pouvoir ensuite corriger toute situation d’inconsistance et synchroniser toutes les construc- tions se servant de l’ontologie avec sa version actuelle. Dans cette situation, l’approche choisie se fonde généralement sur des méthodes de fusion d’ontologies. Si les travaux de [Stojanovic et al., 2002] privilégient une gestion des conséquences simultanée à chaque changement de l’ontologie, les recherches de [Luong, 2007] préfèrent envisager tous les cas de figure, arguant que dans le contexte de partage du Web Sémantique, il n’est pas rare que les ingénieurs maintenant l’ontologie ne soient pas les (seuls) utilisateurs de cette représen- tation.

Nous abordons maintenant de façon plus détaillée la contribution de [Luong, 2007], qui se préoccupe de la gestion des annotations sémantiques en réaction à une évolu- tion ontologique. Pour l’auteur, une annotation sémantique prend la forme d’un triplet

< sujet, predicat, valeur > classique en RDF. Selon une démarche heuristique, Luong as-

socie à chaque stratégie d’évolution proposée par [Stojanovic et al., 2002] une ou plusieurs stratégies de correction des annotations. Par exemple, dans le cas d’une suppression d’un concept C, si la stratégie suivie pour les instances concernées consiste à les rattacher au père

C0 de C, Luong propose de ne garder pour C que les annotations le concernant et faisant intervenir des relations pour lesquelles C0 fait partie du domaine ou co-domaine. L’ancien type des instances concernées (C) est alors remplacé par C0. Dans le cas où une trace des modifications subies par l’ontologie n’est pas disponible, Luong procède en deux temps : il détecte les annotations inconsistantes par le fait qu’elles violent une ou plusieurs contraintes de consistance (définition dans l’ontologie des concepts et propriétés intervenant dans les annotations, compatibilité entre le type d’une instance et le domaine ou co-domaine de la propriété mise en jeu dans l’annotation). Dans un second temps, un ensemble d’heuristiques permet d’émettre des hypothèses plus ou moins fortes sur la nature de l’évolution ayant amené une inconsistance au niveau de certaines annotations sémantiques. L’approche de Luong nous paraît intéressante car elle évite de recourir à des techniques trop complexes du domaine de la fusion d’ontologies. Toutefois, nous nous interrogeons quant à l’exhaustivité annoncée par Luong de ses règles. Il nous semble en effet difficile d’envisager tous les cas de figure possibles pour amener une annotation dans un état inconsistant, d’autant plus que l’effet combiné de plusieurs changements pourrait potentiellement avoir les mêmes consé- quences qu’un changement donné (ce qui accroît le risque de supprimer à tort certaines

annotations).

En guise de conclusion de cette partie, nous soulignons à nouveau le manque de littéra- ture concernée par l’influence d’une évolution d’ontologie sur les annotations sémantiques associées. L’approche proposée par [Luong, 2007] nous a paru relativement attrayante par sa simplicité dans le cas où des traces indiquent précisément l’évolution suivie par l’ontologie. Dans le cas contraire, il nous faudrait plutôt nous pencher sur certaines techniques de la fusion d’ontologies. Puisque le contexte industriel nous le permet, nous opterons en 4.1.2.3 pour une solution consistant à propager systématiquement et immédiatement tout changement dans l’ontologie au niveau des annotations sémantiques. De cette façon, les index seront toujours synchronisés à l’état courant de l’ontologie.

Dans le document Modélisation de connaissances à partir de textes pour une recherche d'information sémantique (Page 83-85)