Solution alternative non fondée sur OWL-DL

3.2 Formalisation d’une Ressource Termino-Ontologique en OWL

3.2.3 Solution alternative non fondée sur OWL-DL

Dans cette dernière sous-section, nous évoquons une approche de la littérature ainsi qu’une solution s’en inspirant partiellement dans le but de résoudre les problèmes soulevés par notre méta-modèle en OWL-DL, à savoir :

– l’absence de distinction entre les propriétés de classe et d’instance,

– l’impossibilité d’associer une occurrence de terme à un concept (et non à une instance de concept)

– l’impossibilité pour un terme de désigner une relation sémantique

L’approche que nous allons décrire ainsi que la nouvelle solution que nous allons propo- ser se fondent toutes deux sur le langage OWL Full avec son défaut inhérent d’indécida- bilité. Nous verrons ensuite que certains travaux parallèles essaient de définir un langage à mi-chemin entre OWL-DL et OWL Full et qui permette de garantir la décidabilité d’une ontologie dérivée tout en proposant des primitives de méta-modélisation12_.

Le méta-modèle LingInfo a été proposé dans [Buitelaar et al., 2006b]

et [Buitelaar et al., 2006a] pour le projet SmartWeb (déjà mentionné en 2.2.4.2). Partant du constat que la partie lexicale d’une RTO est classiquement trop pauvrement repré- sentée, les auteurs ont cherché à mettre au point un modèle compatible avec un format standard (à savoir RDFS et OWL Full) et capable de rendre compte d’informations lexi- cales telles que la langue, la décomposition morpho-syntaxique ou le contexte d’usage d’un terme. Pour ce faire, les auteurs utilisent le mécanisme de méta-classe : ils créent

feat:ClassWithLingInfo, une sous-classe de rdfs:Class13 avec pour particularité

de contenir un ensemble lf:LingInfo de traits linguistiques (cf plus haut). De cette

façon, chaque concept de l’ontologie (qui sera instance de feat:ClassWithLingInfo)

pourra se voir dénoté par plusieurs termes dans plusieurs langues. Soulignons au pas- sage que Buitelaar et ses collègues font eux aussi dans ces travaux l’hypothèse qu’une RTO multilingue peut s’appuyer sur une seule ontologie et plusieurs terminologies de nationalités différentes. Plus intéressant encore, en procédant de même avec les propriétés 12_{Précisons toutefois qu’à ce jour, nous n’avons pu trouver de travaux utilisant directement ce type de forma-}

lismes et se préoccupant précisément de la représentation des termes dans une ontologie.

13_{En effet, dans ce langage, le type d’une classe s’avère être aussi une classe, ce qui permet d’envisager des}

(de type attribut ou relation entre concepts), les travaux en question permettent de leur associer une partie lexicale, ce qui s’avérait impossible dans notre proposition. Par contre, le méta-modèle LingInfo n’aborde pas le problème des occurrences de terme, il se limite à exprimer qu’il existe un lien entre un concept et un terme. Il ne se préoccupe ni de savoir si dans un certain contexte d’utilisation, un terme dénote un concept plutôt qu’un autre (pas de désambiguïsation), ni si ce terme par son occurrence fait référence à un universel (i.e. un concept) ou un particulier (i.e. une instance de concept).

Figure 3.6 —Proposition de méta-modèle en OWL Full

Tout en nous inspirant du méta-modèle LingInfo, nous avons alors modifié notre proposition initiale de façon à en obtenir une version certes non décidable mais plus riche en pratique et théoriquement plus acceptable. La première étape consiste à créer deux méta- classes obir:DomainClasset obir:Termqui permettront au niveau des classes de sé-

parer les entités conceptuelles des terminologiques. Dans le but de gérer plus aisément le lien existant d’une part entre un terme et un concept (jusqu’alors représenté artificielle- ment par une restriction de la relation de dénotation) et d’autre part entre une occurrence de terme et une instance de concept (ou un concept), nous séparons les deux types d’information en une relation dénotepour le premier type et une relation désignepour le

second. Nous fixons alors obir:Termpour domaine de la relation dénote; pour le co-

domaine, nous le définissons comme l’union des méta-classes obir:DomainClass (un

terme peut dénoter un concept . . .),owl:ObjectProperty(. . . mais aussi une relation séman-

nous choisissons comme co-domaine l’union de la classeobir:DomainThing(correspon-

dant au concept le plus générique) et de la méta-classeobir:DomainClassde telle sorte

qu’une occurrence de terme pourra désigner soit une instance de concept (cas des parti- culiers), soit un concept (cas des universaux). Pour domaine dedésigne, nous créons la

classe obir:OccTypede façon à ce que tout terme possède, par héritage, des propriétés

caractéristiques à son occurrence dans un ensemble de textes : identifiant du texte, position relative dans le document, forme sous laquelle le terme est répéré. On notera que la classe

obir:OccTypen’est pas une instance deobir:Termcar ce n’est pas un terme : il n’instan-

cie aucune des propriétés caractéristiques d’un terme (forme canonique, langue, catégorie syntaxique . . . ). On obtient alors le méta-modèle représenté en figure 3.6.

Si l’on revient aux principales limites de notre méta-modèle dans sa version "compatible OWL-DL", on constate que celles-ci ont été levées dans la nouvelle version :

– il y a bien séparation entre les propriétés inhérentes à un terme et celles liées à une de ses occurrences,

– il est désormais possible de prendre en compte des phrases à portée universelle (e.g. "Un plongeur doit respecter les paliers de décompression") étant donné le co-domaine de définition de la relationdésigne,

– le méta-modèle permet d’associer un terme donné à une relation sémantique ou à un attribut de concept.

Le principal inconvénient lié à notre nouveau méta-modèle réside alors dans la néces- saire indécidabilité d’une ontologie qui se fonderait dessus. Dans le cadre de nos travaux, nous verrons notamment en 4.1.2.2 que cette caractéristique n’est pas souhaitable car nous conduisons des inférences sur toute RTO manipulée, dans le but de vérifier sa cohérence. En se plaçant d’un point de vue plus global, il faut néanmoins relativiser l’importance de cet obstacle d’indécidabilité : certains travaux n’utilisent les ontologies que pour stocker des informations et ne cherchent pas à les exploiter au cours d’un processus de raisonnement. En outre, plusieurs approches qui mènent des inférences sur des ontologies non déci- dables mettent en avant que par définition, l’indécidabilité d’une ontologie n’empêche pas de conduire des raisonnements à partir de cette ressource, elle se borne à entraîner une absence de garantie théorique qu’un raisonnement arrive à une conclusion en temps fini. Ces approches illustrent qu’en pratique, il est possible, sous certaines conditions, de raisonner avec une ontologie indécidable sans constater de blocage des raisonneurs. Enfin, nous avons récemment pris connaissance de certaines recherches visant à mettre en place un langage de méta-modélisation décidable fondé sur OWL-DL et que nous allons maintenant aborder.

Comme le prouve formellement [Motik, 2005], l’indécidabilité en OWL Full est causée par le positionnement des primitives de méta-modélisation au même niveau que les ins- tances et les classes. De façon à éviter une quelconque ambiguïté quant au niveau auquel interpréter une "méta-primitive", l’approche de [Pan et Horrocks, 2006] introduit avec OWL FA une architecture sur plusieurs couches comportant chacune leurs propres primitives de construction :

– le niveau instance (niveau 0) permet de représenter les objets du domaine modélisé, – le niveau ontologique (niveau 1) permet de modéliser les concepts usuels du domaine, – le niveau langagier (niveau 2) permet de créer des méta-ressources (concept ou pro-

– le niveau méta-langagier (niveau 3) permet de typer et de comparer les méta- ressources du niveau inférieur

Les primitives du langage sont semblables à celles disponibles en OWL, sauf qu’elles sont indicées par le niveau auquel elles appartiennent. Si on prend par exemple la définition du méta-conceptobir:Termdans notre méta-modèle en OWL Full, celle-ci s’exprime alors

en OWL FA de la façon suivante :

<fa:Class₂rdf:about="&obir;Term">

<rdfs:subClassOf₃rdf:resource="&fa;Class₂"/> </fa:Class₂>

L’avantage de ce langage ontologique est clair : en désambiguïsant systématiquement la couche dans laquelle est défini un axiome, OWL FA permet de garantir la décidabilité du langage14_{. D’un point de vue théorique, il faudrait que OWL FA dispose d’une infinité de} couches pour atteindre une expressivité aussi importante que celle d’OWL Full. Cependant, les auteurs indiquent d’expérience qu’une architecture à 4 niveaux suffit à la plupart des cas d’utilisation usuels. Etant donné la relative nouveauté de OWL FA, aucun raisonneur n’a encore été adapté afin de manipuler sa sémantique. Du fait de sa simplicité et de la décidabilité inhérente, nous sommes tout de même persuadés que ce format est appelé à se répandre, d’autant plus qu’il gère aussi facilement toutes les primitives de OWL, y compris les propriétés de type de donnée (ce dont ne sont pas capables les sémantiques proposées par [Motik, 2005]).

4

Conception d'une plate-forme de

recherche sémantique

Dans ce chapitre, nous présentons nos réflexions liées aux différentes étapes inhérentes à un processus de RI sémantique. Dans un premier temps, nous nous focalisons sur l’éla- boration d’un cycle de maintenance de la RTO (section 4.1). En effet, comme nous avons pu le souligner précédemment en 1.3.4 et en 2.2.3, une RTO modélisant un domaine et/ou une tâche spécifique(s) doit être envisagée comme un artefact dynamique : les objets modé- lisés évoluent dans le temps, certains peuvent apparaître, d’autres à l’inverse peuvent sortir du champ d’intérêt de l’utilisateur. Ce dernier point est en relation avec la problématique des influences sur le processus de modélisation que nous avons abordée en 3.1 ; les besoins applicatifs peuvent de fait fluctuer temporellement, auquel cas leur évolution peut rendre nécessaire une phase d’adaptation de la RTO. De façon logique, nous décrivons ensuite une approche pragmatique destinée à gérer les conséquences d’une modification terminologique et/ou ontologique sur les annotations sémantiques.

Dans une deuxième section, nous nous penchons plus en détail sur les processus d’in- dexation et d’interrogation sémantiques. Nous expliquons notamment comment nous uti- lisons le méta-modèle de RTO proposé au chapitre précédent pour découvrir la trace de concepts dans un ensemble de documents. Nous nous intéressons ensuite à l’appariement sémantique entre cette même collection de textes et une requête exprimée en langue natu- relle. Nous montrons à cette occasion que le processus de RI peut s’avérer bien plus qu’un simple moyen de repérer des informations décorrélées, pour peu que les méthodes d’appariement sémantique ne se bornent pas à une simple comparaison deux à deux des concepts retrouvés dans la requête d’une part et dans les documents indexés d’autre part.

Dans le document Modélisation de connaissances à partir de textes pour une recherche d'information sémantique (Page 114-119)