• Aucun résultat trouvé

2.3 Outils pour faire évoluer les ontologies à partir de textes

2.3.2 Évolution incrémentale d’ontologies

Afin de montrer comment fonctionne cette catégorie d’outils, nous présentons un scéna- rio typique en figure 2.4. Dans ce scénario, nous considérons qu’une ontologie O a été au préalable construite à partir d’un corpus de textes. L’évolution du domaine correspond à l’apparition de nouveaux documents du domaine (corpus en entrée sur la figure 2.4). Pour faire évoluer l’ontologie O, les outils de cette catégorie prennent en entrée l’ontologie O, les nouveaux documents du domaine et se basent sur des outils de TAL pour faire évoluer l’on- tologie O. Certains de ces outils autorisent l’ontographe à intervenir pour sélectionner des résultats intermédiaires et d’autres ne le font pas. L’ontologie résultante O1 est proposée à l’ontographe pour l’affiner en cas de besoin.

Extracteur de termes Concordancier Extracteur de relations Analyseur grammatical Catégoriseur grammatical Outils de TAL

Résultats des outils de TAL

Dépouillement et

interprétation des résultats Ontologie modifiée O1 Nouveaux documents du domaine --- --- --- --- --- --- --- --- --- Interventions de l'ontographe

+

Ontologie initial O

Figure 2.4 — Évolution incrémentale d’une ontologie à partir de textes.

A notre connaissance peu d’outils permettent de faire évoluer incrémentalement une ontologie à partir de textes.

1. EVOLVA11 fait partie de la plateforme de gestion d’ontologies NEON [Zablith et al.,

2009]. EVOLVA s’appuie sur des données textuelles et des ontologies du Web pour faire évoluer une ontologie. En entrée, EVOLVA reçoit des documents textuels (cor- pus de textes ou pages Web) et une ontologie. Tout d’abord, il extrait des listes filtrées de termes (mots simples). Cette liste est présentée à l’ontographe pour qu’il choisisse les termes qui seront intégrés dans l’ontologie. Ces termes sélectionnés sont alors consi- dérés comme les concepts à rajouter à l’ontologie. Pour placer ces concepts, EVOLVA fait appel aux ontologies disponibles sur le Web, au sein desquelles le système cherche une relation (directe ou indirecte) entre un concept à rajouter et un nœud de l’ontologie à enrichir. Pour sélectionner les ontologies les plus pertinentes, EVOLVA dispose d’un module qui, à base de patrons, cherche des sous-graphes communs entre l’ontologie à enrichir et celle réutilisée. Les concepts pour lesquels des relations ont été trouvées sont alors rajoutés dans l’ontologie, et mis en relation avec les concepts existants par les relations trouvées. Nous avons procédé à une évaluation d’EVOLVA avec les corpus dont nous disposons [Zablith et al., 2010]. EVOLVA s’avère performant pour la langue

anglaise, langue pour laquelle il existe de bons extracteurs de termes et qui est celle de la majorité des ontologies disponibles sur le Web. Pour le français, il existe à ce jour trop peu d’ontologies pour exploiter cette approche. De plus, nous avons remarqué lors de nos tests que, plus le domaine devenait spécifique, plus EVOLVA avait du mal à pla- cer de nouveaux concepts dans l’ontologie à enrichir car il ne trouvait pas de nouvelles relations pour les relier à un des concepts existants, alors que l’ontologie avait encore besoin d’évoluer.

2. BOEMIE (Bootstrapping Ontology Evolution with Multimedia Information Extraction)12

[Petasis et al., 2009] [Paliouras et al., 2011] est une plateforme pour l’évolution d’on- tologies et l’annotation de ressources multimédia, spécifiquement dans le domaine de l’athlétisme. Cet outil permet le peuplement et l’enrichissement d’ontologies à partir de pages Web. Pour cela, il dispose d’un modèle sémantique (Multimedia Semantic Mo- del) pour décrire des ontologies et des contenus multimédia ainsi que d’un module d’évolution d’ontologies (the ontology evolution toolkit). En entrée, ce module reçoit des pages Web qui ont été préalablement traitées pour transformer le contenu multimé- dia en textes. Pour enrichir et peupler une ontologie, ce module utilise une approche par patrons lexico-syntaxiques et une approche statistique. 4 patrons lexico-syntaxiques sont définis [Paliouras et al., 2011] : 2 patrons pour enrichir l’ontologie et 2 autres pour peupler une ontologie d’athlétisme. Des critères statistiques sont utilisés ensuite pour rapprocher les concepts et les instances découverts à l’aide des patrons [Petasis et al., 2009]. Bien que BOEMIE soit capable de faire évoluer incrémentalement une ontologie, il reste un outil très spécifique pour un domaine donné et ne peut donc pas être exploité dans un autre domaine.

3. ODIE13 14(Ontology Development and Information Extraction) [Liu et al., 2011] est un outil dédié à l’extraction d’information à partir d’ontologies et de documents issus du do- maine médical. Il permet aussi d’enrichir des ontologies médicales à partir de textes. Pour cela, le module d’évolution d’ontologies reçoit en entrée un corpus de textes en anglais. Ensuite, il utilise une approche par patrons lexico-syntaxiques et une approche statistique (basée sur un calcul de similarité et sur l’information mutuelle) pour suggé- rer de nouveaux concepts et les placer dans l’ontologie. En sortie, l’ontologie modifiée est visible dans l’interface graphique de l’outil. Comme pour BOEMIE, ODIE a été dé- veloppé spécifiquement pour un domaine particulier. Il ne peut donc pas être exploité dans un autre domaine.

Bien que ces outils permettent de faire évoluer incrémentalement des ontologies à partir de textes, ils ne remplissent pas tous les critères que nous souhaitons dans cette thèse. En effet, ODIE et BOEMIE fonctionnent uniquement pour des domaines très spécifiques. De plus ils ne traitent que des corpus en langue anglaise. EVOLVA quant à lui, permet de faire évoluer incrémentalement des ontologies en anglais. Cependant, sa forte dépendance aux ontologies en ligne est son inconvénient car EVOLVA devient non performant dès qu’il s’agit de traiter des domaines très spécifiques pour lesquels il n’existe pas d’ontologies en ligne. De plus, la faible disponibilité d’ontologies en français limite son utilisation.

12. http ://www.boemie.org/

13. http ://www.bioontology.org/ODIE-project

2.3.3 Bilan sur les outils pour faire l’évolution d’ontologies à partir de textes