• Aucun résultat trouvé

DaFOE : an Ontology Building Platform From Texts or Thesauri?

N/A
N/A
Protected

Academic year: 2022

Partager "DaFOE : an Ontology Building Platform From Texts or Thesauri?"

Copied!
3
0
0

Texte intégral

(1)

Dafoe : an Ontology Building Platform From Texts or Thesauri ?

Jean Charlet

1,2

, Sylvie Szulman

3

, Nathalie Aussenac-Gilles

4

, Adeline Nazarenko

3

, Nathalie Hernandez

4

, Nadia Nadah

5

, Éric

Sardet

6

, Jean Delahousse

7

, Valery Teguiak

6

1 INSERM UMR_S 872, Eq. 20, Paris jean.charlet@spim.jussieu.fr

2 Assistance Publique Hôpitaux de Paris, Paris ;

3 LIPN - UMR 7030, Université Paris 13 - CNRS ;

4 CNRS/IRIT et Université de Toulouse ;

5 Heudiasyc CNRS/UMR 6599, Université de Technologie de Compiègne ;

6 LISI-ENSMA et CRITT-Informatique, Poitiers ;

7 MONDECA, Paris ;

1 La plateforme DAFOE

La construction d'ontologies à partir de textes fait l'objet d'études depuis plusieurs années dans le domaine de l'ingénierie des ontologies (Terminae1 Aussenac-Gilles et al. (2000), Text2Onto Cimiano & Volker (2005)). Un cadre méthodologique en quatre étapes (constitution d'un corpus de documents, ana- lyse linguistique du corpus, conceptualisation, opérationnalisation de l'ontologie) est commun à la plupart des méthodes de construction d'ontologies à partir de textes. S'il existe plusieurs plateformes de traitement automatique de la langue (TAL) permettant d'analyser automatiquement les corpus et de les annoter tant du point de vue syntaxique que statistique, il n'existe actuellement aucune pro- cédure généralement acceptée, ni a fortiori aucun ensemble cohérent d'outils supports, permettant de concevoir de façon progressive, explicite et traçable une ontologie de domaine à partir d'un ensemble de ressources informationnelles re- levant de ce domaine. C'est ce que nous proposons dans la plateforme Dafoe, en même temps que nous cherchons à favoriser l'émergence de tels outils se développant comme greon.

?ANR TLOG 06 project <http://dafoe4app.fr>

1http://www-lipn.univ-paris13.fr/~szulman/logi/index.html

(2)

TIA 2009

Un cadre méthodologique a été élaboré durant la dénition de la plateforme.

Il a été utilisé de deux façons, à savoir comme cadre permettant d'avoir une description commune des processus mis en jeu en même temps que modèle évo- luant pour être à même de tenir compte des desiderata de tous les partenaires.

Ainsi, la plateforme a diérents niveaux d'entrées, correspondant aux diérentes ressources, et diérents niveaux de sortie correspondant à des produits de plus en plus élaborés (1) des réseaux terminologiques s'organisant durant l'analyse des données, (2) un niveau termino-conceptuel où les concepts sont organisés et (3) un niveau où l'ontologie est formalisée Charlet et al. (2008). Pour valider l'architecture de méta-modélisation proposée, un premier prototype est en cours de réalisation par le LISI. C'est ce prototype dont nous ferons la démonstration.

Mots-clés : Ontologie, construction d'ontologie, bases de données à bases on- tologiques, TALN

2 DAFOE : An Ontology building plaform

The concept of ontologies, appeared in the nineties, constitute a key point to re- present and share the meaning carried out by formal symbols. Thus, the building of such an ontology is quite dicult. A way to do so is to use preexistent ele- ments (textual corpus, taxonomies, norms or other ontologies) and operate them as a basis to dene the ontology eld. However, there is neither accepted process nor set of tools to progressively built ontologies from the available resources in a traceable and explicit way. We propose a platform, Dafoe, which aims at sup- port emergence of such tools. Taking into account the dierent needs, methods and models, our proposal rely on 3 key points :1) dening a general methodo- logical framework to integrate the accomplishment of several design scenarios ; 2) dening a modeling structure allowing various templates ; 3) specifying and developping a platform able to integrate various kind of tools currently used in an autonomous way within a modeling structure. Moreover, the platform should insure persistence and traceability and allow the building of formal ontologies from the analysis of textual corpora using NLP (Natural Language Processing) annotated texts.

Keywords : Ontology, Ontology Engineering, Lexical Ontologies, Ontology- Based Database, Natural Language Processing

Références

Aussenac-Gilles N., Biébow B. & Szulman S. (2000). Revisiting ontology design : a methodology based on corpus analysis. In R. Dieng & O. Corby, Eds., Knowledge Engineering and Knowledge Management : Methods, Models, and Tools. Proc. of the 12th International Conference, (EKAW'2000), LNAI 1937, p. 172188 : Springer-Verlag.

Charlet J., Szulman S., Pierra G., Nadah N., Teguiak H. V., Aussenac-Gilles N. & Nazarenko A. (2008). Dafoe : A multimodel and

(3)

Dafoe : une plateforme pour construire des ontologies

multimethod platform for building domain ontologies. In D. Benslimane, Ed., 2eJournées Francophones sur les Ontologies, Lyon, France : ACM.

Cimiano P. & Volker J. (2005). Text2onto - a framework for ontology lear- ning and data-driven change discovery. In A. Montoyo, R. Munoz & E.

Metais, Eds., Proceedings of the 10th International Conference on Applica- tions of Natural Language to Information Systems (NLDB), volume 3513 of Lecture Notes in Computer Science, p. 227238, Alicante, Spain : Springer.

Références

Documents relatifs

We have compared the similarity among (i) the representative mapping sets from the harmonisation (see Section 2), (ii) the UMLS-based reference mappings of the track, and (iii)

This discussion paper argues that a more active involvement of the intended user community, comprising subject experts in the domain, may substantially ease gaining the

DAFOE 1 is a new platform for building ontologies us- ing different types of linguistic entries (text corpora, results of natural language processing tools, terminologies or

Mapping each element defined in the domain ontology with the semantic tags contained in the conceptual trees in order to create a set of Knowledge Acquisition Rules,

This case involves a number of return-related problems that can be found elsewhere and put in a comparative perspective; it might also shed some light on the specific

This is probably why in 2016 the ten most common sources of this disputed term included renowned environmental journals with a considerable impact (including Science of

The other common processing step for training and test sentence is to extract textual features for a pair of concepts occurring in a sentence, called feature extraction.. Currently,

Tawny-OWL can be used to generate any ontology and is not specific to the Karyotype Ontology; the latter however is our most extreme example of a patternised ontology with over