• Aucun résultat trouvé

2.3 Etat de l’art sur les approches de construction de Topic Maps

2.3.3 Méthodes de construction d’ontologies

De nombreux travaux ont été réalisés pour construire et maintenir des ontologies. Une

ontologie, est une conceptualisation formelle du réel partagée par une communauté à des fins

d‟échange. Techniquement, elle est représentée sous la forme d'une hiérarchie « is a » de

concepts. De nombreux autres liens sémantiques peuvent être stockés dans l'ontologie en

fonction du domaine à conceptualiser, par exemple : « partie de », « est localisé sur », « a un

effet sur », « évoque », etc. Il existe dans la littérature plusieurs méthodes de construction

d‟ontologies [Gomez-Perez et Macho, 2003] :

54

a) les méthodes de construction par apprentissage à savoir construction à partir

de dictionnaires, à partir de documents XML, à partir de documents texte, à

partir de bases de connaissances, à partir de schémas semi-structurés, à partir de

schémas relationnels, etc., [Aussenac-Gilles et al. 2000], [Agirre et al. 2000],

[Nobécourt, 2000], [Kietz et al. 2000], [Maedche et Staab, 2001], [Suryanto et

Compton, 2001], [Dietel et al. 2001], [Maedche et Staab, 2002], [Khan et Luo,

2002], [Veraldi et al. 2002], [Gomez-Perez et Macho, 2003], [Meadche et al.

2003], [Maedche et Staab, 2004], [Hernandez, 2005], etc ;

b) les méthodes de construction par réutilisation c‟est à dire par fusion

d‟ontologies existantes de même thématique ou encore par intégration

d‟ontologies de thématiques différentes [Gangemi et al. 1999], [Noy et Musen,

2000], [McGuiness et al. 2000] ;

c) les méthodes de construction par re-engineering d’une ontologie existante

[Gomez-Perez et Rojas-Amaya, 1999] ;

d) les méthodes de construction from scratch [Gruninger et Fox. 1995],

[Fernandez et al. 1999], [Schnurr et al. 2000], [Davies et al. 2002], [Sure et al.

2003], etc.

De nombreux outils sont développés pour la construction d‟ontologies, nous citons par

exemple Protege-2000

14

, OntoStudio

15

(successeur de OntoEdit), c‟est un environnement pour

la construction et la gestion d‟ontologies, CORPORUM-OntoExtract

16

, Text-To-Onto,

OntoBuilder

17

,c‟est un outil pour la création d‟ontologies à partir de sources semi-structurées,

iPROMPT [Noy et Musen, 2003] c‟est un outil interactif pour la fusion d‟ontologies,

OntoLingua

18

, CHIMAERA

19

, c‟est un outil pour la création et la gestion d‟ontologies

distribuées sur le Web, une de ses principales fonctions est la fusion d‟ontologies.

OntoSaurus

20

est un éditeur pour l‟ontologie SENSUS. Tous ces outils disposent de la

fonction d‟édition, certains offrent aussi des fonctionnalités de fusion et/ou de validation et/ou

de raisonnement.

14 http://protege.stanford.edu/ 15 http://www.ontoprise.de 16 http://www.Ontoknowledge.org/del/shtml 17 http://ie.technion.ac.il/OntoBuilder 18 http://www-ksl.stanford.edu/software/chimaera/ 19 http://ontolingua.stanford.edu/ 20 http://www.isi.edu/isd/ontosaurus.html

55

Parmi les méthodologies proposées pour la construction d‟ontologies, nous citons par

exemple : METHONTOLOGY [Fernandez et al. 1997] et TERMINAE [Aussenac et al.

2000].

METHONTOLOGY [Fernandez et al. 1997] qui s‟applique à clarifier les différentes

étapes de la construction en respectant des activités de gestion de projets (planification,

assurance qualité), de développement (spécification, conceptualisation, formalisation,

implémentation, maintenance) et des activités de support (intégration, évaluation,

documentation).

TERMINAE, la méthodologie de Aussenac et al. [Aussenac et al. 2000] qui propose

une approche pour sélectionner les concepts, leurs propriétés, les relations et leur

regroupement. Cette méthodologie a été est une composante de la plate forme RFIEC (RFIEC

est une plateforme regroupant un ensemble de résultats associé aux compétences locales

d‟équipes travaillant autour de l‟analyse et la représentation de textes (outils, méthodologies,

corpus, ressources linguistiques). Elle repose sur l‟utilisation d‟outils de traitement

automatique des langues analysant les termes de textes et les relations lexicales. Les termes

sont regroupés suivant leur contexte et facilitent la création de concepts et de relations

sémantiques. Les concepts et relations sont ensuite formalisés dans un modèle.

La méthode de Hernandez [Hernandez et Mothe, 2006], qui consiste à prolonger la

méthode TERMINAE en intégrant les ressources terminologiques qui sont les thésaurus. Ils

proposent de transformer un thésaurus en une ontologie de domaine. Les auteurs définissent

une méthode qui permet d‟extraire les éléments du schéma conceptuel de l‟ontologie à partir

d‟un thésaurus et de documents textuels. Leur approche est fondée sur un ensemble de règles

de transformation. Ces règles exploitent les liens «est plus spécifique que», «est plus

générique que», « Utiliser plutôt » (UP) et « Utiliser pour désigner » (UPD) d‟un thésaurus

pour générer les concepts de l‟ontologie, les labels associés à chacun de ces concepts et la

hiérarchie de concepts.

La méthode proposée repose sur trois étapes : La première étape vise à extraire du

thésaurus un ensemble de concepts ainsi que leurs variations lexicales. Par l‟utilisation d‟un

thésaurus, Hernandez vise à proposer un mécanisme automatique de regroupement des labels

d‟un même concept. La deuxième étape permet de structurer les concepts de l‟ontologie à

partir de la détection de relations taxonomiques et associatives dans le thésaurus et dans le

corpus. Cette étape soulève différentes problématiques de la construction d‟ontologies. L‟une

d‟elles relève de la difficulté à organiser les concepts par des relations taxonomiques. Pour

56

résoudre ces problèmes, les relations hiérarchiques entre termes du thésaurus sont utilisées

pour aider à la détection de ces relations. Cependant, un des inconvénients des thésaurus est

que le niveau hiérarchique le plus général est souvent composé de nombreux termes. Afin

d‟organiser les concepts à partir d‟un niveau d‟abstraction comportant un nombre limité de

concepts, l‟auteur propose l‟utilisation d‟une ontologie générique. Cette ontologie est utilisée

pour définir semi-automatiquement les types abstraits du domaine et structurer l‟ontologie.

Une autre problématique que fait intervenir cette étape est la détection de relations

associatives entre concepts et la désignation de ces relations sémantiques. Elle propose un

mécanisme visant à proposer de façon semi-automatique ces relations ainsi que leur label. Le

mécanisme repose sur l‟analyse syntaxique (la troisième étape) du corpus de référence qui

permet d‟extraire les syntagmes constituant le lexique du corpus ainsi que le contexte dans

lequel ils apparaissent (noms et verbes qu‟ils régissent et par qui ils sont régis). La

formalisation de l‟ontologie est réalisée à la fin de ces différentes étapes après la validation

des éléments proposés par un expert du domaine.

Parmi les outils le plus connus d‟élaboration d‟ontologies, nous citons : Text-To-Onto et

OntoBuilder.

Text-To-Onto, développée à l‟Institut AIFB de l‟Université de Karlsruhe, est une

application d‟extraction d‟ontologies à partir de corpus ou de documents Web qui permet

également la réutilisation d‟ontologies existantes [Maedche et Staab, 2001]. Text-To-Onto est

intégrée à la plate-forme logicielle KAON qui permet l‟édition et la maintenance d‟ontologies

[Bozsak et al. 2002]. KAON utilise le langage de représentation RDFS et est orientée vers

l‟utilisation des ontologies sur le Web, l‟application KAON Portal permettant la recherche et

le parcours d‟ontologies via un navigateur Web.

OntoBuilder, développée au Technion d‟Haifa, permet de bâtir une ontologie à partir

de ressources Web [Roitman et Gal, 2006]. L‟extraction de l‟ontologie à partir de fichiers

XML est suivie d‟une phase de raffinage guidée par l‟utilisateur. Onto-Builder autorise aussi

la fusion d‟ontologies extraites de différents sites Web.