• Aucun résultat trouvé

Une cartographie de domaine pour guider la construction d'une ressource sémantique

N/A
N/A
Protected

Academic year: 2021

Partager "Une cartographie de domaine pour guider la construction d'une ressource sémantique"

Copied!
4
0
0

Texte intégral

(1)

HAL Id: hal-00703173

https://hal.archives-ouvertes.fr/hal-00703173

Submitted on 1 Jun 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Une cartographie de domaine pour guider la construction d’une ressource sémantique

Sarra Ben Abbès, Haïfa Zargayouna, Adeline Nazarenko

To cite this version:

Sarra Ben Abbès, Haïfa Zargayouna, Adeline Nazarenko. Une cartographie de domaine pour guider la construction d’une ressource sémantique. 23es Journées francophones d’Ingénierie des Connaissances, Jun 2012, Paris, France. pp.100-103. �hal-00703173�

(2)

Une cartographie de domaine pour guider la construction d’une ressource sémantique

Une cartographie de domaine pour guider la construction d’une ressource sémantique

Sarra Ben Abbès, Haïfa Zargayouna, Adeline Nazarenko

LIPN - UNIVERSITÉPARIS13 & CNRS (UMR 7030) prenom.nom@lipn.univ-paris13.fr

Résumé : Dans cet article, nous proposons une méthode d’aide à l’ingénieur de la connaissance pour construire un modèle sémantique (terminologie ou ontologie) pour un domaine particulier. Cette méthode repose sur l’utilisation de ressources sémantiques disponibles pour représenter une vue synthétique du domaine à mo- déliser. La méthode proposée se fonde sur les phases suivantes : modularisation, alignement et raisonnement. Le texte sert de support aux différentes phases.

Mots-clés: ressource sémantique, modularisation, alignement, raisonnement

Construire un modèle sémantique nécessite soit : (i) partir de rien, ou (ii) réutiliser les modèles de connaissances mis à disposition (Abadie & Mus- tière, 2010; Cimiano & Völker, 2005), ce que nous appelons iciressources sémantiques. Notre travail s’inscrit dans la deuxième catégorie où le but est de réutiliser au mieux les ressources existantes. Le but de ce travail n’est pas de produire de nouvelles connaissances mais de construire une vue synthétique qui peut servir d’amorce au travail de modélisation.

Un des défis de ce travail est lié à l’hétérogénéité de ressources séman- tiques disponibles. Elles sont de différentes natures ; elles manipulent des connaissances terminologiques (thésaurus et dictionnaire) ou conceptuelles (ontologie et taxonomie). Ces ressources couvrent plus au moins partielle- ment un domaine de spécialité. Il existe des ressources qui contiennent des notions générales sur un domaine d’une activité spécifique (ex. Eurovoc) et d’autres qui sont spécifiques à un sujet donné d’un domaine particulier (ex.

l’ontologie Kaon décrivant les plantes : fleurs, couleur, longueur, etc). Le degré de granularité de la description du domaine est aussi différent d’une

(3)

IC 2012

ressource à l’autre.

Nous construisons unecartographie de domainereprésentant un ensemble de liens entre les connaissances des différentes ressources recensées. La méthode proposée s’appuie sur un texte qui décrit le domaine à modéliser.

Une première phase d’ancrage permet de lier les ressources au texte. Le principe de cette phase est de projetter les éléments des ressources sur le texte afin d’obtenir des éléments ancrés(éléments présents dans le texte).

Notre méthode se fonde sur la définition d’un modèle de cartographie qui donne une représentation homogène des connaissances de ressources qui la composent et de la richesse des liens existants entre ces ressources. Notre contribution s’appuie sur les phases suivantes :

1. Modularisation : le but de la modularisation est de faciliter l’ex- ploitation des connaissances d’une ressource par l’ingénieur de la connaissance sans le noyer par des connaissances périphériques. Pour ce faire, nous nous appuyons sur les éléments ancrés et construi- sons des îlots de connaissances (sous-blocs ou portions d’une res- source sémantique) qui délimitent le champs sémantique. Le recours au texte sert à déterminer les connaissances qui se trouvent autour des éléments ancrés tels que les fils, les frères.

2. Alignement : la phase d’alignement s’appuie sur des correspon- dances entre les éléments des ressources sémantiques. Nous nous intéressons aux correspondances de type 1 : 1 (les liensbleusdans la figure 1). Le texte sert de support pour : (i) vérifier les alignements réalisés, et (ii) enrichir les alignements entre les ressources séman- tiques. L’exploitation du texte permet de raisonner sur sa structure en s’appuyant sur des éléments de contexte (qui peut être la phrase ou le paragraphe).

3. Raisonnement: cette phase permet de réaliser des calculs aussi bien sur les correspondances que sur les îlots des ressources obtenus par la modularisation. Les correspondances entre les éléments de res- sources permettent d’exhiber des correspondances entre les îlots de connaissances (les liensvertsdans la figure 1). Les correspondances peuvent aussi permettent de revoir les contours des îlots de connais- sances en prenant en compte des informations liées au texte (distri- bution, couverture).

La cartographie de domaine obtenue en sortie de cette méthode, décrit un ensemble de correspondances entre les entités (éléments et îlots de

(4)

Une cartographie de domaine pour guider la construction d’une ressource sémantique

connaissances) des ressources avec des caractéristiques spécifiques liées au texte d’acquisition.

FIGURE1 – Exemple d’une cartographie de domaine

Références

ABADIE N. & MUSTIÈRE S. (2010). Constitution et exploitation d’une taxonomie géographique à partir des spécifications de bases de données.

Revue Internationale de Géomatique,20, 145–174.

CIMIANO P. & VÖLKERJ. (2005). Text2onto - a framework for ontology learning and data-driven change discovery.

Références

Documents relatifs

• « Le calcul de l’intermédiarité permet d’afficher les nœuds qui sont au cœur des flux d’informations. Ils sont indispensables pour diffuser l’information au

Le sonar à balayage latéral est défini comme un système d’imagerie acoustique qui fournit sur une large fauchée (25 à 500 m) des images en haute résolution de la surface du

Certaines techniques permettent d’accéder à une connaissance exhaustive de la bathymétrie et de la réflectivité du fond ; c’est le cas pour les Sondeurs Multi-Faisceaux (SMF) et

Directeur de recherche, ENGREF Montpellier Représentant de la DIREN Lorraine Comité d’organisation : Centre d’Etudes géographiques de l’Université de Metz : Jeannine

Dans le domaine de la géo-visualisation et plus précisément l’étude de la représentation d’objets sur des cartes, DiBiase (1992) et MacEachren (1994) identifient des

La conclusion de la journée fut particulièrement intéressante : Emmanuel Jaurand y aborda, dans une com- munication intitulée « Les géographes français et la carte

des distributions de nature et grandeurs différentes, quels que soient l'unité de mesure, la valeur des écart-types et des moyennes. Signalons, en dernier lieu, qu'en

Raison : Pour 1•ela boration de cette carte, on a tente de representer d!uno part, I1importance de , la population, etrangere et sa repartition par principaux groupes; d!autre part,