• Aucun résultat trouvé

Réseaux sémantiques étendus pour la gestion d’informations et de connaissances dans le domaine de la Toxicologie Nucléaire Environnementale

N/A
N/A
Protected

Academic year: 2021

Partager "Réseaux sémantiques étendus pour la gestion d’informations et de connaissances dans le domaine de la Toxicologie Nucléaire Environnementale"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: lirmm-00121929

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00121929

Submitted on 4 Oct 2019

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Réseaux sémantiques étendus pour la gestion

d’informations et de connaissances dans le domaine de la

Toxicologie Nucléaire Environnementale

Joël Quinqueton, Reena Shetty, Pierre-Michel Riccio

To cite this version:

Joël Quinqueton, Reena Shetty, Pierre-Michel Riccio. Réseaux sémantiques étendus pour la gestion

d’informations et de connaissances dans le domaine de la Toxicologie Nucléaire Environnementale.

RIC: Rencontres Intelligence Collective, May 2006, Nîmes, France. 2006. �lirmm-00121929�

(2)

INTELLIGENCE COLLECTIVE : RENCONTRES 2006

Nîmes 22-24 mai 2006

C E N T R E D E R E C H E R C H E L GI 2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences Ecole des mines d’Alès, 3- Professeur Université Montpellier

Projet de recherche Cyclone

Réseaux sémantiques étendus pour la gestion d’informations et de connaissances

dans le domaine de la Toxicologie Nucléaire Environnementale

Le programme ToxNuc-E rassemble plus de 600 chercheurs du CEA, du CNRS, de l’INRA et de l’INSERM sur le thème de la Toxicologie Nucléaire Environnementale. Dans ce contexte, notre travail consiste à imaginer et mettre en œuvre de nouveaux outils, essentiellement logiciels, pour accompagner ces chercheurs répartis en 15 projets scientifiques : dans la gestion d’informations et de connaissances, et dans la quête d’informations.

Mots clés : modèles de données, gestion d’information, gestion de connaissances, web sémantique, clustering, algorithmes d’extraction d’informations, ontologies, indexation de contenus.

Objectifs

Le réseau sémantique RS construit à l’aide d’un éditeur de graphe est automatiquement combiné avec le réseau de proximité RP pour former le réseau sémantique étendu RSE. Cette architecture permet de construire facilement de nombreux réseaux sémantiques étendus : par exemple un pour chacun des 15 projets du programme ToxNuc-E.

Un algorithme de classification permet alors de traiter de nouveaux documents, interne ou externe, et d’indiquer pour chacun d’entre eux les thématiques dominantes.

Architecture

L’association des compétences et du savoir-faire de spécialistes de différentes disciplines (chimie, biologie, physique, informatique, …) est une caractéristique du programme ToxNuc-E. Ces spécialistes possèdent un langage propre, travaillent à partir de concepts spécifiques, ce qui nécessite la construction d’un référentiel commun. Celui-ci est tout à la fois le socle et le résultat de ce programme de recherche.

Pour créer ce référentiel, modèle d’informations et de connaissances, il n’existe pas à ce jour d’autre solution que de créer une ontologie de façon manuelle : ce qui compte tenu de la complexité du domaine est presque impossible. Nous proposons une alternative, les réseaux sémantiques

étendus, construits de façon automatique à partir : d’une part de petits réseaux sémantiques élaborés par un groupe de chercheurs et, d’autre

part de gros réseaux de proximités calculés mathématiquement à partir d’un ensemble de documents sélectionnés.

Problématique

Les réseaux de proximités sont actuellement construits par combinaison de trois méthodes : ACP, K-means et mots associés qui rendent compte de la proximité spatiale des termes dans le contenu documentaire. Nous envisageons prochainement d’introduire d’autre méthodes comme les Soms pour améliorer la qualité des résultats.

Notre objectif est aussi de spécialiser les réseaux sémantiques étendus (par utilisateur) par intégration des modèles utilisateurs (profils et usages en situation).

Une première série d’applications, issues directement de ces travaux sera déployée sur ToxNuc-E en fin d’année 2006.

Avancement des travaux

Université Montpellier II

Reena T.N. SHETTY1, Pierre-Michel RICCIO2 et Joël QUINQUETON3

Fig. 2 : Réseau de proximité du programme ToxNuc-E - RP

Fig. 3 : Réseau sémantique étendu du projet Arabidopsis - RSE

Fig. 1 : Réseau sémantique du projet Arabidopsis - RS

D

O

C

S

Pré-traitement

1

Algorithmes

fouille de

données

2

C O N C E P T S liens relationnels RS domainenoyau RS RP RP RS RS RP RP RS

Figure

Fig. 3 : Réseau sémantique étendu du projet                       Arabidopsis - RSE

Références

Documents relatifs

Mais l'intérêt de ce lien entre ces deux calculs tient entre autre à ce que l'on peut alors utiliser une syntaxe (initialement définie pour la logique linéaire) de réseaux de

La distinction ainsi faite entre connaissances tacites et codifiées au sein de ces différents dispositifs se double finalement d’une interdépendance dans les

Ce mémoire se compose de deux grands chapitres: le premier porte sur la recherche d'un cadre conceptuel susceptible d'éclairer et de situer l'activité de

À partir de l’ensemble des 8 prédictions élémentaires définit précédemment (LK-T, LK-I, LK-S, VMU-S1, MML-T, MML-I, MCG-T et MCG-I), nous proposons deux fusions : 1) une

L’objectif du travail n’étant pas de construire une ontologie finalisée de la toxicologie nucléaire environnementale, mais d’élaborer un modèle de

conclusion Dans ce chapitre, nous avons présenté les outils utilisés pour développer notre application de partage de ressources en utilisant les réseaux sémantiques sur un réseau

the complex nature of most of our normative practices today, and more specifically the hybrid normative nature of the legal practice itsel£ While it is true that the content

This problem was circumvented during the pseudopo- tential PW calculations on Gd(III) complexes by applying a nonlinear core correction (NLCC) [25] which consists in calculating