• Aucun résultat trouvé

Caractérisation sémantique et accès aux ressources distribuées dans le SI d'AnaEE-France

N/A
N/A
Protected

Academic year: 2021

Partager "Caractérisation sémantique et accès aux ressources distribuées dans le SI d'AnaEE-France"

Copied!
25
0
0

Texte intégral

(1)

HAL Id: hal-02801643

https://hal.inrae.fr/hal-02801643

Submitted on 5 Jun 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Caractérisation sémantique et accès aux ressources

distribuées dans le SI d’AnaEE-France

Christian Pichot, Nicolas Beudez, Cécile Callou, Andre Chanzy, Philippe

Clastre, Lucile Greiveldinger, Francois Lafolie, Arnaud Leturgie, A. Maire,

Chloé Martin, et al.

To cite this version:

Christian Pichot, Nicolas Beudez, Cécile Callou, Andre Chanzy, Philippe Clastre, et al.. Caractéri-sation sémantique et accès aux ressources distribuées dans le SI d’AnaEE-France. IN-OVIVE’15: 3ème atelier INtégration de sources/masses de données hétérogènes et Ontologies, dans le domaine des sciences du VIVant et de l’Environnement, Jun 2015, rennes, France. �hal-02801643�

(2)

Caractérisation sémantique

et accès aux ressources distribuées

dans le SI d'AnaEE-France

Atelier IN-OVIVE

IC-2015

29 juin 2015 – Rennes

C. Pichot,

N. Beudez, C. Callou, A. Chanzy, P. Clastre, L. Greiveldinger, F. Lafolie, A. Léturgie, A. Maire,

C. Martin, D. Maurice, N. Moitrier, G. Monet, H. Raynal, A. Schellenberger, R. Yahiaoui

(3)

AnaEE-France

dédiée à l'étude des

écosystèmes continentaux

Une infrastructure nationale

(4)

L'infrastructure AnaEE-France

Plateformes Expérimentales

Nœud 1

Ecotrons

Nœud 2

Semi-naturel

Nœud 3

In natura

Microbiologie

environnementale

Laboratoire

mobile

Instrumentation

partagée

Platforme

Web

Données

Metadonnées

Plateformes

modélisation

Nœud 4

Instruments Analytiques

Nœud 5

Information System

A

ct

iv

ité

s c

en

tra

le

s d

’A

n

aE

E

-F

S

ta

nd

ar

dis

ati

on

d

es

p

ro

to

co

le

s e

t

de

s m

es

ur

es

V

eil

le

te

ch

no

lo

giq

ue

S

er

vic

es

é

co

lo

giq

ue

s e

t s

na

rio

s

de

la

b

io

div

er

sit

é

(5)

..des bases de données

et plateformes de modélisation

Bases de données

observ./expe.

Plateformes

de modélisation

SI des SOERE

(INRA)

SI des experimentations à façon

(CNRS-MNHN)

(6)

Contexte et enjeux du SI

Une infrastructure distribuée pour l'observation/expérimentation :

sur des écosystèmes divers

à plusieurs échelles

comprenant la gestion des données

offrant des services de modélisation

Un objectif de cohérence globale par

la structuration, l'harmonisation

le développement d'environments de mutualisation

un système d'information basé sur l'interopérabilité

Nécessitant notamment :

la définition et partage d'un vocabulaire

l'identification et qualification des ressources (via métadonnées)

le développement des services d'interopérabilité

(7)

Plateformes

de modélisation

Portail d'accès

BDD – Plateformes - Indicateurs

Base de données

observ./expe.

Organisation du SI

Portail soumission

des projets

(8)

Plateformes

de modélisation

Autres ressources d'AnaEE-F

Plateformes expérimentales

Projets de recherche, équipes, instituts....

Portail de

métadonnées

'découverte'

Portail d'accès

BDD – Plateformes - Indicateurs

Base de données

observ./expe.

Portail soumission

des projets

Geocatalogue

Métadonnées /

Données

Saisie manuelle

automatique

(9)

Interopérabilité entre éléments du SI

- Directe par webservice

- Généralisée via la sémantique

(10)

Interopérabilité sémantique

Objectif

- Partager un référentiel sémantique de domaine ( 'objets' et 'relations')

- Annoter les ressources (BDD, plateformes...)

- Requêter en utilisant le référentiel

Mise en oeuvre

* Vocabulaire de référence

=> thésaurus AnaEE-France

* Ontologie basée sur OBOE (Observations en écologie)

* Outils partagés de gestion des référentiels sémantiques et d'annotation

* Intégration dans le portail d'accès aux ressources

(11)

CERES Keywords

Environmental Applications Reference

Thesaurus (EARTh)

Environmental Glossary (St John's University)

GEneralized Multilingual Environmental

Thesaurus (GEMET)

Glossary of leaf shapes (University of Florida)

International Glossary of Hydrology (UNESCO)

LTER Controlled Vocabulary

Plant Anatomy Glossary (University of Rhodes

Island)

U.S. Geological Survey (USGS)

Units (EnvThes3)

Thésaurus FRB

Agrovoc (FAO)

Un thésaurus...

Thésaurus AnaEE-France

Vocabulaire contrôlé et organisé

~ 12 thésaurus

existants

Synthèse des vocabulaires

des SI d'AnaEE-France

...et par le bas

...par le haut

(12)

Outils : poolparty -> VocBench

(RDF/SKOS)

(13)

...le géocatalogue métadonnées AnaEE-F

1) Conformité avec directive INSPIRE

2) Mots clés issus de

thésaurus

3) Interopératibilité et moisonnage

(-> géocatalogue national)

(14)

L'ontologie OBOE

The ontology separates observations

from the entity being observed:

the observation has a measurement

while the entity has characteristics,

and the measurement is then of that

characteristic.

(15)

L' « observation » dans OBOE

Observations can occur within a context, which in turn is an observation;

this property is transitive.

(16)

OBOE dans le contexte d'AnaEE-F

* Approche basée sur des études de cas

Physico-chimie des lacs

plateforme de modélisation

portail d'accès

* Modélisation des données sur la base d'OBOE

(core et extensions)

* Nouvelle extension pour les besoins d'AnaEE-France

* Mise en place d'outils partagés

(17)

Modélisation des données

(physicho-chimie des lacs)

D'une BDD relationelle...

(18)
(19)
(20)

Stockage des triplets RDF dans un tripleStore :

- Allège la charge pesante sur la BD-R

- Duplication des données !

- Triplets RDF désynchronisés avec la BD-R

Mapping BDD<->ontologie à requêtage à la volée :

- Charge supplémentaire pour la BD-R

- Triplets Synchronisés avec la BD-R

Annotation et stockage des données

(21)

D2RQ

Google

Refine

Web Karma

(22)
(23)

Publication

Requêtage SPARQL

( Twinkle )

(24)

- Finalisation de l'intégration des cas d'étude

- annotation des sources autres que BDDR (PF modélisation)

- valorisation au niveau du portail d'accès aux ressources

- contrôle du volume de données renvoyées ?

- annotation des sources autres que BDDR ?

- Consolidation du thésaurus / extension de l'ontologie

- Extension de l'approche sémantique hors cas d'étude

- Utilisation hors portail d'accès aux ressources

- Valorisation au-delà de l'infrastructure AnaEE-F

(25)

Références

Documents relatifs

La prise en compte d’informations sémantiques sur le domaine pour l’annotation d’un élément dans une page web à partir d’une ontologie suppose d’aborder conjointement

Nous avons présenté un système d’annotation sémantique fondé sur une analogie entre la représentation des connaissances d’un domaine par des concepts définis dans une ontologie

L’annotation des documents en utilisant des ontologies de domaine est pratiquée dans le domaine biopuces [5], le domaine médical, Lylia [6] a utilisé la

Nous définissons C un ensemble de concepts partiellement ordonnés dans une ontologie, D un ensemble de documents indexés par une fonction index : D → P(C) où P désigne une

Service Information, Orientation et Insertion Professionnelle Faculté des Lettres.3.

112 3.16 Prol d'un doument textuel : struture logique, ontenu et

Valorisation des données Expérimentales : Les Chantiers de l’Infrastructure AnaEE- France.. Nouveaux défis de Modélisation pour l’Agro-écologie, Feb 2014,

Cinq services de recherche sont ensuite utilisés simultanément pour trouver des entités candidates à partir du contenu des cellules : l’API Wikidata, le moteur Cirrus Search de