A partir de la séletion d'une lasse d'une ontologie, nous pouvons aéder à sapopulation
(si elle existe)via l'onglet omposants.La gure4.34présentelapopulationde lalasseVis
hexagonale à rondelleélastique.
Cette population est onstituée d'un ensemble d'instanes représenté sous une forme
tabu-laire.Chaqueolonnedelatableorrespondàunepropriétépriseparmilespropriétésdisponibles
(appliables) delalasseséletionnéedel'ontologie.Chaqueolonnepossèdeunentête dérivant
lapropriété. ontoweborelapossibilitédepasserduniveaudonnéeauniveauonnaissane
(a-èsàlasémantiquedesdonnéesdéniparl'ontologie)par desentêtes deolonnesativesqui
sontdeslienshypertextespermettantd'aéderàlapartiedesriptivedelapropriétéreprésentée
par les symboles apparaissant danslesellules d'uneolonne delatable.
Notons que les instanes sont ahées par pages et que desboutons de navigation situésà
droite immédiatementaprèsletableaupermettent deparourirlespages.L'utilisateurpeuttrier
les données(ordreroissant/déroissant)suivant haqueolonneethaqueinstaneest
manipu-lable aumoyen d'unensemble de fontion aessibles sous laforme de boutons immédiatement
après letableau de valeurs. Lesationsdisponiblessont :
Editer : permet d'aher dans une fenêtre indépendante les valeurs des propriétés pour
une instanedonnéeen letureseule;
Dupliquer:permetd'ajouterune nouvelle instane à partir d'uneinstane existantedont
Fig. 4.34 Visualisationde l'extension d'unelasseave l'interfae ontoweb
elle estprohe(en terme devaleursdespropriétés) par modiationde ette dernière;
Ajouter:permetlaréationd'unenouvelleinstaneparsaisiedesvaleursdesespropriétés;
Supprimer:permetde supprimerl'instane séletionnée;
Tout supprimer :permet desupprimer toutes les instanes delalasse ourante.
Enn, notons que des odes de ouleurs ont été utilisés an de disriminer les types de
propriétés.CesodesdeouleurssontexpliitésdansunefenêtreaessiblevialelienLégende.
La gure 4.35 présente la fenêtre de visualisation d'uns instane partiulière. Cette fenêtre
les fontionsde miseà jour desvaleursdespropriétés de l'instane ouenore de suppressionde
l'instane.
Fig.4.35 Visualisation d'uneinstanepartiulière d'unelasse ave l'interfae ontoweb
6 Synthèse sur l'implémentation d'ontodb2
Lagure 4.36synthétisel'ensemble desdéveloppementseetués pourdévelopperle
proto-typeontodb2pourlagestionsdesontologiesetdesdboassoiéesetsesdiérentesapi.Alabase
deesapi,nousavonsl'apiOntoLibonstituéedespojomanipulésparHibernatepourlapartie
ontologie, l'api opengisLib d'extensiondes types de donnéesspatiaux,et lapartie méta-shéma
etl'apiExtension pourlamanipulationde lapartiedonnées. Cesapisont utiliséesàejourpar
l'interfae ontoweb etpar la nouvelle version de l'interpréteur de requête ontologique ontoql
en ours de développement sur ontodb2. La gure 4.36 réapitule l'ensemble des modules qui
ont été développés. Dans ette gure, les modules non réalisés et/ou non enore ahevées sont
grisés.
format P21 Ontologie au format rdf/xml
Fig. 4.36 Réapitulatifdesmodules du prototype de bdboontodb2
Conlusion
Nous avons présenté, dans e hapitre, l'implémentation du prototype de bdbo ontodb2.
Ce prototype avait pour objetif de montrer lafaisabilité de développerdes systèmes de bdbo
restant exible et eae au niveau de l'ontologie manipulée. Ce prototype met en ÷uvre des
solutions dénies lors de laphasede spéiation réalisée auhapitre préédent.
Unedesaratéristiquesprinipaled'ontodb2estd'êtrefondéesurunformalismed'ontologie
exible.Pour assureret objetif,lasolution quenousavonshoisia étéd'utiliser desrèglesde
transformationsystématiquesassoiéesàdestehniquesd'idm,oùlesdéveloppementssont
réali-séesauniveau méta-shémapouronevoirdesmodulesindépendantsduformalismed'ontologie
quis'adaptent auxévolutionsde edernier. Nousavonsainsipu mettreen÷uvre ettesolution
pour la générationde lastruture destablesde la partie méta-shéma etde lapartie ontologie,
ladénition d'une api java de gestion de esdeux partieset, l'alimentation de lapartie
méta-shéma par leméta-shéma lui-même et leformalisme d'ontologie et enn,l'alimentation de la
partie ontologies par desontologies existantes.
Laseonde aratéristique d'ontodb2 estla gestiondes dbo par des vues et, la
représenta-tion danslapartie donnéeuniquement desdbo anoniques. Trois diultésprinipales ont été
renontrées lorsde miseen ÷uvrede lapartie données :(1)lagestiondes opérations lassiques
de manipulationdesdonnéessurles vues,(2)latransformation dedbo non anoniquesen dbo
anoniques,et,(3)laportabilitédelapartiedonnées. Conernantlapremière diulté,lesgbd
postgresql ne prenant pasautomatiquement en harges les opérations surles vues, nousavons
dénidesrèglesdegestionesopérations.Conernant laseonde diulté,nousimportons
uni-quementles dboanoniquesetlesdbo nonanoniquesdeslassesowllite,dontladesription
estomplète etdont lalassede baserespeteleadred'hypothèsesque nousavonsdénipour
ontodb2. Enn onernant la troisième diulté, destravaux en ours au laboratoire étudient
l'utilisation d'Hibernate pour mettre à jour dynamiquement à la fois les hiers de mapping
et les pojo d'aès et ei, sans avoir besoin d'arrêter l'appliation. Notons que ette solution
permettrait également d'étendredynamiquement leformalisme d'ontologie.
Nous avons également développé une interfae graphique de type Web qui ore une
ergo-nomie masquant toutelaomplexité non seulement du formalismed'ontologie sous-jaent, mais
aussidesonimplémentationdanslesystèmedegestiondebasesdedonnéesible.Cetteinterfae
permet à un utilisateur de gérer les ontologies etdes dbo. Cette interfae demande toutefois à
être omplétée. Il n'est par exemple pas possible à partir de ette interfae de dénir
l'expres-siond'unelassenon anonique.Demême,ette interfae pourraitêtreétenduepour permettre,
par exemple, lorsqu'unun nouvel attribut est ajouté à une entité du formalisme d'ontologie la
visualisation de e dernier. Parmi les développements ultérieurs, il serait intéressant de générer
automatiquement les formulaires del'interfae utilisateur àpartir despojosutilisés par
Hiber-nate sur la partie ontologie. De nombreux développements peuvent enore être eetués pour
failiter la personnalisation du formalisme d'ontologie. Ce qui onvient néanmoins de noter est
quel'approhed'idmutiliséepermet,pourbeauoupdedéveloppements,deleseetuerdefaçon
générique e quene permettent,à notreonnaissane, auunedesbdbo existantes.
Nousallonsdanslehapitresuivantétudierlavalidationopérationnelleduprototypeontodb2.
Validation
Appliation : Raisonnements
numériques sur les ensembles
partiellement ordonnés
Sommaire
1 Raisonnements Numériquessur des EnsemblesPartiellementOrdonnés159
1.1 ExempleMotivant. . . 159
1.2 Représentationdedonnéesgéographiques. . . 162
1.2.1 Représentationdestypesspatiaux . . . 163
1.2.2 Représentationdesdonnéesd'indexation . . . 163
1.3 Traitementeaedesrequêtes . . . 163
2 FormalisationProposée . . . 163
2.1 RaisonnementsurlesFermeturesTransitivesPropagées. . . 164
2.2 Tehniquesd'ÉtiquetageTopologiqueset Géométriques. . . 164
2.2.1 Tehniques d'étiquetagestopologiques . . . 164
2.2.2 Tehniqued'étiquetagegéométrique . . . 166
3 Coneption et Implémentation . . . 167
3.1 Extensiondelapartieformalismed'ontologiesdesbdbo . . . 167
3.2 ReprésentationdesInstanes . . . 170
3.3 TraitementdesRequêtes . . . 170
4 Appliation à l'ontologiedu og dans la bdboontodb2 . . . . 170
4.1 Ontologie. . . 171
4.2 Données . . . 173
4.3 Traitementdesrequêtes . . . 173
Introdution
Nous avons souligné au hapitre 2, l'existene de besoins spéiques pour de nombreuses
d'appliations quinéessitaientuneexibilitédemodélisationàlafoisduformalismed'ontologie
etdu systèmede typesaessibles dansles bdbo. Nous avonsdéjà présentéomme appliation
leasdesdonnées géographiques (f.setion 2.2.3 duhapitre 3).
Nous présentons ii la apaité d'ontodb2 à répondre à ette exigene en traitant de
fa-çon omplète le as de l'utilisation des données géographiques pour indexer des douments.
L'approhe que nous illustrons onsiste à utiliser les apaités des bases de données à traiter
eaementlesrequêtesnumériquesetalphanumériquesand'indexer desopérationsde
raison-nements qui sinon demanderaient un raisonnement dédutif lors de l'exéution d'une requête.
Ainsi, notreapprohe onsiste à:
exploiterlareprésentationontologiquedisponibledansunebdbopouronnaîtreles
ara-téristiquesdespropriétés de type objet(transitive,symétrique, ordre,
. . .
);enrihir les instanes ave de nouvelles valeurs de propriétés jouant le rle d'index pour
remplaerleraisonnement dédutifparletraitement derequêtes numériques(ou
alphanu-mériques).
Par exemple, lorsqu'une propriété de type objet
π
est dérite en utilisant les aratéristiques d'owl2 asymmetri et transitive, dénissant ainsi un ordre (≺
) strit qui, en plus estarbo-resent ('est àdire que legraphe de larelation estune forêt), alors et ordrearboresent peut
être représentépar unintervalle numérique [3℄.
Ainsi,(1)lorsqu'uneinstaneprésentantunevaleurpourlapropriété
π
estinséréedanslabasede données, deux valeurs de propriétés additionnelles (bound1, bound2) sont automatiquement
alulées parlesystème.Cesvaleursdepropriétésreètentl'ordrearboresent,'est-à-direque:
x
≺
y⇔
bound1(y) <bound1(x) <bound2(x) <bound2(y).Ensuite, (2)lorsquedesinstanes d'annotation pluspetitesqu'une instanedonnéesont
reher-hées, l'interpréteurde requêtes aèdeàl'ontologieetrééritlarequête réursiveutilisant
π
enune requêtenumérique utilisant bound1 etbound2. Cetype d'indexn'est pasnouveau.En eet,
plusieursapprohes[3,14℄,onnuessouslenomd'étiquetage (labeling),ontproposédealulerla
fermeture transitive de relations enles indexant pardeslabelsnumériques oualphanumériques.
Cependant,esapprohessontsouventodéesendurdanslesystèmedegestiondedonnéespour
desrelations prédénies tellesque lasubsumption delasses.
Nousproposonsdansehapitre,desextensionsauxformalismesd'ontologiesquipermettent
(1)d'identierlessituationsoùetyped'approhepeutêtresuiviet(2)del'implémenter
dynami-quement lorsqu'uneontologie esthargée. La formalisationproposée intègre diversestehniques
d'étiquetage permettant de raisonner surles diérents types de relations réursives d'inlusion.
Cei reouvre le raisonnement sur les requêtes taxonomiques, très utilisé dans l'annotation de
ressoures. De plus, nous montrons que ette formalisation peut également être utilisée
ea-ement pour les strutures de dag (graphe orienté aylique) employées dans les appliations
spatialesettemporelles.
L'organisation de e hapitre est lasuivante. Dans lasetion 1, nousdérivonsles objetifs
à atteindre au travers d'unexemple qui illustre le besoin de représentation desobjets spatiaux
et, présentons les requêtes types auxquelles doivent répondre le système. Nousproposons dans
la setion 2, une formalisation du problème à résoudre. La setion 3 présente en détail notre
proposition pour étendre les systèmes de bdbo an de les doter d'une solution eae de
re-présentation et de traitement des objets spatiaux. Notre proposition utilise les tehniques de
labelling topologiques et géométriques pour permettre la gestion des requêtes portant sur des
données spatiales sans avoir à faire appels aux fontions spéiques disponibles par les
exten-sions spatiales des sgbd. La setion 4 présente la mise en ÷uvre de notre solution réalisée sur
ontodb2. Nousterminons par une onlusion.
1 Raisonnements Numériques sur des Ensembles Partiellement
Ordonnés
1.1 Exemple Motivant
Le but du projet e-WokHub 34
est de gérer la mémoire de plusieurs projets d'ingénierie sur
laaptureetlestokagede
CO 2
.Enpartiulier, unobjetifimportant estd'améliorerlaqualité desreherhesdedoumentssuresujet.L'approhesuivieonsisteàutiliserdesannotationsdedoumentsdénies, autantquepossible,demanièreautomatique. Lesystèmee-WokHub viseà
permettre derépondreàdesquestionspratiquessurles sitesdestokagedu
CO 2
,enretournant par exemple, une liste de douments pertinents (annotés par ertains onepts et fournissantdes informations sur tout ou partie d'une zonegéographique donnée) pour failiter la tâhe de
séletion d'unsite.
Dans le adre du projet e-Wok Hub, nous nous sommes en partiulier intéressés à l'aspet
géographique desannotations.
Une ontologie existante appelée og 35
, qui dérit les zones géographiques françaises est
utiliséepour annoterlesdouments.Dansette ontologie, leszonesdéritesorrespondent
au déoupage administratif de la Frane. Ces zones géographiques administratives ont la
struture d'uneforêt.
Unautreontologie, og+,étendleogenintégranten plusdeszonesgéographiquesnon
administratives. Les instanes de zones géographiques de ette ontologie dérivent ette
fois-i nonplus une forêt,mais undag.
Leservied'annotationsémantiqueduprojetutilisel'ontologieog 36
dériteen owl,pour
identier, dansun doument fournien entrée, lestermes référençant desonepts de l'ontologie
og. Ces termes sont utilisés pour produire en sortie, desannotations au format rdf/xml. La
gure5.1 37
,illustreleproessusd'annotationautomatiquedesdouments.Apartir de
l'ontolo-gieog,etdel'extraitdedoumentfournitenentrée,letermeIle-de-Frane estidentiédansun
segment dudoument.L'annotation produiteen sortieduservied'annotation déritlefaitque
la segment d'uri wl ://myDoument#1inriaGeo_1 du doument en entrée est géoloalisé
par lazone géographique d'urigeo :reg_11 qui orrespondà larégion Ile-de-Frane dans
l'ontologieog.Lesannotationsainsiproduitesvont êtrestokéesdanslabdboontodb2.Elles
pourrontdonêtre,parlasuite,exploitéespourrépondreauxdiérentesinterrogationsdes
utili-sateurs. Une entaine d'interrogations typesont étéidentiées pour l'ensembledu projete-Wok
Hub.Parmi elles,ellesrelativesauxaspetsgéographiquesdoivent permettre,parexemple,de:
retrouver lesinformations deloalisationgéographiquesglobales de haque doument;
34
http://www-sop.inria.fr/aaia/proje t/ewo k/
35
CodeOielGéographique,http://rdf.insee.fr/geo/
36
http://rdf.insee.fr/geo/
37
soure:http://www-sop.inria.fr/aaia/ proje t/ewok/
Service d’annotation sémantique
Processus linguistique Term extractor
CORESE
generation annotation Text
Ontologie OWL : COG
Pattern (SPARQL)
<rdf:RDF xmlns:geo="http://rdf.inria.fr/geo/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:wl="http://model.core.weblab.eads.com#">
<wl:Segment rdf:about="wl://myWS/myDocument#1_inriaForGeo_1">
<geo:estGeolocalisePar rdf:resource=" geo:REG_11"/>
</wl:Segment>
</rdf:RDF>
“3D stratigraphic geometries of the intracratonic MesoCenozoic Ile-de-France were obtained by sequence stratigraphic correlations…”
Fig. 5.1Illustration duproessus d'annotatione-Wok Hub.
reherherles douments quiparlent dela zonegéographique Ile-de-Frane.
Enréponseà esdiérentesinterrogations, lesystèmedoitfournir unelistede douments
perti-nentsqui vont guider laséletion d'unsite de stokage.
Le système e-Wok Hub propose deux alternatives d'interrogation omme illustré dans la
-gure5.2:
1. une interrogation indirete àpartir dunomde lazone géographique entrée dansune zone
de texte.Ce typed'interrogation esten partiulier utilisé lorsquel'interrogation porte sur
une zoneadministrative de l'ontologieog;
2. uneinterrogation direte, àpartirduhoix surunearted'unretangledélimitant lazone
dereherhe.Cet typed'interrogation estutiliséavel'ontologieog+ quiomporteaussi
les zonesnon administratives de.
Les zones géographiques administratives du og sont organisées dansune struture d'arbre en
utilisant une relation transitive nommée seSubdiviseEn. Cette relation a le sens suivant : (x
seSubdiviseEn y)
⇔
(y⊂
x).Ainsi, elledénit un ordrepartiel surleszones géographiques. De plus, dans l'ontologie og et ordre est arboresent, haque zone n'étant une subdivision qued'unezonede niveau supérieur.
La gure5.3 présente un extrait de l'arbre des zones géographiques du og. Chaque n÷ud
représenteune zonegéographique ethaque arreprésentelarelation seSubdiviseEn. Dansette
gure,laraine del'arbre estlepays Frane quiest subdiviséen deuxrégions:Ile-de-Frane et
PoitouCharentes.Cettedernièrerégion estelle-mêmesubdiviséeendeuxdépartements:Vienne
et Deux-Sèvres.
Lesdoumentssont automatiquement annotés en utilisant leogetleog+.
Le prédiat d'annotation est nommé estGeoloalisePar. L'annotation (do ontient seg)(seg
estGeoloalisePar zone) (où do représente un doument, seg un segment du doument et zone
unezonegéographique administrativeduog),signiequeledoumentdo ontientunsegment
ayant des informations à propos d'une partie ou de l'ensemble de la zone géographique zone.
1’ Selection sur un carte de
SELECT distinct ?doc WHERE {
?doc rdf:type geo:Document . ?doc geo:contient ?res .
?res rdf:type geo:Segment .
?res geo:estGeolocalisePar <geo:REG_11> ) } PREFIX geo =<http://rdf.insee.fr/geo/>
SELECT distinct ?doc WHERE {
?doc rdf:type geo:Document . ?doc geo:contient ?res .
?res rdf:type geo:Segment . ?res geo:estGeolocalisePar ?x .
?x frontieres _in <
!"Fig. 5.2Illustration duproessusd'interrogation e-WokHub.
(
Fig. 5.3 L'ontologiedu og:exemple de relationd'inlusion entre individus
Nousnotonsqueeprédiataunomportementpartiulierpar rapportàl'ordre seSubdiviseEn.
Si un segment d'un doument ontient des informations à propos de Paris, il ontient des
in-formations à propos d'une partie de l' Ile-de-Frane. Ainsi par exemple, (do ontient seg)(seg
estGeoloalisePar Paris)
= ⇒
(do ontient seg)(seg estGeoloalisePar Ile-de-Frane).Notons que tous les prédiats dont le o-domaine est une zone géographique n'ont pas
for-ément e omportement. Par exemple, la personne qui dirige la région Ile-de-frane ne dirige
pas néessairement ledépartement de Paris, ni l'inverse.Ce omportement a une inidene sur
les requêtes.Eneet,siquelqu'un reherhe touslesdoumentsqui ont unrapportave lazone
géographique zone, le système doit raisonner sur la relation d'inlusion et retourner tous les
douments annotéspar les zones géographiquesinluses danszone.
Le modèleutiliséedanse projet,est illustréepar lagure5.4 . Il omporte troislasses :
1. La lassezone_geographique. Une zonegéographique estaratérisée parun nom,unode,
untype (parexemple,pays,département ou ommune) etuneuri. Unezonegéographique
estSubdiviseEn
Zone_geographique code : string nom : string uri:string type : string Segment
uri : string estGgeolocalisePar
Document uri : string titre : string
contient
Fig. 5.4 Indexationgéographique de doument.
administrativepeutsesubdiviser(seSubdiviseEn) enplusieursautreszonesgéographiques.
Lapropriété seSubdiviseEn, detypeobjet,dénit surette lasseunordrearboresent sur
l'ensemblede sesinstanes.
2. La lasse doument. Un doument est aratérisé par une uri et un titre et, ontient des
segments.
3. La lasse segment représente une portion d'un Doument. Un segment, identié par une
uri,peutréférener(estGeoloalisePar) zéroouplusieurs instanes delalasse
zone_geo-graphique.La propriétéestGeoloalisePar, detypeobjet, liant lalassesegment à lalasse
zone_geographique estpropagée par l'ordre seSubdiviseEn.
Dans le og+, les zones géographiques sont en plus aratérisées par leur frontières. Le
oneptBassinparisien parexemple,estunezonenonadministrativequipeutêtredériteparun
polygonereprésentantsafrontière.Lesfrontièressontreprésentéespardesobjetsgéométriques 38
quidénissent unordreimpliitesurlesinstanesdelalassezone_geographique dansleog+.
Ainsi, de même que pour les zones géographiques administratives, une reherhe des
dou-mentsayantdessegmentsgéoloalisésparlazonenonadministrativedefrontièreorrespondante
au Bassin Parisien du og+, doit retourner non seulement de tels douments, mais aussi les
doumentsayant dessegmentsgéoloalisés par larégion Ile-de-Frane, ledépartement duLoiret
ou touteautre zonedont lafrontièreest inlusedansellede lazoneBasin Parisien.
Lesystèmedebdboontodb2,supportpourlagestiondesdonnéesduogetduog+doit
donorirtouslesméanismespourpermettreàlafoisdereprésenterlesdonnéesgéographiques,
maisausside répondreeaement auxinterrogationsqui peuventêtre faitessuresdernières.
1.2 Représentation de données géographiques
An de permettre la représentation et la manipulation eae des données géographiques,
ontodb2 doitpermettre àlafois :
lareprésentation desdonnées de domainesde valeursdes types spatiaux;
lareprésentation desdonnées d'indexationpour failiterleur interrogation.
lareprésentation desdonnées d'indexationpour failiterleur interrogation.