Partie III V alidation
4.3 T raitement des requêtes
Nousnousintéressonsmaintenant àlatransformation derequêtespourqu'ellespuissent être
exéutées eaement sur ontodb2 en utilisant les apaités de raisonnement numérique de
Postgresql.
Zone_geographique
id nom type … seSubdiviseEn_bound1 seSubdiviseEn_bound2 seSubdiviseEn_xmin seSubdiviseEn_ymin seSubdiviseEn_xmax seSubdiviseEn_ymax
z1 France country 1 12 … … … …
Segm e nt__estG eo localisePa r
rid e stGeol oca li se Par_ref seSub diviseE n_bo und1 se Subdivise En _boun d2 … rid seSudbiviseEn_ref … France Ile de france … France Poitou-Charentes … Ile de france Paris … Poitou-Charentes La rochelle …
Poitou-Charentes Poitiers … (a)instances
S e g m e n t
Requête SPARQL Requête re-écrite Requête SQL
PREFIX geo: <http://rdf.insee.fr/geo/> (?x rdf:type geo : zone_geographique) FILTER (? x = <geo:REG_11>) }
SELECT doc.uri
FROM document doc, doc.contient as seg, seg.estGeolocalisePar as geo, WHERE geo.uri= ‘‘REG_11’’
USING NAMESPACE “http://rdf.insee.fr/geo/”
SELECT distinct doc.uri
FROM document doc, document__contient as cont, segment__estGeolocalisePar as anno, zone_geographique as x WHERE (doc.rid = cont.rid)
AND (cont.contient_ref = anno.rid) AND (x.uri= 'REG_11')
AND (include(anno.seSubdiviseEn_bound1, anno.seSubdiviseEn_bound2, x.seSubdiviseEn_bound1, x.seSubdiviseEn_bound2));
Fig. 5.10og - ontodb2: exemplede rééritured'une requête
La gure5.10 montre le traitement d'une requête sparql relativement simple utilisée dans
leprojete-WokHub. Cetterequête permetde reherhertous lesdouments dont lessegments
sont géoloalisés par la zone géographique Ile-de-Frane. La requête à traiter est d'abord
ré-érite en utilisant l'interpréteur de requête ontologique de ontoql. Ensuite, elle est traduite
en sql et réérite suivant qu'elle néessite ou non un traitement spéial. Dans le as présent,
la propriété estGeoloalisePar est propagée de manière inverse par l'objet_property
seSubdivi-seEn.En onséquene,larequête doitêtreréérite pour qu'elleutilise latehnique d'étiquetage
ative (tehnique de shemeId sh5 assoiée à lapropriété estGeoloalisePar dans latable
pro-perty_shemes).Cetterééritureestprésentéesurlagure5.10 . Suivantlesinformations
onte-nues dans la table labeling_shemes, la réériture utilisent la fontion inlude sur les olonnes
suxéespar bound1 etbound2 pour déterminersi un doument ontient dessegments annotés
par une zonegéographique inlusedansl'Ile-de-Frane.
Notonsque la même ette démarhe s'appliquerait àl'identiquedans le asoù latehnique
d'étiquetage *geo_retangle* serait latehnique ative danslesystème.
Conlusion
La réalisation de la vision du Web Sémantique requiert des outils de gestion d'ontologies
qui passent àl'éhelle en termede quantité de donnéesgérées et quiréalisent desopérationsde
raisonnement surdesontologies en un temps de réponse aeptable. Le premier problème a été
résoluparl'utilisationdesbasesdedonnéesommestruturedepersistane.Leseondproblème
reste ouvert dans bien des as. Dans e hapitre, nous proposons une approhe qui onsiste
à remplaer un raisonnement dédutif par des raisonnements numériques ou alphanumériques
portantsurdesindexesadaptés.Nousavonsd'aborddérit,autraversd'unexemple,leproblème
de la propagation d'une propriété par une autre dénissant une relation d'ordre. Les apaités
de raisonnement fourniespar les arhitetures de bdbo usuelles sont prinipalement basées sur
la représentation expliite de tous les faits qui peuvent être déduits par un raisonneur. Cette
approhe rend diile, ou même impossible, la mise à jour de la base de données. Comme
alternativenousavonsformaliséleproblèmedepropagationdepropriétéet,proposéuneapprohe
qui onsiste à enrihir les instanes d'ontologie utilisées omme annotations ave de nouvelles
valeursdepropriétésdemanièreàpouvoirremplaerunraisonnementdédutifparuntraitement
de requêtes numériques, ou alphanumériques.
Nousavonsonsidérédeuxtypesde raisonnement :lesraisonnementspartransitivitésurdes
ensemblespartiellement ordonnésetdesraisonnementssurlaompositiondedeuxpropriétés,la
seonde étant transitive. Ces asenglobent l'évaluationde propriétés liées à une taxonomie, les
raisonnements de subsumption etles raisonnements d'inlusions spatialeset temporelles. Nous
avons proposé une formalisation qui permet de aratériser es as au niveau des ontologies.
Ceipermetausystèmed'unebdbod'implémenterdynamiquement leraisonnement numérique
lorsquedetellesontologiessonthargées.Cetteformalisationnéessitetroistypesd'informations,
hauned'entre ellesorrespondant à uneextension desmodèles d'ontologies existants par :
le fait qu'une propriété dénit un ordre, 'est-à-dire qu'elle soit transitive, réexive et
antisymétriqueouunordre arboresent,'est-à-direqu'elleimpliqueégalement l'uniitédu
majorant (respetivement du minorant)diret;
lefait qu'unepropriété puisseêtre propagée par une autre propriététransitive;
unetehnique d'étiquetagepermettant despéierletype d'étiquetagequidoitêtreutilisé
pour remplaer le raisonnement dédutif par un raisonnement numérique ou
alphanumé-rique.
Deux types de tehniques d'étiquetage existent. Les tehniques d'étiquetage topologiques
qui orrespondent à diérentes tehniques proposées pour des strutures d'arbre. Ce type de
label peutêtre alulé par le système de la bdbo. Notre approhe permet ainside spéier de
manière délarative la tehnique d'étiquetage qui doit être automatiquement utilisée pour une
propriété donnée et de dénir une tehnique d'étiquetage par défaut. Les tehniques
d'étique-tage géométriques sont utilisées pour le raisonnement spatial ou temporel. Les labels doivent
être fournis au système par l'intermédiaire de propriétés ontologiques. Notre approhe permet
également de dérire où et omment traiter es propriétés. Dans les deux as, l'interpréteur
de requêtes delabdbopeutréérire automatiquement lesrequêtes enutilisant les labels.Cette
approheaétéimplémentéesurlabdboontodb2.Nousavonsprésentélesapprohesquipeuvent
être utiliséespour réérire lesrequêtes.
L'approhe que nous proposons permet d'éviter la matérialisation de tous les faits déduits.
Cei estpartiulièrement important dansle asd'utilisation que nous avons présenté. En eet,
dans e as, la matérialisation des faits déduits onsisterait à multiplier la taille de la table
d'annotations, déjà très importante ompte tenu du volume de douments à traiter, par un
fateur prohe de laprofondeur de la struture hiérarhique onsidérée (e qui estimportant si
on envisage lagestiondeszones géographiquesdu monde).
ontodb2 propose d'autres méanismes de gestion des inférenes en exploitant les apaités
des bases de données et, l'interpréteur de requête ontologique. Dans le hapitre suivant, nous
présentonslevalidation d'ontodb2.
Validation d'OntoDB2
Sommaire
1 Flexibilité eteienede lareprésentationontologique . . . 179
1.1 Flexibilitédereprésentation . . . 179
1.2 Eienedereprésentation. . . 179
1.2.1 Rappelsurleshémadesontologiesd'ontodb2etontodb 179 1.2.2 Desriptionduband'essai . . . 181
1.2.3 Mahine detest . . . 181
1.2.4 Résultatsobtenus . . . 182
2 Flexibilité des typesde données . . . 183
2.1 Rappelsurleshémadesdonnéesd'ontodb2,soretorale . . . . 184
2.1.1 Shémadesdonnéesd'ontodb2:approhehorizontale . . 184
2.1.2 Shémadesdonnéesdesor . . . 185
2.1.3 Shémadesdonnéesd'orale . . . 185
2.2 Évaluationdel'approhed'indexation. . . 186
2.2.1 Desriptionduband'essaiog . . . 186
2.2.2 Métriquesutilisées . . . 186
2.2.3 Expressiondesrequêtes . . . 187
2.2.4 Résultatsobtenus . . . 189
3 Aès eaeaux donnéesanoniques enrihies aprèsmigration d'instanes193 3.1 Desriptionduband'essai . . . 194
3.2 Tempsdehargementdesontologies . . . 194
3.3 Résultatdesinterrogations . . . 195
3.3.1 Faisabilité del'approheproposée. . . 195
3.3.2 Tempsderéponsedesrequêtes . . . 196
Introdution
Nousprésentonsdanse hapitre lavalidationexpérimentaledelabdboontodb2implantée
surle sgbdpostgresql. Nousavons réaliséla validation d'ontodb2 sur troisbansd'essai.
Commenousl'avonsvuau hapitre 3,ontodb2 visent àrépondre àtroisbesoins:
1. laexibilité etl'eiene duformalisme d'ontologie;
2. laexibilité dusystème detypesde données;
3. l'aès eae auxdonnéesanoniques etnon anoniques par migration d'instanes.
Conernant le premier point,nous avons déjà expliqué au hapitre 4 (f. setion 1.1) omment
les tehniques d'idm permettaient d'étendre simplement le formalisme, tant de l'ontologie que
du systèmede type de données. Nous souhaitons don validerii l'eaité, pour le traitement
d'ontologies plib, du hoix de la struture plate de représentation que nous avons présenté au
hapitre 4 pour réduire laomplexité du niveau ontologique. Les essais que nousavons réalisés
ontportésurleparoursdelarelationdesubsumptionentreleslassesdel'ontologie.Nousavons
omparé les temps obtenus entre la struture de représentation plate d'ontodb2 et l'approhe
miseen÷uvredansontodb oùlemodèled'ontologieplibesttraduit àl'identiquedanslesgbd
postgresql. Nousavonspour es testsutilisé trois ontologies plib utilisés eetivement dans le
ontexteindustriel.
Nous avons également réalisé la validation de l'approhe de raisonnement par indexation
automatique des relations d'ordre que nous avons présentée au hapitre 5. Nous avons utilisé
pour ela, les données de l'ontologie og. Les requêtes utilisées dans e ban d'essai ont été
dénies an de permettre de omparer l'eaité temporelle de la méthode proposée. Nous
avons omparé don en terme de temps de réponse, les performanes d'ontodb2, du système
soret dusystèmed'orale.
Enn, nous avons réalisé la validation de l'approhe de représentation des données au sein
d'ontodb2. Pour elanousnoussommesintéressésà(1)aéderauxdonnéesd'unelasse
ano-nique dont tout oupartie desinstanes reçues étaient lassiéesommedesinstanes de lasses
dénies exprimées à partirde ette lasse anonique et, (2) aéder aux instanes d'une lasse
dénie àpartirde lavuequi lui estassoiée.Nousavonsutilisé,pour e dernieras, l'ontologie
uob (oniversity ontology benhmark). Nous avons omparé en termes de temps de réponse et
de omplétude, les performanes d'ontodb2 ave le système sor qui adopte une approhe par
saturation. Lesrequêtes utilisées dans e ban d'essai ont été dénies an de permettre la
vali-dation des hoix adoptées dansontodb2 pour lagestion des données des lasses anoniques et
non anoniquesdes pointsde vueomplétude ettemporel.
Cehapitres'organiseommesuit.Danslasetion1 ,nousrappelonslesméanismesde
exi-bilitémis en ÷uvredansontodb2. Puisnousomparonsletemps denavigation dansleslasses
etpropriétés. Dans lasetion 2, nousprésentons lavalidation desméanismes de exibilité du
systèmedestypesdedonnéesd'ontodb2.Puisnousprésentonslesrésultatsnumériquesobtenus
surl'ontologie og duseond ban d'essai. La setion3, présente l'évaluationde l'approhe de
gestiondesdonnéesdansontodb2 par rapportausystèmesorsurl'ontologie uobdutroisième
ban d'essai. Dansette setion, nousommençons par (1)une desriptiondu ban d'essai que
nous avons utilisé, (2) les requêtes que nous avons exéutées et(3) les résultats obtenus. Enn
nousterminons e hapitre par uneonlusion.
1 Flexibilité et eiene de la représentation ontologique