• Aucun résultat trouvé

Partie III V alidation

4.3 T raitement des requêtes

Nousnousintéressonsmaintenant àlatransformation derequêtespourqu'ellespuissent être

exéutées eaement sur ontodb2 en utilisant les apaités de raisonnement numérique de

Postgresql.

Zone_geographique

id nom type … seSubdiviseEn_bound1 seSubdiviseEn_bound2 seSubdiviseEn_xmin seSubdiviseEn_ymin seSubdiviseEn_xmax seSubdiviseEn_ymax

z1 France country 1 12 … … … …

Segm e nt__estG eo localisePa r

rid e stGeol oca li se Par_ref seSub diviseE n_bo und1 se Subdivise En _boun d2 … rid seSudbiviseEn_ref … France Ile de france … France Poitou-Charentes … Ile de france Paris … Poitou-Charentes La rochelle …

Poitou-Charentes Poitiers … (a)instances

S e g m e n t

Requête SPARQL Requête re-écrite Requête SQL

PREFIX geo: <http://rdf.insee.fr/geo/> (?x rdf:type geo : zone_geographique) FILTER (? x = <geo:REG_11>) }

SELECT doc.uri

FROM document doc, doc.contient as seg, seg.estGeolocalisePar as geo, WHERE geo.uri= ‘‘REG_11’’

USING NAMESPACE “http://rdf.insee.fr/geo/”

SELECT distinct doc.uri

FROM document doc, document__contient as cont, segment__estGeolocalisePar as anno, zone_geographique as x WHERE (doc.rid = cont.rid)

AND (cont.contient_ref = anno.rid) AND (x.uri= 'REG_11')

AND (include(anno.seSubdiviseEn_bound1, anno.seSubdiviseEn_bound2, x.seSubdiviseEn_bound1, x.seSubdiviseEn_bound2));

Fig. 5.10og - ontodb2: exemplede rééritured'une requête

La gure5.10 montre le traitement d'une requête sparql relativement simple utilisée dans

leprojete-WokHub. Cetterequête permetde reherhertous lesdouments dont lessegments

sont géoloalisés par la zone géographique Ile-de-Frane. La requête à traiter est d'abord

ré-érite en utilisant l'interpréteur de requête ontologique de ontoql. Ensuite, elle est traduite

en sql et réérite suivant qu'elle néessite ou non un traitement spéial. Dans le as présent,

la propriété estGeoloalisePar est propagée de manière inverse par l'objet_property

seSubdivi-seEn.En onséquene,larequête doitêtreréérite pour qu'elleutilise latehnique d'étiquetage

ative (tehnique de shemeId sh5 assoiée à lapropriété estGeoloalisePar dans latable

pro-perty_shemes).Cetterééritureestprésentéesurlagure5.10 . Suivantlesinformations

onte-nues dans la table labeling_shemes, la réériture utilisent la fontion inlude sur les olonnes

suxéespar bound1 etbound2 pour déterminersi un doument ontient dessegments annotés

par une zonegéographique inlusedansl'Ile-de-Frane.

Notonsque la même ette démarhe s'appliquerait àl'identiquedans le asoù latehnique

d'étiquetage *geo_retangle* serait latehnique ative danslesystème.

Conlusion

La réalisation de la vision du Web Sémantique requiert des outils de gestion d'ontologies

qui passent àl'éhelle en termede quantité de donnéesgérées et quiréalisent desopérationsde

raisonnement surdesontologies en un temps de réponse aeptable. Le premier problème a été

résoluparl'utilisationdesbasesdedonnéesommestruturedepersistane.Leseondproblème

reste ouvert dans bien des as. Dans e hapitre, nous proposons une approhe qui onsiste

à remplaer un raisonnement dédutif par des raisonnements numériques ou alphanumériques

portantsurdesindexesadaptés.Nousavonsd'aborddérit,autraversd'unexemple,leproblème

de la propagation d'une propriété par une autre dénissant une relation d'ordre. Les apaités

de raisonnement fourniespar les arhitetures de bdbo usuelles sont prinipalement basées sur

la représentation expliite de tous les faits qui peuvent être déduits par un raisonneur. Cette

approhe rend diile, ou même impossible, la mise à jour de la base de données. Comme

alternativenousavonsformaliséleproblèmedepropagationdepropriétéet,proposéuneapprohe

qui onsiste à enrihir les instanes d'ontologie utilisées omme annotations ave de nouvelles

valeursdepropriétésdemanièreàpouvoirremplaerunraisonnementdédutifparuntraitement

de requêtes numériques, ou alphanumériques.

Nousavonsonsidérédeuxtypesde raisonnement :lesraisonnementspartransitivitésurdes

ensemblespartiellement ordonnésetdesraisonnementssurlaompositiondedeuxpropriétés,la

seonde étant transitive. Ces asenglobent l'évaluationde propriétés liées à une taxonomie, les

raisonnements de subsumption etles raisonnements d'inlusions spatialeset temporelles. Nous

avons proposé une formalisation qui permet de aratériser es as au niveau des ontologies.

Ceipermetausystèmed'unebdbod'implémenterdynamiquement leraisonnement numérique

lorsquedetellesontologiessonthargées.Cetteformalisationnéessitetroistypesd'informations,

hauned'entre ellesorrespondant à uneextension desmodèles d'ontologies existants par :

le fait qu'une propriété dénit un ordre, 'est-à-dire qu'elle soit transitive, réexive et

antisymétriqueouunordre arboresent,'est-à-direqu'elleimpliqueégalement l'uniitédu

majorant (respetivement du minorant)diret;

lefait qu'unepropriété puisseêtre propagée par une autre propriététransitive;

unetehnique d'étiquetagepermettant despéierletype d'étiquetagequidoitêtreutilisé

pour remplaer le raisonnement dédutif par un raisonnement numérique ou

alphanumé-rique.

Deux types de tehniques d'étiquetage existent. Les tehniques d'étiquetage topologiques

qui orrespondent à diérentes tehniques proposées pour des strutures d'arbre. Ce type de

label peutêtre alulé par le système de la bdbo. Notre approhe permet ainside spéier de

manière délarative la tehnique d'étiquetage qui doit être automatiquement utilisée pour une

propriété donnée et de dénir une tehnique d'étiquetage par défaut. Les tehniques

d'étique-tage géométriques sont utilisées pour le raisonnement spatial ou temporel. Les labels doivent

être fournis au système par l'intermédiaire de propriétés ontologiques. Notre approhe permet

également de dérire où et omment traiter es propriétés. Dans les deux as, l'interpréteur

de requêtes delabdbopeutréérire automatiquement lesrequêtes enutilisant les labels.Cette

approheaétéimplémentéesurlabdboontodb2.Nousavonsprésentélesapprohesquipeuvent

être utiliséespour réérire lesrequêtes.

L'approhe que nous proposons permet d'éviter la matérialisation de tous les faits déduits.

Cei estpartiulièrement important dansle asd'utilisation que nous avons présenté. En eet,

dans e as, la matérialisation des faits déduits onsisterait à multiplier la taille de la table

d'annotations, déjà très importante ompte tenu du volume de douments à traiter, par un

fateur prohe de laprofondeur de la struture hiérarhique onsidérée (e qui estimportant si

on envisage lagestiondeszones géographiquesdu monde).

ontodb2 propose d'autres méanismes de gestion des inférenes en exploitant les apaités

des bases de données et, l'interpréteur de requête ontologique. Dans le hapitre suivant, nous

présentonslevalidation d'ontodb2.

Validation d'OntoDB2

Sommaire

1 Flexibilité eteienede lareprésentationontologique . . . 179

1.1 Flexibilitédereprésentation . . . 179

1.2 Eienedereprésentation. . . 179

1.2.1 Rappelsurleshémadesontologiesd'ontodb2etontodb 179 1.2.2 Desriptionduband'essai . . . 181

1.2.3 Mahine detest . . . 181

1.2.4 Résultatsobtenus . . . 182

2 Flexibilité des typesde données . . . 183

2.1 Rappelsurleshémadesdonnéesd'ontodb2,soretorale . . . . 184

2.1.1 Shémadesdonnéesd'ontodb2:approhehorizontale . . 184

2.1.2 Shémadesdonnéesdesor . . . 185

2.1.3 Shémadesdonnéesd'orale . . . 185

2.2 Évaluationdel'approhed'indexation. . . 186

2.2.1 Desriptionduband'essaiog . . . 186

2.2.2 Métriquesutilisées . . . 186

2.2.3 Expressiondesrequêtes . . . 187

2.2.4 Résultatsobtenus . . . 189

3 Aès eaeaux donnéesanoniques enrihies aprèsmigration d'instanes193 3.1 Desriptionduband'essai . . . 194

3.2 Tempsdehargementdesontologies . . . 194

3.3 Résultatdesinterrogations . . . 195

3.3.1 Faisabilité del'approheproposée. . . 195

3.3.2 Tempsderéponsedesrequêtes . . . 196

Introdution

Nousprésentonsdanse hapitre lavalidationexpérimentaledelabdboontodb2implantée

surle sgbdpostgresql. Nousavons réaliséla validation d'ontodb2 sur troisbansd'essai.

Commenousl'avonsvuau hapitre 3,ontodb2 visent àrépondre àtroisbesoins:

1. laexibilité etl'eiene duformalisme d'ontologie;

2. laexibilité dusystème detypesde données;

3. l'aès eae auxdonnéesanoniques etnon anoniques par migration d'instanes.

Conernant le premier point,nous avons déjà expliqué au hapitre 4 (f. setion 1.1) omment

les tehniques d'idm permettaient d'étendre simplement le formalisme, tant de l'ontologie que

du systèmede type de données. Nous souhaitons don validerii l'eaité, pour le traitement

d'ontologies plib, du hoix de la struture plate de représentation que nous avons présenté au

hapitre 4 pour réduire laomplexité du niveau ontologique. Les essais que nousavons réalisés

ontportésurleparoursdelarelationdesubsumptionentreleslassesdel'ontologie.Nousavons

omparé les temps obtenus entre la struture de représentation plate d'ontodb2 et l'approhe

miseen÷uvredansontodb oùlemodèled'ontologieplibesttraduit àl'identiquedanslesgbd

postgresql. Nousavonspour es testsutilisé trois ontologies plib utilisés eetivement dans le

ontexteindustriel.

Nous avons également réalisé la validation de l'approhe de raisonnement par indexation

automatique des relations d'ordre que nous avons présentée au hapitre 5. Nous avons utilisé

pour ela, les données de l'ontologie og. Les requêtes utilisées dans e ban d'essai ont été

dénies an de permettre de omparer l'eaité temporelle de la méthode proposée. Nous

avons omparé don en terme de temps de réponse, les performanes d'ontodb2, du système

soret dusystèmed'orale.

Enn, nous avons réalisé la validation de l'approhe de représentation des données au sein

d'ontodb2. Pour elanousnoussommesintéressésà(1)aéderauxdonnéesd'unelasse

ano-nique dont tout oupartie desinstanes reçues étaient lassiéesommedesinstanes de lasses

dénies exprimées à partirde ette lasse anonique et, (2) aéder aux instanes d'une lasse

dénie àpartirde lavuequi lui estassoiée.Nousavonsutilisé,pour e dernieras, l'ontologie

uob (oniversity ontology benhmark). Nous avons omparé en termes de temps de réponse et

de omplétude, les performanes d'ontodb2 ave le système sor qui adopte une approhe par

saturation. Lesrequêtes utilisées dans e ban d'essai ont été dénies an de permettre la

vali-dation des hoix adoptées dansontodb2 pour lagestion des données des lasses anoniques et

non anoniquesdes pointsde vueomplétude ettemporel.

Cehapitres'organiseommesuit.Danslasetion1 ,nousrappelonslesméanismesde

exi-bilitémis en ÷uvredansontodb2. Puisnousomparonsletemps denavigation dansleslasses

etpropriétés. Dans lasetion 2, nousprésentons lavalidation desméanismes de exibilité du

systèmedestypesdedonnéesd'ontodb2.Puisnousprésentonslesrésultatsnumériquesobtenus

surl'ontologie og duseond ban d'essai. La setion3, présente l'évaluationde l'approhe de

gestiondesdonnéesdansontodb2 par rapportausystèmesorsurl'ontologie uobdutroisième

ban d'essai. Dansette setion, nousommençons par (1)une desriptiondu ban d'essai que

nous avons utilisé, (2) les requêtes que nous avons exéutées et(3) les résultats obtenus. Enn

nousterminons e hapitre par uneonlusion.

1 Flexibilité et eiene de la représentation ontologique