Pouvoir d'expression de la vue lausale pour le ontrle d'aès

Chapitre 3. Évaluation de requêtes et ontrle d'aès

3.7. Pouvoir d'expression de la vue lausale pour le ontrle d'aès

Pournirehapitre,onmontreommentenoder,enutilisantnotrevuelausale,

deux méthodes souvent utilisées pour traiter le problème du ontrle d'aès aux

doumentsXML.

I.) Pour ouvrir les approhes basées sur l'attribution des lefs aux n÷uds et/ou

leurs attributs, (voir par exemple [2℄ et[66 ℄), on dénit la notion de lef

K

^sur^un

doument

t

^,^omme^une^fontion(partielle)

K : N odes _t ∪Att → 2 ^{U ser}

^,^telle^que

K(x)

soitunensemblenid'utilisateurs. Voiileslausesenodantl'attribution deslefs:

•

^Soit

u

^un^n÷ud^de

t

^. ^Si

K(u)

^ne^ontient^pasd'identiateur

B

^,^alorsl'utilisateur

B

^ne ^peut ^aéder^au ^n÷ud

u

^,ⁿⁱ^à ^auun ^de ^ses^desendants

v

← U ser(B), u. ∗ [B 6∈ K(u)]

← U ser(B), v. ∗ [B 6∈ K(u), u.∗

^desendant

v.∗]

•

^Soit

att

ûnâttributâssoiéâu^n÷ud

u

^. ^Si

K (att)

^ne^ontient ^pasd'identiateur

B

^,^alors l'utilisateur

B

^n'a ^pas^le ^droit^d'aéder ^à^la ^v^aleur ^d'attribut

att

← U ser(B), u.att [B 6∈ K(att)]

Supposons que l'utilisateur

B

^évalue ^une ^requête

Q

^sur ^un ^doument

t

^assujetti ^à

une politique du ontrle d'aès

P

^stipulant ^que

B 6∈ K(u)

^. ^Si^le ^run ^du ^système

S Q

^atteint^le^n÷ud

u

^,^on^ajoute^à

Hist B

^les^lauses

U ser(B) ←

^,^et

u.∗ ←

^. ^Ensuite,

on ajoutera à

Hist _B

^les ^lauses

v.∗ ←

^,^et

[u.∗

^desendant

v.∗] ←

^, ^pour ^tout ^n÷ud

v

^desendant ^de

u

^,^qui^seront âtteintsên ^desendant ên^dessous^de

u

II.)Pour enoder, à l'aide des lauses, la méthode présentée dans [71℄ (esquissée à

lapage 9 du présent rapport), onintroduitune fontion

Acc : N odes _t → {−r, −R}

qui marquedesn÷uds qui sont interdits d'aès. Par suite, l'approhe du[71 ℄ peut

être enodée par leslauses suivantes:

•

interdition pour tout utilisateurd'aéder aun÷ud

u

^et ^tous ^ses^attributs

← U ser(∗), u. ∗ [Acc(u) = −r]

•

interdition pour tout utilisateur d'aéder au n÷ud

u

^et ^ses ^desendants ^ainsi

queleurs attributs

← U ser(∗), u. ∗ [Acc(u) = −R]

← U ser(∗), v. ∗ [Acc(u) = −R, u.∗

^hild

v.∗]

Requêtes sur douments ompressés

Dans e hapitre nous présentons une approhe qui permet d'évaluer les requêtes

positivesdeCoreXPath,surlesdoumentsompressésdetypeXML,sansnéessiterune

déompressionpréalable. Ellereposesurseptautomatesdemots,quiorrespondent aux

septaxesdebasedeCoreXPath. Enutilisantetteapprohe,onpeutévaluerlesrequêtes

diretement sur les douments partiellement ou totalement ompressés. La omplexité

d'unetelleévaluationestlinéaireparrapportàlatailledelarequêteetlenombred'arêtes

dudoument. Ce hapitreest struturé omme suit : Nous ommençonspar introduire

la notion de trdag (Setion 4.1), et elle de grammaire normalisée (Setion 4.2), qui

nous serviront pour modéliser les douments XML ompressés. Dans les Setions 4.3

et 4.4 nous onstruisons nos sept automates, et présentons notre approhe pour les

requêtes dites de base. Les résultats sur la omplexité de notre méthode se trouvent

danslaSetion4.5. LaSetion4.6estonsaréeàl'évaluationdesrequêtesomposées:

onjontives,disjontiveset imbriquées. Finalement,danslaSetion4.7,nous adaptons

notreapprohe, pourpouvoir déduire, àpartirde laREPONSEàunerequêtedonnée

Q

surundoumentompressé

t

^,^la^REPONSE^à

Q

^sur^l'arbre

b t

^équivalent^à

t

^. ^Notons^que

laméthode présentéeii aété publiéedans[30 ℄.

4.1. Représentation ompressée de douments arboresents

LesvolumesdedonnéesreprésentéespardesdoumentsXMLsontengénéraltrès

importants. Par onséquent,les arbresXMLpeuventouperbeauoupd'espaede

mémoire. Deplus, lareprésentation arboresenten'est paslaplusoptimale,ar sur

un arbre la même information peut être représentée plusieurs fois par exemple,

lapremière,deuxièmeetquatrièmefeuillede l'arbredelaFigure4.1représentent la

même information

a

^. ^De ^nombreuses^reherhes^sur ^une présentation plus éonome des douments XML ont été menées durant la dernière déennie. Diérentes

mé-thodesdeompressiond'arbresXMLontétédéveloppées(voirlaSetion 1.3). Dans

etravailonutiliseralesgraphesorientéssansylesdags(del'anglaisdiretedayli

graphs) pour représenter des douments XML. Notons qu'une telle vision permet

d'obtenir un gain exponentiel d'espae de stokage d'un doument, par rapport à

l'espae néessaire pour stoker le même doument sous forme arboresente. On

introduit maintenant lanotion de trdag grapheà l'aideduquel on modélisera un

doument XML ompressé ounon ompressé.

Dénition 4.1. Soit un alphabet de symboles

Σ

^. ^Un ^trdag ^sur

Σ

êst ûn ôuple

t = ((N odes t , Edges _t ), name t )

^, ^où

(N odes t , Edges _t )

êst ûn ^dag, âyant ûn ^seul

n÷ud raine noté

root t

^, ôù ^les ârêtes ^sortant ^du ^même ^n÷ud ^sont ôrdonnées, êt

name _t : N odes _t → Σ

êst ûne ^fontion, âssignant ^à ^haque ^n÷ud

v

^de

t

^un ^nom

name _t (v) ∈ Σ

Remarquons que tout arbre ordonné, étiqueté par des symboles d'un alphabet

Σ

est un trdag sur

Σ

^, ^mais ^la ^réiproque ^est ^fausse. ^La ^Figure ^4.1 ^représente ^trois

trdags sur

Σ = {a, b, f }

^, ^dont ^seulement ^le^premier ^à ^gauhe êst ûn ârbre. ^Notons

compressé

f

a b

a a

f

a b

f

a b a

arbre partiellement

compressé totalement

Figure4.1. Exemplesdetrdags

aussi, que dans le as où

t

^n'est ^pas ûn ârbre, ^deux ^diérents ênfants ^d'un ^n÷ud

peuventêtrereprésentés parunseul n÷uddu

t

^. ^Par^exemple,^sur^le^trdag^au^milieu

delaFigure4.1, lepremier,deuxièmeainsiquelequatrièmeenfantdelaraine sont

représentésparlemêmen÷udayant lenom

a

^. ^Un^n÷ud^donné^d'un^trdag^peut^alors

représenter son propre frère,ou avoirplus qu'un père.

Soit

t

^un^trdag^donné. ^Pour ^haque^n÷ud

v

^de

t

^,^on^dénit^d'une^façon^réursive

l'ensembledespositions représentées par

v

^sur

t

^,^noté

pos _t (v)

•

^si

v = root t

^,^alors

pos t (v) = {ε}

•

^si

v 6= root _t

^, ^alors

pos _t (v) = {α.i | α ∈ pos _t (w),

^où

w ∈ P arents _t (v)

^et

γ(w) = (u 1 , . . . , u _i−1 , v, u _i+1 , . . . , u _n )}

Ondénit ensuitel'ensembledespositions dutrdag

t

^,^noté

P os t

^,^par ^:

P os _t = [

v∈N odes t

pos _t (v).

La fontion

name t

^peut ^être naturellement étendue à l'ensemble

P os t

^; ^il ^sut ^de

poser:

name _t (α) = name _t (v),

^pour ^tout

α ∈ pos _t (v).

Notons que, si

t

êst ûn ârbre, ^les ênsembles

N odes _t

^et

P os _t

^sont ^en ^une ^bijetion

naturelle,etpeuvent êtreonfondus.

Soituntrdag

t

^sur^un^alphabet

Σ

^. Ônâppelleârbre ^équivalent ^à

t

^,^un^arbre^sur

Σ

(uniqueàisomorphisme près),noté

b t

^,^qui^peut^être ^onstruit^d'une ^façon^anonique

(voir[35℄), enposant :

N odes _b _t = P os _t ,

⁽

b t

⁾

Edges _b _t = {(α, α.i) | α, α.i ∈ P os _t },

name _b _t (α) = name _t (α).

Ondiraalors que

t

êstûne ômpression ^de

b t

^. Ônâppelle ^surjetion ^deômprêssion,

lasurjetion

c : N odes _b _t → N odes _t

^,^dénie ^par ^:

c (α) = v,

^si^et^seulement ^si

α ∈ pos t (v).

Par

t| v

^on ^désignera ^le ^soustrdag ^de

t

^, ^rainé ^en

v

^. ^On ^dira ^qu'un ^trdag

t

^est

totalement ompressé, si et seulement si, pour toute paire

v, u

^de ^n÷uds ^de

t

^: ^si

v 6= u

^,^alors ^les ^arbres

c t| v

^et

t| c u

(équivalents aux soustrdags

t| v

^et

t| u

⁾ ^ne^sont ^pas

isomorphes. Tout trdag qui n'est pas totalement ompressé sera dit partiellement

ompressé. Sur la Figure 4.1 on présente un trdag totalement ompressé (elui au

milieu), etdeuxtrdags partiellement ompressés(à gauhe età droite).

Commedansleasd'unereprésentationarboresente,ononfondraundoument

XML donné ave le trdagquile représente.

4.2. Trdag vu omme grammaire

On onstruit maintenant une grammaire assoiée à un trdag

t

^. ^On ^utilisera

ensuitelegraphededépendanedeettegrammairepourévaluerdesrequêtesXPath

surle doument

t

Dénition 4.2. Soitun trdag

t

^donnée. Ôn âppêlle^grammaire ^normalisée âssoiée

t

^,^une^grammaire^régulière ^d'arbres,^notée

L t

^,^qui^satisfait^les^onditions^suivantes^:

L t

^n'aepte ^que

t

2. lenombre denonterminaux de

L t

^est ^égal ^au ^nombre ^de ^n÷uds ^du

t

3. pour haque nonterminal

A _i

^, îl êxiste êxatement ûne ^prodution ^de ^la ^forme

A i → σ(A j ₁ , . . . , A j _k )

^, ^telle ^que ^pour ^tout

r ∈ {1, . . . , k}

^, ^on ^a

i < j r

^; ^on ^note

alors

Sons(A _i ) = {A j 1 , . . . , A _j _k }

^, ^et

symb _L _t (A _i ) = σ

Bien évidemment, une telle grammaire peut être produite en temps linéaire par

rapport à la taille (nombre d'arêtes) du trdag orrespondant, et elle est unique au

renommage des nonterminaux près. La Figure 4.2 présente un trdag

t

^et ^la

gram-maire normalisée

L t

^assoiée. ^Les ^onditions

2

^et

3

^de ^la^Dénition ^4.2 impliquent,

b

:

c

b a

t f _L _t _:

A ₁ → f (A ₂ , A ₃ , A ₄ , A ₅ , A ₂ ), A ₂ → c,

A ₃ → a(A 5 ), A ₄ → b, A ₅ → b

Figure 4.2. Un trdag

t

^et^sa ^grammaire^normalisée

L t

enpartiulier, quel'ensembledesn÷udsde

t

^et^l'ensemble^desnonterminauxde

L t

sont en bijetion préservant les symboles. Onremarque que la grammaire

normal-iséede

t

^est^une^grammairestraightline,danslesensdénidans[17 ℄,.àd.,haque nonterminal produitexatement un soustrdag de

t

^,êtîl ⁿ ^yâ ^pas^de ^yles ^dans

larelation dedépendane entre lesnonterminaux de

L t

Soituntrdag

t

^,^et^sa^grammaire^normalisée

L t

^. ^Notons^par

n

^le^nombre^de^n÷uds

t

^. ^On^appelle ^graphe ^de^dépendane ^de

L t

^,^un^graphe

•

^omposé^de

n

^n÷uds ^qui^portent ^les ^noms^desnonterminaux

A ₁ , . . . , A _n

^de

L t

•

ôntenant ûne ârête ôrientée ^du ^n÷ud

A _i

^vers ^le ^n÷ud

A _j

^, ^si ^et ^seulement ^si

A _j ∈ Sons(A i )

On étend e graphe en ajoutant une raine supplémentaire (père de n÷ud nommé

A ₁

^), ^qui ^porte^le ^nom

A ₀

^;^e ^n÷udsupplémentaire représentera la raine tive du

doument XML modélisé par

t

^. ^A ^haque ^n÷ud

v

^du ^graphe ^de ^dépendane^de

L t

ainsiétendu, on ajouteunlabel

label(v)

^déni^omme^suit ^:

label(v) =

( (Root, −),

^si

name(v) = A ₀

(symb _L _t (A i ), −),

^si

name(v) = A _i

^et

i ∈ {1, . . . , n } .

(Notonsquelelabel

label(v)

ûtilisé^dansê ^travâil ^étend^la^notion^de^label^lassique

de XML :sapremière omposante estle nomd'élément représentépar

v

^don ^le

label au sens de XML , et sa deuxième omposante (qui pourra être

1

0

^, ^ou

−

⁾

nousindiqueralerledun÷ud

v

^par ^rapport^à^la^requête^évaluée,^f. ^la^sémantique

dans la setion suivante.) Le graphe labelé ainsiobtenu, noté

D t

^, ^sera ^appelé ^rlag

dedépendane de

L t

^(rlag^étant ^uneabréviation derooted labeled ayligraph). Le rlagdedépendane

D t

^ne^ontient^jamais^deux^arêtesparallèles. Deplus,l'ensemble de n÷uds de

D t

^, ^qui ^portent ^les ^noms

A ₁ , . . . , A n

^, êst ên ^bijetion âve ^l'ensemble

de n÷uds de

t

^; ôn îdentiera ^souvent ^don ûn ^n÷ud ^de

t

^ave ^son ^image ^sur

D t

Le deuxième graphe sur la Figure 4.3 est le rlag de dépendane de la grammaire

normalisée dutrdag

t

^représenté ^à ^gauhe.

A

Figure4.3. trdag

t

^,^rlag

D t

^et ^l'ensemble^des^haînonsorrespondants

Soit

t

^un^trdag^donné,

L t

^sa^grammairenormalisée,et

D t

^le^graphe^de^dépendane

orrespondant. Remarquons que le rlag

D t

^est ^susant ^pour ^enoder ^des ^relations

vertiales(pèrels)représentéespar

t

^. ^Néanmoins,^faute^d'arêtesparallèles,en'est

pasune manièreappropriée pour représenter lesrelations horizontales(entre frères)

t

^. ^Pour ês ^dernières, ôn ûtilisera ûne âutre ^famille ^de ^graphes, ^dont ^voii ^la

onstrution :

Pourhaqueprodution

A i → σ(A j ₁ , . . . , A j _k )

^de

L t

^,ônônstruitûn^graphe^linéaire

ontenant

j _k

^n÷uds ^nommés^par

A _j ₁ , . . . , A _j _k

^,^tel^que^:

•

^pour ^tout

l ∈ {1, . . . , k − 1}

^, ^le ^n÷ud ^portant ^le ^nom

A _j _l

^soit ^le ^père ^du ^n÷ud

portant le nom

A _j _l+1

On omplète e graphe en ajoutant un n÷ud raine (tive) portant le nom

A ⁰ _i

Ensuite, à haque n÷ud

v

^d'un ^tel ^graphe ^étendu, ^on ^dénit ^un ^label ^de ^la ^façon

( (Root _i , −),

^si

name(v) = A ⁰ _i

(symb _L _t (A j _l ), −),

^si

name(v) = A _j _l .

Le graphe ainsi obtenu sera appelé

i

^ème ^haînon ^de

L t

^, ^et ^sera ^noté

F i

^. ^On

notera par

F 0

^le ^graphe ^omposée ^de ^deux ^n÷uds ^: ^la ^raine ^portant ^le ^nom

A ⁰ ₀

et le label

label(v) = (Root ₀ , −)

^, ^et ^son ^unique ^ls ^portant ^le ^nom

A ₁

^et ^le ^label

(symb L t (A 1 ), −)

^. ^A ^droite ^de ^la ^Figure ^4.3 ^on ^représente ^les ^haînons

F 0

F 1

^et

F 3

^, orrespondants aux produtions de la grammaire normalisée

L t

^donnée ^sur ^la

Figure4.2.

Soit un doument

t

^(ompressé ôu ^non), êt ûne ^requête

Q

^. ^Pour ^trouver ^la

REPONSE à

Q

^sur

t

^, ôn ûtilisera ^les ^runs ^des âutomates ^de ^mots ônstruits

dans la suite de e hapitre sur le rlag

D t

^et ^sur ^les ^haînons ^de ^la ^grammaire

L t

^assoiée. ^L'absene ^d'arêtes ^parallèles ^sur ^le ^rlag

D t

^implique ^que ^e ^dernier

fournit une représentation très onise du doument

t

^(souvent ^plus ^onise ^que

t

luimême). C'estavantageuxpourlaomplexitédenotreapprohed'évaluation,qui

est (voir laSetion 4.5) linéaire par rapportà lataille du graphesur lequelourent

nosautomates. Notons aussique l'approhe présentéedansles Setions4.34.6 sert

à trouver tous les n÷uds qui répondent à la requête

Q

^sur

t

^. ^Dans ^la ^Setion ^4.7,

on adaptera ette méthode pour déduire quels sont les n÷uds qui répondent à la

requête

Q

^sur^lareprésentation arboresente de

t

4.3. Évaluation de requêtes à l'aide des automates de mots

L'approhe que l'on présente dans e hapitre, pour évaluer des requêtes

posi-tives de Core XPath sur les douments ompressés, est appropriée aux douments

représentés sous une forme totalement ou partiellement ompressée, ou sous une

forme déployée arboresente. Elle ouvre es requêtes en forme standardisée

Q _std

(voirlaSetion 2.4) quel'on peutgénérer à l'aidede lagrammairesuivante:

S _std : Root |

^A::

x | S _std and S _std | S _std or S _std E _std :

^A::

∗

S _std

^℄

|

^A::

∗

E _std

^℄

Q std :

^//

∗ |

^//

∗

S std

^℄

|

^//

∗

E std

^℄.

Toutes les requêtes onsidérées dans e hapitre seront de e type. Notons que

notre approhe peutêtre naturellement étendue à toutes les requêtes standardisées

généréesàpartir delagrammairedonnéedanslaTable2.3,même ellesdelaforme

∗

Y _std conn Y _std

^℄. ^La^méthode^présentéeⁱⁱ^est^basée^sur^sept^automates^de^mots

A _Q

^,orrespondant auxseptrequêtes,appeléesrequêtes debase,quisontdelaforme

Q =

^//

∗

^[axis::

σ

^℄,ôùâxisêstûnâxe^de^base^de^Core^XPath. ^Soientûn^doument

t

^,^et ^une ^requête ^de ^base

Q =

^//

∗

^[axis::

σ

^℄. ^Pour ^évaluer

Q

^sur

t

^, ^on ^utilisera ^le

run topdownde l'automate

A _Q

•

^siâxisêstûnâxe^vertial,âlors ^l'automate

A _Q

^ourra^sur^le^rlag^de ^dépendane

D t

^déni^dans^la^setion ^préédente,

•

^siâxisêst ûnâxehorizontal, alors l'automate

A _Q

^ourra^sur ^l'ensemble ^de^tous

leshaînons de lagrammaire

L t

^assoiée^à

t

Notons que

A Q

^est nondéterministe (plusieurs runs possibles sur le même rlag), maisgrâe à une stratégie dite de priorité maximale, on dénira e qu'on appellera

runde prioritémaximale (voirlaDénition4.4) quiseraunique etserviraàévaluer

larequête

Q

^sur

t

Formalisonsmaintenantlesidéesprésentéesplushaut. Soitunalphabet

Σ

^. ^On

in-troduitquatresymboles

s, η, ⊤, ⊤ ^′

^quin'appartiennentpasà

Σ

^. ^On^appellera^llpaire

toutouple appartenant à l'ensemble

{(s, 1), (η, 1), (η, 0), (⊤ ^′ , 1), (⊤, 1), (⊤, 0)}

^. ^Ces

ouples onstituerons par lasuite lesétats de nosautomates. Considérons untrdag

t

^sur

Σ

^. ^Dans ^la^suite ^de^e ^hapitre, ^on^notera ^par

G t

•

^le^rlag

D t

^,^si âxisâstûn âxe^vertial,

•

^tout^haînon

F

^de

L t

^,^siâxis êstûn âxehorizontal.

On dénit lafontion

llab : N odes _G _t → Σ ∪ {s, η}

^,^omme ^la ^projetion ^de

label(v)

sursapremière omposante :

llab(v) = π ₁ (label(v)),

^pour ^tout

v ∈ N odes _G _t .

Ainsi lelabel au n÷ud

v

êst ûne ^paire ôrdonnée, ^notée

label(v)

^, ^et^le ^llab ^au ^n÷ud

v

êst^la^première ômposante ^de êtte^paire. ^Pendant l'évaluationdesrequêtes

om-posées(Setion4.6),leslabelsvont évoluer,etles n÷udsdurlag

D t

^seront^relabelés

par des llpaires (parfois plusieurs fois) avant d'obtenir la REPONSE à la requête

onsidérée. Le label

label(v)

^nous ^informera onformément à la sémantique de laTable4.1 surle rle du n÷ud

v

^par ^rapport^à ^la^partie ^de ^la^requête^que ^l'on

vient d'évaluer : n÷ud séletionnéou non (premièreomposante), ayant ounon un

desendant séletionné(deuxièmeomposante).

L'automate

A _Q

^qui ^permet^d'évaluer ^la ^requête ^de ^base

Q =

^//

∗

^[axis::

σ

^℄, ^où

σ ∈ Σ ∪ {∗}

^,êst ^dénit ômmeûnûplet

A _Q = (Σ ∪ {s, η}, States Q , {init}, ∆ _Q ),

où

States _Q ⊆ {init} ∪ {(s, 1), (η, 1), (η, 0), (⊤ ^′ , 1), (⊤, 1), (⊤, 0)}

^est ^l'ensemble ^des

états,

init

êst^le^seul ^étatînitial, êt

∆ Q

^est^l'ensemble ^destransitionsde laforme

(q, τ ) → q ^′ ,

où

q, q ^′ ∈ States Q

^, ^et

τ ∈ Σ ∪ {∗, s, η}

^. ^La ^omposition ^des ^ensembles

States Q

∆ _Q

^varie ^suivant ^l'axe ^axis ^utilisé ^par ^la ^requête

Q =

^//

∗

^[axis::

σ

^℄. ^Les ^sept

automates

A _Q

^, orrespondant aux sept requêtes de base

Q =

^//

∗

^[axis::

σ

^℄ ^sont

représentés sur les Figures 4.4, 4.64.11. La onstrution des automates

A Q

^obéit

auxrègles généralessuivantes:

Remarque 4.1. Pour toutes les transitions

(q, τ ) → q ^′

^de^l'automate

A Q

^, ^on ^a ^:

(i)

^si

τ = σ

^, ^alors

q ^′ ∈ {(⊤ ^′ , 1), (⊤, 1), (⊤, 0)}

(ii)

^si

τ 6= σ

^, ^alors

q ^′ ∈ {(s, 1), (η, 1), (η, 0)}

(iii)

^toute ^transition âllant ^d'une^llpaire âve ^la ^deuxièmeômposante

0

^, ^va^vers

une llpaire ave la deuxième omposante

0

Soient une requête de base

Q =

^//

∗

^[axis::

σ

^℄, ^l'automate

A _Q

orrespondant, undoument

t

^,^et^le ^rlag

G t

^. ^Voii ^omment ^on^dénit ^le^run ^de

A _Q

^sur

G t

Dénition 4.3. Le run de l'automate

A _Q

^sur

G t

^est ^une ^fontion

r : N odes _G _t → States _Q

^,^dénie réursivement omme suit: pour tout

v ∈ N odes _G _t

•

^si

llab(v) = Root

^,^ou

llab(v) = Root i

^, ^alors

r(v) = init

•

^si

v

ⁿ^'est ^pas ^la ^raine ^de

G t

^, ^alors

r(v)

^est ^une ^llpaire, ^telle ^que ^pour ^tout

w ∈ P arents(v)

^, ^la ^transition

(r(w), llab(v)) → r(v)

^soit ^dans

∆ Q

Lerun

r

^de^l'automate

A _Q

^sur

G t

êstâinsiûne^fontionônstruite^de^façon^réursive,

topdown(suivanttouslesheminsrainefeuillede

G t

^). Êlleâssigne^l'étatînitial^à^la

rainede

G t

^,êtênsuiteûne^llpaire

r(v)

^à^haque^n÷ud

v

^de

G t

progressivement. Soit

v

^un ^n÷ud^de

G t

^. ^La ^deuxième ^ondition^de ^la^dénition ^impose, ^que ^pour ^pouvoir

dénir la valeur

r(v)

^, îl ^faut ^d'abord ônnaître ^les ^vâleurs

r(w)

^,^pour ^haque ^n÷ud

w

^père^de

v

^. ^De ^plus, ^l'état

r(v)

^doit^être ^onforme ^(par^rapport^auxtransitions de

∆ Q

⁾ ^ave ^tous ^les ^états

r(w)

^, ^pour ^tout ^n÷ud

w

^père ^de

v

^. ^La ^Remarque ^4.1^et ^la

Dénition4.3impliquentquel'état

r(v)

^est^toujours^déterminé ^par

llab(v)

^,^.àd.,^:

• r(v) = init

^,^si

llab(v) = Root

• r(v) ∈ {(⊤, 0), (⊤, 1), (⊤ ^′ , 1)}

^,^si

llab(v) = σ

• r(v) ∈ {(η, 0), (η, 1), (s, 1)}

^, ^si

llab(v) 6= σ

Pour simplier la notation, on pose

η ^′ := s

^, êt ôn ûtilisera ^souvent ^la ^notation

{(l, 0), (l, 1), (l ^′ , 1)}

^,^ou

l ∈ {η, ⊤}

^,^pour^désigner^le^groupe ^des^llpaires^en^question.

Soit une requête de base

Q

^,^et ^l'automate

A _Q

^assoié. ^Comme ^nous ^allons^voir

danslesSetions4.3.1et4.3.2,nosautomatesnesontpasdéterministes,donàpriori

il existe plusieurs runs possibles de

A _Q

^sur ^le ^même ^rlag

G t

^. ^Pourtant ^l'automate

A _Q

^est ^onstruit ^pour ^que ^sur ^tout ^rlag

G t

^, îl êxiste ûn ^seul ^run ^de

A _Q

^qui ^permet

d'évaluerla requête

Q

^sur^le ^doument

t

^. ^Ce^run ^assignera ^à ^haque^n÷ud

v

^de

G t

unétatdontlasémantiquenousinformeraquelleestlasigniationde

v

^par^rapport

àlarequêteonsidérée. Lasémantiquedesétatsdel'automate

A Q

^,orrespondantà larequêtedebase

Q =

^//

∗

^[axis::

σ

^℄,^est^présentée^dans^la^Table^4.1. ^Soit^un^état

(ℓ, x)

^assigné ^à ^un ^n÷ud

v

^de

G t

^,^par ^le^run ^de ^l'automate

A _Q

^,^évaluant ^la^requête

Q

^sur

t

^. ^La ^première ^omposante

ℓ

^, ^nous ^dit ^si ^le ^n÷ud

v

^répond ⁽

ℓ ∈ {s, ⊤ ^′ }

⁾ ^ou

non(

ℓ ∈ {η, ⊤}

⁾ ^à^la^requête

Q

^. ^La^deuxième ^omposante

x = 1

^(resp.

x = 0

^),^nous

informesilen÷ud

v

^possèdeâu^moinsûn^(resp. ^ne^possèdeâuun)^n÷ud^desendant

qui répond à

Q

^. ^Par ^suite, onformément à la sémantique présentée dans la Table 4.1, les états

(s, 1)

^et

(⊤ ^′ , 1)

^seront ^appelés séletionnant. Le onept d'utiliser des étatsenformedeouplesesttrèspratique,arilpermetdereprésenterlaREPONSE

à larequête

Q

^,^d'une ^façon ônise. Ên êet,^pour représenter la partie du rlag

G t

quiontienttouteslesréponsesà

Q

^,îl^sut^de^garder^seulement ês^n÷udsâuxquels

lerun a assignéunétat dont ladeuxièmeomposanteest

1

^(voir^l'Exemple ^4.4).

nom d'état assignable au n÷ud

v

^tel ^que

(s, 1) llab(v) 6= σ

^et

v

^est ^une ^réponse^à

Q (η, 1) llab(v) 6= σ

^et

v

^n'est ^pas^une ^réponse^à

Q

maisilexiste un desendant de

v

^répondant ^à

Q (η, 0) llab(v) 6= σ

^et

v

^n'est ^pas^une ^réponse^à

Q

etauun desendant de

v

^n'est ^pas^une ^réponse^à

Q (⊤ ^′ , 1) llab(v) = σ

^et

v

^est ^une ^réponse^à

Q

(⊤ , 1) llab(v) = σ

^et

v

^n'est ^pas^une ^réponse^à

Q

maisilexiste un desendant de

v

^répondant ^à

Q (⊤, 0) llab(v) = σ

^et

v

^n'est ^pas^une ^réponse^à

Q

etauun desendant de

v

^n'est ^pas^une ^réponse^à

Q init llab(v) = Root

^ou

llab(v) = Root _i

Table4.1. Lasémantiquedesétatsdel'automate

A Q

orrespondantà

Q =

^//

∗

^[axis::

σ

^℄

Surl'ensemble desllpaires,on introduit unordre partiel, ditordre depriorité :

(η, 0) > (η, 1) > (s, 1)

^et

(⊤, 0) > (⊤, 1) > (⊤ ^′ , 1).

L'unique run de

A Q

^évaluant ^la ^requête

Q

^, ^sera ^appelé ^run ^de ^priorité ^maximale.

Pouronstruireerun,onutiliseequ'onappelleunestratégiedeprioritémaximale,

quiexigequelerun

r

^de^l'automate

A _Q

^sur^le^rlag

G t

^doive^être^une ^fontion^totale,

etpourtoutn÷ud

v

^de

G t

^,^la^llpaire

r(v)

^doive^être^la^plusprioritairepossibleparmi toutes les llpairesqui peuvent être assignéesà

v

^en ^utilisant ^lestransitions de

A _Q

Cettestratégieexpliquelehoixde prioritéentrelesllpaires: onpose

(l, 0) > (l, 1)

pour nepas assigner

(l, 1)

^à ûn ^n÷ud^qui ômmeneûne ^branhe ôu îl ^n'yâ ^pas^de

n÷uds répondant à

Q

^, ^et

(l, 1) > (l ^′ , 1)

^pour ^ne ^passéletionner des n÷uds qui ne répondent pasà

Q

^. ^Voii ^la^dénition^formelle ^du ^run ^de^priorité ^maximale.

Dénition 4.4. (MP) Soientunerequête debase

Q

^,^l'automate

A _Q

orrespondant, un doument

t

^, ^et ^son ^rlag

G t

âssoié. Ûne âppliation

r : N odes _G _t → States Q

^est

appelée runde priorité maximale de

A _Q

^sur

G t

^si^et ^seulement ^si, ^pour ^tout^n÷ud

v

G t

^,^elle^satisfait ^les ^onditions ^suivantes ^:

• r(v)

^est ^déni ⁽

r

^est ^totale),

• r(v)

^est ^déterminé ^par

llab(v)

•

^pour ^haque ^n÷ud

w

^parent ^de

v

^, ^l'automate

A _Q

^ontient ^la ^transition ^de ^la

forme

(r(w), llab(v)) → r(v)

• r(v)

^est ^la ^llpaire ^maximale ^par ^rapport ^à ^l'ordre ^de ^priorité, ^qui ^satisfait ^les

onditions préédentes.

Remarquons que la deuxième et la troisième ondition de la dénition idessus,

impliquent que le run de priorité maximale de

A Q

^sur

G t

êst ^bien ûn ^run âu ^sens

de la dénition 4.3. La quatrième ondition de la Dénition 4.4 garantit que le

run de priorité maximale de

A _Q

^sur

G t

êst ûnique. ^Grâe ^à êtte ûniité, ôn ^dira

que l'automate

A Q

êst ^nonambigu, êt ^par ^la ^suite ôn ^ne ^sera întéressé ^que ^par

le run de priorité maximale. Sans mention ontraire, le mot run désignera le run

de priorité maximale. On prouve dans la Proposition 4.1, que le run de priorité

maximale de

A _Q

^sur

G t

^, ^est ^le ^seul ^run ^qui ^permette ^d'évaluer ^la ^requête

Q

^sur ^le

doument

t

^. ^Dans ^la ^Setion ^4.5 ôn ^donne ûn âlgorithme ^qui ônstruit ^le ^run ^de

priorité maximalede l'automate

A Q

^,^sur^un^rlag^donné

G t

^. ^On^y^montre^également,

qu'une telleonstrution est linéaire par rapportaunombred'arêtesde

G t

4.3.1. Requêtes utilisant les axes vertiaux

Dansette setionon présente les automates

A _Q

orrespondant auxrequêtes de base

Q =

^//

∗

^[axis::

σ

^℄,ôùâxisêst^self, ^hild,^parent,^desendant,ânestor.

Automate pour

Q =

^//

∗

^[self::

σ

^℄

La Figure 4.4 présente l'automate

A Q

^, ^permettant ^d'évaluer ^la ^requête ^de ^base

Q =

^//

∗

^[self::

σ

^℄. ^Cet ^automate^n'a^que^quatre^états ^:

init, (η, 0), (η, 1)

^et

(⊤ ^′ , 1)

σ init

η , 1

T ’ , 1

= σ γ

= σ

= σ γ γ

= σ γ

η , 0

σ σ

Figure 4.4. Automate

A Q

^,^où

Q =

^//

∗

^[self::

σ

^℄

Ce sont les seules llpaires onformesave la sémantiquedonnée dansla Table 4.1.

Dans le document Automates pour l'analyse de documents XML compressés, applications à la sécurité d'accès (Page 42-98)

Pouvoir d'expression de la vue lausale pour le ontrle d'aès

Chapitre 3. Évaluation de requêtes et ontrle d'aès

3.7. Pouvoir d'expression de la vue lausale pour le ontrle d'aès

K

t

K : N odes t ∪Att → 2 U ser

K(x)

•

u

t

K(u)

B

B

u

v

← U ser(B), u. ∗ [B 6∈ K(u)]

← U ser(B), v. ∗ [B 6∈ K(u), u.∗

v.∗]

•

att

u

K (att)

B

B

att

← U ser(B), u.att [B 6∈ K(att)]

B

Q

t

P

B 6∈ K(u)

S Q

u

Hist B

U ser(B) ←

u.∗ ←

Hist B

v.∗ ←

[u.∗

v.∗] ←

v

u

u

Acc : N odes t → {−r, −R}

•

u

← U ser(∗), u. ∗ [Acc(u) = −r]

•

u

← U ser(∗), u. ∗ [Acc(u) = −R]

← U ser(∗), v. ∗ [Acc(u) = −R, u.∗

v.∗]

Q

t

Q

b t

t

a

Σ

Σ

t = ((N odes t , Edges t ), name t )

(N odes t , Edges t )

root t

name t : N odes t → Σ

v

t

name t (v) ∈ Σ

Σ

Σ

Σ = {a, b, f }

compressé

f

a b

a a

f

a b

f

a b a

arbre partiellement

compressé totalement

K : N odes _t ∪Att → 2 ^{U ser}

Hist _B

Acc : N odes _t → {−r, −R}

t = ((N odes t , Edges _t ), name t )

(N odes t , Edges _t )

name _t : N odes _t → Σ

name _t (v) ∈ Σ

pos _t (v)

v 6= root _t

pos _t (v) = {α.i | α ∈ pos _t (w),

w ∈ P arents _t (v)

γ(w) = (u 1 , . . . , u _i−1 , v, u _i+1 , . . . , u _n )}

P os _t = [

pos _t (v).

name _t (α) = name _t (v),

α ∈ pos _t (v).

N odes _t

P os _t

N odes _b _t = P os _t ,

Edges _b _t = {(α, α.i) | α, α.i ∈ P os _t },

name _b _t (α) = name _t (α).

c : N odes _b _t → N odes _t

A _i

A i → σ(A j ₁ , . . . , A j _k )

Sons(A _i ) = {A j 1 , . . . , A _j _k }

symb _L _t (A _i ) = σ