• Aucun résultat trouvé

b) Les attributs de contenu

::: o2 ::: o1 o

Figure 6.8.

La relation etendue des attributs structurels fournit un sur-ensemble Nos regles de construction de la relationR

0

ST fournissent un sur-ensemble des contraintes que doivent respecter le document au niveau des instances.

b) Les attributs de contenu

La relationRM de nissant les attributs de contenu s'exprime en fonction des medias. Nous imposons que chacun des attributs de contenu soit un attribut de composition ascendant a n

de n'avoir a indexer, et donc a valuer, que les elements monomedias qui sont les feuilles de la structure. Le contenu de ces attributs se propage par la suite vers la racine du document (comportement d'un attribut de composition ascendant).

Par ailleurs, nous avons une contrainte sur les compositions de media au niveau des types structurels qui dit que si un type structurel

t

est un super-type de

t

0 alors il reprend les medias de

t

0:

8

m

tel queT(

t

0

;m

) et

t

tcomp

t

0

)T(

t;m

)

Cette propriete ajoutee au fait que ce sont les elements monomedias feuilles de structure qui sont indexes, nous permet de veri er que l'extension de la relationRM est inutile puisque nous ne rajoutons pas d'attributs pour les medias. Nous ne faisons que propager les valeurs des attributs des elements monomedias feuilles de structure.

6.7.3 Les attributs de reference

Les relations de reference et par extension, les attributs de reference, comportent des in-formations supplementaires ou complementaires par rapport a l'indexation classique. Il s'agit d'ajouter des informations qui apparaissent dans le contenu d'un element de structure du do-cument et qui referent un autre element de structure du dodo-cument. Ce type d'ajout a montre son inter^et dans [Par96] pour l'indexation de documents textuels ou encore dans [HSD97] a n d'aider a la recherche d'images xes dans un environnement hypertextuel.

Nous considerons les relations de reference comme des elements qui peuvent nous ap-porter de l'information supplementaire pour decrire le document et donc pour le retrouver. Cependant, la portee selon la relation de reference pourrait introduire des incoherences. Une relation de reference peut par exemple avoir pour cible un element structurel de type

t

et lui transmettre, via sa portee, un attribut de nom

a

alors que la relationRST(

t;a

) n'existe pas.

Nous considerons les relations du modele de document etenduR 0

ST etR

0

M et veri ons que ce modele autorise l'application d'une portee utilisant une relation de reference, c'est-a-dire que l'element structurel cible de la relation peut admettre cet attribut.

Ceci peut se transformer selon les deux regles suivantes:

Regle 6.7.3.1 (Attribut structurel de reference)

L'attribut structurel de nom

a

, ainsi que sa valeur, est transmis vers un element structurel de type

t

via une portee de nie selon la relation de reference si et seulement si la relation

R 0 ST(

t;a

) existe.

EP

o ;ref =f

o

ig

ssi

R 0 ST(

type

str(

o

i)

;

)

Regle 6.7.3.2 (Attribut de contenu de reference)

L'attribut de contenu de nom

b

, ainsi que sa valeur, est transmis vers un element structurel de media

m

via une portee de nie selon la relation de reference si et seulement si la relation

R 0

EP

o ;ref =f

o

jg

ssi

R 0

M(

media

(

o

j)

;

)

Les portees decrites selon des relations de reference qui ne veri ent pas l'une de ces deux regles, 6.7.3.1 et 6.7.3.2, seront ignorees. Ne pas poser cette contrainte signi e que c'est le contenu du document qui aurait guide la creation des attributs dans le modele de document etendu. Il nous semble preferable de conserver un modele de document etendu independant du contenu des documents.

6.8 Resolution de con its sur les portees

Le modele de document etendu integre la portee des attributs. Nous allons decrire main-tenant comment se deroule la phase de resolution de con its et nous separons les con its lies a la relation de reference des con its lies aux autres relations (relation de sequence et relation de composition).

6.8.1 Recapitulatif

La resolution de con its correspond a la phase de valuation des attributs du document structure. Nous avons en entree de cette phase un document structure et des informations indiquant la classi cation de chaque attribut de ce document. Cependant les contraintes decrites au niveau du document (page 155) ne sont pas encore veri ees. Cette phase va consister a retablir systematiquement des portees veri ant ces contraintes.

Dans cette phase de resolution de con its, nous distinguons sur la gure 6.9 les trois types de portees liees aux trois relations structures du document. Cette gure schematise l'ordonnancement des traitements.

Résolution des Traitement des Refs

conflits liés aux références

Traitement des Seq

la séquence Résolution des

conflits liés à

Traitement des Comp

la composition Résolution des conflits liés à

Etat Initial Etat final

Valuation Document structuré attributs Classfication des Etendu Modèle de Document Document structuré final

Figure 6.9.

Le traitement des portees

En premier lieu, les portees de nies selon une relation de reference sont traitees. En e et, si par exemple, l'attributauteurdans un document est un attribut de composition ascendant

et qu'une relation de reference genere un attributauteursur un element alors l'attribut genere est un attribut de composition ascendant.

Nous rappelons que la portee d'attribut ne peut ^etre a la fois de nie selon la relation de composition et selon la relation de sequence. Ces portees sont donc independantes et peuvent donc ^etre traitees dans un ordre indi erent sans alterer le resultat de ce traitement.

Nous avons de ni la notion de portee d'un attribut permettant d'expliciter les dependances entre les valeurs d'attribut du document structure. Il est essentiel de veri er que chaque element appartenant a un ensemble decrivant une portee admette une unique valeur pour l'attribut concerne.

Les deux regles qui suivent sont des rappels des contraintes enoncees page 155 et elles ne concernent que la relation de composition et la relation de sequence.

Nous devons veri er la contrainte 6.3.3.1 (de la page 155) pour qu'un element source n'appartienne pas a un ensemble decrivant une portee:

8

o

i

;o

j 2

OS

; o

i=6

o

j :

o

i26

EP

oj

;rel

Nous devons de plus veri er la contrainte 6.3.3.2 (de la page 155) pour que les ensembles decrivant les portees soient disjoints deux a deux:

8

o

i

;o

j 2

OS

; o

i=6

o

j :

EP

;reloi \

EP

oj

;rel =;

Nous allons tout d'abord traiter les con its lies aux relations de reference puis nous pas-serons aux con its lies aux relations de composition et de sequence.

6.9 Con its lies a la relation de reference

Les con its lies a la relation de reference peuvent avoir di erentes origines donc plusieurs sortes de resolutions.

{ L'attribut transmis sur le type de l'element cible de la relation de reference dans le modele de document etendu n'est pas de ni au niveau de l'element cible. Nous ne mettons pas cet attribut et ignorons sa portee car sinon cela signi erait que nous trans-gressons les regles etablies par le modele de document etendu.

{ L'existence prealable d'une valeur pour l'attribut transmis sur l'element cible de la re-lation de reference. Il nous faut donc combiner la valeur de l'attribut de l'element cible avec celle transmise (fonction

combine

).

Le premier type de con it conduit a ignorer la portee a n d'assurer la coherence avec le modele de document etendu.

Par contre, pour le second type de con it, nous montrons comment se deroule la trans-mission de la valeur et la combinaison de celle-ci avec la valeur de l'attribut de l'element cible de la relation de reference.

Soit l'element cible, note

o

c, l'attribut

et l'element source de la relation de reference, note

o

s:

o

c

:

=

v

et

extract

(

o

s) =

v

0

L'application de la fonction de combinaison nous mene aux trois cas suivants, valeur nulle, ltrage et combinaison. Nous utilisons la relation de reference suivante:Echenoz est l'auteur du chapitre 5(decrite dans la section 6.4.2, page 159). Soit

o

5 l'element de structure representant le chapitre 5 et

o

l'element de structure representant l'element source.

1. valeur nulle: la valeur

v

de l'attribut

de l'element cible est nulle:

v

=

NULL

. Nous considerons que cette valeur nulle existe pour tout domaine d'attribut et qu'elle correspond a un attribut non value. L'attribut

de cet element cible prend donc la valeur transmise par la relation de reference.