::: o2 ::: o1 o
Figure 6.8.
La relation etendue des attributs structurels fournit un sur-ensemble Nos regles de construction de la relationR0
ST fournissent un sur-ensemble des contraintes que doivent respecter le document au niveau des instances.
b) Les attributs de contenu
La relationRM denissant les attributs de contenu s'exprime en fonction des medias. Nous imposons que chacun des attributs de contenu soit un attribut de composition ascendant an
de n'avoir a indexer, et donc a valuer, que les elements monomedias qui sont les feuilles de la structure. Le contenu de ces attributs se propage par la suite vers la racine du document (comportement d'un attribut de composition ascendant).
Par ailleurs, nous avons une contrainte sur les compositions de media au niveau des types structurels qui dit que si un type structurel
t
est un super-type det
0 alors il reprend les medias det
0:8
m
tel queT(t
0;m
) ett
tcompt
0)T(
t;m
)Cette propriete ajoutee au fait que ce sont les elements monomedias feuilles de structure qui sont indexes, nous permet de verier que l'extension de la relationRM est inutile puisque nous ne rajoutons pas d'attributs pour les medias. Nous ne faisons que propager les valeurs des attributs des elements monomedias feuilles de structure.
6.7.3 Les attributs de reference
Les relations de reference et par extension, les attributs de reference, comportent des in-formations supplementaires ou complementaires par rapport a l'indexation classique. Il s'agit d'ajouter des informations qui apparaissent dans le contenu d'un element de structure du do-cument et qui referent un autre element de structure du dodo-cument. Ce type d'ajout a montre son inter^et dans [Par96] pour l'indexation de documents textuels ou encore dans [HSD97] an d'aider a la recherche d'images xes dans un environnement hypertextuel.
Nous considerons les relations de reference comme des elements qui peuvent nous ap-porter de l'information supplementaire pour decrire le document et donc pour le retrouver. Cependant, la portee selon la relation de reference pourrait introduire des incoherences. Une relation de reference peut par exemple avoir pour cible un element structurel de type
t
et lui transmettre, via sa portee, un attribut de noma
alors que la relationRST(t;a
) n'existe pas.Nous considerons les relations du modele de document etenduR 0
ST etR
0
M et verions que ce modele autorise l'application d'une portee utilisant une relation de reference, c'est-a-dire que l'element structurel cible de la relation peut admettre cet attribut.
Ceci peut se transformer selon les deux regles suivantes:
Regle 6.7.3.1 (Attribut structurel de reference)
L'attribut structurel de nom
a
, ainsi que sa valeur, est transmis vers un element structurel de typet
via une portee denie selon la relation de reference si et seulement si la relationR 0 ST(
t;a
) existe.EP
o;ref =fo
igssi
R 0 ST(type
str(o
i);
)Regle 6.7.3.2 (Attribut de contenu de reference)
L'attribut de contenu de nom
b
, ainsi que sa valeur, est transmis vers un element structurel de mediam
via une portee denie selon la relation de reference si et seulement si la relationR 0
EP
o;ref =fo
jgssi
R 0M(
media
(o
j);
)Les portees decrites selon des relations de reference qui ne verient pas l'une de ces deux regles, 6.7.3.1 et 6.7.3.2, seront ignorees. Ne pas poser cette contrainte signie que c'est le contenu du document qui aurait guide la creation des attributs dans le modele de document etendu. Il nous semble preferable de conserver un modele de document etendu independant du contenu des documents.
6.8 Resolution de con its sur les portees
Le modele de document etendu integre la portee des attributs. Nous allons decrire main-tenant comment se deroule la phase de resolution de con its et nous separons les con its lies a la relation de reference des con its lies aux autres relations (relation de sequence et relation de composition).
6.8.1 Recapitulatif
La resolution de con its correspond a la phase de valuation des attributs du document structure. Nous avons en entree de cette phase un document structure et des informations indiquant la classication de chaque attribut de ce document. Cependant les contraintes decrites au niveau du document (page 155) ne sont pas encore veriees. Cette phase va consister a retablir systematiquement des portees veriant ces contraintes.
Dans cette phase de resolution de con its, nous distinguons sur la gure 6.9 les trois types de portees liees aux trois relations structures du document. Cette gure schematise l'ordonnancement des traitements.
Résolution des Traitement des Refs
conflits liés aux références
Traitement des Seq
la séquence Résolution des
conflits liés à
Traitement des Comp
la composition Résolution des conflits liés à
Etat Initial Etat final
Valuation Document structuré attributs Classfication des Etendu Modèle de Document Document structuré final
Figure 6.9.
Le traitement des porteesEn premier lieu, les portees denies selon une relation de reference sont traitees. En eet, si par exemple, l'attributauteurdans un document est un attribut de composition ascendant
et qu'une relation de reference genere un attributauteursur un element alors l'attribut genere est un attribut de composition ascendant.
Nous rappelons que la portee d'attribut ne peut ^etre a la fois denie selon la relation de composition et selon la relation de sequence. Ces portees sont donc independantes et peuvent donc ^etre traitees dans un ordre indierent sans alterer le resultat de ce traitement.
Nous avons deni la notion de portee d'un attribut permettant d'expliciter les dependances entre les valeurs d'attribut du document structure. Il est essentiel de verier que chaque element appartenant a un ensemble decrivant une portee admette une unique valeur pour l'attribut concerne.
Les deux regles qui suivent sont des rappels des contraintes enoncees page 155 et elles ne concernent que la relation de composition et la relation de sequence.
Nous devons verier la contrainte 6.3.3.1 (de la page 155) pour qu'un element source n'appartienne pas a un ensemble decrivant une portee:
8
o
i;o
j 2OS
; o
i=6o
j :o
i26EP
oj;rel
Nous devons de plus verier la contrainte 6.3.3.2 (de la page 155) pour que les ensembles decrivant les portees soient disjoints deux a deux:
8
o
i;o
j 2OS
; o
i=6o
j :EP
;reloi \EP
oj;rel =;
Nous allons tout d'abord traiter les con its lies aux relations de reference puis nous pas-serons aux con its lies aux relations de composition et de sequence.
6.9 Con its lies a la relation de reference
Les con its lies a la relation de reference peuvent avoir dierentes origines donc plusieurs sortes de resolutions.
{ L'attribut transmis sur le type de l'element cible de la relation de reference dans le modele de document etendu n'est pas deni au niveau de l'element cible. Nous ne mettons pas cet attribut et ignorons sa portee car sinon cela signierait que nous trans-gressons les regles etablies par le modele de document etendu.
{ L'existence prealable d'une valeur pour l'attribut transmis sur l'element cible de la re-lation de reference. Il nous faut donc combiner la valeur de l'attribut de l'element cible avec celle transmise (fonction
combine
).Le premier type de con it conduit a ignorer la portee an d'assurer la coherence avec le modele de document etendu.
Par contre, pour le second type de con it, nous montrons comment se deroule la trans-mission de la valeur et la combinaison de celle-ci avec la valeur de l'attribut de l'element cible de la relation de reference.
Soit l'element cible, note
o
c, l'attribut et l'element source de la relation de reference, noteo
s:o
c:
=v
etextract
(o
s) =v
0
L'application de la fonction de combinaison nous mene aux trois cas suivants, valeur nulle, ltrage et combinaison. Nous utilisons la relation de reference suivante:Echenoz est l'auteur du chapitre 5(decrite dans la section 6.4.2, page 159). Soit
o
5 l'element de structure representant le chapitre 5 eto
l'element de structure representant l'element source.1. valeur nulle: la valeur