• Aucun résultat trouvé

Synthese et Classi cation des portees

Dans notre etude, nous avons considere les trois types de relations qui sont a la base de notre modele de representation du document structure et nous avons montre que chacun de ces types de relations peut ^etre utilisepour de nir une portee. Chaque type de relation structurelle

engendre un type de portee particulier admettant sa propre semantique et repercutant pour chaque attribut le sens de la relation de structure au niveau des attributs.

Nous etablissons une classi cation des attributs qui depend de leur type de portee:

Portee vide

: ce type de portee n'est lie a aucune relation particuliere puisque l'attribut est dit statique et que l'information contenue ne concerne aucun des elements structurels voisins de

o

.

Attribut Statique

(AS): l'attribut ne se propage pas.

Les portees au sein du document se de nissent par le triplet suivant pour lequel aucun fonction de combinaison n'est speci ee puisqu'elle n'est pas utile4.

(

OS

;

P ;

;

)

Chaque element deP ;compse de nit alors de la maniere suivante pour un element

o

de

OS

. Dans cette de nition, nous ne speci ons pas de relation de structure particuliere, ni de fonction d'acces, ni de fonction de propagation, ni de condition d'appartenance.

Po ; = (

;o;



;static;



;



;

)

Portee liee a la relation de composition structurelle

: ce type de portee, soutenu par la relation de composition, met en evidence l'aggregation des informations dans le docu-ment structure au niveau des attributs. Ce type de portee explicite aussi la dissemination des informations dans les di erentes parties du document structure.

De maniere simpli catrice, les informations s'aggregent en remontant vers la racine du document et elles se disseminent en descendant vers les feuilles. Ce type de portee re ete l'organisation des informations au sein d'une arborescence et elle est comparable a tout outil elabore en plusieurs composants. Chaque composant independamment des autres comporte des fonctionnalites de base qui lui sont propres. L'assemblage de l'ensemble des composants lie ces fonctionnalites de base et o re alors des fonctionnalites globales. Le comportement des informations selon la relation de composition est assez similaire. Chaque element de structure comporte des informations speci ques qui aggregees les unes aux autres forment les informations du document structure complet.

Les portees d'un attribut

selon la relation de composition, au sein d'un document structure, se de nissent par le triplet suivant:

(

OS

;

P ;comp

;combine

)

Nous avons identi e deux classes d'attributs basees sur la relation de composition. Cette classi cation est dirigee par le sens de propagation des informations. Nous donnons pour chaque classe la de nition d'une portee deP ;comppour un element structurel

o

de

OS

.

Attribut de composition Ascendant

(AcA): l'attribut se propage vers le ou les ascendants structurels.

Po ;comp= (

;o;

comp

;pred;value

(

o

)

;f

;cond

)

4:La notation * signi e qu'il s'agit d'une information qui n'a pas besoin d'^etre precisee puisqu'elle va rester inutilsee

Attribut de composition Descendant

(AcD): l'attribut se propage vers le ou les descendants structurels.

Po ;comp= (

;o;

comp

;succ;value

(

o

)

;f

;cond

)

Portee liee a la relation de sequence

: ce type de portee, reposant sur la relation de sequence, exprime les dependances semantiques liees a l'ordonnancement sequentiel. Elle permet de retrouver des attributs indiquant le positionnement des elements de structure au sein du document structure. Par ailleurs, selon le type de structure des documents, et donc le domaine d'application, ce type de portee peut s'averer utile pour propager des informations; exemple de la gestion des versions.

Les portees d'un attribut

selon la relation de sequence, au sein d'un document struc-ture, se de nissent par le triplet suivant:

(

OS

;

P ;seq

;combine

)

La relation de sequence fournit deux classes d'attributs qui dependent la encore du sens de propagation des informations dans leurs portees. Nous donnons pour chaque classe la de nition d'une portee de P ;seq pour un element structurel

o

de

OS

.

Attribut sequentiel Arriere

(AsB): l'attribut se propage vers le ou les predecesseurs sequentiels.

Po ;seq= (

;o;

seq

;pred;value

(

o

)

;f

;cond

)

Attribut sequentiel Avant

(AsF): l'attribut se propage vers le ou les successeurs sequentiels.

Po ;seq= (

;o;

seq

;succ;value

(

o

)

;f

;cond

)

Portee liee aux relations de references

: ce type de portee, reposant sur les relations de reference, permet d'incorporer dans la representation des informations provenant du contenu des documents. L'incorporation de ces informations est re etee par la creation d'attributs et leur valuation basee sur le contenu de l'element source.

(

OS

;

P ;ref

;combine

)

Dans l'ensemble

OS

se trouvent les elements sources de la relation de reference qui n'admettent pas obligatoirement une valeur pour l'attribut

considere.

Nous considerons une unique classe d'attributs pour les relations de reference.

Attribut de reference

(AR): la portee de ce type d'attributs correspond a l'element cible d'une relation de reference  ref.

Pour un element

o

de

OS

, chaque portee appartenant a P ;ref se de nit de la maniere suivante:

L'approche proposee ici pour decrire la portee des attributs au sein du document struc-ture reste tres ouverte [FMB97]. Pour un type de document strucstruc-ture donne, elle permet de de nir une structure d'indexation [FM96] propre a chaque attribut. Nous sommes restes ici independant d'un domaine d'application mais la notion de structure d'indexation reste une notion incontournable dans la recherche des documents structures. La structure d'indexation represente un sous-ensemble de la structure complete du document, c'est-a-dire l'ensemble des elements structurels susceptibles d'^etre interessants en tant que reponse a une requ^ete. Ce choix de conserver un type d'element structurel dans la structure d'indexation peut par exemple dependre du type de l'element, de son contenu ou encore de sa taille.

Dans le cadre de l'indexation d'encyclopedies, il est plus que probable que l'utilisateur ne souhaite pas retrouver une encyclopedie complete qui, bien qu'elle contienne de l'information susceptible de repondre a son besoin, est d'une telle taille qu'il devra fouiller l'encyclopedie complete et e ectuer sa propre recherche. Ce type d'element doit donc ^etre ecarte, comme d'autres, des reponses possibles. Ceci est possible gr^ace a la structure d'indexation.

Nous avons donne dans l'application PRIME-GC [FM96, MMFB97, BFM+97, BFMM97] une structure d'indexation aux documents medicaux que nous avons indexes. Ainsi la struc-ture complete des documents contient des series d'images medicales composees d'images qui n'etaient pas toutes pertinentes puisque certaines ne contenaient pas d'informations interes-santes ou n'etaient pas \lisibles". La structure d'indexation contient donc uniquement les images medicales qui laissaient appara^tre des informations interessantes c'est-a-dire des in-formations qui nous permettent de discriminer le contenu de ces images des autres.

Gr^ace a ce que nous avons presente, chaque attribut peut dorenavant admettre sa propre structure d'indexation decrite par l'intermediaire de la relation

rel

au sein de l'ensemble des elements structurels d'un document structure (

OS

). Cet ensemble est complete par les elements des portees de cet attribut. La structure d'indexation d'un attribut correspond a l'ensemble des elements d'un document qui sont concernes par cet attribut, c'est-a-dire qui admettent une valeur pour cet attribut. C'est aussi la structure d'indexation d'un attribut qui va de nir quels elements sont interreogeables par cet attribut. Si un element appartient a la structure d'indexation d'un attribut

alors il pourra ^etre retrouve par une requ^ete contenant un critere sur

.