• Aucun résultat trouvé

Representation du document

e) Contraintes sur les attributs

5.7.4 Representation du document

Nous allons donner une partie de la representation du document presente dans la gure 5.1 de la page 126. Nous donnons ici uniquement la structure logique de ce document.

Nous considerons que le document complet est represente par l'element structurel

o

de type Journal. Cet element est la racine de la hierarchie structurelle. Nous donnons dans la gure qui suit ( gure 5.2) quelques-uns des elements structurels qui sont des composants de l'element

o

.

{ Soit l'element structurel

o

2 de type Titre qui est un composant direct de l'element

o

:

o

comp

o

2.

{ Soit l'element structurel

o

3 de type SousTitrequi est un composant direct de l'element

o

:

o

comp

o

3, et qui est le successeur direct de l'element

o

2:

o

2 seq

o

3.

{ Soit l'element structurel

o

4 de typeLaUne qui est un composant direct de l'element

o

:

o

comp

o

4, et qui est le successeur direct de l'element

o

3:

o

3 seq

o

4. Cet element est compose d'autres elements logiques:

{ Soit l'element structurel

o

41de type Titrequi est un composant direct de l'element

o

4:

o

4 comp

o

41.

{ Soit l'element structurel

o

42 de type SousTitre qui est un composant direct de l'element

o

4:

o

4 comp

o

42, et qui est le successeur direct de l'element

o

41:

o

41seq

Monde. Clinton demande une ristourne à l’ONU France. Fabius: «Il faut développer l’initiative parlementaire» Vous. Petits arrangements avec sa mort Economie. Retraite accélérée pour les vieux travailleurs Eureka. 100e tir d’Ariane: le train-train de la fusée Culture. Ecrivain en Iran, la condition inhumaine Les autres jours de la semaine La Une de Libération en PDF Avant-projet de loi sur l’immigration Bill Gates croque une part d’Apple Avant-projet de loi Chevènement sur l’immigration La mort de Lady Di et la presse «people» L’accord Microsoft-Apple La politique gouvernementale en faveur du numérique Pour un parti techno ?

Mardi 23 septembre 1997

La privatisation partielle (à hauteur de 20 % de son capital)

de France Télécom est une première: jamais auparavant une

entreprise publique française n’avait été introduite en Bourse.

A l’étranger, les investisseurs institutionnels parient sur le boom des télécoms. L’Etat espère tirer de l’opération 36 milliards de francs, qui financeront le développement international de France Télécom

au moment de l’ouverture du téléphone fixe à la concurrence,

le 1er janvier 1998. Lire également l’éditorial de

Laurent Joffrin. © Libération

A l’occasion de la sortie du nouvel album de XIII, gagnez des A/R Paris/New-York et plus de 100 cadeaux «XIII» Tribunes, analyses, éditoriaux,... Cahier Livres du 18 septembre Cahier Multimedia du 19 septembre Jodie Foster Easy Rider, la sieste, Hammett, l’histoire secrète de la dissolution, Sojourner sur Mars... Spécial emploi-formation du 22 septembre Offres d’emploi, formations, voyages... Les E-mail par service Les tarifs des abonnements, des annonces et de la publicité. Titre : o511 LaUne : o4 SousTitre : o42 Illustration : o43 Paragraphe : o44 Rubrique : o51 Date : o3 Titre : o2 LesColonnes : o5 Manchette : o512 Titre : o41

Figure 5.2.

Representation d'un Document Structure

{ Soit l'element structurel

o

43 de type Illustration qui est un composant direct de l'element

o

4:

o

4 comp

o

43, et qui est le successeur direct de l'element

o

42:

o

42seq

o

43.

{ Soit l'element structurel

o

44 de type Paragraphe qui est un composant direct de l'element

o

4:

o

4 comp

o

44, et qui est le successeur direct de l'element

o

43:

o

43seq

o

44.

{ Soit l'element structurel

o

5 de typeLesColonnesqui est un composant direct de l'element

o

:

o

comp

o

5, et qui est le successeur direct de l'element

o

4:

o

4 seq

o

5. Comme le montre la gure 5.3, cet element structurel est compose d'autres elements de type

Rubrique,Titre,Manchettes, etc.

Conformement au modele que nous proposons, nous devons aussi considerer les autres relations de structure c'est-a-dire les relations de reference presentes dans ce document. La plupart des elements de structure de ce document presente la particularite de referer un autre element structurel de ce m^eme document. En e et, l'exemple que nous considerons correspond a une premiere page de journal qui contient les \titres" des articles contenus dans le document complet. Par exemple, l'element structurel correspondant a la \Une" du journal refere des articles du journal correspondant a d'autres elements structurels dans la representation du document. En fait, cette page est extraite d'un site web et elle comporte des liens hypertextuels qui pour notre modele de representation peuvent ^etre assimiles a des relations de references. Ainsi chaque element de typeManchetterefere un article du document

LesColonnes

Date LaUne

Rubrique Paragraphe

Titre SousTitre Illustration

T Titre D Journal Rubrique o42 o41 o o o1 o2 o2 o1 o3 o o4 o5 o51 o52 ::: o43 o44 o2 les donnees D o1est suivi deo2 o1est compose deo2 L'element o est de type T L'element o contient

Figure 5.3.

Arborsecence du Document Structure

complet. Si nous ne considerons pas explicitement de liens hypertextuels dans notre modele, la relation de reference est un moyen pour les representer.

5.7.5 Conclusion

Pour conclure ces chapitres consacres a la modelisation des documents structures m^elant du texte et des images xes, nous avons donne un exemple de document structure que nous representons a l'aide de notre modele. Ce modele necessite la de nition d'un type de structure comportant des types d'elements structurels lies entre eux. Ces types proposent a la fois de representer les abstractions de la structure logique du document structure, la structure linguistique du texte ainsi que la structure interne des objets de l'image.

Le type de structure de notre modele contient aussi des informations liees aux medias utilises dans le document. Il permet de speci er quels types d'elements structurels acceptent quels medias. D'autre part, ce modele propose une representation uniforme des descripteurs de ces elements structurels a travers les attributs. Nous proposons des attributs dont les domaines se confondent avec des langages d'indexation venant de la recherche d'information. Il est ainsi possible d'avoir des attributs classiques propres aux bases de donnees qui cohabitent avec des attributs donnant une representation du contenu semantique de chaque element

et qui utilisent des formalismes de representation de la connaissance plus avances (graphes conceptuels, logiques descriptives, etc).

Ces attributs contiennent les informations qui peuvent permettre de retrouver un docu-ment, que ce soit une date, un auteur ou encore le contenu semantique de l'element structurel. A partir de cette representation, chaque element structurel decrit par un attribut est un ele-ment retrouvable, c'est-a-dire qui peut repondre a un besoin formule dans la requ^ete d'un utilisateur.