• Aucun résultat trouvé

Les documents multimedias

b) Usage de la structure lors de l'interrogation

2.5 Les documents multimedias

Les documents multimedias presentent la particularite d'englober tout les types de docu-ments que nous avons vus precedemment. Ces docudocu-ments restent encore delicats a manipuler dans le cadre d'applications cherchant a les modeliser et a les rechercher. Avec ce type de

documents, les SGBD et les SRI tendent vers des travaux communs puisqu'il est apparu necessaire de representer le contenu semantique de ces documents.

Comme pour les documents structures avec la norme SGML, les documents multimedias sont en cours de normalisation. Ainsi, nous en sommes au stade ou plusieurs normes sont en cours de developpement, principalement MHEG [Pri93] et HyTime (Hypermedia/Time-based Structuring Language) [Erf94, DD94], et il devient maintenant imperatif de fournir des applications reposant sur ces normes a n de demontrer leurs capacites. HyTime est construit au dessus de SGML et l'etend par des aspects temporels et hypermedias. HyTime herite de SGML la possibilite de de nir des types de documents et requiert, comme SGML, des mecanismes externes pour speci er la presentation des documents.

Nous donnons dans la gure 2.6, reprise de Rutledge & al. dans [RvOHB97], une classi- cation des principales normes de representation et d'encodage des documents multimedias selon deux axes: leur independance vis a vis de la presentation et leurs fonctionnalites hyper-medias. Il appara^t que l'independance entre la structure logique du document et ses donnees physiques permettent de conserver une independance vis a vis de la presentation. C'est le cas pour SGML et HyTime. MHEG ne fournit pas une telle independance puisqu'il propose principalement une norme pour l'organisation du contenu. Les normes PostScript et PDF sont quant a elles totalement dependantes de leur presentation. Les fonctionnalites hyperme-dias qui englobent les aspects hypertextuels ainsi que l'integration des donnees multimehyperme-dias temporelles dans les document sont fortement presentes dans HyTime et MHEG. Elles sont limites a des fonctionnalites de navigation hypertextuelle dans HTML et PDF et peu ou pas presentes originellement dans SGML et le format PostScript.

HyTime SGML

HTML

PostScript PDF

MHEG

Indépendance vis à vis de la présentation

Fonctionnalités Hypermédias

Figure 2.6.

Les normes de representation des documents multimedias

Pour notre part, nous nous interessons uniquement a la recherche sur les documents mul-timedias. Nous presentons succinctement comment les SGBD actuels traitent ce point par-ticulier, puis revenons sur le langage de requ^ete de la norme HyTime, appele HyQ [Kim93], avant d'aborder le traitement des documents multimedias en recherche d'informations.

2.5.1 Les documents multimedias dans les bases de donnees

Les SGBD actuels sont capables de gerer de nombreux medias, textes, images, sequences audios, videos, etc, cependant ils ne procurent que rarement l'ensemble des fonctionnalites nouvelles que necessitent ces donnees. Nous en citerons deux parmi les plus importantes qui sont citees par Klas et Aberer dans [KA95]: l'integration des aspects temporels et la representation de ces donnees par des abstractions. C'est ce dernier point qui est le plus interessant dans le cadre de la recherche sur ce type de documents.

En e et, l'introduction des donnees multimedias necessitent, a la di erence des donnees classiques, des modeles de representation permettant de decrire le contenu de ces donnees. Elles necessitent aussi des processus d'indexation a n d'extraire ces descriptions. Analyti et Christodoulakis propose un modele de representation des donnees multimedias dans [AC95] ainsi que des strategies de recherche sur le contenu reposant sur la modelisation qui a ete faite. La modelisation est basee sur une de nition de classes d'objets correspondant a chaque media. De plus, des objets fournissant les descriptions \semantiques" de ces objets sont de-crits separement des medias. Le processus d'interrogation intervient sur ces derniers objets. Toutefois, comme dans la plupart des SGBD dits \multimedias", les fonctionnalites d'indexa-tion sur ces nouvelles donnees se doivent d'^etre contr^olees par un indexeur humain et restent incompletes lorsqu'elles sont automatiques.

Le systeme MULTOS a ete le premier a proposer une interrogation sur le contenu des documents multimedias. Nous avons presente plusieurs caracteristiques de son langage de requ^etes dans la section b). Des modeles pour les donnees textuelles [Sav90] ainsi que pour les images [CR90, CDY90] ont ete proposees pour ce systeme. Nous pouvons toutefois regretter que, dans ce systeme, les images demeurent des composants passifs, a savoir qu'elles ne peuvent pas ^etre interrogees sur leur contenu.

2.5.2 Un langage de requ^ete pour les documents multimedias: HyQ

Nous rappelons que le langage HyTime [DD94] est une norme ISO 10744 qui utilise la syntaxe SGML pour o rir un modele de donnees permettant de representer des documents multimedias. Pour situer le langage HyTime par rapport a SGML, il nous faut dire que Hy-Time propose des extensions hypermedias non supportees par SGML (references externes, liens actifs, etc) ainsi qu'un cadre structure, sous l'appellation \architectural forms", suppor-tant les dependances temporelles entre les elements des documents.

L'objectif premier de cette norme n'est pas de reinventer ce qui existe tant au niveau des hypermedias que des donnees multimedias temporelles mais elle cherche a creer un consensus autour d'un modele exprimant les dependances entre objets. Nous nous interessons plus parti-culierement au langage HyQ qui permet l'interaction avec les systemes utilisant le mecanisme d'adressage de HyTime.

Les mecanismes d'adressage de HyTime

Le langage HyTime permet de representer des documents multimedias structures et ses mecanismes d'adressage o rent la possibilite de localiser des objets dans des hierarchies, c'est-a-dire retrouver des elements dans une structure. Trois modes d'adressage doivent ^etre

di erencies:

Adressage par nom : acces aux objets par leur nom formel qui se doit d'^etre unique dans un contexte donne (ensemble des documents d'une base).

Adressage par coordonnees : acces aux objets par leur position dans un espace donne. Le langage HyTime propose quatre mecanismes d'adressage par coordonnees:

Tree Location Adress : adressage dans une arborescence. L'expression`1 2 3 1' indique le premier ls du troisieme ls du second ls de la racine.

List Location Adress : adressage dans une liste. L'expression`2 3' retourne les objets 2, 3 et 4 de la liste. Le premier chi re localise l'objet de debut alors que le second indique la dimension de la liste retournee.

Path Location Adress : adressage dans une arborescence par un chemin d'acces. Une arborescence est vue comme une matrice ou les lignes sont les hauteurs de l'arbre et les colonnes sont les chemins d'acces aux feuilles de l'arbre. Un chemin s'exprime par `2 1 1 -1' ou `2 1' selectionne la seconde colonne de la matrice representant l'arborescence (`2 2' aurait fourni la seconde et troisieme colonne) et ou `1 -1'

adresse la totalite de la colonne.

Relative Location Adress acces aux objets d'une arborescence base sur les relations des ces objets avec d'autres objets de l'arborescence.

Adressage semantique : acces aux objets en fonction de leurs proprietes. Il peut s'agir de loca-liser des objets par la valeur de leurs identi ants ou de leurs attributs. Dans la requ^ete suivante, nous selectionnons toutes les valeurs de l'attribut STATUS dans DOMROOT.