• Aucun résultat trouvé

Cette partie définit le contexte de ce travail et délimite la portée de la contribution que nous voulons apporter. Nous situons ici la position dans la chaîne éditoriale du système de transformation que nous proposons.

Notre thème de recherche est centré sur les systèmes d’édition interactive de documents structurés. Nous nous intéressons donc principalement aux trans-formations appliquées à l’édition de documents structurés. Cependant, dans notre étude, nous serons amenés à examiner des systèmes de transformation appliqués à d’autre domaines (génération de documents depuis des bases de données, formatage de documents). Les transformations qui nous intéressent particulièrement interviennent alors que les tâches suivantes sont effec-tuées (figure 11) :

• Importation de documents (a) pour permettre la réutilisation des docu-ments existants. Nous considérons l’importation de docudocu-ments texte plein et de documents structurés.

Les documents formatés utilisent des formats aux syntaxes trop di-verses pour pouvoir être importés selon une méthode générique. De plus ils peuvent être obtenus par l’application de filtres de conversion vers des modèles d’acquisition de documents structurés.

• Transformation en cours d’édition (b) : les transformations intervenant au cours de l’édition permettent la modification dynamique de la structure du document. Ces transformations incluent le changement de type d’éléments, l’insertion et la suppression d’éléments de structure inter-médiaires et le déplacement d’éléments dans la structure du document. • Conversion de documents entre modèles (c) : cette classe de

transfor-mations permet de convertir un document dans son intégralité d’une DTD d’édition dans une autre. Ces transformations sont nécessaires lors-qu’une DTD évolue ou lorsque les documents doivent être échangés entre applications utilisant des DTD différentes. Par exemple lors de la sauvegarde de documents, il est parfois nécessaire de les convertir dans un format spécifique pour publication dans une revue, ou en HTML pour publication sur le Web (c).

Documents structurés Modèles d’acquisition (TEI, Chameleon) Modèles d’édition (Article, Chapitre) Éditeurs de documents structurés a : Importation b : transformations dynamiques c : conversion Formats de publication

Figure 11 : Les transformations pour l’édition de documents structurés Les besoins de transformation exprimés ci−dessus nous permettent de défi-nir les caractéristiques du système de transformation de documents structurés que nous proposons dans ce travail :

• Les transformations doivent être rapides pour pouvoir être exécutées au cours de l’édition. Cette contrainte implique que les algorithmes utilisés soient efficaces.

• Les transformations doivent pouvoir porter sur un document entier, pour l’importation et la conversion. Elles doivent également pouvoir porter sur un sous−ensemble localisé du document pour les transformations dyna-miques.

• La structure d’un document ayant subi une transformation doit être conforme au modèle du document, en particulier les transformations lo-cales ne doivent pas mener à une structure de document incorrecte. Ce chapitre à présenté une approche applicative de la transformation de do-cuments. Nous allons nous intéresser dans les chapitres suivants aux tech-niques de transformation et à la manière dont ces dernières sont exprimées. L’étude menée dans ces chapitres nous permettra de compléter les trois ca-ractéristiques énoncées ci−dessus en prenant en compte les aspects techniques et l’expression des transformations.

Nous analysons les techniques de transformation de documents existantes suivant une méthodologie particulière. Nous avons identifié trois familles de techniques de transformation fondées sur des principes différents : les filtres, les systèmes de transformation explicite et les systèmes de transformation automatique.

• Les filtres (cf. section III.2) sont utilisés pour traduire des documents dans leur intégralité. Un filtre est défini pour des formats source et des-tination spécifiques.

On peut classer les filtres en deux catégories :

− Les filtres permettant la traduction de documents entre formats, par exemple de Word vers PDF.

− Les filtres permettant de traiter des documents structurés prennent en compte lors de la traduction non seulement le format utilisé mais aussi les structures logiques source et destination.

• Les systèmes de transformation explicite (c.f. section III.3) se basent sur un ensemble de règles guidant la transformation. Ces règles per-mettent de paramétrer les transformations et leurs perper-mettent, à la dif-férence des filtres, de s’appliquer à différents formats de documents. Cette technique peut être mise en œuvre par des applications dédiées aux transformations ou intégrées dans d’autres applications (éditeurs de documents, bases de données).

• La comparaison des structures génériques des classes de documents présentée dans le chapitre IV permet une transformation automatique de documents qui sera présentée dans le chapitre V. Cette méthode étant fondée sur une comparaison des structures génériques, elle ne peut s’appliquer qu’aux transformations entre documents possédant une re-présentation riche, comme les documents structurés.

Dans la suite, nous présentons la technique de transformation utilisée par chaque famille en trois parties :

• nous donnons d’abord les principes de la technique de transformation ; • Nous présentons ensuite les outils et prototypes existant fondés sur

cette technique ;

• finalement, nous décrivons notre expérimentation de la technique de transformation. Ainsi nous avons développé différents systèmes de transformation dont certains ont été intégrés aux logiciels diffusés par le projet.

Dans ce cadre, nous avons expérimenté un filtre de transformation lors de l’évolution d’une structure générique de document structuré. Le filtre de conversion des documents Article en Rapport à été utilisé pour la conversion des documents du projet (cf. section III.2).

Amaya propose une transformation de type pour l’édition de documents HTML. Cette fonction à été initialement développée pour expérimenter un sys-tème de transformation explicite dans le contexte d’un outil d’édition (voir sec-tion III.4).

L’éditeur Thot propose des commandes de restructuration génériques basées sur la technique de transformation automatique décrite au chapitre V.

Cette approche expérimentale de l’état de l’art nous permet non seulement de connaître les techniques utilisées pour la transformation de documents struc-turés, mais aussi d’évaluer l’intérêt de ces techniques dans le cadre spécifique de l’édition de documents.

Techniques et outils de transformation

explicite

Nous présentons dans ce chapitre les techniques de transformation néces-sitant une spécification additionnelle aux structures et aux instances de docu-ments. Ces techniques regroupent les filtres qui utilisent une spécification implicite de la transformation et les systèmes de transformation explicites qui interprètent un ensemble de directives servant à paramétrer les transformations. Ces deux familles de transformations sont regroupées dans ce chapitre car il existe des similarités entre les techniques utilisées, comme on le verra plus loin.

La première section présente un exemple de transformation simple qui nous permet d’illustrer les techniques de transformation étudiées. Nous abordons ensuite les filtres de conversion, puis nous détaillons les systèmes de trans-formation explicite existant avant de présenter les transtrans-formations utilisées par Amaya.