• Aucun résultat trouvé

Le format XML est un standard ouvert, interopérable, et (surtout) adaptatif

ANNEXE XII C ODE DE LA SÉCURITÉ SOCIALE P ARTIE RÉGLEMENTAIRE 226 I C ODE DE LA SANTÉ PUBLIQUE

2. Bilan de l’exception handicap dans le domaine de l’édition

2.2. La production de publications adaptées ne bénéficie qu’à la marge des technologies issues de l’internet

2.2.1. A ce jour, XML est le standard de l’accessibilité numérique

2.2.1.2. Le format XML est un standard ouvert, interopérable, et (surtout) adaptatif

XML (eXtensible Markup Language) est une norme d’échange d’information conçue pour développer l’accessibilité numérique à partir de 1996, et adoptée en 1998 par le W3C (World Wide Web Consortium), organisme de normalisation à but non-lucratif fondé par Tim Berners-Lee, le co-inventeur du web.

Le W3C s’est donné pour mission de promouvoir la compatibilité des technologies du web, afin d’en étendre les bénéfices à tous, selon le principe « un seul Web, le Web pour tous ». Selon Tim Berners-Lee : « La nature du web est dans son universalité. Il doit être accessible à toutes les personnes handicapées ».

Le W3C a ainsi lancé l’Initiative pour l’Accessibilité du Web (Web Accessibility Initiative ou WAI), qui s’est traduite par les recommandations « WCAG » (Web Content Accessibility Guidelines)48.

Ces recommandations ont été reprises en France dans le Référentiel général d’accessibilité pour les administrations (RGAA).

Dans un brillant article publié en 2000 et intitulé Vers une révolution dans la conception des catalogues... et bien au-delà? A propos de la concertation sur l'information bibliographique enrichie, 49Pierre-Yves Duchemin et Dominique Lahary décrivent ainsi XML :

« XML est (…) à la croisée de deux univers : d'une part, le monde documentaire qui a produit la norme SGML ; d'autre part, le monde d'internet et du World Wide Web qui a

46 Le NISO (National Information Standards Organization) est un organisme de normalisation américain

consacré à la documentation et aux livres. Il a notamment produit la norme NISO Z39.50, pour la recherche distante dans un catalogue de bibliothèque.

47 IDPF : International Digital Publishing Forum : organisation dédiée aux standards de publication numérique,

qui développe notamment le standard EPUB.

48

http://www.w3.org/WAI/

49

Pierre-Yves Duchemin (Bibliothèque nationale de France) et Dominique Lahary (Bibliothèque départementale du Val d'Oise). Bulletin d'informations de l'ABF, n°188, 2000.

31

produit HTML50. En absorbant la substantifique moelle et en gommant les défauts de ses deux prédécesseurs, XML est ainsi « presque parfait » dès sa naissance : il simplifie la structuration électronique de la sémantique du document électronique de SGML, conserve la séparation établie par SGML entre le fond et la forme, entre le contenu et la présentation, et emprunte à HTML sa facilité d'emploi, sa possibilité d'utilisation de liens hypertextuels et du multimédia, et son interopérabilité sur internet. »

XML (Extensible Markup Language) est un standard ouvert et interopérable, qui facilite l'échange automatisé de contenus complexes entre systèmes d'informations hétérogènes. En raison de sa structuration particulière, XML est aussi et surtout un standard « adaptatif ». Comme son nom complet l’indique, XML est un « Langage de Balisage Extensible », à savoir un « langage » de définition de texte, ou métalangage. Il peut être décrit, comme les langues dites naturelles, par sa syntaxe et sa sémantique.

XML est un langage de balisage générique. Sa spécification 51 décrit le principe de balisage, le lexique et la syntaxe générale d'un fichier XML.

Un format basé sur XML est décrit par une syntaxe appelée « Document Type Definition » (DTD). Cette syntaxe définit un ensemble de règles relatives au nom des balises, au contenu inséré dans ces balises (texte et autres balises), et à l'ordre des balises. Un fichier XML est dit conforme à cette syntaxe lorsqu'il en respecte toutes les règles.

Comme celles des autres langages dits « de balisage », les unités syntaxiques du XML sont des « balises ». Les balises caractéristiques du XML sont des chevrons, chaque information étant enserrée entre deux balises ouvrante, puis fermante, qui en précisent la nature.

L'inclusion de balises permet de distinguer le contenu d’un document et sa présentation formelle, qui peuvent être modifiés indépendamment l’un de l’autre.

D’une part, XML permet de décrire, sémantiquement, le contenu de chaque élément du document (titre, sous-titre, paragraphe, note en bas de page).

Par exemple, pour le titre du présent rapport :

<titre> Exception au droit d’auteur et développement de l’offre de publications accessibles à

l’ère numérique </titre>

D’autre part, XML permet de créer des règles pour définir comment les titres de tel ou tel niveau doivent être présentés (police et taille des caractères, italique ou gras, etc.). La structure, compréhensible par un programme informatique, permet un traitement automatisé, sans perte.

50

Idem, plus haut : « XML est un sous-ensemble de la norme SGML qui a été conçu dans le dessein de concevoir un nouveau langage d'utilisation moins lourde que celle de la norme SGML générique, mais aussi simple que HTML et offrant une puissance supérieure capable de décrire des bases de données, des documents volumineux ou à la structure complexe et multimédia. XML a également été conçu pour être interopérable avec SGML et HTML, et accroître les fonctionnalités du World Wide Web. »

51

32

Par exemple, une note en bas de page peut-être récupérée « à sa place » grâce aux balises insérées : <note de bas de page> http : // http://www.w3.org/WAI/</note de bas de page> Le langage XML est dit « extensible » 52, car il propose un cadre générique permettant de définir des formats particuliers, chacun d’eux étant décrit par une syntaxe particulière dérivée de la syntaxe générique d’XML, et par sa sémantique particulière.

Parmi formats dits « basés sur XML » (« XML-based standards »), on distinguera, relativement à l’objet du présent rapport, deux catégories, les formats de production et les formats de diffusion.

Les formats de production basés sur XML sont :

- Le format « pivot » DAISY, mis au point par le consortium DAISY53, qui permet de générer différents types d'adaptations pour les déficients visuels ; sa version 3 (DTBook) est la plus largement utilisée, dans la mesure où les spécifications de la version 4, plus perfectionnée (NISO Z39.98-2012 dit “ZedAI »)54 n’ont été finalisées qu’en 2012 ;

- le format MathML (pour les formules mathématiques et chimiques) ; - le format MusicXML (pour la notation musicale) ;

- le format XML Editeurs (format non ouvert, développé par Hachette Littérature Générale, mais utilisé par d’autres éditeurs) ;

 Du fait de leur structure générique commune, ces formats sont interopérables entre eux : par exemple, la syntaxe de DAISY-ZedAI permet d'inclure des formules mathématiques ou chimiques issues de MathML.

Les principaux formats de diffusion basés sur XML sont :

- le format ouvert EPUB, format de diffusion des livres numériques (e-books) lisibles sur des tablettes, liseuses, ordinateurs et autres appareils, dont la dernière version est EPUB355.

52 Voir l’article précité : « Qu'est-ce que XML ? XML n'est pas un format ; XML n'est pas un logiciel ; XML n'est pas un langage de programmation ; XML n'est pas un protocole d'échange ; XML est un peu tout cela à la fois, c'est aussi une infrastructure, une approche, voire une méthodologie. C'est un « métaformat », c'est-à-dire une structure générique qui a été conçue pour être transmise, lue et traitée sur le World Wide Web. C'est également un « métalangage », c'est-à-dire un ensemble de balises utilisées pour coder des documents ou des parties de documents, et qui permet de traiter le document électronique indépendamment des outils utilisés pour sa mise en forme. »

53 Le consortium DAISY a été créé en 1996 par un groupe de bibliothèques sonores offrant des services aux

personnes déficientes visuelles afin de gérer la transition du livre audio analogique au livre audio numérique. Il entend contribuer à l’avènement d’un monde où les personnes empêchées de lire auront un égal accès à la connaissance et à l’information, sans délai et ni coût complémentaire.

54 Norme ANSI/NISO Z39.98-2012, dite ZedAI « Authoring and Interchange Framework for Adaptive XML

Publishing Specification »

55

33

- le format ouvert XHTML (Extensible Hypertext Markup Language), format de diffusion pour Internet.

En raison des propriétés décrites ci-dessus, XML est non seulement un format adaptatif,

mais le standard adaptatif et la norme de facto de l’accessibilité, dans la mesure où il

permet de générer, de manière rapide et simple, grâce à une automatisation des tâches matérielles, différents formats de diffusion accessibles aux personnes empêchées de lire des textes imprimés « ordinaires » - ou, selon l’expression dédiée, « en noir ».

2.2.1.3. Le standard DAISY, basé sur XML, permet de produire automatiquement

Outline

Documents relatifs