• Aucun résultat trouvé

3.4 La calculabilit´e

3.4.4 Terminologie de l’espace documentaire num´erique

restitution de la forme s´emiotique, projection ´eph´em`ere... Autant d’´el´ements in-troduits par le num´erique qui bouleversent nos habitudes documentaires. Nous proposons ici une terminologie de l’espace documentaire num´erique tenant compte des discussions sur la caract´erisation d’un possible document num´erique dans les parties pr´ec´edentes.

Tout d’abord, voici les notions informatiques n´ecessaires `a la description des entit´es documentaires num´eriques :

Binaire

C’est le plus basique niveau logique d’encodage de l’information dans un dis-positif num´erique. Celle-ci est repr´esent´ee par une s´equence de bits. En infor-matique, le binaire est g´en´eralement masqu´e par des abstractions logiques de plus haut niveau, les formats. Mais toute donn´ee informatiques est une s´equence binaire.

Format

C’est une abstraction logique d´ecrivant des r`egles de composition de formats de niveau inf´erieur. Il fournit un mod`ele d’interpr´etation (par la machine) de donn´ees informatiques. Par exemple, le XHTML est un format qui repose sur le XML, lui mˆeme un format qui repose sur les formats d’encodage de caract`eres16 qui reposent sur le binaire. Un format n’est pas une mise en forme, il ne s’agit ici que de structuration de donn´ees. Par exemple, le format ASCII17

d´ecrit comment une s´equence binaire doit ˆetre trait´ee pour obtenir une s´equence de caract`eres, mais ne comporte aucune indication quant `a la police de caract`eres `a utiliser pour leur affichage. Toutefois, certains formats sont plus prescriptifs d’une repr´e-sentation des donn´ees, comme les formats d’encodage d’images matricielles. Ces derniers d´ecrivent une image comme un tableau de points, i.e. une matrice de pixels. Le format v´ehicule alors une repr´esentation implicite des donn´ees, mais ne l’impose pas : dans le cas de l’utilisation d’un ´ecran de faible r´esolution par exemple, les pixels encod´es dans un format de donn´ees ne seront pas respect´es pour l’affichage de la totalit´e de l’image.

Donn´ee

Information encod´ee selon un format dans un dispositif num´erique. Par exemple des notes de cours encod´ees en ASCII.

Fichier

Unit´e de d´ecoupage logique des donn´ees, au niveau du syst`eme d’exploita-tion18

. `A un fichier correspond un format particulier, appel´e format de fichier19 .

Flux

S´equence temporelle de donn´ees.

16. Comme les normes UTF-8 ou ISO 8859-1 par exemple.

17. Format standard pour l’encodage de donn´ees textuelles en langue anglaise. 18. Et plus pr´ecis´ement le syst`eme de fichiers qu’il utilise.

19. G´en´eralement identifi´e par une extension ou une signature (i.e. un invariant dans la structure du fichier qui permet d’en d´eterminer le format)

Projection

Production d’une forme physique de restitution `a partir de donn´ees. Par exemple, l’affichage en utilisant une police de caract`eres de donn´ees au format ASCII, mais aussi l’impression d’un texte.

Les notions que nous venons de voir correspondent `a une caract´erisation du traitement de donn´ees par un dispositif informatique. Elles ne devraient pas avoir d’incidence sur les notions documentaires bien que, comme nous l’avons d´ej`a vu pour la notion de fichier, il y ait confusion dans la pratique. Les d´efinitions des notions documentaires que nous allons voir maintenant devraient supprimer toute ambigu¨ıt´e subsistante.

Ressource

Donn´ees permettant la construction d’une entit´e documentaire. C’est une d´e-finition r´ecursive, nous ne faisons pas de supposition sur la taille d’une ressource. Par exemple, une page Web est une ressource servant `a la composition d’un site Web mais est aussi elle-mˆeme compos´ee de ressources (images, vid´eos, sons, code HTLM, etc.). De fait, une ressource peut ˆetre compos´ee de plusieurs fichiers.

Fragment

Un sous-ensemble de donn´ees constitutives d’une entit´e documentaire. C’est une notion proche de la pr´ec´edente sauf que nous parlons de fragment lors de la d´ecomposition d’une entit´e documentaire en ´el´ements plus petits alors que nous parlerons de ressource lors de la composition d’entit´es documentaires plus grandes. Un fragment peut devenir ressource et inversement une ressource peut devenir fragment. Tout d´epend d’o`u on se situe dans le cycle de vie des entit´es documentaires ´etudi´ees. Enfin, cette notion englobe celle de segment utilis´ee pour d´ecrire les entit´es documentaires temporelles (Auffret 2000).

Contenu

Entit´e documentaire intentionnelle, finie et autonome. Constitu´ee de ressources regroup´ees de mani`ere consistante, elle repr´esente un«vouloir dire»inscrit sur le support num´erique selon un format. Nous parlerons de contenu logique si le format en question explicite la s´emantique des relations entre les ressources constituant le contenu, c’est un format de cr´eation. De mˆeme, nous parlerons de contenu

lisible, ou par abus juste contenu, lorsqu’il est exprim´e selon un format d’exploi-tation,i.e.un format pour lequel des projections existent et sont banalis´ees (voir

3.4.2, page3.4.2). Un contenu num´erique, quel qu’il soit, n’est jamais directement lisible.

Mod`ele documentaire

Ensemble de r`egles d´efinissant les structures autoris´ees pour des contenus, autrement dit la grammaire structurelle de ces contenus. Un mod`ele documentaire permet de mettre en œuvre un processus de validation (v´erification si un contenu est une instance du mod`ele, i.e. respecte la grammaire d´efinie par un mod`ele) et il apporte des informations suppl´ementaires sur les contenus qui nous permettent de les traiter de mani`ere sp´ecifique (on connaˆıt les constituants d’un contenu et on peut associer des traitements automatiques `a chacun d’entre eux). Un mod`ele documentaire exprime par cons´equent un format de contenus. Ce sont les DTD ou les sch´emas pour le XML.

Document num´erique

Nous avons vu que la caract´erisation d’un document classique s’applique mal au num´erique. ´Etant donn´e la polys´emie du terme «document», il serait peut-ˆetre pr´ef´erable d’abandonner le terme en faveur de notions moins sujettes `a des interpr´etations abusives. Cependant, son impr´egnation dans les sciences de l’infor-mation est telle que nous pr´ef´erons proposer un compromis, une d´efinition plus harmonieuse avec la signification traditionnelle du terme mais tenant compte des sp´ecificit´es du contexte num´erique. Ainsi, nous parlerons de document num´e-rique lorsqu’il s’agit d’un contenu lisible stabilis´e et partag´e par une communaut´e. C’est-`a-dire que la composition du contenu est fig´ee par un processus de publica-tion qui en mˆeme temps le met `a la disposipublica-tion d’un groupe d’individus.

Multi-formats

L’utilisation de contenus logiques permet de mettre en œuvre un processus de transformation automatique `a partir d’un format de cr´eation vers un ou plusieurs formats d’exploitation ou mˆeme vers d’autres formats de cr´eation20

. Nous par-lerons d’exploitation multi-formats d’un fonds documentaire, pratique que nous avons pu exploiter avec succ`es dans le domaine de la formation (Gebers 2007).

20. Par exemple, dans le cadre du projet SCENARIsup, des contenus logiques dans un format sp´ecifique propre au projet ´etaient publi´es dans le format DocBook.

Multi-supports

Nous parlerons de supports lorsque, dans le cadre d’une pratique multi-formats, des formats d’exploitation produits sont destin´es `a une projection mo-bilisant un support autre que num´erique.