• Aucun résultat trouvé

Convergence numérique dans l’édition

De la recherche en SHS aux humanités numériques

2.3 Convergence numérique dans l’édition

La convergence numérique désigne le mouvement amorcé depuis bien longtemps dans le sens du tout numérique. Toutes les sphères de l’édition sont concernées par le numérique, de la rédaction à la lecture qui a été la dernière activité à intégrer cette dimension avec les ordinateurs dans un premier temps puis avec les tablettes, les liseuses et les smartphones.

D’un point de vue organisationnel, il faut noter que les problématiques, de la production à la consultation en passant par la conservation et le signalement, autour de l’information scientifique, dont l’édition universitaire est un important pourvoyeur, sont aujourd’hui au cœur des politiques publiques avec la création en 2009 de la Bibliothèque Scientifique Numérique (BSN)22 qui a pour objectif général de veiller : [...] à ce que tout enseignant-chercheur, chercheur et étudiant dispose d’une information scientifique pertinente et d’outils les plus performants possibles.

En accord avec les orientations de la Commission européenne, la BSN privilégie l’accès ouvert aux documents scientifiques sous différentes formes reposant sur des innovations, des négociations avec les éditeurs ou le soutien aux archives ouvertes, en tenant compte des différences entre les disciplines [BSN, 2012].

BSN est organisée en 9 segments thématiques parmi lesquels BSN 7 traite spé-cifiquement des questions d’édition et de publication. Ce groupe a ainsi publié une Charte des bonnes pratiques pour l’édition numérique scientifique23 qui fixe les

cri-22. http://www.bibliothequescientifiquenumerique.fr

2.3. Convergence numérique dans l’édition tères vérifiables (citabilité, interopérabilité, accessibilité, ouverture, durabilité) à res-pecter pour pouvoir recevoir le label bibliothèque scientifique numérique.

2.3.1 Production éditoriale

La figure 2.2 donne une représentation synthétique de l’organisation éditoriale fondée sur des formats de données structurées. La méthode consiste à produire, à partir des jeux de données d’entrée, des versions pivots respectant des modèles abstraits adaptés au domaine de l’édition matérielle. L’ensemble des formes de diffusion sera ensuite produit à partir de ces versions pivots. Notons que, dans certains cas, les versions remises par les éditeurs scientifiques sont déjà respectueuses de modèles de représentation. Dans ce cas, l’éditeur matériel doit être en mesure de réorganiser les données pour les faire correspondre aux catégories qu’il manipule habituellement dans les opérations de production des formes de diffusion. Ainsi la tendance décrite plus haut impose en quelque sorte aux éditeurs matériels d’être capable de traiter des données très finement structurées par les chercheurs.

Figure 2.2 – Schéma général de production éditoriale.

En effet, dans la mesure où, d’une part, les humanités numériques se fixent comme objectif de constituer et de partager des ressources et que, d’autre part, ces ressources sont le plus souvent produites en exploitant des langages à balises en liens avec des modèles, les auteurs déposent de plus en plus souvent des instances structurées chez les éditeurs, là où ils remettaient auparavant des manuscrits ou des tapuscrits.

Cet effort d’adaptation ne pose pas nécessairement d’énormes problèmes et pour comprendre ce qu’il implique il faut revenir à la notion de modèle. Les modèles de représentation de texte sont bien souvent présents chez les éditeurs mais avec des méthodes d’exploitation parfois peu claires pour ceux qui les manipulent. En effet, le plus souvent, ce modèle s’instancie dans des feuilles de style de paragraphes et de caractères. Si ces feuilles de style sont correctement pensées elles reflètent bien le modèle de représentation textuel de l’éditeur en proposant des catégories de textes génériques et transférables d’un document à un autre, quelle que soit sa mise en forme, comme “titre de chapitre”, “titre de section”, “paragraphe”, “citation”, “note de bas de page”, etc. Cependant, il est important de comprendre que cet outil ne présente aucune espèce de coercition et peut être utilisé d’une manière totalement libre et totalement orientée par la mise en forme avec des styles locaux difficiles à généraliser comme “Gras, corps 12, 10 points avant et 25 après”. Si une certaine rigueur dans l’application de tels styles autorise à poser une correspondance avec des catégories relevant d’un modèle abstrait, l’entreprise reste risquée et relativement hasardeuse.

L’existence d’un modèle de représentation, même local, relativement peu forma-lisé et existant uniquement sous forme de feuilles de style, permet donc à un éditeur matériel d’aborder plus sereinement l’évolution de sa chaîne de production par l’in-tégration de données structurées.

De plus, le respect d’un modèle de représentation abstrait est aussi à consi-dérer comme le révélateur d’une bonne intégration des grandes fonctions de l’édi-tion [Schuwer, 1997]. C’est pour cette raison que les éditeurs qui ont conservé une forte culture métier ne rencontrent en général que peu de difficultés à intégrer des formats de données pivot au cœur de leurs méthodes de production. Le rapport d’étude sur l’édition numérique commandé par les éditions QUÆ [Prost, 2007] ex-plicite clairement ce lien entre la sphère “intellectuelle” de l’édition matérielle et ses mises en œuvre techniques.

La figure 2.3 donne deux exemples de feuilles de style qui montrent bien la dif-férence entre les deux approches qui peuvent présider à la conception de ce type d’outils. La première cherche à nommer les types de textes en faisant abstraction de leurs mises en forme locales dans un document donné alors que la seconde se contente de rassembler un certain nombre de propriétés graphiques et typographiques sous une étiquette unique pour simplifier les opérations de mise en forme. La première cherche donc à factoriser des dénominations de types de textes à une échelle plus générale, celle de la collection voire celle du fonds de l’éditeur, tandis que la seconde se limite

2.3. Convergence numérique dans l’édition

Figure 2.3 – Exemples de feuilles de style de logiciels de traitement de textes. à lister les différentes formes, c’est-à-dire des caractéristiques graphiques et typogra-phiques, à appliquer à un document spécifique. Autrement dit, dans le premier cas il s’agit d’une première ébauche de modèle tandis que la seconde prétend seulement simplifier le travail de systématisation des formes dans le document.

Si, dans un contexte de production d’une forme unique, comme c’était le cas il y a quelques années, ces deux approches sont tout à fait utiles et contribuent, chacune à leur échelle, à faciliter le travail de l’éditeur matériel, la convergence numérique bouleverse totalement la donne. La multiplication des supports de diffusion impose une nécessaire adaptation des pratiques de production éditoriale pour permettre la diffusion des mêmes contenus sous différentes formes avec la même exigence de qualité pour chacune d’elles.

Ainsi, il ne s’agit plus aujourd’hui de produire des textes pour alimenter une forme de diffusion, mais de manipuler des flux d’informations textuelles, complétés par des ressources multimédia comme des images, des vidéos ou des sons, qui sont organisés, croisés pour alimenter différents supports de lecture.

Le trésor de l’éditeur n’est plus son fonds de livres papier, mais bien un réservoir de données qui seront mobilisées en fonction des choix de politique éditoriale. L’édi-teur pourra ainsi extraire des séquences de textes pour alimenter une version papier, articulée avec une version numérique qui pourra reprendre une partie du volume papier en la complétant d’images et de vidéos.

2.3.2 Diffusion

Le fonds de l’éditeur devient donc un réservoir de données numériques de plus en souvent structurées. En conséquence, les éditeurs mettent en place des stratégies de diffusion adaptées à ce nouveau paradigme. Les modèles économiques suivants sont donc à considérer comme des retombées du modèle technique d’organisation des flux de travail autour des ressources numériques construites par les différents acteurs.

Ainsi, le Centre pour l’édition électronique ouverte (CLEO) a adopté depuis 2011 le modèle économique freemium. Ce modèle consiste à proposer la diffusion gratuite du format HTML et payante des formats détachables PDF et ePub. Du point de vue commercial, l’idée est de faire financer la totalité de la plateforme par les utilisateurs prêts à payer pour consulter les formats détachables24.

L’unité éditoriale de base est l’article ou le chapitre, regroupés pour consti-tuer des numéros ou des ouvrages. Ces unités de base sont structurées en XML en suivant les recommandations de la TEI et leur organisation en numéros ou en livres est réalisée en utilisant le Metadata Encoding and Transmission Standard (METS) [METS Editorial Board, 2010]. C’est la rentabilité de ce processus qui rend possible l’approche économique du CLEO.

Les Presses universitaires de Caen proposent un modèle articulant version papier et version électronique pour leur collection de sources. Dans cette organisation, les versions papier sont payantes et les versions en ligne sont gratuites. Les commentaires scientifiques constituent la valeur ajoutée du papier, mais les textes des sources édi-tées constituent un corpus consultable et interrogeable en tant que tel gratuitement en ligne.

Cette organisation est rendue possible par la mise en place d’un fonds d’éditeur composé d’unités éditoriales atomiques qui peuvent être mobilisées et réagencées en fonction de la politique éditoriale.

Cette construction de fonds d’édition permet d’organiser la consultation en ligne des travaux scientifiques dans un cadre précis, comme dans le cas des sources du Mont Saint-Michel, mais aussi selon d’autres critères d’interrogation et à l’échelle souhaitée. Tout le fonds de l’éditeur devient une base interrogeable par thème par exemple. En réalité, tous les éléments structurés dans les textes sont susceptibles de devenir des critères d’extraction ou d’interrogation.

Sans entrer dans les détails sur lesquels nous reviendrons dans la partie IV, c’est ce type d’exploitation qui est mis en place dans l’édition en ligne de l’Hortus Sanitatis