• Aucun résultat trouvé

Bibliothèques pionnières

Dans le document Le livre 010101 (1998-2003) (Page 53-57)

5. Le réseau des bibliothèques numériques

5.2. Bibliothèques pionnières

Objectif poursuivi par des générations de bibliothécaires, la diffusion d’œuvres du domaine public devient enfin possible à très vaste échelle, d’une part grâce à la numérisation des livres en mode texte, dans un format simple qui puisse être lu sur toutes les machines et par tous les systèmes, d’autre part grâce au fait que, via l’internet, ces fichiers puissent être téléchargés librement par tout lecteur potentiel.

Le Project Gutenberg

Le Project Gutenberg naît en juillet 1971 lorsque Michael Hart, alors étudiant à l’Université de l’Illinois (Etats-Unis), décide de convertir des œuvres du domaine public au format électronique pour les mettre gratuitement à la disposition de tous. Trois ans plus tard, le Project Gutenberg est le premier site d’information sur un internet encore embryonnaire, qui débute en 1974 et prend son essor en 1983. Vient ensuite le web (sous-ensemble de l’internet), opérationnel en 1991, puis le premier navigateur, qui apparaît en novembre 1993. Lorsque l’utilisation du web se généralise, le Project Gutenberg trouve un second souffle et un rayonnement international. Au fil des ans, des centaines d’œuvres sont patiemment numérisées en mode texte par des volontaires de nombreux pays. D’abord essentiellement anglophones, les collections deviennent peu à peu multilingues.

Qu’ils aient été numérisés il y a vingt ans ou qu’ils soient numérisés maintenant, tous les textes électroniques sont au format ASCII (American standard code for information interchange), avec des lettres capitales pour les termes en italique, gras ou soulignés, afin que ces textes puissent être lus sans problème quels que soient le système d’exploitation et le logiciel utilisés. Libre à d’autres organismes de les convertir dans des formats différents s’ils le souhaitent.

Cinquante heures environ sont nécessaires pour scanner un livre, le corriger et le mettre en page. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est en général composé de deux fichiers ASCII. Si certains livres anciens sont parfois saisis ligne après ligne, à cause du manque de clarté du texte original, les livres sont en général scannés en utilisant un logiciel OCR (optical character recognition), qui permet de convertir en fichier texte un fichier d’abord numérisé en mode image, afin de pouvoir corriger son contenu si nécessaire. Les livres numérisés sont ensuite relus et corrigés à deux reprises, parfois par deux personnes différentes.

« Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier, explique Michael Hart en août 1998. Le seul point commun est que nous diffusons les mêmes œuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d’enseignement. (...) Mon projet est de mettre 10.000 textes électroniques sur l’internet. Si je pouvais avoir des subventions importantes, j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d’un milliard seulement. (...) J’introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible. » Michael Hart se définit lui- même comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle.

Comment cette vaste entreprise a-t-elle débuté ? Michael Hart numérise son premier texte le 4 juillet 1971. Le 4 juillet étant le jour de la fête nationale, il saisit le texte de la

Déclaration de l’Indépendance des Etats-Unis (signée le 4 juillet 1776) sur le clavier de

son ordinateur, et il envoie le fichier électronique correspondant à quelques collègues et amis.

Entre 1971 et 1979, il scanne un volume par an d’une série qu’il intitule History of

Western Democracy. Entre 1980 et 1990, il poursuit ce travail avec quelques

volontaires. Son équipe et lui scannent la Bible dans son entier et plusieurs œuvres de Shakespeare. En 1990, dix textes sont prêts. Le dixième texte est The King James Bible. La moyenne mensuelle des textes scannés progresse ensuite régulièrement : un texte par mois en 1991, deux textes par mois en 1992, quatre textes par mois en 1993 et huit textes par mois en 1994. Fin 1994, les collections comprennent 100 textes. Le centième texte est l’œuvre complète de Shakespeare, désormais scannée dans son entier.

Lorsque l’utilisation du web se généralise, il devient beaucoup plus facile de faire circuler les œuvres et de recruter de nouveaux volontaires. La production augmente donc en proportion, avec 16 textes par mois en 1995, puis 32 textes par mois en 1996 et 1997. Fin 1997, les collections comprennent 1.000 textes. Le millième texte est La

Divine Comédie de Dante, en italien. La production passe à 36 textes par mois en 1998

et 1999. Fin 1999, les collections se chiffrent à 2.000 textes. Le 2.000e texte est Don

Quichotte de Cervantes, en espagnol.

Le nombre de textes scannés est toujours de 36 textes par mois en 2000. Il passe à 40 textes par mois pendant le premier semestre 2001, puis 50 textes par mois pendant le deuxième semestre. Le 3.000e texte, disponible courant 2000, est le troisième volume de

A l’ombre des jeunes filles en fleurs, de Proust, en français. Le 4.000e texte, disponible courant 2001, est The French Immortals, version anglaise de la série publiée en 1905 par la Maison Mazarin pour rassembler des fictions d’écrivains couronnés par l’Académie française (Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, etc.). Le 5.000e texte, disponible en avril 2002, est la version anglaise des Carnets de Léonard de Vinci.

En 2002, les collections s’accroissent en moyenne de 100 titres par mois. Au printemps 2002, elles représentent le quart des œuvres du domaine public disponibles sur le web, recensées de manière pratiquement exhaustive par The Internet Public Library (IPL). Un beau résultat pour trente ans de travail acharné basé en grande partie sur le volontariat, avec 1.500 volontaires actifs dans plusieurs pays. En 2003, le catalogue comprend 8.000 œuvres dans de nombreuses langues. Michael Hart espère atteindre les 10.000 œuvres d’ici 2005.

The Online Book Page

En 1993, un deuxième projet pionnier se développe parallèlement au Project Gutenberg, à l’instigation de John Mark Ockerbloom, doctorant à l’Université Carnegie Mellon (Pittsburgh, Pennsylvanie, Etats-Unis). Il s’agit de The Online Books Page, dont le but n’est pas de numériser des œuvres mais, tout aussi utile, de répertorier celles qui sont en accès libre sur le web, en offrant au lecteur un point d’entrée commun.

John Mark Ockerbloom retrace les débuts de son répertoire lors d’un entretien datant de

septembre 1998 : « J’étais webmestre ici pour la section informatique de la CMU (Carnegie Mellon University), et j’ai débuté notre site local en 1993. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l’origine The Online Books Page était une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des

versions web de certains textes du Project Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d’autres sites. J’ai remarqué que de nombreux sites (et pas seulement le Project Gutenberg ou Wiretap) proposaient des livres en ligne, et qu’il serait utile d’en avoir une liste complète qui permette de télécharger ou de lire des livres où qu’ils soient sur l’internet. C’est ainsi que mon index a débuté. J’ai quitté mes fonctions de webmestre en 1996, mais j’ai gardé la gestion de The Online Books Page, parce qu’entre temps je m’étais passionné pour l’énorme potentiel qu’a l’internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j’ai du mal à rester à jour. Je pense pourtant poursuivre cette activité d’une manière ou d’une autre. Je suis très intéressé par le développement de l’internet en tant que médium de communication de masse dans les prochaines années. J’aimerais aussi rester impliqué dans la mise à disposition gratuite pour tous de livres sur l’internet, que ceci fasse partie intégrante de mon activité professionnelle, ou que ceci soit une activité bénévole menée sur mon temps libre. » Fin 1998, John Mark Ockerbloom obtient son doctorat en informatique. En 1999, il rejoint l’Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique. A la même époque, il y transfère The Online Books Page, tout en gardant la même présentation, très sobre, et il poursuit son travail d’inventaire dans le même esprit. En 2003, ce répertoire fête ses dix ans et recense plus de 20.000 textes électroniques.

La Bibliothèque électronique de Lisieux

Le milieu des années 1990 marque les débuts du web francophone, d’abord au Québec et ensuite en Europe. En juin 1996 apparaît la Bibliothèque électronique de Lisieux, une des premières bibliothèques francophones du réseau, créée à l’initiative d’Olivier Bogros, directeur de la médiathèque municipale de Lisieux (Normandie). Dès ses débuts, cette réalisation suscite l’intérêt de la communauté francophone parce qu’elle montre ce qui est faisable sur le réseau avec beaucoup de détermination et des moyens limités.

Pendant deux ans, de 1996 à 1998, Olivier Bogros héberge le site web sur les pages de son compte personnel CompuServe. En juin 1998, il enregistre un nom de domaine (bmlisieux.com) et déménage l’ensemble sur un serveur offrant une capacité de stockage de 30 Mo (méga-octets). En juillet 1999, 370 œuvres sont disponibles en ligne. Elles comprennent des œuvres littéraires, des brochures et opuscules documentaires, des manuscrits, livres et brochures sur la Normandie, et enfin des conférences et exposés transcrits par des élèves du lycée de Lisieux.

A la même date, Olivier Bogros explique : « Les œuvres à diffuser sont choisies à partir d’exemplaires conservés à la bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage. La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux...). De même nous laissons à d’autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne

des textes excentriques et improbables. (…) Nous réfléchissons aussi, dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie... - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand. » En 2003, la bibliothèque électronique approche les 600 textes.

L’année 2000 marque le début du partenariat de la bibliothèque électronique avec l’Université de Toronto. Lancé officiellement en août 2000, LexoTor est une base de données fonctionnant avec le logiciel TACTweb et permettant l’interrogation en ligne des œuvres de la bibliothèque, ainsi que des analyses et des comparaisons textuelles. Le projet est issu de la rencontre d’Olivier Bogros avec Russon Wooldridge, professeur au département d’études françaises de l’Université de Toronto, lors du premier colloque international sur les études françaises valorisées par les nouvelles technologies d’information et de communication, organisé par ce dernier en mai 2000 à Toronto. Deux ans après, en mai 2002, un deuxième colloque international sur le même sujet est organisé cette fois par Olivier Bogros à Lisieux.

Dans le document Le livre 010101 (1998-2003) (Page 53-57)