• Aucun résultat trouvé

Les documents numériques : numérisation et diffusion des documents

N/A
N/A
Protected

Academic year: 2021

Partager "Les documents numériques : numérisation et diffusion des documents"

Copied!
64
0
0

Texte intégral

(1)

HAL Id: dumas-01685197

https://dumas.ccsd.cnrs.fr/dumas-01685197

Submitted on 16 Jan 2018

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de

Les documents numériques : numérisation et diffusion

des documents

Jason Frodot

To cite this version:

Jason Frodot. Les documents numériques : numérisation et diffusion des documents. Sciences de l’information et de la communication. 2014. �dumas-01685197�

(2)

Université

Sciences humaines e; sociales

Charies-de-Gaulte

Département Sciences de l'Informationetdela Documentation

Diffusion

Ml

Atelier natonal dereproduction des thèses

Jason FRODOT

MASTER 1, MENTION ICCD

(Option : Sciences de l'Information et du Document)

MEMOIRE DE STAGE

Mission effectuée du 2juin au 11 juillet 2014

L'ANRT (Atelier national de reproduction de thèses) Villeneuve d'Ascq

LES DOCUMENTS

NUMÉRIQUES

:

NUMÉRISATION

ET DIFFUSION DES

DOCUMENTS

Sous la direction de :

Mr Joachim Schopfel (tuteur universitaire)

Mr Rachid Berbache (tuteur professionnel)

Soutenu le 11 septembre 2014 l'UFR DECCID-SID

Université Charles de Gaulle, Lille 3 (Campus Pont de Bois) BP 60 149, 59 653 Villeneuve d'Ascq Cedex

(3)

Remerciements

Cemémoire s'est fait dans le cadre de l'Anrt(Atelier national de reproduction de thèses),un

servicequi s'occupe du traitement des thèses et de leurs exportationsversdifférentes

bibliothèquespoursatisfaire d'éventuelles demandes.

Je tiensd'abord à remerciermafamille, qui m'aaidé à chercherunstage endocumentationou dans lesarchives, recherche quej'ai réalisé dans de nombreux endroitsetpendantaumoins 2 mois, etquiparla suite m'a encouragé durant monstage.

Jeremercie également le personnel de l'Anrt quiaaccepté de m'engagerentantque stagiaire. Parmieux,jetiensàremercier :

- Joachim

Schopfel, qui aaccepté de m'engager comme stagiaireetqui m'aconseillé des

ouvrages dans le cadre demonmémoire, àsavoir« Manuel de numérisation» et« Manuelde constitution de bibliothèques numériques » (tous deux étantsousla direction de Thierry Claerr et IsabelleWesteel) ;

- Rachid

Berbache,qui m'afait visiter les lieuxet montrer comment exporterdes informations à partir d'un site ;

-FredériqueDhooghe, quimemontra commentnumériser, puis vérifier les thèseset enfin les

exporter, etenfin qui m'a bien aidée faceauxproblèmes de numérisation ;

-MaryseNoncle quiavec Joachim Schopfel et Rachid Berbache, aaccepté de m'engager ;

(4)

Résumé

Dans uncontexte de développementaccrude l'Internet etdes demandes de lapart des

utilisateurs, lanumérisationetla diffusion de l'informationsedoivent de répondreauxdéfis

engendréspar ces développements. Pourcela, il convientaudocumentalisteet àl'archiviste de

scanner l'informationcontenue dans le documentpapier àtraversunscanner, utiliserdes formats adaptés à lanumérisationetàl'exportation des données, vérifier si les couleursne sontpas

déséquilibréesauniveau de la disposition, ou si possible les supprimer si celles-ci devaientgêner

lanumérisation, faire attention àd'éventuelles erreursde codage qui pourraient nuire à la lecture de l'information ainsi qu'àsaprotection, etenfin àexporterces informations àtravers différents sites sous différentsformats, cela bien entenduavecl'autorisation de l'auteur dutexte contenants

ces informations dansle cadre de la loi.

Parconséquent, la numérisationetladiffusionde l'information sontconcernéesparde multiples

enjeuxcomme par exemple les enjeuxstratégiques, juridiques etinformatiques. Enjeux quisont

eux-mêmes liésàdemultiplesproblèmescomme celle de la protection informatiques des

données àtraverslecodage etle choix des formats, celle de la protectiondes droits d'auteurau moyendes lois les encadrantetenfin celle des liensparpartenariatavecdifférents sites de

diffusion de documents numérisés(commeparexemple la diffusion de thèsesavec l'ABES (Agencebibliographiquede l'enseignement supérieur)), ainsi quediversesbibliothèques (comme lesbibliothèquesuniversitaires)et centres de documentation.

Mots-clés :

Bibliothèques, codage, couleur,diffusion, documentation, droit d'auteur, format, information,

(5)

Tables des matières

Liste des abréviations 5

Introduction 7

Chapitre 1: Pourquoinumériser 10

1)Définition 10 2) Le contexte 12 3) Cequ'implique lanumérisation 15 4) Les objectifs 21 Chapitre 2: lanumérisation 24 1) L'image numérique 24

2) Lesformats de fichier 29

3) Commentacquérirl'image numérique 32

Chapitre 3: De ladiffusion des documents 42

1)De l'utilité des sites Internetpourla diffusion 42

2) Commentfaireunemise enligne ?

43

3) Ladiffusion des documents : les destinatairesetles usages 47

4) Le document numérique : l'avenir du document ? 49

Conclusion 52

Bibliographie 53

Glossaire 54

(6)

Liste des abréviations

ABES : Agencebibliographique de l'enseignement supérieur

AIIM : Association for Information andImage Management ANR :Agence national de la recherche

ANRT: Atelier national dereproduction de thèses BMP : Bitmap

BnF : Bibliothèque nationale de France CCD: Charge-Couple Device

CCITT : Comité consultatifinternationaltéléphoniqueettélégraphique CFC : Centre français d'exploitation du droit de copie

CIE : «CommissionInternationale de l'éclairage »

Cm : Centimètre

CMOS : Complementary Métal Oxide Semiconductor CNRS: Centre national de la recherche scientifique

CPI : Code de lapropriété intellectuelle CSV :Comma-separated values

DADVSI: [Loirelative aux] droits d'auteur etdroits voisinsdans lasociétéde l'information

DCT(de l'anglaisDiscrète Cosine Transform) : Transformée encosinus discrète

Dpi (de l'anglaisDot PerInch) : Pointpar pouce DTD : DocumentType Définition

EAD : EncodedArchivaiDescription EXIF: Exchangeable image file format

FAX G4 : Facsimile Group 4 Fk : foreign key

GIF (de l'anglais : Graphie Interchange Format): Formatd'échange d'images HDR: High Dynamic Range

HTML : Hypertext Markup Language ICC: International Color Consortium

id : identifier

IPG: InternationalProgrammers Guild

IPTC: InternationalPress Télécommunications Council

ISBN : International Standard Book Number

ISO (de l'anglais: International Organization for Standardization): Organisation internationale de

normalisation

JBIG: Joint Bi-levelImageexperts Group

JFIF : JPEG File Interchange Format JPEG : JointPhotographie Experts Group

Lab (ou l*a*b): « 1» pourla clarté, « a » pourlagamme de 600 niveaux surl'axe rouge-vert, « b»pour lagamme de 600 niveausurTaxe jaune-bleu

LED: Light Emitting Diode LZW: Lempel-Ziv-Welch

(7)

MESR: Ministère de l'Enseignement supérieuretde la Recherche MLD : Modèle logique de données relationnelles

Mm :Millimètre

Mpix : Megapixels Mo : Méga-octet Nm : Nanomètre

NNT: Numéronational de thèse

NCSA(de l'anglais National Center for SuperComputingApplications) : Centre nationalpourles

applications des super-ordinateurs

OCLC : OnlineComputerLibrary Center

OCR(de l'anglais optical character récognition) : Reconnaissance optique de caractères PDF : Portable Document Format

Pk : primary key

PNG : Portable NetworkGraphics

Px :Pixel

RGB : Red, Green, Blue (voir significationpourRVB) RLE : Run-Lenght-Encoding

RVB : Rouge, vert,bleu

STIC: Sciencesettechnologie de l'informationetde la communication

TICE: Technologies de l'informationetde la communicationpourl'enseignement TIFF : TaggedImage FileFormat

URL : Uniform Resource Locator USB: Universai Sériai Bus

UTF-8 : UniversalCharacterSetTransformation Format- 8 bits XML: ExtensibleMarkupLanguage

(8)

Introduction

Lors de marecherche de stage, quiaété trèslongue, ileut d'abord étédifficile de savoir quel

thèmeabordé, à savoir si celui-ci estquelque chose dans la documentation, dans les bibliothèques

oules archives,jusqu'àce que l'onme propose unposteàl'ANRT, situé à l'université Lille3

Charles-de-Gaulle. L'ANRT estunateliercrée en 1971 dans lebutde reproduire les thèses de doctoratsparimpression, miseenmicrofiche (depuis 1983) etnumérisation à la demande,etdont

ilexistaitavantla réunification le 1erjanvier 2011 deux ateliers, selon la discipline (1):

le

premier rattaché àl'université Lille-III pourles lettres, sciences politiques, juridiques, et humaines et sociales ;

le second rattaché à l'université Grenoble-II

pourles sciencesexactes, la médecine, la pharmacie, les sciences économiques etde gestion.

Lorsquej'effectuais monstage,monprincipal travail consistait d'abord à numériser des thèseset

les formulairesqui ensontrattachés aumoyen d'unscanneretd'un logiciel informatique (CapturePerfect),toutentenantcomptede la taille de cesthèses, dutype d'impression initiale (recto,recto/verso ou enignorant lespagesblanches), du fait qu'ilssontencouleurou non (dans lecasprésent, il faut retirer les infiltrationsetl'arrière-plan)etenfinde la présence oude

l'absence d'agrafes reliant certainespages; puis à vérifiercesthèses sur un autre logiciel (PixEdit

7), dont les tâches consistaientàvérifier s'ilne manque pas une ouplusieurspages sur une ou

plusieurs thèses, puis à supprimer les couleurs de fond de certaines pagesn'ayantpas puêtre

retirées (dans cecasla suppression des pagesde la thèse numérisée puis l'enregistrement séparé

de lathèse corrigées'avèrentnécessaires); etenfinà exporterles fichiers vers unautre poste ayantuneautretâche quecelle de la numérisation des documents.

Parlasuite,une autretâche m'aété confiée, à savoir demettreenplaceundocument (par

exemple surBloc-Notes) dans lequelondoit d'abord donner le numéro NNT (qui équivautenfait àl'identifiant de labibliothèque universitaire ciblée) puis, après l'ajout d'un point virgule, l'URL

de lathèse ciblée. Letoutentapant le numéro ANRT puis copiant les informations depuisunsite

(ici l'ANRT). Cela donne, pourla plupart des thèses, le résultat suivantavec l'exemple

ci-dessous:

1986PA100194; http://www.diffusiontheses.fr/3837-thèse-de-larroque-michel.html

Ce documentdoit avoirpourtitre lemois puis Tannée de la liste des thèses ciblées (ex: Mars 2014).

De ces deuxtypes de tâches, qui n'ont en apparence aucunpointcommunentreelles, ellesont pourtantcommelien le fait d'être inclus dansunechaîne dans laquelle s'entremêlent

numérisation dudocument, partenariatavecdiverses organisations commeles bibliothèques, les

droits d'auteurs aveclesautorisationsdes auteurs d'undocument, choix du formatetaspect

(9)

physique des documents. Une chaîne dans lequel semble inclusuncontexte de dématérialisation

dudocument, autrementditdupassage du format papierauformat numérique, ainsi qu'une demande toujoursplus croissante des demandesenmatière d'informationetde documents,

auxquelles lesbibliothèques, lescentres de documentationetles archives sedoivent de répondre. Orcompte tenude l'évolution croissante des documents, des informations,etdes demandes

toujours plus immédiates, ainsiquedes difficultés de gérercetensemble aussi bien dansles domaineséconomiques que structurels etmatériels, les organisations sedoivent de réaliser des partenariats avecd'autres (par exemple le partenariatentrel'ANRT, l'ABES etle MESR) dans le

butd'assurerplus efficacement la diffusion des documents. Dece fait, les tâches effectuées dans

une organisation semblent enréalité sontpourchacunes d'entre elles desrouages dansunrouage, lui-même inclusdansunensembleplus grand. Un ensemble quipeutêtre mis à mal si l'une des tâches venait à manquer ousi des problèmes venaientàapparaître dans l'une des tâches

concernés. Il convientparconséquent d'établir la problématique suivante: enquoi les tâches de la documentation,enparticulier la numérisation, sont-elles utiles aubon fonctionnementdecet ensemble?

Eneffet, pourfaire face àcecontexte d'augmentation du nombre d'informations, de documentset dedemandes, les bibliothécaires, les documentalistesetles archivistes(alors métiers à

documents) sedoivent de répondre le plus rapidement possibleetauxplusde demande possibles. Pourcela, cesmétiers se doiventnonseulement établir despartenariats entreorganisations, mais aussidisposerdumatériel adapté. Ainsi vient lescanner, qui numérise le documentnon

numérique, et l'ordinateur, qui nonseulement fait exécuterla tâche de numérisation,mais aussi

adaptece document selon le format adapté àce dernier (ex: TIFF ouJPEG)toutencorrigeant

d'éventuelles erreurs(comme les couleurs indésirablesparexemple), le toutgrâce àdes logiciels de numérisationetde correction de documents. Ortout supportquiserespecte souffre de divers inconvénients. Eneffet, si le documentnumérique secaractérisepar sonimmédiatetéetpar son

ubiquité, ilpeut également souffrir de problèmespropreàl'informatique commeles erreursde

codageoudes formats inadaptés, quipeuvententraînerlaperte des informationspropreàun documentoul'illisibilitéde cesderniers. D'autrepartles techniques de numérisationne sontpas uniformes enraisond'unepart de la multiplicité des formes de document (comme les livresetles microfilms), etd'autrepartparce quecertains documentspeuventserévélerfragiles (ex: les livres

rares enraison de leurs anciennetés dans laplupart des cas). Sanscompterdu fait quela numérisationestelle-même soumiseàde nombreuses contraintesjuridiques,notammentence

qui concerne lesdroits d'auteursetle délai de validitépour unereproduction. Cesinconvénients

peuventde cefait nuire àla bonne diffusion des documents.

Diffusion des documentsàlaquelle la numérisationsembleoccuper, àtraverssesavantages etses

inconvénients, uneplace centrale dans la diffusion des documentsentre lesorganisations. Cequi

amène à lagrande problématique: commentexpliquer cetteimportance centrale qu'occupe la numérisation ?

Pourtenterderépondre à cetteproblématique, la démarche entreprise dans le stage effectué consiste à voircommentnumériserunethèse àtraverslesparamètres etl'observation des

problèmes éventuelles,àlacorriger si besoin, àl'exportersurd'autrespostes, etenfin àrécupérer les informations depuisunsite. Letout couplé àuneobservation de l'entrepriseetàla

récupération d'informations despages de sites etdes livres susceptibles d'aider dans la résolution

(10)

Encequi concernele plan, nous nousintéresserons

d'abord

surle pourquoi de la

numérisation

sous sesdifférents aspects,puis àsestechniques, et

enfin

à

la

diffusion des documents

pour finalement établiruneconclusion.

(11)

Chapitre

1

:

Pourquoi numériser

Avantde s'intéresserauxpourquoi de la numérisation, il convient d'abord de définir cequ'estun documentnumériquepourmieux les analyser.

1)

Définition

Undocumentnumérique estdifficile à définir dans lamesure ilcomporte plusieurs définitions, variablesenfonction des sources(ci-dessousune listenon exhaustive):

-Selonla définition de lanorme ISO 19005-1 : «Représentation numérique, selon un

format depage, d'une agrégation de données textuellesetgraphiques, etde métadonnées utilesàl'identification, la compréhension, etle rendu des données, quipeutêtre

reproduitesur unpapierou une microformeoptique sanspertesignificative deson

contenu en information. »

-RogerT. Pédauque ,du STIC CNRS etauteurde "Document: forme, signe etmédium, les

reformulations dunumérique",en proposetrois :

+Définition 1: « Undocumentnumérique estunensemble de données organisées selon une

structurestable associée àdesrègles demise enformepermettantune lisibilité partagée entre

sonconcepteur etseslecteurs. »(1) [6]

+Définition 2: « Undocumentnumérique est untextedont les élémentssontpotentiellement

analysablespar unsystèmede connaissanceen vue deson exploitationpar unlecteur

compétent. » (1) [6]

+ Définition 3: Undocumentnumérique estla tracede relations socialesreconstruiteparles dispositifs informatiques. (1) [6]

-SelonWikipédia,un document numériqueest« uneforme de représentation de

l'information consultable à l'écran d'un appareil électronique. L'affichage de ce typede

documentpeutêtreapparentésoitau « document»même, ousoitàl'interface logicielle. Suivantl'intervention d'applications informatiques dansunepartie deson contenu (bases de données, POO), les changements dans l'organisation logique de sesdonnéespeuvent

être apportés [...]. » (2)

(1)PÉDAUQUE,Roger. Document:forme,signeetmédium, les reformulations du numérique. 8 juillet 2003. (consultation le 27juillet 2012),<http://archivesic.ccsd.cnrs.fr/docs/00/06/21/99/PDF/sic_0000051 l.pdf> (2)http://fr.wikipedia.org/wiki/Document_numérique

(12)

Quoi qu'il ensoit,undocument numérique estquelque chose quise rapporte àlafois à l'informatique (avec lestermes"données", "métadonnées"et"interface"),ausocial ("relation

social") etàcequ'il contient ("texte", "textuelle","structure" et"contenu"). Quelque chose qui

partage avecle documentnonnumérique (dont il fautnoterégalementladifficulté de ledéfinir)

le faitqu'il dispose d'uncontenant, d'un contenu, desinformations,etle faitqu'il nécessiteau moins unémetteuretunrécepteur. Undocument numériquepeutprendre plusieurscatégories:

les documents édités : livres électroniques, e-books,revuesscientifiques électroniques;

(DP]

les documentsnonédités: archivesouvertes etinstitutionnelles, production pédagogique,

jeux dedonnées de recherches etdonnéesadministratives. (1)[2]

Des catégories de documentsqui sont,dans touslescasetpour aumoinsunepartie d'entre elles, des versions électroniques dedocuments sousformes papier (livres, thèses, feuilles) de plaques de verre,demicrofilms oude microfiches (2) (comme c'estle cas àl'ANRT),tousde forme, de taille, de résistancephysique, de durée de conservation (en particulier lesmicrofiches) etde coûts variables. Ces documentssontdivisés selon les mêmescatégoriesqueles documents numériques,

àsavoir:

-parmi les documents édités (1) [2]:

+livres, périodiquesetpresse,

+revues etouvrages scientifiques etpédagogiques,

+ documentspatrimoniaux (imprimés, estampes, cartes etplans imprimés, partitions, cartes postales, etc.);

-parmi les documentsnonédités (1) [2]:

+ documentspatrimoniaux (archives, manuscrits, dessins, etc.),

+documentsiconographiques (négatifs, plaques deverre, Ektachromes,etc.), + archives institutionnelleset informationsadministratives,

+ archives dela recherche(archives, manuscrits, photographies, cartes etplans, etc.), + documentspédagogiques(courspolycopiés, préparations decours, notes, etc.).

Ainsiàtravres ces listes desdocuments éditésetnonédités, onpeut endéduire plusieurs enjeux,

àsavoird'abord lesenjeux culturels, avecladiffusion desoeuvresd'art etd'esprit dans lecadre

despatrimoines culturelles, les enjeux scientifiques,avec denouveaux corpusdetextes

susceptibles d'être mise à jour,etles enjeux économiques, si l'on seréfèreaufait qu'une

(1) Sous la direction de Thierry ClaerretIsabelle Westeel.Manuel de lanumérisation. Editions du Cercle

de lalibrairie. Paris:Electre, 2011. 320pages.ISBN:978-2-7654-0983-0. (Page 19)

(2) Anoterquel'ANRT disposede deuxtypesde microfichespourchaque thèse, de compositionetde durée de conservation différentes

(13)

numérisationimpliqueunbudget de lapart du service.

2)

Le contexte

Contexte général

Lorsque la numérisationcommença audébutdes années 1990 dans les bibliothèques etles

archives (avec les exemplesdesArchives nationales etdes archives départementales de la

Mayenne en 1993), elle avaitpourbut de préserver le document, bienque la qualité des

documents numérisés de l'époque (qui étaient d'abord réalisés surdes microfiches) n'étaitpas forcément bonne. Avec l'émergence de la miseen ligne, la qualité de l'image ainsi queles

fonctionnalités de recherche s'améliorèrent, aupointqueletexte de l'oeuvre numériséet

l'exemplaire numérisé supplante désormais la consultation physique des documents, cela grâce à

l'OCRetauxréseaux de télécommunication.

Ainsi dans lesservices, lesopérations de numérisation, le nombre de documentsànumériseret

par conséquentle public commencèrent à s'accroître considérablement dès le début desannées 2000, àunpoint telque le public virtuel devenait l'un des enjeux majeurs des services des

bibliothèques etdes archives. C'est alors que depuis 2005, date à laquelle onassiste aulancement du programme de numérisation domoteuraméricain Google, que la décision d'augmenter la

quantité de documents numériques misàladisposition dupublic, bienquetous les documents ne

sontpasnumérisés car noninclus dans le cahier des charges (par exemple les formatsnon standard, les tableaux de chiffreset lesdépliants). Ce cahier des charges fait des choixen

fonctionde sesproprescritères, puis selon les exigences de conservation, ensuite d'après des

critères intellectuelles etenfin dans le cadrede la chaîne de numérisation, oùonsélectionne les documentsànumériserselon leur étatdeconservation, leur caractèreprécieuxet selon leur

conformitéauxcritères de normalisationdetraitement industriel. Chaînedenumérisationdans laquelle les chantiers de numérisation demasse, quiontpourbut principal d'adresser àune

production industrielleungrand nombre d'ouvrages ànumériser, nepeuvent êtreeffectués quesi

l'institutiondispose déjà d'un catalogue informatisé dans sonfondspour assurerla traçabilité des

ouvrages entre l'institutionetla chaîne de production.

Face àlamasse des documents ànumériser, les traitements etles indexations effectués manuellement deviennentdeplusenplusinadaptésaucontraire des traitements etdes

indexations effectués automatiquement, de manièreàcequ'il yaitunaccèsparle contenu etune diffusionqui exploite les bonnes méthodes de compression. Toutefois les traitements

automatiques peuventcomporterdeserreurs (ex : résolutiontrop faible) maispeuventêtreévités

lors de la rédaction ducahierdescharges.

Le toutpeutainsi s'inscrire dans le cadre d'une révolution numérique, dans laquelle les

technologies de numérisationetd'informatique amènent à de nouvelles pratiques etàde nouveauxusages, notammenten cequi conçementles documents récents. Onpeutciterpar exemple la micro-informatiqueetles réseaux, commeInternet, quise sontgénéralisés àunpoint tel que c'estla société qui afinitparles approprier, puis les faire évoluer, etcela de deux

manières quise complètent mutuellement:

L'adaptation de la société avecl'environnement numérique, dans lequelnonseulement lesinstitutions culturellesproposentlesdocuments numérisés, mais enplus conçoivent

(14)

des applicationsdont les lecteurs peuventyparticiper à l'enrichissement des informations

descriptives.

L'adaptation du numériqueenfonction des besoins, dans lamesure oùl'usagerpeut créer

surla Toileunmonde virtuel àsa convenancepar l'intermédiaire d'outilpermettantde personnaliser sonenvironnement de consultation,toutenenrichissantles informationàsa

disposition.

Contexteen France

Si enFrance, onassiste àune évolutioncomparable auxautres pays européens enmatière de numérisation, onassiste toutefois à l'émergence d'une perspective de constitution d'une

bibliothèque numérique europénne, portéeparle ministère de la Cultureet de la Communication etmisen oeuvreparla BnF. Pour éviter la dispersion des initiatives de numérisation,onassiste à la mise enplace auniveau national de cataloguescollectifs des ressourcesnumériques intégrées auportail européen Michael (portailmultilingue qui rassemble les collections numérisées de différents payseuropéens). Ces cataloguessontaunombre de 2 :

- Patrimoine

numérique

Mis en oeuvrepar le ministère dela Culture etde la Communication (quia son propremoteurde

recherche (1)) etintégréen2004dans le projet européen Michael (2), il s'agit d'un catalogue national des fonds culturels numérisés quirecenseles collections ayantfait l'objet d'une numérisation ainsi queles institutions quiysont impliquées (cela qu'importe lasource de fmançement). Enfévrier 2011, il recense pasmoins de 1714 collections et595 institutions.Il

valorise les initiatives de numérisation conduitesparles institution culturelles (ex: musées et

services d'archives)toutenoffrant des modes de navigationpouraccéderauxcollections,comme l'accès géographique, le sujet, le type d'institutionetletype de document.

- NUMES

(3)

Développéparle MESR, géré actuellementparl'ABESeten cohérence avecle catalogue Patrimoine numérique, c'estun catalogue quiestdestinéaux collections des institutions

dépendant de larecherche etde l'enseignement supérieur. Il offreune visibilité sousl'angle

national etinternational des activités denumérisation effectuées pourles besoins de

l'enseignement universitaire,de la recherche etpourla préservation du patrimoine documentaire

etscientifique.

Encequi concernelanumérisationenelle-même, sesrésultats dépendent des institutions qui le

pratiquent. Dans le casdes bibliothèques des collectivitésterritoriales (qu'ils soient régionales,

départementalesoucommunales), les collectivités participent àl'activité de numérisation des institutionsculturelles, toutencoopérantavec les institutionsmajeurs commela BnF, etcela

jusqu'enavoir étépromoteur. Cesopérations, même si ellesnesontfinancés que parles

collectivités et sontmodestes (hormis dans lecas de la Ville de Lyon, quiaeffectuéun

(1) http://collections.culture.fr (2) http://www.numérique.culture.fr (3) http://www.numes.fr

(15)

partenariat avecGoogle pourla numérisationetla diffusion de 500000 ouvragesanciens), sont approuvées et soutenues parle ministère de la Culture etde la Communication dans lamesureoù elles fontpartiedu Plan national de numérisation, qui àétélancé en 1996. ComparéeàGallica, qui fut inaugurée en 1997etquiaeffectuée unenumérisation demasse d'untrès grand nombre de documents(soitenfévrier 2011 267540 ouvrages, 800000fascicules de périodiques et244000

images)enprovenance de sescollections, des éditeurs associésoudesbibliothèques partenaires, les initiativesdeces collectivitéssontmodestesmaissontpeuàpeuintégrésdans lepaysage

numériquesetrépondentauxpréoccupationsdes politiques culturelles des bibliothèques territoriales. Celaenmettantenplace des bibliothèques de tailleplus modeste grâce aux

collectivités, auxprofessionnels etauprojet culturel serattachant, etonpeutdonnerl'exemple de

laBibliothèque municipale de Baud qui numérise descartespostalesayantpourthème la Bretagneetlemonde maritime. Le résultat estquel'on dénombre 466fonds numériséspar175 bibliothèques(dont 135 municipales) (1), composésenpartie de collectionspatrimoniales, de documents liéesàl'histoire locale (commeles oeuvres d'écrivains serattachant àunevilleouà unerégion) oude documentsrares,numériséspourrépondreàla diversité du public. Ces

documents sontmise enlignepardes portails régionaux qui fédèrentparfoislescollectivités

locales.

Pour cequiest du réseaudes Archives de France, il englobe les Archives nationales

(qui

comprennentles Archives nationales, lesArchives nationales d'Outre-meretles

Archives

nationales duMonde du travail)etles archivesterritoriales (qui sont composées des archives départementales, des archivesmunicipalesetdes archives régionales).Avec la décentralisation

dans lesannées 1980, cesderniers sont intégrés lesconseils généraux, les municipalités etles

conseilsrégionaux,qui leursprocurent leursmoyens humains etfinanciers. Ainsi le nombre de

projets denumérisation des documentsd'archives etle nombre de fonds numérisésaccessibles

surInternetaugmentèrent, etondénombrepasmoins de 777 projetspubliésparles services

d'archives (dont 480auniveau départemental) (1). Cesprojetspeuventêtredivisés enplusieurs types:

Lesdocuments iconographiques, qui font parties des projets lesplus nombreux(ex: estampes, affiches, cartespostales, etc.);

Les plans cadastraux;

L'étatcivil (ex: registres paroissiaux, registres d'étatcivil, tables décénnales, etc.),dont 2 à 3 millions deregistres paroissiaux etd'état civil sontnumériséspardépartements;

Lesjournaux locaux;

Divers types de registres etde documents commelesrecensements de populationetles

archivesnotariales.;

Des documents "oraux"commeles enregistrementssonoresetaudiovisuels;

Diverstypes de documents nonclassés (ex: les plans-terriers du 18 èmesiècle de l'abbaye de Cluny etlescahiers des instituteurs pendant la Grande Guerre);

(16)

Anoterqueles inventairesetles instruments de recherche, enparticulier les répertoires

imprimésetdactylographiés plus anciensetles plus rares, sontégalement numérisés. Pourcela, l'océrisationetl'encodage auformat XML (suivant laDTDEAD) estnécéssairepourla

récupération d'undocumentélectronique structuré, cequiad'ailleurs déjà été réaliséparles Archivesnationalesd'Outre-Meret decertains services départementaux.

Dans lecas del'enseignement supérieuretde la recherche (dont l'ANRTenest lié), les bibliothèques numériques sontpeunombreuxetde taille modeste si l'on considère la taille des fondspatrimoniaux etleurs diversité,ce quipeut être cependantcorrigé àtermeparla réforme

desuniversités, lamultiplication des sourcesde financementetlarecherche de notoriété. Par

exemple onpeutciter le casde PôLiB, qui estla bibliothèque numérique patrimoniale des universités Lille 1, Lille 2etLille3 qui l'ont reprises en2008, alors qu'il s'agissait à l'origine

d'unprojet lancéen2001 parle pôle universitaire Lille Nord-Pas-de-Calais. Elle a pourbut de valoriserle patrimoine écrit des universités lilloiseset les bibliothèques régionales partenaires

dans le domaine de l'histoire dessciences.(l)

Ainsi la numérisation s'inscritdans uncontexte demultiplication destypesde documents, du

type depublic, d'évolution de la technologie etde numérisationenmasse depuis 2005. Ce qui

impliqueparconséquentplusieursaspects.

3) Ce

qu'implique la numérisation

Pourqu'une numérisationse fassecorrectement, il faut tenircompte de nombreuxaspectsqui

l'entourent

Que faut-il numériser ?

Dansunenumérisation, il faut aussi savoirce quel'onveutnumériser. Eneffet, il faut savoir queltypede documentveut-onnumériser. Autrement dit, les questions àse posersontles

suivantes: quelaspectdu document doit être numérisé (document papier, document sonore.... ) ?,

dansquel domaine (thèses de lettres, thèses de sciences....) ?, quel estle format initial du

documentànumériser(livres, thèses, brochures....) ?, dans quel thème (par exempleunerégion précise) ?, dans quel but (conservation, complétion d'une bibliothèqueoud'une collection....) ?,

est-ce untexte,uneimagephotographique oubien sonore?

Ainsi ce que l'onveutnumériser détermine le matériel quisera adapté àchaquetypede document,comme les scannersàdéfilementpourles lots de feuilles volantes de thèses

(nécessitant donc desmoyenstechniques), ainsi quele(s) format(s) de numérisation (TIFF ou

JPEG), l'espace de numérisation, le nombre de documents ànumériser, le personnel nécessaire (nécessitant donc desmoyenshumains), le coût de la numérisation (nécessitant desmoyens

financiers), letempsnécéssaire àla numérisation, variable selon les documents etla méthode

choisie (pagepar page ou parlot)etles partenariatsavec différentes institutions (comme le

partenariat ANRT-ABES).

(17)

Les droits d'auteurs

Lorsque l'on parle de droit d'auteur, onparle de deuxtypes de droits quepeutdisposer l'auteur

d'uneoeuvre: les droitspatrimoniaux, qui sontdes droits de reproductionetde communication au public dans lequel l'auteurpeutautoriserouinterdire la reproduction etla communication de ses

documents, etquisontlimités dans le temps; etles droits moraux, quisontdes droits qui

permettent de préserverla paternité de l'auteur (quiale droit de choisir l'anonymatou un

pseudonyme) touten assurantl'intégrité de l'oeuvre, c'est à direpasd'ajout, de suppressionou

de modification decontenusans l'autorisation de l'auteur.

Ainsi l'auteurale droit de fairecequ'ilveutde son oeuvre, cequipeutposerdes questions

conçernantles droits d'auteuretla propriété intellectuelle, à savoir: cette dernière est-elle pertinente ? Peut-onpartager etprotéger? Si oui, quefaut-il protégerexactement? C'estpour

celaque les licences Créatives Commons ((CC)) sontcréespourtenterde répondre àces questions. Ils serventselon les cas à :

-protégerla paternitéde l'oeuvre;

-empêcher d'éventuelles modifications effectuées sansl'autorisation de l'auteur

-empêcher la diffusion d'une oeuvreàdes fins commerciales sansl'autorisation de l'auteur;

-partageruneoeuvre àl'identique de l'original.

Notonsaussi quel'article L.l 12-2 (1) du CPI dormeuneliste de création entrantdans la catégorie des oeuvresde l'esprit, commeles documents écrits ( livres, brochures, et autres écrits littéraires,

artistiquesetscientifiques,comme par exemple les thèses), les photographies, lesoeuvres d'art, lesplanset cartes géographiques, etc(1). Onpeutinclure aussi comme oeuvresprotégéesles lettresmissives, les bases de données(ce dernierpouvantbénéficier sous certaines conditions d'uneprotection "sui generis" ,assuré parl'article L.342-1 du CPI) sur son contenu.),les index et les résumés.

Quelque soit la création celui quipeutautoriser la divulguationrestel'auteur (ouen cas demort

de cedernier les ayantdroits, ouàdéfaut le juge de tribunal de grande instance), sauf si celui-ci a cédé ses droits dereproductionetde représentationparexemple àunéditeur ouàune revue.

Toutefoisonpeut observer descas il existe plusieurs auteurs (comme c'est lecasde certaines thèses numérisées). Dansce cas, ilfaut distinguerune oeuvre de collaboration, dans lequel

plusieursauteurstravaillentsur unprojetcommunetdont chacun d'entre euxpeuventbénéficier

du droitd'auteur,d'une oeuvre collective dans laquelle l'oeuvre estcrée surl'initiative d'une personnephysique oumorale (dont lenomestdivulguésurl'oeuvre), qui bénéficie ainsi du droit d'auteur dans sonintégralité.

S'il existe bon nombre de situation danslequel il faut tenircomptede l'autorisation de l'auteur

(ce dont tientcompte l'ANRT), il existe d'autres casoùl'autorisation de l'auteur n'estpas

nécéssaire, parmi lesquelles :

(1) Anoterquelesoeuvrescitées ci-dessus sontdes exemples parmiunelistede14typesd'oeuvres inclusdans

(18)

Le fait que lesétablissements dépositaire du droit légal peuventreproduire les documents de

quelque manière que ce soitdans des buts decollecte, de conservationetdeconsultation surplace, cela à des finsnoncommerciales, chosespermisesparlesnouvelles dispositions de la

loi DADVSI(article L.132-4 duCode du patrimoine (1)).

Lefait que les bibliothèques, les musées etles services d'archives puissent reproduire des

documentspourles mêmes raisons évoquéesprécédemment, etcela dans des butsnon économiques etnoncommerciales,bien qu'il n'existepas de définition précise d'une

bibliothèqueetqueles critèresetles contraintes sontparfois flous.

Lefaitqu'undocument estreproduitpourrépondre à des situations de handicap telles que le

handicap physique, sensoriel, mental,cognitiveetpsychique, dans des formatsetdessupports

adaptés. Pour cela, les établissements devronteffectuerune demande de dépôtdesfichiers

numériquesconçernantune oeuvre àla BnF ou auCentre national dulivre,àconditionque cela

s'effectue deux ansaprès le dépôt légal de l'oeuvre impriméetquecelaneportepas préjudice auxintérêts légitimes de l'auteur.

Les courtes citations, quipeuvent sefaire souscertaines conditions : qu'elles aientun

caractères critique, polémique, scientifique oud'information; quele nomde l'auteuretlasource du document soientindiqués; et qu'elles soient brèves.

L'analyse du public

Poursavoircommentnumériser, on sedoit de savoir d'abord quel public estciblé, etpar

conséquentquelsusages sontréaliséspar ce public. Pourcela, Isabelle WesteeletJean-François Mouffletendéfinissent troistypes (2) [2]:

Le grand public, quiest "en quête, la plupart dutemps, d'informations généralistes, de

thématiques larges,pouravoirunaperçu, de façonpragmatique, de cequi existe. Curieux, mais

ne désirantpass'embarasser de connaissance tropspécifiques outechniques, il rechercheavant

toutlasimplicité d'utilisationetd'accessibilité à l'information" (2)[2]

-Lepublic "scolaire": dans lecasprésent, la numérisation, quiestconsidérécomme unvecteur

pédagogique très important, "participe à l'ouverture des scolairesetdes étudiantsaumonde

extrascolaire, parl'accès auxmultiples informations, dansunbutd'apprentissage etde

découverte, mais aussid'approfondissement des connaissances, toutenrestantludiqueset innovants. Dotée d'unpotentiel pédagogique conséquent, elleparticipeégalement à un nouveau

typedecommunication (forums, échangesentreécoles, relationsentre élèves, partagesentre

enseignants) denaturecollaborative. " (2) [2]

(1) "L'auteurnepeutinterdireauxorganismesdépositaires,pourl'application duprésenttitre:

1° laconsultation de l'oeuvresurplacepardes chercheurs dûment accréditésparchaque organisme dépositaire surdespostesindividuels de consultation dont l'usage estexclusivementréservé àceschercheurs;

2°lareproduction d'uneoeuvre surtout support etpartoutprocédé, lorsquecettereproductionestnécessaireà lacollecte,à laconservationetàlaconsultationsurplacedans les conditionsprévuesau 1°."

(2)Sous la direction deThierryClaerr etIsabelleWesteel.Manuel de la numérisation. Editionsdu Cercle

(19)

Le public spécialisé: ici, "la numérisation eststratégiquepourtoutles domaines de la

recherche" (1)[2],dans lamesure où elle peutrendre acessible de l'informationrare et précieuse. Selon les mêmesauteurs, "ellefaciliteetrendplus efficace la recherche et

l'exploration des liensparles bibliothécaire, les étudiants, les enseignants, les érudits, les chargésdecoursà l'université, les chercheurs, etc. carellepermetd'étudier les documentsetdestravauxdisparates dans des contextesnouveaux. "(1) [2]. Il s'agit ici du

public principalement conçerné parles universités, etdoncdu public ciblépar l'ANRT.

Le coût

Il s'agit de l'un desaspects des plusimportantspour unenumérisation. En effet, le coût d'une

numérisationdépend du budget du service de numérisation. Le budget, qui représente environ

environdeux tiers des coûts totaux, dans lequel il tenirencompte le calendrier budgétaireet les obligations enterme de paiements etde marchés. Lebudget tientencompte :

- La

préparationet la restauration des documents, dont il faut tenircompte àla fois de la

volumétrie des documents, de l'étatdes documents (voir si le documentn'estpas trop

dégradé, quece soitparlanumérisationouautre chose) etparconséquentde sonétat

sanitaire. Si le documentesttrop dégradé, des opérations de restauration pourraient être effectuées. Lavérification, la restaurationetlapréparationmatérielle nécéssiteune

mobilisation d'équipes de personel,etdoncunbudget;

-Le signalement des documentsparnumérisationqui, associé àun catalogageprécis des

documents, estréalisé selon les normes envigueurtoutenpermettantl'accèsaudocument numériséetl'interopérabilité;

Le déplacement du document, quipeutse faireaufrais du prestataire selon lestermesdu

marchépassé avec ce dernier. Sionveutréduire les frais, onpeutsoitassurersoi-même le transport, soit sous-traiterle document (par le commanditaire ou parleprestataire).

Lanumérisation elle-même, quidépend à la fois dutempspassé àreproduire lapage, du

nombre devues, etdu coût de lapage. Letoutdépend de la technique utilisée : pourla

numérisationpatrimoniale, qui consiste à scannerlentementetmanuellementdes documentsprécieux, fragiles ouabimés, le coûtestde 0,60 à 3 euroslapage; quantàla numérisationparpage, qui dépend du nombre depages de l'ouvrage relié etpar

conséquentdumatériel, l'opérationpeutprendre plusieurs dizaines de minutesetcoûter

de 10 à 40centimes lapage;et dansle cas d'une numérisation demasse, qui s'effectue

pourles documents à platetdes ouvragesmassicotésparscannerbureautique, le coûtest

de 5 centimes par page. Lecoûtde la numérisation dépend aussi dupassage du document numérisé à l'OCR: pourl'OCR brut, c'est 5 centimesparpage; pourl'OCR acceptable, c'est 20 centimes lapageet 15 euros ledocument; etpourle document HCR HQ, c'est 90 eurosle document.

(1) Sous la direction de Thierry ClaerretIsabelle Westeel.Manuel de lanumérisation. Editions duCercle

(20)

L'achat dumatériel, qui inclut le scanner, diverses appareils dephotographie numérique, les ordinateur, ledisque dur, un écrande qualité professionnelleet des licences de

logiciels de traitementetde retouches d'images (pour la vérification de la qualitéetla gestion de la photographie numérique). Le coûtseraélevé sicesmatériauxsont achetés en

grand nombre;

Les supports de livraison: pourlivrer des donnéesaucommanditaire, il faut utiliser des

supportsamovibles,comme parexemple les disques durs qui permettentune livraisonet

unchargement des donnéessur unsystème d'information de manière rapide. Quelque soit le support, le prestataire facturerasonachat.

Lamise enligne, qui endevientuneétapepresque obligéepourla diffusion, etdont les

coûts liéesàcelles-ci doiventêtreprévue (pourl'élaboration du site Internet, l'achat et

l'installation deslogiciels);

Laconservation desdonnées, qui dépend des supportsamovibles etde lasurveillance régulière des supportsde stockage au moyen d'un contrôleparéchantillon de la lisibilité des données etd'uneplanification des opération de migration (dans le casde supports

vieuxoude mauvaise qualité). Dans lecas des stockagesurdes supportsen ligne, des opérations de réplication sontnécessairespoureffectuer une copie de sécuritéet

sauvegarder des données;

Les ressourceshumaines, qui consistent àrecruter des vacatairespourtravaillersurle conditionnement, la miseenordreetl'indexation des documents. Anoterquele coût

humainreprésente environ la moitié du budget.

Letout dépend durespectdu Code des marchés publics (décret n°2006-975 du 1er août 2006), dontl'applicationpermet"le respectdes principes de libertés d'accès à lacommande publique, d'égalité de traitement des candidatsetdetransparence des procédures."(l). Ce qui sous-entend

aumoins trois obligations : définir unbesoin, respecterdes obligations de publicitéetde mise en

concurrence etchoisir l'offre laplus avantageused'un point de vueéconomique. Anoterqu'il existe des seuils de marché danslequel sontdéfinis les modalités de publicitéetde mise en

concurrence. Onpeutremarquer queplus lemontant dumarché estélevé, plus la publicité etla

publicationdansuncertaintype depresse deviennent obligatoires etplus la miseen concurrence seraobligatoireetfera l'objet d'une procédureformalisée. (2)[2]

La tenued'un cahier descharges

Pourassurerle bon déroulement de lanumérisation,unebonne tenued'un cahierdes chargessera nécéssaire. Ce cahier des chargesestplus précisément "uncahier des clauses techniques

particulières", quiest inclus dansundossier de marché public etqui dispose de clausesayant

pourbut de déterminer la préparation, l'exécution de la numérisationetladiffusion des

documents. Onétablira iciunelistenon exhaustive decesclauses (3) [2]:

(1) Article 1 du Code des marchés

(2) Sous la direction de Thierry ClaerretIsabelle Westeel.Manuel de lanumérisation.Editions du Cercle de la librairie. Paris: Electre,2011. 320pages.ISBN: 978-2-7654-0983-0.(Tableaux despages 112-113)

(3) Sousladirection de Thierry ClaerretIsabelle Westeel.Manuel dela numérisation. Editions du Cercle de la librairie. Paris: Electre,2011. 320pages. ISBN: 978-2-7654-0983-0.(Tableauxpages 127 à 134)

(21)

Lecontexte etlesobjectifs du marché:

Il s'agit de déterminer lanature etl'objectif du marché, àsavoir :

+l'identité etles missions ducommanditaire; +lestypes de documents concernés;

+le résultatattendu, l'exploitation prévueetlesusagesenvisagés;

+lepérimètrede la prestation;

+lesrelationsavec d'autres prestatairespourd'éventuelles tâches différentes;

Le résumé desprestations à réaliser:

Il s'agit d'énumérer les futures tâchesréaliséespar leprestataireparordre chronologique, ou sinonindiquer les prestations couvertes par unautreprestataire.

Laprésentationdes documents à numériser:

C'estladescription détaillée des documentsqui feront l'objet d'unenumérisation.

- La

décomposition dumarchéen sous-ensemble:

Il s'agit de préciser ledécoupage d'une prestationenunités, donnant lieuàdes livraisonspar le

prestataire etcorrespondantàdes envois échelonnés de documentsouà

des tâches distincts

à

effectuer.

- Le déroulementet les délais d'exécution :

C'est ladescription de l'enchaînement chronologique de l'envoiet des tâches, ainsiquedes délais de réalisationetde contrôleprévuspourchacune destâches.

- Les conditions

générales d'exécution:

Il faut préciserles règles de base qui serontsuivies durant laprestationetqui guideront la

relation

prestataire/commanditaire.

- Lamise à

disposition des documents:

Description de la préparationdudocument (ex: préparationdu format)et de la forme du

bordereau les accompagnant(informations, format)

- La

priseencharge, letransport et le stockage des documents:

Auniveau deces aspects, il faut définir les rôles etlesresponsabilités du prestataire etdu commanditaire, ainsi queles contraintes de chacune des tâches.

Les caractéristiques des fichiers àfournir:

Il s'agit ici de détailler les caractéristiques techniquesdes fichiers images (ex: résolution,

colorimétrie....),préciser le formattexte désiré après océrisation, expliciter les règles de

nommage de fichieretpréciserle format des métadonnées s'yassociant.

Le droitd'auteur :

C'est laprécision selon laquelle le prestatairene disposepas de droitd'auteursurles images

(22)

4) Les

objectifs

Avantde définir lafaçon de numériser, il convient d'abord d'enconnaître les objectifs

poursuivis, qui doivent d'abord répondre à certains critères. Pour cela, il existeunmoyen

mnémotechniquepour connaîtrecescritères, àsavoirl'acronyme SMART (intelligenten

anglais), dont les significations sont :

« S » pour Spécifique {Spécifie)

« M » pourMesurable (Measurable) « A»pourAtteignable (Achievable)

- «R»

pourRéaliste (Realistic)

«T » pour Temporellement défini (Time-bound)

Autrementditles objectifs poursuivis, ainsique chacun decescritères sedoivent d'être le plus

proche de la réalité possible, qu'il soitmatériellement, économiquement, temporellement et humainement. IsabelleWesteel (archiviste paléographe, conservateur des bibliothèques, titulaire d'un DEA d'Histoire etundesdirecteurs del'ouvrage« Manuel de la numérisation ») et

Jean-François Moufflet (archiviste paléographe, conservateurdu patrimoineetdoctorantenhistoire

médiévale)proposentpar ailleurs des listes d'objectifs selon deux ordres (chacun d'entre eux

concernantun ordreet directementissuede l'ouvrage« Manuelde la numérisation ») :

Au niveaupatrimonial : Ces objectifs sont :

favoriserl'accès auxdocuments anciens etfragiles. Pour celacetobjectifdoit sefairepar

la reconstitutionvirtuelle descollections, lacomparaison des exemplaires

géographique-mentdistants, la valorisationetla facilitation de l'accèsàl'informationparl'offre denou¬

veauxmodes de consultation pourle public ;

faire connaîtredes documents noncommunicablesoun'ayantjamaisété communiqués en

raison de leur étatsphysique(fragilité despagesde documents, documents tendantàse

dégraderlors de certaines conditions définiscomme la température etl'humidité,enparti¬ culier dans lecas desarchives). Dansce cas, les documents apparaissent commedes sub¬

stituts pourpallierces défauts ;

faire connaître des documentsdontl'accès aucontenuinformatifestdifficile, commepar

exemple les manuscrits enluminésetlesmarques de lecture. Pour cela, la numérisation

permetde faire ressortir des détails jusqu'alors inaccessible à l'œil humain ;

préserverlecontenuinformatif des documents condamnésàunedégradation irrémédiable du faitde lafragilité dusupport ;

(23)

transférer dansunformatnumérique des supportsquisontendanger, empruntés oumal¬ menés pourmieuxlespréserveretréduire leur consultation, comme c'est le casdes

plaques deverre, des films surCelluloïd oude lapresse ;

valoriser lepatrimoine local, régional, nationaletinternational. Dans ce cas, chaque insti¬

tution doits'interrogersur cequipeutêtrefacteurd'identitéetde communauté àtravers

les documentsconservés. Eneffet, les documentsrequiérant le plus grand intérêtnesont pasforcément les plus esthétiques, les plus prestigieux oules plus anciens.

Atravers cesobjectifsauniveau du patrimoine, onpeutremarquer quela numérisationpeut sefaire dansunbutde conservationetde communication desdocuments, etdansune moindre mesureunbutpolitique etculturel.

Au niveau documentaire etscientifique :

Les principaux objectifsauniveau de cespoints devue sont :

ladiffusion des documentsàungrand nombre de personnesgrâceaux nouveauxmodes deconsultationetdecommunication ;

laparticipation àla dynamique actuelle de la dissémination de l'information, le soutienà la création de contenus etdeproduits multimédias,toutenfavorisant la maîtrise des tech¬ nologies nouvelles de l'information ;

lamise enœuvredesoutils etproduits numériques dans le cadre des TICE(Technologies de l'Informationetde laCommunicationpourl'Education) ;

l'inscription du projet de numérisation dans lapolitique culturelle duterritoire, enparte¬

nariatavec d'autres structures deconservation,etsurdesthématiques partagées ;

offriraupublic intéressé la possibilité de consulterune riche collection régionaleoulo¬ cale ;

lapermission de l'accèsàdes collections thématiques numérisées enlienavec la politique

documentaire de l'établissement ;

laparticipation àdesprogrammes de coopérationet de concertationetdoncla numérisa¬ tion parexemple d'imprimés complémentaires duprogrammede numérisation demasse mené parla BnF oudesprogrammes menésparlesautres établissements culturels (ar¬ chives, bibliothèquesoumusées). Dans le casdesbibliothèques universitaires, les docu¬

mentsnumérisés sontpourlaplupart des thèses de doctoratsoudes mémoires de Master ;

- l'insertion

dans des programmes coopératifs nationauxetinternationaux, commele projet

(24)

(Cedernier estunprogrammede numérisation lancéen2010ayantpourbut de

reconstituerunebibliothèque virtuelle de documentsroyauxeuropéens du Moyen-âge à la Renaissance. Elle associe pourcelacinq grandesbibliothèques européennes) ;

permettre àl'établissement departiciper à des projets de recherche, commeles projets

Corpus lancésparl'Agencenationalde larecherche(ANR) ;

lamise enligne de la productionimpriméedeschercheurs ;

lamiseen lignedes fonds d'archives d'une grande richessepour un usagepédagogique

ou unusage de recherche, personnelle ouscientifique ;

veiller àrépondre auxbesoins des chercheursen corpus, enreconstitution virtuelle de col¬

lections oudebibliothèques dispersées ;

enfin, la mise enplace d'un projet pilotepourtesterlesperformances techniques detelles technologies, enparticulier lesprojets innovants.

Ici les butsinduits parla liste d'objectifsauniveau documentaire etscientifiqueconcernent

d'unepartlesbuts scientifiques, etd'autrepart dansdesbuts techniques, culturels,

scientifiques etde coopérationentreles différentes organisations.

Unefois les objectifs ciblés etle cahier des charges réalisé,il s'agit maintenant depasseràla numérisation.

Références

Documents relatifs

Cette tâche n’est pas triviale car si l’OCR doit apprendre à distinguer la forme de chaque caractère dans un vocabulaire de taille souvent importante, il doit en plus être capable

De plus, un code de domaine appelé oaiSet, basé sur la classification Dewey et utilisé dans la recommandation TEF, a été attribué pour chaque thèse en préparation, comme

C’est une structure qui peut être exprimée dans les fichiers sources sous forme de commandes associées au texte ou directement sous forme graphique dans un document visualisable

Seules les banques de données, définies comme des collections de données factuelles validées, répondent à cette catégorisation. En effet, la plupart des bases de données permettent

Grâce à la méthode DMOS et au générateur de systèmes de reconnaissance de documents structurés, nous avons pu produire par compilation un système de reconnaissance capable

Navimages est composé de trois modules qui peuvent fonctionner de manière indépendante : le collecteur va identifier et préparer les images ; la base documentaire va

On ne peut pas construire de résolution magnifique des singularités pour de telles hypersurfaces, mais on montrera qu’elles admettent tout de même des résolutions

Mais, au-delà de la question de la diffusion, l’exposé propose également des applications possibles à la numérisation du patrimoine autour du text mining et du