• Aucun résultat trouvé

La numérisation des catalogues : une analyse rétrospective

N/A
N/A
Protected

Academic year: 2022

Partager "La numérisation des catalogues : une analyse rétrospective"

Copied!
17
0
0

Texte intégral

(1)

une analyse rétrospective

Sarra Ben Lagha

Inforge, Ecole des HEC, Université de Lausanne BFSH1, 1015 Lausanne

Sarra.benlagha@hec.unil.ch

RÉSUMÉ. Dans le secteur des bibliothèques, toutes les activités professionnelles reposent sur la création et la gestion des catalogues. Le passage des catalogues papiers aux catalogues numériques est un projet ambitieux dont la complexité est difficile à prévoir et à gérer. Dans cet article nous nous intéressons aux problèmes posés par la mise en œuvre pratique d’un tel projet. Nous commençons par définir les catalogues bibliographiques, puis la problématique de leur mise en réseau. Nous abordons par la suite les modalités et les difficultés de leur numérisation. Nous terminons enfin cet article par une étude de cas et une conclusion.

ABSTRACT. In the sector of the library all the professional activities reset on the creation and the management of the catalogues. The digitalization of those is an ambitious project whose complexity is difficult to evaluate and to manage. In this paper we are interested with in the problems arising at the practical implementation of such a project. We start by an introduction, then we define the bibliographical catalogues, and explain the difficulties of their federation and networking. We then discuss the methodologies of their digitalization.

And we finally present a case study followed by a conclusion.

MOTS-CLÉS : notice bibliographique, catalogue, numérisation, normes et standards.

KEYWORDS: bibliographic record, catalogues, digitalization, standards.

(2)

1. Introduction

Chaque secteur professionnel manipule et gère des dossiers, plus ou moins évolutifs, plus ou moins complexes et plus ou moins volumineux. Dans le secteur des bibliothèques, on gère des périodiques et des monographies qui ont un cycle de vie (acquisition, catalogage, prêt, etc.) et pour cela on utilise des « dossiers ». Mais plutôt que d’associer un dossier à chaque ouvrage, chaque étape du cycle de vie de ce dernier engendre la création ou la mise à jour d’un document dans un ou plusieurs dossiers (fichier de commande, livre d’inventaire, catalogue matière, catalogue auteur, etc.). Aujourd’hui, on s’imagine mal que pour trouver un livre, il faut se déplacer jusqu’à la bibliothèque, chercher les fichiers (physiques), ouvrir des tiroirs en acier et faire défiler des fiches cartonnées rédigées selon un format peu convivial et classées par ordre alphabétique. Pourtant, dans la période de transition qui caractérise actuellement la production et la diffusion de l’information scientifique et technique, tous les pays ne se trouvent pas au même niveau (Guinchat et al., 1989).

Le passage du papier au numérique est un projet ambitieux dont la complexité est difficile à prévoir et à gérer. Dans cet article nous nous intéressons aux problèmes posés par la mise en œuvre pratique d’un tel projet dans le secteur des bibliothèques. Nous commençons par définir les catalogues bibliographiques, puis la problématique de leur mise en réseau. Nous abordons par la suite les modalités et les difficultés de leurs numérisation. Nous terminons enfin cet article par une étude de cas et une conclusion.

2. Les catalogues bibliographiques

Pour qu’il soit disponible pour les lecteurs, tout document doit être catalogué.

Cataloguer un document consiste à créer et lui associer une notice bibliographique dans un catalogue. Il existe des formats normalisés de structuration et de représentation de ces notices. Un exemple de notice bibliographique du

« Dictionnaire critique de la révolution française de F. Furet », telle qu’elle figure dans le catalogue de la Bibliothèque nationale de France (BNF, 2002) selon le format UNIMARC (BNF, 1994) est illustré par la figure 1. Si un tel format est très utile pour des catalogueurs professionnels, il est loin de l’être pour les lecteurs qui voudraient rechercher à un ouvrage et y accéder dans une bibliothèque. Pour cela, il existe un autre format plus restreint et plus lisible pour présenter une notice aux lecteurs, c’est le format ISBD (International Standard Bibliographic Description).

La figure 2 illustre la même notice bibliographique que la figure 1 mais exprimée en format ISBD. Ces deux formats justifient la gestion et la maintenance de deux catalogues : le catalogue professionnel et le catalogue public (destiné aux lecteurs).

Un catalogue se présente comme un ensemble de fiches classées par ordre alphabétique. Suivant le mode d’accès (titre, auteur, localisation...) on a besoin de

(3)

catalogues différents. On distingue ainsi, du côté des lecteurs, le catalogue matière, le catalogue auteur, le catalogue géographique, etc., et du côté des professionnels le catalogue topographique (nécessaire à l’inventaire), le catalogue chronologique (classement par numéro d’entrée du document dans le fonds documentaire), etc.

L’élément d’accès à la notice dans un fichier (ou catalogue) s’appelle la vedette ou l’autorité. On parle alors de vedette-matière, vedette-auteur, etc.

Figure 1. Notice bibliographique au format UNIMARC

Les données bibliographiques d’une notice se répartissent en : zones descriptives permettant d’accéder à la notice par le titre ; zones d’accès normalisé permettant d’accéder à la notice le plus souvent par l’intermédiaire de la liste de vedettes ou des autorités et zones de liens permettant de lier une notice bibliographique à une autre

(4)

notice bibliographique (pour faire référence à l’ouvrage en langue d’origine s’il s’agit d’une traduction par exemple).

Figure 2. Notice bibliographique au format ISBD

La création d’une notice se fait selon deux processus. Le premier est quasi automatique ; il consiste à remplir les champs descriptifs de la notice tels qu’ils figurent sur le document à cataloguer (titre exact, auteur, maison d’édition, etc.). Le second consiste à décrire par un ensemble de mots, de quoi parle le document ; c’est l’indexation. L’indexation d’un document est un processus intellectuel assez délicat qui dépend fortement du catalogueur. De la compétence de ce dernier et de sa maîtrise du sujet traité dépend la qualité de l’indexation et donc la facilité de retrouver le document par les utilisateurs suite à une recherche par thème ou par sujet. L’indexation consiste à associer des descripteurs au document. Ces descripteurs peuvent être des mot-clés librement définis par le catalogueur suite au seul examen du document à indexer, ou un ensemble de termes issus de la confrontation du document au notions déjà présentes dans un référentiel, c’est-à-dire un langage documentaire (liste de vedettes-matières, thésaurus ou classification) (Aitchison et al., 2002 ; Chan, 1994 ; Markey, 1986 ; Mortimer, 1999). On parle alors d’indexation libre et d’indexation contrôlée.

La notice ainsi établie est appelée notice bibliographique. Pour gérer les exemplaires, on crée en général des notices d’exemplaires qu’on rattache à la même notice bibliographique. La notice d’exemplaire et sa notice bibliographique constituent une notice catalographique. Cette dernière contient des informations concernant le numéro d’exemplaire, le statut (prêtable, exclus du prêt, etc.), la situation (en reliure, en prêt, disponible, etc.), la cote qui indique l’emplacement physique de l’ouvrage sur les rayons, etc.

En plus des notices bibliographiques, la bibliothèque gère des notices d’autorité.

Les autorités définissent la forme qui fait autorité pour une entité (personne physique, collectivité, titre uniforme, mot-matière) et qui doit être utilisée comme vedette dans les notices bibliographiques. Pour donner un exemple, nous avons cherché comment s’écrit le nom de la personne la plus recherchée sur terre en ce moment, nous avons trouvé six formes différentes en écriture latine : Usama Bin Laden, Osama Bin Laden, Oussama Ben Laden, Osama Ben Laden, Osama Bin

(5)

Ladin et Ussamah Bin Laden. Un accès au catalogue par auteur, doit refléter tous les ouvrages écrits (ou traduits) par un même auteur quelle que soit la transcription de son nom. Le fichier d’autorité définit pour cela la forme retenue et les formes rejetées. Comme les notices bibliographiques, les notices d’autorité ont aussi des formats normalisés. La figure 3 illustre la notice autorité-matière liée à la notice bibliographique de la figure 1 ; le symbole « < » désigne les termes exclus,

« >><< » désigne les termes associés et « >> » désigne les termes spécifiques.

Figure 3. Exemple de notice d’autorité

3. La problématique de la mise en réseau

La coopération et l’échange des données et des informations sont des concepts ancrés dans l’esprit et les pratiques des professionnels des bibliothèques. D’une part, parce que dans ce domaine on a toujours été conscient du fait qu’il est impossible de se procurer, par ses propres moyens, tous les documents dont on aurait besoin, et, d’autre part chaque ouvrage étant édité en centaines d’exemplaires, pour tout document qui arrive dans une bibliothèque, il y a de très fortes chances qu’un exemplaire ait déjà atterri dans une autre bibliothèque et qu’il y soit déjà catalogué.

Pour éviter le travail en double du côté des professionnels et rendre de meilleurs services aux lecteurs ou chercheurs, les bibliothèques s’organisent généralement en réseaux d’information. Il s’agit de réseaux et de services de diffusion, d’échange ou de commercialisation de notices bibliographiques. Dans tout système de gestion de bibliothèques (même manuel) on retrouve donc la notion d’import et d’export de notices. Ceci engendre deux modes de catalogages : le catalogage originel et le catalogage dérivé. Dans le premier mode le catalogueur créé lui-même toute la notice bibliographique alors que dans le second mode il importe (ou copie) une notice existante (à partir d’un listing, d’un cédérom, d’une base de donnée ou d’un site web) et l’adapte localement.

(6)

Ces réseaux nécessitent, au-delà des problèmes classiques de mise en œuvre d’une infrastructure connectique, l’établissement d’une organisation intellectuelle et matérielle basée sur le développement et le respect de standards et de normes pour chaque étape du cycle de vie d’un document. La normalisation touche notamment la structure et la forme des notices. La première traduction informatique des normes bibliographiques remonte aux années 1960 avec l’arrivée, aux Etats-Unis du format MARC (Machine Readable Cataloguing) (Piepenburg, 1999). Plusieurs autres formats en ont été dérivés depuis (CanMARC au Canada, USMARC aux Etats-Unis, INTERMARC en France, etc.) et on converge aujourd’hui vers un format universel qui est l’UNIMARC. Précisons que ces formats s’appliquent aux documents imprimés (livres et périodiques) et qu’une bibliothèque peut aussi gérer d’autres types de documents, tels que, les documents sonores, vidéos, multimédias, électroniques, images numérisées, cartes, partitions, etc. Pour décrire ces documents il faut créer d’autres catalogues qui font appel à d’autres standards basés sur le concept de métadata, dont Dublin Core (DublinCore, 2002 ; NIS, 2001) et RDF (Resource Description Format) (Brickley, 2000 ; Hjelm, 2001).

Une autre norme toute aussi importante est l’ISO 239.50 mieux connue des professionnels sous le nom de Z39.50 (Michael, 1994NIS, 1996). Créée en 1989 et gérée par la bibliothèque du Congrès aux Etats-Unis, cette norme a pour objet de faciliter l’interconnexion entre des clients et des serveurs et ce indépendamment des différences entre leurs systèmes respectifs et des différences entre les bases de données auxquelles le serveur donne accès. La norme définit un ensemble d’attributs permettant d’organiser le lien entre le logiciel serveur Z39.50 et la base de données bibliographiques à laquelle il donne accès. En général, chaque système informatisé implémente une partie de ces attributs selon l’application qu’il met en place. Il définit ainsi un profil et une interface spécifique qui interprète une requête et sa réponse.

La première adaptation nécessaire pour les notices importées concerne la langue de catalogage. Suivant que la langue de catalogage est le français, l’arabe, l’allemand ou l’anglais par exemple, une traduction des champs non descriptifs est nécessaire. Il est à signaler cependant que ceci nécessite d’autres niveaux de normalisation pour les systèmes de catalogages informatisés ; il s’agit du codage des caractères et de la gestion de plusieurs alphabets ou scripts. A défaut de ces fonctionnalités, les bibliothécaires se trouvent obligés de noter les champs dans une notice par translittération et non par traduction.

Une seconde adaptation, toute aussi importante, concerne l’indexation, c’est-à- dire les descripteurs du contenu sémantique du document. L’adaptation est d’abord culturelle (un livre concernant la Méditerranée, par exemple, ne pourra jamais être indexé de la même manière au Canada, en Italie et en Chine). Elle concerne ensuite le langage documentaire adopté ; ainsi, des mots-clés issus d’une indexation libre par exemple doivent être transformés en descripteurs autorisés dans une indexation contrôlée ; de même, lorsqu’on change de liste de vedette matières ou de thésaurus, les descripteurs autorisés et leur hiérarchie peuvent aussi changer. Enfin,

(7)

l’adaptation doit aussi se faire au niveau de la précision de l’indexation ; ainsi, on ne pourra pas indexer un livre par le descripteur « santé » dans la bibliothèque d’une faculté de médecine. Suivant que la bibliothèque est spécialisée ou pas il faudra parfois préciser une indexation trop encyclopédique ou généraliser une indexation trop spécifique.

Lorsqu’il s’agit de créer une bibliothèque virtuelle par la mise en réseau de plusieurs bibliothèques, leurs catalogues respectifs sont fédérés en un seul : le catalogue collectif. Ce mode de travail suppose une plus grande rigueur quant aux règles de catalogage. Un même document peut être acquis par plusieurs bibliothèques du réseau, cependant, à tout document, quels que soient le nombre d’exemplaires disponibles et leurs localisations, doit correspondre une seule notice.

Il faut alors définir des règles et des protocoles permettant de gérer les modes et la qualité du catalogage. Plusieurs scénarios sont possibles ; en général il faut se mettre d’accord sur :

– la grille ou bordereau de saisie : définissant les champs considérés comme obligatoires dans une notice bibliographique ;

– le nombre minimum et maximum de descripteurs pour chaque document ; – le langage documentaire à utiliser : l’indexation libre étant à exclure, les membres du réseau de bibliothèques adaptent un même outil documentaire (liste de vedettes-matières, thésaurus...). Dans certaines situations, les seuls descripteurs autorisés ne suffisent pas à faire une indexation précise et correcte, pour cela, une commission est en général chargée de mettre à jour et faire évoluer le langage documentaire sur propositions des différents catalogueurs ;

– la qualité des notices : avant de créer une notice, le bibliothécaire consulte le catalogue collectif, si le document a déjà été catalogué, a-t-il le droit de modifier la notice existante ? En général, on adopte la règle de première initiative ; c’est-à-dire que la première notice soumise par quelqu’un dans le catalogue collectif est implicitement validée par tous les catalogueurs, cela dit, des réunions périodiques (annuelles ou semestrielles) sont généralement programmées pour discuter de la qualité de certaines notices et, le cas échéant, de leur rectification ;

– le niveau d’indexation : dans le cas où une bibliothèque spécialisée participe à un réseau de bibliothèques, il peut être nécessaire, voire même indispensable de gérer deux niveaux d’indexation ; une indexation encyclopédique en respectant les règles générales du catalogue collectif et une indexation locale plus détaillée pour une recherche plus spécialisée par le public concerné.

4. Du papier au numérique

La numérisation des catalogues change l’art du possible dans le domaine des bibliothèques. En effet, elle permet la création de nouveaux services aussi bien pour les lecteurs que pour les professionnels. Cependant, le passage des catalogues papiers aux catalogues informatisés pose le problème de la rétroconversion des

(8)

données. C’est cet aspect qui nous intéresse dans la présente section. Par

« rétroconversion » nous entendons la transformation des catalogues papiers en dossiers numériques et leur intégration dans un seul dossier qui représente le catalogue collectif. Nous ne traitons ni de la transformation des notices bibliographiques ou d’autorités d’un codage informatique à un autre, ni des problèmes liés à la reconnaissance des images numérisées de notices tels que étudiés par Belaïd et al. (Belaïd, 1997 ; Belaïd, 1998a ; Belaïd, 1998b ; Chenevoy, 1996).

La difficulté de la création du catalogue électronique dépend fortement de l’état de l’existant. Selon la taille de la bibliothèque, les moyens dont elle dispose et la compétence de son personnel, la qualité de ses catalogues peut varier aussi bien au niveau informationnel qu’au niveau des caractéristiques physiques du support.

Plusieurs situations peuvent ainsi se présenter :

– une bibliothèque dispose normalement d’un catalogue pour l’accès au public (OPAC OPen Access catalogue) au format ISBD mais il arrive qu’elle ne gère pas de catalogues professionnels, au format MARC ou un de ses dérivés. Dans plusieurs cas, la génération du catalogue électronique doit alors se faire à partir de l’OPAC ;

– suivant la politique de prêt, les documents peuvent être disposés dans la salle de lecture pour l’accès libre et/ou en magasin. Dans certaines petites bibliothèques (universitaires notamment), il n’existe même pas d’OPAC au vrai sens du terme.

Certains bibliothécaires gèrent des fichiers Excel et éditent des catalogues papiers sous forme de listings qu’ils mettent à la disposition de leurs lecteurs. Parfois, tous les documents sont en libre accès et aucune forme d’OPAC n’est disponible. Chaque exemplaire contient alors une fiche (en général manuscrite) qui permet de gérer les prêts ;

– les fiches cartonnées formant un OPAC peuvent avoir été éditées par un traitement de texte ou même par machine à écrire, cela explique parfois le fait que sur certaines de ces notices, le catalogueur inscrit à la main des données dans une langue qu’il n’a pu taper avec sa machine (comme l’arabe sur certaines fiches en français) ;

– quand l’OPAC existe, sa qualité informationnelle peut aussi être très différente d’une bibliothèque à l’autre. Certains professionnels ne respectent pas à la lettre les normes de catalogage, ainsi il arrive souvent qu’ils ne prennent pas la peine de mentionner l’identificateur unique standardisé qui est l’ISBN (International Standard Book Number) du document dans sa notice.

La rétroconversion des notices consiste à transformer un ensemble de catalogues papiers (fiches cartonnées) en un catalogue collectif numérisé. Pour cela, on peut procéder à la resaisie de toutes les fiches, leur numérisation puis conversion du mode image en mode texte ou le téléchargement de notices électroniques. En général, il s’agit plutôt d’une combinaison de ces trois approches. Cette construction s’inscrit dans un processus comportant un nombre relativement élevé d’étapes organisationnelles, techniques ou « intellectuelles » et faisant appel à des compétences diversifiées. Il ne suffit pas de budgéter un tel projet, il faut aussi se

(9)

donner les moyens techniques et humains de le faire. Dans ce qui suit, nous exposons quelques choix techniques, leurs prérequis et leurs limites. Avant toute étape, il convient par ailleurs de choisir la structure des données, c’est-à-dire le format des notices qui formeront le catalogue collectif électronique.

4.1. Numérisation/conversion

Cette méthode ne peut s’appliquer que lorsque l’OPAC existe réellement sous la forme d’un ensemble de fiches et que celle-ci sont dans un bon état. Cette méthode est en général réalisée en sous-traitance et ce pour deux raisons essentielles. La première est qu’une bibliothèque, ne peut en général se permettre d’investir dans la création et la gestion d’un atelier composé d’équipements souvent coûteux et vite dépassés par les évolutions technologiques rapides et qui ne peut s’amortir par les seules activités de la bibliothèque. La deuxième raison est que pour numériser les fiches, il ne suffit pas de les scanner, il faut par la suite transformer les « images numériques » des fiches en notices au format texte ; le volume important des fiches à traiter et leur état physique et typographique nécessite alors le recrutement et la formation d’un personnel qualifié. Selon la durée prévue pour cette opération, la solution prestataire de services peut s’avérer plus rapide et plus professionnelle que la mise en œuvre un atelier interne. Le rôle du prestataire consiste à numériser, en mode image, sur la base d’un cahier des charges très précis les fiches qui lui sont fournies. Puis de les transformer en fiches catalographiques selon le format indiqué dans le cahier des charges (par un processus de reconnaissance de caractères et/ou de correction de chaque fiche individuellement). Cette solution de numérisation/conversion, qu’elle soit faite en local ou outsourcée, pose plusieurs problèmes logistiques.

Une des difficultés majeures concerne précisément la définition du cahier des charges et le contrôle qualité du résultat fourni. Ce contrôle qualité, effectué systématiquement sur toutes les fiches, mais plus souvent par échantillonnage, vu le volume important à contrôler, pose le problème de l’élaboration des critères de qualité qui sont demandés aux prestataires et qui sont ensuite repris pour juger la qualité du travail fourni. En plus, ce contrôle doit aussi toucher la complétude du travail ; il faut vérifier que toutes les fiches du catalogue papier existent réellement dans le catalogue électronique livré. Rappelons à ce stade que tout document non catalogué est un document inaccessible et donc définitivement perdu.

Un autre problème tout aussi important est celui de l’accès aux fiches à cataloguer. Les fiches à numériser doivent être fournies au prestataire de service (fournisseur ou atelier interne). Faut-il envoyer les fiches et arrêter l’exploitation de la bibliothèque jusqu’à la fin des travaux ou plutôt dupliquer les fiches ? S’il faut dupliquer les fiches, faut-il le faire par photocopie, photographie et que faut-il donner au fournisseur : la copie ou l’original car de meilleure qualité ? Et s’il faut ainsi manipuler les fiches une à une, pourquoi ne pas les numériser à ce moment-là ?

(10)

Si c’est le cas, qui doit faire cela, la bibliothèque ou le prestataire de service ? Et qui définit alors les caractéristiques techniques de la numérisation, puisque de la qualité des images des fiches dépend, en partie, la facilité de leur traitement pour la génération du catalogue électronique ?

4.2. Resaisie

Cette méthode consiste tout simplement à saisir les fiches du catalogue une par une lorsque l’OPAC existe réellement sous la forme d’un ensemble de fiches, ou à saisir les différents champs à partir d’un listing édité sous la forme d’un tableau Word ou Excel. Elle peut se faire par les ressources propres de la bibliothèque ou en sous-traitance. Cette technique pose les mêmes problèmes logistiques et de contrôles de qualité et de complétude discutés ci-dessus. Les risques d’erreur ne sont pas dus aux erreurs éventuelles de la reconnaissance de caractères, mais simplement au erreurs de frappe ou de saisie.

4.3. Téléchargement

Plutôt que de construire le catalogue électronique à partir des fiches du catalogue papier, cette méthode consiste à importer les notices à partir d’une ou de plusieurs bases bibliographiques et de les compléter en insérant les cotes. Par opposition aux deux méthodes précédentes, la qualité des notices importées est en général supérieure à la qualité informationnelle du catalogue initial. Cependant elle pose encore d’autres problèmes. En effet quelle que soit la base bibliographique choisie il est quasiment impossible qu’elle contienne toutes les notices recherchées. Se pose alors le problème de la couverture de la base ; il s’agit de la proportion des notices contenues dans la base par rapport à celles qui constituent le catalogue papier.

Notons toutefois que si une base pouvait contenir toutes les notices, il y a de fortes chances que ce soit celle de l’OCLC (Online Computer Library Center) (OCLC, 2002), mais cette base étant uniquement en anglais, le problème de la langue de catalogage restreint son utilisation.

Ainsi, il faudra choisir plusieurs bases plutôt qu’une. Quand ces bases sont disponibles sous la forme de cédéroms les incidences budgétaires sont moins importantes que lorsqu’elles ne sont disponibles qu’en ligne, et ce même si l’on ne paye que la notice que l’on télécharge, à cause du coût de la connexion. Sur le plan pratique, il faut pouvoir repérer quelles sont les notices trouvées et celles qui ne le sont pas et compléter le traitement de ces dernières par une autre méthode.

Cette méthode de rétroconversion, bien qu’a priori très intéressante, car indépendante de la qualité du catalogue papier, ne peut être appliquée dans tous les cas. En effet, l’accès à une base se fait par un identifiant, c’est l’ISBN qui joue normalement ce rôle. Or, si les fiches de l’OPAC initial ne contiennent pas l’ISBN

(11)

comment peut-on accéder aux notices de la base et être certain qu’il s’agit des notices recherchées ? Il y a toujours moyen d’accéder par titre et auteurs par exemple, mais cela devient beaucoup plus pénible et les risques d’erreurs augmentent considérablement.

4.4. Adaptation et intégration

Ces trois méthodes sont beaucoup plus complémentaires que concurrentes pour la construction du noyau du catalogue électronique à partir d’un catalogue papier.

En effet, nous parlons de noyau, car à ce niveau il reste encore les étapes d’intégration des catalogues des différentes bibliothèques pour la construction du catalogue collectif et l’adaptation sémantique des notices.

L’intégration consiste en fait à enlever les doublons, généralement par fusion des notices identiques afin de garantir qu’à toutes les notices traitant d’un même ouvrage dans les catalogues papier différents correspond une seule notice dans le catalogue collectif. Cette notice doit faire référence à toutes les cotes contenues dans chacune des notices papier initiales, généralement préfixées par un code identifiant la bibliothèque d’origine pour éviter qu’une cote se produise plus d’une fois. La fusion des notice est une fonctionnalité offerte par la majorité des modules de catalogage des différents logiciels de gestion de bibliothèques. Il suffit donc, de se doter d’un tel module et de faire en sorte que le noyau du catalogue électronique respecte bien l’une des normes de structuration de données (MARC ou ses dérivées) supportées par ce module. Par ailleurs, pour reconnaître, d’une manière automatique, que deux notices sont identiques, il faut aussi disposer d’une clé d’accès qui est normalement l’ISBN. A défaut de l’ISBN, il faudra gérer (fusionner) les doublons manuellement en attendant d’avoir le courage de parcourir tous les rayons et de consulter les ouvrages un à un pour compléter cette information dans le catalogue électronique, en faisant attention à ne pas oublier les ouvrages absents des rayons (en prêt, en reliure...).

Après l’intégration des différents catalogues et la suppression des doublons, il faut finalement procéder à l’adaptation de l’indexation comme décrit dans la section précédente et puis éventuellement gérer le lien entre les notices bibliographiques et leurs notices d’autorités si celle-ci sont déjà disponibles dans un format électronique et normalisé.

Comme nous pouvons le ressentir à partir de ce qui précède, la numérisation des catalogues papiers, pour la création du « dossier numérique » qu’est le catalogue collectif, est une opération délicate, lourde et coûteuse. Pour minimiser les coûts, surtout lorsqu’il s’agit de bibliothèques universitaires, on peut procéder à une bibliothèque par secteur, par exemple une seule faculté de médecine, une seule école d’architecture, etc., et utiliser le noyau ainsi construit comme base bibliographique pour la numérisation des catalogues des autres bibliothèques de la même spécialité.

Une autre manière de diminuer le budget en étalant le projet dans le temps, consiste

(12)

à définir des priorités, tel le fait de sous-traiter la numérisation des notices des ouvrages les plus consultés et prendre le temps d’enrichir le catalogue localement par les notices des autres ouvrages avec une équipe plus restreinte.

Malheureusement, quand on travaille uniquement en mode papier, il est difficile de disposer de statistiques fiables et à jour pour pouvoir identifier les fonds documentaires les plus urgents à traiter.

5. Etude de cas

Il va sans dire que l’informatisation des bibliothèques universitaires (BU) et leur interconnexion sont indispensables pour tirer profit de toutes les ressources documentaires et de rationaliser leur évolution. Dans cette section nous illustrons à travers la description d’un cas réel, les étapes et les problèmes d’un tel projet.

5.1. Contexte général

Le projet que nous décrivons consiste à informatiser et interconnecter toutes les BU d’un pays. Nous supposerons qu’une étude préalable a été réalisée pour évaluer le budget nécessaire et définir la durée ainsi que les étapes du projet, et que cette étude a révélé les résultats suivants :

– il existe près d’une centaine de bibliothèques, une dizaine pourraient être considérées comme grandes bibliothèques, une dizaine comme moyennes et le reste comme petites bibliothèques ;

– la plus grande majorité des bibliothèques sont plus ou moins spécialisées ; – quelques bibliothèques disposent d’un système informatisé de gestion de bibliothèques (SIGB), certaines utilisent des tableurs comme outils de gestion et les autres sont totalement manuelles ;

– aucune bibliothèque n’est raccordée à l’internet et aucun réseau physique n’est encore installé à cet effet ;

– la gestion des acquisitions est réalisée d’une manière autonome d’une bibliothèque à l’autre ;

– les collections de revues sont rarement complètes, certains abonnements ne sont pas renouvelés, certains numéros sont perdus ;

– le personnel est assez souvent formé sur le tas, peu de bibliothèques disposent de documentalistes ou conservateurs diplômés ;

– le personnel (diplômé ou non) ne maîtrise pas les nouvelles technologies de l’information et de la communication ;

– dans la plupart des cas, le nombre d’ouvrages disponibles est au-dessous du minimum nécessaire par rapport au nombre des étudiants de chaque établissement.

(13)

Nous supposerons par ailleurs, que nous nous trouvons dans un contexte où les BU sont gérées uniquement et directement par les établissements d’enseignement supérieur (écoles, instituts, facultés, etc.) auxquels elles sont rattachées et où elles se trouvent physiquement et que ces établissements sont sous la tutelle d’un ministère de l’enseignement supérieur (MES). Ainsi, suite à cette étude, le MES lance un projet (appelons-le BIRU pour bibliothèques informatisées pour la recherche et l’université) pour l’informatisation et l’interconnexion des BU.

L’étude préalable, qui a duré deux ans, a estimé le budget nécessaire au projet à quelques millions d’euros, sa durée de mise en œuvre à trois ans et l’a divisé en quatre volets : formation, connectique et matériels, fonds documentaire, logiciels, normes et standards. Un comité de pilotage a été désigné ainsi que quatre comités techniques, un pour chaque volet avec pour objectifs respectifs :

– comité de formation (CF) : mettre en place un DESS (diplôme d’études supérieures spécialisées) et un programme de formation continue pour la formation de nouveaux bibliothécaires et la mise à niveau du personnel existant ; les diplômés seront appelés « informatistes » et non pas « documentalistes » ;

– comité connectique et matériels (CCM) : définir l’architecture physique du réseau ainsi que le nombre et les configurations des serveurs et des postes de travail pour les professionnels et pour la consultation ;

– comité fonds documentaire (CFD) : harmoniser les procédures d’acquisition, proposer des scénarios et des protocoles pour la mise à niveau des ressources documentaires, les revues et les ressources électroniques et pour le prêt inter- bibliothèques ;

– comité logiciels, normes et standards (CTLNS) : définir les normes et les caractéristiques techniques nécessaires à l’acquisition d’un logiciel de gestion intégrée d’un réseau de bibliothèques.

Trois directives principales ont été prises :

– les logiciels existants dans certaines bibliothèques ne seront ni mis à jour ni interfacés mais simplement ignorés ;

– le logiciel à acquérir sera le même pour toutes les bibliothèques qu’elles soient grandes, moyennes ou petites, spécialisées ou généralisées ;

– à la fin des trois ans, il faut avoir dépensé tout l’argent alloué au projet.

5.2. Problèmes pratiques et bilan

Le projet BIRU allait fournir le remède à tous les maux des BU et faire ainsi le bonheur de milliers d’étudiants, de bibliothécaires de chercheurs et de professeurs.

Mais sur le plan pratique, les problèmes techniques ont été maîtrisés alors que plusieurs problèmes organisationnels ont surgi tels que :

(14)

– aucune personne affectée au projet ne l’était à plein temps ; tous les membres de tous les comités étaient fonctionnaires ou enseignants et leur affectation au projet n’a été accompagnée d’aucune réduction de leurs charges professionnelles ; la plupart des intervenants étaient donc des consultants ;

– le chef de projet, un de ces principaux initiateurs, qui par ses qualités professionnelles et sa notoriété pouvait assurer le trait d’union entre le technique et l’administratif a quitté le comité de pilotage peu après le démarrage du projet ;

– la coordination entre les différents comités était quasi inexistante ; le comité de pilotage, essentiellement formé par des hauts fonctionnaires du MES responsables du suivi budgétaire, pensait que les travaux des uns et des autres étaient indépendants et de ce fait, personne ne s’est occupé du problème des données ;

– la définition des fichiers d’autorité matière, auteur, etc., à utiliser à l’échelle de tout un pays relève normalement des activités de sa bibliothèque nationale (BN). La BN n’ayant pas été directement impliquée dans le projet BIRU, aucune ressource n’a pu être récupérée, d’autant plus que les bibliothèques publiques n’étaient pas informatisées et que leurs collections documentaires n’étaient ni aussi importantes ni aussi techniques et spécialisées que le fonds documentaire des BU ;

– la définition de l’architecture du réseau et sa mise en œuvre physique relève des activités du ministère des communications. Ce dernier n’étant pas directement impliqué dans le projet BIRU, la coordination a été très difficile et les contraintes de délais n’ont pu être maîtrisées.

L’acquisition d’un seul logiciel pour tout un pays est une opération très délicate ; le CTLNS avait bien conscience de la nécessité de disposer d’un noyau du catalogue collectif pour choisir les sources bibliographiques, pour estimer le pourcentage de recouvrement des fonds documentaires, pour tester les différents logiciels étudiés pendant la phase de rédaction du cahier des charges. En réponse à l’une de ses requêtes, le comité de pilotage a demandé à chaque bibliothèque de lui fournir un fichier au format XML, contenant un échantillon de 1 000 (ISBN, cote) ; ces fichiers devaient être fusionnés et servir pour le téléchargement des notices correspondantes.

Aucune suite n’a pu être donnée à cette idée puisque l’équipe de 20 contractuels, la salle et les postes de travail que le MES proposait de mettre à disposition du projet n’ont jamais vu le jour. De plus, pendant la période d’étude et de développement du projet BIRU, le MES a gelé toutes les acquisitions informatiques (matériels et logiciels) dans les BU, il était alors impossible de demander aux responsables des différentes bibliothèques, déjà à court de personnel, de participer par un moyen ou un autre à la construction du noyau du catalogue collectif national.

Pour définir un cahier des charges qui tienne compte de toutes les contraintes techniques évoquées dans les sections précédentes, le CTLNS a mis deux ans. Il a rédigé un document sous la forme de 2 800 questions pour lesquelles chaque soumissionnaire devait présenter des réponses nettes et précises précédés d’une série de 25 questions à réponses booléennes qui concernaient l’implémentation des normes et standards requis et qui traduisaient donc des critères éliminatoires. Un appel d’offres a été lancé et une commission de dépouillement a été désignée. Les

(15)

principaux fournisseurs de logiciels mondiaux étaient représentés par les offres reçues, mais les critères éliminatoires étaient tellement stricts qu’une seule offre a été retenue sur le plan technique ; le dépouillement financier n’était alors que formel.

Après la rédaction des contrats et information du fournisseur, retenu quelques semaines avant la fin du délai de trois ans, la situation était telle que :

– un seul logiciel semblait répondre à tous les critères demandés, mais suffit-il de croire sur parole le fournisseur ? Il fallait bien évidemment tester le produit, mais qui allait le faire, avec quelles données et sur quelle configuration ?

– sur le plan de la formation, les étudiants n’ont pas spécialement été formé pour ce logiciel-là et le MES ne pouvait pas encore les recruter…

– sur le plan de la connectique, les liaisons n’étaient pas encore mises en place et sur le plan matériel on ne savait pas combien est-ce qu’il fallait acquérir de postes de consultation : fallait-il comptabiliser en fonction de la taille du fonds documentaire existant (or on sait qu’il est largement inférieur au standard et que l’un des volets du projet BIRU était justement de le mettre à jour) ou du nombre d’étudiants ? Et puis à quoi bon acquérir des PC qui seront largement dépassés dans quelques mois alors qu’il n’y a même pas d’OPAC à consulter ?

– sur le plan des modalités de la fédération des bibliothèques (protocoles de prêts, règles de catalogages, commissions de validation...) le CFD avait, semble-t-il, rendu un rapport au comité de pilotage ; on n’en saura pas plus !

Quelques jours plus tard, le fournisseur retenu a été informé que le marché a été annulé pour vice de procédure. Le dernier chef de projet, dans un moment de panique ou d’inspiration, avait découvert qu’un membre du CTLNS, n’ayant tout de même pas participé au dépouillement, avait des relations professionnelles avec le fournisseur en question. Ce dernier pouvant avoir bénéficié d’informations supplémentaires, il y avait un risque de non-respect des règles de la concurrence…

En dépit des raisons déclarées de l’arrêt du projet, il y a des chances que les responsables administratifs aient enfin pris conscience de l’ampleur du projet et qu’ils aient réalisé que sans données ni réseau, il n’y avait pas moyen de tester le logiciel choisi ni d’espérer que tous les problèmes de configuration et d’exploitation soient résolus avant la fin de la période de garantie et que sans budget pour la maintenance du système il était insensé d’embarquer dans une telle aventure.

Aujourd’hui on ne parle plus de BIRU, les budgets ne sont plus disponibles mais on ne sait pas si le projet a été annulé ou reporté. S’il fallait le refaire pensera-t-on suffisamment à l’avance que le cœur d’un réseau de bibliothèques est un « dossier numérique » et que sa création est un projet à part entière ?

(16)

6. Conclusion

Dans cet article nous avons présenté les catalogues bibliographiques et leur importance dans le fonctionnement d’une bibliothèque et dans un réseau de bibliothèques. Nous avons évoqué leur fédération et la difficulté de leur numérisation. Nous avons illustré enfin par une étude de cas réelle, comment, lorsqu’on ne fait pas partie de ce secteur professionnel, il est difficile se rendre compte de l’importance de la numérisation des catalogues dans un projet d’informatisation et d’interconnexion de bibliothèques et que cela peut être fatal à tout le projet.

Le catalogue collectif d’un réseau d’information est amené à évoluer comme tout dossier. Le respect des normes et des standards ainsi qu’une rigueur au niveau des procédures de travail sont indispensables pour la bonne gestion d’un tel dossier.

Suivant le niveau d’informatisation des bibliothèques, le type de services rendus au lecteurs ainsi que les types de collections et de documentations gérées dans plusieurs dossiers numériques (des catalogues différents) peuvent s’avérer nécessaires. Dans ce cas, les nouvelles technologies de l’information et le développement de modules spécifiques peuvent aider à mieux exploiter ces dossiers et en faciliter l’utilisation.

7. Bibliographie

AFNOR, Description bibliographique internationale normalisée des monographies, Paris, AFNOR, 1987.

Aitchison J., Gilchrist A., Bawden D., Thesaurus Construction and Use: a Practical Manual, Fitzroy Dearborn Publishers, 2002.

Belaïd A., Future trends in Retrospective Document Conversion, Brazilian Symposium on Document Image Analysis (BSDIA), LNCS, p. 111-128 Curitiba, Brasil, November 1997.

Belaïd A., Retrospective Conversion of Old Bibliographic Catalogues, Six DELOS Workshop, Preservation of Digital Information, Tomar, Portugal, June, 1998.

Belaïd A., Retrospective Document Conversion: Application to the Library Domain, International Journal on Document Analysis and Recognition, vol. 1, 125-146, 1998.

BNF, UNIMARC Manual bibliographic format, Paris, KG Saur, 1994.

BNF, http://catalogues.bnf.fr, accédé le 15 mai 2002.

Brickley D., RDF Specifications, World Wide Web Consortium, 2000.

Chan L. M., Cataloging and Classification: an Introduction, McGraw-Hill Higher Education, 1994.

Chenevoy Y. et Belaïd A., « Une approche structurelle pour la reconnaissance de notices bobliographiques », Traitement du Signal, vol. 12, n° 6, 1996.

DublinCore, http://dublincore.org/, accédé le 15 mai 2002.

(17)

Guinchat C., Skouri Y., Alix M-P., Guide pratique des techniques documentaires, Paris, EDICEF, 1989.

Hjelm J., Creating the Semantic Web with RDF: Professional Developer’s Guide, Wiley, 2001.

Markey, Dewy decimal Classification Online Project, OCLC, 1986.

Michael J. J., Hinnebusch M., From A to Z39.50: a Networking Primer, National Information Standards, US, 1994.

Mortimer M., Learn Dewey Decimal Classification, Scarecrow Press, 1999.

NIS, Information Retrieval (z39.50): Application Service Definition and Protocol Specification, National Information Standards Series, US, 1996.

NIS, The Dublin Core Metadata Element Set: An American National Standard, National Information Standards Series, US, 2001.

OCLC, http://www.oclc.org/home/, accédé le 15 mai 2002.

Piepenburg S., Easy Marc: a Simplified Guide to Creating Catalog Records for Library Automation Systems Incorporating Format Integration, Hi Willow Research & Pub, 1999.

Références

Documents relatifs

Enfin, la derni` ere technique relative ` a la s´ eparation des HRTF a mis en ´ evidence la pr´ esence d’au moins deux groupes parmi les individus : ceux pour lesquels la partie

type de document mode de numérisation définition texte. texte et dessin au trait bitonal

Avec ses près de 4,5 millions de livres, dont près de 40 000 provenant du projet Gutenberg et 300 000 du projet Microsoft Live Book Search, Internet Archive se positionne comme la

Dans un premier temps, nous avons séparé ces formes car il est impossible de les étudier dans le même rapport de transformation depuis la construction de la forme II que celui

Un nouveau catalogue était donc à l’ordre du jour, d’autant plus que d’autres pièces se sont ajoutées à la cote « Manuscrits hébreux » de la Bibliothèque de Genève,

Ce document vise à donner une description de l’ensemble des informations attendues dans le schéma de données, et à proposer un cadre à la démarche de numérisation des

b) (prix-ttc pht taux) qui calcule le prix TTC d'un objet dont le prix ht est pht sachant que taux est le taux de TVA (ex : aujourd’hui, en général, en France 19.6 et

Pour accompagner la diffusion de ces données, transport.data.gouv a accompagné ce Schéma d’un dispositif dédié appelé Base Nationale des Aménagements Cyclables..