• Aucun résultat trouvé

Catalogues collectifs

Premiers pas

Par le passé, on a pu reprocher aux catalogues de bibliothèques d’être austères, peu conviviaux, et surtout de donner les références du document mais en aucun cas l’accès au contenu. Depuis qu’ils sont disponibles sur l’internet, les catalogues sont moins austères et plus conviviaux. Et surtout - rêve de tous qui commence à devenir réalité - ils permettent l’accès aux documents eux-mêmes : textes et images dans un premier temps, extraits sonores et vidéos dans un deuxième temps. En 1998, les 2 500 œuvres de l’Universal Library sont accessibles par le biais d’un système expérimental (ESS : experimental search system) intégré ensuite au catalogue en ligne de la Library of Congress.

L’avenir des catalogues en réseau tient à l’harmonisation du format MARC (machine readable cataloguing) par le biais de l’UNIMARC (universal machine readable cataloguing). Créé en 1977 par l’IFLA (International Federation of Library Associations), le format UNIMARC est un format universel permettant le stockage et

l’échange de notices bibliographiques au moyen d’une codification des différentes parties de la notice (auteur, titre, éditeur, etc.) pour traitement informatique. Ce format favorise les échanges de données entre la vingtaine de formats MARC existants, qui correspondent chacun à une pratique nationale de catalogage (INTERMARC en France, UKMARC au Royaume-Uni, USMARC aux Etats-Unis, CAN/MARC au Canada, etc.). Les notices dans le format MARC d’origine sont d’abord converties au format UNIMARC avant d’être converties à nouveau dans le format MARC de destination. UNIMARC peut aussi être utilisé comme standard pour le développement de nouveaux formats MARC.

Dans le monde anglophone, la British Library (qui utilise UKMARC), la Library of Congress (qui utilise USMARC) et la Bibliothèque nationale du Canada (qui utilise CAN/MARC) décident d’harmoniser leurs formats MARC nationaux. Un programme de trois ans (décembre 1995 - décembre 1998) permet de mettre au point un format MARC commun aux trois bibliothèques.

Parallèlement, en 1996, dans le cadre de son Programme des bibliothèques, la Commission européenne promeut l’utilisation du format UNIMARC comme format commun d’échange entre tous les formats MARC utilisés dans les pays de l'Union européenne. Le groupe de travail correspondant étudie aussi les problèmes posés par les différentes polices de caractères, ainsi que la manière d’harmoniser le format bibliographique, tout comme le format du document lui-même pour les documents disponibles en ligne.

A la fin des années 1990, de plus en plus de catalogues sont disponibles sur le web, moyennant une interface spécifique. L’usager a souvent le choix entre deux types de recherche, simple et avancée, et il peut sélectionner plusieurs critères complémentaires tels que le nombre de notices souhaitées ou bien le mode de classement. A réception du résultat, il dispose de plusieurs pages de notices abrégées ou complètes. Les notices sélectionnées peuvent être copiées, imprimées, sauvegardées ou bien envoyées par courriel. Des liens hypertextes permettent de passer facilement d’une requête à l’autre. Ces catalogues utilisent le protocole Z39.50, un standard de communication permettant de chercher et récupérer des informations bibliographiques dans des bases de données en ligne. Ce protocole est d'abord utilisé par le WAIS (wide area information servers), un système de recherche créé au début des années 1990 pour consulter les index de bases de données situées sur des serveurs consultables à distance, avant l'apparition des moteurs de recherche sur le web. La version du Z39.50 en cours (norme ISO 23950 : 1998) est utilisée par les grands catalogues de bibliothèques disponibles sur le web, notamment par celui de la Library of Congress. Ce protocole est également promu par la Commission européenne pour favoriser son utilisation dans les pays de l’Union européenne.

Tous deux en accès libre, les catalogues de la British Library et de la Library of Congress sont d’excellents outils bibliographiques à l’échelon mondial. En mai 1997, la British Library lance son OPAC 97 (OPAC : online public access catalogue), un catalogue en ligne permettant l’accès aux catalogues de ses principales collections à Londres et à Boston Spa, soit 150 millions de documents rassemblés depuis 250 ans.

Catalogue expérimental, l’OPAC 97 est ensuite remplacé par sa version définitive, le BLPC (British Library public catalogue). Quant au catalogue de la Library of Congress, avec menus en anglais et en espagnol, il s’agit du plus important catalogue en ligne au monde, avec un grand nombre de notices en français.

Les catalogues collectifs visent à faire connaître les ressources disponibles à l’échelon local, régional, national et international. C'est le cas par exemple du Catalogue collectif de France (CCFr), mis en chantier en juillet 1997, qui permet de « trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu’elles rendent et interroger leur catalogue en ligne ». A terme, annonce-t-on en 1998, il permettra aussi de « localiser des ouvrages (documents imprimés, audio, vidéo, multimédia) dans les principales bibliothèques et demander le prêt ou la reproduction » de documents qui seront remis à l’usager dans la bibliothèque de son choix. C’est chose faite en novembre 2002. En juillet 2001, la gestion du CCFr est confiée à la Bibliothèque nationale de France (BnF). Le CCFr regroupe les catalogues de la BnF et des bibliothèques universitaires, ainsi que les catalogues des fonds anciens (avant 1811) et locaux des bibliothèques municipales et spécialisées. En décembre 2006, le CCFr permet de localiser 15 millions de documents dans 160 bibliothèques françaises.

WorldCat et RedLightGreen

L’internet facilite la gestion de catalogues collectifs mondiaux. Le but premier de ces catalogues est d’éviter de cataloguer à nouveau un document déjà catalogué par une bibliothèque partenaire. Si le catalogueur trouve la notice du livre qu’il est censé cataloguer, il la copie pour l’inclure dans le catalogue de sa propre bibliothèque. S’il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs officiant dans d'autres bibliothèques. Ce pari osé est tenté par deux associations, l’OCLC (Online Computer Library Center) dès 1971 et le RLG (Research Libraries Group) dès 1980. Quelque 30 ans plus tard, l’OCLC et le RLG gèrent de gigantesques bases bibliographiques alimentées par leurs adhérents, permettant ainsi aux bibliothécaires d’unir leurs forces par-delà les frontières.

Fondée en 1967 dans l’Ohio (Etats-Unis), l’OCLC gère l’OCLC Online Union Catalog, débuté en 1971 pour desservir les bibliothèques universitaires de l’Etat de l’Ohio. Ce catalogue collectif s’étend ensuite à tout le pays, puis au monde entier. Désormais appelé WorldCat, et disponible sur abonnement payant, il comprend en 1998 38 millions de notices en 370 langues, avec translittération pour les caractères non romains des langues JACKPHY (japonais, arabe, chinois, coréen, persan, hébreu et yiddish). L’accroissement annuel est de 2 millions de notices. WorldCat utilise huit formats bibliographiques correspondant aux catégories suivantes : livres, périodiques, documents visuels, cartes et plans, documents mixtes, enregistrements sonores, partitions, documents informatiques. En 2005, 61 millions de notices bibliographiques produites par 9 000 bibliothèques et centres de documentation sont disponibles dans 400 langues. En 2006, 73 millions de notices provenant de 10 000 bibliothèques dans 112 pays permettent de localiser un milliard de documents. Une notice type contient la description du document ainsi que des informations sur son contenu : table des matières, résumé, couverture, illustrations et courte biographie de l’auteur.

Devenue la plus grande base mondiale de données bibliographiques, WorldCat migre progressivement sur le web, d’abord en rendant la consultation des notices possible par le biais de plusieurs moteurs de recherche (Yahoo!, Google et bien d’autres), puis en lançant en août 2006 une version web (bêta) de WorldCat en accès libre, avec en sus un accès direct aux documents électroniques des bibliothèques membres : livres du domaine public, articles, photos, livres audio, musique et vidéos.

Fondé en 1980 en Californie, avec une antenne à New York, le RLG (Research Library Group, qui devient ensuite le Research Libraries Group) se donne pour but d’améliorer l’accès à l’information dans le domaine de l’enseignement et de la recherche. Le RLG débute son propre catalogue sous le nom de RLIN (Research Libraries Information Network). Contrairement à WorldCat qui n'accepte qu'une notice par document, RLIN accepte plusieurs notices pour un même document. En 1998, RLIN comprend 82 millions de notices dans 365 langues, avec des notices translittérées pour les documents publiés dans les langues JACKPHY et en cyrillique. Des centaines de dépôts d’archives, bibliothèques de musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques, bibliothèques d’entreprise et bibliothèques d’art utilisent RLIN pour le catalogage, le prêt inter-bibliothèques et le contrôle des archives et des manuscrits. Une des spécialités de RLIN est l’histoire de l’art. Alimentée par 65 bibliothèques spécialisées, une section spécifique comprend 100 000 notices de catalogues d’expositions et 168 500 notices de documents iconographiques (photographies, diapositives, dessins, estampes et affiches). Cette section inclut aussi les 110 000 notices de la base bibliographique Scipio, consacrée aux catalogues de ventes.

En 2003, RLIN change de nom pour devenir le RLG Union Catalog, qui comprend désormais 126 millions de notices bibliographiques correspondant à 42 millions de documents (livres, cartes, manuscrits, films, bandes sonores, etc.). Au printemps 2004, une version web du catalogue est disponible en accès libre sous le nom de RedLightGreen, suite à une phase pilote lancée à l’automne 2003. La mise en ligne de RedLightGreen inaugure une ère nouvelle. C’est en effet la première fois qu’un catalogue collectif mondial est en accès libre. Destiné en premier lieu aux étudiants du premier cycle universitaire, RedLightGreen propose 130 millions de notices, avec des liens vers des informations spécifiques aux bibliothèques d’un campus donné (cote, version en ligne si celle-ci existe, etc.). Après trois ans d’activité, en novembre 2006, les usagers sont invités à utiliser WorldCat, dont la version web (bêta) est en accès libre depuis août 2006. A la même date, le RLG est intégré à OCLC.

[encadré] Chronologie

* Cette chronologie ne prétend pas à l’exhaustivité.

1967 : Fondation d’OCLC (Online Computer Library Center)

1971 : Débuts de l’OCLC Online Union Catalog, qui deviendra WorldCat 1977 : Lancement de l’UNIMARC, format universel de catalogage

1980 : Débuts du RLG (Research Libraries Group) et de son catalogue RLIN (Research Libraries Information Network)

1994 : Travlang, répertoire de dictionnaires de langues créé par Michael Martin 1994 (janvier) : Annuaire de l’UREC (Unité réseaux du CNRS)

1995 : Frantext, base textuelle de l’Institut national de la langue française (INaLF) 1995 : A Web of Online Dictionaries, créé par Robert Beard

1996 : Adoption de l’UNIMARC par la Communauté européenne 1996 : Site de recherches et activités littéraires de Patrick Rebollar

1996 : Une Autre Terre, portail de science-fiction, créé par Fabrice Lhomme 1996 (juin) : Zazieweb, site d’actualité littéraire créé par Isabelle Aveline 1997 (mai) : OPAC (online public access catalogue) de la British Library 1997 (juillet) : Débuts du Catalogue collectif de France (CCFr)

1997 (décembre) : Outils linguistiques de la société de traduction Logos 1998 : Rubriques à Bac, site créé par Gérard Fourestier

1998 : ESS (experimental search system) de la Library of Congress 1999 : yourDictionary.com, portail cofondé par Robert Beard

1999 (décembre) : WebEncyclo, première encyclopédie francophone en accès libre 1999 (décembre) : Britannica.com, première encyclopédie anglophone en accès libre 1999 (décembre) : Mise en ligne de l’Encyclopædia Universalis

2000 : Mise en ligne du Quid

2000 : HyperNietzsche, lancé sous la direction de Paolo d’Iorio 2000 (mars) : Mise en ligne de l’Oxford English Dictionary

2000 (septembre) : L’encyclopédie Encarta de Microsoft en accès libre

2000 (septembre) : Mise en ligne du Grand dictionnaire terminologique (GDT) par l'Office québécois de la langue française (OQLF)

2001 (janvier) : Laboratoire ATILF (Analyse et traitement informatique de la langue française)

2001 (janvier) : Wikipedia, grande encyclopédie coopérative fondée par Jimmy Wales et Larry Sanger

2003 : RLIN devient le RLG Union Catalog, puis le RedLightGreen

2004 (printemps) : RedLightGreen, premier catalogue collectif mondial en accès libre 2006 (août) : Le catalogue collectif mondial WorldCat en accès libre en version bêta 2006 (novembre) : Disparition de RedLightGreen, et fusion du RLG avec l’OCLC 2007 (mars) : Citizendium, grande encyclopédie collaborative en ligne fondée par Larry Sanger

2007 (mai) : Encyclopedia of Life, grande encyclopédie collaborative des sciences de la vie fondée par un consortium