• Aucun résultat trouvé

RIDDLE, P., Library culture, computer culture, and the Internet haystack,

N/A
N/A
Protected

Academic year: 2022

Partager "RIDDLE, P., Library culture, computer culture, and the Internet haystack,"

Copied!
13
0
0

Texte intégral

(1)

Résumé

Le présent mémoire se penche sur la problématique de l’indexation manuelle des sites Web par les répertoires ou bibliothèques virtuelles. Il s’interroge dans un premier temps sur l’alternative que ces derniers peuvent constituer par rapport aux moteurs de recherche, comparant les principes de fonctionnement et dégageant les usages qui peuvent être faits de ces deux outils. Il entreprend ensuite de cerner au mieux l’organisation des grands annuaires et des répertoires sélectifs, leurs réponses respectives au problème de l’évaluation des ressources et leurs publics, avant de se plonger au cœur d’un débat qui divise quelque peu la communauté des documentalistes : faut-il conserver les structures classificatoires traditionnelles ou bien le Web, en tant nouveau support, nécessite-t-il l’élaboration de nouvelles classifications ? Enrichi de ces multiples observations, ce travail tente de déterminer un ensemble de principes méthodologiques susceptibles d’améliorer les répertoires sélectifs de ressources. Pour terminer, une application permettant la gestion aisée des répertoires et de leur maintenance est conceptualisée, puis implémentée.

Abstract

The following thesis considers the question of manual indexing of web sites aid of directories or virtual libraries. First of all, this study takes into account the directories as an alternative to search engines, comparing working principles and establishing uses that can be made of both tools. Its next aim consists in studying the way large catalogs and selective directories are organized, their respective way of evaluating resources and their publics. After that, the work considers the debate that seems to devide the librarians community. The question is : Shall the documentalists keep the traditional classification structures or elaborate new classifications as a response to the birth of a new media ? While keeping its previous observations in mind, the essay tries to determine a set of methodological principles able to improve subject catalogs.

Finally, an application providing solutions for an easy management of directories has been specified and implemented.

(2)

Parvenue au terme de ce travail, je voudrais adresser mes remerciements à mon promoteur, le Professeur Berleur, pour son attention, ses conseils et sa disponibilité, et à Mme Bogaert, pour sa gentillesse et ses précieux renseignements.

Un tout grand merci à mes parents, qui m’ont entourée de leurs encouragements tout au long de mes études, et à Frédéric, qui a de nouveau partagé mes innombrables bavardages, enthousiasmes et petits tracas liés à la rédaction d’un mémoire.

Je voudrais enfin remercier tout particulièrement mon petit frère Pierre. La vive passion pour l’informatique, qui l’anime depuis son enfance, a suscité mon intérêt. Il y a deux ans, il m’encourageait à franchir le pas, m’assurant de sa présence et de son aide chaque fois que j’en aurais besoin. De tout cœur, je le remercie d’avoir tenu ses promesses.

(3)

« [Librarians] can never quite understand the technology as well as the people who invent it. While many librarians are struggling valiantly to keep up with runaway technology, they are continually in a position of reacting to rather than originating change. »

« Computer people are continually trying to reinvent concepts which librarians have been honing for decades…

[C]omputer people try to solve every problem by throwing robots at it. »

RIDDLE, P., Library culture, computer culture, and the Internet haystack, 1996

http://is.rice.edu/~riddle/dl94.html

(4)

Introduction

« Les bibliothécaires devront s’allier aux informaticiens pour que cesse l’anarchie qui règne sur l’Internet »1. Telle fut la conclusion de Clifford Lynch (Université de Californie) en 1997, alors qu’il dressait le constat suivant : à ses origines, Internet n’a pas été conçu dans une perspective de publication ou de recherche d’information. Il en résulte un ensemble de problèmes – ceux-là même qu’ont tenté de résoudre les bibliothèques classiques – liés à la conservation, l’organisation et la recherche des données. A vrai dire, cette vaste question de l’organisation du savoir n’est pas neuve ; en son temps, Leibniz ne poursuivait-il pas un idéal encyclopédiste, entamant l’ambitieux projet de faire « un inventaire exact de toutes les connaissances acquises et mal rangées »2 ? Le philosophe et mathématicien cultivait une certaine hantise de la dispersion du savoir, qu’il comparait à des images caricaturales, certes, mais significatives : le marchand sans carnets de comptes, l’armée en déroute, le magasin exempt d’inventaires et, surtout, la bibliothèque

1 LYNCH, C., « La recherche d’informations » dans Pour la science, n° 235, mai 1997, pp. 44-48.

2 COUTURAT, L., « Opuscules et fragments inédits de Leibniz », cité dans Dictionnaire des Philosophes, Paris, 1998 (Encyclopaedia Universalis), p. 874.

(5)

4

dépourvue de catalogues3. Cette dernière métaphore fut ressuscitée il y a quelques années, alors que l’on comparait le World Wide Web à « une bibliothèque dévastée par des vandales qui auraient détruit le catalogue et jeté des centaines de milliers de documents pêle-mêle sur le sol, après en avoir arraché les pages liminaires »4. Il est vrai que la Toile abrite l’éphémère et le durable, le fondamental et l’anecdotique. S’y côtoient les travaux de scientifiques chevronnés et une multitude de pages personnelles, bref, comme l’affirme Daniel Parrochia, « Internet n’est pas la merveilleuse encyclopédie que d’aucuns se plaisent à imaginer »5. Dans ce gigantesque espace de recherche, « la redondance est non seulement extrême, mais « les chemins qui ne mènent nulle part » sont légion »6. Si aujourd’hui encore nombre d’internautes cultivent un certain droit à l’errance et se plaisent à « surfer » sur la vague électronique, le temps du chercheur est généralement compté. Jusqu’ici, la bibliothèque lui permettait d’en gagner.

La bibliothèque, une contre-organisation néguentropique

Passée la description d’un réceptacle austère d’où rien ne sort et vers où tout doit converger, la bibliothèque d’aujourd’hui est vivante et remplit des fonctions assurément incontournables.

L’une des mieux connues demeure sans conteste le traitement économique et efficace de l’information7. Daniel Parrochia a récemment rappelé les enjeux liés à son efficience8 : la bibliothèque reçoit des lecteurs désireux de consulter des informations desquelles ils ne connaissent qu’approximativement l’emplacement. L’institution bibliothécaire met généralement à leur disposition des catalogues grâce auxquels ils parviendront à localiser, découvrir et, en définitive, utiliser les documents. Classiquement, l’on considère la fonction d’organisation des informations comme étant adaptée lorsqu’elle permet d’exécuter ces diverses activités de manière

3 PARROCHIA, D., « Nécessité des réservoirs et exigence des flux : vers une néo-bibliothéconomie » dans Bulletin des bibliothèques de France, t. 46, n°1, p. 40.

4 GORMAN, M., « The corruption of cataloging » dans Library journal, 15 septembre 1995, p. 33, cite par HUDON, M., « Structuration du savoir et organisation des collections dans les répertoires du Web » dans Bulletin des bibliothèques de France, t. 46, n°1, p.57.

5 PARROCHIA, D., Op. cit., p. 46.

6 Ibidem.

7 A ce propos, consulter APOSTEL, L., « Le problème formel des classifications empiriques » dans La classification dans les sciences, Bruxelles, 1963.

8 PARROCHIA, D., Op. cit., pp. 42-43.

(6)

la plus efficace possible, c’est-à-dire en contribuant à l’optimalisation des critères que nous allons dès à présent expliciter. Le premier de ces critères réside dans la maximisation du nombre de documents considérés comme pertinents, et ce pour un nombre aussi grand que possible de recherches faites. Le deuxième critère constitue un prolongement du premier : il s’agit de maximiser le nombre de documents pertinents récupérés dans la recherche et en conséquence – troisième contrainte – de minimiser le nombre de documents récupérés par cette même recherche mais non pertinents. Le quatrième paramètre est strictement économique : il consiste à minimiser aussi bien les coûts de conservation des documents que ceux de maintenance des index et catalogues. Enfin, le dernier critère prévoit la satisfaction de tous les précédents, parallèlement à une maximisation de la vitesse de récupération des documents. Dès les années 1960, des sélecteurs mécaniques furent imaginés ; ils devaient permettre la reconstitution dans le langage du système d’un concept exprimé assez approximativement par le chercheur dans son propre langage. Parruchia formalise le problème de la manière suivante9 :

SOIENT :

1) un ensemble d’informations x1,…,xn ;

2) la fonction f(x1,…,xn), une information recherchée par le lecteur ;

3) la fonction g(x1,…,xn), le classement des informations contenues dans les documents ;

ET Donnons-nous la fonction H telle que :

a) H = 0 si pour aucune de valeur de y1,…,yn , la fonction g(y) ne devient équivalente à f(x)

b) H[f(x1,…,xn)] = g(y’1,…,y’n ), s’il existe une valeur particulière y’ des y qui rend g équivalente à f.

Remarquons que les restrictions sur les H relèvent typiquement de la nature du sélecteur alors que les restrictions sur les f seront fournies par la nature de l’information demandée. L’organisation du système classificateur impose quant à lui des restrictions sur les g10. Désormais, il s’agit donc

9 Ibidem, p. 43.

10 Ibidem.

(7)

6

de s’interroger sur les requêtes qui pourront être exprimées et sur les fonctions de recherche mises en œuvre pour exécuter ces requêtes et, surtout, sur la structuration de la base documentaire. En effet, « en théorie, tous les regroupements sont possibles et, formellement parlant (…), l’ensemble des recherches s’identifie à l’ensemble des sous-ensembles ouverts d’un espace topologique. En pratique, il est clair que certains parcours sont tout de même plus probables que d’autres. Faut-il, dès lors, que la topologie de base du rangement suggère déjà certains rapprochements ? N’y a-t-il pas là quelque danger, étant donné l’évolution incessante du savoir ? »11

Parochia insiste donc sur la nécessité d’encourager la dimension évolutive de toute classification.

Cette dernière ne revêt en effet rien de naturel ; elle est le fruit de rapprochements qui, à terme, favorisent l’interdisciplinarité, les rencontres et l’émergence d’idées nouvelles. En définitive, un processus positif qui dévolue à la bibliothèque les fonctions d’un « opérateur néguentropique qui, concentrant et comprimant le savoir, le rend aussi plus productif, plus efficace. De son traitement bibliothéconomique, par les langages classificatoires et d’indexation, celui-ci doit non seulement sortir fiché, réparti, ventilé, mais, par l’espace des renvois possibles, potentiellement

« chaotisé », bouleversé, dynamisé » 12.

Ce dynamisme, la bibliothèque a pour mission de le susciter chez tous, pas seulement chez le scientifique qui cultive l’habitude d’arpenter ses recoins. Elle entretient alors un rôle pédagogique, différenciant judicieusement les flux pour ensuite les répartir adéquatement : « Aux

« conduites forcées » destinées à dynamiser la recherche devrait se surajouter un système d’écluses, qui, graduellement, pourrait faire franchir à celui qui en a le désir les degrés du savoir »13.

11 Ibidem.

12 Ibidem, p. 42.

13 Ibidem.

(8)

Le World Wide Web, ou la désorganisation entropique

Avec une rapidité époustouflante, le Web s’est construit de manière très informelle. A mille lieues du « chaosmos » voulu et conscient qui stimule les rencontres de flots d’informations, c’est

« un désordre subi du fait des nécessités du marché » que nous décrit Parrochia, qui insiste également sur la perte du rôle pédagogique qu’assumait la bibliothèque : « Contrairement à ce qu’on croit, Internet, dans son désordre, et à cause du manque de fiabilité des informations transmises comme de l’amateurisme présidant à la constitution de la plupart des sites, ne peut avoir cette vocation pédagogique que la bibliothèque, précisément parce qu’elle est prise en main par des professionnels, doit pouvoir assumer »14. Le philosophe n’est pas seul à déplorer l’absence du bibliothécaire sur la Toile. Une étude menée auprès d’étudiants, par ailleurs spécialisés dans le domaine des IHM, de la School of Computing Science (Middlesex University) sur les digital libraries, a donné les résultats suivants : « 26% of the subjects, who would not like to see traditional libraries being replaced by DLs, highlighted the fact that librarians play an important role in assisting the library users in the traditional library. 68% of subjects prefer human-like librarian help (…) »15. Bien entendu, les parcours au sein des bibliothèques digitales et du Web sont de nature très distinctes, ne fût-ce que parce que les créateurs des premières ont dès le départ tenté de leur insuffler une organisation appropriée. Ceci ne rend le constat que plus amer : lorsqu’il s’agit de repérer un document numérique, l’absence du bibliothécaire se fait quelquefois cruellement ressentir…

La question de l’organisation des savoirs qui s’amoncellent sur la Toile s’est pourtant posée assez tôt. En 1993, Tim Berners-Lee, créateur du HTML et du Web, lançait The Virtual Library.

L’année suivante, David Filo et Jerry Yang, deux étudiants de l’université de Stanford, initiaient Yahoo !, devenu aujourd’hui le répertoire le plus connu au monde. Des chercheurs ont donc très vite eu tendance à reproduire sur le Web des méthodes qui, à l’instar de l’indexation et du catalogage, ont toujours appartenu à leur vie quotidienne. L’utilisation de ces moyens

14 Ibidem.

15 THENG, Y.L., MOHD-NASIR, N., and THIMBLEBY, H., « Purpose and usability of digital libraries » dans 5th ACM Conference on Digital Libraries, 2000, San Antonio, p.238.

http://www.cs.mdx.ac.uk.staffpages/yinleng/dl00-purpose.pdf

(9)

8

traditionnels dans l’organisation des pages Web suscite nombre d’interrogations : A quels besoins répondent les annuaires et autres bibliothèques virtuelles ? A quels publics sont-ils destinés ? Peuvent-ils constituer une alternative aux moteurs de recherche ? Comment opèrent-ils le recensement des sites, et, une fois repérés, comment ces derniers sont-ils répertoriés ? Les critères bibliothéconomiques mis en œuvre sont-ils les mêmes que pour les bibliothèques traditionnelles ou bien de nouveaux critères ont-ils été élaborés, résultats d’exigences liées à un support d’une nature nouvelle ?

Ces questions jalonneront le cheminement du présent mémoire. Dans un premier temps, nous nous attacherons à définir les concepts sur lesquels nous nous baserons tout au long de ce travail.

En effet, même si des termes tels que « moteur de recherche », « répertoire », « bibliothèque virtuelle » ou « portail » appartiennent désormais au langage courant, force est de constater que la confusion préside souvent l’usage des uns et d’autres. Nous nous interrogerons ensuite sur les principes qui régissent les deux grandes catégories d’outils que constituent les moteurs de recherche et les répertoires, espérant ainsi dégager les réponses que chacun apporte au problème de la recherche d’information sur le Web. Le décor définitivement posé, nous pourrons entrer dans ce qui constitue assurément le cœur de ce travail : l’examen de quelques-uns des catalogues et bibliothèques virtuelles sinon les plus riches, du moins les plus significatifs. En effet, l’observation des uns et des autres devrait nous permettre non seulement de mieux comprendre la manière dont ils organisent la collecte et l’intégration des ressources, mais également d’appréhender l’une des problématiques les plus fondamentales des répertoires : la question de la structuration de l’information. A ce sujet, nous examinerons les deux alternatives principales que constituent les processus de transposition de classifications traditionnelles sur le Web d’une part et l’élaboration de nouvelles méthodes classificatoires d’autre part. Ces observations devraient en effet nous permettre de mieux comprendre les arguments mis en exergue par les protagonistes de ce débat qui occupe d’ores et déjà une certaine partie de la littérature spécialisée. Durant tout ce parcours, nous nous intéresserons plus particulièrement à la manière dont l’histoire en tant que domaine de recherche s’est organisée. Ce choix n’est certes pas neutre ; il répond assurément à des préoccupations d’ordre sentimental, mais aussi à la conviction que la communauté historienne cultive certainement, de par son rapport existentiel aux documents, une pleine conscience des enjeux liés à l’organisation de ces derniers. Forts de ces observations et – nous

(10)

l’espérons – de ces enrichissements, nous nous investirons dans la mise en œuvre d’un ensemble de principes méthodologiques susceptibles d’appuyer l’élaboration des répertoires sélectifs durant leur cycle de vie, depuis la construction des collections jusqu’aux facteurs permettant l’assurance d’une maintenance de qualité. Ces principes, nous tâcherons à notre tour de les appliquer dans le cadre de l’élaboration d’un outil permettant de répertorier les ressources que le Web abrite relativement à l’une des préoccupations de ce siècle balbutiant : l’informatique et les questions éthiques.

(11)

10

(12)

Table des matières

Introduction ...3

Chapitre I : Les catalogues et bibliothèques virtuelles, une alternative aux moteurs de recherche ? Les enjeux ...11

1.1. Les concepts ...13

Les moteurs...13

Les annuaires de recherche...13

Les bibliothèques virtuelles ...14

Les portails...16

1.2. Les moteurs de recherche ...18

Leur fonctionnement...18

Leurs limites ...20

1.3. Les catalogues et bibliothèques virtuelles ...25

L’impossible exhaustivité...25

Organisation du repérage des sites : de la recherche pro-active à la satisfaction d’une demande ...26

L’évaluation des ressources ...28

Les publics ...31

Conclusion ...34

Chapitre II : Principes de classification des ressources issues du Web ...35

2.1. L’oganisation hiérarchique ...37

2.2. La transposition d’organisations classiques sur le web : l’œuvre des bibliothécaires ...42

2.3. Exemples d’élaboration d’une nouvelle classification ...46

Les termes du débat : le Web en tant que nouvel environnement nécessite-t-il de nouveaux schémas de classification documentaire ?...48

(13)

Chapitre III : Elaborer et maintenir un catalogue d’accès à des ressources Web :

aspects organisationnels, conceptuels et techniques...55

3.1. Collecter les liens ...58

Découvrir les sites...58

Evaluer les sites ...60

3.2. Organiser l’offre ...63

Deux architectures possibles...63

L’usage de métadonnées...66

Structurer la hiérarchie ...70

3.3. Maintenir l’accès à une offre documentaire valide ...72

Rechercher et supprimer les liens morts ...72

Soigner la correspondance entre les ressources et leur description ...74

Chapitre IV : projet d’application ...75

4.1. Description informelle du projet ...77

4.2. Les fonctionnalités...80

4.3. Choix de conception logique ...82

Choix d’une architecture et modèle de distribution...82

Schémas de données ...84

Interfaces graphiques ...86

4.4. Conception physique ...95

45. Les enseignements...96

Conclusion...97

Références

Documents relatifs

L’Espace des sciences, dans le Nouvel Équipement Culturel, accom- plira l’ensemble de ses missions que ce soit à l’échelon de la métropole rennaise, du département ou de la

Nous avons donc pensé ce colloque comme une approche globale de la transformation de l’offre d’accompa- gnement et donc in fine de la transition inclusive, à destination des acteurs

Le projet a abouti à identifier des systèmes de culture (successions de culture et itinéraires techniques) à expérimenter compte tenu de leurs performances a priori

Tout en suivant une démarche pédagogique axée sur l'élève, l'enseignante ou l'enseignant en sciences de la nature doit, dans la mesure du possible, ne pas perdre de vue son rôle dans

Tout en suivant une démarche pédagogique axée sur l'élève, l'enseignante ou l'enseignant en sciences de la nature doit, dans la mesure du possible, ne pas perdre de vue son rôle dans

Tout en suivant une démarche pédagogique axée sur l'élève, l'enseignante ou l'enseignant en sciences de la nature doit, dans la mesure du possible, ne pas perdre de vue son rôle dans

• Apprentissage facile pour les Francophones : à cause de ses racines latines, d'un alphabet semblable et de la prononciation ordinaire, l'espagnol est l'une des langues les

Il peut donc être judicieux d’allotir le marché afin de : – confier la production des espèces difficiles à produire à un prestataire qui maîtrise bien leur itinéraire