Etude des défis du passage à l’internet Guy Teasdale
elon les dernières estimations, le web comprend entre un et deux milliards de documents, dont quelques dizaines de millions de textes savants [LAW 99, DAH 00]. L’édition savante est donc en train de passer à l’électronique. Aurait-elle déjà relevé le défi des NTIC ? Si tout était aussi simple, les articles seraient courts et les journées des lecteurs (et des auteurs) plus longues.
Mais la communication savante est un phénomène complexe. Avant de parler de son devenir, on doit d’abord étudier ce qu’elle est. Un préambule historique nous permettra de mieux comprendre les importantes fonctions sociales de la communication savante traditionnelle. L’histoire nous aidera également à comprendre les rôles et intérêts, parfois divergents, de ses différents acteurs (auteurs, sociétés savantes, éditeurs, bibliothécaires).
Le passage à l’électronique est inéluctable et doit relever plusieurs défis non négligeables : maîtrise des outils et techniques, choix des formats électroniques, coûts du matériel et des logiciels, réingénierie de la chaîne de production, etc. Toutefois, après avoir fait état des nombreux avantages de l’électronique, nous constaterons que plusieurs problèmes techniques doivent encore être résolus avant que l’édition savante devienne exclusivement électronique. Par exemple : l’accès aux documents devra être facile, durable et stable, la recherche devra être optimisée par le catalogage et l’indexation,
S
au moyen des métadonnées1, la tarification et les licences devront être équitables et transparentes, les procédures d’archivage, de sécurité et de citation devront nous assurer de la pérennité et du caractère immuable des textes.
Mais qu’est-ce au juste que l’édition savante ?
Sous ce vocable sont regroupées les monographies ou les revues qui ont pour caractéristiques principales d’être publiées par et pour les membres d’une communauté de chercheurs et/ou d’un champ de recherche bien délimité. Les textes sont révisés par des pairs, généralement spécialistes de la discipline concernée, et comportent tout un réseau de renvois, citations et bibliographies. Les tirages, sauf exception, sont limités, car ils sont destinés à un public érudit.
Les éditeurs de ce type d’ouvrages sont des presses universitaires, des maisons d’édition commerciales, des sociétés savantes ou professionnelles, des organisations internationales et enfin, des centres de recherche de compagnies privées. Financièrement, il s’agit d’un tout petit secteur du vaste marché de l’édition. En effet, si les ventes de livres aux Etats-Unis ont été de 24 milliards de dollars US en 1999, les ventes des presses universitaires ne représentent que 412 millions de dollars US de ce marché faramineux (soit moins de 2 %2).
Quantitativement, c’est beaucoup plus important : on produit de plus en plus d’ouvrages et d’articles chaque année, non pas en raison d’une augmentation de la productivité des scientifiques, mais simplement en raison de l’augmentation du nombre des scientifiques ([TEN 97], p. 141).
Enfin, l’édition savante est surtout importante en raison de son rôle dans le processus de la communication scientifique et par sa contribution à l’avancement de la recherche et des connaissances. C’est par ce processus que les connaissances nouvelles sont affinées, validées, diffusées et conservées.
1. Pour plus de détails sur les métadonnées, cf. [TEA 00].
2. Cf. [AAP 00]. Précisons que ce chiffre ne représente que l’édition savante produite par les presses universitaires, généralement des monographies. Il est plus difficile de départager ce que représente l’édition savante des éditeurs commerciaux. L’objectif est de donner ici un ordre de grandeur. D’autre part, il faut distinguer l’édition savante du marché du livre destiné à l’éducation supérieure (par exemple, les manuels scolaires) qui est beaucoup plus important, en raison des tirages beaucoup plus grands. Il représente 3,1 milliards de dollars US. Les chiffres des revues savantes seront analysés plus loin.
L’Association of Research Libraries (ARL) estimait en 1991 qu’il y avait 118 500 revues papier et notait que 70 000 d’entre elles avaient été fondées depuis 1971 ([CHO 00], p. 89). Actuellement, la banque de données EBSCO comporte 260 000 titres de publications en séries ([KET 00], p. 48) et celle de Ulrich, près de 250 000. Combien sont des revues savantes ? Ulrich en dénombre 18 4223 sous une rubrique intitulée « révisées par les pairs » (refereed).
Du côté électronique, le ARL Directory of Electronic Journals, Newsletters and Academic Discussion Lists ne recensait, dans son édition 1997, que 2 459 revues électroniques, dont 1 049 révisées par les pairs. Infomine : Scholarly Internet Resource Collections4, sous la rubrique Electronic Journal, donne la liste de 2 400 revues électroniques. EBSCO annonçait le 27 juin 20005 la disponibilité de plus de 5 000 revues savantes électroniques, accessibles en texte intégral, provenant de 75 des principaux éditeurs. Enfin, la liste NewJour qui recense les bulletins et revues électroniques comportait 9 229 items en août 20006. Toutefois, cette dernière liste ne comprend pas que des revues savantes, mais également des magazines et bulletins (newsletters). On peut donc grossièrement estimer à un peu plus de 5 000 le nombre de revues savantes électroniques.
L’article de périodique est devenu le principal vecteur de la communication savante, surtout dans le secteur des sciences, de la technologie et de la médecine (STM). Aussi nous attarderons-nous plus en détail sur les revues savantes. La monographie savante ne sera abordée qu’indirectement car, comme nous le verrons, les prix des revues influent sur les ventes des monographies7.
Historique de la communication savante
1455 : l’invention de Gutenberg donne une formidable impulsion à la diffusion des connaissances. Les savants vont désormais mieux communiquer.
Or, l’arrivée de cette NTIC n’a pas immédiatement provoqué l’apparition de la revue savante, tout comme la disponibilité des NTIC actuelles ne se traduit pas par un passage immédiat et massif de l’édition savante vers l’électronique. Essayons de comprendre pourquoi.
3. <http://www.bowker.com/ulrichs/home/about.html>. Il est difficile d’avoir des chiffres précis pour les revues savantes car les critères d’inclusion varient.
4. <http://infomine.ucr.edu/main.html>
5. <http://www-ca.ebsco.com/home/whatsnew/5000.stm>
6. <http://gort.ucsd.edu/newjour/toc.html>
7. Pour ceux que la question des monographies savantes intéresse, cf. [TEA 96], chap. 3.
La communication entre savants dans la « République des lettres » se faisait à l’origine par lien épistolaire. Cette communication savante était de l’ordre du privé, de l’informel, sans intervention éditoriale, bref, au petit bonheur. Curieusement, c’est l’émergence d’un système de distribution (postal) fiable et efficace à travers toute l’Europe qui permettra l’apparition des revues savantes deux cents ans après l’invention de Gutenberg.
Notons ici, comme le souligne Jean-Claude Guédon ([GUE 96], p. 74), la tendance qu’ont les systèmes de communication restreints à évoluer vers un réseau plus large. On a toujours tendance à sous-évaluer (à « sous- imaginer ») l’ampleur des changements que peuvent induire les NTIC.
Ainsi, Bell voyait dans son téléphone une nouvelle façon de diffuser de l’opéra. Ainsi, le système postal ne devait servir qu’à relier efficacement le corps diplomatique. Ainsi, la revue savante électronique, en réseau, deviendra bien autre chose qu’un simple succédané électronique de la revue papier.
Donc, à la fin de la Renaissance et au début du siècle des Lumières, le monde scientifique commence à utiliser ce nouveau mode de communication et d’échange entre les gens de lettres, de plus en plus nombreux. Les rencontres organisées par les sociétés savantes ne suffisent plus. Une revue paraissant à intervalle fixe est un moyen plus efficace pour faire face à l’explosion du savoir, et elle procure en même temps un accès élargi aux découvertes scientifiques.
Le 5 janvier 1665, Denis de Sallo fait paraître la première revue savante, un hebdomadaire, Le journal des sçavans. Le 6 mars de la même année, la Royal Society de Londres fait paraître les Philosophical Transactions, sous l’impulsion de Henry Oldenburg. Peu après, la Royal Society éprouve le besoin d’organiser l’information : on commence le catalogage des bibliothèques d’Oxford. Les principaux acteurs du système de communication sont donc déjà en place : les auteurs, les sociétés savantes, les bibliothécaires et les éditeurs.
Fonctions sociales du système de communication savante
Le nouveau système de communication remplira graduellement les fonctions suivantes dans les communautés de chercheurs [SCH 94] :
– construire une base de connaissances communes et vérifiables dans une forme stable, non altérable et ayant la confiance de la communauté scientifique qui l’utilise. La littérature scientifique constitue en quelque sorte depuis ses débuts, « le procès-verbal » de la science ;
– communiquer l’information ;
– valider la qualité de la recherche à travers la révision par les pairs, même si cela ne garantit pas absolument la qualité et l’absence de fraude8 ;
– conférer autorité et visibilité en établissant des priorités dans l’ordre des découvertes et en en créditant leurs auteurs. En retour, la promotion des chercheurs ou l’octroi de subventions est basé sur leurs publications.
Différents indicateurs servent maintenant à classer, évaluer, comparer les revues savantes entre elles et à leur conférer du « prestige ». L’un des indicateurs les plus utilisés est le facteur d’impact9. Le facteur d’impact est aussi un outil utilisé pour des études de marché et pour la gestion des abonnements aux périodiques dans les bibliothèques de recherche. Il est signifiant lorsqu’on veut comparer des journaux similaires couvrant un seul champ de recherche ou une seule discipline ;
– construire et réunir des communautés de chercheurs, des « collèges invisibles10 ».
Autre date charnière : 1945. Après la seconde guerre mondiale, les gouvernements se sont mis à investir massivement dans la recherche scientifique et l’éducation. L’augmentation du nombre des chercheurs, enseignants et étudiants diplômés a engendré un besoin d’information qui s’est répercuté sur le marché de l’édition savante, lequel a alors connu une forte croissance.
Jusque-là, ce système d’échange était sans but lucratif, excepté chez les éditeurs commerciaux, mais c’était un petit marché. « En ce temps-là la vie était plus belle, / Et le soleil plus brûlant qu’aujourd’hui11 ». Les choses étaient simples en effet : les universitaires produisaient des textes érudits, ces textes étaient publiés par des presses universitaires, des sociétés savantes12 ou des éditeurs commerciaux (valeur ajoutée : contrôle de qualité, révision par les
8. Pour une étude du processus de révision par les pairs, cf. [FOX 94].
9. L’Institute of Scientific Information publie les facteurs d’impact des revues savantes depuis 1975 dans le Journal Citation Reports. Pour plus d’information, cf. [GAR 94].
10. L’expression « collège invisible » fut utilisée pour la première fois dans une lettre de Robert Boyle le 22 octobre 1646, lors des échanges qui ont donné naissance à la Royal Society. (Cf. Dorothy Stimson, Dr. Wilkins and the Royal Society). Elle a été reprise notamment par Derek J. De Solla-Price (1963), puis par Diana Crane (1972).
Crane montre l’existence de réseaux de communication informels entre des groupes restreints de chercheurs seniors ayant accès à de l’information privilégiée. Cette information était diffusée rapidement, grâce à des réseaux de contacts et à un échange de littérature grise. Nous verrons que les nouveaux réseaux numériques permettent de rendre plus visibles (et plus démocratiques) les « collèges invisibles ».
11. Jacques Prévert, Les feuilles mortes.
12. Les sociétés savantes ont été les principaux éditeurs de revues savantes jusqu’au début du XIXe siècle [PAR 00].
pairs, diffusion) et étaient achetés par les bibliothèques (valeur ajoutée : identification, sélection, catalogage, organisation physique et conservation), ensuite traités par des indexeurs (valeur ajoutée : repérage). Enfin, les universitaires les consultaient et ce cycle de transmission et production des connaissances recommençait, aussi régulier que le cycle des saisons.
Avec l’expansion de l’éducation supérieure, le marché est devenu plus vaste (et donc plus intéressant), les éditeurs commerciaux ont peu à peu pris la relève des sociétés savantes. Ces dernières ont cédé leurs responsabilités à ces sociétés commerciales qui leur offraient de meilleurs systèmes de correction, de mise en page, de gestion des abonnements et de marketing jusqu’au niveau international. Tous y trouvaient profit : les éditeurs des sociétés savantes pouvaient consacrer plus de temps au travail d’édition qu’au marketing, les auteurs voyaient leur « prestige » accru par la participation à des revues mieux diffusées et que les bibliothèques acquéraient plus facilement. Ce « maraudage » des gros éditeurs commerciaux continue et même s’accentue actuellement : les petites revues y voient une solution simple à la question complexe, coûteuse et pressante du passage à l’électronique.
1985 : la crise de la communication savante13
Conséquences pour ce petit marché captif : les prix montent en flèche depuis le milieu des années 1980, alors que les ressources des bibliothèques universitaires stagnent. Au même moment, les principaux éditeurs commerciaux de revues savantes, de plus en plus concentrés entre quelques très grandes sociétés, affichent des marges de profit qui peuvent osciller entre 20 et 40 % annuellement.
Les bibliothèques annulent des abonnements, les ventes diminuent, les prix augmentent et c’est la spirale inflationniste : le système de la communication savante est en crise. Pour ne citer qu’un exemple, l’abonnement à la revue Brain Science coûte 16 344 dollars US annuellement (soit 24 246 $can ou 118 552 F14). Conséquence chiffrée : depuis 1986, les abonnements à des périodiques dans les bibliothèques de recherche nord- américaines ont décliné de 6 % en moyenne, même si les sommes consacrées à l’achat de ces périodiques ont augmenté de 207 % [KIR 00] et que le nombre de périodiques est en croissance.
13. Le site web de l’Association of Research Libraries comporte une section intitulée
« Create Change » dans laquelle toute la problématique de cette crise est analysée de façon détaillée et des solutions sont proposées <http://www.arl.org/create/>.
14. Voir la liste des 100 abonnements les plus chers.
<http://db.arl.org/journals/FMPro>
De plus, les bibliothèques ont dû transférer une part des budgets d’acquisition de monographies vers les périodiques. On constate que pendant la même période (1986-1999), les achats de monographies ont baissé de 26 %. Les baisses de ventes ont en retour influé sur le prix de ces monographies : elles ont subi une augmentation de 65 %. Dans les deux cas, périodiques et monographies, les augmentations de prix ont été supérieures à l’inflation.
Accès aux ressources plutôt qu’achat
Autre conséquence importante, les bibliothèques possèdent moins de ressources documentaires intra muros. Le besoin des chercheurs demeure toutefois car l’emprunt interbibliothèque a augmenté de 169 % [KIR 00]. Bref, le pouvoir d’achat des bibliothèques a diminué, la demande de service a augmenté et le personnel est demeuré stable.
Les bibliothèques de recherche sont placées dans une situation où elles craignent de ne plus pouvoir assumer leur rôle traditionnel dans la communication savante. Elles réagissent de différentes façons afin de ramener une saine compétition dans ce bien étrange marché « inélastique15 ».
Les bibliothèques se sont regroupées en coalitions16, pour négocier des achats collectifs de ressources, ont participé avec des presses universitaires à la création de nouvelles ressources17 et elles ont formé en 1997 une entreprise destinée à faciliter la mise en place de revues savantes à meilleur marché et à ramener ainsi une saine concurrence dans le marché18. L’université Stanford a également fondé HighWire Press dans le même but19.
Voyons maintenant si les NTIC sont capables de relever le défi de l’édition savante, soit assumer ses fonctions traditionnelles tout en apportant
15. Se dit d’un marché où la demande n’est pas affectée par le prix. En effet, les chercheurs ont besoin de ces revues à haut facteur d’impact et les bibliothèques doivent leur procurer.
16. Cf. Coalition of Library Consortia <http://www.library.yale.edu/consortia/>.
17. Voir The Muse Project <http://www.muse.org>.
18. Voir la Scholarly Publishing and Academic Resources Coalition (SPARC18).
<http://www.arl.org/sparc>. SPARC est notamment partenaire du BioOne, projet qui rendra accessible une douzaine de grandes revues savantes, à haut facteur d’impact, à compter de mars 2001 <http://www.bioone.org>. Il semble que la SPARC réussit déjà à freiner la hausse des prix de certaines revues.
19. Highwire est actuellement la deuxième plus grande ressource d’articles savants gratuits sur la planète, après la NASA.
<http://highwire.stanford.edu/lists/largest.dtl>
une valeur ajoutée suffisante pour assurer son adoption par la communauté des chercheurs et permettre une sortie de crise.
Avantages des documents électroniques20
Les documents électroniques présentent les avantages suivants :
– un tel document peut être lu par plusieurs personnes simultanément, à partir de différents endroits ;
– l’accès au document électronique est direct, alors que l’accès au document papier se déroule en deux étapes : recherche au catalogue et suivi de recherche sur les rayons pas toujours concluants (document emprunté, mal rangé, etc.). Il y a même trois étapes pour les recherches dans les sources secondaires : recherche dans les index, recherche des titres repérés dans le catalogue et recherche sur les rayons ;
– l’électronique permet des regroupements plus larges et modifiables à volonté (par exemple, une compilation d’articles). Sur papier, cela implique beaucoup de déplacements ;
– l’ouvrage électronique peut être copié sans lui faire subir de mutilation ou sans subir la corvée des photocopies ;
– le texte peut faire l’objet d’une recherche électronique (dans le texte intégral ou dans ses métadonnées) ;
– il n’y a plus de risque de mal ranger le document ou de le remettre en retard ;
– le document est accessible 24 heures sur 24 et 7 jours sur 7 ;
– on peut incorporer au document électronique de nouveaux médias : films, sons, modèles théoriques, réalité virtuelle, etc.
– les délais de parution sont réduits ;
– les coûts sont réduits (si l’on abandonne le papier).
D’aucuns ont vu une panacée à la crise dans ce dernier point. Est-ce aussi simple ? En passant à l’électronique, des économies substantielles (autour de 25 %) peuvent en effet être réalisées du côté de l’impression, de l’entreposage, de l’expédition et des invendus ; mais on oublie trop souvent que l’électronique ajoute aussi des coûts importants à une chaîne de production – par exemple les coûts d’administration du système, de catalogage du contenu, de balisage, de conversion de codes, de vérification de codes, d’insertion de liens, de vérification des liens, frais de réseau, d’ordinateurs et de périphériques, de service au consommateur et enfin de rétention d’un personnel plus qualifié ([REG 99], p. 159).
20. D’après [REG 99], p. 161.
Dans la phase actuelle de l’édition savante, nous assistons à l’apparition de versions électroniques de revues papier et à la conversion massive de collections existantes vers un format électronique21. Mais il ne faut pas se leurrer, nous n’avons pas encore changé de paradigme, il n’y a pas encore de révolution : le papier prédomine. En effet, on constate que la version électronique des revues est offerte sans frais supplémentaires visibles avec un abonnement papier dans 75 % des cas. Dans les cas restants, un supplément de 10 à 30 % est demandé par rapport à l’abonnement papier seul ([KET 00], p. 49).
On vient de le voir, plusieurs facteurs militent en faveur du passage de l’édition savante à l’électronique. D’autres facteurs demeurent des inhibiteurs importants.
En effet, l’édition savante électronique devra permettre la reconnaissance des chercheurs et de leur propriété intellectuelle, assurer la qualité, la validation, la pérennité de l’information et la libre circulation des idées nécessaires à la communication savante, et ce mieux que le papier et à meilleur coût, autant que possible.
Quelle sera la forme prise par les documents savants dans la phase suivante ? Difficile à dire. Sans doute naîtra-t-il alors un nouveau type de publication, sans équivalent dans le monde papier. D’ici là, des problèmes techniques complexes doivent encore trouver solution.
Défis et problèmes de l’électronique
D’abord, il y a le problème de l’obsolescence des formats électroniques.
Le phénomène est simple et amplement documenté, un seul exemple suffira : il y a à peine dix-sept ans, on pouvait écrire un texte avec le logiciel WordStar, fonctionnant sous le système d’opération CP/M. Comment le lire aujourd’hui ? Que fera l’archéologue numérique dans vingt ans pour lire les formats d’aujourd’hui ? Qui sera le Champollion de l’électronique ? La longévité des supports de stockage, qu’ils soient magnétiques ou optiques, est également préoccupante. Enfin, on s’interroge sur le caractère inaltérable des formats.
21. JSTOR, par exemple, donne accès à plus d’une centaine de revues savantes importantes. Six millions de pages de texte ont été numérisées à ce jour. Ce projet donnera notamment accès, d’ici décembre 2000, aux Philosophical Transactions de la Royal Society, mentionné plus haut, et ce à partir du premier numéro, datant de 1665. JSTOR est autofinancé par les abonnements des bibliothèques
<http://www.jstor.org>.
Migration, conversion, conservation
Tout projet de périodique électronique devrait donc prévoir des coûts de migration vers de nouveaux formats électroniques et/ou l’émulation de logiciels afin de pouvoir lire demain les textes d’aujourd’hui. Il faudra aussi développer des projets permettant d’assurer que l’on conserve au moins une copie de tous les textes savants et que cette copie ne soit pas altérée. Le papier nous donnait cette garantie, car les textes imprimés sont distribués à de nombreux endroits à travers le monde. C’est un peu ce que préconise le projet Lockss22 de l’université Stanford pour les documents électroniques.
Prolifération de contenu, nécessité du filtrage
Actuellement, la révolution ne se fait pas encore au niveau de l’édition mais bien de la communication savante (groupes de discussions, listservs, révisions et commentaires en ligne, échanges avec les lecteurs, prépublications, sites web23). L’échange plus libre entre scientifiques et l’accélération consécutive de la circulation des savoirs peut donner l’impression que le pouvoir des éditeurs et des comités éditoriaux diminue.
Au contraire, le travail de l’éditeur (et du modérateur dans les listes) devra demeurer : c’est un filtre plus que jamais essentiel dans l’édition savante électronique24.
Les auteurs n’étant plus confinés aux frontières (et aux coûts) de la page, il y a danger que l’on se mette à publier des textes trop longs ou encore que les critères de révision par les pairs deviennent moins contraignants. La publication sous forme uniquement électronique, moins coûteuse, risque de mener à une prolifération de contenus.
Steven Harnad propose une solution intéressante mais à contre-pied des pratiques actuelles : imposer aux auteurs des frais de publication, frais qui seraient remboursés par les subventions de recherche [HAR 97]. Selon lui, le meilleur intérêt des auteurs de littérature non commerciale (c’est-à-dire savante) sera assuré lorsque leurs œuvres seront accessibles à tous, gratuitement et à perpétuité. William Arms, l’éditeur en chef de la revue D- Lib Magazine, constate que ce processus est déjà en œuvre [OLS 00].
22. Lots of copies keep stuff safe <http://lockss.stanford.edu/>.
23. Le site web Scholarly Societies Project de l’université de Waterloo recensait, le 23 août 2000, 1 798 sites de sociétés savantes <http://www.lib.uwaterloo.ca/society/>.
24. On trouvera les avantages et inconvénients de la révision électronique par les pairs dans [BIN 98].
Mesure d’impact électronique
Les universités n’ont pas encore de position officielle face à l’édition électronique pour la titularisation et l’avancement. Les facteurs d’impacts des versions électroniques commencent à peine à être étudiés25. Il faudra également mettre en place de nouveaux critères de promotion qui ne soient plus seulement quantitatifs.
Prépublications
Depuis l’irruption des réseaux dans l’univers documentaire, on assiste de plus en plus à une dissolution des frontières traditionnelles entre les publications primaires et secondaires, de même qu’entre les publications formelles et informelles. Une étude sur l’édition savante serait donc incomplète si l’on n’abordait pas la question des prépublications. Cette littérature grise se définit par le fait qu’elle ne passe pas par les canaux normaux de publication, de distribution, de contrôle bibliographique ou d’acquisition des libraires ou agences d’abonnements. Elle était, jusqu’à maintenant, difficile d’accès et diffusée de façon informelle et privilégiée, entre membres des collèges invisibles. La littérature grise électronique est maintenant aussi accessible que la littérature traditionnelle. Techniquement ce n’est pas de l’édition savante, car elle n’est pas révisée par les pairs avant publication, mais pratiquement, c’est un nouveau modèle de révision et d’échanges après publication qui se met en place à travers les réseaux.
Il est amusant de constater que, comme au XVIIe siècle, c’est le développement du service postal (électronique cette fois) qui a permis cette révolution de la communication savante. Les prépublications électroniques furent d’abord diffusées par courriel. Comme les chercheurs devaient y référer, elles ont par la suite été organisées plus efficacement dans un serveur, mis au point par Paul Ginsparg, pour la communauté des physiciens, au laboratoire de Los Alamos au Nouveau-Mexique, à partir de 1991 [MCK 00]. Ce serveur de prépublications intègre la diffusion sélective de l’information et des hyperliens générés automatiquement entre les différentes notices. Il contient près de 200 000 contributions scientifiques, accessibles à partir de seize sites miroirs, et assure un accès élargi à l’information, même à ceux qui n’ont pas toute l’infrastructure nécessaire en termes de bibliothèques et de centres de recherche (pays en développement). Le succès de cette expérience fait actuellement boule de neige dans différentes communautés de chercheurs. On peut en voir quelques-unes regroupées dans le projet
25. Se reporter aux études en cours dans le cadre de l’Open Citation Project
<http://opcit.eprints.org/>, intitulées « Mining the Social Life of an ePrint Archive »
<http://fluffy.ecs.soton.ac.uk/~tdb198/opcit/>.
Universal Preprint Service (UPS26), de même que dans un portail de recherche de littérature grise produite par les agences de recherche du gouvernement américain, le GrayLit Network27. Ce portail, ouvert en août 2000, donne accès au texte intégral de 100 000 rapports techniques.
Citations pérennes
Les scientifiques ont besoin de références stables et non altérables : c’est pourquoi ils citent surtout la version papier. Le web est encore trop instable et de qualité variable : ce qui était là hier n’y est plus aujourd’hui ou bien la version précédente a été écrasée. Comment l’édition savante électronique pourra-t-elle remplir son rôle de « procès-verbal » de la science, si ce
« procès-verbal » est modifié constamment ? Le projet UPS cherche également à résoudre les problèmes d’interopérabilité entre les différentes archives électroniques et à développer un système de création de liens qui permettrait de passer de la citation bibliographique d’un article vers le texte intégral de l’ouvrage cité, de façon pérenne et transparente pour les usagers.
Il s’agit en somme de faire aboutir la vision des Vannevar Bush, Ted Nelson, Douglas Engelbart et de tous les précurseurs de l’hypertexte : accéder de n’importe quelle station de travail à tous les textes savants, peu importe où ils se trouvent dans le monde, de façon conviviale et rapide, au moyen d’hyperliens fonctionnant « comme la pensée28 ».
Les recherches sur les méthodes de liaison sont d’une importance fondamentale pour l’établissement d’un réseau de citations vraiment efficace. Une méthode normalisée de liens pérennes devra donc s’imposer.
Aujourd’hui, plusieurs projets sont à l’œuvre. L’Open Citation Project, qui a débuté en octobre 1999, utilise le SFX Linking Service. On peut voir des exemples de liens actifs dans leur site29. Un autre projet encore plus récent, CrossRef30, est basé sur l’utilisation d’URL rendues persistantes grâce au Digital Object Identifier (DOI31).
26. <http://ups.cs.odu.edu/>
27. <http://graylit.osti.gov/>
28. Sur ces chercheurs et sur l’hypertexte, cf. [TEA 95].
29. <http://opcit.eprints.org/>
30. D’ici la fin de l’an 2000, les initiateurs du projet prévoient que trois millions d’articles provenant de milliers de périodiques seront liés au moyen de CrossRef.
Par la suite, les liens d’un demi-million d’articles s’ajouteront chaque année. Cf.
<http://www.crossref.org/faqs.htm>. Les liens ne se feront pas seulement entre des revues savantes, mais pourront aussi pointer vers des articles d’encyclopédies, des actes de colloques, des manuels scolaires, etc.
31. DOI : système d’identification de la propriété intellectuelle dans un environnement numérique. Cf. <http://www.doi.org/>.
Métadonnées
On l’a mentionné, la qualité de l’information et de la recherche sur le web est de valeur inégale. Comment les chercheurs peuvent-ils s’y retrouver dans cet océan de deux milliards de documents numériques, en progression exponentielle, s’ils sont tous placés sur un pied d’égalité sur le web ? Il faut se mettre à la tâche de cataloguer tout cela, comme on l’a fait à Oxford au XVIIe siècle, si l’on veut que la communication savante puisse se poursuivre dans le cyberespace. Plusieurs projets de recherche sont en cours afin de réaliser ce que Tim Berners-Lee appelle le web sémantique. Pour y parvenir, l’usage des métadonnées devra se généraliser.
Grâce aux métadonnées, il sera possible de remonter le fil des découvertes en liant les articles de la prépublication à la version officielle, en passant par les errata, les modifications et les suites, de façon plus efficace que ce que les corpus papiers actuels permettent. Une fois que la masse critique aura été atteinte, les moteurs de recherche commenceront à indexer les métadonnées.
Plusieurs outils se développent. Par exemple, le projet CORC de OCLC facilite le catalogage des documents électroniques en format MARC et leur conversion en Dublin Core32 et vice versa. Les métadonnées permettront également d’accoler aux articles des cotes d’évaluation normalisées décrivant le public cible, la cote d’âge, la valeur intellectuelle, morale, etc33. Tous ces schémas de métadonnées permettront de filtrer l’information savante, et même d’automatiser la recherche d’information.
Formats structurés
Les différents schémas de métadonnées seront insérés dans un cadre : le cadre de description des ressources (Resource Description Format, RDF) qui s’intégrera dans une structure XML. Les formats structurés, tels que décrits dans l’article de Stéphane Chaudiron, seront la lingua franca de tous ces formats et schémas.
Le XML, en plus de permettre de transmettre notre « intelligence » du texte à la machine, permet également la pérennité de l’information, la réutilisation des textes et des données et leur conversion vers d’autres formats. En raison de ses tirages limités et du public visé, l’édition savante des monographies et des périodiques se prêtera très bien à la diffusion en
32. Le schéma de métadonnées du Dublin Core <http://purl.oclc.org/dc/>
permettra à chaque article de circuler avec sa fiche bibliographique. Le NISO est en train de l’adopter comme norme américaine (NISO Z39.85).
33. Voir le Platform for Internet Content Selection (PICS) <http://www.w3.org/PICS/>.
format e-book, par exemple. La DTD XML open e-book existe déjà. Il est possible également d’imaginer une dérivation de versions abrégées de textes, ou de versions de différentes langues, ou même de versions en braille.
Conclusion
L’ARL a énuméré récemment un certain nombre de principes qui devront guider les nouveaux systèmes d’édition savante [CAS 00]. Ces principes résument bien la problématique que nous venons d’exposer : les coûts devront être contenus afin non seulement de maintenir, mais d’améliorer l’accès à l’information, et ce sur un plan multidisciplinaire. On devra trouver un système fiable qui permettra de citer l’information mais aussi d’y accéder à long terme34, même une fois qu’elle aura été archivée. Il faudra également maintenir des critères serrés d’évaluation par les pairs et informer le lecteur sur les critères utilisés. Le nouveau système devra reconnaître l’équilibre entre usage équitable et droit d’auteur. On devra chercher à réduire le temps de soumission et de publication, de même que l’emphase actuelle sur la quantité, pour évaluer davantage la qualité. Enfin, il faudra garantir la confidentialité de l’accès aux ressources électroniques.
Inéluctable l’édition savante électronique ? Nous le croyons, mais une fois que les problèmes mentionnés dans ce texte auront été résolus et que les intérêts de tous les acteurs auront été satisfaits. Les recherches à cet effet sont toujours en cours.
Bibliographie
[AAP 00] AMERICAN ASSOCIATION OF PUBLISHERS, Industry Statistics. Book Sales Total $ 24 Billion in 1999, en ligne <http://www.Publishers.org/home/stats/index.htm>.
[BIN 98] BINGHAM, C., “Peer review on the Internet: a better class of conversation”, The Lancet, vol. 351, suppl. I, 1998, p. 10-14.
[CAS 00] CASE, M. M., “Principles for Emerging Systems of Scholarly Publishing”, ARL : a Bimonthly Report on Research Issues and Actions from ARL, CNI and SPARC, en ligne, n° 210, juin 2000 <http://www.arl.org/newsltr/210/principles.html>.
[CHO 00] CHODOROW, S., “Scholarship and Scholarly Communication in the Electronic Age”, Educause Review, January 2000, p. 86-92.
34. Par exemple un accès perpétuel aux numéros payés (sur cédérom par exemple), même après l’abandon d’un abonnement ou la faillite d’un fournisseur. JSTOR et Muse offrent cette garantie.
[CRA 72] CRANE, D., Invisible Colleges: Diffusion of Knowledge in Scientific Communities, Chicago University Press, 1972.
[DAH 00] DAHN, M., “Counting Angels on a Pinhead: Critically Interpreting Web Size Estimates”, Online, jan.-fév. 2000, p. 35-40.
[FOX 94] FOX, M. F. “Scientific Misconduct and Editorial and Peer Review Processes”, Journal of Higher Education, vol. 64, n° 3: Perspectives on Research Misconduct, May- June 1994, p. 298-309.
[GAR 94] GARFIELD, E., “The Impact Factor”, Current Contents, en ligne, vol. 25, 20 juin 1994, p. 3-7 <http://alerting.isinet.com/hot/essays/7/>.
[GUE 95] GUÉDON J.-C., « Edition savante commerciale ou édition électronique : le combat des chefs », Interface, vol. 16, n° 5, sept.-oct. 1995, p. 5-7.
[GUE 96] GUÉDON, J.-C., “The Seminar, the Encyclopedia, and the Eco-Museum”, in R.P. Peek et G.B. Newby (dir.), Scholarly Publishing : The Electronic Frontier, The MIT Press, Cambridge, Mass., 1996, p. 71-89.
[HAR 97] HARNAD, S., “The Paper House of Cards (and why it’s taking so long to collapse)”, Ariadne, en ligne.
[HOR 95] HOROWITZ, I. L., CURTIS M. E., “Scholarly Book Publishing in the 1990s”, in P. G. Altbach et E. S. Hoshino (dir.), International book publishing: an encyclopedia, t. XXVI, New York, Garland Publications, 1995, p. 303-312.
[KET 00] VAN ORSDEL K., BORN K., “Pushing Toward More Affordable Access”, Library Journal, 15 avril 2000, p. 47-52.
[KIR 00] KYRILLIDOU, M.; “Trends in ARL Libraries: April 10, 2000”, en ligne,
<http://www.arl.org/stats/arlstat/99intro.html> (page consultée le 5 août 2000).
[LAW 99] LAWRENCE S., GILES C. L., “Accessibility of Information on the Web”, Nature, vol. 400, 8 juil. 1999.
[MCK 00] MCKIERNAN, G., “ArXiv.org: the Los Alamos National Laboratory e-print Server”, The International Journal on Grey Litterature, vol. 1, n° 3, 2000, p. 127-138.
[OLS 00] OLSEN, F., “Logging in with …William Arms: ‘Open Access’ is the Wave of the Information Future, Scholar Says”, The Chronicle of Higher Education, en ligne, August 18 2000, <http//chronicle.com/free/2000/08/2000081801t.htm>.
[PAR 00] PARROTT, J., “Editorial, 2000 March 27: The Role of the Scholarly Societies Project”, en ligne, <http://www.scholarly-societies.org/editorial_20000327.html>
(page consultée le 23 août 2000)
[PRI 63] DE SOLLA-PRICE, D. J., Little Science, Big Science, New York, Columbia University Press, 1963.
[REG 99] REGIER, W. G. “Electronic Publishing is Cheaper”, in R. Ekman and R. E.
Quandt (dir.), Technology and Scholarly Communication, Berkeley, University of California Press, 1999, p. 158-167.
[SCH 94] SCHAFFNER, A. C., “The future of scientific journals: Lessons from the past”, Information Technology and Libraries, vol. 13, n° 4, déc. 1994, p. 239-248.
[TEA 95] TEASDALE, G., « L’hypertexte : historique et applications en bibliothéconomie », Cursus, en ligne, vol. 1, n° 1, octobre 1995.
<http://www.fas.umontreal.ca/EBSI/cursus/vol1no1/teasdale.html>
[TEA 96] TEASDALE, G., L’édition savante à l’ère de la bibliothèque virtuelle : Publication d’un livre en SGML sur le World Wide Web, Maîtrise de bibliothéconomie et sciences de l’information (M.B.S.I.), Université de Montréal, novembre 1996 <http://www.bibl.ulaval.ca/info/pagepers/teasdale/cadre_td.htm>.
[TEA 00] TEASDALE, G., « De la nécessité des métadonnées sur Internet et les intranets », La lettre du bibliothécaire québécois, en ligne, n° 21, janvier/mars 2000,
<http://www.sciencepresse.qc.ca/lbq/lbq21.6.html>
[TEN 97] TENOPIR C., KING D. W., “Trends in Scientific Scholarly Journal Publishing in the United States”, Journal of Scholarly Publishing, en ligne, vol. 28, n° 3, 1997, p. 135- 170.