• Aucun résultat trouvé

2.9 Portails de revues

2.9.1 Revues.org

Le portail Revues.org se présente comme le doyen des sites français en sciences humaines et sociales (SHS) avec pour ambition première de promouvoir les revues francophones. Cependant, Revue.org accueille en 2012 aussi bien des revues éditées en France qu’à l’étranger en français, écrites pour partie ou en totalité en anglais, espagnol, portugais, russe et même basque.

Ce portail est animé par le Centre pour l’Édition Électronique Ouverte (Cléo). Basé à Marseille et Paris, cette unité associe le Centre national de la recherche scientifique (CNRS), l’École des Hautes Études en Sciences Sociales (EHESS), l’Université de

Provence et l’Université d’Avignon.

2.9.2 Persée

Persée est un programme de publication électronique de revues scientifiques en sciences humaines et sociales. Les collections imprimées de revues sont numérisées et

mises en ligne sur un portail avec des possibilités avancées d’exploitation de ces corpus numérisés.

L’une des ambitions de Persée est d’offrir des services et des outils permettant une exploitation enrichie des documents.

Des accords de coopération sont en cours de formalisation avec les principaux portails francophones assurant la diffusion de la production courante de revues scientifiques. L’objectif est d’offrir aux lecteurs une continuité dans la consultation des fonds entre Persée et les autres sites.

Persée repose sur un certain nombre de normes et de standards ouverts qui ga- rantissent la possibilité de réutilisation des données, une utilisation optimale du site web par tout internaute, l’interopérabilité du portail et des possibilités étendues de mutualisation avec d’autres outils du même type.

L’ensemble des développements réalisés dans le cadre du programme PERSEE sont « Open Source ». Ils sont en effet dotés une double licence CeCCIL et GPL et pourront être réutilisés dans le cadre d’autres projets de numérisation et/ou de diffusion de documents.

2.9.3 Érudit

Fondée en 1998, la plateforme Érudit est un consortium inter universitaire (Université de Montréal, Université Laval, Université du Québec à Montréal) et un organisme sans but lucratif qui donne accès à plus de 80 revues savantes, 27 revues culturelles, une cinquantaine de livres et actes, 30 000 mémoires et thèses, et près de 3 000 documents et données provenant de centres de recherche subventionnés par le Fonds québécois de recherche sur la société et la culture (FQRSC).

Les documents diffusés sur la plateforme sont produits par le Centre d’expertise numérique pour la recherche de l’Université de Montréal et par la Bibliothèque de l’Université Laval.

Les services d’édition sont basés sur des normes internationalement reconnues et sur des formats normalisés (Unicode, XML, XHTML, TIFF, PDF).

Érudit offre aux revues représentées une vitrine internationale grâce à une stratégie de référencement misant sur les partenariats et l’indexation dans des outils de recherche spécialisés et des bases de données disciplinaires.

2.9.4 Cairn

Cairn.info est né de la volonté de quatre maisons d’édition (Belin, De Boeck, La Découverte et Erès) ayant en charge la publication et la diffusion de revues de sciences humaines et sociales, d’unir leurs efforts pour améliorer leur présence sur l’Internet, et de proposer à d’autres acteurs souhaitant développer une version électronique de leurs publications, des outils techniques et commerciaux développés à cet effet.

En février 2006, la Bibliothèque nationale de France s’est associée à ce projet, de façon à faciliter le développement d’une offre éditoriale francophone, sous forme numérique.

Cairn.info réunit, en outre, différents investisseurs institutionnels, notamment Gesval, la société ayant en charge la gestion des participations de l’Université de Liège.

L’ambition de Cairn.info est d’aider les maisons d’édition, organismes ou associations ayant en charge des publications de sciences humaines francophones à gérer la coexistence des formats papier et électronique. Dans ce but, les services de Cairn.info couvrent à la fois la fabrication papier et électronique, la distribution papier (gestion des abonnements pour les revues, routage) et électronique (texte intégral en ligne, distribution des métadonnées auprès des sites et bases bibliographiques), ainsi que la diffusion et la promotion de ces publications auprès des publics auxquels elles s’adressent.

2.10 Conclusion

Notre but est la réalisation d’une interface de recherche en informatique afin de trouver de la littérature scientifique pertinente. Le portail ACM semble être particuliè- rement adapté à cette tâche. Nous pensons donc établir pour ce portail une librairie (au sens informatique du terme) pour automatiser la recherche depuis notre futur outil.

Le projet DBLP offre également une intéressante collection de fiches bibliographiques. Cependant, connaître les potentielles sources de documentation scientifique ne nous donne pas d’information sur les méthodes de recherche, les attentes et les réels besoins de l’usager. Examinons ce qu’est réellement la recherche d’information, quels en sont les enjeux et les méthodes depuis plus basiques à celles les plus sophistiquées.

Chapitre

La recherche d’information

Tout ce que je sais, c’est que je ne sais rien.

.

Socrate

Introduction

L

e terme de recherche d’information (Information Retrieval) est apparu pour la

première fois en 1948 dans le mémoire de MASTER du MIT1 de Mooers (Mooers,

1948). Dinet et Rouet définissent la recherche d’information (RI) comme « l’activité d’un individu qui vise à localiser et traiter une ou plusieurs informations au sein d’un environnement documentaire complexe, dans le but de répondre à une question ou de résoudre un problème (Dinet et Rouet, 2002) ».

Dans le premier chapitre de An Introduction to Information Retrieval, Manning et al. (2008) nous offrent la définition suivante de la recherche d’information : « As

Figure 3.1:Le modèle « simpliste » Morville et Rosenfeld (2006) de système d’information

an academic field of study, information retrieval might be defined thus :Information retrieval (IR) is finding material (usually documents) (...) that satisfies an information

need from within large collections (usually stored on computers)1. »

Dans le troisième chapitre de leur livre Information architecture for the World Wide Web, Morville et Rosenfeld présentent la vision « grand public » d’une recherche d’information (cf. Fig. 3.1). Cette idée reçue est qu’il suffit de poser une question à un moteur de recherche et la « boîte magique » donnera la réponse ultime relativement à notre besoin de connaissances par rapport au sujet. Toujours selon Morville et Rosenfeld, ce type de résultat fait figure de cas isolé, pour ne pas parler d’exception (Morville et Rosenfeld, 2006, chp. 3). Une requête informationnelle est dépendante du fonctionnement du système d’informations et pas seulement de la personne qui l’initie. Posons les définitions suivantes proposées par l’association des professionnels de

l’information et de la documentation (ADBS)2 :

Définition de Recherche d’Information

Ensemble des méthodes, procédures et techniques permettant, en fonction de critères de recherche propres à l’usager, de sélectionner l’information dans un ou plusieurs fonds de documents plus ou moins structurés ADBS (2012).

1. Proposition de traduction. « En tant que discipline académique, la recherche d’information peut être définie ainsi : La recherche d’information (RI) est le repérage au sein de grandes collections (généralement stockées sur les ordinateurs) de ressources (habituellement des documents) qui répondent

à un besoin d’informations. »

2. http://www.adbs.fr/vocabulaire-de-la-documentation-41820.htm, accédé le 1er août

Définition de Recherche documentaire

Ensemble des méthodes, procédures et techniques ayant pour objet de retrouver des références de documents pertinents (répondant à une demande d’information) et les documents eux-mêmes ADBS (2012).

Définition de Recherche bibliographique

Ensemble des méthodes, procédures et techniques ayant pour objet de retrouver les références bibliographiques de documents pertinents ADBS (2012).

De ces trois définitions, nous dégagerons une synthèse fonctionnelle de la recherche d’information, qui en tant que processus ne peut être réellement séparée des recherches documentaire et bibliographique. Notre vision sera donc pragmatique, nous voyons la recherche bibliographique comme la finalité de la recherche documentaire, elle-même résultante de la recherche d’information.

Marcia Bates, reprenant les concepts de bases posés par Robertson, proposait un schéma volontairement trivial (cf. Fig. 3.2) modélisant un système de recherche d’in- formation (SRI) dans un contexte idéal (Bates, 1993, Robertson, 1977). Pour elle, il s’agit d’une représentation utopique, bien que répandue, de l’offre documentaire, avec le besoin d’informations formalisé par le biais d’une requête.

Nous ajouterons que le but de cette activité peut être purement cognitif, c’est-à-dire élargir son champ de connaissances dans un domaine (dans notre optique scientifique) pour tenter de le synthétiser pour mieux en saisir la substance. Il ne s’agit pas dans ce cas à proprement parler d’un besoin d’information, mais d’une forme de curiosité, l’envie de mieux appréhender un champ de connaissance.

3.1 Le paradoxe de la RI

Ce qui est paradoxal dans la RI c’est qu’elle peut traduire :

– Un besoin de références bibliographiques pour structurer et étayer sa connaissance et ses idées ;

– Directement un besoin de connaissances, c’est-à-dire combler une lacune.

Cependant dans ce dernier cas, la prise de conscience de ce besoin, ou manque informatif,

découle d’une expérience du domaine1. Pour comprendre son besoin d’informations, il

faut avoir déjà effectué un panorama du champ de connaissances (Boubée et al., 2005). Si nous explicitons différemment les choses, pour comprendre son ignorance, il faut déjà avoir commencé à chercher. Y. F. Le Coadic définissait cet état de connaissance : « nous en savons assez pour savoir que nous avons un besoin d’information, mais nous

n’en savons pas assez pour pouvoir poser les bonnes questions (Le Coadic, 2008) ». Cette réflexion peut être illustrée par la citation de l’en-tête de chapitre attribuée à Socrate :Tout ce que je sais, c’est que je ne sais rien. L’une des premières difficultés pour les usagers est d’identifier les sources pertinentes et d’avoir une vision claire des contenus.

Nous allons dans cette première partie étudier dans le détail les différents aspects de la recherche d’information dans les systèmes numériques. Nous étudierons les interfaces de recherche d’information et les mécanismes qui y sont associés.

1. Nous voyons le détail du besoin d’information et les aspects psyscho-cognitifs qui y sont liés dans le chapitre 5 « Les écoles de pensées en RI : Processus et Cognition »