• Aucun résultat trouvé

L'indexation de productions scientifiques sur ProdInra

III. Analyse des activités réalisées

3. L'indexation de productions scientifiques sur ProdInra

Spécificités et fonctionnement de la plateforme

L'archive ouverte institutionnelle de l'INRA, ProdInra, constitue l’un des principaux outils à disposition des professionnels de l'information scientifique et technique qui travaillent au sein de l'institut afin de valoriser les publications des chercheurs. Il donne accès à des fonctionnalités de dépôt de notice, de recherche dans une base de données de références bibliographiques et permet dans certains cas l'accès au texte intégral. Ses fonctionnalités reposent sur plusieurs mécanismes de restitution de l'information et de statistiques qui sont accessibles aux usagers par le biais de leur tableau de bord personnel.

Son moteur de recherche, à travers des modules de recherche avancée et de recherche experte, permet des requêtes plus ou moins complexes dont les modalités sont détaillées directement sur la plateforme. Les différents opérateurs de recherche et la syntaxe à respecter, ainsi que des exemples de requêtes susceptibles d'être utiles aux chercheurs sont mises en avant sur les onglets de recherche avancés.

Il est également possible d'accéder aux notices au format XML, ce qui permet d’obtenir des informations supplémentaires par rapport à ce que peut présenter l'interface de base, notamment le nom du dépositaire d’un document et des informations concernant le workflow.

Comme cela avait été mentionné lors de la présentation initiale de la mission, l'archive ouverte est interconnectée avec HAL. Concrètement, afin d'établir ce lien et de faire figurer une notice de ProdInra sur HAL, il suffit d'indiquer une thématique spécifique dans les informations générales du document à référencer et de cocher une case signalant un référencement sur HAL. La manœuvre est donc très facile à effectuer et favorise la diffusion du document.

ProdInra permet également l'import des notices à partir du Web of Science et de PubMed, qui sont deux plateformes de recherche de références bibliographiques. Encore une fois, tout comme pour l'import de notices sur BeL-Inra avec le protocole Z39.50, il est impératif de vérifier les informations présentes au sein des différents champs et le respect de la syntaxe, avant l'intégration de la notice. L'import passe par là aussi par zone tampon et les notices importées se retrouvent alors intégrées dans un premier temps dans une section de l’espace personnel, avant la transmission au relecteur et l'éventuelle intégration dans ProdInra.

Le fonctionnement de la plateforme, afin de garantir la conformité des données saisies et la cohérence de la base de données, est justement soumise à une hiérarchisation stricte. Ainsi, les différentes actions qu'il est possible d'effectuer (dépôt, intégration de notices, modifications, ajout de pièces jointes etc.) dépendent de plusieurs niveaux d'autorité : du dépositaire à l'administrateur en passant par le relecteur. L'intégration définitive d'une notice se fait donc sous la forme d'une série d'étapes successives qui garantissent la cohérence du fonctionnement de l'outil.

Si l'objectif de la plateforme et de permettre l'accès aux productions scientifiques et la valorisation de celles-ci, il s'agit avant tout d'une base de données de référencement et de recherche de données bibliographiques propres à l'institut. En effet, ce ne sont au final qu'un peu plus de 13% (13,23% le 17/05/2016) des notices qui proposent un accès aux texte intégral, à travers l'intégration d'une pièce jointe, le plus souvent au format PDF.

Dans un souci d'accessibilité et afin de faciliter l'utilisation des différentes fonctions de l'interface, on retrouve également sur ProdInra un wiki recensant les différentes règles de catalogage et d'indexation et les normes à respecter pour le dépôt des productions scientifiques.

Des modules de e-learning sont également mis à disposition et présentent les fonctionnalités de l'archive ouverte, décrivant étape par étape comment procéder à un dépôt. Ainsi, tout est pensé pour faciliter le dépôt de documents pour les usagers, à savoir la communauté scientifique, qui n'ont pas de compétences spécifiques en documentation et en traitement de l'information.

Cela s'explique notamment par le fait qu'une archive ouverte institutionnelle n'a de réelle valeur que si elle est mise à jour constamment et dans une optique d'exhaustivité, et que si elle peut être prise en main rapidement par ses utilisateurs.

Méthodologie et règles de catalogage

En ce qui concerne la tâche qui m'a été confiée, j'étais chargé de cataloguer les productions de l'unité Fourrages, environnement, ruminants (FERLUS) pour les années 2011 à 2014, fournies par la secrétaire de l'unité expérimentale, qui en fait un inventaire annuel dans un classeur. Ces documents se présentent sous la forme d'articles parus majoritairement dans des revues à comité de lecture, mais il a également fallu cataloguer des documents de communication tels que des posters ou des extraits de présentations orales. Pour ce faire, un accès à l'interface de dépôt m'a été fourni et il m'a fallu dans un premier temps chercher les publications afin de vérifier qu'elles n'étaient pas déjà référencées dans la base, puis inscrire, le cas échéant, sur chaque document son identifiant ProdInra afin de faciliter les recherches à l'avenir.

ProdInra : cartographie des auteurs

Lors de l'accès à l'onglet consacré au dépôt de document, c'est une interface simple qui est proposée, permettant de saisir les informations générales telles que le titre, les noms des auteurs ou encore l'année de publication. Afin de saisir l'ensemble des données requises dans les champs adéquats, il convient de passer par l'interface de dépôt avancée, nécessaire à la saisie d'une notice conforme aux exigences de la plateforme, comportant par exemple des champs dédiés à la langue des titres et des résumés.

Si j'ai eu l'occasion de saisir de nombreuses notices sur la plateforme, et donc d'effectuer un travail de catalogage, je n'ai pas eu à indexer, c'est à dire à qualifier intellectuellement les documents. Cela s'explique par le processus de double indexation propre à ProdInra, puisqu'il est nécessaire d'intégrer à la fois des mots-clés définis par l'auteur et présentés sur le document à saisir, et des mots-clés, ou plutôt des descripteurs, issus d'un thésaurus propre à l'INRA. Cette deuxième forme d'indexation est restreinte à l'interface du relecteur et de l'administrateur, et je n'avais donc pas les droits pour effectuer cette tâche.

De la même manière, pour la plupart des productions saisies dans la base, il s'agit avant tout d'en effectuer le référencement bibliographique, puisque l'accès à la version intégrale des documents n'est pas garanti dans de nombreux cas, nécessitant un abonnement sur le site de l'éditeur et de s'assurer du respect des droits d'auteur et de diffusion.

Le dépôt d'une notice sur ProdInra implique par ailleurs de respecter l'ordre des auteurs tel qu'il est présenté sur la publication, puisqu'il n'est pas le fruit du hasard mais reflète effectivement les niveaux de responsabilité des différents auteurs. Pour ce faire, il est possible de saisir les différents auteurs, à partir du référentiel (correspondant aux listes d'autorités telles qu'on peut les trouver sur PMB), dans l'ordre indiqué, ou d'effectuer un drag & drop (glisser-déposer) par la suite sur l'onglet réservé aux auteurs.

Il est également possible de déposer un document directement via son DOI (Digital object identifier) s’il en possède un, ce qui permet de remplir de manière automatique un certain nombre de champs, ou bien de de renseigner son numéro WoS (identifiant sur le Web of Science) ou son PMID (identifiant PubMed). Comme dit précédemment, ces fonctions d'import et d'interconnexion impliquent de vérifier la qualité des données saisies et de prendre certaines précautions.

Afin de garantir l'interconnexion des articles issus de revues avec l'archive ouverte HAL, c'est le choix de la thématique « Sciences agricoles », qui permet de qualifier la quasi- totalité des productions de l'INRA, qui a été effectué.

Il est également judicieux, lors du catalogage d'un article de revue, de se référer au wiki et aux chantiers qualité, qui correspondent à des initiatives d'harmonisation des données, qui y sont présentés, notamment lorsqu'il s'agit de déterminer le public visé (scientifique, professionnel, grand public, etc.) par les revues.

Par ailleurs, lorsque c'était possible, c'est à dire quand une version éditeur du document pouvait être retrouvée sur le site de la revue ou de l’événement, il était nécessaire d'intégrer les documents en version intégrale en passant par le dépôt d'une pièce-jointe dans l'onglet correspondant. Le wiki de ProdInra précise par ailleurs les modalités de dépôt des versions intégrales des documents, notamment au regard des droits d'auteur et des droits de diffusion de l'éditeur.

En ce qui concerne les difficultés que j'ai pu rencontrer lors de l'utilisation de l'outil, il est possible de mentionner la rigidité de certains champs de saisie ou la nécessité d'ajouter manuellement et un par un, c'est à dire avec une zone de saisie individuelle pour chacun d'entre eux, les mots-clés. Il est également déconseillé de travailler avec plusieurs onglets (et donc plusieurs notices) simultanément, car cela engendre un risque de verrouillage de la notice et donc une éventuelle impossibilité de la transmettre au relecteur.

Toutefois, ces différents soucis d'ergonomie, qui restent minimes, s'expliquent par la volonté d'harmoniser l'ensemble des données saisies et donc de garantir au mieux l'interconnexion et l'interopérabilité avec les autres plateformes de références bibliographiques et archives ouvertes.

Enjeux pour les usagers et objectifs à l'échelle de l'institut

L'objectif d'une archive ouverte, qui va au-delà d'une simple base de données de références bibliographiques, est de favoriser un accès direct à l'information et de garantir la visibilité des publications. Cette visibilité, qui passe avant tout par la dissémination de l'information et donc plus concrètement par la nature ouverte de ProdInra et son interconnexion avec de nombreuses plateformes similaires, telles que HAL, déjà mentionnée, mais également Isidore, VOA3R, le FAO, RePEc ou encore OpenAIRE, permet de faciliter l'accès et la lecture des publications, et donc leur éventuelle citation. C'est ce critère de visibilité qui est essentiel pour les usagers, mais les fonctionnalités de ProdInra constituent également des outils permettant l'évaluation des unités à travers la manipulation de statistiques, notamment par le biais des analyses bibliométriques.

Ces analyses nécessitent par nature la collecte et le moissonnage de données issus du plus grand nombre de champs possible. Elles impliquent également d'avoir des données spécifiques et précises, et les besoins doivent être alors établis en amont, en accord avec les chercheurs et les unités pour lesquels elles s'intègrent dans le processus d'évaluation. En outre, et notamment au regard des manipulations de tableaux statistiques qu'elles impliquent, elles symbolisent l'importance de la notion de « qualité », cruciale lors de la gestion d'une base de données, garantie notamment par l'harmonisation des données. Il est possible, à partir de ProdInra, d'extraire des statistiques liées aux auteurs, notamment en se reposant sur leurs affiliations et leur collaborations, en fonctionnant à partir d'un référentiel normé (précisant pour chaque auteur son unité, son centre de recherche, leur département etc.). Il peut également être intéressant d'obtenir des statistiques concernant les titres et les types de publications enregistrées dans l'archive ouverte afin de réaliser des cartographies des thématiques abordées et donc de qualifier la nature des recherches effectuées. Toutefois, ce sont surtout les statistiques et indicateurs concernant les différentes revues dans lesquels paraissent les articles des chercheurs qui constituent l'intérêt majeur de ces analyses, toujours dans le cadre d'une démarche d'évaluation, permettant de juger la qualité du travail accompli sur les quatre dernières années.

En effet, c'est la notion de notoriété des revues qui est centrale pour estimer le rayonnement des travaux du centre de recherche et le facteur d'impact devient alors le critère essentiel. Ainsi, un revue est jugée en fonction de son « impact », qui correspond en fait ici au nombre de fois où les articles qui y sont publiés sont cités. Le facteur d'impact repose donc sur un calcul mathématique établi par Eugène Garfield, fondateur de l'ISI (Institute for Scientific Information, qui est à l'origine du Web of Science), qui constitue l'estimation de la chance d'être cité par une revue sur les deux prochaines années.

Ceci étant, il s'agit d'un outil, d'un indicateur, qui, malgré sa facilité d'utilisation, est fortement critiqué puisqu'en plus d'être aisément manipulable, ce qui a pu mener à de nombreuses dérives dans le monde de l'édition scientifique, il est également biaisé, ne prenant pas en compte les thématiques et la portée effective des revues ainsi que leurs spécificités.

C'est pour cette raison que l'INRA a préféré développer la notion de « notoriété », qui vient alors se substituer à l'unique indicateur de facteur d'impact, en intégrant cette fois la notion de thématique et en permettant une meilleure prise en compte du concept de reconnaissance par les pairs. Il s'agit finalement, par le biais de cet indicateur de notoriété, de replacer le facteur d'impact dans un contexte plus précis. Cette notoriété est alors un critère essentiel pour les chercheurs, et tout comme le facteur d'impact, elle ne fonctionne que pour les publications référencées sur le WoS. Cette notoriété repose donc sur un ensemble d'indicateurs de visibilité et son fonctionnement est finalement très proche de celui de l'algorithme de Google, PageRank, qui s'est justement quant à lui inspiré du facteur d'impact et des processus d'évaluation des revues scientifiques.

Afin d'assurer, pour les usagers, un suivi de la notoriété des différentes revues, l'INRA a développé une application disponible sur l'intranet de la structure, NORIA (Notoriété des Revues et Indicateurs d'Articles). Ce service permet de consulter la notoriété des principales revues dans lesquelles les chercheurs de l'INRA sont susceptibles de publier et de télécharger le référentiel annuel des revues scientifiques. Pour les professionnels de l'IST qui réalisent les analyses bibliométriques, l'application permet également d'enrichir les données issues du WoS avec les notoriétés calculées par l'INRA. Cet indicateur de notoriété a été repris par l'éditeur Thomson Reuters au niveau international.

Les analyses bibliométriques accordent également une importance particulière aux partenariats à l'étranger et aux différentes collaborations des unités qui font l'objet de l'évaluation, afin d'estimer le rayonnement des travaux des chercheurs du centre dans le monde.

Les résultats de ces analyses se présentent sous la forme de nombreuses représentations graphiques (cf. annexe 8), à savoir des cartographies, des nuages de mots, des tableaux ou encore des graphiques, permettant de visualiser les points forts et les lacunes de l'unité de recherche en matière de publication scientifique.

Ainsi, ces analyses bibliométriques constituent un élément essentiel des dossiers d'évaluation qui sont établis tous les quatre ans à l'échelle des unités de recherche. Elles s'intègrent donc à une démarche d'évaluation et de validation du travail effectué par les chercheurs mais ne constituent pas réellement un outil de déploiement d'une politique et d'aide à la décision. Il s'agit en effet de deux processus distincts qui répondent à des impératifs différents.

Documents relatifs