• Aucun résultat trouvé

PARTIE 3 - LES BIBLIOTHÈQUES UNIVERSITAIRES ET LES

2. Quelles actions pour les BU dans le développement des SI recherche ?. .98

2.3. Utilisation des SI recherche par les BU

2.4.1. ScanR, un outil d'exposition des données

ScanR est un outil lancé le 6 juillet 2016 par le département des outils d'aide à la décision qui dépend de la Sous-direction des Systèmes d'information et études statistiques (SIES) du MENESR. Il s'agit d'un moteur de recherche agrégeant différentes sources de données autour de la recherche française publique et privée.

Cette application Web est pour l'instant proposée en version bêta.

Elle propose de décrire, de caractériser et d'analyser le contexte de 25 000 acteurs de la recherche en France, qu'ils dépendent d'administrations ou d'entreprises. A travers une barre de recherche, l'objectif est de permettre aux utilisateurs de répondre à des questions comme :

« Quels laboratoires travaillent sur le Boson de Higgs ?

• Quelles entreprises travaillent en collaboration avec les chercheurs de notre région ?

• Quel laboratoire peut accueillir mon projet de thèse ?

241DELHAYE, Marlène. El conditor pasa. Dans : Marlène’s corner [en ligne]. 9 juin 2014.

[Consulté le 8 décembre 2016]. Disponible à l’adresse : https://marlenescorner.net/2014/06/09/el-conditor-pasa/.

242DUCHAMP, Cyril. Bibliographie : lancement du projet Conditor, référentiel de la production scientifique française. AEF. 7 décembre 2016.

243L'ABES, l'Amue, CasuHal, le CCSD, l'INIST, la DIST du CNRS, l'INSHS, le SAP2S, Huma-Num, l'INRA, l'INRIA, l'IRD, l'IRSTEA, le MENESR avec les outils ScanR et RNSR, l'OST et le HCERES, ainsi que les universités de Bordeaux, Paris-Dauphine, Paris-Diderot, et l'UPMC.

244DUCHAMP, Cyril. Bibliographie : lancement du projet Conditor, référentiel de la production scientifique française. AEF. 7 décembre 2016.

245DUCHAMP, Cyril. Bibliographie : lancement du projet Conditor, référentiel de la production scientifique française. AEF. 7 décembre 2016.

DELEMONTEZ Renaud | DCB | Mémoire d'étude | janvier 2017 76

-• Quels sont les acteurs de la recherche et de l'innovation près de chez moi ?246 ».

Les résultats se présentent sous forme de liste normalisée. Ils permettent de conduire à des fiches détaillées. Elles contiennent des informations générales comme le nom du responsable, l’emplacement géographique précis via OpenStreetMap, un nuage de tags tiré de l’analyse des mots-clés du site, des productions et des projets de l’organisme, les productions scientifiques ou encore la tutelle dont elle dépend. Des graphes sont également disponibles pour visualiser des relations, par exemple avec les organismes privés ou publics. Une vue synthétique permet également de consulter les résultats sous forme de carte ou de graphiques pour faire ressortir les points saillants de l'activité de la structure concernée. Le site Outil Froid propose dans un article du 8 juillet 2016 une description très détaillée de ces fonctionnalités247.

246À Propos de scanR. Dans : scanR : le moteur de la recherche et de l’innovation [en ligne]. [s. d.].

[Consulté le 8 décembre 2016]. Disponible à l’adresse : https://scanr.enseignementsup-recherche.gouv.fr/static/a_propos.html.

247ScanR, un moteur pour identifier les structures de recherche et d’innovation en France | Outils Froids [en ligne].

[s. d.]. [Consulté le 8 décembre 2016]. Disponible à l’adresse : http://www.outilsfroids.net/2016/07/scanr-un-moteur-pour-identifier-les-structures-de-recherche-et-dinnovation-en-france/.

DELEMONTEZ Renaud | DCB | Mémoire d'étude | janvier 2017 77

-Illustration 10: ScanR : exemple de fiche d'un laboratoire

Pour arriver à ce résultat, le département des outils d'aide à la décision a travaillé avec la société C-Radar248. Ils ont agrégé différentes sources249 : des référentiels -CrossRef, Wikidata, etc.-, des données issues de bases ouvertes -HAL, ProdINRA, etc.-, mais également des données de sites Web qui ont été

« scrapées », c'est-à-dire aspirées pour être utilisées dans un autre contexte et structurer l'information présente dans un texte. Emmanuel Weisenburger et Yann Caradec, responsable et responsable-adjoint du département des outils d'aide à la décision nous ont en effet expliqué en entretien que certains sites, comme celui de l'ANR, ne mettaient à disposition que des pages rédigées pour décrire les projets retenus. Un traitement a donc été nécessaire pour que les informations qu'elles contiennent puissent être agrégées et mises en relation avec d'autre données250.

ScanR est donc un outil très puissant pour valoriser l'activité de recherche et permettre de trouver des collaborations ou expertises potentielles. Il n'est pas un CRIS, puisqu'il n'a pas vocation à fournir des indicateurs de suivi, ni un RNS, puisqu'il ne propose pas de pages personnelles pour les chercheurs. Il constitue toutefois un SI, puisqu'il regroupe des données de différentes sources, pour les lier entre elles et les restituer sous une forme exploitable aux utilisateurs.

Cette application Web remplit également une mission très importante pour la gestion des données sur l'activité de recherche.

D'une part, le parti pris a été de ne pas attendre de trouver les meilleures sources de données, mais d'utiliser celles à disposition -voire d'améliorer celles disponibles grâce à une analyse syntaxique-. L'objectif n'était pas de proposer des informations parfaites, mais de les exposer au plus grand nombre. Sachant cela, les

248Tout ce que vous avez toujours voulu savoir sur la recherche française…. Dans : C-Radar [en ligne]. 6 juillet 2016. [Consulté le 8 décembre 2016]. Disponible à l’adresse : http://www.c-radar.com/blog/2016/07/06/tout-ce-que-vous-avez-voulu-savoir-sur-la-recherche-francaise-sans-peiner-a-le-chercher/.

249Découvrez scanR, le moteur de la recherche et de l’innovation (en version béta). Dans : scanR : le moteur de la recherche et de l’innovation [en ligne]. [s. d.]. [Consulté le 8 décembre 2016]. Disponible à l’adresse :

https://scanr.enseignementsup-recherche.gouv.fr/.

250Voir Annexe 2.G. Entretien avec Emmanuel Weisenburger et Yann Caradec.

DELEMONTEZ Renaud | DCB | Mémoire d'étude | janvier 2017 78

-Illustration 11: ScanR : exemple de graphe relationnel

personnes et structures concernées peuvent prendre conscience qu'une donnée erronée saisie dans une base ou un référentiel peut avoir des répercussions. Lorsqu'une erreur est repérée, elle peut ainsi être signalée pour une correction ultérieure251. Les sources ne peuvent qu'en être améliorées.

D'autre part, les jeux de données utilisés sont signalés et placés sous licence ouverte Etalab252. Ils peuvent donc être réutilisés dans d'autres systèmes, par exemple un SI recherche ou une archive ouverte. Cette ouverture est également valable pour les jeux de donnés « scrapés », comme par exemple la liste 2016 des projets ANR retenus et des participants identifiés253 ou des finalistes et lauréats du concours Ma Thèse en 180 secondes France254.