• Aucun résultat trouvé

Politiques et initiatives de l’État français

4.1. Législation relative à la diffusion des données scientifiques 4.1.1. A l’origine : la loi CADA (1978 / 2005)

Il existe en France une législation qui régit l’accès et la réutilisation des informations du secteur public. En 1978 a été promulguée une loi relative aux relations entre l’administration et les usagers (dite « loi CADA »)146, instaurant un droit d’accès aux documents administratifs. Elle a été modifiée en 2005, lorsqu’a été transposée en droit français la directive européenne du 17 novembre 2003 concernant la réutilisation des informations du service public (dite « directive PSI »)147. Cette modification a établi un droit à la libre réutilisation des informations du secteur public. Un régime dérogatoire a néanmoins été accordé aux établissements d’enseignement et de recherche, qui restaient libres de fixer les conditions de réutilisation des informations qu’ils produisaient. Jusqu’au tournant des années 2000, la politique de recherche française était en effet davantage tournée vers la valorisation économique des résultats scientifiques que vers leur ouverture. C’est en partie pourquoi un régime dérogatoire avait été accordé aux établissements de recherche, ceux-ci pouvant réguler la réutilisation des informations qu’ils produisaient. Jusqu’en 2016, c’est donc la loi CADA qui, sur le plan juridique, régissait les conditions de diffusion des données de la recherche française.

4.1.2. La loi Valter et la loi pour une République numérique (2015 / 2016)

Quinze ans plus tard, la rhétorique de l’ouverture (openness) est devenue omniprésente, s’étendant du domaine scientifique aux domaines politique et économique. Elle s’est traduite dans la législation française par l’introduction de la loi Valter en 2015 et de la loi pour une République numérique en 2016.

146Loi   n°   78-753   du   17   juillet   1978   portant   diverses   mesures   d’amélioration   des   relations   entre   l’administration   et   le   public   et   diverses   dispositions   d’ordre   administratif,   social   et   fiscal  (dite « loi CADA »). https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000339241 (consulté le 19 septembre 2019).

147 Directive 2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 concernant la réutilisation des informations du secteur public 2003, op. cit.

Promulguée le 28 décembre 2015, la loi relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite « loi Valter »)148 est la transposition de la directive européenne du 26 juin 2013149. Elle rend gratuite la réutilisation des informations issues du secteur public.

La loi pour une République numérique150 a, quant à elle, été promulguée le 7 octobre 2016. Elle impose aux administrations de plus de 2 500 agents de mettre en ligne de manière spontanée et dans un format ouvert les documents produits dans le cadre de leurs activités. Ces documents deviennent alors librement réutilisables, y compris à des fins commerciales. La loi pour une République numérique instaure ce que Manuel Valls, alors Premier ministre, a qualifié de « principe d’open data par défaut »151. Même si les données de la recherche n’y sont que brièvement mentionnées, elles ne font désormais plus exception et doivent répondre à ce même principe d’ouverture et de libre réutilisation. L’article 11 de l’ancienne loi CADA, qui accordait un statut dérogatoire aux informations issues des établissements de recherche, a en effet été abrogé. Seule la protection de droits appartenant à des tiers (propriété intellectuelle, vie privée, confidentialité et secrets) peut désormais justifier la non diffusion de ces informations (Maurel 2018b).

L’unique mention du terme de données de recherche concerne l’article 30 du texte de loi :

« Dès lors que les données issues d’une activité de recherche financée au moins   pour   moitié   par   des   dotations   de   l’État,   des   collectivités   territoriales,   des   établissements publics, des subventions d’agences de financement nationales ou  par   des   fonds   de   l’Union   européenne   ne   sont   pas   protégées   par   un   droit  spécifique   ou   une   réglementation   particulière   et   qu’elles   ont   été   rendues   publiques par le chercheur, l’établissement ou l’organisme de recherche, leur  réutilisation est libre.

148Loi n° 2015-1779 du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des   informations du secteur public (dite « loi Valter »)

https://www.legifrance.gouv.fr/eli/loi/2015/12/28/PRMX1515110L/jo/texte (consulté le 19 septembre 2019). 149 Directive 2013/37/UE du Parlement européen et du Conseil du 26 juin 2013 modifiant la directive 2003/98/

CE concernant la réutilisation des informations du secteur public, op. cit.

150Loi n° 2016-1321 du 7 octobre 2016 pour une République numérique. https://www.legifrance.gouv.fr/eli/loi/ 2016/10/7/ECFI1524250L/jo/texte (consulté le 19 septembre 2019).

151 VALLS, M. (2015). Présentation de la stratégie numérique du Gouvernement. https://www.gouvernement.fr/ partage/4972-discours-de-manuel-valls-lors-de-la-presentation-de-la-strategie-numerique-du-gouvernement-a-la (consulté le 19 septembre 2019).

L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des  données de la recherche rendues publiques dans le cadre de sa publication.

Les dispositions du présent article sont d’ordre public et toute clause contraire à   celles-ci est réputée non écrite. »

Cet article vise à protéger le principe de libre réutilisation des données de recherche. L’objectif est d’empêcher des éditeurs privés de s’arroger l’utilisation exclusive des données de recherche. Au moment de la publication d’un article scientifique, il arrive que des éditeurs demandent aux chercheurs de leur remettre les données sous-jacentes et qu’ils insèrent dans le contrat d’édition une clause d’utilisation exclusive. L’article 30 a rendu nulle toute clause de ce type.

L’article 30 de la loi pour une République numérique est en partie dû aux acteurs de la science ouverte (principalement des professionnels de l’information scientifique et technique), qui ont contribué à l’élaboration du texte législatif, dans le cadre de la consultation publique ouverte en 2015. Le projet de loi avait en effet été soumis à une contribution en ligne des citoyens152. L’article 30 introduit donc le terme de « données de recherche » dans le Code de la recherche (article L533-4), lui conférant ainsi une existence juridique, quoique sans en donner de définition. De la même manière, le terme synonyme de « données scientifiques » avait été introduit dans l’article L112-1 par la loi relative à l'enseignement supérieur et à la recherche de 2013. Celle-ci avait en effet ajouté aux objectifs de la recherche publique française

« l’organisation de l’accès libre aux données scientifiques »153.

Le droit français fait donc des données de recherche un type d’information publique et scientifique à part entière. Cela témoigne de l’émergence, depuis la loi CADA, du concept de donnée de recherche. Ce dernier a commencé à être pensé de manière transdisciplinaire sous cette appellation à partir des années 2000 environ. Cela témoigne également de la reconnaissance par l’État de ce type d’information et de ses spécificités. D’après un rapport du Digital Curation Centre et de SPARC Europe publié en 2018154, 13 pays européens, dont la France, disposent actuellement d’une politique d’ouverture des données de la recherche (sur

152 La chronologie du projet de loi est disponible sur https://www.gouvernement.fr/action/pour-une-republique-numerique

153Article   L112-1   du   Code   de   la   recherche. https://www.legifrance.gouv.fr/affichCodeArticle.do? cidTexte=LEGITEXT000006071190&idArticle=LEGIARTI000006524135&dateTexte=&categorieLien=ci d (consulté le 19 septembre 2019).

un total de 28 États membres). La France est le seul pays avec la Lituanie155 à avoir entériné dans la loi cette question de l’ouverture des données. Dans les autres pays, l’ouverture des données fait plutôt l’objet de politiques venant de financeurs de la recherche, de feuilles de route nationales ou de codes d’éthique. Le rapport qualifie la politique mise en place par la France de « douce » (soft). Celle-ci se révèle en effet peu contraignante, se concentrant davantage sur des droits en matière d’ouverture que sur des obligations.

4.2. Initiatives du Ministère de la Recherche en matière de données de recherche

4.2.1. La Bibliothèque Scientifique Numérique (2009-2017) et son successeur, le Comité pour la Science Ouverte (2018-)

Au niveau gouvernemental, c’est le Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI) qui porte la question des données scientifiques. Celle-ci a été intégrée à une structure préexistante : la Bibliothèque Scientifique Numérique (BSN). Créée en 2009, la BSN est un dispositif national de coordination des actions en matière d'information scientifique et technique. Elle a vu le jour dans un contexte d’évolution des modèles de communication scientifique et de leurs acteurs. Placée sous la tutelle du Ministère, elle se compose de différents groupes de travail (appelés « segments »), axés sur des thématiques précises (l’édition scientifique, les archives ouvertes, l’archivage pérenne…). Au sein de ces groupes, il avait été choisi de réunir les représentants de différentes structures de l’enseignement supérieur et de la recherche (universités, organismes de recherche, associations professionnelles, infrastructures de recherche…). En rassemblant les différents acteurs de l’ESR, le Ministère imaginait renforcer les pratiques de coopération et favoriser l’utilisation d’outils nationaux mutualisés. Chaque segment avait pour mission : d’instruire

154 SPARC EUROPE (2018). An Analysis of Open Data and Open Science Policies in Europe. Version 3. https:// sparceurope.org/latest-update-to-european-open-data-and-open-science-policies-released/ (consulté le 19 septembre 2019).

155 En Lituanie, la loi relative à l’enseignement supérieur et à la recherche (adoptée en 2009 et révisée en 2015 puis 2016) stipule que les résultats des travaux de recherche réalisés par les institutions publiques d’enseignement supérieur et de recherche doivent être rendus publics.

Voir le texte de loi : https://e-seimas.lrs.lt/portal/legalAct/lt/TAD/548a2a30ead611e59b76f36d7fa634f8? jfwid=rp9xf47k7

des sujets thématiques ; de proposer des orientations ; d’accompagner des actions associées. La gouvernance était assurée par un comité de pilotage, secondé par un comité technique, composé des pilotes des différents segments et chargé d’instruire les décisions du comité de pilotage.

Au départ, les données de la recherche ne faisaient pas partie des thématiques « officielles » de la Bibliothèque Scientifique Numérique. C’est en 2013, quatre ans après le lancement de la BSN, qu’a été créé un segment dédié : BSN10. Ce nouveau groupe répondait à la même structure que les 9 autres d’ores et déjà en place. Parmi ses membres figuraient des personnes travaillant déjà sur la question des données à l’échelle de leur établissement de recherche. Ces personnes étaient principalement issues d’organismes de recherche comme le CNRS156, le CEA157, l’INRA158, l’INSERM159 et l’IRSTEA160. Une des raisons est que ces organismes étaient considérés comme plus avancés que les universités, ayant à cette époque d’ores et déjà mis en place une politique institutionnelle de gestion et d’ouverture des données au sein de leur établissement. Par ailleurs, les membres du groupe BSN10 étaient pour la plupart des professionnels de l’information scientifique et technique.

De 2013 à 2017, le groupe a réalisé plusieurs études et émis différentes recommandations sur des sujets comme la fouille de données ou l’article 30 de la loi pour une République numérique161. Il a également coordonné des actions collectives, dont Cat OPIDoR, catalogue référençant l’offre de services française en matière de données de recherche162. L’action de BSN10 s’est donc concentrée davantage sur l’étude du paysage français que sur la mise en place de dispositifs nouveaux pour gérer et partager les données de la recherche. Cela tient notamment à son mode de fonctionnement. Le fait d’être composé de membres venant d’horizons divers lui apportait certes une richesse en termes de points de vue et de

156 Centre National de la Recherche Scientifique (http://www.cnrs.fr/)

157 Commissariat à l'énergie atomique et aux énergies alternatives (http://www.cea.fr/) 158 Institut National de la Recherche Agronomique (http://www.inra.fr/)

159 Institut National de la Santé et de la Recherche Médicale (https://www.inserm.fr/)

160 Institut National de Recherche en Sciences et Technologies pour l'Environnement et l'Agriculture (https://www.irstea.fr/)

161 Voir supra, 4.1.2, p.88

propositions, mais créait une sorte d’inertie due au peu de temps que chacun de ses membres pouvait lui consacrer (la plupart d’entre eux occupaient en effet des postes à responsabilités dans leurs propres établissements).

En 2018, la Bibliothèque Scientifique Numérique a cédé la place au Comité pour la Science Ouverte (CoSO). Ce dernier a été créé dans le cadre de la mise en place d’un plan national pour la science ouverte (voir ci-dessous). Fondé sur une structure similaire à la BSN, le CoSO se veut composé d’experts de toutes professions et disciplines concernées par la science ouverte. Il est organisé non plus en dix segments mais en quatre collèges :

Un collège Publications

Un collège Données de la recherche

Un collège Compétences

Un collège Europe & International

Cette nouvelle répartition montre l’importance qu’ont prise les données de la recherche dans la politique nationale d’ouverture de la science entre 2009 et 2018.

4.2.2. Un plan national pour la science ouverte (2018)

Le 4 juillet 2018, la Ministre de l’Enseignement supérieur, de la Recherche et de l’Innovation, Frédérique Vidal, a annoncé le lancement d’un plan national pour la science ouverte. Elle a présenté la transition de la France vers la science ouverte comme un enjeu de compétitivité163. Doté d’un budget de 5,4 millions d’euros pour l’année 2018-2019, ce plan se compose de trois axes : le premier axe vise à généraliser le libre accès aux publications ; le deuxième axe à structurer et ouvrir les données de la recherche ; le troisième axe à inscrire la France dans une dynamique européenne et internationale164.

163 Vidal 2018, op. cit.

Ce plan entend répondre à un double objectif :

Celui de l’Amsterdam Call for Action on Open Science165, lancé sous la présidence néerlandaise au Conseil de l’Union européenne et appelant à une démocratisation de l’accès aux savoirs ;

Celui de l’Open Government Partnership166, visant à développer la transparence de l’action publique.

En voulant à la fois rendre la science plus transparente, accélérer le progrès scientifique, nourrir la formation et contribuer à l’innovation, le plan national pour la science ouverte semble donc nourrir de grandes ambitions. On peut se questionner sur la possibilité de les honorer toutes. Est-il possible de mettre en place des solutions concrètes, qui tiennent compte de tous ces objectifs ?

Pour ce qui est de l’axe consacré aux données scientifiques, l’objectif est que « les données  produites par la recherche publique soient progressivement structurées en conformité avec   les principes FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables), préservées   et,   quand   cela   est   possible,   ouvertes »167. Le plan national recommande également

« l’adoption d’une politique de données ouvertes associées aux articles et le développement   des data papers168»167.

Afin d’accélérer cette transition, a été planifié le lancement d’un appel à projets. Intitulé « ANR Flash », cet appel a été publié le 28 mars 2019 par l’Agence Nationale de la Recherche (ANR)169. Il vise à « demander   à   la   communauté   scientifique   elle-même   de  proposer, domaine par domaine, discipline par discipline, spécialité par spécialité, comment   elle   peut   appliquer   les   principes   de   la   science   ouverte   à   propos   des   données   de   la  recherche »170. Le Ministère met donc entre les mains de la communauté scientifique la question de comment ouvrir les données.

165Amsterdam   Call   for   Action   on   Open   Science (2016). https://www.ouvrirlascience.fr/amsterdam-call-for-action-on-open-science/ (consulté le 19 septembre 2019).

166 Déclaration du gouvernement ouvert 2011, op. cit.

167 Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation 2018, op. cit., p.6

168 Un data   paper est « une publication qui décrit un jeu de données scientifiques, notamment à l’aide d’informations structurées appelées métadonnées. Contrairement aux articles de recherches classiques, les data papers fournissent une voie formalisée au partage des données plutôt que tester des hypothèses ou présenter de nouvelles analyses » (source : https://doranum.fr/data-paper-data-journal/fiche-synthetique/). 169https://anr.fr/

Le plan national pour la science ouverte prévoit également plusieurs autres mesures.

Sur le plan administratif : sera créée la fonction d’administrateur des données au ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI). Cette fonction existe déjà dans d’autres ministères. Elle avait été instituée en 2014 par le décret n°2014-1050171, dans le cadre de la politique nationale d’Open Data. L’administrateur du MESRI sera chargé de coordonner l’action publique en matière de données scientifiques et d’animer un réseau d’administrateurs des données dans les établissements de recherche.

Sur le plan financier : les dépenses de traitement des données seront rendues éligibles dans les appels à projets.

Sur le plan pédagogique : des offres de formation seront proposées à la communauté scientifique, pour développer les compétences sur les données de la recherche.

Sur le plan technique : des centres de données thématiques et disciplinaires seront développés ; la mise en place de plans de gestion de données dans les appels à projets de recherche sera généralisée (depuis 2019, l’ANR impose ainsi un plan de gestion de données aux projets de recherche qu’elle finance172).

Ces différentes mesures se focalisent sur l'ouverture des données, c’est-à-dire sur la manière de les rendre accessibles et réutilisables. La question de leur réutilisation effective n’est pas abordée. Le plan pour la science ouverte ne prévoit pas de stratégie pour stimuler la réutilisation des données qui seront mises en ligne. Peut-être est-ce encore trop tôt ? C’est en tout cas un aspect qu’il faudra aborder, car le défi est aussi économique. Ce problème a déjà été identifié par les acteurs de l’Open Data, qui ont constaté que la réutilisation des informations publiques mises en ligne demeurait limitée173.

170 AGENCE NATIONALEDELA RECHERCHE (2019). Appel FLASH Science ouverte : pratiques de recherche et  données   ouvertes. http://www.agence-nationale-recherche.fr/fileadmin/aap/2019/aap-data-2019.pdf

(consulté le 19 septembre 2019).

171Décret   n°2014-1050   du   16   septembre   2014   instituant   un   administrateur   général   des   données.

https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000029463482&categorieLien=id

(consulté le 19 septembre 2019).

172 AGENCE NATIONALEDELA RECHERCHE (2018). Plan d’action 2019.

https://anr.fr/fileadmin/documents/2018/Plan-d-action-ANR-2019.pdf (consulté le 19 septembre 2019). 173 Voir supra, 2.3, p.63

A l’instar de l’Open Data, le principe d’ouverture des données de la recherche est mobilisé dans les politiques publiques pour servir simultanément plusieurs objectifs. De la Déclaration de l’OCDE (2004) au plan national français pour la science ouverte (2018), en passant par la création d’un espace européen de la recherche (2012), l’ouverture des données est prônée à la fois pour accélérer le progrès scientifique et stimuler l’innovation. Les politiques d’ouverture conjuguent donc une vision libertaire et une vision néolibérale de la science (Chartron 2016, p.2). L’orientation de la Commission européenne semble pourtant sous-tendre fondamentalement la seconde vision : celle d’une science au service de l’innovation. Comment expliquer alors cette double argumentation ? On peut s’appuyer, pour y répondre, sur le concept de buzzword, décrit par l’historienne Bernadette Bensaude Vincent (2014). L’expression d’« ouverture des données » fonctionne en effet comme un buzzword, c’est-à-dire comme un mot ou groupe de mots capable de fédérer des personnes d’horizons différents. La puissance fédératrice des buzzwords vient de leur connotation positive et du fait qu'ils véhiculent des valeurs présentes dans la société en général. Ils pointent un objectif, un but à atteindre et, ce faisant, créent une dynamique autour de l'élaboration de principes d'action (dans le cas des données, les principes FAIR en sont un exemple). De manière générale, le terme d'« ouverture » connote la libération de quelque chose qui jusqu'alors ne bénéficiait qu'à quelques uns. La notion d’ouverture des données de la recherche fait par ailleurs appel à des valeurs scientifiques (la connaissance comme bien commun174) ainsi qu'aux valeurs d’un Internet sans frontières, dans lequel les données sont des biens communs numériques et informationnels (Latrive 2000). Les buzzwords, et l'ouverture des données en particulier, se rapprochent de ce que Star et Griesemer (1989) nomment des « objets-frontières » (boundary  objects). Ce sont des mots malléables, dont le sens est suffisamment imprécis et à la fois suffisamment accessible, pour susciter des interprétations diverses. Ils peuvent ainsi être adoptés par des catégories d’acteurs différentes, qui chacune les adaptent au cadre de référence qui leur est propre. C’est probablement ce qui explique le succès de l’ouverture des données de la recherche (et de la science ouverte en général). Leur flexibilité sémantique permet de réunir autour d’un même principe d’action – l’ouverture – des personnes aux

174 Dans l’« ethos de la science » de Merton (1973), une des quatre normes régulant l’activité scientifique est le « communisme ». Selon cette norme, toute découverte scientifique, en tant que produit de la collaboration entre chercheurs, est un bien commun et doit donc systématiquement être publiée.

perspectives divergentes, les unes plaçant la recherche au cœur de la croissance économique,