• Aucun résultat trouvé

L’ouverture des données de la recherche

Le mouvement du libre accès ne se cantonne pas seulement aux publications, il concerne également les données et les résultats de recherche. L’open data scientifique est le terme utilisé pour désigner l’ouverture des données de projet de recherche financés par les fonds publics. Parallèlement, le « data sharing », est un mouvement porté par les chercheurs concernés par l’ouverture des données.

« L’objectif de l’ouverture des données de la recherche est de fournir l’information nécessaire à la validation des constations, des conclusions ou des résultats d’un

projet de recherche ». Les données sont essentielles à la corroboration (ou à la réfutation) des théories car l'accessibilité publique des données permet une relecture ouverte par les pairs et encourage la reproductibilité des résultats. Ces données sont aussi capitalisables : elles peuvent être réutilisées pour d’autres recherches à venir.

Ces données peuvent être définies de la manière suivante : « Les données de la recherche sont les informations quantitatives ou les relevés qualitatifs collectés par les chercheurs au cours de leurs expérimentations, observations, entretiens ou suivant toute autre méthode » [11, GAILLARD].

Selon l’avis du COMETS, en 2015, il s’agit également de « toutes les données collectées dans le contexte de la recherche scientifique, c’est à dire les données primaires (empiriques, observées, mesurées) dont certaines n’ont pas vocation à être stockées et a fortiori à être partagées ; les données secondaires, dérivées des données primaires, annotées, enrichies, interprétées ajoutant de la valeur aux données initiales et pouvant impliquer d’autres acteurs, les métadonnées qui structurent, gèrent, facilitent l’accessibilité des données primaires et secondaires et informent sur les conditions de partage. Ces données peuvent être des flux numériques issus de capteurs, ou des documents textuels, graphiques, picturaux, multimédia » [10, COMETS].

D’un point de vue juridique, « Le chercheur doit rester titulaire de droits sur les données qu’il produit ou qu’il analyse comme sur ses publications, s’il souhaite les partager ou en autoriser la réutilisation. Dans ce cas, il lui est vivement conseillé de mettre ses données protégeables sous une licence libre » [10, COMETS].

Depuis maintenant 10 ans, les institutions, les financeurs, les gouvernements, les infrastructures de recherche et certains éditeurs travaillent à élaborer des modèles pour partager et rendre accessible et compatibles ces données, selon les principes de la déclaration de Berlin.

Malgré le fait que demeurent des questions d’ordre organisationnel, normatif, juridique, technologique et financier, l’open research data est de plus en plus considéré et pris en compte dans les nouveaux projets : le programme cadre de l’Union Européenne pour la recherche et l’innovation, Horizon 2020 rend obligatoire le libre accès aux données des recherches qui s’y rapportent, par exemple.

Les infrastructures comme DRYAD4 aux USA, OpenAirePlus5 en Europe ou la plateforme donneesdelarecherche.fr6 en France sont un indicateur de la considération et de l’importance qu’accorde la communauté scientifique à ce type d’information.

Face à ces enjeux, de nouveaux protocoles apparaissent comme la création de Data Management Plans (Plan de gestion des données) qui décrivent, facilitent la gestion, l’ouverture et la protection des données de la recherche.

Au-delà des initiatives d’ouverture des données de la part de la communauté scientifique, des politiques d’open data ont été instaurées par les états. En Europe, la majorité des pays ont adopté une politique visant à promouvoir l’ouverture des données publiques. En effet, les états sont d’importants pourvoyeurs de données produites, reproduites, collectées, diffusées ou rediffusées par les administrateurs publics dans le cadre de leurs missions institutionnelles. Il s’agit notamment de données démographiques, géographiques, météorologiques, économiques, financières, culturelles, touristiques… qui visent à assurer la qualité et la continuité du service public. En France, ETALAB7 est le service qui gère l’open data sous l’autorité du Premier Ministre. Les données subventionnées sur fonds public sont ainsi mises à disposition de manière libre et gratuite et peuvent être réutilisées. Ces données peuvent être ré-exploitées et monétisées après traitement par les entreprises.

Dans le cadre de l’open data public, l’incitation est d’origine normative et s’applique légalement à l’ensemble des agents publics, y compris aux agents travaillant dans le service public de la recherche : les chercheurs sont sensibilisés et de plus en plus conscients de l’importance et des enjeux de l’open data et de l’open access. Malgré une hétérogénéité des pratiques et des contraintes, les chercheurs sont incités à poursuivre un idéal de partage et d’échange entre pairs. Avec l’ouverture des données de la recherche, ils doivent faire face à de nouvelles responsabilités relatives à la qualité de ces données, leur interopérabilité et la clarté de l’information

4 DRYAD : https://datadryad.org/

5 OpenAirePlus : https://www.openaire.eu/openaireplus-press-release

6 Donnéesdelarecherche.fr : http://www.donneesdelarecherche.fr/

7 Blog de la mission d’ETALAB : http://www.etalab.gouv.fr/

Voir aussi http://www.data.gouv.fr/fr/

qui les accompagne. Ces préoccupations sont de l’ordre de « leur responsabilité individuelle, déontologique et éthique vis-à-vis de la communauté à laquelle ils appartiennent » selon le rapport du COMETS. [10, COMETS]

De manière générale, si l’on prend en considération les nombreuses politiques allant dans le sens du libre accès, les initiatives l’encourageant et la sensibilisation de la communauté scientifique pour ce mouvement, on peut considérer que l’open research data est une politique qui tend à se généraliser.

I.4 La démocratisation de l’information scientifique : l’enjeu du