• Aucun résultat trouvé

Science Ouverte : Réflexions et actions coordonnées à l’échelle de l’UFTMiP pour le partage et la valorisation des Données de la Recherche Toulousaine | Unité Régionale de Formation à l'Information Scientifique et Technique

N/A
N/A
Protected

Academic year: 2021

Partager "Science Ouverte : Réflexions et actions coordonnées à l’échelle de l’UFTMiP pour le partage et la valorisation des Données de la Recherche Toulousaine | Unité Régionale de Formation à l'Information Scientifique et Technique"

Copied!
51
0
0

Texte intégral

(1)

Nathalie Aussenac-Gilles, Pascal Gaillard, Michelle Sibilla

Comité de Réflexion pour le partage et la valorisa6on des données de la recherche et la coordina6on de la Science Ouverte à l’échelle de l’UFTMiP

Données de la recherche et Open Access :

Réflexions partagées par la communauté

toulousaine

A l’ATTENTION DES

pascal.gaillard@univ-tlse2.fr Nathalie.Aussenac-Gilles@irit.fr michelle.sibilla@irit.fr

(2)

Plan de la présentaPon

I.  Des données à leur ouverture

II.  IllustraPons des enjeux

III.  Réflexions et AcPons du CéSO :

vers le partage et l’ouverture des résultats de la

recherche

IV.  Conclusions et perspecPves

(3)

PARTIE I

Des données à leur ouverture

• 

Quelles données sont concernées ?

• 

Vers l’ouverture

• 

Nécessité d’un accompagnement tout au long

du cycle de vie des données

• 

Besoins d’environnement(s) support

• 

Conclusion

(4)

Quelles sont les données concernées ?

DéfiniPon de l’OCDE des données de la recherche financée sur fonds publics (1) :

« Les «données de la recherche » sont définies comme des enregistrements factuels (chiffres, textes, images, sons) u6lisés comme sources principales pour la recherche

scien6fique et généralement reconnus par la communauté scien6fique comme nécessaires pour valider les résultats de la recherche. »

(5)

Quelles sont les données concernées ?

DéfiniPon de l’OCDE des données de la recherche financée sur fonds publics (1) :

« Les «données de la recherche » sont définies comme des enregistrements

factuels (chiffres, textes, images, sons) u6lisés comme

sources principales

pour la recherche scien6fique et généralement reconnus par la communauté

scien6fique comme nécessaires pour

valider

les résultats de la recherche. »

PUBLICATIONS

PRE-PRINTS POST-PRINTS D’OBSERVATION EXPERIMENTALES DE SIMULATION DERIVEES CODES MODELES ALGORITHMES DATA PAPERS TRAVAUX DE RECHERCHE

DONNEES

(reviews) RESULTATS VALORISATION

(6)

Autres « données » partageables

Les « données » liées aux ac6vités scien6fiques

PUBLICATIONS

CODES

TRAVAUX DE RECHERCHE RESULTATS

DONNEES

ACTIVITES SCIENTIFIQUES

CAHIERS DE LABORATOIRES ESSAIS PROCEDURES WORKFLOW « BONNES PRATIQUES » VALORISATION

(7)

CODES

DONNEES

PUBLICATIONS

PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS REFERENTIEL

Vers l’Ouverture

TRAVAUX DE RECHERCHE RESULTATS REFERENTIEL REFERENTIEL ARCHIVES VALORISATION

(8)

Vers l’Ouverture

PUBLICATIONS

CODES

DONNEES

PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS DEUXIÈME AXE : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE REFERENTIEL REFERENTIEL TRAVAUX DE RECHERCHE RESULTATS REFERENTIEL REFERENTIEL ENTREPOTS REFERENTIEL REFERENTIEL ENTREPOTS REFERENTIEL REFERENTIEL REFERENTIEL ARCHIVES VALORISATION

(9)

CODES

Vers l’Ouverture

PUBLICATIONS

DONNEES

PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS DEUXIÈME AXE : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE REFERENTIEL REFERENTIEL Facilement TROUVABLES, ACCESSIBLES, INTEROPERABLES, REUTILISABLES TRAVAUX DE RECHERCHE RESULTATS REFERENTIEL REFERENTIEL ENTREPÔTS REFERENTIEL REFERENTIEL ENTREPÔTS REFERENTIEL REFERENTIEL REFERENTIEL ARCHIVES REGISTRES REGISTRES ONTOLOGIES VOCABULAIRES META-DONNEES DATASET VALORISATION

(10)

CODES

Vers des entrepôts généraux cerPfiés

PUBLICATIONS

DONNEES

PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS DEUXIÈME AXE : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE TRAVAUX DE RECHERCHE RESULTATS ONTOLOGIES VOCABULAIRES VALORISATION

(11)

CODES

PUBLICATIONS

DONNEES

Exemple pour le domaine de la Biodiversité

TRAVAUX DE RECHERCHE RESULTATS

Vers des entrepôts spécifiques cerPfiés

VALORISATION

(12)

CODES

PUBLICATIONS

DONNEES

Exemple pour le domaine de la Biodiversité

TRAVAUX DE RECHERCHE RESULTATS

Vers des entrepôts spécifiques cerPfiés

VALORISATION

(13)

Les quesPons fusent …

C, E-C, Ing Etudiant.e.s Avec qui puis-je les partag er ?

Où trouve

r des donn

ées ?

Combien de temps dois-je les conserver ?

Où déposer mes

(méta)données ?

Quelles (méta)données uPlisées ?

Quelles (méta)données

vais-je produire?

Quels ouPls puis-je uPliser pour les analyser?

Quelles don

nées produi

re ?

(14)

Une gesFon nécessaire tout au long

du cycle de vie des données

C, E-C, Ing Etudiant.e.s Avec qui puis-je les partager ? Où trouver des données ? Combien de temps dois-je les conserver ? Où déposer mes (méta)données ? Quelles (méta)données uPlisé es ?

(15)

Un point de départ :

le Plan de GesFon de Données (PGD)

OBLIGATION Data Set

!

C, E-C, Ing Etudiant.e.s Data Paper ENTREPÔTS Avec qui puis-je les partager ? Où trouver des donn ées ? Combien de temps dois-je les conserver ? Où déposer mes (méta)données ? Quelles (méta)données uPlis ées ? PublicaPon

(16)

Nécessité d’un accompagnement tout

au long du cycle de vie des données

C, E-C, Ing Etudiant.e.s Avec qui puis-je les partager ? Où trouver des données ? Combien de temps dois-je les conserver ? Où déposer mes (méta)données ? Quelles (méta)données uPlisé es ? Source : Le Data Management Plan (DMP ou Plan de GesPon de Données (PGD) et OPIDoR. Collège de France – DirecPon des réseaux et partenaires documentaires – Département de bibliométrie et des ressources en ligne

(17)

Nécessité d’un accompagnement tout

au long du cycle de vie des données

C, E-C, Ing Etudiant.e.s Avec qui puis-je les partager ? Où trouver des données ? Combien de temps dois-je les conserver ? Où déposer mes (méta)données ? Quelles (méta)données uPlisé es ? Etablissement COMPETENC ES VARIEES POUR REALIS ER CETTE GES TION

(18)

C, E-C, Ing

SituaPon de gesPon des données de la

recherche (laboratoire)

Laboratoires

mulP-tutelles

(19)

C, E-C, Ing

SituaPon de gesPon des données de la

recherche (laboratoire)

Laboratoires

mulP-tutelles

mulP-sites

UNE COORDINATION EST SOUHAITABLE POUR UNE MEILLEURE EFFICACITE ET UTILISATION DES RESSOURCES SOUS-JACENTES

(20)

C, E-C, Ing

SituaPon de gesPon des données de la

recherche (projet)

C, E-C, Ing C, E-C, Ing C, E-C, Ing

(21)

C, E-C, Ing

SituaPon de gesPon des données de la

recherche (projet)

C, E-C, Ing C, E-C, Ing C, E-C, Ing DATA MANAGEMENT PLAN

(22)

Besoins d’environnement(s) support

Infrastructure calcul et stockage Equipements Plateformes de travail collaboraPf REGISTRES (vocabulaires, metadonnées, ontologies) REFERENTIELS généralistes, disciplinaires, d’établissement (?) SERVICES SUPPORTS (SensibilisaPon, formaPon, recommandaPons, bonnes praPques, ouPls…)

(23)

Besoins d’environnement(s) support

Infrastructure calcul et stockage Equipements Plateformes de travail collaboraPf RÉFÉRENTIELS (vocabulaires, metadonnées, ontologies) REFERENTIELS généralistes, disciplinaires, d’établissement (?) SERVICES SUPPORTS (SensibilisaPon, formaPon, recommandaPons, bonnes praPques, ouPls…) COÛTS FINAN CIERS ET ENVIRO NNEMENTAUX

(24)

Conclusion

• 

Il faut BEAUCOUP de moyens :

accompagnements, supports, infrastructures

• 

Chaque communauté scienPfique est plus ou

moins avancée et organisée

• 

Même disparité au niveau des établissements

Comment gagner en efficacité ? en qualité ?

POUR TOUTES LES COMMUNAUTES SCIENTIFIQUES

tout en réduisant nos coûts ?

(25)

ParPe II -

(26)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

(27)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  … C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

Fouille de texte Mise en relaPon Découverte de connaissances

IST

EX

Fouille de données Classific aPon ApprenPssage AutomaPque . Recherche de régularités passées pour interpréter de nouvelles données . AlternaPves à la modélisaPon mathémaPque ou à la simulaPon . AnPciper des comportements, des

(28)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  … C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

collecter ne^oyer analyser documenter stocker Archiver réuPliser infrastruc tures entrepots registres publicaPons Traces d’usages PraPques de recherche données Écosystème par domaine : Ecosystème de site :

(29)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  … C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

Fouille de données Classific aPon ApprenPssage AutomaPque Nouvelles recherches

(30)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

Rendre visibles et accessibles ses données et ses publicaPons c’est •  Amplifier leur visibilité •  CirculaPon des métadonnées des portails vers des registres sans intervenPon du chercheur •  Pouvoir reproduire les expériences des autres chercheurs •  Mieux comparer les contribuPons •  Gage de qualité des recherches MD Registres Portails MD MD

(31)

+  Aller vers de la Data Driven Science +  Disposer d’un écosystème +  Partager des données, des expériences et en trouver beaucoup d’autres +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches (inter)disciplinaires +  Se connaître (jusqu’à l’internaPonal) +  Etre efficace +  Valoriser les résultats +  Porter une visibilité disciplinaire/communautaire +  Aller vers une reconnaissance (acteurs de la SO, évaluaPon) +  C, E-C, Ing Etudiant.e.s

Enjeux scienPfiques

Sta6s6ques sur Google Dataset Search N. Noy, 2021

(32)

+  Enjeu de visibilité des recherches (pôles, (inter)disciplinarité) +  Image posiPve, cohérente et coordonnée +  Réduire les disparités entre communautés scienPfiques (locales et naPonales) +  Offrir des services de qualité, adaptés aux disciplines/communautés +  Faciliter les acPvités (individuelles, projets, communautés) des chercheurs +  RaPonaliser des moyens, des services, des compétences +  Réduire les coûts +  Approche responsable des points de vue éthique et environnement C, E-C, Ing Etudiant.e.s +  Porter une visibilité disciplinaire/ communautaire simple +  Partager des données, des expériences et en trouver beaucoup d’autres +  Aller vers une reconnaissance (SO, évaluaPon) +  Se connaître (jusqu’à l’internaPonal) +  Mieux connaître l'état des lieux et les iniPaPves +  IniPer de nouvelles recherches interdisciplinaires +  Disposer d’un écosystème + Etre efficacité

Enjeux pour nos établissements

Etablissements, organismes

(33)

ParPe III -

Réflexions et acPons du CéSO

vers le partage et l’ouverture des

résultats de la recherche

• 

Le CéSO et ses missions

• 

OrganisaPon de la réflexion et de la coordinaPon

• 

Premières iniPaPves, acPons et incitaPons

(34)

Le CéSO

•  Validé par le Conseil des Membres de l’UFTMiP en Juin 2020 •  Lancé en Septembre 2020 dans un conPnuum d’acPons engagées par certains établissements et disciplines

toulousaine

Accélérons l’adoption

de recommandations,

de standards, d’outils

en partageant nos

besoins, nos pratiques,

nos compétences dans

un cadre coordonné.

(35)

Les missions du CéSO

•  COORDONNER une campagne de sensibilisaPon/formaPon à la Science Ouverte

avec le réseau des bibliothèques

•  PROPOSER une « poliPque de site » de gesPon des données de la recherche

(PGD) et ses déclinaisons (pôles/établissement/ laboratoires) avec l’aide des différents groupes de travail (existants ou à définir)

•  IDENTIFIER des référenPels de données conformes aux préconisaPons

naPonales et européennes (FAIRisaPon), liés à des archives ouvertes (données de la recherche, publicaPon, …)

•  PRECONISER une urbanisaPon des services autour de ces entrepôts de données

•  COORDONNER, SUSCITER, STIMULER des réponses aux appels à projets

naPonaux et européens pour assurer la présence du site sur les AAP les plus importants … en collaboraPon avec l’alliance académique

(36)

Cadre de réflexion et de coordinaPon

REPRESENTATIVITE

ORGANISATION INTERACTIONS

(37)

REPRESENTATIVITE ORGANISATION INTERACTIONS (INTER)DISCIPLINA IRE/PLATEFORME 53% DOCUMENTATION 20% FORMATION 7% RELATIONS (Région -> InternaPonal) 10% UTFMiP 10% ComposiFon du CéSO (30 membres)

Une représentaPvité large

(38)

REPRESENTATIVITE ORGANISATION INTERACTIONS (INTER)DISCIPLINAI RE/PLATEFORME 53% DOCUMENTATION 20% FORMATION 7% RELATIONS (Région -> InternaPonal) 10% UTFMiP 10% ComposiFon du CéSO (30 membres)

PÔLES STRUCTURES PLATEFORMES

H-SHS MSHS-T PUD-T PROGEDO

DSPEG TSE Lab Exp

UPEE OMP DATA TERRA

BABS IFERISS, INSERM GENOTOUL MST2I FédéraPon FERMAT CALMIP SDM InsPtut de Chimie

Transversal ANITI Alliance dataNooS

Une représentaPvité large

(39)

REPRESENTATIVITE ORGANISATION INTERACTIONS (INTER)DISCIPL INAIRE/ PLATEFORME 53% DOCUMENTAT ION 20% FORMATION 7% RELATIONS (Région -> InternaPonal) 10% UTFMiP 10% ComposiFon du CéSO (30 membres) FEUILLE DE ROUTE ET COMMUNICATION SENSIBILISATION FORMATION ETAT DES LIEUX CHARTE FEUILLE DE ROUTE ET COMMUNI CATION SENSIBILI SATION

FORMATION ETAT DES LIEUX

CHARTE

Groupes de travail

(40)

REPRESENTATIVITE ORGANISATION INTERACTIONS (INTER)DISCIPL INAIRE/ PLATEFORME 53% DOCUMENTAT ION 20% FORMATION 7% RELATIONS (Région -> InternaPonal) 10% UTFMiP 10% ComposiFon du CéSO (30 membres) FEUILLE DE ROUTE ET COMMUNICATION SENSIBILISATION FORMATION ETAT DES LIEUX CHARTE FEUILLE DE ROUTE ET COMMUNI CATION SENSIBILI SATION

FORMATION ETAT DES LIEUX

CHARTE

Groupes de travail

OrganisaPon parPcipaPve

(41)

REPRESENTATIVITE

ORGANISATION INTERACTIONS

IN SITU EX SITU

(42)

Premières iniPaPves coordonnées

« 2021 : Année de la valorisaAon des données de la recherche toulousaine

et la Science Ouverte »

UNE PRIORITE :

INITIER UN ETAT DES LIEUX

SUR LES DONNEES DE LA RECHERCHE

TOULOUSAINE

Objec6f : Disposer d’un portail et d’une visibilité

UNE URGENCE :

(IN)FORMER SUR LA CONSTRUCTION

DES DMP

CYCLE DE VIE DE LA DONNEE Objec6f : Garan6r la qualité des données et la ges6on de leur cycle de vie

(43)

Premières iniPaPves coordonnées

• 

dataNoosphère :

– 

un écosystème autour des données

– 

Faire de la science ouverte un sujet de recherche

• 

Agora: Un groupe d’animaPon depuis 2018

– 

Faire émerger des besoins

– 

IdenPfier l’existant

– 

Favoriser des échanges

• 

Un groupe de travail et d’expérimentaPon

– 

Cas d’usage :

•  Données environnementales •  Données en aéronauPque

– 

Prototypes de composants d’une plateforme pour la science ouverte

h^ps://datanoos.univ-toulouse.fr/

(44)

AcPons en cours et IncitaPons

• 

Evénements déjà planifiés en 2021 (Love Data Week, OA

Week,

…) : ouverture à d’autres établissements

• 

AdaptaPon de formaPons et événements à de nouvelles

thémaPques disciplinaires

• 

Catalogue partagé des formaPons existantes

• 

Recueil des besoins auprès des chercheurs et partage de

bonnes praPques so

• 

Etat des lieux : cartographie des rôles/référents/

correspondants, des données, des infrastructures,

(45)

Echanges locaux et (inter)naPonaux

RelaPons directes insPtuPonnelles

• 

Les établissements du sites

(Présidents, VP Recherche, VP Numérique, Pôles, Stratégique scienPfique partagée)

RelaPons (par l’intermédiaires des membres locaux du CéSO) avec

• 

la mission « Calcul, données ouvertes » du CNRS

• 

la conférence des Présidents d’Universités (CPU)

• 

les collèges du Comité NaPonal pour la SO (CoSO) : collège

PublicaPon, contact Collège Données de la Recherche)

• 

certains groupes de la Research Data Alliance (RDA) (inter)naPonale

• 

des communautés naPonales bien avancés (SHS, Environnement,

Science du Vivant) et d’autres à co-construire

(46)
(47)

Ouvrir la Science

(48)

Ouvrir la Science

Une transformaPon qui nous concerne tous !

Une transiPon progressive qui nécessite

(49)

Vers ce^e ouverture …

Sensibiliser les personnels, établissements et

l’UFTMiP de la nécessité de se coordonner pour

ce^e ouverture des données et des praPques dans

un esprit :

• 

trans-, inter- et disciplinaire

• 

inclusif

• 

éthique

• 

d’équilibre

(50)

PERSPECTIVES

• 

Effort constant de communicaPon/

sensibilisaPon/formaPon

• 

Mise en réseau des compétences pour

accompagner la gesPon des données

• 

Appel à retour d’expériences

– 

«

Success Stories

» pour convaincre et valoriser

– 

«

Failed Stories

» pour orienter la réflexion et les

acPons prioritaires à mener

• 

Promouvoir le partage/l’ouverture

(51)

Déconfinons nos données et nos

praPques …

Parlons-en

et

Contactez-nous !

Nathalie Aussenac-Gilles, Pascal Gaillard, Michelle Sibilla

Comité de Réflexion pour le partage et la valorisa6on des données de la recherche et la coordina6on de la Science Ouverte à l’échelle de l’UFTMiP

pascal.gaillard@univ-tlse2.fr Nathalie.Aussenac-Gilles@irit.fr michelle.sibilla@irit.fr

Références

Documents relatifs

le texte ne révèle pas les conséquences tant pour l’entité prophète que pour l’ED, nous pouvons en déduire au terme de cette analyse que ces oracles du prophète contribuent

de même, ce sont dans leurs fondements que sont interrogées nos écoles d’architecture plus traditionnellement portées sur le « projet » lui-même (ses formes et ses fonctions,

C’est pour cela que, si nous étions cohérents dans la réalisation de l’égalité des chances, nous devrions donner à l’avenir des points supplémentaires,

Les résidus miniers contenant des minéraux sulfureux peuvent produire du drainage minier acide (DMA) lorsqu'ils sont en contact avec l'oxygène de l'air et l'eau et que

Figure 1 : Schéma du Jumelage Eolien — Diesel avec Stockage d'Energie sous forme d'Air Comprimé L'hybridation pneumatique d'un moteur Diesel consiste à introduire l'air comprimé à

Rappelant la conceptualité aristotélicienne de la catharsis, Tosel observe en effet qu’« il y aurait à s’interroger sur la dimension pédagogique (et esthétique

Cette deuxième étude a également confirmé l’importance du trouble de stress aigu comme facteur de risque au développement d’un TSPT chez une population de victimes

Néanmoins, pour ne pas réduire la complexité de cette recherche aux seuls aspects diachroniques (classe, race), et/ou à l’articulation des différences « visibles » de ces deux