• Aucun résultat trouvé

4. Enquête

4.2 Résultats

4.2.2 Résultats par questions

Les questions 1 à 4 sont des questions d’ordre général sur l’état de la problématique de la gestion des données de recherche dans les institutions suisses et les perspectives d’avenir.

Q1a. Dans votre activité professionnelle, êtes-vous confronté(e) à la problématique de la gestion des données de la recherche ?

Q1b. Dans quelle mesure pensez-vous y être confronté(e) d'ici 5 ans ?

Un tiers des participants à l’enquête est souvent confronté à la problématique de la GDR. D’après les réponses, cette proportion devrait approcher les 58% d’ici 5 ans. Environ la moitié des participants (32 personnes) y est actuellement confronté parfois et 12 participants

n’ont actuellement jamais affaire à la GDR. Une seule personne estime qu’elle ne sera pas confrontée à la GDR dans cinq ans, et 7 ne se prononcent pas.

Figure 2 : Confrontation à la problématique de la GDR

Q2. L'institution pour laquelle vous travaillez a-t-elle élaboré ou a-t-elle pour projet de développer une politique ou des bonnes pratiques pour la gestion des données de la recherche ? Si oui, précisez : Politique institutionnelle instaurée / Politique institutionnelle en

développement / Bonnes pratiques instaurées / Bonnes pratiques en développement

Nous avons décidé de ne pas traiter les réponses de cette question, en raison du nombre important d’incohérences, en particulier en regard des réponses obtenues à la Q15 (services développés par l’institution). Nous avons pris le parti d’éliminer complètement cette question, en faisant l’hypothèse que sa formulation a créé de l’incompréhension ou une lecture peu attentive.

Q3. Dans votre travail actuel, dans quelle mesure avez-vous un contact direct avec les étudiants et les chercheurs ?

En posant cette question, nous voulions vérifier dans quelle mesure les professionnels de l’information sont déjà impliqués dans des activités avec contact direct aux usagers, de type soutien, conseil et formation. Un gros tiers affirme ne pas prodiguer de soutien pour la GDR ou pour l’utilisation de jeux de données. Une proportion équivalente dit être souvent impliquée dans le service de recherche documentaire et dans les formations aux usagers (chercheurs, étudiants). On peut imaginer que ce sont ces mêmes personnes qui seront amenées à former les usagers à la GDR et verront probablement leurs activités de recherche documentaire s’élargir à la recherche de jeux de données réutilisables.

Par ailleurs, quelques personnes ont dit être en contact direct avec les étudiants et chercheurs pour d’autres activités : promotion/communication (3), coordination (1), questions de droits d’auteur (1), support technique (1) et acquisitions (2).

21 32 12 0 38 19 1 7 0 5 10 15 20 25 30 35 40

Souvent Parfois Jamais Je ne sais pas

Tableau 4 : Contact direct avec les usagers

Souvent Parfois Jamais

Soutien pour l'utilisation de jeux de données de recherche

9 21 35

Soutien à la gestion des données de recherche

13 19 33

Conseil en vue de publication 12 29 24

Archive institutionnelle (utilisation, dépôt)

28 20 17

Support bibliométrique (H-index, Impact factor)

6 18 41

Service de recherche documentaire 33 18 14

Formations (à l'utilisation de bases de données spécifiques, outil de gestion des références bibliographiques, etc.)

32 23 10

Guichet d'accueil (prêt, retours, etc.) 33 8 24

Q4a. Selon vous, quel rôle joue votre institution/service dans la gestion des données de la recherche ? (136 réponses)

Plusieurs réponses étaient possibles.

Q4b. Selon vous, quel rôle pourrait jouer votre institution/service dans la gestion des données de la recherche ? (223 réponses)

Plusieurs réponses étaient possibles.

Les questions portaient ici sur l’orientation en termes de services de l’institution au sein de laquelle travaillent les répondants. Si l’on peut estimer que les réponses de la première partie correspondent à la réalité (les gens savent quelle est l’orientation actuelle de leur institution), la seconde partie pourrait correspondre à la réalité (les gens savent vers quoi se dirigent leur institution à court/moyen terme) mais elle peut aussi exprimer une forme de souhait ou ce qui est de l’ordre du possible mais qui ne se réalisera pas forcément.

Selon l’avis des participants, les institutions auraient les capacités ou devraient se positionner plus ou moins sur tous les fronts. En effet, seules deux voix se sont exprimées pour « aucun service », alors que les domaines proposés « Conseil », « Formation », « Curation et Préservation », « Stratégie et Planification » et « Promotion » reçoivent tous entre 38 et 51 voix.

Néanmoins, à l’heure actuelle, les institutions sont relativement peu présentes pour les volets « Stratégie et Planification » et « Promotion », ainsi que pour « Curation et Préservation », bien que dans une moindre mesure.

Figure 3 : Positionnement perçu de l'institution/service pour la GDR

Q5a. Je connais le type de données produites par les chercheurs de mon institution / ma faculté.

Moins d’un tiers des répondants ne connaissent pas le type de données produites par les chercheurs de leur institution. Ce constat n’est pas alarmant dans la mesure où ils n’en ont probablement pas besoin pour l’instant, ou n’en auront peut-être jamais besoin.

Figure 4 : Connaissance du type de données produites par les chercheurs de

l’institution/la faculté

Q5b. Êtes-vous d'accord avec la proposition suivante ? Je suis en mesure d'évaluer les pratiques des chercheurs en ce qui concerne la gestion des données de recherche

Les réponses à cette question sont relativement hétérogènes. La balance penche quand même du côté du non, avec 10 personnes qui estiment qu’elles ne sont plutôt pas capables d’évaluer les pratiques des chercheurs et 22 qui estiment qu’elles n’en sont pas du tout capables. 8 personnes ont préféré ne pas répondre. Du côté du oui, 6 personnes sont tout à fait aptes à l’évaluation des pratiques de GDR et 19 s’estiment plutôt aptes.

33 27 24 17 17 17 51 47 43 38 41 2 0 10 20 30 40 50 60

Conseil Formation Curation et Préservation Stratégie et Planification Promotion Aucun Présent Hypothétique 30.77% 50.77% 18.46%

Non, je ne connais pas

Oui, je sais de quoi il s'agit

Oui, je sais de quoi il s'agit et je suis capable de l'expliquer à un tiers

Figure 5 : Aptitude à évaluer les pratiques des chercheurs

Q6a. Je connais les principes fondamentaux de curation digitale ainsi que le cycle de vie des données

Ici, 30 participants ont affirmé savoir de quoi il s’agit (46%), 14 les connaitre et être capable de les expliquer à des tiers (22%), et 21 ont dit ne pas les connaitre (32%). Cette répartition est assez similaire à la distribution des réponses de la Q5a.

Q6b. Je connais les exigences des bailleurs de fonds pour le traitement et le partage des données de la recherche

Une moitié des participants affirme ne pas connaitre les exigences des bailleurs de fond pour le traitement et le partage des DR. En comparaison avec la question précédente, il nous parait logique que la proportion des « non, je ne connais pas » augmente, puisque la question porte sur un aspect plus spécifique.

Figure 6 : Connaissance des principes fondamentaux et des exigences de bailleurs

de fonds

6 19 10 22 8 0 5 10 15 20 25

Tout à fait d'accord Plutôt d'accord Plutôt en désaccord Tout à fait en désaccord Sans réponse 14 30 21 11 21 33 0 5 10 15 20 25 30 35

Oui, je sais de quoi il s’agit et je suis capable de les expliquer à

des tiers

Oui, je sais de quoi il s’agit Non, je ne connais pas

Q7a. Êtes-vous d'accord avec la proposition suivante ? Je peux aider les chercheurs à préparer un plan de gestion des données de la recherche

Q7b. Êtes-vous d'accord avec la proposition suivante ? Je suis capable d'établir les métadonnées nécessaires et pertinentes pour décrire des jeux de données

Ces deux questions ont suscité une répartition des réponses quasi identique. Seules quelques personnes de plus se sentent capables de définir les métadonnées pour des jeux de données. On aurait pu s’attendre à ce que la différence soit plus grande : en effet, contribuer à la préparation d’un DMP est une compétence qui requière une connaissance plus large de la problématique de la GDR que l’attribution de métadonnées. Nous soupçonnons un manque d’assurance plutôt qu’un manque de compétence de certains répondants pour cette question sur l’attribution de métadonnées. Il est également possible que des personnes ne soient pas conscientes qu’elles peuvent transférer les connaissances qu’elles ont déjà à la description de jeux de données de la recherche.

Quatorze personnes ont précisé les standards de métadonnées qu’ils utilisent le plus fréquemment. Les standards les plus cités sont : Dublin Core (4x), METS (3x), DDI (2x), DOI, ISAD-G (2x), OAIS (2x), PREMIS (2x)13.

Figure 7 : Aptitudes à aider les chercheurs au DMP et à établir les métadonnées

pour des jeux de données

Q7c. Il m'arrive de faire de la modélisation de données

Seules trois personnes font souvent de la modélisation de données, 11 en font parfois et 51 n’en font jamais.

13

Le détail se trouve dans l’annexe 13 Résultats bruts de l’enquête.

7 11 19 20 8 9 13 19 16 8 0 5 10 15 20 25

Tout à fait d’accord Plutôt d'accord Plutôt en désaccord Tout à fait en désaccord

Sans réponse

Q8a. Dans votre activité professionnelle, quel(s) type(s) de données avez-vous l'habitude de manipuler ou de décrire ? (254 réponses)

Plusieurs réponses étaient possibles.

Pour cette question, les participants avaient la possibilité de cocher autant de réponses que souhaité. Le tableau ci-dessous montre que les données textuelles sont les plus habituelles avec 52 occurrences, puis les bases de données (37 occurrences), talonnées par les données matérielles et physiques (36 occurrences). Les données numériques comptent 30 occurrences.

Tableau 5 : Type(s) de données manipulées

Données textuelles 52 Bases de données 37 Données matérielles et physiques 36 Données numériques 30 Numérisation (scans) 20 Images, photographies 19 Vidéo 17 Audio 12 Codes source, langages de programmation 9 Applications, logiciels, programmes informatiques 8 Aucun 7 3D, modèles, visualisation 5

Q8b. Quel(s) dépôt(s) utilisez-vous pour stocker les données de la recherche ? (80

réponses)

Plusieurs réponses étaient possibles.

Ici, seuls 8 répondants (12%) ont fait l’effort de spécifier leurs réponses, alors que cela était explicitement demandé. La question comportait des catégories à cocher ainsi qu’un espace pour entrer du texte à côté avec la consigne « cochez la ou les réponses et spécifiez ». Un bon tiers (33,9%) des répondants n’effectue aucun stockage de DR. Près de la moitié (49,2%) dit stocker des DR dans une archive institutionnelle. Ce chiffre semble refléter la logique d’utilisation des archives institutionnelles déjà en place pour les DR. De plus, il souligne le lien fort entre Open Access et Open Data, tel qu’il a été exprimé par l’écrasante majorité des participants de l’enquête à la Q18.

Douze personnes (18,5%) utilisent un ou des dépôts externes, 9 ont coché autre et 5 le

cloud14.

Tableau 6 : Dépôts utilisés pour les DR

Archive institutionnelle 32 Aucun 22 Dépôt externe (repository) 12 Autre 9 Cloud storage 5

Q8c. Quelle(s) manipulation(s) effectuez-vous sur les données de la recherche ? (209

réponses)

Plusieurs réponses étaient possibles.

Les résultats suivants sont les occurrences pour les manipulations effectuées sur les données de recherche. Sans trop de surprise, les actions le plus souvent menées sont également les moins complexes parmi la liste que nous avions proposée. Ainsi, la collecte, la vérification, la saisie, la description et le stockage obtiennent le plus d’occurrences. La valeur « aucune » reçoit 31 occurrences, ce qui signifie que sur 65 personnes, 31 n’effectuent aucune manipulation sur des DR (48%), et que les 34 personnes restantes (52%) se partagent les occurrences distribuées ci-dessous.

Tableau 7 : Action(s) effectuées sur les données

Aucune 31 Collecter 24 Vérifier 20 Saisir 19 Décrire 19 Stocker 17 Numériser 13 Valider 12 Interpréter 11 Migrer vers un meilleur format 11 Nettoyer 7 Migrer vers un support approprié 7 Analyser 7 Transcrire 5 Reconstituer des données incomplètes ou corrompues 3 Dériver 1

Q9. Quelle(s) action(s) êtes-vous en mesure d'effectuer afin de protéger les données de la recherche ? (118 réponses)

Plusieurs réponses étaient possibles.

Sur les 65 participants, 33 ne sont en mesure d’effectuer aucune action en vue de préserver et protéger les données de recherche. Parmi les 32 autres, 22 sont capables de sélectionner et d’appliquer les techniques de curation et préservation (33,9%), 20 savent gérer les droits d’accès (30,8%) et 19 savent établir des procédures pour assurer le respect des droits d’auteurs et de l’intégrité des données (29,2%). Des manipulations plus spécifiques, comme le chiffrage de données, l’anonymisation et même la destruction sont moins répandues.

Tableau 8 : Capacité à effectuer des mesures de protection des données

Aucune 33 Sélectionner et appliquer les techniques de curation et de

préservation

22

Gérer les droits d'accès 20 Établir des procédures pour assurer le respect des droits d'auteurs

et de l'intégrité des données

19

Détruire des données 10 Anonymiser les données 9

Chiffrer les données 5

Q10a. Je connais les critères de sélection des jeux de données à conserver

Q10b. Quelle valeur êtes-vous en mesure de déterminer pour un jeu de données ? (80

réponses)

Plusieurs réponses étaient possibles.

Ces deux questions portaient sur l’évaluation des données de la recherche. Ainsi, 37 participants (56,9%) admettent ne pas connaitre les critères de sélection des DR à conserver, alors que 22 (33,9%) disent savoir de quoi il s’agit et 6 (9,2%) pensent les connaitre et être capables de les expliquer à des tiers.

Figure 8 : Q10a. Connaissance des critères de sélection pour la conservation

D’autre part, 30 participants (46,2%) ont déclaré ne pouvoir déterminer aucune valeur pour un jeu de données. 26 participants (40%) se sont dit en mesure de déterminer sa valeur scientifique, chiffre qui chute à 17 (26,2%) pour sa valeur légale et à 7 (10,8%) pour sa valeur économique.

Q10c. Êtes-vous d'accord avec la proposition suivante ? Je suis conscient des coûts liés aux activités de curation des données de la recherche

Les réponses concernant la connaissance des coûts liés aux activités de curation digitale sont assez disparates : 8 personnes ne se prononcent pas, 18 personnes sont soit tout à fait

en désaccord, soit plutôt d’accord, 11 sont tout à fait d’accord et 10 plutôt en désaccord.

Q11a. Dans mon activité professionnelle, je suis amené(e) à : (125 réponses)

Plusieurs réponses étaient possibles.

Ici, les participants étaient invités à rendre compte des types d’activités de gestion (au sens large) dans lesquels ils sont actuellement impliqués, sans que cela ne se restreigne à la GDR.

Tableau 9 : Activités de gestion

Aucune de ces options 25 Contribuer à la coordination des pratiques entre institutions 23 Identifier les ressources et les risques éventuels auxquels mon

service pourrait être confronté

23

Gérer les ressources (humaines, technologiques, financières) de mon service

20

Faire valoir les activités de curation digitale à mes supérieurs 18 Gérer les risques éventuels (humains, technologiques, financiers) de

mon service 16 6 22 37 0 5 10 15 20 25 30 35 40

Oui, je sais de quoi il s’agit et je suis capable de les expliquer à

des tiers

Q11b. Je connais la responsabilité légale de mon institution pour les activités de curation digitale

40% des répondants se sont dit au courant de la responsabilité légale de l’institution pour laquelle ils travaillent en matière de curation digitale, 8% très au fait, et 52% pas au courant.

Q12a. Je connais des politiques pour la publication des données de la recherche émises par certaines revues scientifiques

60% des répondants connaissent plus ou moins bien des politiques de publication émises par des revues scientifiques (31 « oui je sais de quoi il s’agit » et 8 « oui je sais de quoi il s’agit et je suis capable de les expliquer à des tiers ») et 40% n’en connaissent pas.

Q12b. Êtes-vous d'accord avec la proposition suivante ? Je suis capable d’aider des tiers à citer les données de la recherche

Q12c. Êtes-vous d'accord avec la proposition suivante ? Je sais où trouver des jeux de données utiles aux chercheurs de mon institution / ma faculté

Les participants ont évalué de manière quasi identique leur aptitude à prodiguer des conseils pour la citation correcte des DR et à savoir où aller chercher des données de recherche réutilisables pour les chercheurs de leur institution. Un peu plus de la moitié des répondants (près de 54%) se sentent capables d’aider des tiers à citer les données de la recherche et savent où trouver des jeux de données utiles aux chercheurs de leur institution.

Figure 9 : Aptitudes à aider à la citation et à rediriger les chercheurs pour l'utilisation

de jeux de données

Q13. Lesquels des sites et outils suivants connaissez-vous ?

En proposant une question sur les sites et outils de référence pour la GDR, nous voulions avoir un aperçu de l’étendue de connaissance, même par ouï-dire, de ces derniers. Les participants avaient la possibilité de sélectionner certains sites et outils parmi une liste en précisant s’ils les connaissent ou non, ou s’ils les utilisent.

Le tableau récapitulatif ci-dessous montre qu’un peu plus de la moitié des répondants sont familiers d’Openresearch.ch, ORCID et CrossRef. En revanche, la majorité ne connaît pas

14 21 12 14 4 13 22 12 14 4 0 5 10 15 20 25

Tout à fait d’accord Plutôt d'accord Plutôt en désaccord

Tout à fait en désaccord

Sans réponse

les autres outils listés. Les participants ont été invités à citer d’autres sites et outils qu’ils connaissent ; 10 personnes se sont prêtées à cet exercice15.

Tableau 10 : Sites et outils de référence

Je ne connais pas Je connais Je connais et j'utilise

DataCite 39 23 3 Zenodo 41 20 4 DataVerse Network 58 6 1 FORS 38 24 3 Openresearchdata.ch 32 28 5 ORCID 30 27 8 CrossRef 30 25 10 ePIC 59 5 1 ISNI 58 6 1 DataDocumentation Initiative (DDI) 53 9 3 DMPOnline 56 5 4

Q14. Quels sont les aspects qu'une formation sur les données de la recherche devrait couvrir pour vous être utile ? Attribuez des points de 1 à 4 aux sujets suivants (1= pas

important et 4= très important)

En plus des questions destinées à jauger le niveau d’activités et de connaissances liées à la GDR, cette question était une façon directe de demander leurs besoins en formation aux participants. Il s’agissait d’attribuer des points à des grandes catégories en fonction de leur utilité dans le cadre d’une formation.

Les thèmes étaient parfois assez larges, comme Sécurité et évaluation par exemple, car l’idée était d’éviter de noyer les participants dans une liste sans fin. Les sujets qui ont récolté le plus de points sont, dans l’ordre, Standards et bonnes pratiques, Dépôts et données

réutilisables, Pratiques et besoins des chercheurs, Sécurité et évaluation, Publication, Responsabilités légales et éthiques, Métadonnées, qui obtiennent tous un score de plus de

220, avec un très faible taux de points non distribués (les sans réponses). Les thèmes qui obtiennent le score le plus bas sont Business Plans, Modèles conceptuels, Data Citation et

Impact, et ce sont également ceux pour lesquels il y a eu le plus d’abstention.

Il s’avère que ces aspects considérés comme les moins importants sont aussi les plus abstraits, alors que ceux qui obtiennent les plus de points sont très orientés vers le concret (Standards et bonnes pratiques, Dépôt et données réutilisables, Pratiques et besoins des

chercheurs).

15

De façon générale, les participants ont considéré la plupart des thèmes importants ou très importants et ont donc attribué des notes hautes (3 ou 4 points) plutôt que des notes basses (1 ou 2 points).

Figure 10 : Thèmes souhaités dans une formation

206 228 193 185 241 200 224 229 225 226 192 156 188 226 4 1 3 6 1 5 2 1 0 0 4 7 5 2 0 50 100 150 200 250 300 Data Identification Pratiques et besoins des chercheurs Exigences de bailleurs de fonds Modèles conceptuels Standards et bonnes pratiques Plan de gestion Métadonnées (modélisation, description, manipulation) Dépôts et données réutilisables Responsabilités légales et éthiques Sécurité et évaluation Gestion des risques Business plans Data citation et impact Publication des données

Id en ti fy Sco p e P la n Sto re P ro te ct Ev al u ate M an ag e P ro vi d e

15. Quels sont les services de votre institution ?

Pour déterminer les services actifs ou en projet dans les institutions des participants au sondage, nous avons proposé une liste de 17 services avec la possibilité de dire s’ils existent, si leur développement est en projet ou s’ils ne sont pas envisagés. Parmi ceux-ci, une partie est spécifique aux DR, alors qu’une autre partie consiste en des services autres mais qui pourraient s’étendre à la GDR. Nous avons laissé la possibilité de ne rien répondre en soupçonnant que tous les répondants ne sont pas forcément au courant de tous les projets de l’institution dans laquelle ils travaillent. A noter que les chiffres correspondent aux nombres de participants (65) mais pas nécessairement à un nombre d’institutions. En effet, il n’est pas exclu que plusieurs collaborateurs de la même institution aient répondu à l’enquête.

Ces résultats montrent que les services actuellement les plus répandus sont le Dépôt

institutionnel pour le partage des données et le Service de conseil pour trouver et citer les données (27 oui chacun), talonné par la Gestion d’un dépôt (26 oui) – logiquement liée à

l’existence-même des dépôts–. Viennent ensuite la Formation et sensibilisation des

chercheurs et doctorants et l’Archivage à long terme (24 oui chacun). L’Infrastructure pour le

Documents relatifs