• Aucun résultat trouvé

Corpus et données numériques de la recherche

N/A
N/A
Protected

Academic year: 2022

Partager "Corpus et données numériques de la recherche"

Copied!
5
0
0

Texte intégral

(1)

dayClic();2

Date : 10 mai 2016

Lieu : Maison de la Recherche Germaine Tillion de l'Université d'Angers Thème/Titre :

« Corpus et données numériques de la recherche : enjeux et méthodologies de la captation à la valorisation »

Présentation :

Comment faire de la recherche avec des données de plus en plus numériques, issues du web, des réseaux sociaux, des bases de données, voire du « bigData » ? Il est désormais courant en effet que les données collectées et/ou produites dans le cadre des projets de recherche (textes, images, sons, vidéos, données d'enquêtes, données chiffrées, etc.), soient de plus en plus numériques et

« massives » en termes de volume. Mais qu'est-ce que la « numérisation » de la donnée de recherche, entendue ici dans une acception large, implique à tous les niveaux de la fabrique de la recherche ? Quelles sont les méthodologies, les techniques, les dispositifs à mettre en œuvre et les droits à respecter pour capter, traiter, analyser, exploiter et valoriser des données ? Et quid du

« crowdsourcing » ? Cette numérisation des sources et des données de recherche, des procédés de captation à leur représentation, n'est-elle pas en train de modifier profondément la manière dont le chercheur conçoit, envisage et pratique la recherche ? Cette mutation n'opére-t-elle pas en effet une transformation de la relation entre les sciences humaines et sociales, les sciences de l'information, les sciences informatiques et les sciences de l'ingénieur de plus en plus amenées à collaborer, au sens plein du terme ?

Durant cette journée dayClic, il s'agira d'aborder l'ensemble de ces questions – et de toutes celles qui en découlent – , à travers deux interventions le matin et trois ateliers l'après-midi dédiés à la discussion et au débat à partir de retours d'expérience.

Le format « dayClic(); » ?

Le format « dayClic » est une manière d'accompagner les chercheurs à la transition numérique.

"dayClic" vise en effet à créer une configuration dynamique de (d'info)formation à l'interface entre SHS et STIC, entre chercheurs et ingénieurs, et entre théories et pratiques sur des thèmes qui sont nécessairement liés au numérique, au sens large du terme. Chaque « dayClic » tente d'apporter des réponses à des questionnements pratiques, techniques, métholodologiques, technologiques, fondamentalement numériques, tout en les inscrivant dans un contexte scientifique, un débat, une actualité, un questionnement, une problématique dans laquelle le thème de la journée prend tout son sens. Organisée en deux temps, la matinée est généralement consacrée à 2 (ou 3) interventions qui amènent à repositionner le thème de la journée en rapport à un état de la question, à une actualité ou une tendance lourde, et à apporter de cette manière des éléments de réflexion et de compréhension sur des questions que pose le numérique, au sens large du terme, dans la recherche. L'après-midi est destiné à des ateliers de mise en pratiques qui peuvent prendre la forme d'initiation à de la manipulation d'outils (numériques, informatiques), à des débats et des discussions techniques à partir de retours d'expériences, de foire aux questions, etc., qui permettent à tout un chacun des participants de discuter sur leur propre objet, sujet, problème.

(2)

« dayClic » 1 : Numérique, droit d'auteur, droits voisins et données de la recherche

Une première « dayClic » a eu lieu le 22 octobre 2015 à l'occasion de l'Open Access Week (http://corist-shs.cnrs.fr/DayClicOAW_2015). Sur le thème du droit d'auteur et des droits voisins appliqués aux données de la recherche, cette journée, labellisée Action Régionale de Formation par la DR 17, a permis de réunir une quarantaine de chercheurs et d'ingénieurs de différentes disciplines sur des questions que posent aujourd'hui les données numériques par rapport au droit d'auteurs et aux règles de l'open access. Cette journée avait été l'occasion, justement, de relever, entre autres, la grande difficulté aujourd'hui de définir précisément ce que recouvrent les « données numériques de la recherche », et a fortiori les droits qui s'en rapportent, et nous avions conclu sur la nécessité de se pencher sur la question.

La « dayClic » n°2 – EnjeuX « données numériques » -, nous donne l'occasion d'aborder cette question, et plus précisément sur la manière de faire de la recherche avec des données numériques.

En effet, nombre de chercheurs et d'ingénieurs font très souvent remonter des besoins en termes d'accompagnement sur les données numériques de la recherche – notamment dans le cadre du programme EnJeu[x]. Comment faire, comment procéder ? Qu'est-ce que le numérique oblige, contraint le chercheur à acquérir, à développer, à orienter dans l'ensemble des process de la fabrique de la recherche ? Et qu'est-ce que cela veut dire que de travailler avec/sur des données numériques en termes de droits ? Actuellement, il est par exemple de plus en plus fréquent que les institutions européennes ou nationales de la recherche demandent l'élaboration d'un « plan de gestion de données » (PGD) qui nécessitent des compétences certaines dans le domaine numérique pour décrire au plus près les modalités de captation à celles visant la pérennisation et la réutilisation des jeux de données hors du contexte dans lequel ils ont été élaborés et utilisés. C'est là une conséquence de cette transformation que le numérique opère dans l'univers de la recherche, en SHS et ailleurs, et qui demande, au-delà même des données, de s'interroger sur le plus petit bagage numérique nécessaire pour que le chercheur ou l'ingénieur puisse encore agir. A défaut d'acquisition de ce minima supposé, une des solutions à l'avenir n'est-elle pas de réfléchir sur la frontière entre les SHS et les STIC qui nécessite qu'elle soit redéfinie au profit d'approches interdisciplinaires assumées ? Il y a là tout un ensemble de questions à la fois théoriques et pratiques sur les enjeux et les méthodologies à mettre en oeuvre autour des données numériques qui touchent au fondement même de la recherche.

Programme (en cours d'élaboration)

(c) = intervenant-e confirmé-e (a) = en attente de confirmation 9h00 – 9h30

• Café accueil des participants.

9h30 – 12h30

9h30 – 9h45 • Introduction à la dayClic « EnjeuX données numériques » : Stéphane Loret - Pôle Numérique de la MSH, Benjamin Hervy - projet EnjeuX.

(3)

9h45 – 10h45 • Francis André, Directeur Adjoint de l'Information scientifique et technique, IR CNRS (titre d'intervention à préciser) (c)

10h45 – 11h45 • Pascale Kuntz, Professeure en Informatique, École Polytechnique de l'Université de Nantes, LINA, équipe DUKe (titre d'intervention à préciser) (c)

12h00 – 12h30 • Discussions avec les participants autour des thèmes abordés par les intervenants du matin.

12h30 - 13h45

• Déjeuner, buffet 14h00 – 17h30

14h00 – 15h00 •

Atelier 1 : Capter, stocker les données

• François Vignale, conservateur, membre du laboratoire 3LAM : (titre d'intervention à préciser) (c)

• Vladimir Ritz, doctorant en droit privé, Université de Nantes, IRDP (titre d'intervention à préciser) (c)

15h00 – 16h00 • Atelier 2 : Traiter, analyser

• Damien Hamard, docteur en Archivistique, (titre d'intervention à préciser) (c)

• un chercheur, doctorant du LINA (a)

16h00 – 17h00 • Atelier 3 : Exploiter, valoriser

Daniel Bourrion, conservateur des bibliothèques, responsable de la bibliothèque numérique et de l'informatique au SCD de l'Université d'Angers, animateur du site face- ecran.fr, membre du Lab'UA (titre d'intervention à préciser) (c)

• Matthieu Quantin (Ecole Centrale de Nantes) : exploiter des données d'archives, le cas du projet des Salons Mauduit de Nantes (c)

17h30

• Conclusion de la journée et clôture de la session dayClic et mise en perspective.

Partenariat

• Maison des Sciences de l'Homme Ange-Guépin

• Programme de recherche EnjeuX – Enfance et Jeunesse

• Délégation Régionale du CNRS Bretagne et Pays de la Loire.

• Université d'Angers

• Université de Nantes

• Université du Mans.

(4)
(5)

Références

Documents relatifs

The Immunology Database and Analysis Portal (ImmPort) system was developed under the Bioinformatics Integration Support Contract (BISC) Phase II by the Northrop Grumman

La plupart des gens permettent l’utilisa- tion de données médicales identifiables pour la recherche, incluant le jumelage de données, en autant qu’un comité d’éthique

Vous trouverez de nombreuses autres manifestations sur le site de la SCF : www.societechimiquedefrance.fr,

Il est possible de déposer des données de recherche sur HAL (images, vidéos, sons, cartes) soit comme données supplémentaires qui apparaissent en annexe de vos dépôts d’articles

I nauguré en octobre 2014 1 , Pandor, puissant outil d’inter- rogation et de valorisation des ressources numériques, permet de localiser et d’accéder à un ensemble de données,

Cette démonstration présente une solution performante de désidentification de données texte selon 13 types d’entités nommées et entraînée sur des données issues de la

Nicolas Belorgey plaide dans son article pour un « véritable accès aux données de santé », permettant de pouvoir utiliser à la fois les données individuelles issues

Nous avons retenu celles de l’OCDE [1] : les donn´ ees de la recherche sont d´ efinies comme des enregistrements factuels (chiffres, textes, images et sons - auxquelles on ajoute