• Aucun résultat trouvé

Big data

N/A
N/A
Protected

Academic year: 2022

Partager "Big data"

Copied!
3
0
0

Texte intégral

(1)

École thématique

BIG DATA

Flux d'information et constitution des connaissances scientifiques

Organisée par Anouk Barberousse (STL/Université Lille 1) 23-26 septembre 2013

Université Lille 3, Maison de la recherche (Bât. F)

Description du projet :

Depuis que les ordinateurs ont des capacités de stockage importantes et que les données des appareils de détection et de mesure transitent nécessairement par eux, on observe une augmentation considérable de la quantité des données disponibles pour la recherche. Les expressions de « déluge de données » et

« avalanche de données », de même que « big data » sont devenues courantes. Plusieurs domaines de la recherche sont concernés, et en particulier les disciplines issues de la génomique (protéomique, etc., qui élaborent des méthodes d'expérimentation à haut débit) et celles qui étudient le changement climatique (dont la physique de l'atmosphère). Ainsi des problèmes communs se posent-ils à des disciplines fort éloignées, concernant par exemple l'accessibilité des données, leur cohérence lorsqu'elles sont hétérogènes, la pérennité de leur stockage, et plus généralement leur interprétation et leur utilisabilité pour résoudre des questions scientifiques. Un autre aspect concerne le travail en équipe : dans ces domaines, les informaticiens sont souvent des intermédiaires indispensables entre le chercheur et ses données. Cela soulève des questions concrètes d'organisation du travail scientifique, de transmission des informations et des compétences.

Le projet de l'école est d'identifier plus précisément les problèmes soulevés par le caractère gigantesque des masses de données disponibles et d'offrir la possibilité d'un dialogue interdisciplinaire, éclairé par une perspective d'histoire et de philosophie des sciences. En effet, les intervenants de ce domaine auront pour tâche de replacer ces développements récents sur des échelles de temps plus longues et dans la vaste diversité des méthodologies mises en oeuvre dans les différentes branches de la science.

Modalités pédagogiques :

Après la journée introductive, les trois autres journées de l'école se dérouleront selon le format suivant : - le matin, un intervenant fait un exposé qui présente un aspect majeur des big data ; une plage conséquente (d'une heure à une heure trente) est réservée aux discussions avec les participants.

- l'après-midi, les participants se partagent en petits groupes pour travailler collectivement sur des thèmes liés aux big data, qui auront été présentés lors de la première journée. Chaque groupe (de 4 ou 5 participants) choisit un thème, qu'il gardera toute la durée de l'école. L'après-midi du dernier jour sera consacré à la restitution de ce travail collectif, sous forme de projets d'articles.

Des exemples de thèmes pour le travail en atelier se trouvent en annexe de ce programme.

(2)

PROGRAMME

Lundi 23 septembre 2013

14h : accueil des participants

15h : exposé d'introduction par Anouk Barberousse :

« Réflexion historique et philosophique sur l'avènement des grandes quantités de données » 16h45 : pause café

17h : présentation des ateliers par Julie Jebeile et Pierre-Alain Braillard

Au cours de cette séance, les participants sont invités à se répartir en petits groupes pour le travail en atelier des jours suivants.

Mardi 24 septembre 2013

9h-12h : exposé de Vincent Israel-Jost :

« Le tournant numérique » 12h : déjeuner libre

14h-18h : travail collectif en petits groupes

Mercredi 25 septembre 2013

9h-12h : exposé de Jacques Descloitres :

« Fouille de données et gestion des connaissances : des outils pour les chercheurs en génomique et en physique de l'atmosphère ? »

12h : déjeuner libre

14h-18h : travail collectif en petits groupes

Jeudi 26 septembre 2013

9h-12h : « Histoire naturelle : collections informatisées et banques de gènes »

12h : déjeuner libre

(3)

14h-16h : présentation des résultats des ateliers 16h : pause café

16h30 : évaluation de l'école 17h30 : fin de l'école

Annexe : Thèmes des ateliers

T

HÈME

A : P

ROBLÈMESDEMÉTHODOLOGIE

1. « Data-driven sciences » versus « hypothesis-driven sciences ».

2. Concernant les « data-driven sciences »

T

HÈME

B :

L

UTILISATEUR FACEAUXDONNÉES

1. Quantité versus gain épistémique 2. Formats de présentation des données

3. Sélection de données à des fins d’accessibilité cognitive 4. « Les » utilisateurs face aux données

T

HÈME

C : S

TOCKAGEETÉCHANGEDESDONNÉES

1. Diminution de données 2. Stockage et classification

3. Le problème de la standardisation 4. Partage des données

5. Impact sur les modalités de publication scientifique

T

HÈME

D : P

ARTICULARITÉSDISCIPLINAIRES

Références

Documents relatifs

Développer chez eux un certain nombre de qualités d'ordre intellectuel, moral et caractériel qui leur font malheureusement trop souvent défaut, et dont l'absence

Plus précisément, la communication présente une étude sur l’écart d’âge entre conjoints à partir de données extraites d’un site de rencontres en

• Naissance du métier de TIM dans les années 1990 avec la mise en place du PMSI. • Evolution du rôle et

Christine Sybord déplace ainsi la réflexion relative à la responsabilité des praticiens vers l’hypothèse d’une responsabilité médicale étendue au patient, dans le contexte

Increasing access by integrating the media archives with European on-line digital portals in a digital preservation framework. O1 To research and develop means of ensuring

Pour les trois villes, 179 personnes reconnaissent le rôle des organisations syndicales dans l’amélioration de la mobilité des travailleurs.. 25 personnes ont répondu par

En France, le gourvenement a mis en place de nombreuses campagnes de prévention routière pour diminuer le nombre d’accidents.. Elles visent à sensibiliser les conducteurs pour

création de données et des technologies qui permettent de les traiter afin d’en retirer de l’information;..  Passage d’une société industrielle à une société