École thématique
BIG DATA
Flux d'information et constitution des connaissances scientifiques
Organisée par Anouk Barberousse (STL/Université Lille 1) 23-26 septembre 2013
Université Lille 3, Maison de la recherche (Bât. F)
Description du projet :
Depuis que les ordinateurs ont des capacités de stockage importantes et que les données des appareils de détection et de mesure transitent nécessairement par eux, on observe une augmentation considérable de la quantité des données disponibles pour la recherche. Les expressions de « déluge de données » et
« avalanche de données », de même que « big data » sont devenues courantes. Plusieurs domaines de la recherche sont concernés, et en particulier les disciplines issues de la génomique (protéomique, etc., qui élaborent des méthodes d'expérimentation à haut débit) et celles qui étudient le changement climatique (dont la physique de l'atmosphère). Ainsi des problèmes communs se posent-ils à des disciplines fort éloignées, concernant par exemple l'accessibilité des données, leur cohérence lorsqu'elles sont hétérogènes, la pérennité de leur stockage, et plus généralement leur interprétation et leur utilisabilité pour résoudre des questions scientifiques. Un autre aspect concerne le travail en équipe : dans ces domaines, les informaticiens sont souvent des intermédiaires indispensables entre le chercheur et ses données. Cela soulève des questions concrètes d'organisation du travail scientifique, de transmission des informations et des compétences.
Le projet de l'école est d'identifier plus précisément les problèmes soulevés par le caractère gigantesque des masses de données disponibles et d'offrir la possibilité d'un dialogue interdisciplinaire, éclairé par une perspective d'histoire et de philosophie des sciences. En effet, les intervenants de ce domaine auront pour tâche de replacer ces développements récents sur des échelles de temps plus longues et dans la vaste diversité des méthodologies mises en oeuvre dans les différentes branches de la science.
Modalités pédagogiques :
Après la journée introductive, les trois autres journées de l'école se dérouleront selon le format suivant : - le matin, un intervenant fait un exposé qui présente un aspect majeur des big data ; une plage conséquente (d'une heure à une heure trente) est réservée aux discussions avec les participants.
- l'après-midi, les participants se partagent en petits groupes pour travailler collectivement sur des thèmes liés aux big data, qui auront été présentés lors de la première journée. Chaque groupe (de 4 ou 5 participants) choisit un thème, qu'il gardera toute la durée de l'école. L'après-midi du dernier jour sera consacré à la restitution de ce travail collectif, sous forme de projets d'articles.
Des exemples de thèmes pour le travail en atelier se trouvent en annexe de ce programme.