Sujet de stage : traçabilité dans un Cloud collaboratif.
Mots-clefs : Cloud Computing, réseau sociaux, traçabilité, reporting, dashboard.
Partenaires du projet : CNRS (Université d’Orléans), EFREI (école d’ingénieurs).
Lieux du stage : EFREI (villejuif) et Université d’Orléans.
Stage rémunéré.
Durée du stage : 4 à 6 mois.
Contact : benoit.charroux@efrei.fr
Contexte du stage : la reproductibilité scientifique vise à vérifier si les résultants obtenus avec les mêmes méthodes sur un matériel de test identique fait dans des conditions différentes (différents opérateurs, différents équipements, différents laboratoires e/ou après différents intervalles de temps) sont les mêmes.
La recherche scientifique s’appuie de plus en plus sur des programmes informatiques pour démontrer la pertinence scientifique d’un travail de recherche, qui est d’apporter une nouvelle contribution à un problème donné. Cependant, la communication des résultats de recherche repose encore aujourd’hui sur des articles scientifiques qui n’incluent pas les programmes informatiques utilisés. Pour pallier cette lacune, RunMyCode (www.runmycode.org) est une plateforme de Cloud Computing qui permet à des chercheurs d’associer les programmes informatiques accompagnés de leurs données à des publications scientifiques. Les utilisateurs de RunMyCode peuvent reproduire les expériences scientifiques en relançant les programmes afin d’obtenir des résultats tout en modifiant les données. La contribution majeure au problème de la reproductibilité de RunMyCode est de limiter les efforts que les chercheurs ont à faire pour mettre à la disposition de la communauté scientifique leurs articles accompagnés de leurs programmes informatiques. En effet, les chercheurs accèdent à RunMyCode via une interface Web simple où il publie leurs articles, leurs programmes et les données associées ; la plateforme prend en charge le test des programmes, leurs déploiements sur une infrastructure de Cloud Computing ainsi que leur mise à disposition pour la communauté scientifique.
Sujet du stage : l’infrastructure Cloud de RunMyCode utilisée pour exécuter les programmes, de part la diversité des équipements matériels et des logiciels qui la compose, peut influer sur la reproductibilité des résultats. Par exemple, en arrondissant des valeurs numériques lors des calculs. Il convient donc de s’assurer que la non reproductibilité des résultats n’est pas due à l’infrastructure elle-même. Pour pouvoir déterminer la cause de la non reproductibilité, la traçabilité de toutes les actions qui ont été faites sur les programmes informatiques et les données des chercheurs manipulés par RunMyCode doit être totale. Ces manipulations peuvent être automatique (sans intervention humaine) ou faite par un opérateur humain. De plus, les opérateurs humains peuvent être nombreux car les programmes et les données sont mis à la disposition de toute une communauté scientifique qui constitue un réseau social de chercheurs autour de RunMyCode. Enfin, afin de pouvoir être analysées, toutes les traces produites doivent être consultables par des membres du réseau social de RunMyCode (des membres d’une communauté scientifique, ceux de l’équipe support de RunMyCode, etc.). Des rapports sur les traces doivent donc être générés et présentés aux utilisateurs d’une façon appropriée vis-à-vis du rôle qu’ils jouent dans RunMyCode.
Profil recherché : étudiant(e) de M2 en master. Connaissances en Cloud Computing et/ou Clustering souhaités.
Maîtrise en Java Enterprise Edition pour le développement d’applications Web et Java Script souhaitées.
Connaissances en technique de reporting (dans le domaine de la BI par exemple) appréciées.