• Aucun résultat trouvé

Big Data. Challenges Big Data Faire de la France un leader mondial du Big Data

N/A
N/A
Protected

Academic year: 2022

Partager "Big Data. Challenges Big Data Faire de la France un leader mondial du Big Data"

Copied!
16
0
0

Texte intégral

(1)

Challenges Big Data

Faire De la FranCe un leaDer monDial Du Big Data Dossier de presse

2 décembre 2014

(2)
(3)

6

Rappel du contexte Big Data 9

Exemples de projets Big Data soutenus par l’État

(4)

Les Challenges Big Data en dix questions

Qu’est-ce Qu’un challenge Big Data ?

Un « challenge Big Data » est un concours à l’attention des startups, qui utilise des jeux de données mis à disposition par de grandes entreprises ou des entités publiques. En exploitant ces jeux de données, les startups peuvent développer des solutions techno- logiques innovantes et de nouveaux cas d’usage et de services, ou encore aider à la création de nouveaux modèles économiques. Les challenges sont généralement d’une durée de 3 à 12 mois et permettent de sélectionner un ou plusieurs lauréats. Certains challenges peuvent prendre la forme de hackathons1.

PourQuoi les challenges Big Data ?

L’augmentation considérable du volume et de la diversité des données numériques gé- nérées, couplée aux technologies d’analyse du big data, offre d’importantes opportu- nités de création de valeur pour les sociétés de nombreux secteurs économiques. Le lancement des Challenges Big Data permet de favoriser des démarches d’innovation ouverte entre, d’une part, des entreprises ou entités publiques détenant des données exploitables, et d’autre part des startups ou PME fournisseurs de technologies inno- vantes. Ces challenges représentent une opportunité pour faire émerger des solutions radicalement nouvelles pour tous les acteurs.

Quelles sont les initiatives sélectionnées ?

Cinq initiatives bénéficient d’un soutien de l’État pour le lancement des Challenges. Ces initiatives sont portées par des animateurs, qui sont des entités ayant vocation à animer des écosystèmes d’innovation (pôle de compétitivité, accélérateur, etc.) dans la mise en place de « challenges big data ». Le rôle de ces animateurs est double :

- identifier des entreprises « sponsors » et les accompagner dans la définition et la struc- turation de leurs challenges ;

- mobiliser les écosystèmes de startups innovantes pour répondre aux challenges.

Les 5 animateurs sélectionnés sont : le pôle de compétitivité Cap Digital (accompagné de ses partenaires infrastructures, technologiques, animation et fournisseurs de don- nées), l’association parisienne NUMA, l’association rhônalpines Lyon Urban Data (avec le Cluster Edit et l’accélérateur Axeleo), le pôle de compétitivité lillois Euratechnolo- gies (avec le Centre d’Innovation des Technologies sans Contact EuraRFID et l’agence EuraSanté) et un projet commun porté par le pôle de compétitivité rennais Images &

Réseaux, et la collectivité Montpellier Agglomération.

Quels exemPles D’aPPlication sont attenDus ?

Plus de 55 challenges seront lancés grâce au soutien de l’État, dans des domaines très va- riés. À titre d’exemple, les challenges permettront de développer les nouveaux services sui- vants :

- nouveaux services proposés aux chômeurs à partir des données de pôle emploi ;

- nouveaux services urbains pour améliorer le quotidien des citoyens (« Ville Intelligente ») ; - nouvelles solutions innovantes dans le domaine de la cyber-sécurité (prévention plus effi- cace des attaques) ;

- prédiction des risques de diabète en fonction de différents facteurs.

1. hackathon : événement temporaire collaboratif réunissant des développeurs et créateurs, organisés par équipes, pour pro- duire des prototypes dans le cadre d’un objectif précis.

(5)

Quels sont les critères De sélection ?

La sélection des initiatives retenues s’est faite sur la base des critères suivants : caractère innovant et retombées économiques des challenges proposés, niveau d’engagement des sponsors (mise à disposition de jeux de données pertinents notamment), règles de partage équitable de la propriété intellectuelle.

Quel intérêt Pour les granDs grouPes « sPonsors » ?

Les challenges permettront de favoriser la transformation numérique des entreprises

« sponsors » de challenges. Grâce à l’accompagnement des animateurs, elles pourront trouver les meilleurs acteurs innovants pour les accompagner dans le développement de nouveaux services Big Data. Elles pourront ainsi améliorer la compétitivité de leurs offres ou de leurs processus grâce à une meilleure exploitation de leurs données.

Quel intérêt Pour les start-uPs ?

Les challenges permettront de faciliter l’accès des start-up du Big Data à des jeux de données d’acteurs privés ou publics, afin d’implémenter leurs offres technologiques. Ce faisant, elles pourront développer des partenariats dans la durée avec des entreprises détentrices de données, partenariats dont elles pourront se servir comme « première référence ».

En fonction du besoin identifié par le sponsor, les lauréats pourront bénéficier d’un sou- tien publicsur leurs travaux de R & D.

Quels autres soutiens PuBlics sont moBilisés Pour favoriser le Déve- loPPement Du Big Data ?

En complément des challenges, l’État soutient également des projets de R & D indus- trielle dans le domaine du Big Data. Ces projets visent en premier lieu à favoriser le développement d’une offre technologique française ; ils sont en règle générale portés par des startups ou PME engagées dans un projet ambitieux de croissance. Les projets visent également à répondre aux grands défis applicatifs du Big Data.

L’État a également soutenu la mise en place d’une plate-forme d’expérimentation mu- tualisée, à l’attention des PME et startups du secteur.

Quel est le rôle Du Programme D’investissements D’avenir et Du commissariat général à l’investissement ?

Le Programme des Investissements d’Avenir (PIA) est un programme d’investissement lancé en 2010, doté de 47 milliards d’euros, qui vise à investir – en période de crise – dans des filières de croissance pour la France. Le PIA est organisé en 5 programmes, dont celui sur l’Economie Numérique qui finance les challenges Big Data.

Le Commissariat Général à l’Investissement est une équipe rattachée au Premier Mi- nistre, en charge de superviser la mise en œuvre du PIA.

Quels sont les montants investis Par l’état en faveur Du DéveloP- Pement Du Big Data ?

Au total, l’État a mobilisé près de 60 M€ pour soutenir le développement à la fois d’une offre technologique française de Big Data et le développement de nouveaux usages in- novants dans différents secteurs économiques.

(6)

Rappel du contexte Big Data

Le Big Data correspond à un phénomène de croissance très forte des flux de données numériques due à l’usage accru des nouvelles technologies. En effet, avec la crois- sance d’internet, de l’usage des réseaux sociaux, de la téléphonie mobile, des objets connectés et communicants, l’information est aujourd’hui plus abondante que jamais et sa croissance est chaque jour plus rapide. Le monde crée ainsi en deux jours autant de données que toute l’humanité en a créées pendant deux mille ans.

Les enjeux liés au Big Data sont considérables, tant sur le plan économique que pour garantir un espace numérique protecteur de la vie privée et des libertés fondamentales.

Le Big Data induit ainsi une transformation majeure dans l’usage du numérique par les entreprises de tous les secteurs économiques. À titre d’exemple, de nombreux usages du Big Data apparaissent dans des domaines aussi variés que la santé, le tourisme et la grande distribution. En termes d’emplois, l’enjeu du Big Data est de créer ou consolider de l’ordre de 137 000 emplois, soit directement dans l’industrie informatique, soit dans les fonctions technologiques au sein des entreprises, soit dans les fonctions métiers (par exemple les fonctions de vente) des entreprises.

Le caractère disruptif de l’innovation introduite par la diffusion du Big Data dans un champ toujours plus large de domaines industriels ouvre enfin d’importantes oppor- tunités de création de valeur et de différenciation, notamment pour les startups et les PME du numérique. Le marché des activités liées au Big Data a représenté en France environ 1,5 milliards d’euros en 2014, et atteindra près de 9 milliards d’euros d’ici 2 020.

Face à ces enjeux, les pouvoirs publics mobilisent l’ensemble des leviers dont ils dis- posent pour positionner la France comme le pays de référence dans le domaine du Big Data, à travers quatre leviers principaux Via le Programme des Investissements d’Avenir, l’État a facilité l’organisation de « challenges » permettant à des entreprises tradition- nelles de mettre leurs données à disposition d’entreprises innovantes. l’état a égale- ment mobilisé près de 60 m€ pour soutenir le développement à la fois d’une offre technologique française et de nouveaux usages innovants dans diverses filières indus- trielles. En outre, les pouvoirs publics favorisent le développement d’un écosystème compétitif dans le domaine du Big Data, en favorisant la formation de « data scientists » et, enfin, en adaptant le cadre législatif et réglementaire à l’émergence des traitements de données massifs.

(7)

l’état soutient le DéveloPPement De nouveaux usages Du Big Data, afin D’accomPagner les entrePrises Dans leur

transformation numériQue

L’ensemble des secteurs industriels vont être transformés par les technologies du numé- rique. Le Big Data est l’une de ces technologies génériques ayant un enjeu disruptif sur l’économie française particulièrement important. Des secteurs comme l’assurance, la grande distribution, l’industrie automobile, ou encore l’énergie sont amenés à connaître des évolutions importantes de leur chaîne de valeur sous l’effet du Big Data.

Accompagner les entreprises dans leur transformation numérique grâce au Big Data constitue l’enjeu principal du plan « Big Data » de la Nouvelle France Industrielle, pi- loté par MM. Paul Hermelin et François Bourdoncle. La feuille de route du plan iden- tifie des initiatives sectorielles concrètes, qui visent à accélérer le développement de la demande, i.e. des usages du Big Data, dans des domaines variés : assurances, smart city, santé… À travers le Programme des Investissements d’Avenir, l’État soutient plusieurs expérimentations d’usages de ce type.

Il convient en outre de favoriser la coopération entre entreprises détentrices de données et startups innovantes, dans une démarche d’« innovation ouverte ». Il s’agit là d’un facteur décisif pour faire émerger de nouveaux leaders mondiaux dans le domaine du Big Data et pour permettre aux industriels de gagner en compétitivité grâce au numé- rique et à l’exploitation des données.

Les sponsors de ces challenges seront variés et comprennent de grands groupes comme Axa, La Poste, Pôle Emploi, Vinci Energie ou EDF.

Cette dynamique vient compléter le programme engagé dans le Concours Mondial d’In- novation, dont un des 7 thèmes est justement le Big Data.

C’est une brique essentielle de la transformation numérique de notre économie.

Afin d’atteindre cet objectif, l’état soutient des entités ayant vocation à animer des écosystèmes d’innovation (pôle de compétitivité, accélérateur, etc.) dans la mise en place de « challenges big data » : il s’agit de concours à l’attention de startups, qui utilisent des jeux de données mis à dispo- sition par de grandes entreprises. grâce au soutien de l’état, plus de 55 challenges seront lancés dans le cadre de 5 initiatives.

(8)

l’état soutient le DéveloPPement D’une offre technologiQue française Dans le Domaine Du Big Data

Au-delà des usages, l’État a soutenu, avec le Programme des Investissements d’avenir plusieurs projets pour développer des entreprises porteuses de solutions particulière- ment innovantes et capables de saisir ces nouvelles opportunités économiques : ces en- treprises sont souvent des startups ou des PME engagées dans une croissance rapide.

Les projets retenus couvrent un large éventail de problématiques technologiques : conception conjointe d’architectures avec les applications du « Big Data », outils et méthodes pour l’exploitation de grandes masses de données, réponses apportées à de grands défis applicatifs… Ces projets regroupent une grande variété d’acteurs : concep- teurs de systèmes informatiques, éditeurs de logiciel, intégrateurs de technologies, la- boratoires de recherche et un nombre important de startups et PME innovantes.

L’État a également soutenu la mise en place d’une plate-forme d’expérimentation mutua- lisée, à l’attention des PME et startups du secteur du Big Data. Celles-ci peuvent ainsi s’ap- puyer sur des moyens de test, comparaison et vérification à l’échelle des problèmes traités.

l’état DéveloPPe les formations Dans le Domaine Du Big Data

Le Big Data est un domaine qui va susciter une demande rapidement importante de profils connus sous le nom de « data scientist », à même d’appréhender à la fois les mé- thodes statistiques, mathématiques et informatiques dans le cadre d’un contexte métier particulier. Le système éducatif français doit donc s’adapter en conséquence.

La France disposant d’excellents enseignements en mathématiques, statistiques et infor- matique, elle a le potentiel de former des « data scientists » au meilleur niveau interna- tional.

Des initiatives ont d’ores et déjà été lancées, comme par exemple à l’Institut Mines- Télécom ou au Groupe des Ecoles Nationales d’Economie et Statistique. Le sujet de la formation de « data scientists » fera l’objet de développements dans les prochains mois.

l’état vise à Promouvoir une aPProche resPonsaBle et éthiQue Du Big Data

Pour ce faire, le Ministère travaille avec la CNIL pour accompagner les différents acteurs dans une démarche d’utilisation des données protectrice de la vie privée et des libertés fondamentales de chacun. L’objectif est que la protection des données ne soit pas un obstacle mais un facteur de la confiance dans ces nouveaux services

L’État et la CNIL s’engagent ainsi dans la voie de la certification de processus industriels complets liés à des scenarios détaillés d’usage et de croisement de données. Seront définis des « Packs de conformité » par type d’usage à l’intérieur de chaque « écosys- tème industriel » impacté par le Big Data. Ces « packs » contiendront les règles qui per- mettent de certifier un processus industriel. Les deux premiers secteurs prioritaires dans lesquels seront mis en œuvre ces « packs » seront l’assurance et le véhicule connecté.

(9)

Exemples de projets Big Data soutenus par l’État

Via le Programme des Investissements d’Avenir, l’État a mobilisé 60 M€ pour soutenir des projets industriels dans le domaine du Big Data. Cet effort se poursuivra en 2015, notamment avec le soutien à de nouveaux challenges et la seconde phase du Concours Mondial d’Innovation 2 030.

« challenges Big Data »

La mise en place de challenges vise un double objectif :

- Favoriser la transformation numérique des entreprises et des entités publiques, qui mettent des jeux de données à disposition d’un écosystème d’acteurs dans un modèle

« d’innovation ouverte », afin de répondre à une problématique ou à un besoin précis (par exemple, apport de solutions techniques innovantes ou développement de nou- veaux cas d’usage et services) ;

- Faciliter l’accès des start-up du Big Data à des jeux de données d’acteurs privés ou publics, afin de créer des partenariats dans la durée.

Les projets sont portés par des entités ayant vocation à animer des écosystèmes d’inno- vation (pôle de compétitivité, accélérateur, etc.).

Au total, il est prévu que plus de 55 challenges soient lancés grâce au soutien des pou- voirs publics.

nom du projet Partenaires Description

cap Digital – challenges Big Data

Partenaires : Cap Digital (chef de file), systematic Paris région, Finance innovation, institut mines télécom, armadillo, Bluestone, Cnes, Dassault systemes, Dataiku, Five By Five, oVh, internet memory, research, agorize.

sponsors : axa, Pole emploi, les echos, la Poste, CDC Propriété intellectuelle, Bouygues

Cap Digital adopte ici une approche sur-mesure pour chaque sponsor, dans la définition précise du Challenge, dans son format, sa durée, dans les moyens techniques à mettre en œuvre pour son exécution. les premiers sponsors comme aXa ou Pôle emploi pourront présenter leur contexte particulier et leur besoin (réponse à une problématique de l’assurance ou challenges plus ouverts sur la thématique de l’emploi par exemple), que ce soit dans la typologie de ses données, dans le volume de données à traiter, ou dans la pertinence de croiser ses données privées avec d’autres données privées ou publiques.

Data shaker numa

thématique média : aFP, l’Équipe

thématique smart City : Vinci Énergie, Ville de Paris, sFr, snCF, orange, Dirif, setec

Data shaker est un dispositif axé sur l’expérimentation autour de données, dont l’objectif est de créer un cadre de collaboration durable entre :

- des porteurs de projets qui développent de solutions innovantes, mais qui manquent parfois de cas d’usage pour tester, valider leur projet ;

- un écosystème business qui dispose de ressources (notamment des datas) et de cas pratiques et qui a intérêt à soutenir l’émergence d’un écosystème d’acteurs travaillant sur ses problématiques.

Dans le cadre de l’ami Big Data, numa portera des programmes Data shaker autour de 2 grandes thématiques : média et smart City.

(10)

soutien au DéveloPPement De nouveaux usages Du Big Data

La capacité à exploiter les données pour en tirer de la valeur deviendra un enjeu majeur de compétitivité pour l’ensemble des acteurs économiques. Tous les secteurs sont en effet susceptibles d’en bénéficier, et de nombreux usages apparaissent dans des do- maines aussi variés que la santé, le tourisme et la grande distribution. Dans l’industrie, un impact est attendu dans toutes les phases clés : conception, production, qualité, mar- keting et distribution.

L’État soutient donc des projets visant au développement de nouveaux services inno- vants du Big Data.

nom du projet Partenaires Description

les données au service de la ville intelligente – projet commun montpellier/

rennes

chefs de file : images

& réseaux (chef de file administratif) et montpellier agglomération

sponsors : 3Ds, rennes métropole, iBm, universités montpellier 1 et montpellier 2, l’iDate.

les deux métropoles de montpellier et rennes ont choisi le thème des données utilisées pour la gestion des villes (les transports et la mobilité, l’énergie, l’environnement) comme sujet d’organisation des challenges destinés à faire émerger par les entreprises des applications innovantes qui utilisent à la fois des données ouvertes ou accessibles des métropoles partenaires et les possibilités des deux plateformes (plateforme temps réel de pilotage urbain (iBm) et plateforme 3DeXPerienCity (Dassault systèmes).

lille’s Data, au cœur des Big Data

chef de file : euratechnologies Partenaires : le CitC – eurarFiD et eurasanté sponsors : stormshield, siriC onColille

la cyber-sécurité et la e-santé sont deux enjeux majeurs pour notre société, le premier pour garantir à chacun d’évoluer dans un monde numérique en toute confiance, le second pour développer une médecine encore plus proche du patient et de ses attentes. les technologies du « Big Data » sont à même d’apporter des réponses à ces enjeux par une valorisation judicieuse de volumes de données gigantesques. les challenges organisés dans le cadre de lille’s Data mettront à contribution l’excellence et l’esprit d’innovation de start-up du numérique pour explorer ces pistes de progrès.

smart Data challenges : comment les Big Data se mettent au service du « smart living » ?

l’association lyon urban Data qui porte le lieu d’innovation par l’expérimentation : le tuBa

‘tube à expérimentations urbaines (Chef de File) l’accélérateur de startup du numérique aXeleo le cluster eDit premiers sponsors :

· sFr

· Canal tP (Keolis)

· gDF-sueZ

· eDF

· soPra

le projet smart Data Challenges a pour objectif de mettre le Big Data au service du smart living en faisant émerger des produits ou services autour des nouveaux services urbains, de l’habitat, de la santé, de la citoyenneté, de la culture, du tourisme du e-commerce,… Ce consortium organisera, sur 3 ans et en s’appuyant sur la plateforme de données du grand lyon, une dizaine de compétitions de startup venant de toute la France autour de la valorisation des données des grands donneurs d’ordre du territoire.

les startups sélectionnées pourront travailler étroitement avec eux sur la mise en œuvre d’expérimentations

« business » en vue de collaboration commerciale en cas de succès. les lauréats pourront bénéficier en outre d’un accompagnement pour les aider à mieux formaliser leur proposition de valeur, valider leur stratégie de développement et rencontrer des investisseurs publics et privés.

(11)

thématique nom du projet Partenaires Description Biotechnologies Biodatacloud Biogemma (chef de file)

· sysFera

· institut Français de Bioinformatique (iFB) représenté par les plates- formes :

• Institut de Biologie de Chimie des Protéines de lyon (iBCP)

• Université de Bordeaux – Centre génomique Fonctionnelle (CgFB)

• CNRS – IRISA Rennes - (genouest)

• INRA Toulouse – (GenoToul)

• INRA Jouy en Josas - (Migale) - institut de recherche informatique de toulouse (irit) représentant l’institut national Polytechnique de toulouse (inPt)

le projet BioDataClouD a pour objectif, au travers d’un partenariat public/

privé, de développer une plateforme de services informatiques en réponse à la problématique BigData dans le domaine des biotechnologies végétales (secteur de la génétique et de la génomique végétale) : elle permettra d’amener la bio- informatique, appliquée à l’amélioration des plantes, à l’ère du Cloud Computing.

la plateforme sera ainsi développée sur le thème de la gestion et de l’analyse des données de génétique et de séquençage à haut débit (ngs).

la plateforme se veut également suffisamment flexible pour accueillir des applicatifs métiers correspondant à d’autres secteurs de recherche.

Paiement eBoB 2.0 (e-Business optimization with Big data)

• b-pack (chef de file)

• BPM-Conseil

• Laboratoire d’Informatique Fondamentale de marseille (liF)

• EURECOM

• SecludIT

• Vivadour

la prédiction des dépenses et recherche des meilleures conditions d’achat pour les entreprises sont les enjeux de ce projet.

elles pourront piloter leurs dépenses en utilisant des solutions « Purchase to Pay » qui seront optimisées grâce au projet eBoB 2.0 en utilisant des analyses Big Data (analyses de tendances et des aides à la prise de décision basées sur les données internes et externes à l’entreprise).

marketing fanvoice (anciennement

« innovagora »)

alfstore (Chef de File), temis, edifixio, adelit, institut mines télécom.

sponsors : Citroën, groupe altyor

FanVoiCe est un outil de campagnes marketing de co-création (ou « social product innovation »), qui vise à faire participer activement, via les réseaux sociaux, les futurs utilisateurs potentiels d’un nouveau produit dans la conception de celui-ci.

la plateforme permettra d’aider les marques à mieux comprendre les attentes de leurs clients grâce à une analyse de leurs besoins.

marketing sodatech 1000mercis (chef de file), ecole normale supérieure de Cachan, institut mines telecom

le projet soDateCh a pour objectif de créer des outils permettant aux entreprises de rapprocher l’ensemble des données de leurs clients (données d’achat, carte de fidélité, lieu de résidence etc.) avec celles issues des réseaux sociaux (mentions « j’aime » sur Facebook, tweets…) et donc :

- de mesurer et de suivre l’efficacité des stratégies marketing déployées, - et proposer des stratégies innovantes de relations clients fondées sur des algorithmes de recommandations.

Cette plateforme de « social Crm » clé en main propose permet aux marques d’avoir une relation très personnalisée avec leurs clients.

(12)

thématique nom du projet Partenaires Description assurance square Predict arrow group Chef de file.

editeur du Crm open source square solution pour mutuelles et assureurs

isthma : editeur spécialiste dans la fouille de données et visualisation de résultats Digital & ethics : Cabinet de conseil spécialiste en déontologie et l’éthique des affaires

liPaDe : laboratoire d’informatique de l’université Paris Descartes

liPn : laboratoire

d’informatique de l’université Paris nord

laris : laboratoire de recherche en informatique et système de l’ecole internationale des sciences du traitement de l’information (eisti)

square Predict est un projet open source d’analyse décisionnelle visant à valoriser et monétiser l’énorme quantité de données des assureurs.

l‘objectif de square Predict est de générer des prédictions utiles au business des assureurs à partir de leurs données croisées avec les données Big Data issues du Web sémantique, de l‘open Data et des réseaux sociaux.

tourisme tourinflux syllabs (Pme, chef de file) aProgeD (association) l3i (laboratoire public) Proxem (Pme)

le tourisme représente plus de 6 % du PiB national et internet prend une part prépondérante dans la promotion touristique. les données sont au coeur de la création de nouveaux services pour attirer de nouveaux visiteurs et faire découvrir de nouveaux centres d’intérêt.

grâce à des technologies Big Data et sémantiques, tourinflux collecte, analyse et rassemble les données touristiques disponibles sur un territoire : données provenant du web (avis, etc.) ou des institutionnels (offices de tourisme, etc.). tourinflux fournira des données enrichies pour les développeurs et des observatoires pour les décideurs.

maintenance

préventive WenDelin • Nexedi (Chef de file)

• GDF Suez

• Abilian

• 2nd Quadrant

• Institut Mines Télécom

• INRIA

• Université de Paris 13 et le soutien de :

• Mitsubishi Motors (Russie)

• Woelfel (Allemagne)

WenDelin développera une solution

« marque France » de Big Data

industriel à partir de logiciels open source reconnus mondialement.

Deux premières applications sont prévues : la maintenance préventive des éoliennes et la maintenance préventive des automobiles. Dans les deux cas, le Big Data permet de prédire une panne avant qu’elle

survienne et d’améliorer ainsi la qualité du service rendu aux usagers.

ouverture des données

xData eDF, orange, la Poste, Data Publica (chef de file), Hurence, Quantmetry, INRIA, telecom Paristech

le projet XData vise à montrer l’intérêt du croisement de données de sources diverses pour de nouveaux usages (applications, analyses et visualisation) sur les thématiques de la mobilité, de la densité et de la consommation de services en France. les données utilisées sont celles des partenaires eDF, la Poste et orange, croisées aux données open data et aux données des réseaux sociaux.

une attention particulière est portée au problème de la protection des données personnelles dans le cadre de ce projet.

(13)

soutien au DéveloPPement D’une offre technologiQue française Dans le Domaine Du Big Data

L’État soutient des projets qui visent au développement d’entreprises porteuses de solu- tions particulièrement innovantes, capables de saisir ces nouvelles opportunités écono- miques, en premier lieu des startups ou PME engagées dans un projet ambitieux de croissance.

Exemples de projets :

thématique nom du projet Partenaires Description

composants logiciels

Datalyse laboratoires/universités :

• 3 équipes du LIG (Laboratoire d’informatique de grenoble), INRIA, Université Joseph Fourier,

laboratoire d’informatique Fondamentale de lille, ( liFl), laboratoire informatique robotique microélectronique de montpellier (lirrm), université de montpellier 2 ( um2), inria saclay entreprises :

• STIME/Les Mousquetaires eolas/Business & Decision (Chef de File)

le projet Datalyse vise à créer des composants logiciels (les Datalyseurs) permettant de faciliter la manipulation de bout en bout des données de masse (générées par des objets ou des utilisateurs), pour les transformer en information actionnable.

les Datalyseurs sont de nature variée et complémentaire : Préparation des données, analyse de données, modèle prédictif…

4 cas d’usages sont menés en parallèle pour fournir l’expression de besoins et les jeux de données, mais aussi concevoir, développer, intégrer et valider les Datalyseurs :

• Efficacité énergétique et pilotage prédictif du réseau d’un Data Center

• Open Data

• Marketing Digital

• Comportement consommateur Grande Distribution

calcul haute Performance

Datascale Chef de file : Bull nom des partenaires : activeeon, armadillo, Bull, Cea list, Cea Dam, inria, institut de Physique du globe de Paris (iPgP), linkfluence

sa mission principale est de développer les synergies entre les domaines du Big Data et du calcul haute performance (ou hPC - high Performance Computing), et plus concrètement de développer des briques technologiques Big Data qui viendront enrichir l’écosystème hPC.

le projet s’attachera en outre à évaluer l’intérêt de ces briques technologiques en réalisant des démonstrateurs basés sur des cas réels d’application dans les domaines de la détection d’événements sismiques, de la gestion de grands clusters hPC et de l’analyse de données multimédia.

analyse iKats an

innovative toolKit for analyzing time series

Chef de file : cs si Partenaire : le laboratoire d’informatique de grenoble (Université Joseph Fourier)

le projet iKats a pour objectif de fournir des outils logiciels génériques spécifiquement dédiés à la manipulation, l’analyse et la visualisation de grandes masses de séries temporelles complexes issues de réseaux de capteurs. il s’agit de construire un environnement collaboratif adapté à des utilisateurs non experts du data mining en repoussant les limites quantitatives actuelles des algorithmes d’apprentissage sur ce type de données.

(14)

thématique nom du projet Partenaires Description nuage occiware open Wide (Chef de File),

inria (coordination scientifique), activeeon sa, Csrt (Cloud, systèmes, réseaux et télécoms), institut mines- télécom/télécom sudParis, linagora gso, obeo, oW2 Consortium, Pôle numérique, Université Joseph Fourier – grenoble

le projet oCCiware vise à proposer un cadre formel et outillé pour la gestion de toute ressource en nuage, de la modélisation à l’exécution, en s’appuyant sur le standard open Cloud Computing interface (oCCi). l’objectif est de baisser le coût d’entrée et décloisonner les différents domaines du Cloud Computing : Data Center, déploiement, Big Data, données liées.

architecture

ouverte reQuest thales communications &

security, thales services, orange labs, snCF, aldecis, altic, isthma (groupe Viseo), syllabs, talend et les laboratoires académiques eriC (université lyon 2), liP6 (Paris), limsi/Cnrs/iles (orsay), laBri (inria Bordeaux), l2ti (Paris 13), utt (troyes)

Le projet REQUEST va permettre d’implémenter : une architecture ouverte, dédiée à la gestion des données, aux algorithmes d’analyse et de visualisation des techniques de gestion des données, fondée sur les nouvelles bases de données ; des techniques innovantes de requêtage ; des algorithmes adaptés au traitement de données massives, hétérogènes et dynamiques (données structurées, données non structurées et grands graphes) ; et des techniques de visualisation analytique et interactive, permettant aux utilisateurs d’investiguer les données.

les résultats sont mis en œuvre sous forme de services « REQUEST », dans le cadre de trois chaînes de traitement dédiées aux applications de la sécurité et des transports intelligents : développés en étroite collaboration avec les utilisateurs finaux du projet (gendarmerie, Police, orange, thales et snCF), et en prenant en compte les enjeux éthiques, juridiques, sociétaux et économiques

Plateforme

décisionnelle speedData at internet (chef de file) laBri (laboratoire public de recherche en informatique rattaché à l’université de Bordeaux)

Ce projet a pour objectif de développer et de fournir une plateforme décisionnelle en mode saas offrant des analyses de données inédites en s’appuyant sur une technologie innovante et compétitive qui répondra aux nouveaux enjeux du Big Data : stockage, exploitation et interprétation de données massives et hétérogènes. un site web consacré au projet a été mis en place (http://events.

atinternet.com/speed-data/). il est régulièrement mis à jour en fonction des avancées et des publications.

Plateforme r & D teralaB institut mines technologique, genes

la plate-forme de r & D collaborative sur le big data, teralaB, réunit des moyens de traitement, des corpus de données, des logiciels d’analyse et peuvent expérimenter sur une teramachine (innovation accélérant l’accès du calcul à de gros volumes de données). Chercheurs et entreprises peuvent y accèder en mode cloud pour expérimenter des applications, perfectionner les algorithmes d’analyse ou tester des nouveaux logiciels applicatifs.

la version définitive, avec la,

(15)
(16)

sec.senum-presse@cabinets.finances.gouv.fr

www.economie.gouv.fr

Références

Documents relatifs

This is done through BDI’s Semantic Data Lake and components like SANSA 1 which performs analytics on semantically structured RDF data by providing out-of-the-box scalable

Concr` etement Hive transforme une requˆ ete HiveQL en des jobs MapReduce pour op´ erer sur les donn´ ees sous un format particulier dans le syst` eme de fichier HDFS. Vous

Based on Big Data technologies, the platform enables new potentials in terms of data analytics and applications development, with the ability to scale up seamlessly from one

“Lack of Sufficient Resources (BDAB3), “Data Scalability (BDAB10), and Lack of Data Integration and Management (BDAB12)” were medium significant barriers, while barriers such as

Ainsi, le Code civil et le Code de la santé publique dotent la personne dont sont issues les données génétiques de droits fondamentaux à l’occasion de la réalisation d’un test

Bien qu’ils soient partisans de laisser parler les données, les auteurs nous préviennent: “nous devons nous garder de trop nous reposer sur les données pour ne pas

Pour un usage de ces données en sociologie du couple, voir (Bergström 2016)...

I Sequential text classification offers good performance and naturally uses very little information. I Sequential image classification also performs