• Aucun résultat trouvé

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

N/A
N/A
Protected

Academic year: 2022

Partager "Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics"

Copied!
15
0
0

Texte intégral

(1)

Big Data ? Big responsabilités !

Paul-Olivier Gibert

Digital Ethics

(2)

Big data le Buzz

Le Big Data ? Tout le monde en parle sans trop savoir ce qu’il signifie.

Les médias high-tech en font la nouvelle panacée, qui pourrait tour à tour, guérir les maladies, prédire l’avenir et révolutionner notre vision du monde, tandis que les réalisations effectives sont rares et généralement discrètes.

Un argument marketing pour remettre à jour et à la mode de vieux produits

(3)

Croissance des volumes de données disponibles

2.700.000.000.000 Gigaoctets,

c'est le volume de données qu'aurait amassé l'humanité depuis son existence en 2012

.

(source IDC)

Une croissance de 48% entre 2011 et 2012

90% sont constitués d’images, de vidéo et de musique

Majoritairement des données « non structurées »

Des données hétérogènes

(4)

Big data : des capacités à traiter de gros volumes de données hétérogènes

Ces volumes de données hétérogènes et véloces sont difficilement traitées avec les techniques classiques

De nouvelles techniques de traitement se sont développées permettant de commencer à lever ces verrous techniques :

Hadoop

Mape Reduce

Et de les exploiter avec une réelle facilité

Visualisation

Fouille de donnée

Analyse sémantique

Traitement de « données incertaines »

(5)

Big data : quelques définitions

Wikipédia : "expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent

difficiles à travailler avec des outils classiques de gestion de base de données

Décidéo : "données dont le volume, la vitesse de constitution, la variété (formats, sources), la variabilité (constance du sens dans le temps) rendent complexes voire impossible le traitement avec les techniques et capacités habituelles »

AAP Cloud 2012 : "Avec la croissance d’internet, de l’usage des réseaux sociaux, de la téléphonie mobile, des objets connectés et communicants, les informations sont aujourd'hui plus abondantes que jamais et la

croissance de leur production est chaque jour plus rapide."

(6)

Que retenir ?

Le big data est le traitement de données :

◦ Très volumineuses

◦ Hétérogènes

◦ Véloces

Nécessitant le recours à des techniques non conventionnelles

La question du big data est devant nous

(7)

Des enjeux économiques

Un marché du big data

◦ Nombreux investissements

◦ Offre de produits et de savoir faire

La donnée devient une matière première

◦ Sa réutilisation est source de revenu cf. Twitter

◦ Gestion de l’énergie

(8)

Une nouvelle attitude face à la donnée

La donnée tend à prendre une existence autonome

Internet des objets

Réutilisation des données

Les 8 lois du big data :

http://www.forbes.com/sites/davefeinleib/2012/07/24/big-data-trends/

Dont :

Les données ont une autre valeur (usage? ) que celui auquel vous pensiez en les collectant

Utilisez des données diverses

Appuyez vous sur les hommes

(9)

Des enjeux éthiques et de conformité

Ethique

Qui est propriétaire des données ?

Impact sur la vie privée

Impact sur les libertés individuelles

Attention aux algorithmes

 Conformité

Toutes les données sont elles des données personnelles ?

Respect Loi Informatique et libertés

Consentement

Finalité de la collecte et du traitement

Interconnexion de traitements

Proportionnalité

(10)

Le CIL face au Big Data

Distinguer le vrai big data et son utilisation marketing

Quatre points de vigilance cf. Charte Ethique et Big data de l’Aproged :

La description des données La traçabilité

La propriété intellectuelle

Les réglementations spécifiques à la nature des données traitées

(11)

Le CIL face au Big Data

 La description des données

◦ Quelles sont les données traitées ?

◦ Quelle est leur origine ?

◦ Qui en sont les producteurs ?

(12)

Le CIL face au Big Data

La traçabilité

Quels sont les différentes transformations réalisées ? Quelles sont les données intermédiaires produites ?

Quels sont les acteurs/ producteurs de ces traitements ?

(13)

Le CIL face au Big Data

La propriété intellectuelle

Quelles est le régime de propriété de ces données ? Quelles sont les licences applicables ?

(14)

Le CIL face au Big Data

Les réglementations spécifiques à la nature des données traitées

Outre la réglementation propre aux données personnelles, quelles sont les réglementations applicables ?

données financières ?

Données de santé ?

Informations protégées par un secret ?

(15)

Big Data ? Big responsabilités !

Merci !

Paul-Olivier Gibert

pogibert@digital-ethics.com

Digital Ethics

Références

Documents relatifs

Ainsi des problèmes communs se posent-ils à des disciplines fort éloignées, concernant par exemple l'accessibilité des données, leur cohérence lorsqu'elles

opportunities for the use of big data in government, including case studies in using big data sets for public health and the provision of health care [7, 8, 9]. However, despite

Roux Ludovic, Racoceanu Daniel, Loménie Nicolas, Kulikova Maria, Irshad Humayun, Klossa Jacques, Capron Frédérique, Genestie Catherine, Le Naour Gilles, N Gurcan Metin Mitosis

I Sequential text classification offers good performance and naturally uses very little information. I Sequential image classification also performs

Increasing access by integrating the media archives with European on-line digital portals in a digital preservation framework. O1 To research and develop means of ensuring

Bien qu’ils soient partisans de laisser parler les données, les auteurs nous préviennent: “nous devons nous garder de trop nous reposer sur les données pour ne pas

• Conception et mise en place de solutions distribuées pour différents types de Machine Learning tels que l’apprentissage supervisé et l’apprentissage non-supervisé. • La

• Naissance du métier de TIM dans les années 1990 avec la mise en place du PMSI. • Evolution du rôle et