• Aucun résultat trouvé

Introduction to Data Science

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction to Data Science"

Copied!
5
0
0

Texte intégral

(1)

Introduction to Data Science

1

Qu’est-ce que la Data Science ?

Ensemble d’outils et de techniques et qui permettent de collecter, nettoyer, transformer, analyser et tirer parti des données afin d’en dégager des enseignements.

Définition

Mathématiques (statistiques, probabilités, modélisation)

Programmation informatique (Python ou R)

Réseau (Architecture Cloud, API, etc) Compétences requises

(2)

Introduction to Data Science

2

Les facteurs de l’essor de la Data Science

Explosion de la génération des données sur le web (GAFAM, BATX..) et grâce aux objets connectés

Grosse capacité de stockage des données grâce à l’écosystème Big Data

Augmentation considérable de la puissance de calcul

Baisse exponentielle des coûts de stockage et de calcul

(3)

Introduction to Data Science

3

Les métiers de la Data Science

Data Scientist

Data Analyst

Data Engineer

DevOps

Métier

(4)

Introduction to Data Science

4

Le cycle de vie d’un projet en Data Science

Collecte des données

Data Visualisation

Déploiement Exploration des données

Modélisation

• Etude de l’existant

• Définition des données

• Statistiques descriptives

• Pré-visualisation des

• Cloud

Définition de la problématique

• Définition des besoins est des objectifs

(5)

Introduction to Data Science

5

Focus sur la gouvernance et la qualité des données

Définition des politiques de gouvernances des données:

Rôles et Responsabilités

Processus métiers et données associées

Définition et implémentation des contrôles de la qualité des données

Revue périodique et/ ou automatique de la qualité des données

Rôle de Chief Data Quality Officer

Références

Documents relatifs

→ Borne inférieure : on ne peut pas faire mieux (#P-difficile sans borne sur la largeur d’arbre) Caractérise les conditions sur la structure des données probabilistes qui permettent

capteurs en tout genre, compteurs en tout genre (´ electrique, etc.), v´ ehicules, ´ electro-m´ enager Open data des institutions, des entreprises. horaires, statistiques sur les

capteurs en tout genre, compteurs en tout genre (´ electrique, etc.), v´ ehicules, ´ electro-m´ enager Open data des institutions, des entreprises. horaires, statistiques sur les

Récupérer, mélanger, enrichir, filtrer, nettoyer, vérifier, formater, transformer des données.. Mettre en œuvre une méthode un modèle (ML/Stats) Arbre de décision,

32 L’atelier présenté et discuté dans cet article a été proposé à des enseignants du supérieur, en formation continue, dans le cadre de deux dispositifs

En effet, les options fiscales sont bien plus variées : impôt sur le revenu (IR) ou option pour l'impôt sur les sociétés (IS), capital faible ou fort, comptabilisation

Dr CHANELIERE, Dr RICHET, Dr FIGON Séminaire FPC – LYON - 15 et 16 septembre 2011. « Erreur médicale : quels enseignements

Il faut saisir 1 dans le champ « Effectif » pour 1 couple et non 2 pour deux individus (aussi le cas avec le pictogramme « parades nuptiales & accouplements » ).