Introduction to Data Science
1
Qu’est-ce que la Data Science ?
Ensemble d’outils et de techniques et qui permettent de collecter, nettoyer, transformer, analyser et tirer parti des données afin d’en dégager des enseignements.
Définition
•
Mathématiques (statistiques, probabilités, modélisation)•
Programmation informatique (Python ou R)•
Réseau (Architecture Cloud, API, etc) Compétences requisesIntroduction to Data Science
2
Les facteurs de l’essor de la Data Science
•
Explosion de la génération des données sur le web (GAFAM, BATX..) et grâce aux objets connectés•
Grosse capacité de stockage des données grâce à l’écosystème Big Data•
Augmentation considérable de la puissance de calcul•
Baisse exponentielle des coûts de stockage et de calculIntroduction to Data Science
3
Les métiers de la Data Science
•
Data Scientist•
Data Analyst•
Data Engineer•
DevOps•
MétierIntroduction to Data Science
4
Le cycle de vie d’un projet en Data Science
Collecte des données
Data Visualisation
Déploiement Exploration des données
Modélisation
• Etude de l’existant
• Définition des données
• Statistiques descriptives
• Pré-visualisation des
• Cloud
Définition de la problématique
• Définition des besoins est des objectifs
Introduction to Data Science
5
Focus sur la gouvernance et la qualité des données