• Aucun résultat trouvé

Hadoop Distributed File System (HDFS) Data science Master 2 ISIDIS

N/A
N/A
Protected

Academic year: 2022

Partager "Hadoop Distributed File System (HDFS) Data science Master 2 ISIDIS"

Copied!
6
0
0

Texte intégral

(1)

Hadoop Distributed File System (HDFS)

Data science Master 2 ISIDIS

S´ebastien Verel verel@lisic.univ-littoral.fr

http://www-lisic.univ-littoral.fr/~verel

Universit´e du Littoral Cˆote d’Opale Laboratoire LISIC Equipe OSMOSE

(2)

Introduction

Syst` eme de fichier - File Sytem

Rappels `a travers une question :

Qu’est-ce qu’un syst`eme de fichier (File System) ?

Quelles sont les commandes relatives `a un FS ? Quelles sont les propri´et´es attendues d’un FS ?

(3)

Introduction

Syst` eme de fichier - File Sytem

Rappels `a travers une question :

Qu’est-ce qu’un syst`eme de fichier (File System) ?

Quelles sont les caract´eristiques d’un FS ? Quelles sont les commandes relatives `a un FS ? Quelles sont les propri´et´es attendues d’un FS ?

(4)

Nouvelles probl´ ematiques, nouvelles solutions

Nouveaux big besoins On d´esire :

Avoir acc`es aux donn´ees depuis de nombreux clients `a travers le r´eseau

Sauvegarder une tr`es grande quantit´e de donn´ees Garantir les services classiques d’un file system

Question :

Quelles solutions peut-on imaginer pour faire cela ?

(5)

Introduction

Hadoop Distributed File System (HDFS)

Hadoop Distributed File System (HDFS) est : un syst`eme de fichier (file system) un syst`eme de fichier distribu´e

Buts de ce File System

Stocker une grande quantit´e de donn´ee (fichiers)

Donner acc`es aux donn´ees `a de nombreux clients distribu´es sur le r´eseau

Garantir l’acc`es aux fichiers Remarque :

Projet de la fondation Apache, Open Source.

(6)

Support de cours

Bilel Derbel, Universit´e de Lille 1

Programmation Parall`ele et Distribu´e,

https://sites.google.com/site/bilelderbelpro/

home/teaching Benjamin Renaut,

MBDS universit´e de Nice Sophia Antipolis Cours big data,

http://cours.tokidev.fr/bigdata/

Source du concepteur Hordon :

https://fr.hortonworks.com/apache/hdfs/

Références

Documents relatifs

Simplification structure de donn´ ees (json, pas d’int´ egrit´ e r´ ef´ erentielle entre des tables, pas de sch´ ema au niveau du serveur). Structures sp´

capteurs en tout genre, compteurs en tout genre (´ electrique, etc.), v´ ehicules, ´ electro-m´ enager Open data des institutions, des entreprises. horaires, statistiques sur les

R´ egression lin´ eaire univari´ ee (fait ?) R´ egression lin´ eaire multivari´ ee (fait ?) R´ egression polynomiale. R´ egression r´ egularis´ ee

Pour construire chaque arbre, vision parcellaire du probl` eme : Tirage (avec remise) d’un sous-ensemble d’exemples.

Sauvegarder une tr` es grande quantit´ e de donn´ ees Garantir les services classiques d’un file system.

Outlook ∈ { Sunny , Overcast, Rain } ; Temperature ∈ { Hot, Mild, Cool } ; Humidity ∈ { High , Normal } ; Wind ∈ { Strong , Weak }. 1 cible : Playball ∈ { No, Yes } 14 exemples

Pour construire chaque arbre, vision parcellaire du probl` eme : Tirage (avec remise) d’un sous-ensemble d’exemples.

un syst` eme de fichier (file system) au mˆ eme titre que fat32, ext3FS, NTFS, etc. un syst` eme de fichier distribu´ e comme NFS (network