VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar

Texte intégral

(1)

VirtualScale

L’expert infrastructure de

l’environnement Open source HADOOP

Avril 2014 Virtualscale 1

Sofiane Ammar

sofiane.ammar@virtualscale.fr

(2)

•Les enjeux du Big Data et d’Hadoop

•Quels enjeux opérationnels ?

•Le positionnement de Virtualcale

•L’offre Produits & Services

•Les premiers succès commerciaux

•Projections financières

•VirtualScale : fondateurs et dirigeants

Avril 2014 Virtualscale 2

Sommaire

(3)

Le Big Data : nouvelle révolution impliquant un modèle autour de traitement et de l’analyse de grandes masses de DONNEES

CRM 360, Détection de fraude, Analyse des usages, Internet des Objets, ..

Virtualscale

3

Les enjeux du Big Data et d’Hadoop

(4)

Virtualscale 4

L ’environnement Hadoop un catalyseur au cœur de la révolution Big Data (Applications,

Analytiques et Infrastructures) :

Une avancée majeure issue des géants du web, socle technique d’un traitement Big Data en rupture (ralliement de l’ensemble des acteurs de l’industrie)

-Technologique : issue de la communauté Open source, Hadoop permet de traiter parallèlement des données (structurées et non structurées), en très grosses volumétries grâce à son système de fichiers distribués.

-Financière : capable de reposer sur une infrastructure à faible coût de stockage et de traitement, Hadoop rebat les cartes de l’accès au traitement Big Data face aux bases de données traditionnelles.

Les enjeux du Big Data et d’Hadoop

(5)

Un métier de spécialiste va émerger autour de la gestion applications – infrastructures du Big data

• Expertise et courbe de connaissance très récente du à un démarrage de quelques Grands comptes

• Une complexité inhérente à la profondeur de l’éco système HADOOP et sa jeunesse : système de gestion de fichiers distribués, totale imbrication des infrastructures sous

jacentes comme le réseau, la sécurité, les serveurs, l’impact sur la performance des applications et de leur

développements au sein des cluster Hadoop

Avril 2014 Virtualscale 5

Les enjeux du Big Data et d’Hadoop

(6)

Avril 2014 6

Quels enjeux opérationnels ?

Nous sommes sur des architectures hautement élastiques tant sur les CPU/RAM que sur les stockages : perdre une machine ou un disque ne donne pas les mêmes effets quant aux architectures 3 tiers des serveurs BD/Web classiques ;

Après une extension d’un cluster (ajout de nouveaux nœuds, de CPU, de RAM ou de capacité de stockage aux serveurs existants), des

requêtes SQL (Hive) impliquant des ressources importantes ne fonctionnent plus (problème de configuration des comptes

utilisateurs) ;

Les nœuds de données sont identifiés comme non utilisables après un processus de réplication de données, qui est un processus naturel utilisé par HDFS pour disposer les données sur plusieurs disques

(problème de configuration des délais d’envois de rapports par les nœuds) ;

(7)

Avril 2014 7

Quels enjeux opérationnels ?

Chaque redémarrage du nœud de gestion de l’ensemble de

l’infrastructure de données (Name Node) déclenche au bout d’une heure une instabilité majeure du cluster (problème de configuration des délais d’envois de rapports par les nœuds) ;

Les nœuds de données sont bloqués de temps à autres (marqués donc inutilisable par le nœud de gestion du cluster Name Node) : ils sont lockés par d’autres programmes qui attendent de se

terminer (problème de nœuds attendant en cascade des résultats d’opérations) ;

Les programmes exécutants les requêtes SQL (Hive) sont marqués « KILLED Unclean » par l’utilisateur provoquant ainsi une très forte lenteur du résultat de la requête (problème de configuration des ressources affectées à Hive, le scheduler met alors fin à certaines tâches pour en prioriser d’autres)

(8)

Avril 2014 8

Le positionnement Virtualscale

Partenaire BI – Big Data Virtualscale

(9)

L’offre Produits & Services

Devenir le leader Français « Gestion des infrastructures Hadoop » autour des axes majeurs suivants :

Conseil en architecture, déploiement d’infrastructures matérielles et logicielles Open source Hadoop, distribution 100% Apache et formations Hortonworks

Prestation Forfait journalier

Pack Annuel de 50 tickets de support incluant le support technique sur HDP 2.0

(versioning, sécurité, performances, bugs, assurance qualité Open source, diagnostics impact applicatif …)

Centre de formation agréé Hortonworks.

Services managés « Hadoop as a service » intégrant infogérance, centre de support et

sécurisation d’infrastructures Hadoop avec gestion de SLA, soit sur site client (My datazoomr), soit le Paas de Virtualscale ou d’un Cloud Public (Cloud datazoomr)

Editeur du logiciel d’orchestration Hadoop, datazoomr

Éditeur contributif de la communauté Open Source avec Efficient Hadoop on Openstack (optimisation Hadoop sur Openstack)

9

Avril 2014 Virtualscale

(10)

Le Paas Cloud datazoomr

Une plateforme et un logiciel (datazoomr) pour la mise en place et la gestion de cluster Hadoop en mode service, hébergé en France

10

Avril 2014 Virtualscale

(11)

Teralab choisit la plateforme Cloud datazoomr de VirtualScale pour la première itération de son projet de plateforme Big Data destiné aux laboratoires de recherche

Quelques POC se testent au quotidien sur notre

Plateforme par plusieurs Entreprises et société de Business Intelligence

Avril 2014 Virtualscale 11

Premiers succès commerciaux

(12)

Projections financières

Avril 2014 Virtualscale 12

2013 2014 2015 2016 2017

Turnover 223 450 1 463 733 3 140 584 5 203 434 7 781 515

Hadoop Consulting Services 3 250 242 250 436 550 596 800 704 950

Cloud datazoomr 4 000 210 433 806 200 1 762 500 3 155 300

Management Software 0 0 138 384 529 784 1 380 615

Training 0 168 000 364 800 499 200 528 000

Virtuali 216 200 843 050 1 394 650 1 815 150 2 012 650

General expenses & administration 497 720 1 852 335 3 504 598 4 624 977 5 985 818 Sales & Marcom (incl indirect sales com) 96 600 431 000 1 054 590 1 334 281 1 545 606

Finance & support 13 000 24 000 44 600 96 600 102 600

IT (incl Hardware and Licences costs for

integration) 344 800 1 265 700 2 217 560 2 960 160 4 049 160

General expenses 43 320 131 635 187 848 233 936 288 453

Revenue -274 270 -388 602 -364 014 578 457 1 795 697

(13)

Avril 2014 Virtualscale 13

Fondateur et Dirigeants

Sofiane Ammar – Président Sofiane.ammar@virtualscale.fr

Serge Alexandre – Directeur du développement Serge.alexandre@virtualscale.fr

Evelyne Bourderioux – Directrice partenaires Evelyne.bourderioux@virtualscale.fr

Cyril Masson – Directeur Business Développement Cyril.masson@virtualscale.fr

Arnault Janson – Directeur Technique et des Opérations Arnault.janson@virtualscale.fr

Figure

Updating...

Références

Updating...

Sujets connexes :