• Aucun résultat trouvé

Contrôle et supervision des données dans le Cloud

Partie I. Etat de l’art et travaux connexes

II. Cloud computing

II.9. Contrôle et supervision des données dans le Cloud

L'un des sujets les plus vifs et le plus importants liés à la technologie Cloud est la gestion des données. Le cycle de traitement des données passe par plusieurs étapes: construction, modification, sécurisation, stockage (élimination), et contrôle [44].

II.9.1. La nature des données

Le nombre de plus en plus croissant des clients utilisant des services Cloud ainsi que leurs diversités, a engendrés l'apparition de différents types de données qui nécessitent chacune, un traitement spécifique. Puisque une donnée image ne peut pas être modifiée comme un simple texte, un contrat de vente ne peut pas avoir le même niveau de sécurité qu'un email professionnel et les données d'un Blog ne peuvent pas être stockées comme un ensemble de données structurées… etc.

Les types de données ne sont pas le seul enjeu, mais également la quantité de données à gérer sur Cloud. Pour pouvoir stocker et contrôler l'accès à des millions de vidéos ou d'images sur des réseaux sociaux, ou pour gérer de gigantesques masses de données structurées et générer chaque seconde par les entreprises multinationales, il faut avoir des capacités de stockage énorme et des applications efficace et disponible 24h/24.

Avec une telle quantité et une diversité importante des données, les entreprise ainsi que les particuliers ont besoin d'accéder rapidement avec un minimum de latence, afin qu'il puise opérer avec un maximum de données pour augmente leur compétitivité dans un marché incertain.

Les systèmes Cloud doivent également assurer un bon niveau de collaboration entre leurs ressources afin de permettre un accès intégral et un contrôle totale des données par les différents intervenants dans la chaine de productivité jusqu'au consommateur.

II.9.2. La sécurisation des données

Les trois principaux axes sur lesquelles se base la sécurisation des données dans le Cloud sont:

 L'emplacement des données.  La Manipulation des données.  Le transfert des données.

II.9.2.1. L'emplacement des données

Le problème le plus important à soulever dans ce cas-là est les lois qui régissent l'accès et le contrôle des données dans chaque pays, puisqu’une fois les données envoyées dans le Cloud, le client ne peut plus les contrôler, puisque seul le fournisseur des services Cloud peut décider de l'emplacement géographique dans lequel les données seront stockés. Le risque réside dans le fait que les lois d'accès aux données diffèrent d'un pays à un autre, ce qui peut

26

donner l'autorisation (selon les lois de certains pays), d'accéder aux données des clients, pour des raisons de sécurité nationale par exemple.

Un autre problème est la possibilité de stocker les données des clients particuliers avec les données des entreprises ce qui les expose aux dangers d'une attaque de pirates ou de virus.

Les données doivent également être protégé par des SLA qui empêche des sociétés de publicités de les utilisées pour des fins commerciales.

Enfin les Métadonnées qui servent comme moyen de description de données sont déterminées au préalable par le fournisseur ce qui réduit le contrôle des données par le client.

II.9.2.2. Manipulation des données

Un fournisseur de service Cloud digne de confiance doit avoir un contrôle total sur les données de ces clients en mettant en œuvre un ensemble de mécanismes qui vise à : vérifier l'exactitude et l'intégrité des données stocker et traitées, manipuler le type de fichier qui sert à stocker les données, contrôler la cohérence entre les données en entrée et les données en sortie, crypter les données sensibles et restreindre l'accès aux personnes qui sont autorisés par l'SLA, avoir des mécanismes de récupération de données en cas de failles et protéger le niveaux physique de tout accès non autorisé, et enfin s'assurer de la supervision des données (sous demande du client) de tout emplacement de stockage (même les données redondantes).

II.9.2.3. Transfer de données

Il est essentiel de suivre quelques conseils de sécurité afin d'avoir un transfert sûr de données. Avant toute opération le client doit s'assurer que l'espace de stockage du fournisseur Cloud ne contient aucune faille qui peut conduire à une fuite de données, ensuite le client doit choisir une piste sure entre lui et le fournisseur pour que personne n'intercepte ces données.

Afin de garantir un transfert sure de données le fournisseur de services Cloud utilise un Réseau Virtuel Privé (RVP), qui contient un par feu qui sépare l'Internet et les ressources Cloud et un système de cryptage afin de coder les données pour que seul l'ordinateur ou la ressource de destination (qui possède la clé de décryptage) puisse les lires.

II.9.3. Traitement de données

Un fournisseur de services Cloud doit s'assurer que son système trouve toujours les ressources dont il a besoin quand il a besoin afin de pouvoir stocker et traiter la masse d'information de plus en plus croissante que produisent les entreprises multinationales à travers le monde, cette masse peut être divisée en trois catégories:

1. Les données à grande échelle: le Cloud offre un cadre important pour le traitement de ce genre de données (ex. la recherche scientifique en génomique computationnelle, le suivi et l'analyse des fréquences radio-étiquetés d'identification, l'analyse des flux des nouvelles en temps réel … etc.), en se basant sur un ensemble de techniques telle que: MaPreduce de Google et Hadoop de Apache, afin de créer des systèmes massivement évolutives qui permettent l'auto-approvisionnement d'espace de stockage et d’unités de traitements selon les besoins des clients.

2. Base de données dans le Cloud: avec la complexité de plus en plus croissante des applications dans le Cloud et la nature distribuée des données à traiter, le modèle

27

relationnel rencontre beaucoup de difficultés pour répondre aux requêtes complexes. Une solution serait de répliquer les données sur chaque serveur ou bien les partager sur plusieurs applications, mais ce genre de solutions pourrait compliquer la fourniture des données à la demande. Afin de résoudre ce problème, les grandes entreprises de fourniture de services Cloud ont créé leurs propre base de données Cloud: Google Bigtable qui ressemble à une grande table pour le stockage et le partage de données basée sur Mapreduce pour l'interrogation et le traitement de données, Amazone simpleDB qui représente un services web d'indexation et de stockage de données, Cloud-based SQL qui est une BD relationnelle dans le Cloud basée sur la Platform Microsoft Azure… etc. il y a des tentatives aussi de créer des bases de données Cloud open source, comme: MangoDB pour le stockage de document coder en C++, CouchDB de l'organisation Apache … etc.

3. Les données d'archivage: l'archivage de données est un domaine très ancien en informatique qui consiste à stocker des données statiques et rarement utilisé (les règlements légaux (selon chaque pays) obligent les entreprises de les stocker). Il existe plusieurs modèles d'archivage dans le Cloud tel que : IBM SmartCloudTM Content Management (http://www-935.ibm.com/services/us/en/it- services/smartcloud-archive.html), Microsoft Exchange Online Archiving(http://office.microsoft.com/en-us/exchange/microsoft-exchange-online- archiving-archiving-email-FX103763589.aspx) … etc. qui ont pour but d'externaliser la gestion et le stockage de ce genre d'informations rarement utilisées.

II.9.4. Métadonnées

Les Métadonnées représentent le moyen le plus sûr pour comprendre et mapper les données des clients afin d'éviter un quelconque mélange entre ces derniers et les données d’autres clients. Les Métadonnées servent également de moyen de distinction des données lors du transport de ces derniers d'une ressource Cloud vers une autre pour s'assurer qu’ils seront véhiculés vers la bonne destination.