• Aucun résultat trouvé

CHAPITRE 1 REVUE DE LITTÉRATURE

1.4 Paramètres pour le choix du stockage des données dans le CTD ou dans un nuage

nuage privé

1.4.1 Quantité et type de données

L’étude de Gu, Lago et Potenza (2013) porte sur la gestion des données du point de vue de l’utilisateur du nuage. Pour déterminer quel type de données l’usager doit migrer vers le nuage versus celles qu’il doit maintenir localement, ils mesurent l’énergie consommée par une unité de stockage ou celle du système de stockage ainsi que le coût énergétique d’archivage des données dans les nuages. Ils ont conçu le système cadre appelé Value of

Energy framework qui estime le gaspillage d’énergie dans la gestion données par l’entreprise

pour identifier celles qui doivent migrées vers le nuage. Des algorithmes sont mis en places pour déterminer lequel conduit le système à consommer moins de ressources lors de l’exécution de cet algorithme. Lors de l’exécution d’une même tâche, la puissance de traitement restante disponible est plus grande. Si une organisation décide de maintenir à l’interne que les données critiques, le modèle Value of Energy framework montre l’énergie gaspillée par le stockage des données sans valeur pour l’entreprise et la perte d’énergie par l’espace inoccupé trop inoccupé (Gu, Lago et Potenza, 2013).

Selon leur usage, les données peuvent être stockées à différent niveau de service. Par exemple, les données critiques de l’entreprise, tel que les états financiers récents doivent être stockés dans des dispositifs à haute performance et fiable et pouvant atteindre une haute

disponibilité de l’information (Gu, Lago et Potenza, 2013). Les données peu critiques, tels que les bilans financiers datant de cinq ans peuvent être sauvegardés dans un environnement plus écologique et plus économique, tel que l’infonuagique (Gu, Lago et Potenza, 2013).

Parmi les 55 classifications des données dans l’ILM, 17 sont reliées à l’archivage des données et Gu, Lago et Potenza (2013) les classifient selon quatre critères : la période de rétention (9 classes), la fréquence de l’usage (5 classes), la dernière modification (2 classes) et l’importance de la donnée (1 classe). Ils définissent dans la politique ILM de l’entreprise trois types de données hot, cold and frozen. La classe « hot » contient des données qui sont récemment utilisées et qui ne sont pas trop vielles. Ce sont celles que l’entreprise utilise pour exécuter ses processus d'affaires, et sans elles, il peut être affecté à la baisse. Il est assumé qu’il n’est pas ou peu affecté par un fichier qui est peu consulté (Gu, Lago et Potenza, 2013). La classe « cold » contient les données qui sont moins fréquemment accédées ou les anciens fichiers. Ceux-ci sont susceptibles de se déplacer vers le nuage dans l’avenir (Gu, Lago et Potenza, 2013). La classe des données « frozen », sont les données anciennes et faiblement consultées. Elles doivent être conservées pendant de longue période pour être archivées (Gu, Lago et Potenza, 2013). Un client peut décider de changer la classification. Il peut être décidé qu’un fichier récent (ou récemment modifié) qui est faiblement consulté sera tout de même considéré comme une donnée « frozen », donc sera archivé (Gu, Lago et Potenza, 2013). Bien que les critères de la fréquence et des modifications récentes peuvent être changés par le client, celui de la rétention doit toujours demeurer intact puisqu’une donnée « frozen » doit avoir une période de rétention plus longue que le seuil relatif, car lors de la migration vers le nuage, un fichier doit être retenu et la politique de destruction des données devrait être gérée (Gu, Lago et Potenza, 2013). .

Ils affirment que l’espace de stockage est utilisée de manière peu efficiente lorsque les données à faibles valeurs sont stockées dans un système de stockage devant plutôt être utilisé pour des données à fortes valeurs. Les entreprises doivent archivées les données à faibles valeurs, ce qui signifie les déplacer vers un système de stockage plus approprié, tel que le nuage (Gu, Lago et Potenza, 2013). Toutefois, l’énergie effective potentielle peut être

transformée en énergie inefficace lorsque l’énergie n’est pas transformée en énergie efficiente (Gu, Lago et Potenza, 2013). Cela signifie qu’il y a trop d’espace libre dans le système de stockage, c’est parce qu’il n’a jamais été utilisé, d’où le gaspillage (Gu, Lago et Potenza, 2013). Lorsqu’une entreprise utilise le service de stockage en nuage pour archiver ses données, alors qu’elle continuer de payer pour l’énergie consommée par un CTD comprenant un système de stockage trop large, dans ses prochaines mise à jour il pourra gérer le stockage en conséquente et éviter les pertes futures (Gu, Lago et Potenza, 2013). En attendant, elle peut maintenir l’espace de stockage dans le cas où elle n’est pas satisfaite avec le service d’archivage en nuage (Gu, Lago et Potenza, 2013).

Quant aux opérations CRUD, les conclusions de Chen et al., (2014) indiquent qu’en maintenant le nombre de requêtes constantes, tout en augmentant graduellement leur charge de travail, la consommation d’énergie des requêtes « insert » et « update » augmentent significativement en fonction du nombre de requêtes. Toutefois, dans les mêmes conditions, l’énergie consommée par les requête « delete » et « select » augmentent plus faiblement (Chen et al., 2014). Les opérations « insert » et « update » requièrent la lecture et l’édition d’une grande quantité de données sur le disque dur, contrairement aux opérations « select » et « delete » qui sont plus rapides et demandent requièrent moins d’énergie des serveurs du CTD infonuagique (Chen et al., 2014).

1.4.2 Délai d’accès aux données

Plus les émissions de GES sont élevées, plus la capacité requise pour le stockage est élevé et plus la bande passante doit être performante. Pour rendre le système de stockage plus efficient, son ECO2 peut être réduite en stockant une plus grande quantité de données dans une empreinte plus dense sans compromettre à la baisse les services rendus, et en déplaçant les données dans une plus petite période de temps (Schulz, 2011). Cela implique ainsi un stockage plus grand des données gérées par les employés lorsque l’information générée ajoute de la valeur à l’organisation (Schulz, 2011). Elle implique aussi un accès rapide aux données (soit en quelques minutes, plutôt qu’en quelques heures). Un autre axe de la

réduction des GES associées aux données est de permettre aux ressources informatiques d’être utilisées plus efficacement, en dérivant plus de valeur par gigaoctet, téraoctet, etc, des données stockées (Schulz, 2011). Elle implique aussi de pousser de l’avant les contraintes avant qu’elles ne deviennent des obstacles (Schulz, 2011).

1.4.3 Distance géographique entre l’utilisateur et le lieu de stockage

Les conclusions de Baliga et al. (2011) indiquent d’autres facteurs à considérer, notamment la distance géographique du nuage avec celle de l’utilisateur de services infonuagiques. Un nuage localisé dans une zone géographique plus lointaine, occasionnera une consommation d’énergie plus grande étant donné la distance que doivent parcourir les données entre l’ordinateur de l’usager et le nuage : raison pour laquelle les nuages privés ont généralement une empreinte énergétique moins élevées que les nuages publics (Baliga et al., 2011). En effet, lorsque les nuages privés sont placés dans les mêmes locaux où la majorité du personnel travaille, seulement quelques périphériques réseau sont nécessaires pour transférer le trafic réseau entre les points d'extrémité (Baliga et al., 2011; Makela et Luukkainen, 2013).

1.4.4 Nature du nuage

Les mesures et les simulations réalisées par Baliaga et al. (2011) indiquent aussi que le nuage privé est le modèle de déploiement le plus efficace en terme d’énergie. La principale raison de ce résultat est les courtes distances entre le CTD et les utilisateurs finaux. En raison de la grande quantité de trafic réseau, les données les plus fréquemment utilisées devraient être stockées localement, tandis que les données rarement utilisées, comme les fichiers de sauvegarde, peuvent être stockés dans le nuage (Baliga et al., 2011).

1.4.5 Taux et vitesse de téléchargement

Baliga et al. (2011) arrivent également aux conclusions suivantes quant à la consommation d’énergie par le transport, le stockage et les serveurs par le modèle StaaS du nuage privé de l’infonuagique :

• à mesure que le taux de téléchargement augmente, plus l’énergie est importante pour les serveurs, les routeurs et les commutateurs du nuage pour surmonter le trafic additionnel;

• le stockage dans les nuages est indépendant de la vitesse de téléchargement. Ainsi, à mesure que la moyenne de téléchargement augmente, plus les pourcentages de l’énergie totale consommée par les serveurs et le transport augmente, alors que celui du stockage diminue. Toutefois, à des taux d’utilisation élevée, c’est le transport qui domine la consommation d’énergie totale;

• à plus d’un téléchargement par heure, environ 10 % de l’énergie est consommée par les serveurs, moins de 1 % par le stockage et le reste par le transport qui domine la consommation d’énergie d’un nuage fortement utilisé;

• à un taux d’utilisation élevé ou moyen, la consommation d’énergie par le système de stockage est faible (Baliga et al., 2011; Makela et Luukkainen, 2013).

CHAPITRE 2