Simplifier e-discovery et conformité à l’ère des big data
Une approche holistique de la gestion de l’information apporte des bénéfices importants en termes de coûts et de risques pour les équipes juridiques et conformité
Emily Wojcik
Product Marketing Manager
White Paper
Tableaaaaa
Table des matières
Le défi des big data ... 3 Sauvegarde et archivage des big data : comment s’en
sortir ... 5 Front commun vis-à-vis de la convergence des données ... 5
Les 10 grandes questions : les big data créent-elles un
big problème de gestion de l'information ? ... 8 CommVault Simpana OnePass™ ... 8 Comparaison : trois workflows séparés et Simpana
OnePass™ ... 9
CommVault ... 10
Copyright © 2013 CommVault Systems, Inc. | All Right Reserved. СТРАНИЦА | 3
White Paper
Le défi des big data
L’explosion permanente des big data continue de déclencher des problèmes aussi profonds que persistants : les organisations ne savent pas comment conserver, consulter, rechercher et effacer les contenus en accord avec des réglementations qui ne cessent de changer. Les big data affectent de nombreux acteurs, de l’IT aux affaires juridiques. Tandis que les informaticiens se débattent avec les environnements complexes de big data, les équipes juridiques doivent prendre des mesures pour tenir compte de ces données dans un processus d’e-discovery déjà coûteux.
Ce qui caractérise les big data, c’est leur simple volume, généré par une armée croissante d’appareils, de sources de données et d’applications. IDC1 estime qu’il faudra déployer cette année plus de 4.200 pétaoctets d’espace de stockage pour suivre le rythme de croissance des données. Une croissance alimentée par l’évolution des règles de rétention et par les autres réglementations, notamment HIPAA ou la loi sur la liberté d’information, qui imposent de conserver l’information, ici quelques années, là indéfiniment.
Toujours selon IDC2, en 2010, le monde a produit plus d’un zettaoctet (Zo), soit un million de pétaoctets (Po) de données. En 2014, la croissance devrait atteindre 72 Zo par an, en partie sous l’effet du gonflement rapide des données générées par les machines. Multiplication des systèmes de négoce et transactions programmés dans la finance, compteurs et autres instruments intelligents, données pléthoriques des appels à présent disponibles sur les smartphones et tablettes : tout cela contribue à la gigantesque prolifération des données générées par les machines.
Simultanément, un afflux sans cesse croissant de données non structurées (images, musique, vidéo) ou semi- structurées (e-mails, fichiers journaux) ajoutent encore à la complexité, en particulier lorsqu’il s’agit de choisir le moyen le plus efficace et fiable pour digérer, protéger, organiser, consulter, préserver et effacer à bon escient toute cette information virtuelle. La préservation et la conservation des données se font également plus complexes à mesure que les organisations sont tenues de respecter des règles de rétention pour une variété de sources, notamment les e-mails, les documents et les fichiers médias, selon le contexte.
Ces données peuvent constituer un atout considérable. Ou un fardeau énorme si l'on ne dispose pas d'une stratégie moderne en la matière. Les changements de paradigme vont de pair avec une augmentation de la quantité et de la complexité des données issues des opérations de découverte (discovery). En fouillant des montagnes de big data pour retrouver des informations, les organisations peuvent dépenser des millions d’euros pour isoler dans le stockage électronique celles qui sont pertinentes, et plus encore pour les analyser. En langage courant, le problème des big data remet au goût du jour l’expression « chercher une aiguille dans une botte de foin ».
Manifestement, la croissance exponentielle des données, la diversité des types de données et les exigences continuelles en matière de rétention vont donner naissance à la tempête du siècle si la gestion des big data ne fait pas l’objet d’une approche plus holistique dans les entreprises. C’est seulement ainsi qu’elles pourront considérer les sauvegardes et archives de manière plus stratégique tout en installant des solutions intégrées pour réduire le coût du stockage et les risques pour la conformité. S’il faut que les entreprises suivent le rythme accéléré de la croissance actuelle des données, elles doivent aussi envisager l’avenir avec le même sens de l’urgence. Plus précisément, nous avons besoin de technologies qui répondent aux impératifs de l'activité par une stratégie flexible et adaptative reflétant exactement la situation du moment. Les entreprises pourront alors extraire une valeur optimale de toutes leurs informations cruciales et en tirer des avantages économiques précieux sans se retrouver entravées par des technologies exclusives.
1 Directions 2012, IDC’s 47th Annual Business Forecast, « The Race to Value Capitalizing on Big Data Hot Spots », Rick Villars, mars 2012
2 Livre blanc IDC : « Rethinking your Data Retention Strategy to Better Exploit the Big Data Explosion », Rick Villars, Marshall Amaldas, octobre 2011.
White Paper
Sauvegarde et archivage des big data : comment s’en sortir
Trop nombreuses sont les organisations où les fonctions de sauvegarde et d’archivage sont déployées et
entretenues dans des « silos » séparés à l'intérieur d'une stratégie générale de gestion de l'information. Ce n'est pas une bonne idée, pour plusieurs raisons. Des logiciels et matériels multiples et disparates sont souvent utilisés pour gérer ces silos. Cela débouche sur des informations dédoublées, à protéger et préserver. De plus, la pression légale (qui exige de préserver et de pouvoir retrouver les données) génère encore plus de silos, voire le pire des scénarios : la rétention indéfinie des informations, qui ne permet pas de savoir clairement ce qui entre dans la composition des données conservées.
La diversité des sources (audio, vidéo, médias sociaux sur les desktops, portables et appareils mobiles) accentue encore la difficulté administrative de la gestion de ces données hétéroclites, à la fois en termes de coût et de risque.
Problème supplémentaire, deux groupes totalement distincts sont traditionnellement responsables de la protection et de la préservation des données dans la plupart des grandes entreprises.
Les administrateurs du stockage et des sauvegardes supervisent la protection des données. Ils sont focalisés sur les effets des big data pour les fenêtres de back-up, les SLA de restauration et les coûts d’infrastructure. Quant aux acheteurs de la gestion de l’information, ils sont concentrés sur le rôle des big data dans les politiques de rétention, d'e-discovery et de gouvernance de l’information. Mais ils opèrent souvent sans tenir compte de l’incidence opérationnelle de ces politiques.
Résultat : un fossé se creuse entre ces deux groupes critiques dans le débat sur les big data. D’après Gartner3, la sauvegarde et l’archivage se complètent mutuellement. Pourtant, les administrateurs de sauvegarde et les
architectes de l’information ne parlent pas la même langue, et la plupart des outils ou technologies ciblent une de ces disciplines, pas les deux.
Si la sauvegarde et l’archivage poursuivent des buts différents, leur fonctionnement est similaire : les deux processus prennent une copie des données originales à des fins de restauration ou de préservation. Cela dit, Gartner et d’autres affirment qu’une approche holistique de la sauvegarde et de l’archivage promet d’importantes économies de coûts et des bénéfices dans la gestion des risques4. La convergence de la sauvegarde et de l’archivage est un concept qui fait son chemin. Il intéresse les organisations en quête de solutions pour réduire le nombre de copies créées pour la sauvegarde et l’archivage tout en alignant plus étroitement les politiques d’accès aux données de part et d’autre.
Front commun vis-à-vis de la convergence des données
Les budgets et les ressources étant comptés (même s’il ne faut pas voir là un manque d'intérêt du management pour la gestion de l’information ou la gouvernance des données), le leitmotiv est « faire plus avec moins ».
Un moyen pour y parvenir consiste à unifier sauvegarde et archivage, mais il faut pour cela unir les forces entre équipes afin que les besoins de toutes les parties prenantes soient pris en compte.
Il faut commencer par mieux comprendre comment les applications, les utilisateurs et les processus critiques doivent accéder aux données durant tout leur cycle de vie. L’effort nécessite coopération et collaboration entre le métier et les informaticiens responsables de la restauration et de l'e-discovery. Ce groupe doit examiner ensemble les différentes politiques et pratiques qui régissent le déplacement, la copie, l'inventaire et l’accès aux données pour les sauvegardes, la rétention, l'e-discovery et l’élimination. Dans le courant du processus, bon nombre de facteurs qui entravent l'accès aux données individuelles et collectives aux différents niveaux de l'entreprise apparaîtront au grand jour. En même temps, on identifiera les domaines où une visibilité limitée sur l'information vitale entraîne une exposition inutile à des risques en termes de conformité et de gouvernance.
Copyright © 2013 CommVault Systems, Inc. | All Right Reserved. СТРАНИЦА | 5
White Paper
Autre résultat typique de l'analyse initiale : la révélation, la prise de conscience que les données se trouvent partout en de multiples exemplaires, sur des serveurs physiques et virtuels, en cloud, dans les dépôts de sauvegarde, dans les archives légales et IT, ainsi que sur les desktops et les mobiles des employés. Bref, partout dans l’entreprise. Si la déduplication peut réduire efficacement le nombre de copies redondantes, l’avantage majeur réside dans la consolidation des données en un seul « store », une infrastructure matérielle et/ou logicielle commune pour la sauvegarde et l’archivage.
Le concept du dépôt unique qui met fin aux redondances et aux silos séparés est convaincant à de nombreux égards. Une approche holistique qui capture les données une seule fois pour en faire ensuite l'objet de la protection et de la préservation : tel est le secret pour mettre les bonnes données entre les mains des bonnes personnes pour qu’elles puissent en tirer parti au bénéfice de l’entreprise.
Simultanément, la faculté d'exploiter un dépôt de données unique permet aux juristes d’obtenir suite à une requête e- discovery les résultats les plus complets en un minimum de temps. Une collection de données unique signifie que toutes les sources sont prises en compte par l'e-discovery : toutes les données critiques sont rassemblées, préservées, prêtes à analyser et à exporter vers le conseil extérieur le cas échéant. Un endroit central pour effacer les données réduit aussi le coût et le risque liés au stockage involontaire de copies multiples. Une bonne
compréhension des pools de données, suffisante pour extraire et collecter des sous-ensembles pertinents en vue d’une e-discovery à la fois réactive et proactive, peut se traduire par une réduction considérable des coûts et des risques.
Un autre effet positif de la convergence dans la stratégie de protection et de rétention des données se trouve dans le rapportage centralisé, qui permet aux responsables métier et IT de prendre des décisions mieux étayées, notamment grâce à des facultés d’analyse améliorées. Les organisations peuvent aussi mieux appréhender leur activité avec des outils de décision et d’analyse qui procurent une visibilité granulaire sur le rôle toujours changeant que les données peuvent et doivent jouer dans l’orientation de l’entreprise.
Mais surtout, les entreprises sont à même d'entretenir l’équilibre entre capturer trop ou trop peu de données, chacun de ces deux scénarios pouvant entraîner des risques graves. Avec les bonnes connaissances et les bons outils, il est possible de s’assurer que toutes les sources de données sont collectées dans l’entreprise, en particulier à la
périphérie du réseau, où les portables et mobiles sont souvent ignorés et vulnérables. Avec des outils de rapportage robustes et prédictifs, il est beaucoup plus facile de prédire, d’analyser et de budgéter l’afflux constant de big data sans compromettre l’intégrité, la sécurité, l'accessibilité ni la fiabilité des données. Le rapportage peut servir d’outil dans l’e-discovery pour défendre efficacement la méthodologie de collecte et de préservation des données en réponse à un litige, une demande officielle ou une enquête interne.
Dans le monde des big data, tout moyen pour endiguer le tsunami de l’information est un pas dans la bonne direction. Dans un proche avenir, cependant, les organisations qui se servent encore de sauvegardes pour la rétention à long terme vont rencontrer des difficultés insurmontables lorsqu’elles voudront accéder à ces masses d’information pour les besoins de l’e-discovery et de la conformité. Elles s’exposeront à des risques supplémentaires en rassemblant de grandes quantités d’information à partir de silos disparates, sans le secours d'une plate-forme unique pour rechercher dans toute l’entreprise les données critiques dont elles ont absolument besoin. Les
entreprises prévoyantes, de leur côté, auront adopté une approche unifiée pour gérer à la fois les sauvegardes et les archives. Elles pourront profiter à fond d'une solution à l'épreuve de l'avenir, qui améliore globalement la gestion de l'information tout en ouvrant un accès adéquat aux informations critiques à mesure qu'elles prennent de l'âge.
White Paper
Les 10 grandes questions : les big data créent-elles un big problème de gestion de l'information ? 1. Vos systèmes de fichiers sont-ils devenus trop gros pour les sauvegarder ?
2. Vous servez-vous des sauvegardes pour la restauration et la rétention à long terme ?
3. Collectez-vous et capturez-vous les données de sauvegarde et d’archivage dans des silos de produits séparés ?
4. Êtes-vous en mesure de traiter sans retard les demandes internes/externes d’informations dans le cadre de l’e- discovery et/ou de la conformité ? Quelles autres ressources juridiques ou professionnelles affectez-vous à ces tâches ?
5. Vos politiques de sauvegarde et d’archivage sont-elles alignées et automatisées ?
6. Y a-t-il des données qui figurent en double sur les copies de sauvegarde et d’archivage ? Quelles sont les ressources et les dépenses IT absorbées par la gestion de ces contenus dédoublés ?
7. Comment gérez-vous la prolifération des données ? Collectez-vous les données de toutes les sources, y compris les desktops distants, portables et mobiles ? À quels risques vous exposez-vous en vous privant de l'accès à des données critiques situées à la périphérie ?
8. Jouissez-vous d’une visibilité suffisante sur les données vitales pour faciliter vos décisions critiques ou l'évaluation initiale des dossiers ?
9. Êtes-vous capable de prédire l’impact des big data sur vos besoins en termes d’infrastructure de back-up, de restauration et de rétention dans un proche avenir ?
10. Votre département juridique est-il capable de mener à bien ses propres demandes d’e-discovery ? Des ressources sont-elles consacrées à des tâches manuelles qui pourraient être accomplies avec les bonnes technologies ?
Si vous avez répondu oui à une ou plusieurs de ces questions, vous avez déjà un big problème de sauvegarde et d’archivage. Dans le meilleur des cas, cela ne va pas tarder.
CommVault Simpana OnePass™
CommVault peut vous aider. La fonction Simpana OnePass™de CommVault apporte une réponse au défi des big data : le premier processus convergent de sauvegarde, archivage et rapportage à partir d’une collecte de données unique et d’une infrastructure commune. La nécessité de maîtriser les coûts des environnements d’archivage ne va pas disparaître demain. L’approche CommVault – faire converger l’archivage, la sauvegarde et le rapportage sur une plate-forme unique – réduit les coûts, stimule la productivité et transforme les données conservées en valeur. Mais il est possible d’aller plus loin. Dans cette perspective, Reference Copy est une fonction de rétention à base de contenu qui applique les règles des politiques à la rétention profonde. Les utilisateurs peuvent définir et personnaliser les données qu’ils veulent conserver et comment ils entendent procéder. Pour les équipes IT, cela veut dire que le stockage est optimisé, car seules les données pertinentes sont conservées. Quant aux équipes juridiques et conformité, elles gèrent mieux les risques : ce qui est conservé concerne le métier, la conformité et les autres preuves requises. Les données qui ne répondent pas à ces critères sont à juste titre effacées de la source unique.
Toutes les données gérées séjournent dans le ContentStore, un dépôt virtuel évolutif, inconscient du matériel, associé à un index intelligent, qui supporte tout à la fois la protection des données, l'archivage et le rapportage de l'infrastructure de stockage (voir la figure 1).
Copyright © 2013 CommVault Systems, Inc. | All Right Reserved. СТРАНИЦА | 7
White Paper
Comparaison : trois workflows séparés et Simpana OnePass™
Figure 1 : Des politiques et processus séparés créent de multiples dépôts de données, augmentant les coûts et les risques par rapport à Simpana OnePass™ et à sa collecte unique pour le rapportage, la sauvegarde et l’archivage.
Grâce à ses capacités de sauvegarde, d’archivage, de recherche et d’analyse à partir d'un code commun et d’une plate-forme unique, CommVault est la clé de voûte d’une stratégie d’information de long terme. En adoptant Simpana OnePass et CommVault, les acteurs de la gestion de l’information (de l’IT au service juridique) seront à même de réaliser les avantages suivants :
Abaisser les coûts, réduire la complexité et améliorer les operations
Éliminer les solutions ponctuelles via la révolution CommVault de la convergence dans la gestion des données
Réduire le coût de l’infrastructure, de l’administration et du support
Regrouper la gestion et les politiques en une console unique pour maximiser la productivité
Limiter les besoins en infrastructure : moins de données empruntant le réseau, moins d'impact sur le système de fichiers, moins de dégradation des E/S disque
Raccourcir la fenêtre de sauvegarde et améliorer la performance des serveurs
Augmenter la productivité de l'utilisateur et de l'administration avec des systèmes optimisés et un accès transparent pour l'utilisateur
Relever les défis de l’e-discovery et de la conformité pour réduire les risques
Rationaliser la préservation, les mises en suspens pour des raisons juridiques et l’e-discovery avec un dépôt de données unique et un point d’effacement unique
Dégonfler le volume de big data et éliminer les redondances dans le processus de contrôle pour abaisser les coûts des tiers
Permettre une rétention de long terme économique pour respecter les normes de gouvernance de l’information
Analyser les données via les rapports intégrés pour prendre des décisions informées en matière de capacité et de pertinence des données pour la rétention ou l'effacement
Améliorer l’accès à l'information métier tout en intensifiant la productivité.
For more information about Simpana® software modules and solutions, and for up-to-date system requirements, please visit www.commvault.com
www.commvault.com • 888.746.3849 • [email protected] CommVault, siège mondial • 2 Crescent Place • Oceanport, NJ 07757 USA Phone: 888.746.3849 • Fax: 732.870.4525
CommVault, sièges régionaux: États-Unis • Europe • Moyen-Orient et Afrique • Asie-Pacifique • Amérique Latine et Caraïbes • Canada • Inde • Océanie
White Paper
CommVault
Une vision unique – la conviction qu’il est possible de mieux répondre aux besoins actuels et futurs de la gestion des données – guide CommVault dans le développement de ses solutions Singular Information Management® pour une protection performante des données, leur disponibilité universelle et une gestion simplifiée à travers les réseaux de stockage complexes. L’architecture exclusive de Simpana – une plate-forme unique – donne aux entreprises une maîtrise sans précédent sur l’augmentation des volumes de données, des coûts et des risques. Les programmes CommVault Simpana® ont été étudiés dès le départ pour fonctionner ensemble, partageant un même code et des fonctions communes. Ils apportent des capacités exceptionnelles en termes de sauvegarde, de restauration, d’archivage, de réplication, de recherche et de gestion des ressources. Chaque jour, de nouvelles entreprises grossissent les rangs de celles qui ont découvert l’extraordinaire efficience de CommVault, ses performances, sa fiabilité et ses instruments de contrôle. Pour en savoir plus sur CommVault, rendez-vous sur www.commvault.com.
Le siège central de CommVault se trouve à Oceanport, dans le New Jersey, aux États-Unis.