• Aucun résultat trouvé

Le Worm Logique

Dans le document Archivage de données SAP (Page 41-45)

II Les concepts de l’archivage électronique

4 Contraintes techniques du système d’archivage.

4.4 Cycle de vie de l’information archivée

4.5.2 Le Worm Logique

Il existe en fait trois approches différentes destinées à assurer cette conservation sécurisée : le worm logiciel, les CAS et le stockage en grille.

4.5.2.1 Worm logiciel

La première de ces approches, sans doute la plus « simple », consiste à utiliser des baies de stockage traditionnelles sur disque et à y ajouter une couche logiciel en amont destinée à gérer cette notion de WORM logique et ainsi à bloquer toute tentative de réécriture, de modification ou de suppression.

En résumé, le principe repose sur une horloge logicielle indépendante de la baie qui écrit sa mesure systématiquement sur les disques WORM toutes les 10 secondes. Toutes les fonctions liées à la manipulation des fichiers worm sont validées par l'horloge. Si jamais l'on

21 RAID (Redundant Array of Independent Disks) : est une technologie permettant de stocker des

données sur de multiples disques durs afin d'améliorer, en fonction du type de RAID choisi, la tolérance aux pannes et/ou les performances de l'ensemble. (voir http://fr.wikipedia.org/wiki/RAID_(informatique) )

remplace le contrôleur par un contrôleur d’une nouvelle armoire avec une nouvelle horloge et avec une autre mesure de temps, le logiciel s'en aperçoit et se recale. Les disques sont de type RAID. Lors des manipulations, le contrôleur effectue un calcul de contrôle et, en cas d’erreur, le segment est réécrit. Avec le RAID, les données sont cryptées et réparties, ce qui rend impossible la lecture ou la modification directe.

L'avantage de ce dispositif réside dans sa simplicité : • n'importe quel volume peut devenir un WORM,

• l'application n'a pas besoin d'une API22 pour accéder aux archives, il suffit d'y accéder comme un NAS23.

4.5.2.2 Le CAS (Content Addressed Storage)

Une autre approche, est l'adressage de fichiers fixes appelé CAS (Content Addressed

Storage). Ce dernier crée une empreinte numérique pour chaque objet entrant. Cette

empreinte devient ensuite le seul moyen pour consulter l’objet ainsi stock

Il s’agit en fait d’une logique apparentée à celle des consignes. En effet, vous déposez un objet et en retour vous obtenez un ticket (adresse de contenu). Ultérieurement, seul ce ticket vous permettra de retrouver l’objet déposé. La façon dont est conservé ce dernier est totalement prise en charge par le système.

Par exemple, habituellement, pour stocker le fichier "resultats.xls", le système va inscrire les données sur le disque et enregistrer sur une table d'allocation, le nom du fichier, l'adresse physique correspondante (ou les adresses si le fichier est réparti sur plusieurs segments), ainsi que quelques données supplémentaires comme la taille ou la date d'écriture. Ce système comporte deux inconvénients dans une utilisation d'archivage :

• Il peut arriver qu’un fichier strictement identique puisse être enregistré plusieurs fois ou dans un autre répertoire.

• Il est impossible de distinguer deux exemplaires d’un fichier avec le même nom, la même taille, mais avec un chiffre modifié, par exemple.

22 API (Interface pour la programmation d'applications) : Ensemble de bibliothèques permettant une

programmation plus aisée car les fonctions deviennent indépendantes du matériel. (voir http://www.futura- sciences.com/fr/definition/t/informatique-3/d/api_465/ )

23 NAS (Network Attached Storage) : est une unité autonome, reliée à un réseau dont la principale

fonction est le stockage de données en un gros volume centralisé pour des clients-réseau hétérogènes. (voir

Dans le cas de l'archivage, il est important de ne pas multiplier les versions identiques d'un même fichier. Au contraire, il est intéressant de distinguer une version mise à jour. Pour pallier ce problème, toute modification du contenu déclenche automatiquement la création d’une nouvelle adresse de contenu. A l’inverse, si un même objet se présente, l’adresse de contenu étant déjà existante, il n’y aura pas de doublement en matière de stockage. Les accès aux ressources sont rapides. La gestion et l’administration d’une telle solution sont considérablement simplifiées, même pour de gros volumes. Par ailleurs, le système est en mesure de garantir l’intégrité du contenu à long terme et la confidentialité des informations peut être obtenue par un chiffrement systématique des données ainsi conservées.

4.5.2.3 Le stockage en grille

La troisième approche répond à une logique d’organisation en cellules, faisant appel au concept de stockage en grilles ou « grid ». De telles solutions intégrées d’archivage sont plutôt indépendantes des applications, mais elles utilisent néanmoins une méthode d’accès aux enregistrements normalisée.

Cette approche est constituée de plusieurs cellules interconnectées via un réseau Ethernet24. Chacune d’entre elle participe à la solution et une demande d’archivage est ainsi répartie sur l’ensemble des cellules. Une cellule possède un processeur, un espace de stockage pour l’indexation des « contenus » et les « méta données » ainsi qu’un espace de stockage pour les données des contenus.

L’un des principaux avantages de cette approche est de permettre la réalisation facile de systèmes de stockage complexes à partir d’éléments standards. Une telle technologie permet en effet la réalisation de solutions très performantes, indépendantes du nombre d’enregistrements gérés, évitant du même coup tous les phénomènes liés aux baisses de performances que l’on peut observer au cours des montées en charge. Un autre avantage et non des moindres réside dans sa capacité à effectuer des migrations très progressives, cellule par cellule. Enfin, l’exploitation de tels systèmes est simplifiée et surtout allégée à l’extrême. Ainsi, même si en apparence le coût d’acquisition peut sembler plus onéreux qu’un système traditionnel, une comparaison plus complète tenant compte des coûts d’exploitation sur trois ans ne laisse plus aucun doute. L’intérêt est encore plus évident si l’on prend en considération la notion de migration, évoquée précédemment.

4.5.2.4 Principaux acteurs du marché

Ce sous-chapitre vise à donner quelques exemples de grands acteurs du marché utilisant les approches décrites précédemment :

• IBM : Ce constructeur bien connu, disposant toujours de juke-boxes de disques optiques à son catalogue pour l'environnement iServer (AS/400), propose également depuis quelques années une solution d'archivage WORM à base de disques magnétiques, le Totalstorage DR (pour Data Retention). Ce système repose sur le module SSAM (System Storage Archive Manager), une extension du logiciel TSM (Tivoli Storage Manager), connu pour la gestion du stockage. Outre la garantie de protection WORM des données sur disque et leur cryptage, le Totalstorage DR offre des fonctions sophistiquées et auditables de conservation des informations répondant aux exigences multiples et évolutives des législations et des outils de gestion de contenu. Pour les conservations de longue durée, et dans le but d'assurer un véritable ILM (Information Lifecycle

Management)25, le Totalstorage DR prend à son compte les évolutions technologiques et assure, au moment opportun, la migration des données vers une unité de conservation WORM plus récente.

• Network Appliance : De son côté, NetApp à développé un solution sogiciel défend nommée SnapLock permettant de faire du Worm logique.

• EMC : propose au travers des systèmes Centera une solution avec une technologie basée sur l’approche du CAS (Content Aeeess System) vue précédemment.

• Hitachi: En tant que fournisseur de baies de stockage, Hitachi a développé un gestionnaire d'archivage avec son logiciel Data Retention Utility. Ce logiciel utilitaire offre ainsi la fonction Worm sur les systèmes de stockage sur disque Hitachi dans les environnements de type systèmes ouverts ou de type mainframe.

Hitachi offre également une véritable solution dédiée à l'archivage: Archive Content Platform. Cette solution est basé sur l’approche de stockage à grille. • Hewlett Packard (HP) : HP propose une solution intégrée d'archivage RISS

(Reference Information Storage System) indépendante des applications avec

une méthode d'accès aux informations normalisées. Cette solution utilise une approche du stockage en grille.

• SUN/Storagetek: Fournisseur de solutions d'archivage, ce constructeur a une approche de la gestion du stockage sous la forme de « classes de service » indépendante des technologies utilisées. Cette approche permet la mise en œuvre d’une véritable politique ILM (Information Lifecycle Management) intégrée au processus métier et garantit une gestion très efficace des fonctions d'intégrité et de traçabilité indispensables dans des contextes d'archivage à valeur probante.

Dans le document Archivage de données SAP (Page 41-45)

Documents relatifs