• Aucun résultat trouvé

Stratégies d’archivage et principes de base

4. Résultats

4.1.5 Stratégies d’archivage et principes de base

Les stratégies d’archivage varient selon le type d’organisme qui les établit. Dans les milieux où la politique vient encadrer un projet en cours, les stratégies sont précises et justifiées en fonction du contexte d’usage, des ressources et des besoins de l’organisation. Par exemple, The University of Melbourne a choisi d’archiver de manière fréquente la page d’accueil de son site Web et de produire quatre portraits annuels de ce dernier. Elle n’a pas développé une application maison pour réaliser ces captures. Elle a choisi d’utiliser les outils développés par Internet Archive. Lorsqu’il s’agit de politiques d’archivage du Web proposées par des archives nationales (n=15), ces dernières présentent l’éventail de stratégies existantes. Elles décrivent leurs avantages et inconvénients et les scénarios possibles menant aux choix d’une

combinaison d’approches et de techniques d’archivage en fonction de la nature du site Web à archiver, des risques qu’il présente et des exigences auxquelles est soumise l’organisation (ex. : NAA, 2001b; Archives New Zealand, 2006a; Public Record Office Victoria, 2008). Les politiques suggèrent ainsi d’adopter une combinaison des approches suivantes :

1. Archivage en ligne : mise en ligne d’une copie du site archivé à une date antérieure avec une copie de sauvegarde du site sur le serveur (ou dépositaire local du site Web). Cette approche n’a pas été identifiée dans la revue de littérature. Elle a émergé des données de recherche;

2. Approche orientée objet : capture périodique du site Web ou des documents sélectionnés sur le site Web ainsi que les métadonnées qui y sont assignées avec suivi des changements apportés au site Web et tenue d’un journal historique des activités ou des transactions;

3. Approche orientée événement : capture des événements ou des transactions ayant lieu entre le site Web et un utilisateur. Il s’agit de documenter la date et l’heure de l’événement, l’adresse IP depuis laquelle la transaction a été réalisée, le profil de l’utilisateur, la requête ou l’action réalisée, les ressources utilisées et ayant servi à l’utilisateur ainsi que les métadonnées associées à la transaction et aux documents produits.

Les politiques d’archivage proposées par des archives nationales rappellent aussi les principes archivistiques devant être respectés, sans quoi l’intégrité des archives capturées et leur complétude ne seraient pas garanties. Pour opérationnaliser ces principes, des mesures d’archivage peuvent porter sur l’ensemble du site Web (macro-archivage), viser des sections ou des pages particulières du site Web (micro- archivage), ou cibler des documents de gestion du site Web (méta-archivage). Les actions suivantes ont été recommandées.

Macro-archivage des sites Web :

 Capture de l’ensemble du site Web à des intervalles prédéterminés;

 Conservation des anciennes versions du site (si elles existent) et des portraits réalisés;

 Sauvegarde d’une copie en ligne du site archivé (archives en ligne du site). Micro-archivage des sites Web :

 Sauvegarde périodique de la carte du site;

 Capture des documents « signifiants » au fur et à mesure de leur création dans un système d’archivage;

 Conservation d’une copie des formulaires en ligne;  Capture des transactions depuis le serveur.

Méta-archivage des sites Web :

 Production périodique et archivage du rapport consignant les changements apportés au site Web incluant le nom des auteurs du changement et la date;  Conservation des courriels communiqués à un utilisateur suite à l’utilisation

d’une application;

 Sauvegarde du rapport produit par une base de données suite à l’entrée de données en ligne par un utilisateur;

 Périodiquement, documentation des technologies de développement du site, des procédures d’édition et de gestion des contenus, des guides et procédures de gestion de l’information diffusée sur le site Web.

Selon les politiques analysées, ces trois niveaux d’actions sont complémentaires. Nous n’avons pas pu confirmer cette assertion sur le terrain. Dans les milieux universitaires étudiés, par exemple, les organismes cumulent non seulement des captures périodiques de leur site Web, auxquelles nous n’avons pas eu accès, mais procèdent aussi à un archivage sélectif de pages Web particulières. Nous n’avons pas pu vérifier si les webmestres produisent une documentation Web qui, elle aussi, est archivée. Les webmestres interviewés ne documentent pas leurs tâches essentiellement par manque de temps. Nous n’avons pas pu confirmer, par conséquent, si les portraits des sites Web sont suffisants ou s’il faut archiver d’autres types de documents pour constituer des archives Web complètes et de qualité.

Pour opérationnaliser ces choix, l’ensemble des politiques analysées suggère une démarche systématique :

 Évaluer la vulnérabilité redditionnelle du site Web;

 Documenter tout changement qui survient sur le site Web et ses différentes composantes (documentaires et technologiques);

 Utiliser des liens permanents;

 Assigner des délais de conservation aux archives Web;  Intégrer les documents créés dans un système d’archivage.

Les politiques analysées mettent l’accent sur les critères de sélection des archives Web. En plus des besoins administratifs et des exigences légales, les archives Web sont également conservées pour leur valeur sociétale. L’approche d’évaluation des archives Web ne diffère donc pas de celle utilisée pour les archives en général :

« […] records of websites can be appraised in the same way as any other record. PROV’s Appraisal Policy suggests that the following factors be considered in determining a retention period:

• Business operation and administration needs • Legislative and regulatory requirements

• Public administration, organisational and social accountability • Social obligations of the Victorian public sector

• Social interests of the people and groups of Victoria

• Fundamental rights and entitlements (including human and cultural rights)

• Significance to Victoria. » (Public Record Office Victoria, 2007: 16)

L’évaluation archivistique d’un site Web ne se limite pas au contenu informationnel. Toutes les composantes d’un site Web doivent être considérées :

« The appraisal of web records requires all elements of a website be considered, including pages, content items, files, background processes, look and feel, automated or manual transactions, and evidence of business activity in creating and maintaining websites. » (Archives New Zealand, 2009: 11)

Au niveau des outils d’archivage, les politiques étudiées indiquent que la capture d’un site Web pourrait être réalisée à distance grâce à un logiciel robot (crawler) ou en faisant appel à un service d’archivage. À titre d’exemple, The Melbourne University et University of Toronto sont abonnées au service Archive-It d’Internet Archive pour la capture périodique de leur site Web public. L’archivage d’un site pourrait également être possible en exploitant les fonctionnalités d’un

système de gestion de contenus ou en intégrant les documents Web à un système d’archivage électronique, et ce, depuis leur création. Ces deux approches sont résumées dans la citation suivante :

« Approaches to choosing a system to manage web records include: - using a web publishing system, such as a content management system (CMS), as a recordkeeping system […],

- using an electronic recordkeeping system, such as an Electronic Document and Records Management System (EDRMS), to manage content published on the web. […]. » (New Zealand Archive, 2009: 9) Les politiques analysées n’élaborent pas beaucoup sur les stratégies de préservation des sites Web archivés. On y rappelle seulement les problèmes d’obsolescence des technologies, la nécessité de planifier la migration périodique des documents vers d’autres supports, l’intérêt de choisir des formats normalisés pour la conception des sites Web organisationnels ou l’utilisation d’identifiants uniques et la documentation des procédures. Les solutions de pérennisation des sites Web restent très théoriques, comme l’indique cette citation :

« Normalisation (or format migration) means accessing a web record in a different format from that in which it is currently held. A normalisation or migration strategy ensures archived material remains available independent of the system that created it, yet important elements of the record, such as look and feel and context are retained. » (Archives New Zealand, 2009: 25)

En aucun cas les politiques analysées font référence à des normes telles que la norme ISO 28500 : 2009 qui définit le format de fichier WARC pour l’archivage de l’internet ou la norme ISO 14721 relative au modèle OAIS. Pareillement, les politiques d’archivage ne précisent pas toujours les principes d’édition des sites Web. Elles renvoient toutefois les personnes concernées aux guides des sites Web qui présentent des standards et des règles pour la création et la gestion des sites Web.

Au moment de la constitution du corpus de politiques à analyser, le phénomène du Web 2.0 n’était pas assez développé pour que l’on retrouve des politiques lui étant propres. Cet aspect n’est ainsi pas présent dans notre analyse, mais il est à noter que des politiques plus récentes abordent les problématiques liées à

l’archivage du Web 2.0 et en proposent des stratégies d’archivage (ARMA International, 2011; NARA, [s.d.]a; NSW, 2009b).

Les politiques analysées se distinguent les unes des autres sous plusieurs aspects. Alors que certaines portent sur des aspects théoriques liés aux archives Web, d’autres sont de nature plus technique. Quelques-unes rappellent les principes archivistiques pour la gestion des archives Web, plusieurs s’attardent sur les avantages et inconvénients des approches et techniques d’archivage propres aux sites Web. Le lecteur est souvent renvoyé à d’autres politiques et documents complémentaires pour pouvoir dresser un portrait complet de la démarche de gestion, de conservation et de préservation des sites Web.

Somme toute, les politiques analysées se complètent, mais elles n’offrent pas toutes les informations nécessaires sur l’ensemble du processus d’archivage d’un site Web. La dispersion des recommandations et des outils à utiliser ou à mettre en place ainsi que la focalisation sur les problématiques techniques n’offrent pas une vision globale du processus de gestion et d’archivage d’un site Web organisationnel.

En observant les forces et les faiblesses de chacune des politiques étudiées, et suite à l’observation des milieux, nous proposons dans le chapitre Discussion un modèle de politique type pour l’archivage des sites Web organisationnel qui présente les principes directeurs à suivre et la méthodologie d’analyse des risques à mettre en place afin d’identifier les documents à conserver ainsi que la méthode, la technique et la fréquence d’archivage avec des exemples d’outils à développer (ex. : règle de conservation spécifique, politique de gestion des URL).

En résumé, depuis les débuts du Web, les institutions archivistiques ont reconnu l’intérêt de bien gérer les documents issus des technologies, et ce, pour les besoins des organisations ou de la recherche. Plusieurs politiques d’archivage du Web sont diffusées en ligne. Nous les avons analysées dans l’objectif d’identifier les systèmes Web visés, les responsables de l’archivage des sites Web dans une organisation, l’unité d’archivage ainsi que les choix méthodologiques et techniques devant être établis.

L’archivage du Web organisationnel est une tâche partagée entre différents intervenants : webmestres, archivistes et tout autre acteur impliqué sur le plan technique ou de gestion d’un site Web organisationnel. Ces politiques rappellent la valeur archivistique d’un site Web organisationnel (valeur primaire et valeur secondaire ou sociétale) et identifient les documents et les composantes d’un site Web à archiver. L’archivage d’un site Web peut se réaliser à trois niveaux complémentaires : macro-archivage (l’ensemble du site Web), micro-archivage (certaines sections ou éléments particuliers du site Web) et méta-archivage (documents relatifs à la gestion et à la maintenance du site Web). Les unités d’archivage sont déterminées grâce à une démarche d’analyse des risques. Les documents devant être archivés afin de témoigner des activités en ligne d’une organisation doivent être intégrés dans un calendrier de conservation afin de gérer leur cycle de vie.