• Aucun résultat trouvé

RESULTATS ET DISCUSSIONS

CHAPITRE 7 Intégration dans un système d'information local

7.1 Centraliser et faciliter l'accès à la donnée

7.1.2 Archiver et organiser la donnée

Maintenant que les notions d’exhaustivité et de pertinence ont été définies, il est plus facile d’appréhender la limite qui existe entre un simple archivage de la donnée et la valorisation de celle-ci. Toutefois, les concepts d’archivage et d’organisation d’une donnée méritent d’être abordés plus en détail pour affiner la compréhension et la définition des objectifs dans la mise en place d’un système d’information. Lors de la création de tout système, des concessions doivent être faites au profit d’avantages prépondérants pour le bon fonctionnement dudit système. La limite entre archivage et valorisation d’une donnée s’inscrit dans cette catégorie de choix : quelles sont les concessions acceptables dans l’exhaustivité de la mise à disposition de l’information, pour en améliorer et en faciliter la communication ?

Un bon archivage de la donnée est une étape indispensable pour consolider tout socle de données acquis puisque c’est lui qui permet, d’une part, de retrouver l’information et, d’autre part, de le faire rapidement. Remarquons concernant le premier point « retrouver l’information », que la problématique de l’archivage a été liée, de tout temps, à l’insécurité de la conservation, car les documents n’existent souvent qu’en un seul exemplaire et, malgré une protection méticuleuse (contre le vol, le feu, l’humidité, …), réussir à les conserver en état n’est jamais garanti. D’ordre pragmatique, ce paramètre est à considérer dans la mesure où il impacte la quantité de données à gérer. De fait, aujourd’hui la plupart des services géologiques tendent à remplacer leurs archives « papier » par des bases de données électroniques (Van Der Meulen et al., 2013). Le canton de Genève n’y fait pas exception. Avec le développement des technologies actuelles, la dématérialisation des documents par leur informatisation est un processus courant, mais relativement long. Depuis plusieurs années, les documents sont ainsi numérisés et stockés sur des serveurs protégés. Cependant, cette nouvelle accumulation de fichiers informatiques entraîne d’autres problèmes posés par l’archivage électronique et que l’on ne peut ignorer dans le cadre d’un projet comme celui-ci. Tout d’abord, il s’agit du coût et de la durée de vie des supports. Les locaux des archives « papier » se sont transformés en centres de données ou « data center » où sont regroupés l’ensemble des constituants des systèmes informatiques. Ces locaux sont très souvent énergivores, car, au-delà de l’électricité consommée pour faire tourner le système, ils doivent être climatisés pour éviter la surchauffe des installations (Douchet, 2015;

Uddin et al., 2015). Une surveillance et une logistique lourdes sont également nécessaires dans ces espaces, engendrant, par là-même, des coûts supplémentaires. De plus, un support informatique a une durée de vie limitée, de quelques mois pour les DVD à une dizaine d’années pour les disques durs. Il faut donc également assurer le suivi et le remplacement des éléments supports avant qu’ils ne se détériorent en entraînant alors la perte de la totalité des données sauvegardées. Au vu de la complexité d’une telle gestion, les utilisateurs ont de plus en plus tendance à décentraliser leurs données et à sous-traiter leur gestion à de nouvelles entreprises spécialisées dans l’archivage informatique. Ces entités économiques du 21ème siècle mettent en place d’immenses « Datacenter» et proposent un suivi et une sauvegarde protégée des données sur le principe des systèmes de « cloud55 ». Elles offrent également une aide dans l’organisation des documents pour éviter que le désordre ne s’installe au fur et à mesure du stockage et que l’information ne soit plus accessible facilement. Cela nous amène à notre deuxième condition nécessaire à un bon archivage : trouver rapidement la donnée recherchée, voire assister la recherche en guidant l’utilisateur par la structure même de l’archivage. Aussi, le classement et l’arborescence des dossiers doivent-ils être correctement réfléchis et conçus, avec une bonne anticipation des problématiques et de l’évolution des besoins. Cela peut parfois prendre du temps et engager des investissements importants, mais est néanmoins nécessaires au bon

55Le stockage dans un cloud est un modèle de stockage de données dans lequel les données numériques sont stockées dans des groupes logiques. L'environnement physique est généralement détenu et géré par une société d'hébergement à l’extérieur de l’infrastructure de l’entreprise. Ces fournisseurs de stockage en nuage sont chargés de garder les données disponibles et accessibles. Les personnes et les organisations achètent ou louent des capacités de stockage auprès des fournisseurs pour stocker les données relatives aux utilisateurs, à l'organisation ou aux applications (Wikipedia, 2017).

103

déploiement du système sur le moyen et le long terme. L’organisation de documents sur un serveur ne peut pas être personnelle et, par conséquent, subjective. Une rigueur et une rationalité des plus universelles et objectives possibles, sont donc nécessaires et c’est précisément un des points qui se révèle délicat. Solliciter régulièrement un regard extérieur sur l’infrastructure que l’on cherche à mettre en place a donc été privilégié. Afin d’assurer l’opérationnalité, il s’est avéré nécessaire de procéder prudemment étape par étape. Pour commencer, il convient de fondamentalement comprendre et synthétiser les enjeux évidents et moins évidents qui sont recherchés au travers de l’archivage électronique (Chabin et al. 2006) :

Aspect logistique : permet de retrouver rapidement un document recherché pour soi-même ou pour un mandataire externe ;

Aspect technique : permet de pérenniser les connaissances et de les diffuser ;

Aspect sécuritaire : permet la protection du document et la garantie et le contrôle des accès ;

Aspect juridique : permet la traçabilité et le formatage dans le cadre de procédure juridique ;

Aspect pécuniaire : permet d’éviter les doublons de mandats ou les pénalités en cas de pertes de documents importants et d’offrir un gain de temps dans la recherche du document.

Ces aspects concernent donc toute profession ou activité produisant et/ou utilisant des données.

En pratique aujourd’hui, les notions d’archivage sont souvent sous-évaluées ce qui crée des situations très difficiles à corriger par la suite. L’enjeu existe donc dès les prémices de la mise en place du système. Entrons maintenant encore plus encore dans le détail afin d’identifier les méthodologies utiles à notre cas.

En géologie comme dans presque tous les domaines, un seul rapport peut concerner plusieurs objets ou thématiques. Prenons pour exemple le rapport final de l’Evaluation du potentiel géothermique du canton de Genève – PGG (PGG, 2011), document générique intégrant plusieurs objets (forage, cartes géologiques, …) présents dans le bassin genevois. De ce fait il devient difficile de le lier à un seul dossier. La solution choisie est généralement la duplication des rapports et leur intégration dans chacun des dossiers concernés. Inévitablement, il en résulte un alourdissement avéré du volume de données à stocker et le déploiement de nombreuses infrastructures informatiques pour garantir l’espace suffisant de stockage. Il est alors intéressant de se tourner vers des systèmes comme la Gestion électronique des documents (GED) qui peuvent réduire ou prévenir les accumulations importantes de documents. Ce type de système permet d’indexer un document, de lui associer des mots-clefs et de créer des accès spécifiques aux différents utilisateurs (Nicolet, 2017). Il est également possible de lui attribuer plusieurs objets sans devoir multiplier le document qui se retrouve facilement par une recherche des caractéristiques qui lui ont été attribuées. Cependant pour garantir la valeur du document, il convient de prendre en compte l’ensemble du cycle de vie de la donnée. Face à ces nouvelles méthodes d’archivage, des lois ont apporté un cadre clair pour assurer la valeur juridique d’un document. Aussi, pour éviter que la donnée archivée électroniquement ne perde de sa valeur suite à des modifications régulières, chaque amendement apporté au document doit être enregistré et clairement notifié (Chabin et al. 2006). Enregistrer le cycle de vie de la donnée de sa création à sa destruction, c’est garantir son intégrité. Qu’ils soient stratégiques, réglementaires, organisationnels ou géopolitiques, les enjeux et les contraintes de l’archivage sont multiples. Dans tout projet, et en premier lieu dans celui qui nous intéresse ici, il s’avère donc indispensable de considérer chacun de ces aspects pour mettre en place le système d’archivage le mieux adapté aux besoins métier.

104

Dans le cadre du projet GEothermie2020, un mandat supporté par les SIG en collaboration avec le Canton a été déployé concernant l’identification des aspects évoqués ci-dessus (Chablais 2016). L’objectif premier de ce mandat actuellement en cours d’exécution, est de rassembler, trier, classer et archiver toutes les données accumulées concernant le sous-sol genevois, qu’il s’agisse de productions universitaires ou de rapports de bureaux d’ingénieurs. À cette étape-ci, le but est d’assurer l’indexation, la centralisation et l’échange des données avec les nouveaux acteurs du projet, qui, comme illustré sur la Figure 56, sont nombreux.

Figure 56: Vue d’ensemble des acteurs liés au programme GEothermie2020 (Chablais 2016).

Ces collaborations multiples induisent une production et donc une accumulation de données et de rapports d’autant plus importantes. En parallèle, les données brutes continuent aussi d’être collectées, ce qui augmente encore le volume de documents à organiser. Par ailleurs, et comme évoqué précédemment, un tel programme risque de conduire à des doublons de mandats si l’archivage n’est pas correctement opéré. Le flux des rapports reçus est tel que parfois seule une consultation rapide du document est possible dans le temps à disposition des mandataires. Dans le cadre de séances de travail dédiées au mandat, ce sont principalement les résultats qui sont présentés afin d’aller de l’avant. Les rapports complets et les documents détaillés qu’ils contiennent sont souvent amoncelés dans des dossiers difficiles à retrouver. Parfois ils restent stockés dans les boites de réception des courriers électroniques sans être classés, par manque de temps. N’étant absolument pas durable, cette gestion de données risque d’entraver, tôt ou tard, le bon déroulement du programme. Pour ce projet, il est donc vital que tous les acteurs soient sensibilisés et autorisés à consacrer du temps et des investissements à la gestion des données géologiques afin d’assurer le suivi de l’archivage des documents reçus tout au long du déroulement du programme, d’autant plus que la gestion de données est justement au cœur celui-ci.

Mandaté par les SIG et indirectement pas le canton de Genève au travers du programme GEothermie2020 pour l’accompagner dans la centralisation des données acquises à ce jour, le bureau de géologues-géomaticiens, « Hydro-Géo Environnement », s’est largement appuyé sur l’expérience opérationnelle acquise dans le milieu pétrolier par certains membres de l’équipe ayant eu l’habitude de travailler avec un tel socle de données. « Hydro-Géo Environnement »

105

possède également de fortes connaissances en géologie régionale. Il est aussi impliqué dans les projets genevois, ce qui lui permet de comprendre la donnée à organiser. De fait, les bureaux informatiques offrent de très bonnes connaissances de la gestion de données mais s’ils ne les comprennent pas, ils ne peuvent pas prendre les décisions adéquates. La nécessité d’une collaboration entre les domaines est, une fois de plus, primordiale. Dans ce mandat, les géologues du bureau ont proposé l’architecture ci-dessous (Hydro-Geo Environnement, Chablais 2016). Les éléments présentés sont nombreux et abondants, et l’arborescence des dossiers est complexe (Figure 57). L’organisation des données techniques du programme GEothermie2020 se scinde, ici, en plusieurs grandes catégories et correspond à une arborescence typique de projet opérationnel de grande envergure (prospection, exploration, exploitation) :

- en bleu les étapes des projets des SIG : la prospection, l’exploration et l’exploitation ; - en vert les thématiques : Géologie, Hydrogéologie, Géothermie et Pompes à chaleurs,

Systèmes énergétiques et les études environnementales ;

- en rose les partenaires du programme : le canton de Genève, la Confédération et les Communautés de Communes frontalières ;

- en brun un projet identique conduit sur le Canton de Vaud : EnergÔ ; - en jaune les présentations publiques et la communication ;

- en rouge les revues et audits

Figure 57: Proposition d’architecture pour l’archivage des données géologiques correspondants aux données techniques globales du programme Geothermie2020 (Chablais 2016)

Chaque dossier se déploie et se ramifie à son tour en sous-dossiers. L’exemple des forages et des données de puits, présenté dans la Figure 58, est probablement l’un des plus complets et complexes. Il s’agit d’un socle de données très riche qui illustre, à lui seul, l’enjeu de la nécessité d’organiser ces données avec rigueur. Le planning, les opérations, les résultats, l’évaluation, la production et l’administration sont les dossiers principaux pour ces objets.

106 Figure 58: Proposition d’architecture pour l’archivage des données de Forages (Chablais 2016).

Pourtant, un tel système montre des failles : il ne peut évoluer seul et doit constamment être administré pour que la mise à jour des dossiers soit affectée. L’archivage se fait à un temps T et le suivi n’est pas assuré en temps réel. Il faut parfois des mois pour que ce socle de données soit mis à jour chez tous les propriétaires. De plus, lorsqu’un document ne rentre pas dans une case prédéfinie de la structure (« dossier »), l’opérateur peut facilement créer un nouveau dossier.

Cette liberté risque, à terme, de rendre l’arborescence encore plus complexe et de conduire ainsi à un désordre complet du système en place. Ce type de système devient, par ailleurs, très vite obsolète lorsque la quantité de données et le nombre d’acteurs sont trop importants pour respecter les règles d’une arborescence simple. De surcroît, les infrastructures parallèles nécessaires pour assurer l’indexation et la diffusion des documents, GED ou cloud, ne sont pas encore mises en place à ce jour. A l’heure actuelle, les données sont stockées sur des disques durs et partager ces informations pas totalement dématérialisées s’avère délicat. Enfin, avec ce schéma d’infrastructure, il est compliqué, voire impossible, de garantir le cycle de vie et la confidentialité des données. Ce système ne peut donc légitimement pas être considéré comme un projet achevé, mais plutôt comme une première version de recherche. C’est en effet une étape clé qui pose des bases, répond à des questions, en soulève d’autres, et à laquelle il faut désormais se confronter pour mettre en place le système abouti.

Cet exemple de résultat d’organisation de la donnée démontre aussi, une fois de plus, la complexité d’une telle problématique et renforce la nécessité d’œuvrer intensément pour créer, pour le programme GEothermie2020, un système de gestion pérenne et robuste sur la base des interrogations existantes. Retenons donc, pour l’application au cas du canton de Genève, que les réflexions organisationnelles sur l’archivage de données mentionnées plus haut sont indispensables, de même qu’il est tout aussi obligatoire qu’elles soient accompagnées d’une structuration de type arborescente dans un système de GED. En pratique, la prochaine étape est d’extraire, à partir des rapports et documents collectés, les informations considérées comme pertinentes et nécessaires et de les organiser sous forme de tables et d’attributs dans la base de

107

données. Ces informations seront ensuite facilement intégrables et corrélables les unes aux autres et ainsi prêtes pour une valorisation immédiate. De nouveaux plans d’informations ainsi que des modèles accompagnant les utilisateurs du sous-sol pourront facilement être créés grâce aux logiciels de modélisation comme ArcGIS, Move, Isatis, Strater et diffusés via les plateformes comme le SITG et GST. L’archivage électronique ordonné et la mise en valeur des données sous la direction du Canton permettront ainsi d’offrir les outils indispensables au service pour la bonne gestion des géo-ressources de son sous-sol.

7.1.3 Méthodes

Sur base des recherches effectuées jusque-là, il a alors été possible d’établir un protocole expérimental prometteur pour atteindre les premiers résultats intermédiaires concrets dans le projet d’élaboration de la base de données du canton de Genève. Les étapes clés de la méthodologie développée ont été les suivantes :

1. Documenter : rassembler les documents d’intérêts ; 2. Consulter : parcourir ces documents ;