• Aucun résultat trouvé

Gouvernance et gestion de l’information Information management governance

3.9 L’impact de l’évolution des systèmes décisionnels sur les architectures de référence

3.9.10 Gouvernance et gestion de l’information Information management governance

nance

La gouvernance de l’information fait référence aux disciplines, technologies et solutions utilisées pour gérer les informations au sein d’une entreprise. La gouvernance des données et information comprend trois volets fondamentaux : le cycle de vie, la qualité et la sécurité des données. On y inclut aussi les données de référence de l’entreprise, la gestion des métadonnées et aussi leur catalogue. Nous revenons plus en détails sur ces aspects dans le chapitre 4.

Data Lifecycle Management : Data Lifecycle Management est une discipline qui s’applique non seulement aux données analytiques, mais également aux données opérationnelles, de base et de référence au sein de l’entreprise. Cela implique la définition et la mise en œuvre de politiques sur la création, le stockage, la transmission, l’utilisation et la destruction éventuelle des données, afin de garantir qu’elles soient traitées de manière à être conformes aux exigences commerciales et aux mandats réglementaires. Dans le cadre des données massives, cet aspect est très important, de part la volumétrie des données qui est générée, mais aussi au niveau des processus d’archivage de ces données (voir section3.1.4).

Les données de base - Master data and Entity : Les données de base et d’entité fournissent aux utilisateurs et aux applications une "source unique de vérité" pour les entités critiques. Ce sont les notions de "Master Data Management" qui sont parfois assimilées aux données de référentiels d’une organisation.

Reference Data : Les données de référence sont un concept similaire aux données de base et aux données d’entité, mais elles se rapportent à des éléments de données communs tels que les codes de localisation, les taux de change, etc., utilisés par plusieurs groupes ou secteurs d’activité au sein de l’entreprise. À l’instar des données principales et des données d’entité, les données de référence sont géné- ralement utilisées par les systèmes opérationnels et analytiques. Elles sont donc généralement stockées en dehors du système décisionnel et accessibles lorsque nécessaire pour l’intégration ou l’analyse des données.

Catalogue de donnée : Data Catalog est un environnement contenant des métadonnées relatives aux données stockées dans les zones de stockage du système décisionnel. Le catalogue conserve la localisation, la signification et le lignage des éléments de données, les relations entre eux et les politiques et règles relatives à leur sécurité et à leur gestion. Le catalogue est essentiel pour permettre une gouvernance efficace de l’information et pour permettre l’accès en libre-service aux données à des fins d’exploration et d’analyse.

Cette notion est clé dans un projet de gouvernance des données, et nous y revenons en détail dans le chapitre4.

Modèle de données : Les modèles de données fournissent une représentation cohérente des éléments de données et de leurs relations au sein de l’entreprise. Un modèle de données d’entreprise efficace facilite la représentation cohérente des entités et des relations, simplifiant la gestion des données et leur accès.

Dans la section3.5nous évoquons ces évolutions de modèle, comme le Data Vault par exemple.

Qualité des données : Les règles de qualité des données décrivent les exigences de qualité pour chaque ensemble de données du composant de stockage et fournissent des mesures de la qualité des données pouvant être utilisées par les consommateurs potentiels de données pour déterminer si un ensemble de données convient à un usage particulier. Par exemple, les ensembles de données obtenus à partir de sources de médias sociaux sont souvent rares et donc de "mauvaise qualité", mais cela n’empêche pas nécessairement l’utilisation d’un ensemble de données. Pourvu qu’un utilisateur des données connaisse sa qualité, il peut utiliser ces connaissances pour déterminer quels types d’algorithmes peuvent être appliqués à ces données. Les règles de qualité des données sont définies et gérées dans le composant Gestion de l’information et gouvernance. Ils peuvent être appliqués à un ensemble de données lors de leur ingestion dans le composant Ingestion et Integration, ou à tout moment après leur ingestion.

3.9.11

La sécurité

La sécurité est une considération cruciale pour les systèmes décisionnels. Les données sont un actif d’entreprise qui doit être correctement sécurisé avec les informations qui en découlent. Chaque entreprise doit protéger ses ressources informatiques afin de s’assurer qu’elles ne sont utilisées de manière appropriée que par les utilisateurs autorisés et qu’elles ne sont pas exposées à des concurrents ou à des criminels. Pour certains types d’informations, il existe également des exigences réglementaires en matière de confidentialité et de sécurité, ainsi que des sanctions significatives en cas de non-conformité.

Le composant de sécurité de l’architecture de référence fournit des fonctionnalités permettant de prendre en charge la sécurité des ressources d’informations dans le système décisionnel. Il y a quatre ensembles de capacités dans ce composant :

Masquage de données : Le masquage et la rédaction des données permettent de modifier les attributs de données sensibles de manière à ne pas exposer leur valeur réelle (masquage) ni supprimer ou masquer les valeurs (rédaction). Cela garantit que les attributs sensibles tels que les numéros d’identification personnels, les numéros de compte, etc., ne sont pas exposés à des utilisateurs non autorisés.

Le cryptage : Le cryptage de données est la capacité de crypter des données soit en stockage (au repos), soit en cours de transmission sur un réseau (en mouvement). Le chiffrement garantit que même si les données sont accédées ou copiées, elles ne peuvent être lues que par un utilisateur ou une application autorisée.

Protection des données : La protection des données (Data Protection) est la capacité à utiliser ces capacités et d’autres pour identifier et protéger les actifs d’informations sensibles, surveiller leur accès et leur utilisation, identifier les anomalies et prévoir les menaces avant qu’elles n’entraînent des violations de sécurité potentiellement coûteuses ou catastrophiques.

Sécurité Intelligente : La sécurité Intelligente (Security Intelligence) est la mise en œuvre de toutes ces fonctionnalités sur une plate-forme commune qui favorise la définition et la mise en œuvre cohérente des stratégies de sécurité dans toute l’entreprise.

Avec la venue de la réglementation autour des données personnelles (RGPD), nous proposon de rajouter un composant dédie à ce domaine CONFIDENTIALITE des DONNEES (Data Privacy).