• Aucun résultat trouvé

Modélisation multidimensionnelle

2. CONCEPTION

2.2 Modélisations des données du Data Warehouse

2.2.1 Modélisation multidimensionnelle

La modélisation multidimensionnelle consiste à considérer un sujet analysé comme un point

dans un espace à plusieurs dimensions. Les données sont organisées de manière à mettre en évidence le sujet analysé et les différentes perspectives de l'analyse.

Ce modèle conceptuel a été simplifié au maximum pour permettre au plus grand nombre d'utilisateurs d'appréhender l'organisation des données et de comprendre ce que le Data Warehouse mémorise. [23]

A- Eléments de modélisation multidimensionnelle

Le modèle multidimensionnel est une représentation conceptuelle du Data Warehouse sous forme d’un ensemble de cubes reliés entre eux et adaptés à l’analyse multicritères.

Afin de comprendre la modélisation multidimensionnelle, on va décrire trois concepts : le cube, le fait et la dimension.

A.1. Concept de fait

Le fait modélise le sujet de l’analyse. Un fait est une « observation du marché », il est formé de mesures correspondant aux informations de l’activité analysée.

Les mesures d’un fait sont numériques et généralement valorisées de manière continue [20][24]. Les mesures sont numériques pour permettre de résumer un grand nombre d’enregistrement, on peut les additionner, les dénombrer ou bien calculer le minimum ou le maximum. Les mesures sont valorisées de façon continue, elles sont aussi additives ou semi- additives afin de pouvoir les combiner au moyen d’opérations arithmétiques. [16]

A.2. Concept de dimension

Une dimension modélise une perspective de l’analyse. Le sujet à analyser, c'est-à-dire le fait, est analysé suivant différentes perspectives. Ces perspectives correspondent à une catégorie utilisée pour caractériser les mesures d’activité analysées.

Une dimension se compose de paramètres correspondant aux informations faisant varier les mesures de l’activité.

Chaque dimension est forme par un ensemble d’attributs et chaque attribut peut prendre différentes valeurs. Les attributs sont discrets, c'est-à-dire que les valeurs possibles sont bien déterminées et sont des descripteurs constants.

Les dimensions possèdent en général des hiérarchies associées qui organisent les attributs à différents niveaux pour observer les données à différentes granularités. Une dimension peut avoir plusieurs hiérarchies associées, chacune spécifiant différentes relations d’ordre entre ses attributs.

[25]

Une hiérarchie organise les attributs d'une dimension selon une relation "est_plus_fin"

conformément à leur niveau de détail.

les données sont généralement analysées en partant d'un faible niveau de détail vers des données plus détaillées pour "forer vers le bas". Pour définir ces différents niveaux de détail,

chaque dimension est munie d'une (ou plusieurs) hiérarchie(s) des paramètres. La hiérarchie sert lors des analyses pour restreindre ou accroître les niveaux de détail de l'analyse. [16]

A.3. Cube

Le cube de données offre une abstraction très proche de la façon dont l’analyste voit et interroge les données.

Un cube est un ensemble de mesures organisées selon un ensemble de dimensions. C’est une

représentation dimensionnelle d’un fait (sujet d’analyse) et de ses dimensions (critères d’analyse). Par exemple, un cube de ventes qui comprend les dimensions « Temps », « Produits » et « Magasins » et la mesure « Ventes en $ ». Pour chaque combinaison des trois dimensions (Magasins, produits, temps), on peut accéder à la mesure numérique associée au fait ventes (cellule non vide). Les interrogations s'interprètent souvent comme l'extraction d'un plan, d'une droite de ce cube (par exemple, lister les ventes du produit A), ou l'agrégation de données le long d'un plan ou d'une droite (par exemple, total des ventes du produit A). [24]

Figure 17 : Modèle en cube.

B. Schémas de modélisation

Partant du principe que les données sont des faits à analyser selon plusieurs dimensions, il est possible de réaliser une structure de données simple qui correspond à ce besoin de modélisation multidimensionnelle. Au niveau logique, cela peut se traduire par trois modèles différents : en étoile, en flocon de neige ou en constellation. [16]

B.1. Modèle en étoile

Le modèle en étoile tire son nom de sa configuration. Il contient un objet central, nommé table

des faits. Cet objet central est connecté à un certain nombre d’objets de manière radiale, les tables de dimension. La table des faits, comme son nom l’indique, contient les faits. Les tables de dimensions contiennent les attributs définissant chacun des membres des dimensions. Elles sont dénormalisées.

Toutes les données décrivant les attributs de la dimension sont stockées à l’intérieur d’une même table de dimension. La définition des niveaux s’effectue à l’aide de champs de la table. Pour chacun des niveaux, un champ identifiant les attributs du niveau est obligatoire. [26]

Figure 18 : exemple de modèle en étoile.

Les plus grands avantages de ce type de modèle sont la lisibilité et la performance:[23]

- La lisibilité : ce modèle est très parlant pour l’utilisateur et sa finalité est évidente. Il est

naturellement orienté sujet et définit clairement les indicateurs d’analyse. - La performance : les chemins d’accès à la base de donnés sont prévisibles. B.2. Schéma en flocon

Une modélisation en flocon consiste à décomposer les dimensions du modèle en étoile en sous hiérarchies, le fait est conservé et les dimensions sont éclatées conformément à sa hiérarchie des paramètres. L’avantage de cette modélisation est de formaliser une hiérarchie au sein d’une dimension. Par contre, la modélisation en flocon rend pratiquement la présentation des informations plus complexe en terme de lisibilité et de gestion. [16] [23]

Vente

Quantité

Montant

Temps

Année Saison Trimestre Mois Jour

Produit

Type prod Gamme Nomprod Couleur

Géographie

Région Département Ville

Figure 19 : exemple de modèle en flocon.

B.3. la modélisation en constellation

Il s'agit de fusionner plusieurs modèles en étoile qui utilisent des dimensions communes. Un modèle en constellation comprend donc plusieurs faits et des dimensions communes ou non.

Figure 20 : exemple de modèle en constellation.

Trimestre Trimestre Nom couleur Couleur Département Géographie Ville Département Région Région Vente Quantité Montant Type Type prod Produit Nomprod Gamme Gamme Année Année Mois Mois Temps Jour Saison Saison