• Aucun résultat trouvé

Partie I: Synthèse Bibliographique

Chapitre 4: Conception de la zone « entreposage des données »

II. Processus de la modélisation dimensionnelle

II.1 Volet « vente »

a) Présentation de l’activité « Vente »

« Une vente est la cession d’un bien ou d'un service en échange d'une somme d’argent convenue entre le vendeur, celui qui cède le bien ou le service, et l'acheteur, celui qui paie » [Larousse, 2008].

SONELGAZ, par le biais de ses quatre filiales, propose la vente d’énergie, (électricité ou gaz), livré par canalisation jusqu’au lieu de consommation, dans le cadre d’un contrat de fourniture.

La vente d’énergie, électrique ou gazière, demeure comme l’activité principale des filiales de distribution du groupe SONELGAZ, réalisant la plus grande partie du chiffre d’affaire du groupe. Les chiffres liés aux ventes se présentent comme des indicateurs d’une grande signification par rapport à la performance du groupe. Ainsi la disponibilité de ces informations s’avère indispensable pour les décideurs de l’entreprise.

b) Grain de l’activité

Le choix du grain le plus fin donne un maximum de flexibilité. Dans le cas des ventes le grain le plus fin, ou le niveau de détail le plus bas, correspond à une opération de facturation12, d’où une ligne de table de fait correspondant à :

Suivi de la quantité et du montant de la vente d’une énergie par tarif à un client activant dans un certain domaine à une date donnée.

12 Ce n’est qu’après facturation que la quantité et le montant consommé sont arrêtés, d’où la vente.

c) Les dimensions participantes du modèle

Les dimensions ont pour objectif de décrire le fait, donc on essaye de recens informations qui décrivent une

1. Dimension Temps La dimension temps est

entrepôt de données, car en pratique tout entrepôt de données est une série temporelle. Le temps est le plus souvent la première dimension dans le classement sous jacent de la base de données » [Kimball, 2001].

La dimension temps se présente com

Figure II.11

Le niveau de détail le plus bas de cette dimension est la journée. En effet, les utilisateurs ont fait ressortir le besoin de suivre les chiffres au jour le jour et d

ces derniers.

Dans cette dimension, il est

artificielle sert à faciliter la manipulation de la dimension. Le tableau suivant détails sur cette dimension :

sions participantes du modèle

dimensions ont pour objectif de décrire le fait, donc on essaye de recens formations qui décrivent une vente et qui peuvent intéresser les décideurs.

Dimension Temps

La dimension temps est « la seule dimension qui figure systématiquement

entrepôt de données, car en pratique tout entrepôt de données est une série temporelle. Le temps est le plus souvent la première dimension dans le classement sous jacent de la base de

La dimension temps se présente comme suit :

11 : La Dimension Temps de l’activité « Vente

le plus bas de cette dimension est la journée. En effet, les utilisateurs fait ressortir le besoin de suivre les chiffres au jour le jour et d’en garder

il est utilisé une clé artificielle comme clé primair la manipulation de la dimension. Le tableau suivant

dimensions ont pour objectif de décrire le fait, donc on essaye de recenser toutes les vente et qui peuvent intéresser les décideurs.

la seule dimension qui figure systématiquement dans tout entrepôt de données, car en pratique tout entrepôt de données est une série temporelle. Le temps est le plus souvent la première dimension dans le classement sous jacent de la base de

».

le plus bas de cette dimension est la journée. En effet, les utilisateurs garder l’historique de comme clé primaire. Cette clé la manipulation de la dimension. Le tableau suivant donne plus de

Désignation Détails Code_temps

Date Jour

Jour_semaine Mois

Mois_annee Annee_mois

Semaine_dans_annee Annee

Trimestre

Trimestre_annee Saison

Evénement

Clé artificielle de la dimension temps.

La date au format complet.

Position du Jour dans le mois.

Nom des jours de la semaine.

Nom du mois.

Numéro du mois dans l’année.

Année et mois (concaténation).

Numéro de la semaine dans l’année.

Année de la date.

Trimestre de la date.

Trimestre et année (concaténation).

Saison à la quelle appartient une date.

Evénement survenu lors de cette date.

Tableau II.5 : Tableau descriptif de la dimension « Temps ».

2. Dimension client

Le client s’impose comme un élément important dans l’analyse

analystes et les décideurs de l’entreprise. Outre ce qu’il représente dans une opération de vente, l’analyse du comportement du client peut aider l’entreprise à mieux

Figure II.12

La dimension client décrit un client, l’acheteur. Un client est référencié par son lieu de consommation, c'est-à-dire quatre clients qui ont habité le même lieu, sont considérés comme un seul client. Pour permettre la traçabilité et le suivi d’un client on a

artificielle. Celle-ci aide à pallier à l’insuffisance de la codification en pour une finalité décisionnelle

Le client s’impose comme un élément important dans l’analyse

analystes et les décideurs de l’entreprise. Outre ce qu’il représente dans une opération de analyse du comportement du client peut aider l’entreprise à mieux

12 : La Dimension Client de l’activité «

dimension client décrit un client, l’acheteur. Un client est référencié par son lieu de dire quatre clients qui ont habité le même lieu, sont considérés comme un seul client. Pour permettre la traçabilité et le suivi d’un client on a

aide à pallier à l’insuffisance de la codification en vigueur, notamment le. Les caractéristiques qui décrivent un client sont:

Le client s’impose comme un élément important dans l’analyse, et intéresse les analystes et les décideurs de l’entreprise. Outre ce qu’il représente dans une opération de

analyse du comportement du client peut aider l’entreprise à mieux le satisfaire.

imension Client de l’activité « Vente ».

dimension client décrit un client, l’acheteur. Un client est référencié par son lieu de dire quatre clients qui ont habité le même lieu, sont considérés comme un seul client. Pour permettre la traçabilité et le suivi d’un client on a introduit une clé vigueur, notamment . Les caractéristiques qui décrivent un client sont:

Désignation Détails

La référence du lieu de consommation

Le numéro affecté à un client FSM 13(ce champ est utilisé si le client est un abonné FSM)

Le nom du client.

Adresse du client.

Code postal du lieu de consommation.

Commune du lieu de consommation.

Agence à laquelle le lieu de consommation est affilié.

La direction régionale où le lieu de consommation est affilié.

La wilaya du lieu de consommation.

La filiale à laquelle le lieu de consommation est affilié.

Secteur d’activité du client dans le lieu de consommation.

Débit gaz installé sur le lieu de consommation.

Débit électricité installé sur le lieu de consommation.

Type du client (ordinaire ou FSM).

Le groupe de facturation du client (Chaque client appartient à un groupe de facturation. Il existe 60 groupes de facturation).

La tournée de relève à laquelle appartient le client.

Tableau II.6 : Tableau descriptif de la dimension « Client ».

13 FSM : Facturation sur mémoire.

3. Dimension facture

Une facture est un document relatif au fait de vente. Cette dernière contient un certain nombre d’informations intéressantes pour une analyse. Elle décrit les différentes

caractéristiques d’une facture, et qui caractérisent aussi une vente.

Figure II.13 :

La facture est identifiée

présent, à la facture en cas d’annulation. L

champ type facture. On pourrait dans ce cas penser à

Cependant une telle clé nuirait fortement aux performances souci de performance, on a introduit une clé artifici

plus justifiable que la dimension est une dimension à évolution rapide.

caractérisée par :

Dimension facture

document relatif au fait de vente. Cette dernière contient un certain nombre d’informations intéressantes pour une analyse. Elle décrit les différentes

caractéristiques d’une facture, et qui caractérisent aussi une vente.

La Dimension Facture de l’activité « Vente

par un numéro facture. Ce même numéro est affecté la facture en cas d’annulation. La différence entre les deux se fait

champ type facture. On pourrait dans ce cas penser à l’adoption d’une clé primaire composée.

nuirait fortement aux performances du système. Pour cela, et dans un souci de performance, on a introduit une clé artificielle à cette table. Ce choix est d’autant plus justifiable que la dimension est une dimension à évolution rapide.

document relatif au fait de vente. Cette dernière contient un certain nombre d’informations intéressantes pour une analyse. Elle décrit les différentes

Vente ».

par un numéro facture. Ce même numéro est affecté, dans le cas ifférence entre les deux se fait alors grâce au l’adoption d’une clé primaire composée.

. Pour cela, et dans un elle à cette table. Ce choix est d’autant plus justifiable que la dimension est une dimension à évolution rapide. La facture est

Désignation Détails

Le numéro facture dans le système source.

Date de la facturation.

Cycle d’émission de la facture.

Type de la facture (Emission ou Annulation).

Type de la relève (les relèves d’index se font de différentes manières).

Montant du soutient de l’état (les wilayas du sud).

Tableau II.7 : Tableau descriptif de la dimension « Facture ».

4. Dimension zone géographique La dimension zone géographique besoins au sein du groupe, il parait zones géographiques. Le grain le plus bas

dernières sont susceptibles d’évolution dans le temps (appartenance a une filiale ou une wilaya). On jugé donc nécessaire

l’évolution de la dimension et

Figure II.14 : La D

Les caractéristiques de la dimension « tableau suivant :

Dimension zone géographique

géographique décrit la zone où le fait a eu lieu. Après l’étude des besoins au sein du groupe, il parait intéressant de faire des comparaisons par rapport à des zones géographiques. Le grain le plus bas de cette dimension correspond aux

d’évolution dans le temps (appartenance a une filiale ou une nécessaire d’introduire une clé artificielle pour permettre le suivi de

et d’assurer la cohérence des données.

Dimension Zone géographique de l’activité «

de la dimension « Zone géographique » sont explicitées dans le le fait a eu lieu. Après l’étude des intéressant de faire des comparaisons par rapport à des de cette dimension correspond aux communes. Ces d’évolution dans le temps (appartenance a une filiale ou une une clé artificielle pour permettre le suivi de

Vente ».

» sont explicitées dans le

Désignation Détails

Code de l’agence (une agence regroupe plusieurs communes).

Nom de l’agence.

Adresse de l’agence.

Téléphone de l’agence.

Code de la direction de distribution.

Nom de la direction de distribution.

Adresse de la direction de distribution.

Téléphone de la direction de distribution.

Code de la wilaya.

Nom de la wilaya.

Code de la filiale de distribution (il y a quatre filiales).

Adresse de la filiale de distribution.

Téléphone de la filiale de distribution.

Tableau II.8 : Tableau descriptif de la dimension « Zone géographique ».

5. Dimension activité

Figure II.15 : Cette dimension décrit les

chargée à partir d’un tableau transmit par le ministère des finances, que beaucoup d’analyses observée

Souvent, des analyses sont faite

tarification est affectée de manière étudiée selon le type du client.

cette dimension contient :

La Dimension Activité de l’activité « Vente Cette dimension décrit les différents secteurs d’activités économiques.

chargée à partir d’un tableau transmit par le ministère des finances, et très importante, dès lors observées pendant l’étude des besoins, se base sur cette dimension.

Détails

Le code de l’activité.

Libellé de l’activité.

: Tableau descriptif de la dimension « Activité

16 : La Dimension Tarif de l’activité « Vente ».

des analyses sont faites par rapport aux tarifs affectés tarification est affectée de manière étudiée selon le type du client. En plus du

Détails

Le code tarif qui est appliqué actuellement.

Abréviation du tarif telle qu’utilisée dans l’entreprise et codifiée sur les documents officiels.

Une description sommaire du tarif.

10 : Tableau descriptif de la dimension « Tarif ».

Vente ».

s économiques. Celle-ci est très importante, dès lors pendant l’étude des besoins, se base sur cette dimension.

Activité ».

».

par rapport aux tarifs affectés au client. Cette En plus du « code_tarif »,

code tarif qui est appliqué actuellement.

dans l’entreprise et

Tarif ».

7. Dimension énergie

Figure II.17

Les filiales de distribution de SONELGAZ livrent plusieurs types d’énergie différent par un certain nombre de caractéristiques

caractéristique ou à une autre est très contexte du fait. Cependant il existe des clés ne référençant aucune

sont dites dimensions dégénérées.

La dimension puissance max dimension. En effet, celle-ci

17 : La Dimension énergie de l’activité « Vente

filiales de distribution de SONELGAZ livrent plusieurs types d’énergie différent par un certain nombre de caractéristiques. Avoir une segmentation par rapport à une

une autre est très intéressant lors d’une analyse. Une énergie est décrite

11 : Tableau descriptif de la dimension « Energie».

Dimension dégénérée « Puissance maximale »

Les clés étrangères de la table de fait référencent les dimensions qui représentent le contexte du fait. Cependant il existe des clés ne référençant aucune dimension, ces dernières sont dites dimensions dégénérées.

La dimension puissance maximale est dans ce cas un exemple de ce type de ne contient aucune description textuelle et elle ne peut être dimension. Elle est identifiée par sa valeur dans la ta

dernier la possibilité d’analyser les ventes selon la puissance maximale Vente ».

filiales de distribution de SONELGAZ livrent plusieurs types d’énergie qui voir une segmentation par rapport à une ne énergie est décrite dans la table des faits et tes selon la puissance maximale

d) Les mesurables

Les mesurables qui correspondent à l’activité des ventes et qui permettent de mesurer les performances de cette activité, sont la « quantité vendue » et le« montant de la vente en hors taxe » et les « primes fixes ».

e) Le modèle en étoile de l’activité « Vente »

Figure II.18 : Modèle en étoile de l’activité « Vente ».

f) Les agrégats

Les tables d’agrégats améliorent les performances du Data Warehouse, en réduisant le nombre de lignes que le SGBD manipule afin de répondre à une requête. Cela se fait grâce à l’agrégation des données contenues dans les tables de faits détaillées et qui sont stockées dans de nouvelles tables de faits.

La construction des agrégats se base sur le modèle en étoile détaillée, et elle peut nécessiter:

La création de nouvelles dimensions dérivées : la construction d’un modèle agrégé nécessitera la suppression de quelques attributs d’une dimension qui désigne le grain le plus fin.

La suppression de quelques dimensions : le modèle agrégé peut engendrer l’élimination de certaines dimensions qui n’apparaissent pas au niveau de détail voulu.

On peut aussi :

Créer de nouveaux faits: lors de la création de la table de faits agrégée on peut rajouter quelques faits qui n’existaient pas dans la modèle de base. En effet, l’usage et la signification des tables agrégées peuvent différer du modèle de base.

Créer des tables pré-jointes : une table d’agrégat peut être construite à partir d’une jointure entre la table de faits et une ou plusieurs dimensions. Le résultat est stocké dans une seule table dite pré-jointure.

Une table d’agrégat peut être invisible ou visible à l’utilisateur final :

• Elle est invisible lorsqu’elle reflète exactement le modèle de base

• Elle est visible lorsqu’elle contient des faits supplémentaires.

Les résultats issus d’une table agrégée ou du modèle de base doivent être identique.

Pour cette phase, on s’inspire de la démarche décrite par C. Adamson dans son livre

« Mastering the Data Warehouse Aggregates, Solution for Star Schema Performance ». La démarche consiste à :

1- Enumérer les agrégats potentiels à partir d’une étoile détaillée : pour détecter les agrégats potentiels et choisir ceux à implémenter dans le Data Warehouse. Il est nécessaire de bien décrire chaque agrégat.

2- Détecter les agrégats utiles : choisir des agrégats utiles à partir des agrégats potentiels.

3- Construire le modèle agrégé : enfin on construit le modèle agrégé tout en prenant en considération les dimensions dérivées commune entre les différents modèles.

Les agrégats sont conçus, en général, comme des modèles dimensionnels.

1) Les agrégats potentiels

Le tableau suivant décrit, d’une manière simple et efficace, les agrégats potentiels du modèle dimensionnel de base de l’activité des ventes:

Dimension Agrégats potentiels

Nombre d’agrégats

possibles

Temps Mois, trimestre, année, saison 4

Energie Type, débit 3

Activité Code activité 1

Tarif Tarif 1

Zone Tournée, agence, commune, DR, wilaya, filiale 6

Facture Date, cycle, type, relève 4

Client Numéro, commune, agence, DR, wilaya, filiale, activité,

débit gaz, débit électricité, type 10

Tableau II.12 : Liste des agrégats potentiels pour l’activité « Vente ».

2) Les agrégats utiles :

Les agrégats potentiels ne sont pas en effet tous utiles, soit par le nombre de lignes agrégées ou par les informations fournies. Pour cela on réduit la liste des agrégats à ce qui suit :

Dimension Agrégats utiles Nombre d’agrégats retenus

Temps Mois, trimestre, année, saison 4

A partir du tableau précédent nous choisissons les agrégats qui nous semblent les plus pertinents et susceptibles de faire l’objet d’accès fréquents. nous arrêtons la liste des modèles agrégats suivants :

Ventes journalières par type d’énergie par activité par commune.

Ventes mensuelles par DR (agrégation de plus de dix mille lignes).

Ventes mensuelles par cycle par type de relève (agrégation de plus de trois millions lignes).

La modélisation des agrégats se fait grâce aux principes de la modélisation dimensionnelle.