• Aucun résultat trouvé

2 Système de prévision proposé

2.3 Identification des typologies de consommation

La procédure d'identification des tendances permet de caractériser les attributs clés de la série de consommations historiques : Tendance et saisonnalité. Cette caractérisation sert d'une part comme information, remontée auprès de l'utilisateur, et est utilisée d'autre part par le système pour opérer le choix pertinent de la technique de prévision la plus appropriée. La typologie de consommation d'un produit peut en effet varier au cours du temps, et par conséquent, une adaptation du modèle de prévision peut s'avérer nécessaire. Cette procédure est présentée dans Jomaa et al. (2012) et Jomaa et al. (2013. b).

2.3.1 Identification de la tendance

Nous adoptons une règle de test équivalente à celle appliquée dans Pearce (1995). La série de consommation historique est approchée par un modèle linéaire (Droite des moindres carrées ordinaire) et un test de significativité de la pente de la droite est effectué. Si le coefficient de la droite est significativement différent de zéro, la consommation est considérée comme étant tendancielle. Dans le cas contraire, la série n'est pas considérée comme tendancielle.

Figure 29 : Approximation par la droite des moindres carrés ordinaire

0 5 10 15 15 20 25 30 35 40 45 50 Demande Droite MCO

94

Le test de significativité de la pente consiste à vérifier l'influence réelle de la variable exogène (dans notre cas le temps) sur l'endogène (la consommation historique). Les deux hypothèses à confronter s'écrivent :

La statistique de test s'écrit :

étant l'estimation de la pente de la droite des moindre carrées approchant la consommation et étant la variance estimée du coefficient. Cette statistique suit une loi de Student à (n - 2) degrés de liberté, n étant le nombre d'observations de la série historique de consommation. La région critique (de rejet de H0) à un risque α donné s'écrit :

t1-α/2 étant le quantile d'ordre (1 - α/2) de la loi de Student.

Le système calcule la statistique et opère le test R.C. Si l'hypothèse est vérifiée, H0 est rejetée, la pente est significativement différente de zéro et donc la série est tendancielle. Dans le cas contraire, la série ne présente pas de tendance.

2.3.2 Identification de la saisonnalité

Coefficient d'autocorrélation

Makridakis et al. (1998) définissent la saisonnalité dans une série de données comme étant

un motif qui se reproduit à des intervalles de temps fixes. Les ventes de mazout, par exemple, sont élevées pendant l'hiver et bas pendant l'été marquant ainsi une saisonnalité mensuelle. L'utilisation des antihistaminiques peut présenter une saisonnalité annuelle

95

marquée pendant le printemps et l'été et liée à la présence naturelle de pollen durant ces périodes.

Dans la littérature, une saisonnalité mensuelle correspond à un phénomène périodique se reproduisant chaque année à un décalage de douze mois. Le coefficient d'autocorrélation est une statistique clé souvent utilisée dans l'étude et l'identification des phénomènes périodiques. Nous considérons, dans le cas de notre système, une procédure d'identification basée sur cette statistique. Nous revenons en premier lieu sur la notion de corrélation avant de détailler la procédure en question.

Le coefficient d'autocorrélation d'une série temporelle à un décalage donné k permet de traduire le niveau de corrélation de la série avec la même série de données décalée de k observations. Pour une série de données Dt, la fonction d'autocorrélation FAC(k) s'écrit :

FAC(1) traduit la dépendance des éléments successifs de la série D, FAC(2) traduit la dépendance des éléments de la série décalés de deux périodes de temps, et ainsi de suite. Une série de données de saisonnalité k, présente en général une valeur élevée du coefficient de corrélation à l'ordre k, traduisant la forte dépendance des observations à ce décalage.

Figure 30 : Autocorrélogramme d'une série de données saisonnières

Les données que nous récupérons étant mensuelles, nous considérons lors de l'analyse de la saisonnalité un décalage de 12. Nous nous inspirons de la procédure évoquée dans Pearce

96

(1995), basée sur l'analyse du coefficient d'autocorrélation, et l'adaptons au cas de la maille

mensuelle. Nous détaillons dans ce qui suit la procédure d'identification implémentée.

Procédure d'identification de la saisonnalité

Nous présentons dans l'organigramme de la figure 31, la procédure implémentée permettant de détecter l'existence de saisonnalité dans la série de consommation historique.

(a) Test de tendance et correction de la série

Le test de tendance, précédemment décrit, est systématiquement appliqué à la série historique. Dans le cas où la série présente une tendance, un premier traitement, consistant en une différenciation normale d'ordre 1, est appliqué afin d'ajuster la série. Les phénomènes tendanciels peuvent polluer les autocorrélogrammes des données, d'où la nécessité d'élimination de cette composante afin d'aboutir à des profils plus robustes. La différenciation est une technique statistique couramment appliquée permettant d'éliminer, à une certaine étendue, la non-stationnarité dans une série de données. La série résultante, appelée série différenciée, est obtenue par soustraction des éléments successifs de la série initiale.

(b) Application du test de Ljung-Box

L'étape suivante consiste à opérer un test de Ljung-Box sur la série de données résultantes. (Différenciées ou non selon le cas). Le test de Ljung-Box fait partie de la famille connue sous l'appellation Portmanteau tests. Cette procédure permet d'évaluer la significativité statistique d'un ensemble de valeurs de la fonction d'autocorrélation d'une série temporelle. Ceci permet d'évaluer l'existence ou non d'une certaine dépendance dans les données. Ljung

& Box (1978) considèrent un nombre arbitraire h de valeurs de la fonction d'autocorrélation

97

Cette variable a une distribution équivalente à une loi de Khi Deux. Il est démontré que si les données d'une série correspondent à un bruit blanc, la variable Q correspond à une loi de Khi Deux à h degrés de liberté. Si la valeur de Q se situe dans la région droite constituant les α % de la distribution de Khi Deux, il est conclu que les données représentent une certaine dépendance.

Si après l'application du test, il s'avère que la série ne présente pas de dépendance, le système conclut à l'inexistence d'un phénomène saisonnier. Dans le cas contraire, le système procède à la vérification de la douzième valeur de la fonction d'autocorrélation.

98

(c) Calcul et test de l'ACF à ordre 12

Demande brute

Calcul ACF

Calcul de la statistique de Ljung - Box

Statistique de Ljung - Box significative ?

ACF(12) significative ?

Différenciation saisonnière au décalage 12

Statistique de Ljung - Box significative ? NON Série brute OUI Série normalement différenciée NON

Série non saisonnière

OUI

NON

Série non saisonnière

OUI

NON

Série saisonnière

OUI

Série non saisonnière

Existence de tendance ?

Différenciation normale de la série de données

Récupération de l'ACF d'ordre 12 : ACF(12)

99

Dans le cas où les données sont dépendantes, le système va tester si la dépendance est due à un phénomène périodique mensuel. Ceci se fait par calcul et évaluation de la significativité statistique du coefficient d'autocorrélation d'ordre douze. Ce coefficient est comparé, en valeur absolue, à , n étant le nombre d'observations de la série. S'il est en deçà de cette limite, le coefficient sera considéré comme statistiquement non significatif. Si le coefficient n'est pas significatif, le système conclut à l'inexistence d'un phénomène saisonnier. Si le coefficient est significativement différent de zéro, une différenciation saisonnière est appliquée à la série de données.

(d) Différenciation saisonnière et deuxième test de Ljung-Box

La différenciation saisonnière est une autre technique de traitement des séries temporelles permettant d'éliminer la non-stationnarité dans les séries de données par élimination des phénomènes périodiques. Une différenciation saisonnière d'ordre 12 consiste à appliquer à la série la différence entre ses éléments et les éléments décalés de 12 observations (une année). La série de données résultante se calcule comme suit :

Si la consommation historique présentait réellement un phénomène saisonnier mensuel, l'application d'une différenciation d'ordre 12 éliminerait ce phénomène. Le système va calculer la série de données différenciée et réappliquer le test de dépendance de Ljung-Box sur la série résultante. Si le test est positif, cela signifie que l'opération de différenciation n'a pas éliminé la dépendance, supposée prévenir d'un phénomène saisonnier mensuel, dans ce cas le système conclut de l'inexistence d'un phénomène saisonnier. Dans le cas contraire, le système conclut qu'il existe un phénomène saisonnier mensuel.