R EVUE DE STATISTIQUE APPLIQUÉE
J ACQUES G IROD
Ajustement de type logarithmique et prévision des diagrammes de charge
Revue de statistique appliquée, tome 23, n
o1 (1975), p. 83-95
<http://www.numdam.org/item?id=RSA_1975__23_1_83_0>
© Société française de statistique, 1975, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
AJUSTEMENT DE TYPE LOGARITHMIQUE
ET PRÉVISION DES DIAGRAMMES DE CHARGE(1) Jacques GIROD
Pour une étude
proposée
par EURATOM "Incidence àlong
terme de l’é-nergie
nucléaire sur le choix des moyens deproduction
d. électricité de la Com- munautéEconomique Européenne"*,
on a dûeffectuer
uneprévision
des dia-grammes de
charge jusqu’à
l’an 2000. Pour un terme aussilointain,
les techni- quesstatistiques
habituelles se sont avéréesinopérantes
et ont étéremplacées
par des tests de cohérence de
quelques hypothèses posées
apriori.
Pour un ho-rizon moins
éloigné,
1980 ou1985,
il a été en revanchepossible
de proposer des méthodes dont lesfondements
sont mieux assurés. Cet article est unapprofon-
dissement
théorique
de l’une d’entre elles.Confronté avec l’étude de séries de deux
variables,
pour desobjectifs
d’ex-plication
ou deprévision,
on commencegénéralement
paréprouver
les modèlesd’ajustement
lesplus simples,
linéaires etlogarithmiques.
En casd’échec,
onpoursuit
avec des modèlesplus compliqués
dont lasignification
et lajustifica- tion,
contrairement auxprécédents,
ne sont pastoujours
assurées. Dans le casprésent.
pour une raisonqui apparaîtra
dans lasuite,
on passera à cequ’on
peutappeler
lepremier degré
decomplexité
d’unajustement semi-logarithmique ajouter
une constante à la variable dulogarithme,
soitl’équation :
y = a .
Log (x
+b)
+ c(logarithme népérien) (1)
Dans une
première partie
on proposera une méthode d’estimation des para-mètres,
l’introduction de b interdisant le recours aux moindres carrés. On mon- trera ensuite quel’équation (1)
peuts’interpréter
à l’aide d’une relationparticu-
lière sur la pente de la série. On
appliquera
enfin les résultats à laprévision
desdiagrammes
decharge
de la consommation d’électricité.1) Article remis le 22/11/73
* Modèle énergétiques - Structure de la production d’électricité dans le Marché Commun ; I.R.E.P., Grenoble 1971.
1 - METHODE D’ESTIMATION DES PARAMETRES
A
partir
del’équation d’ajustement (1),
on considère le modèlestatistique:
y = a . Log (x + b) + c + ex (M1)
où les résidus ex sont
supposés aléatoires, gaussiens,
de moyennesnulles,
sanscorrélation entre eux et de lois
indépendantes
de x.Les estimations des
paramètres
de M 1 sont obtenues par une méthode clas-sique
d’itérations rendant maximum la vraisemblance de cesparamètres [ 1 ].
Lepoint particulier
estcependant
le choix des valeurs initiales des itérations. Lespropriétés
del’équation d’ajustement
et de sa fonction inverse permettent de n’en estimer audépart qu’une seule,
en l’occurrence a.1.1. Paramètres du modèle Ml.
Le
logarithme
de la vraisemblances’écrit,
à une constanteprès :
(N
est le nombre d’observations xi,yi)
L’estimateur du maximum de vraisemblance
(le
vecteur v de composantesà, b, c)
est solution del’équation (ou plutôt
dusystème d’équations
non linéai-res) :
où L
(v)
est le vecteur des dérivéespremières
de K aupoint
v.Si v. est une valeur
proche
dev,
onpeut
écrire :Sous certaines
conditions,
on peut trouver un vecteur v1,compris
entre v 0 et v au sens d’une normepréalablement définie,
et satisfaisantl’égalité :
et le nombre d’itérations
dépend
de larapidité
de convergence, c’est-à-dire de la décr.oissanceplus
ou moinsrapide
de la normeIlvn+ 1 - Vn il vers
0.Appliquée
au modèle M 1 cetteprocédure
conduit à :A
partir
de M(v),
il est aisé de calculer la matriceasymptotique
des varian-ces et covariances de
à, b,
c, etmieux,
celle de ces troisparamètres complétée
par la variance des écarts ex , soit
Q2 ,
estimé par :Pour ce
faire,
il fautajouter
au nouveau vecteurL’(v)
une composante sup-plémentaire :
On vérifie facilement que la nouvelle matrice d’information s’écrit :
et la matrice
asymptotique
des variances - covariancesOn notera en
particulier
que[2] :
-
s2
est sans corrélation avecà, b, c ;
- les variances et covariances des
paramètres
sontproportionnels
às2
et in-dépendantes
de c.En ce
qui
concerne la fin des itérations. onpeut
se fixer l’une des deux rè-gles
suivantes :- convenir d’arrêter le processus
lorsque
deux vecteurs successifs vérifient :El 1 étant une valeur fixée au
départ :
- convenir d’arrêter le processus
quand
le vecteur des dérivéesprend
des valeursproches
de zéro :En
pratique,
on constatequ’il
suffitgénéralement
de trois ou quatre ité- rations pour vérifier l’uneet/ou
l’autre de ces conditions.1.2 Choix de la solution initiale - Le modèle auxiliaire.
Le choix de la solution initiale consiste à trouver un vecteur vo tel que le vecteur des dérivées
premières
aupoint
v 0 soit aussiproche
quepossible
de zéro. Montrons que la détermination d’un tel vecteur peut être limitée à l’esti- mationpréalable
d’une seule de ses composantes, ao :La fonction inverse de
l’équation d’ajustement (1)
s’écrit :Ce
type d’ajustement, proche
des fonctionslogistiques
et deGompertz, a
étéfréquemment
étudié[3, 4, 5].
W.L. Stevens a trouvé une méthode de résolutionne
requérant qu’une
seule valeur initiale pour R. Dans sonprincipe,
cette métho-de est
identique
à celleadoptée
pour le modèleprécédent : procédure
itérativecherchant à maximiser la fonction de vraisemblance.
Soit donc le modèle
statistique :
où nous supposons que
77y jouit
dans unpremier
temps des mêmespropriétés
que ex.
Les estimateurs
A,
B et R sont solutions del’équation
J(w)
=0,
où J(w)
est le vecteur des dérivées
premières
de la vraisemblance :Si 1 est la matrice
d’information,
àpartir
d’une estimation initiale w., on peutparvenir
deproche
enproche
au vecteur W n + 1 :Dans le cas
présent,
il se trouve que, à lapremière
itération parexemple,
les solutionsA
1 etB 1 ne dépendent
pas des valeurs initialesAo
etBo
maisseulement de
Ro.
On a :
avec
On le
voit,
1(w),
nedépend
que de B et R. Son inverse peut s’écrire :où les
F1 ...F6
nedépendent
maintenant que de R.En
désignant
par03B4wo
le vecteuraccroissement,
on montre facilementqu’on
obtient les estimations.Ainsi,
àpartir
deRo
et des Ncouples (x, y)
on calcule lesFi,
lesXi
etde là, Al, Blet BI 5Ro,
pourparvenir
à une nouvelle valeurRI. Théoriquement,
rienn’empêche
depoursuivre
les itérations sur la base dutriplet (Al, B1, R 1 ) ;
laprécision
del’ajustement
peut ainsi être améliorée. Il faut remarquercependant
que, sauf cas
particulier,
legain
nejustifie guère
lapoursuite
du calcul. Les esti- mations deM2
sont desparamètres
auxiliaires que laprocédure
examinée pourM
1 devra améliorer.Surtout,
il faut noter que toutes leshypothèses
nécessaires pour les calculsprécédents
ne sont pas strictement vérifiées ou du moins ne peu- vent-elles l’être à la fois pourMi
1 etM2 ;
on penseprincipalement
aux consé-quences de
l’échange
effectué entre variableexpliquée
et variableexplicative.
Le passage du modèle auxiliaire aux
paramètres
initiaux du modèleprinci-
pal
est assuré par les relations :1.3 - Estimation
préalable
de aoPour
plusieurs
raisons dontquelques
unesrejoignent
les fondements incer- tains deshypothèses
relatives àM2,
il estpréférable
d’estimer aupréalable
aoplutôt
queRo’ L’égalité Ro = e1/a-o
permet ensuite de passer d’unparamètre
àl’autre.
Pour a.,
plusieurs
méthodes sontpossibles :
-
développement
limité del’équation (3)
etajustement parabolique,
- élimination de b et c à
partir
deséquations (1)
et(3),
-- utilisation de la pente de
l’équation (1)
Pour les séries utilisées lors des
calculs,
aucune de ces méthodes n’a donné des résultats satisfaisants. On leur apréféré
les deuxprocédures
suivantes :1)
ao est déduit de l’estimation deMl
1 par la méthode des moindres carrésavec b = 0.
2)
ao est déterminé àpartir
des différencespremières
del’équation (1) :
A(y) =
yx-1-yxSi x + b est suffisamment
grand, A (y)
vérifie :et
En
pratique,
on choisit la valeur aocorrespondant
à n = N - 1 ou n =- N - 2.La double estimation a pour seul but d’amorcer la convergence des itéray tions pour au moins une des valeurs de ce
paramètre.
On sait que pourqu’elle
aitlieu,
il faut audépart
se situer assezprès
de la vraie valeur v. Sur certaines sériesplus
ou moinsrégulières
le seconde estimation peut conduire à des valeurs de ao aberrantes(par exemple, négatives
avec une tandancecroissante).
Dans ce cas, il fautpartir
de lapremière, généralement
moinsprécise quand l’hypothèse d’ajus-
tement
est vérifiée,
maisjamais
aberrantepuisque dépendante
de toutes les ob-servations.
L’organigramme
ci-dessous résume laprocédure
d’estimation desparamètres
a, b et c.
2 - APPLICATIONS AUX DIAGRAMMES DE CHARGE
L’exemple d’application
concerne lesdiagrammes
decharge, plus précisé-
ment les
diagrammes
de la consommation d’électricité(pertes incluses)
de la Francependant
les mois de décembre. Les coordonnées desdiagrammes
sont res-pectivement
les 24 heures de lajournée
et lespuissances appelées
en ces différen-tes heures par l’ensemble des utilisateurs. Les données
statistiques
de base quenous considérons sont les relevés effectués par E.D.F. tous les trosièmes mercre-
dis de
chaque
mois[6].
On les notera
Ph ix les
indices se rapportant à lapuissance appelée
à l’heureh du mois i de l’année x.
Pour
l’entreprise
fournissantl’énergie électrique,
lesdiagrammes
decharge
sont d’une
grande importance.
Ils sont lecomplément indispensable
desprévi-
sions à court, moyen et
long
terme de la consommation en ce sensqu’ils
larépartissent
entre les différentes heures desjours
de l’année.Leur déformation au cours du
temps
traduit ledéveloppement
des usagesélectriques
etégalement
lesmodifications, spontanées
etplus
souvent provo-quées,
dans le comportement des utilisateurs. Sur un horizon de 5 à 10 ans, ils servent de base au choix des investissements pour laproduction
d’électricité.2.1 - Prévision des
diagrammes
decharge.
De très nombreuses méthodes de
prévision
desdiagrammes
decharge
ontété élaborées
[7].
Parmielles,
l’une consiste àremplacer
cesdiagrammes
par desdiagrammes
dits réduits obtenus en divisantchaque puissance Phi.
par lapuis-
sance moyenne du
jour
considéré[8].
On peut ainsipercevoir
l’évolution et la déformation desdiagrammes indépendamment
de l’accroissement annuel de la consommation d’électricité et des fluctuations ou écarts accidentels(tempéra-’
ture,
ensoleillement...)
On définit les
puissances
réduites par :On vérifie immédiatement que
Sous réserve de
prévoir
lespuissances
moyennesP.ix
laprévision
des dia-grammes
réduits,
c’est-à-dire à laprévision
des 03C0hix.L’étude
[8] déjà
citée a mis en évidence unepropriété
intéressante des 7r, à savoir leur tendancelinéaire,
croissante oudécroissante,
en fonction du temps x.Sur cette
base,
on peut proposer le modèlestatistique :
(l’indice
i sera dorénavantsous-entendu)
Les
projections correspondantes
ne donnent des résultatsacceptables qu’à
court terme, au maximum pour une échéance de trois ou
quatre
ans. Elles sup- posent, par le biais du coefficient ah constant dans le temps, une stabilité de l’environnementéconomique
eténergétique
et, desurcroît,
une croissance ou une décroissance illimitée despuissances
réduites. Cettehypothèse
est en con-tradiction aussi bien avec les conditions d’offre à court terme du
producteur qu’avec
les interventions constantes des institutionspubliques chargées
de modi- fier la forme dudiagramme
notamment à l’aide de la tarification.L’objectif poursuivi
enproposant
un autre typed’ajustement
est d’étendrele domaine de validité des
projections
tout en s’assurantqu’à
court terme ellessont au moins aussi satisfaisantes
qu’avec
le modèle linéaire(1).
Cette extension du
champ d’application
passe par unejustification
théori-que de l’évolution des
puissances
réduites et nonplus
seulement par la consta- tation d’une liaisonstatistique
avec letemps. On peut
chercher un tel fondementen considérant la pente du nuage d’observations.
(1) Il faut entendre par "satisfaisantes" un coefficient de corrélation pour Ml au moins égal à
celui obtenu pour le modèle linéaire.
On
remplace
la pente ah du modèle linéaire par la fonction p(x)
vérifiant la relation de récurrence :Cette relation traduit
bien,
enpremière approximation,
lephénomène
que l’on veutreprésenter :
décroissance de p(x)
vers zéroquand
x croit. En outre, elle est formellementproche
del’équation
P’ =- (K > 0), équation
classi-que de la théorie des servomécanismes donnant les corrections successives ap-
portées
à une valeur initiale de P. Cette référence aux asservissements tente deprendre
en compte l’influence des réactions tarifaires destinées àcorriger,
d’unefaçon plus
ou moins continue et avant d’atteindre des situationsaberrantes,
les déformations tropimportantes
dudiagramme
decharge.
Par un double
changement
de variables :on déduit la solution de
(8) :
La fonction
intégrale
est :dont nous savons estimer les trois
paramètres
a,b,
c àpartir
des observations(03C0, x)
En vue d’assurer la définition du
logarithme,
on supposera b > o(x
est lui- mêmepositif).
Les estimations
numériques
desparamètres
étant connues, on choisit com-me
prévision
de 7Tl’espérance mathématique
de la variable estimée pour différen- tes valeurs de x.Quelques rectifications,
engénéral mineures,
sont nécessaires pour vérifierl’égalité (7).
2.2 - Résultats
numériques
Parmi l’ensemble des
diagrammes
decharge mensuels,
on a retenu celui dedécembre, particulièrement significatif
parce que lespuissances appelées
yatteignent,
on le suppose dumoins,
leur maximum annuel.Quant
aux annéesconsidérées,
les effets de la nouvelle tarification établie en 1957 ne commen-çant
à se faire sentir d’unefaçon significative qu’à partir
de1960,
on ne retien-dra que les années
postérieures
à cette date.On est ainsi conduit à traiter un ensemble de 24 séries
horaires,
chacune comportant 12 observations(1961-1972).
Les valeurs en sont les 7Th x déduits desPhx
de décembre par la relation(6).
Les séries révèlent pour la
plupart
des heures de lajournée
une tendance nette, croissante ou décroissante selon les cas,accompagnée
d’une diminutionprogressive
de la pente. Pour les heures de la nuit et lamajorité
des heures de lamatinée,
les observations sont peudispersées
autour de la tendance. Elles le sont nettementplus
pour les heures del’après-midi,
avecparfois
des valeurs aber- rantes.Enfin,
pour certainesheures, 6h, 20h,
21 h et22h,
il ne sedégage
aucunetendance nette. Elles ont de ce fait été exclues des calculs et, pour la
prévision,
ont fait
l’objet
d’un traitementparticulier (agrégation
etestimation).
Les valeurs des
paramètres âh, bh 1 eh
des 20 sériesanalysées
sont données dans le tableauci-après.
On y trouveégalement :
- le coefficient de corrélation
R2L
avecl’hypothèse
d’un modèlelinéaire,
- le coefficient de corrélation
R2
avecl’hypothèse M 1,
- les valeurs
empiriques
etthéoriques
des 1T h pour l’année1972,
- les valeurs
prévues
pour 1975 et 1980.* Estimations
Le
graphique
suivant superpose quatrediagrammes
decharge
pour deux annéespassées,
1965 et 1972 et pour deux annéesfutures,
1975 et 1980.2.3 - Conclusions.
On se limitera ici aux conclusions d’ordre purement
statistique.
1)
On remarque que pour toutes lesrégressions
effectuées on aR2
>R2LI,
ce
qui
satisfait à un desobjectifs
du modèle Ml.De la
comparaison,
pour1972,
entre réalisation et valeurthéorique
on tireles
renseignements
suivants :- écart maximum :
0,014
soit1,3
% par rapport à la valeurobservée ;
-
écart-type
de la différence(calculée
pour les 24heures) : 0,006.
2) Quant
aux estimations desparamètres,
on voit que les valeurs de b sont de l’ordre dequelques
unités. Dans deux cas ellesdépassent
10 et dans troisautres cas elles sont
nulles,
rendant ainsiéquivalent
le tnodèle testé avec le mo-dèle
semi-logarithmique classique.
Notons au passage que b peut
s’interpréter
comme unparamètre-retard.
Eneffet,
si la tendance fondamentale duphénomène correspond
bien à une fonc-tion
logarithmique
l’incidence des facteurs d’asservissement a pour résultat de donner comme mesure duphénomène
à l’instant t la mesure duphénomène, supposé
non influencé par cesfacteurs,
telqu’il
serait apparu à l’instant t + b.En ce
qui
concerne encoreb,
on doit constater que la variance de l’estima- teur estgénéralement élevée,
contrairement à celles de à et de c.Les matrices des variances-covariances montrent aussi que les trois estima- teurs sont fortement correlés entre eux. Ce sont là deux inconvénients de la mé- thode
d’ajustement proposée.
3)
Pour lesprévisions
de lapériode 1975-1980,
il est difficile dejuger
deleur
qualité
en soi. Lesenseignements statistiques
en l’occurence ne suffisentplus ;
il faut les renforcer par desjugements
de valeursspécifiques
au domained’application,
icil’électricité, et
corroborer les résultats par d’autres méthodes.Pour terminer on voudrait
signaler quelques prolongements possibles
dansl’utilisation du modèle Ml. Bien que d’autres
applications économiques puis-
sent être
envisagées,
enparticulier
en prenant une autregrandeur
que le tempscomme variable
explicative,
on se limitera là encore auxdiagrammes
decharge.
1. Estimer les
paramètres (a, b, c)
sous la contrainteexplicative L 03C0hx = 24
pour tout x.
2.
Chercher,
pour unechronique
donnée 03C01,parmi
l’ensemble des 24 x 12chroniques 03C0h
ixsupposées ajustées
parM1,
lachronique équivalente
03C02 définie par :ou
La
première
série est décalée de k par rapport à la seconde etjoue,
pour laprévision
de ’TT 2 ’ le rôle desérie-anticipation;
REFERENCES
BIBLIOGRAPHIQUES
[1]
RAULT(C.) -
"Etudeéconométrique
de lapossession
d’un ensemble de biens durables deconsommation",
Annales del’INSEE, n° 1,
mai 1969.[2]
OLIVER(F.R.). -
"Anothergeneralisation
of thelogistic growth function", Econometrica,
vol.37, n° 1, janvier
1969.[3]
NELDER(J.A.) -
"Thefitting
of ageneralisation
oflogistic curve",
Bio-metrics,
vol.17, n° 1,
1961.[4]
OLIVER(F.R.) - "Aspects
of maximum likelihood estimation oflogistic growth function",
Journal of American StatisticalAssociation,
vol.61,
n° 3,
1966.[5]
STEVENS(W.L.) - "Asymptotic Regressions", Biometrics ; septembre
1951.[6]
E.D.F. -"Statistiques
de laproduction
et de laconsommation" ;
1961...1972.