R EVUE DE STATISTIQUE APPLIQUÉE
M. G RUN R EHOMME
D. L ADIRAY
Moyennes mobiles centrées et non-centrées.
Construction et comparaison
Revue de statistique appliquée, tome 42, n
o3 (1994), p. 33-61
<http://www.numdam.org/item?id=RSA_1994__42_3_33_0>
© Société française de statistique, 1994, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
MOYENNES MOBILES CENTRÉES ET NON-CENTRÉES
CONSTRUCTION ET COMPARAISON
M. GRUN REHOMME
(1),
D. LADIRAY(2)
(1) IUT de NIORT,
département
STID, CentreDuguesclin,
PlaceChanzy,
79000 NIORT.(2)
INSEE,département
de laconjoncture,
BP 100, 92244 MALAKOFF cedex.RÉSUMÉ
Dans un
premier
temps, cet articleprésente
unesynthèse
des différentes moyennes mobiles,qui
restent de nosjours
un outil essentiel, efficace etsouple
d’utilisation, dans lapanoplie
des méthodes delissage
et de désaisonnalisation des sériestemporelles.
Nousdéveloppons
un modeunique
de construction des moyennes mobiles, centrées ou non-centrées,pour le
lissage
ou la désaisonnalisation, sous la forme d’unproblème d’optimisation
souscontraintes. Ainsi, on résoud le
problème
de la perte d’information aux extrémités des séries. On montre en passantl’équivalence
desapproches proposées
par Kendall etBongard.
Ongénéralise
les moyennes
asymétriques
deMusgrave,
utilisées dans lelogiciel
XI 1, et un nouveau critère,mélange
convexe des critères deBongard
et de Henderson, est défini et étudié sur unexemple simple.
Mots
clefs :
moyennes mobiles,lissage,
désaisonnalisation.SUMMARY
In its first part, this paper presents an overview of the different
moving
averages that still remain animportant
tool for the statisticien who wants toperform smoothing
orseasonal
adjustment,
and thanks to theirefficiency
and theirsimplicity.
In the second part, the construction of centered or non-centeredmoving
averages is then seen as aproblem
ofoptimization
under constraints. Thispoint
of view enables us to answer thequestion
of the loss of information at the extremities of the time series.Incidentally,
theequivalence
of theapproach proposed by
Kendall andBongard
isproved.
TheMusgrave’s asymetric moving
averages, used in the X11 software, arereplaced
in this context and thengeneralized.
A new convex criteriumis defined
using
theBongard’s
and Henderson’s criteria and then studied on asimple exemple.
Key
words :moving
averages,smoothing,
seasonaladjustment.
Introduction
L’analyse
des sériestemporelles
a, de touteévidence,
fait de grosprogrès depuis
une
vingtaine
d’années. Dans sapanoplie
de méthodes pour aborder lesproblèmes
du
lissage
et de ladésaisonnalisation,
le statisticiendispose aujourd’hui
d’un outil unpeu
anachronique, qui
résiste bien à l’usure dutemps
et aux innovationsstatistiques :
les moyennes mobiles. Le succès de cet outil est essentiellement dû d’une
part
àson excellent
rapport «qualité-prix»
et, d’autrepart,
àl’hégémonie
deslogiciels
dedésaisonnalisation X11 et X 11-ARIMA
qui
en font unlarge
usage. Les moyennes mobiles sont en effet trèssimples
deprincipe, n’impliquent
pas apriori
l’utilisation deconcepts
ou de modèlessophistiqués
et se révèlentd’application particulièrement souple :
il estpossible
de construire une moyenne mobilepossédant
lespropriétés
souhaitées en termes de conservation de
tendance,
d’élimination de lasaisonnalité,
de réduction du
bruit,
etc ... ets’adaptant
ainsi auproblème
traité. Bâti sur de telsoutils,
lemythique logiciel
de désaisonnalisation Xll défie letemps. Aujourd’hui
encore, c’est une version de 1968
qui
est utilisée et les améliorationsimportantes
ap-portées
à ce programme, notamment à travers lelogiciel
XI 1-ARIMA deStatistique
Canada dans les années
1975,
n’en ont pas remis en cause leprincipe
de base. Force est de constaterqu’aujourd’hui
ces outils sont trèslargement utilisés,
à tort selon certainsqui pensent
que de meilleures méthodes existent de nosjours,
mais à raison selon les utilisateursqui
valident les résultats etemploient
parexemple
X 11-ARIMApour sa faculté de désaisonnaliser
rapidement
et correctement ungrand
nombre deséries. Les moyennes mobiles sont de vieilles dames. De très
importants
efforts derecherche sur ce thème ont été faits au début de ce siècle par des noms
aujourd’hui
célèbres :
Spencer, Henderson, Macaulay ....
et des résultatsaujourd’hui
oubliés ontété obtenus.
Qui
sait parexemple,
que le fameuxproblème
de laperte
d’informationaux extrémités de la
série,
etévoqué
comme l’un des inconvénientsmajeurs
de cesoutils,
a été étudié et enpartie
résolu par Henderson dans les années 20 ?Et,
par lasuite, Macaulay, Kendall, Musgrave (pour
lelogiciel X11), Bongard... s’y
sontattaqué
avecplus
ou moins de succès. Dans unpremier temps,
cet articleprésente
unesynthèse
despropriétés
connues des moyennes mobiles. Celles-ci sontprésentées
dans un cadreméthodologique général plus
actuel : leur mode de construction est vu comme unproblème
de minimisation d’une formequadratique
sous contraintes. Les moyennes mobilestraditionnelles, symétriques
ou non-centrées sont alorsreplacées
dans cecadre et
comparées
entre elles. Cetteprésentation
unifiéepermet
alors degénéraliser
les modes de construction et d’association et de déduire
quelques
résultats nouveaux.Le rôle central des critères de
Bongard (réduction
de la variancerésiduelle)
et deHenderson
(pouvoir
delissage)
est mis en évidence. On montre ainsil’équivalence
des
approches
de Kendall et deBongard.
Un nouveaucritère, mélange
convexe desdeux critères
précédents,
est défini et étudié. Les moyennes mobilesasymétriques
deMusgrave
sontgénéralisées,
améliorées et desrègles
de construction de moyennes mobilesnon-centrées, permettant
de résoudre leproblème
de l’estimation despoints
aux extrémités des
séries,
sontprésentées.
Ce travails’inspire
bien entendu des résultats obtenus par lesgrands
nomsdéjà
cités mais aussi de travauxplus récents,
comme ceux de
Doherty [2],
Gourieroux et Le Gallo[3]
etGray
et Thomson[5].
1.
Rappels
et notationsCe
chapitre
est une brèveprésentation
des notions de base sur les moyennes mobiles. Pour unexposé plus complet,
le lecteur pourra consulter Kendall[6]
ou,pour un ouvrage en
français,
Gourieroux & Monfort[4].
Dans la
suite,
on considèrera une sérietemporelle (Xt).Xt désignera
alors lavaleur de la série à l’instant t.
L(Xt) désigne
la transformée de la série brute par unopérateur
L etLXt
sera la valeur de cette nouvelle série à l’instant t.Par
ailleurs,
on fera souvent référence auxproblèmes
dulissage
ou del’ajustement
saisonnier danslesquels
la série brute estsupposée
apriori
sedécomposer
additivement :
2022 en une tendance
(Tt)
et un bruit(et)
pour lelissage : Xt
=Tt
+ Et2022 en une tendance
(Tt),
une saisonnalité(St)
et un bruit(Et)
pour ladésaisonnalisation :
Xt - Tt
+St
+ et.1.1.
Moyennes
mobilessymétriques
etasymétriques
On
appelle
moyenne mobile decoefficients {03B8i}, l’opérateur
notéMM{03B8i},
ou
plus simplement MM,
et défini par :La valeur à l’instant t de la série brute est donc
remplacée
par une moyennepondérée
de p valeurs«passées»
de lasérie,
de la valeur actuelle et def
valeurs«futures» de la série. La
quantité p + f
+ 1 estappelée
ordre de la moyenne mobile.Il est
clair,
pour des raisons dedéfinition,
que les ppremiers points
et lesf
derniers
points
de la série brute nepeuvent
être transformés parl’opérateur
MM.Lorsque
p estégal
àf,
la moyenne mobile est dite centrée.Si,
en outre, on a03B8-i
=()i
pour tout
i,
la moyenne mobile MM est ditesymétrique.
Par la
suite,
on notera 03B8 le vecteur de dimension(p
+f + 1,1)
dont les coordonnées sont les coefficients de la moyenne mobile :1.2.
Propriétés simples
des moyennes mobiles 1.2.1. En termes de conservation de tendancesIl est facile de montrer que pour
qu’une
moyenne mobile MM conserve lespolynômes
dedegré d,
il faut et il suffit que ses coefficients vérifient :Matriciellement,
ces contraintes s’écrivent : C03B8 = a, où C et a sont des matrices(d
+1,
p +f
+1)
et(d
+1,1)
valant :On
peut
remarquer à cette occasion que toute moyenne mobilesymétrique qui
conserve les
polynômes
dedegré
2d conserve aussi lespolynômes
dedegré
2d + 1.1.2.2. En termes d’élimination de saisonnalités
Les saisonnalités sont souvent «modélisées» par des fonctions
périodiques
depériode k (4
pour une série trimestrielle...);
dans le cas d’un modèle decomposition additif,
les coefficients saisonniers sont en outresupposés
être de somme nulle. Cesfonctions
engendrent
alors un sous espace vectoriel de dimension k - 1 dont il est facile d’exhiber une base.Ainsi,
parexemple,
dans le castrimestriel,
on trouve lesous espace
engendré
par :[1 -1 0 0 1 -1 0 0
...]
1 0 -1 0 1 0 -1 0 ...
1
0 0 -1 1 0 0 -1...
L’annulation de telles séries introduit donc des contraintes sur les coefficients de la moyenne mobile
qui s’expriment
matriciellement : CO = ce, où C est la matrice(k - 1, p
+f
+1)
dont leslignes
sont les vecteurs de base ci-dessus et où a est la matrice nulle de dimensions(k - 1,1).
Par
ailleurs,
nous verronsplus
loin(11.2.2
et Annexe1) qu’il
estpossible
de traiter lecas de saisonnalités variant linéairement
(ou polynômialement)
avec letemps.
1.2.3. En termes de réduction du bruit
Le
résidu,
dans ladécomposition
de la sériebrute,
est souvent modélisé sousla forme d’un bruit
blanc,
suite de variables aléatoires(et) d’espérance nulle,
noncorrélées,
et de même variance03C32.
Ce bruit blanc est transformé par la moyenne mobile en une suite de variables aléatoires(03B5*t),
de même varianceégale
à :i=+f Diminuer la
composante irrégulière
revient donc à diminuer laquantité: o2
i=-p Cette
quantité figurera,
dans les tableaux etexemples présentés
par lasuite,
sous le nom de BONGARD.
1.3.
Quelques effets
indésirables des moyennes mobiles 1.3.1L’effet Slutsky-Yule
La transformation du bruit blanc
(et)
par une moyenne mobile donne un pro-cessus aléatoire
(Et*)
corrélé dans letemps.
Eneffet,
le coefficient d’autocorrélation d’ordre k(k
entier naturel nonnul)
est :Cette corrélation entre p +
f
termes consécutifs du processus(03B5*t)
introduit des oscillationsparasites.
Il estimpossible
de les éliminer mais onpeut
les atténuer enréduisant la variance résiduelle. Par
ailleurs,
la«périodicité»
de ces oscillations estaléatoire;
il estcependant possible
d’en estimer la valeur moyennequi figurera,
dansles tableaux et
exemples présentés
par lasuite,
sous le nom de PERIODE.1.3.2.
Effet d’amplitude et effet
dephase
La transformation par une moyenne mobile d’une série
géométrique d’amplitude
variable
produit
des effets«parasites» d’amplitude
et dephase.
Soit la série :
Xt = t ezwt où 03C9 = 203C0 T avec T > 0 alors on a, par transformation par la moyenne mobile MM :
Si a et
~ désignent respectivement
le module etl’argument
de03A3 03B8k03C1keiwk,
on obtient :
X; = a03C1tei(wt+~)
On a donc un effet
d’amplitude (a)
et un effet dephase (~).
L’effet dephase
est inhérent aux moyennes mobiles nonsymétriques,
sauf àajouter,
dans leurconstruction,
une contrainte sur leurs coefficients de la forme :Pour une moyenne mobile
symétrique (p
=f
=m)
avec p =1,
on a :Dans ce cas, on a ~ =
0,
c’est-à-dire pas d’effet dephase,
ou ~ = 7r, c’est-à-direk=m
opposition
dephase,
et l’effetd’amplitude
vaut(03B80 +
203A3 03B8kcos03C9k)ei03C9t
k=l
1.4. Résolution d’un
problème
de minimisationd’une forme quadratique
sous contraintes
Soit 03B8 le vecteur de dimension
(p
+f
+1, 1)
dont les coordonnées sont les coefficients inconnus de la moyenne mobile recherchée. Soient en outre les matricesconnues w,
0, C,
et a, de taillesrespectives (p
+f
+1,1), (p
+f
+1, p
+f
+1), (k, p
+f
+1)
et(k, 1).
Ç2 estsupposée symétrique,
définiepositive
et C estsupposée
deplein
rang. On s’intéresse à la résolution duproblème
de minimisationsous contraintes du
type :
La solution
unique
de ceproblème classique
est :Bien
entendu,
la résolution de ceproblème
suppose que l’on n’ait pasplus d’équations
que d’inconnues et donc que le nombre de contraintesindépendantes
surles coefficients résumées dans la matrice C
(soit k)
est inférieur ouégal
à l’ordre de la moyenne mobile(soit p + f
+1).
Dans le cas où il y auraitégalité,
la contrainte déterminepleinement
la solution et iln’ y
aplus
deproblème d’optimisation ;
d’ailleursC est alors une matrice inversible et 03B8 =
0-la
2. Génération de moyennes mobiles
symétriques classiques
2.1. Les moyennes mobiles
arithmétiques simples
L’exemple
de moyenne mobile leplus simple
estclassiquement
obtenu ensupposant
que celle-ci conserve les constantes tout en diminuant au maximuml’importance
de laperturbation.
Cette réduction de lacomposante irrégulière
estmesurée par la
quantité L 03B82i.
Celaéquivaut,
dans les termes duproblème
i=-p
d’optimisation évoqué,
àprendre
une matrice Ç2égale
à la matrice identité. Parailleurs,
on a ici :
On obtient alors les moyennes
arithmétiques simples,
dont tous les coefficients sontégaux
à l’inverse de l’ordre de la moyenne mobile. Lasymétrie
de lasolution,
obtenue dès que la moyenne recherchée est
supposée centrée, permet
enplus
d’affirmer que ces moyennes mobiles conservent aussi les droites. On
peut
aisément vérifierqu’une
moyenne mobilearithmétique simple
d’ordre m élimine les fonctionspériodiques
depériode
m, etqu’elle peut-être obtenue,
ensupposant toujours
que lamoyenne des coefficients saisonniers est
nulle,
avec :C’est cette
optique qu’il
estpréférable
deprivilégier,
comme nous allons le voirimmédiatement,
si on veutgénéraliser
le mode de construction de ces moyennes.2.2. Les
compositions
de moyennes mobilessimples
2.2.1 Les
compositions
de moyennes mobilessimples
de type mxnDans le
logiciel
CensusXll,
des moyennescomposées
àpartir
de moyennes mobilesarithmétiques simples
sont utilisées pour estimer la série des coefficientssaisonniers;
elles sont notées3x3, 3x5,
3x9 ...ces notationsindiquant qu’une
moyenne mobile
arithmétique simple
d’ordre 3 estappliquée
à la sériepuis,
surcette série
lissée,
une moyenne mobilesimple
d’ordre 3 ou 5 ou 9. Il suffitalors,
pour construire ces moyennes, de choisir le même critère de réduction de la variance queprécédemment
en mettant dans la matrice C les contraintes d’annulation de saisonnalités ad hoc. On aboutitalors,
parexemple,
à des moyennes comme cellesprésentées
dans le tableau 1.2.2.2. Annulation de saisonnalités variant
polynômialement
avec le tempsL’hypothèse
de stabilité de la saisonnalité dans letemps
estparfois
peujustifiée
et on est amené à modéliser cette évolution de la
façon
suivante :où
(ut) désigne
une fonctionpériodique
depériode
b. Si l’on cherche alors unemoyenne mobile d’ordre p +
f + 1
annulant cetype
desaisonnalités,
on montre(voir
annexe 1 pour un calcul
général détaillé)
que les coefficients de la moyenne mobile doiventvérifier,
ensupposant p + f
+ 1 = nb :TABLEAU 1
Moyennes
mobilessimples composées
éliminant diverses saisonnalités Mn x pdésigne
lacomposée
de deux moyennes mobilesarithmétiques simples
d’ ordre n et d’ordre p.
Spl5 désigne
la moyenne mobile deSpencer
sur 15 termes, conservant lespolynômes
dedegré
3 et annulant les saisonnalités d’ordre 4 variant linéairement avec letemps
et d’ordre 5. Laquantité
notée Hendersondésigne
la valeurdu critère de Henderson
(voir 2-4)
L’annulation de fonctions
périodiques
depériode
4 variantquadratiquement
avec letemps
conduira donc à 9 contraintes. Le tableau 1présente quelques exemples
detelles moyennes mobiles
composées
àpartir
de moyennes mobilessimples.
Troismoyennes notées M4x4x5
figurent
dans ce tableau. Les deuxpremières
ont lesmêmes
propriétés
d’élimination des saisonnalités d’ordre 4 variant linéairement avec letemps
et les saisonnalités d’ordre 5 : seul leur nombre de termes diffère. Latroisième,
outre ces mêmespropriétés,
conserve lespolynômes
dedegré
3(voir
ci-après).
2.3. Les moyennes mobiles de Kendall et Stuart
De
façon
tout à faitnaturelle,
onpeut
souhaitergénéraliser
lepremier procédé
deconstruction des moyennes mobiles
arithmétiques simples
en cherchant des moyennesqui
conservent lespolynômes
dedegré
d. Il faut tout d’abord remarquer que cettepropriété
de conservation depolynôme
est locale : il suffitqu’une
série soitlocalement,
c’est-à-dire sur toutepériode
delongueur
l’ordre de la moyennemobile,
assimilable àun
polynôme
dedegré
d pourqu’elle
soit conservée par la moyenne mobile. Kendall et Stuart se sont intéressés à ceproblème
en le résolvant par unetechnique
de«régressions
mobiles». Sur tout ensemble de2p
+ 1points
consécutifs de lasérie,
onajuste
unpolynôme
dedegré
d : la valeurajustée
au centre de cet ensemble depoints représentera
la valeur de la série lissée à cet instant. Ils montrent par ailleurs que cette méthode revient àappliquer
à la série dedépart
une moyenne mobile adhoc,
dont les coefficients nedépendent
que dudegré
dupolynôme
choisi et du nombre p.En
fait,
et c’estl’objet
de l’annexe2,
onpeut
montrer que cetteapproche
estcomplètement équivalente
à résoudre unproblème
deminimisation,
le critère étant celui deBongard,
de minimisation de la variancerésiduelle,
et les contraintes celles inhérentes à la conservation d’unpolynôme
dedegré
d.Comme
précédemment
donc la matrice Ç2 est la matrice identité et on a parailleurs,
pour une moyenne centrée d’ordre2p
+ 1 :Là encore, on
pourrait imposer
en outre à la moyenne mobile d’éliminer parexemple
certaines
saisonnalités;
on retrouverait alorsl’approche développée
parBongard
en1962 dont les résultats
précédents
sont des casparticuliers.
2.4. Les moyennes mobiles de Henderson
Les moyennes mobiles de
type
"Henderson" sont surtout utilisées pour lisserune série. L’estimation
(Ît)
de la tendance doit donc être une courbe lisse. Une basede l’ensemble des séries étant constituée des séries définies par :
il suffit
d’imposer
que les transformées de ces séries par la moyenne mobile soientsouples.
Ces séries transformées sont, à une translation destemps près, égales
à lasérie des coefficients de la moyenne mobile :
Il suffit donc
d’imposer
à la courbe des coefficients de la moyenne mobile d’êtresouple.
Henderson aproposé
d’utiliser comme critère de«souplesse»
laquantité :
où 17
représente l’opérateur
différencepremière. (~Xt = Xt - Xi-1).
Plus cette
quantité
estfaible, plus
la série transformée par la moyenne mobile estjugée souple.
Cettequantité
est notée HENDERSON dans les tableauxproposés.
Deplus,
les moyennes mobiles de Henderson sontsupposées
restituer correctement despolynômes
de faibledegré. Ainsi,
dans lelogiciel
CensusX 11,
des moyennes mobiles de Hendersonsymétriques
sur5, 7, 9,
13 ou 23 termes, et conservant lespolynômes
de
degré 2,
sont utilisées selon les cas(et
enparticulier
selon lapériodicité
de lasérie).
Si on cherche par
exemple
à retrouver la moyenne mobile de Hendersonsymétrique
sur
2p
+ 1 termes,qui
conserve donc lespolynômes
dedegré
inférieur ouégal
à3,
les
paramètres
de notreproblème
de minimisation seront :2.5. De
Bongard
à HendersonOn
peut
avoir l’idée(comme
dans[5])
demélanger
enquelque
sorte les deuxcritères et de construire des moyennes mobiles «conciliant» la réduction de bruit et
le
pouvoir
delissage
de la série. C’est ce que nous avons fait en considérant unecombinaison convexe des deux
critères,
et en résolvant donc leproblème :
où k est une constante
comprise
entre 0 et1, I et 03A9 désignant
les matrices associéesrespectivement
aux critères deBongard
et Henderson. Ce programme se résoud de la mêmefaçon
queprécédemment
et, à titred’exemple,
le tableau 2présente,
pour des valeurs de kaugmentant
de 0.1 en0.1,
les moyennes mobiles centrées d’ordre 9 conservant lespolynômes
dedegré
2. Sur cetexemple,
on constate que lepouvoir
de«lissage» représenté
par le critère de Henderson s’améliore trèsrapidement
dès que ledegré
de «contamination» du critère deBongard
atteint 10 à 20%.2.6. Les moyennes mobiles de
Spencer
Une moyenne mobile comme l’une des deux
premières
M4x4x5présentées
ci-dessus a de bonnes
propriétés
en termes d’élimination de saisonnalitésmais,
entermes de restitution de
tendance,
ne restitue que les droites. Au début de cesiècle,
leproblème
dulissage préoccupait beaucoup
les actuairesqui
cherchaient enparticulier
à lisser les courbes de mortalité et ce, de
façon simple,
les contraintes matérielles detemps
de calculétant,
à cetteépoque,
fondamentales.Ainsi, Spencer
a utilisé ceprincipe
decomposition
de moyennes mobiles à coefficientssimples,
cequi
assureune succession de calculs
simples,
et a cherché une moyenne mobilequi, appliquée après
une4 x 4 x 5, corrigerait
lesdéfauts,
en termes delissage
de cette dernière.Remarquons
en outre que si on utilise une moyennesymétrique qui permettrait
àla
composée
de tout cela de conserver lesparaboles,
cette résultante conserverait naturellement aussi lescubiques.
Onpeut
montrer(voir [4]
pour un calculanalogue)
que si on cherche une moyenne d’ordre
3, symétrique,
de coefficients(a, b, a)
etqui, appliquée
à notreM4x4x5,
conduit à une moyenne mobilegénérale
conservant lescubiques,
il faut que a et b vérifient :Ce
qui
conduit à la solutionunique 1 4 [-9, 22, -9] correspondant
à la moyenne notée M4 x 4 x 5(1)
du tableau 1.Les
propriétés
delissage
de cette moyenne n’ont pas paru suffisantes àSpencer qui
a cherché une moyenne mobile d’ordre 5 conduisant aux mêmespropriétés.
Sicette moyenne,
symétrique,
admet pour coefficients(a, b,
c,b, a),
onpeut
montrer(voir [4]
pour un calculanalogue)
quea, b
et c doivent vérifier lesystème :
Ce
qui
conduit à un ensemble moyennes mobiles de coefficients :parmi lesquelles Spencer
aprivilégié
lamoyenne 1 12[-9,9,12,9, -9] obtenue pour
c = 1. La moyenne de
Spencer
sur 15points
ainsi obtenuefigure
dans le tableau 1.A titre de
comparaison figure,
dans ce mêmetableau,
sous le nom M4 x 4 x 5(2),
lamoyenne mobile sur 15
points ayant
les mêmespropriétés
que la moyenne deSpencer,
et minimisant le critère de
Bongard :
elle est obtenue pour c voisin de -13. Demême,
la moyenne mobile sur 15points ayant
les mêmespropriétés
que la moyenne deSpencer,
et minimisant le critère de Henderson est obtenue pour c voisin de0.7,
cequi
montre laproximité
desapproches
deSpencer
et Henderson.3. Génération de moyennes mobiles non centrées
Dans la
pratique,
les moyennes mobilessymétriques
sontpréférées
auxmoyennes mobiles
asymétriques
parcequ’elles présentent,
dans leurapplication,
moins d’effets pervers, notamment en ce
qui
concerne les effetsd’amplitude
et dephase. Malheureusement,
si on lisse une série avec une moyenne mobile centrée d’ordre2p + 1,
on nedisposera
pas d’estimation de la série lissée pour les ppremiers
et les p derniers
instants,
cequi
est pour le moinsgénant.
Dans lapratique,
on seraitdonc conduit à utiliser des moyennes non centrées pour effectuer ces estimations.
Notons,
dès àprésent,
que lesproblèmes d’amplitude
et dephase évoqués
ci-dessussont dans ce cas moins cruciaux dans la mesure où il
s’agit,
non de lisser la série dansson
ensemble,
mais d’estimerquelques points.
Enfait,
à notreconnaissance,
iln’y
a que dans le programme de désaisonnalisation Census XI 1 et ses dérivés que des moyennes mobiles non centrées sont utilisées pour résoudre ce
problème;
et encorefaut-il reconnaitre que leur mode de
génération
n’a été que très récemment retrouvé(voir [2]),
même s’il existe de bonnes études sur lespropriétés
de ces moyennes(voir Laroque [7]
et Wallis[11]).
3.1. Deux
générations
«naturelles » de moyennes mobiles non centréese Une
première
idée très naturelle estd’utiliser,
pour cesestimations,
des moyennes mobiles centrées(et
mêmesymétriques)
d’ordre inférieur. Parexemple,
si notre série a été lissée par une moyenne mobile de Henderson sur 9 termes et si T est le dernier instant de la
série,
onpourrait
estimer la valeur de la série lissée enT - 4 par une Henderson sur 7 termes, la valeur en T - 3 par une Henderson sur 5 termes .
Malheureusement,
cette idée se heurte àplusieurs problèmes.
Toutd’abord,
le cas du dernier instant d’observation n’est pas résolu et nous n’aurons
toujours
pas d’estimation pour cette date.Ensuite,
si notreexemple permet
d’utiliser des moyennes mobiles d’ordre inférieurayant
les mêmespropriétés
en termes de conservation detendances,
il n’en serait pas de même pour d’autrestypes
de moyennesmobiles; ainsi,
des moyennes mobilesarithmétiques simples
éliminent des saisonnalités différentes selon leur ordre. Etenfin,
il est assez intuitif decomprendre
queplus
l’ordre de lamoyenne mobile est
grand, plus
l’effet de rabot de la moyenne seraimportant; changer
cet ordre conduit donc à moins lisser la fin de la série que la
partie
centrale et il n’estpas évident a
priori
que ce soit souhaitable .e Une seconde idée découle du fait que la résolution du
problème
de minimi-sation d’une forme
quadratique
sous contraintesqui permet
de déterminer les coef- ficients d’une moyenne mobile ne nécessite pasl’hypothèse
que la moyenne mobile soit centrée. Kendall(voir [6]) puis Bongard (voir [1])
avaient d’ailleursdéjà
utilisécette idée et
imaginé
de telles moyennes mobiles non-centrées. A titred’exemple,
letableau 3
présente
les coefficients des moyennes mobiles de Henderson non centrées d’ordre 9qui permettraient
d’estimer les 4 dernierspoints
d’une série lissée avec uneHenderson centrée sur 9 termes; on a choisi
d’y
fairefigurer
des moyennes conservant lespolynômes
dedegré
2(notés D)
ou 3(notés T).
La moyenne mobile centrée de Henderson conservant lespolynômes
dedegré
2 étantsymétrique,
elle conserve aussiles
cubiques.
Il est curieux de constater que, sur cetexemple,
il vaut mieux utiliser pour lisser unecourbe,
dupoint
de vue des critères de Henderson etBongard,
unemoyenne de
type D6-2,
donc noncentrée, plutôt qu’une
moyenne centrée.TABLEAU 3
Moyennes
mobiles d’ordre 9 de Hendersonconservant les
polynômes
dedegré
2 et 3.La notation
p-f signifie
que la moyenne mobile est d’ordre p +f
+ 1 avec p termes dans lepassé
etf
termes dans le futur. La valeur i = 0correspond
à l’instant tprésent.
Les moyennes D(respectivement T)
conservent lespolynômes
dedegré
2(respectivement 3).
3.2. Les moyennes mobiles non centrées de
Musgrave
3.2.1. La démarche initiale de
Musgrave
Musgrave
a cherché à résoudre ceproblème
d’estimation des données lesplus
récentes dans le cadre de la désaisonnalisation et,
plus précisément,
pour la miseau
point
dulogiciel
XI 1qui,
entre autres, utilise pour estimer la tendance de lasérie,
des moyennes mobiles de Henderson et des moyennescomposées
de moyennes mobilesarithmétiques simples
pour l’estimation des saisonnalités. L’idée de base deMusgrave
est que les estimations des dernierspoints,
faitesgrâce
à la moyenne mobile noncentrée,
devraient être le moinspossible
réviséeslorsque
seradisponible
l’information à la date T + 1.
Pour
cela,
il pose leshypothèses
suivantes :e la série
peut
se modéliser linéairement sous la forme :Xi
= a + bi + êi oùa et b sont des constantes, et
les
sont des variables aléatoires noncorrélées,
de moyenne nulle et de variance(72 .
e on
dispose
d’une série depoids
Wl, W2 ..., WN de sommeégale
à 1(c’est
en fait par
exemple
notre moyenne mobile centrée deHenderson)
et on cherche unesérie de
poids
u1, U2, ..., um, avec mN,
de sommeégale
à 1.e cette nouvelle moyenne mobile doit en outre minimiser les révisions des
estimations, c’est-à-dire,
parexemple,
minimiser le critère :Sous ces
hypothèses,
on montre(voir [2]
pour le calculdétaillé)
que lespoids peuvent
être calculés en fonction durapport
D =b Malheureusement,
la valeur de D est inconnue maisMusgrave
fait remarquer que le choix de l’ordre des moyennes mobiles de Henderson dans X11 se fait àpartir
de la valeur durapport M - =i
où Idésigne
la moyenne des variations absolues au mois le mois dans lapartie irrégulière
de la série et C
désigne
la moyenne des variations absolues au mois le mois dans la tendance de la série. Ensupposant
la normalité des Ci, on montre alors que :ce
qui permet,
pour des valeursparticulières
deM,
de déduire les moyennes mobilesnon centrées solutions. A titre
d’exemple,
le tableau 4 donne ces moyennes mobiles pour une valeur de Mégale
à1,
valeur pourlaquelle
X 11 choisit une moyenne mobile de Henderson centrée sur 9 termes pour lapartie
«centrale» de la série.TABLEAU 4
Moyennes
mobiles non centrées d’ordre 9 deMusgrave
correspondant à une moyenne de Henderson.
La notation
Mp-f signifie
que la moyenne mobile est d’ordre p +f
+ 1 avec p termes dans lepassé
etf
termes dans le futur. La valeur i=0correspond
à l’instant tprésent.
Cette
approche
est aussivalable,
selon[9]
et[10],
pour les moyennes mobilescomposées
utilisées dans X11 pour traiter les saisonnalités(moyennes
3 x3, 3
x5,
3 x 9
...) ;
il suffit dans cettedémonstration,
deremplacer
lerapport I G
par lerapport
_ C
dit «ratio de saisonnalité mobile»
I S
où7 désigne toujours
la moyenne des variations absolues au mois le mois dans lapartie irrégulière
de la série etS désigne
la moyenne des variations absolues au mois le mois dans la saisonnalité de la série.3.2.2. Généralisation de cette
approche
Nous allons montrer à
présent
que cette démarchepeut
segénéraliser
et semettre sous la forme
envisagée
dans cette note. Pourcela,
onpeut envisager
unemodélisation
polynômiale
dedegré d
de la série brute :Ce
qui peut
s’écrire matriciellement :avec
Soient en outre w le vecteur des coefficients de la moyenne mobile d’ordre p +
f
+ 1ayant
servi à lisser lapartie
centrale de la série et u le vecteur des coefficients de la moyenne mobile non centrée recherchée. Comme le montre le tableauprécédent,
on
peut toujours
supposer que cette moyenne mobile est d’ordre p +f
+ 1 si onajoute
une condition de nullité des derniers coefficients. Le critère de
Musgrave
s’écrit alors :avec
puisque
La matrice Ç2 est une matrice définie
positive
d’ordre p +f + 1,
comme il estimmédiat de le vérifier. Il suffit donc à
présent
d’inclure dans la matrice des contraintes C la nullité de certains coefficients ui ainsi que le fait que la somme des coefficients estégale
à 1. La matriceC,
deplein
rang, s’écrit alors :3.2.3.
Quelques
remarquesw On
peut
alorsimaginer
la démarche suivante : une fois fixé ledegré
dupolynôme auquel
estsupposée s’adapter
la sériebrute,
on estime par les moindres carrés ordinaires les coefficients dupolynôme,
soit la matrice/3
et la variance desperturbations,
soit laquantité a2 .
La matrice [2 est alors déterminée et onpeut
calculerautomatiquement
lescoefficients ui
de la moyenne mobile nonsymétrique.
2022
Reprenons
le cas traité parMusgrave,
où w est une moyenne mobile de Henderson. Il est facile de constater que si onimpose
à u de conserver, nonplus
les constantes, mais les
droites,
alors u nedépend plus
de la série initiale. Eneffet,
on a
alors,
à cause des contraintes sur les coefficients de u et wimposées
par leurspropriétés
de conservation de tendances :puisque
2022
Et,
si onprend l’espérance
de cettequantité,
on trouve :or 2t (u - w) (u - w).
Laminimisation de ce critère ne
dépend
alorsplus
dea2 .
Parailleurs,
on retrouve ici uneformulation du
problème
voisine del’approche
de Kendall et Stuart : on s’intéresse àun
problème
derégression
locale(ici
onajuste
à unedroite)
enimposant
en outre à lamoyenne mobile d’une
part
d’avoir certains coefficients nuls et, d’autrepart,
d’être«proche»
de la moyenne mobile w initiale.2022 Il est difficile de
comprendre pourquoi,
si ce n’est pour des raisons decalcul,
Musgrave
s’est cantonné à deshypothèses
si «restrictives»qui
l’amènent à construire des moyennes mobilesdépendant
defaçon
un peu curieuse de la série : le critère Mexplicité plus
haut est en effet calculé sur l’ensemble de la série et, si de ce fait ilpeut
être utilisé pour choisir l’ordre de la moyenne mobile lissant lapartie
centrale de lasérie,
il est par naturebeaucoup
moins robuste pour les données lesplus
récentes.2022 Dans le cas
particulier
donc où la moyenne «centrale» w est une moyennemobile de
Henderson,
il nousparaît
doncplus
efficace de chercher une moyenne mobile non centrée dont certains coefficients sont éventuellementnuls,
conservant lespolynômes
dedegré
2(comme
la moyenne w, cequi équivaut
à supposer que la série est localement assimilable à cetype
defonction)
et«proche»
de w au sens oùelle minimise le
critère t(u - w ) (u - w).
3.3. En résumé
A
partir
d’une moyenne mobile MMdonnée,
d’ordre p +f + 1,
leproblème
des extrémités de série se ramène donc à celui de la
génération
de moyennes mobilesnon centrées
permettant
d’estimer lespoints manquants.
Deux cas seprésentent
enpratique :
e On ne connait rien sur la moyenne mobile
MM,
c’est-à-dire rien d’autre queses coefficients et en tout cas pas ses
propriétés
en termes de conservation detendance,
delissage,
d’élimination desaisonnalités,
de réduction de variance. Dans ce cas, ilparaît
assez naturel de chercher des moyennesUk, (k
=1,..., f si
on s’intéresseaux instants les
plus récents),
lesplus proches possibles
de MM au sens où ellesminimisent le
critère t(u - w) (u - w),
wdésignant
ici le vecteur des coefficients deMM,
etayant k
coefficients nuls.Evidemment,
il esttoujours possible d’imposer
à cesmoyennes mobiles d’autres
propriétés,
parexemple
celles de la moyenne «initiale»MM que l’on
pourrait
retrouver àpartir
de ses coefficients(vérifier
que la somme des coefficients estégale
à 1....).
e Le second cas est
plus simple
dans la mesure où on suppose que l’onconnait,
sinon letype
de la moyennemobile,
au moins lepourquoi
de son utilisation. Onpeut
alors en connaissance de cause choisir les contraintes et éventuellement le critère.TABLEAU 5
Moyennes
mobiles non centrées d’ordre 9associées à une moyenne de Henderson.
Le tableau 5 montre le