R EVUE DE STATISTIQUE APPLIQUÉE
J. P. I NDJEHAGOPIAN
Analyse des effets d’intervention sur les prévisions issues de modèles ARIMA
Revue de statistique appliquée, tome 29, n
o4 (1981), p. 5-30
<http://www.numdam.org/item?id=RSA_1981__29_4_5_0>
© Société française de statistique, 1981, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
5
ANALYSE DES EFFETS D’INTERVENTION SUR LES
PREVISIONS ISSUES DE MODELES ARIMA (1)
J.P. INDJEHAGOPIAN
(2)
RESUME
Dans cet article nous nous intéressons à la modélisation et à la
prédiction
des séries tem- porellesperturbées
par des interventions connues telles que des modifications tarifaires, l’intro- duction d’un nouveau produit sur unmarché,
unegrève,
etc. Plusprécisément, après
avoirpré-
senté brièvement la modélisation des effets d’interventions connues et du bruit à l’aide des filtres linéaires réalisables et dissipatifs, on introduit la notion de biais de
prédiction
lorsque l’on ignore dans la modélisation la partie déterministe relative à une intervention. Ce calcul de biais deprédiction
nous permet à partir d’unthéorème,
de discuter del’adaptabilité
desprédictions
issues de modèles ARIMA. Nous illustrons les résultats trouvés sur la série du trafic passagers national
perturbé
par lesgrèves
de Février-Mars 197 3 et Novembre-Décembre 1979.1. INTRODUCTION
La modélisation d’une série
temporelle
àpartir
de sonhistorique
en utilisantla classe des modèles linéaires ARIMA suppose la stabilité structurelle au cours du
temps
du modèle retenu et de ses coefficients. Dèslors,
si l’on est enprésence
d’unestructure évolutive
et/ou
deparamètres
variant au cours dutemps,
lesprédictions
issues du modèle univarié seront sérieusement affectées.
Dans cet article nous nous intéressons à la modélisation et à la
prédiction
deséries
temporelles
dont leshistoriques
sontperturbés
par des interventions connues tellesqu’une promotion,
l’introduction d’un nouveauproduit
concurrent sur unmarché,
l’annonce d’une modification detarif,
unegrève,
etc.Dans la
première partie
de cet article nousprésentons
brièvement la modéli- sation des effets d’interventions connues et du bruit àpartir
de la classe des modèles linéairesdynamiques
et del’analyse
des interventionsdéveloppées
parBOX,
JENKINS et
BOX,
TIAO(cf. [4]
et[5 ]).
Plusprécisément
nous montrons commentl’analyse
des interventions essaie derépondre
à laquestion :
"étant donné une ou(1) Cet article est une version révisée d’une communication
présentée
à EURO IVFourth European Congress on Operations Research, Cambridge, England, July 1980.
(2) Professeur de Statistique à l’ESSEC, Cergy Pontoise, France.
Revue de Statistique Appliquée, 1981, vol. XXIX, n° 4
plusieurs interventions,
y a-t-il unchangement
dans l’évolution de la sérietemporelle depuis
la date connue d’occurence de cette(ces) intervention(s)
et sioui, quelles
sont lescaractéristiques
etl’amplitude
dece(s) changement(s)
?"Dans la deuxième
partie
nous montronsqu’il
estpossible
de calculer le biais deprédiction lorsque
l’onignore
lapartie
déterministe de l’intervention dans le modèle. Ce calcul du biais deprédiction
nouspermet
de discuter del’adaptabilité
des
prédictions
issues des modèles ARIMAlorsque
les sériestemporelles
sont sou-mises à des interventions déterminées telles que des
impulsions
ou des sauts.Enfin dans la
première partie
nous illustronsl’analyse
des interventions àpartir
de la série du trafic aérien national passagersperturbée
par lesgrèves
descontrôleurs aériens en Février-Mars 1973 et Novembre-Décembre 1979. Dans ce
dernier
exemple,
on discutepréalablement
de la stabilité du modèle àpartir
du moisde Novembre 1979 début de la
grève.
A ceteffet,
onprésente
briévement le test de BOX et TIAO[6].
2. MODELES INTERVENTION
Pour définir les modèles d’intervention de BOX et
TIAO,
nousprésentons préalablement quelques
notions fondamentales sur les filtres linéaires réalisablesdissipatifs (R.D.).
Dans cet article nous
appellerons
filtre H une transformation linéaire invariante au cours dutemps
transformant une sérietemporelle § == (03BEt, t
EZ)
à
temps discret, appelée entrée,
en une sortie y =(yt,
t EZ)
àtemps
discret.Lorsque
l’ensemble des entrées admissibles du filtre H est un espacevectoriel,
on aclassiquement (cf.
KOOPMANS[ 16],
OPPENHEIM[19],
ROBINSON[22], [23]).
où la suite
(hj, j E Z) représente
laréponse impulsionnelle
du filtre. La série for-melle
s’appelle
fonction de transfert du filtre.Si
hj
= 0pour j 0,
la sortie autemps
tdépend
de l’entrée seulement pour lestemps
s ti.e.,
duprésent
et dupassé de 03BE.
Un filtreprésentant
cette caracté-ristique
est dit réalisable(ou causal).
On dit que le filtre est
dissipatif lorsque
laréponse impulsionnelle
est de carrésommable. Enfin un filtre est stable si pour tout entrée bornée la sortie est bornée
(E.B.S.B.).
Un filtre est stable si et seulement siCompte
tenu des définitions donnéesci-dessus,
la fonction de transfert d’un filtre’réalisable dissipatif (R.D.)
s’écrit :avec
La condition
(2.5) implique
que la fonction de transfert se définit comme unefonction
analytique
dans tout ledisque
ouvertD = {z E C : 1 z 1 l}.
2
La
réponse fréquentielle h
d’un filtre réalisabledissipatif
est la fonction deL2c [ - 7T, 7r]
définie comme la transformée de Fourier discrète de laréponse impul-
sionnelle
(hjj E N) (1 )
Si on considère
(2.6)
comme undéveloppement
en série de Fourier onpeut
alors chercher la condition pourqu’une
fonction h ait undéveloppement
ensérie de Fourier de coefficients de Fourier
hn
tels queUne telle condition
peut
se trouver en utilisantl’espace
deHardy H2 .
L’espace
deHardy H2
se définit comme l’ensemble des classes de fonctionsanalytiques
dans ledisque
ouvert D ={z
EC : 1 z 1 1 },
de la formesatisfaisant à
La relation de Parseval
permet
de montrer que la condition(2.7)
estéqui-
valente à la condition
(2.5).
Cequi implique
que tout filtre réalisabledissipatif (R.D.) appartient
àH2.
On remarqueraqu’une
fraction rationnelleappartient
à
H2
si et seulement si sespôles
sont à l’extérieur dudisque
unitéfermé,
De
plus,
onpeut
vérifier que sif E H2
alorsf(X) - f(e-iÀ)
est limite(1) Le théorème de RIESZ-FISHER affirme que si la suite
(hjj
E N) est telle que:¿ 1 hj 1
00 alors il existe une fonction h EL2c[2013
7r, 1T] telle que :¿hj e -1
converge au sensde L vers h et où les
h.
sont les coefficients de Fourier de h.au sens de
L2
et p.p. def(re-i03BB) quand
r tend vers 1 par valeurs inférieures et00
que hj e-i03BBj
est ledéveloppement
en série de Fourier deÊ(X).
o
Compte
tenu des résultatsprécédents,
il est clair que la condition recher- chée est que happartienne
àl’espace H2 .
En outre on
peut
montrer quel’application qui
associe à toute fonction h deH2
sa valeur au bord aD dudisque
unité D(i.e.,
le cercle unité T ={z
E C :1 z = 1 } )
c’est-à-direh
deL2 (T) 1)
est unisomorphisme d’espace
de Hilbert deH 2
sur le sous espace hilbertienL+ (T)
deL 2(T)
des fonctions g deL2 (T)
tels que les coefficients de Fourier
gn
=1 203C0~03C0-03C0 g(e-1 ) e01 d03BB = 0 pour tout
n 0.
Cette isométrie
permet
donc d’identifierH2
àL+ (T)
en munissantH2
du
produit
scalaireL’intérêt d’une telle identification réside dans le fait que toute fonction f non
identiquement
nulleappartenant
àH2
admet la factorisationunique
f(z)
=03C1B(z) F(z) S(z),
où p =eia
avec a = arg(f/ B) (0),
où {an}
est l’ensemble des zéros de f dansD,
d’ordrerespectivement
pn,avec
an ~
0 et p l’ordre du zéro àl’origine,
B leproduit
de BLASCHKE associé à ces zéros et où JJ est une mesurepositive
bornée sur[201303C0, 03C0] singulière
parrapport
à la mesure de LEBERGUE(i.e., d03BC/d03BB
= 0 VB p.p. sur[201303C0, 03C0]).
Ainsi,
tout filtre réalisable etdissipatif
pourra être factorisé defaçon unique.
Deplus, si
le filtre f est une fraction rationnelle dont lespôles
sontà l’extérieur de
D
doncappartenant
àH2 ,
lacomposante singulière disparait.
Le lecteur intéressé par la théorie de
l’espace H2
etplus généralement
les espaces
HP
pourra consulter BELA Sz. NAGY[18],
DUREN[7],
DYM[8],
HOFFMAN
[14],
HELSON[12],
KOOSIS[17],
RUDIN[28],
RUCKEBUSCH[26],
STEIN[30],
WIENER[34].
(1) On peut identifier
L2 (T)
etL2c[201303C0,
03C0] cf. RUDIN [28].REMARQUE
Dans cet
exposé,
seuls les filtres scalaires ont été étudiés. Il est cepen- dantpossible
degénéraliser
les résultatsprésentés
au cas vectoriel(cf.
BELAS. NAGY
[18],
HANNAN[11],
ROBINSON[21],
ROZANOV[24]
et[25],
RUCKEBUSCH
[27],
WIENER[34]).
Lorsque
l’on cherche àapproximer
un filtre discret réalisable dont laréponse impulsionnelle
est une suiteinfinie,
il est souvent intéressant d’uti- liser la sous classe des filtres récursifsautorégressif-moyenne
mobiles(ARMA).
Un filtre de cette sous classe transforme
l’entrée 03BE
en une sortie y de la formeL’équation
aux différences(2.8) peut
s’écrire sous formeplus compacte
où
et
où B est
l’opérateur
dedécalage
arrièreLa filtre ARMA
(r, s)
a pour fonction de transfert la fraction rationnelleet pour
réponse impulsionnelle
la fractionOn
peut
montrer(cf.
KOOPMANS p.174) qu’une
condition suffisantepour que le filtre ARMA soit réalisable et
dissipatif
est que lepolynome
6(z)
= 0r
n’ait pas de racines dans le
disque
ferméD
={z : Izi ~ 1}
où03B4(z) = 03A3 6jzj;
60=1.
i=oLa classe des modèles considérés par BOX et TIAO pour modéliser des séries
temporelles
soumises à des interventions connues sont de la formeoù la sortie finale zt est
représentée
comme la somme des sortiesYj(1 ~ j ~ k)
transformées
respectivement
des variablesexogènes entrées 03BEj
par les filtres de fonctions de transfertrespectivement 03C9j(z)/03B4j(z)
où
wj(B)
et6j(B)
sont despolynomes
dedegrés Sj
etrj respectivement.
Les racines du
polynome 03C9j(z)=0 (respectivement 03B4j(z)=0)
sont suppo-sées être à l’extérieur du
disque
unité D(respectivement D).
Le bruitNt
t dif- férence entrezt
et 2Yjt
estreprésenté
par un processus récursif ARMAoù le
polynôme
moyenne mobilee (z)
a ses racines à l’extérieur dudisque
fermé D
(condition
d’inversibilité et où lepolynome autorégressif ~(z)
sefactorise en
général
sous la formes,
d,
D entierspositifs
ou nuls où les racines dupolynome o(z)
sont à l’exté-rieur du
disque
fermé D.Enfin,
on faitl’hypothèse
(i) {at}
est une suite de variables aléatoiresindépendantes,
distribuées suivantune loi normale
N (0, a2)
(ü)
chacune des variablesexogènes (ou indicateurs) entrées 03BEjt
estindépendante
du bruit
Nt.
Dans
l’analyse d’intervention,
les variablesexogènes
ou indicateurs03BEj(1 ~ j ~ k) prennent
les valeurs 1 et 0 pourreprésenter
l’occurence ou lanon occurence d’interventions connues.
La classe des modèles d’intervention
(2.12)
considérés par BOX et TIAO est donc constituée des filtresdissipatifs
et réalisables telle que laréponse
im-pulsionnelle
associée à chacun de ces filtres est une fraction rationnelle ene-i03BB.
On
peut
remarquer aussi que le bruitNt
éventuellement transformé par le filtre(1 - B)d
etplus généralement
par le filtre(1 - B)d (1 - Bs)D (où
s est lasaisonnalité du processus et D un entier
positif
ounul)
est la sortie d’un filtre réalisable etdissipatif
dont laréponse impulsionnelle
est une fraction ration-nelle
ene-i03BB.
Les fonctions de transfert associéesrespectivement
aux inter-ventions et au
bruit stochastique
stationnariséappartiennent
donc àl’espace
de HARDY
H2.
Il est doncpossible
d’utiliser d’unepart
les théorèmes de factorisation dansl’espace H2
et d’autrepart l’isomorphisime d’espace
deHILBERT entre
H2
etL + (T).
..La classe des modèles d’intervention de BOX et TIAO
(2.11) peut
être illustrée à l’aide de lafigure
1 en utilisant laterminologie
et les schémas des automaticiens.Figure 1. - Structure des filtres.
On utilise
principalement
dansl’analyse
d’intervention deuxtypes
de va- riablesexogènes
ou indicateurs- l’indicateur saut
- l’indicateur de
pulsion
Différents modèles
dynamiques
caractérisant les effets d’intervention ont étéprésentés
par ABRAHAM[1],
BHATTACHARYYA[3],
BOX et TIAO[5]
et
[31], TIAO,
BOX et HAMMING[31],
GRUPE[10],
HIPEL[13],
JENKINS[15],
PACK[20], SCHWARZ [29],WICHERN [33].
Par
exemple
si l’intervention à unepériode
T estreprésentée
par la sériePt
avec uneréponse
décroissanteexponentiellement
àpartir
de lapériode
sui-vante, alors le modèle
dynamique
sera donné pari.e.,
En
effet,
il suffit dedévelopper
la fraction1/(1 - 03B4B)
de(2.14)
en sérieentière
i.e.,
3. PREVISIONS A PARTIR DU MODELE D’INTERVENTION
Dans cette
partie
on suppose que le processus{zt ; t ~ Z}
est solutiondu modèle d’intervention
(2.11)
de BOX et TIAO et on calcule leprédicteur
linéaire
optimal
de l’observation future zn +Q(au
sens del’espérance
de l’erreurquadratique minimale,
critère notéMSE). Enfin,
on exhibe le biais deprédic-
tion
lorsque
l’onignore
lapartie
déterministe du modèle d’intervention. Ce calcul du biais deprédiction
nouspermet
de discuter del’adaptabilité
despré- dictions,
issues de modèlesARIMA,
aux indicateurs sauts etimpulsions.
Pour la clarté de
l’exposé
nousreportons
en annexe laplupart
des dé-monstrations
Théorème
Soit le processus
{zt ; t ~ Z}
solution del’équation stochastique
auxdifférences
où {03BEt ;
t EZ}
est une suite non aléatoire de 0 et 1 et{ at ;
t EZ}
un processus bruit blancgaussien
où les at sontindépendants.
Il estsupposé
en outre que~(B) = (1 - B)d (1 - Bs)D et les
zéros despolynomes ~(z)
et03B8(z)
sontà l’extérieur du
disque
unité fermé D.Alors le
prédicteur
linéaireoptimal (vis-à-vis
du critère minimum de l’es-pérance
de l’erreurquadratique
deprévision)
de l’observation futurezn+v(v ~ 1)
basée sur les données du
passé
zn, Zn-1, ... estl’espérance
de Zn+v condi- tionnellement aux valeurs observées du processus. Cetteespérance
conditionnelle notéeZn (v)
se calcule par la relationoù
et
03C0j(1)
=1Tj
où la suite{03C0j ; j ~ N} représente
les coefficients dans ledévelop- pement
ensérie
entière dePreuve : voir l’annexe 1.
Supposons
maintenant que l’on fasse uneprédiction
de la valeur future Zn +v enignorant
les effets del’intervention 03BE qui
s’estproduite
àT (n > T).
Dans ce cas, le
prédicteur
linéaireoptimal
est donné par(cf.
BOX et JENKINS[4]).
~Il est alors
possible
de calculer le biais deprédiction lorsque
l’onignore
cetteintervention,
àpartir
des relations(3.2)
et(3.5).
On
peut
donc àpartir
de cebiais,
illustrerl’adaptabilité
de la fonctionprédic-
tion
lorsque
le processus zt évolue suivant un modèle avec intervention dutype (2.11).
a)
Cas d’une intervention avec l’indicateur sautSi(T)
= 0 pour t T et 1pour t ~ T et d’une
réponse
de la forme03C9(B)/03B4(B)
=03C90.
Le biais de
prédiction
pourl’époque
n + v avec v >1,
n > T se calcule par(3.6)
etIl est alors intéressant de se demander si le biais converge vers zéro
lorsque
n
augmente indéfiniment
pour T fixé.Lemme 1
Si le processus
zt,
enignorant
lapartie intervention,
évolue suivant un modèle non stationnaire ARIMAoù les racines de 0
(z)
= 0 sont à l’extérieur dudisque
ferméD
et tel que~(z)
= 0admettre la racine unité
(i.e. ~(B) = (1 - B)d (1 - Bs)D ~(B)
avecmax (d, D)
>0),
alors
Preuve
Ce lemme se démontre à l’aide d’un raisonnement par récurrence.
Pour
puisque .p(z)
= 0 admet la racine unité et sachant que8 (z)
= 0 a ses racines àl’extérieur du
disque
ferméD (condition d’inversibilité),
celaimplique
queSupposons
maintenant que la relation(3.8)
soit vraie pourv - 1,
alorsEn
posant
k= j
+ v -1,
on obtientLe calcul du biais de
prédiction
donné par la relation(3.7)
et le lemme 1 montrent que les modèlesstochastiques
non stationnaires ARIMAs’auto-adaptent
à des
changements
de niveau liés à des interventions dutype
saut. En d’autres termes, le biais deprédiction quand
onignore
l’intervention tend vers zérolorsque
la
période
àpartir
delaquelle
on fait desprévisions s’éloigne
de la date d’inter- vention.b) Cas
d’une intervention avec l’indicateurimpulsion Pt(T)
= 0 pour t ~ Tet 1 pour t = T et d’une
réponse
de la forme03C9(B)/03B4 (B)
= o?o . Le biais deprédiction
se calcule parLe biais convergera donc vers zéro si la suite
{03C0(v)n+1-T}
converge vers zérolorsque
naugmente
indéfiniment.Compte
tenu de la relation de récurrence(3.3)
liant les
poids 03C0(v)j,
il est clairqu’il
estéquivalent
d’étudier lecomportement
de la suite des
{03C0k,k~N}.
Cespoids
sont les coefficients de la série entièreSi le modèle ARIMA est
inversible i.e.,
les racines{ai}
dupolynome e (z)
= 0 sont àl’extérieur
dudisque D,
alors la série entière7r(z)
estconvergente
dans ledisque 15(0, p)
avec 1 pmin lai 1
. La vitesse de convergence de la suite{03C0k}
vers zéro est donc lié à laproximité
de la racine deplus petit
mo-dule à la frontière T du
disque
unité D.Nous allons maintenant énoncer et démontrer en annexe un lemme
qui permettra
d’étudier la vitesse de convergence vers zéro de la suite{03C0k,k~N}.
,
Lemme 2
Soient P et
Q
deuxpolynomes
en z à coefficientscomplexes
sans facteurscommuns
où les racines deQ(z) = 0
sont à l’extérieur dudisque
unitéD=
{z~C ; |z| ~ 1}.
Alorset il existe deux constantes réellees A et B strictement
positives
telles queOn
peut
donc enappliquant
le lemmeprécédent
à la fraction rationnelle~(z)/03B8(z)
définie en(3.10) conclure
que si les zérosal’ a2 ’ ... , aq de 03B8(z)
sont à l’extérieur du
disque
fermé D alors lespoids {03C0k}
tendent vers zéro etSous ces conditions de biais de
prédiction 03B4n(v)
donné par la relation(3.7)
converge vers zérolorsque
letemps présent
ns’éloigne
de la date T d’in- tervention. La convergence vers zéro(de type
décroissanceexponentielle)
estd’autant
plus rapide
que le minimum des valeurs absolues des zéros dupolynome 0(z) est éloigné de
1.4. EXEMPLES D’APPLICATION
La méthode
développée
par BOX et JENKINS etl’analyse
des interven-tions de BOX et TIAO ont été utilisées pour
analyser
le trafic aérien national passagers et mesurer les effetsdynamiques
des deuxprincipales grèves
des contrô- leurs aériensqui
se sont déroulées enFévrier,
Mars 1973 etNovembre,
Dé- cembre 1979.L’estimation des différents modèles a été faite en utilisant
l’historique
du trafic mensuel de Janvier 1969 à Mars 1980
(cf.
Annexe2).
Unepartie
del’évolution de ce trafic est
représentée
à lafigure
1.Figure 1. - Trafic passagers national.
a)
Construction du modèleincorporant
l’effet degrève
en Février et Mars 1973La modélisation a
porté
sur la tranched’historique
du traficcommençant
en Janvier 1969 et se terminant en
Septembre
1979.Une
analyse préalable
par la méthodeclassique
de BOX et JENKINS apermis
de retenir deux modèles(en
fait ces deux modèles ont été estimés sur unhistorique tronqué
pour les six dernières observations et desprévisions
ontété
générées
sur lapériode
éliminée. Les critères de sélection des modèles ont été de deuxtypes :
les critèresclassiques
de BOX et JENKINS sur lapériode
d’estimation et les critères
MAPE(L)
etRMSE(2)
sur lapériode
deprévisions simulées).
Lescaractéristiques
des deux modèles retenusM i
etM2
sont résu-mées dans la table 1.
Pour tenir
compte
de la baissedramatique
du niveau du trafic lors de lagrève
des contrôleurs aériensfrançais
en Février et Mars 1973(cf. fig. 1)
il aété inclus dans chacun des modèles
(Ml)
et(M2)
une fonction d’interventioncomportant
deux interventions.Les deux interventions
correspondant
à lagrève
de Février et Mars 1973respectivement
ont été modélisées à l’aide de l’indicateurpulsion
ensupposant
que chacune des
grèves produisait
uneréponse
instantannée définie par unebaisse du trafic de la valeur 03C91 et W2 pour Février et Mars
respectivement.
En outre une
réponse dynamique
dans letemps
detype exponentiel
a été in-corporée
dans la modélisation afin deprendre
encompte
unerécupération
éventuelle du trafic à
partir
d’Avril. Cette dernièrehypothèse
sera à tester enregardant
lasignificativité
des coefficients de la fonctionréponse dynamique
du filtre.
Compte
tenu de cequi précède
la fonction d’intervention déterministese modélise sous la forme
où
Le modèle
(4.1) peut
encore s’écrire sous la formeéquivalente
avec
Les
hypothèses qui
ontpermis
de construire le modèle(4.1)
ou(4.2)
peuvent
être résumées dans lafigure
2.M
Figure 2. - Fonction d’intervention.
Les modèles d’intervention dans
lesquels
le bruitNt
évolue suivant unmodèle ARIMA de
type Mi
ouM2
et notésrespectivement Ml173
etM2I73
ont été estimés sur la
période
s’étendant de Janvier 1969 àSeptembre
1979.Les
paramètres estimés (1)
du modèleM1 I73
etM2 173 figurent
dans la table 2.Pour le modèle
MI 1 on
constate àpartir
des écartstypes
estimés SE des esti- mateursqu’il
estpossible d’accepter (au
seuil 95%)
la non nullité desparamètres
~ = (~1 , ~2 , cp3 ’ 03A6) du
modèle d’évolution du bruitNt (cf.
la table1).
Ence
qui
concerne lesparamètres
du modèle d’interventionfi t)
onconstate que la
perte
de trafic pour Février et Mars 73 est estiméerespective-
ment à
03C91 = -7676(101)
etw2 = - 12970(101)
passagers. Unepremière
estimation de la perte
globale
sur les deux mois degrève
est donc évaluée à206 460 passagers.
Par contre bien que le coefficient estimé ô soit
significativement
diffé-rent de
zéro,
le coefficient W3 estimé à2020(101)
estsignificativement
nul(l’écart type
estimé vaut2810(101)).
Dans ces conditions on nepeut
pas affir-mer
(statistiquement) qu’il
y a unphénomène
derécupération qui joue après
la
grève.
La même constatation
peut
être déduite des valeurs estimées du modèleM2I
où le bruitNt
suit un processus dutype M2.
Sous cettehypothèse,
laperte wl (respect. w2)
pour Février 73(respect.
Mars73)
vaut8619.101 (respect.
12136.101)
soit pour les deux mois degrève
uneperte
totale estimée à 207550 passagers.Les coefficients estimés
03C93
pour le modèleMil
et03C93, e 6
pour le mo-dèle
M2I
étantsignificativement égaux
à zéro(au
seuil a = 5%)
il convient de réestimer les modèlescompte
tenu de ces nouvelleshypothèses.
Les es-timations définitives des deux modèles sont
présentés
dans la table 3.(1) Estimation par l’algorithme des moindres carrés non linéaire de GRUPE [10].
0
TABLE 3
Modèles sélectionnés avec interventions
Les
pertes globales
pour les mois de Février et Mars sont évaluées à 224910 et 222 720 passagers pour les modèlesMi 173
etM2 I73 respective-
ment.
Les
graphiques superposés
du trafic observé et estimé avec et sans inter- ventions pour lapériode
Février-Juillet 1973 sontreprésentés
dans lafigure
3.b)
Construction du modèleincorporant
l’effet degrève
en Novembre et Dé-cembre 1979
Une démarche similaire à celle
proposée
dansl’exemple a)
a été utiliséepour modéliser les effets de
grèves
des contrôleurs aériens survenues en No- vembre et Décembre 1979. Pourjustifier
sur leplan statistique
l’introduction de fonction d’intervention dans le modèlestochastique,
il a été mis en oeuvrele test de BOX et TIAO
[6].
Ce testpermet
de détecter unchangement
éven-tuel du modèle sur la
période
allant de Novembre 1979 à Mars 1980(Mars
étantla dernière observation
disponible).
Ce test
permet
de tester siglobalement
les différences entre observations etprévisions
simulées sontsignificativement
différentes de zéro sur lapériode
de
changement suspectée.
Figure 3. - Comparaison entre les valeurs observées et les valeurs estimées par les modèles
M1, M1 I et M2I.
Si l’on suppose que zt évolue suivant un processus ARIMA
~(B)
zt - 03B8(B) at
alors onpeut
montrer que l’erreur deprévision
faite en n + v(v ~ 1)
pour des
prévisions générées
àpartir
del’époque présente
n est donnée par(cf.
BOX et JENKINS[4]
page128)
où la
séquence
despoids 1, 03A81,..., 03A8v-1
est obtenue enprenant
les v pre- miers coefficients dans ledéveloppement
en série entièrede 03A8(B)
=0(B) ~-1 (B)
et
où {at}
est un processus bruit blancgaussien i.e.,
En notant par
en
le vecteur decomposantes en(1),
... ,en(m), an
levecteur de
composantes
an+1 ,... an + m etpar 03A8 m
la matricetriangulaire
basse de dimension
(m , m) :
on a la relation évidente
En
remarquant
que la matrice de covariance du vecteuremn
vaut03C32 03A8m 03A8’m
sous les conditions
(4.4),
il s’ensuit que sousl’hypothèse
nulle : le modèle estiméjusqu’à l’époque
n estapproprié
surl’époque
n +1, ... ,
n +m (m > 1),
lastatistique
est distribuée suivant un
x2
à mdegrés
de liberté. Lastatistique Q
n’estrien d’autre que la somme des carrés des erreurs de
prévision,
de pas un, standardi- sées. L’erreur deprévision
de pas un étant définie parL’utilisation du test de BOX et TIAO nécessite d’estimer
préalablement
la variance
a2
du bruit. Lastatistique Q
obtenue enremplaçant a 2
par son estimateurâ2
suit alorsapproximativement
une loi du~2m- lorsque
n est suf-fisamment
grand (cf.
BOX et TIAO[6]
page197).
Lastatistique Q peut
ainsiêtre
calculée
connaissant lespoids 03A81 ,..., 03A8m
etQ 2
et êtrecomparée
aufractile
X m (p).
La valeur estimée de
Q
sur lapériode
allant de Novembre 1979 à Mars 1980 pour le modèleM179
retenu(estimé jusqu’en
Octobre1979)
étant de45,27,
ilconvient de
rejeter l’hypothèse
nulle de stabilité du modèleM179
au seuil a =0,05 (~25(0,95) = 11,1).
Il est doncparfaitement justifié d’utiliser
un modèle avecinterventions.
Les
analyses statistiques
ontpermis
de retenir le modèle avec interven-tions suivant
où
où
Pt(Nov) (respect. Pt(Dec)
est l’indicateurqui prend
la valeur 1 si t = Nov(respect.
t =Dec)
et 0 sinon(respect.
0sinon).
Les estimations des
paramètres
du modèle retenu sontprésentées
dansla table 4. Ce modèle
indique qu’il n’y
a pas derécupération dynamique
dutrafic passagers
(au
seuil 5%).
Laperte
totale sur les deux mois degrève
estévaluée à 383 820 passagers.
Considérons le modème
M 80 1
estimé sur lapériode
allant de Janvier 1969 à Mars 1980 et dontl’équation
est donnée par(1
+0,296
B +0,392 B2
+0,225 B3) (1 + 0,721 B12) [0,094] [0,089] [0,096] [0,081]
(1 - B) (1 - B12) zt = ât
[4405]
Compte
tenu du théorème et du lemme2,
le biais deprédiction 03B4n(v) lorsque
l’on
ignore
lapartie intervention,
converge vers zéroquand
letemps présent s’éloigne
de lapériode
T d’intervention. Celasignifie
que le modèleM180
dontle
polynome
moyenne mobile est inversibles’auto-adapte
enprésence
d’inter-ventions de
type impulsion
et deréponses
de la formecj(B)/6 (B) = 03C90.
Figure 4. - Evolution des
prédictions
D’autre
part,
nous avonsreprésenté
enfigure
4 l’évolution desprédic-
tions faites en Mars 1980 pour
Avril, Mai, ... ,
Décembre 1980 à l’aide des modèles :MI9, M180, MII79
estimésrespectivement
sur lespériodes:
Janvier1969 à Octobre
1979,
Janvier 1969 à Mars 1980 et Janvier 1969 à Mars 1980.On constate que ces
prédictions
sontpratiquement
confondues(pour plus
deprécision
le lecteurpeut
sereporter
à l’annexe 2 oùfigurent
les valeurs numé-riques
desprédictions).
5. CONCLUSION
Dans cet article nous avons tout d’abord
présenté
les modèles d’inter-ventions de BOX et TIAO comme des filtres linéaires réalisables et
dissipatifs.
Nous avons montré que les fonctions de transfert associées à cette classe de filtres
appartenaient
àl’espace
deHardy H2
identifié à un sous espace deL2(-
7T,7r)
par unisomorphisme d’espace
de HILBERT. Nous avons alorsindiqué
l’intérêt d’une telle identificationcompte
tenu des théorèmes de fac- torisation dansH2.
Ces résultatspeuvent
d’ailleurs être étendus au cas où les variablesentrées 03BEi
sont des variables aléatoires. Cette extensionpermet
alors de couvrir le casdes
modèles avec fonction de transfert de BOX et JENKINS et les modèles vectoriels ARIMAlorsqu’il
y a des effets de rétroactions.Nous avons
ensuite, gràce
à unthéorème,
calculé le biais deprédiction
différence entre la
prévision générée
par un modèleincorporant
le filtre lié à l’intervention connue et celle issue d’un modèleignorant
l’intervention. Ce calcul du biais deprédiction
nous apermis
de montrer d’unepart
que les proces-sus non stationnaires dont le
polynome autorégressif
admet la racine unités’auto-adaptant
à des interventions detype
saut, et d’autrepart
que les processus ARIMA dont lepolynome
moyenne mobile est inversibles’auto-adaptant
àdes interventions de
type impulsion.
Les résultats trouvés ont été illustrés àpartir
de deuxexemples.
ANNEXE 1
Preuve du théorème
Il est bien connu que le
prédicteur optimal (au
sensMSE)
de l’observation future Zn + Il estl’espérance
conditionnelle de Zn + Il sachant Zn, Zn - 1 , ...Ce
prédicteur optimal
est une combinaison linéaire des données dupassé
si leprocessus at est
indépendant
deZs, s t (cf.
ANDERSON[2], GRENANDER [9], HANNAN[11]).
Nous allons démontrer la relation
(3.2)
à l’aide d’un raisonnement par récurrence. On induit la relation pour v = 1 et2,
on admet lapropriété
pourv - 1 et on la démontre pour v.
Multiplions
les deux nombres del’équation (3.1)
parrr(B)
etremplaçons
le
temps
t par n +1,
il vientDéveloppons compte
tenu de(3.4)
Prenons
l’espérance
conditionnelle de z,, + 1 sachant{Zn, Zn - 1 ,...} = Z(n)
et
puisque
E(an + 1 Z(n»
=0,
on obtientPour obtenir le
prédicteur
linéaireoptimal
pour v =2,
on remarque quesoit encore
Le
prédicteur
linéaireoptimal
pour v = 2 s’obtient enprenant l’espérance
condi-tionnellement à
Z(n)
et enremarquant
que an+1 et an+2 sontindépendants
de
Z(n), il
vientce
qui permet
d’induire les relations(3.2)
et(3.3)
du théorème.Supposons
maintenant ces relations vraiesjusqu’à v -
1 et montronsqu’elles
sont aussi vérifiées pour v.A
partir
de la relation(A.1)
et pour letemps
n + v, on aLe
prédicteur
linéaireoptimal
est donné parRemplaçons zn(v-1) ,..., zn(l)
par leur valeurSoit en
réarrangeant
les termes(car
onpeut
commuter les sommationspuisque
~
la série
L. 1Tj
estsommable,
en effet~(B) = (1 - B)d (1 - Bs)D ~(B)
max(d, D)
> 0o
or
7r(B)
=cp(B) /
03B8(B)
donc03C0(1)
= 1- 03A3 03C0j
= 0 si 03B8(z)
= 0 n’a pas de zéro sur1
le cercle unite
T) .
La relation
(A.3)
s’écrit doncEt en utilisant la relation
(3.3),
on obtient bien la relation(3.2)
annoncée.Preuve du lemme 2
Décomposons
la fraction rationnelleP/Q
en élémentssimples
sur Coù
E(z) représente
lepolynome partie
entière de la fraction rationnelle. Onest donc ramené à
développer
en série entière les termes de la forme(z-a)-p
avec a =1= 0.
A
partir
dudéveloppement
de(1-z)-1
et en dérivant p fois on obtientet
Montrons
qu’il
estpossible
demajorer
la valeur absolue du coefficient sk dezk lorsque la | >
1et
la suite
{|sk| |a|k/2}
reste donc bornée par une constante K > 0 etEn considérant tous les
termes
de la forme(z-a)-p
dans(A.4)
et enregroupant
les coefficients dez
on obtient1
avec
B = - Log |a| >
0ou la |
=min 1 ai 1
; les ai étant les zéros dupoly-
2 -
nome
0 (z) supposés
à l’extérieur de D.ANNEXE 2
Historique
du trafic national(Janvier
1969 à Mars1980)
Prévisions
REFERENCES
[1]
B. ABRAHAM. - Intervention inmultiple
timesseries, Proceedings of
theAmerican Statistical Association
(Statistics section), Washington,
1978.[2]
T.W. ANDERSON. - The statisticalAnalysis of
Timeseries, Wiley:
NewYork,
1971.[3]
M.N. BATTACHARYYA and A. LAYTON. - Effectiveness of Sealt BeltLegislation
on theQueensland
Road Toll - An Australian CaseStudy
inIntervention
Analysis,
J. Amer. Statist.Assoc., 74, 596-603,1979.
[4]
G.E.P. BOX and G.M. JENKINS. - Time SeriesAnalysis Forecasting
andControl, Holden-Day :
SanFrancisco, 1970, 1976.
[5]
G.E.P. BOX and G.C. TIAO. - Interventionanalysis
withapplications
toenvironmental to economic
problem, J.
Amer. Statist. Assoc.70, 70,
1975.[6]
G.E.P. BOX and G.C. TIAO. -Comparison
of forecast andactuality, Appl.
Statist., 25, n° 3, 105,
1976.[7]
P. DUREN. -Theory of Hp
spaces, Academic Press : NewYork,
1970.[8]
H. DYM and H.P. McKEAN. -Gaussian Processes,
FunctionTheory,
and the InverseSpectral Problem,
Academic Press : NewYork,
1976.[9]
U. GRENANDER and M. ROSENBLATT. - StatisticalAnalysis of
Statio-nary Time
Series, Wiley :
NewYork, 1957.
[10]
M.R. GRUPE. - ModifiedComputer Programs, Department
ofStatistics, University of Wisconsin-Madison, 1977.
[11] E.J. HANNAN. - Multiple Time Series, Wiley :
NewYork,
1970.[12]
H. HELSON. - Lectures on InvariantSubspaces,
Academic Press : NewYork,
1964.
[13]
HIPEL and OTHERS. - Interventionanalysis
in water resources, Water Re-sources