• Aucun résultat trouvé

Modélisation des séries temporelles : processus ARFIMA

N/A
N/A
Protected

Academic year: 2021

Partager "Modélisation des séries temporelles : processus ARFIMA"

Copied!
82
0
0

Texte intégral

(1)

République Algérienne Démocratique et Populaire Ministère de l’enseignement Supérieur et de la Recherche Scientifique

Université Mohammed Seddik Ben Yahai - Jijel

Faculté des Sciences Exacte et Informatique Département de Mathématique

№ d’ordre : ...

№ de séries : ...

Mémoire de fin d’études

Présenté pour l’obtention du diplôme de

Master

Spécialité : Mathématiques.

Option : Probabilités et statistiques.

Thème

Modélisation des séries temporelles : processus ARFIMA

Présenté par : - GHEDIED Nora - LASMAR Zohra

Devant le jury :

Président : GHOUIL Djoweda Encadreur : CHERAITIA Hassen Examinateur : SELLAMI Nawel

Promotion 2017/2018

(2)

TABLE DES MATIÈRES

Liste des tableaux v

Liste des figures viii

Notations ix

Introduction générale x

1 Introduction aux modèles linéaires ARIMA 1

1.1 Introduction aux séries chronologiques . . . . 1

1.1.1 Approches temps/fréquences : un peu d’histoire . . . . 2

1.1.2 Les composantes principales d’une série temporelle . . . . 4

1.1.3 Les modèles de décomposition déterministe . . . . 4

1.1.4 Estimation et élimination de la partie déterministe (T(t) et S(t)) . . 4

1.2 Processus stochastique . . . . 4

1.2.1 Définitions . . . . 4

1.2.2 Les autocorrélations et la densité spectrale . . . . 7

1.3 Processus ARMA . . . . 10

i

(3)

TABLE DES MATIÈRES ii

1.3.1 Processus MA(q) . . . . 10

1.3.2 Le processus AR(p) . . . . 13

1.3.3 Processus ARMA(p,q) . . . . 17

1.4 Processus ARIMA et SARIMA . . . . 20

1.4.1 Processus ARIMA . . . . 20

1.4.2 Processus SARIMA . . . . 20

1.5 Processus TS et DS . . . . 21

1.5.1 Les processus TS (Trend stationary) . . . . 21

1.5.2 Les processus DS (Differency Stationary ) . . . . 22

2 Les processus autorégressifs moyennes mobiles fractionnairement inte- grés (ARFIMA) 24 2.1 Introduction à la notion de ˝mémoire longue˝ . . . . 25

2.1.1 Généralités et définitions . . . . 25

2.1.2 La comparaison entre un processus à mémoire longue et un proces- sus à courte mémoire . . . . 26

2.1.3 Processus self-similaires . . . . 26

2.2 Processsus ARFIMA . . . . 27

2.2.1 Processus ARFIMA(0,d,0) . . . . 27

2.2.2 Processsus ARFIMA(p,d,q) . . . . 29

2.2.3 Exposant de Hurst . . . . 31

2.3 Les méthodes d’estimation des processus ARFIMA . . . . 33

2.3.1 Les méthodes en deux étapes . . . . 34

2.3.2 Les méthodes en une étape . . . . 35

2.4 Résultats préliminaires sur les prédicteurs dans un modèle ARFIMA(p,d,q) 38

2.4.1 Prédiction linéaire à l’horizon l basée sur n observations de X 1 , X 2 , ..., X n

d’un processus . . . . 38

(4)

TABLE DES MATIÈRES iii

2.4.2 Prédiction pour un processus ARFIMA(p,d,q) avec

d >1 2 . . . . 39

3 Applications 40 3.1 Simulation des modèles ARFIMA . . . . 41

3.1.1 Quelques simulations des modèles ARFIMA(0,d,0) . . . . 41

3.1.2 Quelques simulations des modèles ARFIMA(p,d,0) . . . . 42

3.1.3 Quelques simulations des modèles ARFIMA(0,d,q) . . . . 44

3.1.4 Estimation du paramètre d’integration fractionnaire "d" . . . . 45

3.2 Étude empirique sur les modèles ARFIMA . . . . 52

3.2.1 Analyse préliminaire de la série ( tmpyr ) . . . . 52

3.2.2 Différentiation de la série ( tmpyr ) . . . . 53

3.2.3 La méthodologie de Box-Jenkins . . . . 54

3.2.4 Prévisions . . . . 61

Conclusion générale 63

Bibliographie 65

Annex 67

(5)

LISTE DES TABLEAUX

3.1 Les résultats d’estimation d’un ARFIMA(0,d,0) pour n=200 par la mé- thode GPH. . . . 46 3.2 Les résultats d’estimation d’un ARFIMA(0,d,0) pour n=1000 par la mé-

thode de GPH. . . . 46 3.3 Les résultats d’estimation d’un ARFIMA(0,d,1) pour n=200 par la mé-

thode de GPH. . . . 47 3.4 Les résultats d’estimation d’un ARFIMA(0,d,1) pour n=1000 par la mé-

thode de GPH. . . . 47 3.5 Les résultats d’estimation d’un ARFIMA(1,d,0) pour n=200 par la mé-

thode de GPH. . . . 48 3.6 Les résultats d’estimation d’un ARFIMA(1,d,0) pour n=1000 par la mé-

thode de GPH. . . . 48 3.7 Les résultats d’estimation d’un ARFIMA(0,d,0) pour n=200 par la mé-

thode de Whittle. . . . 49 3.8 Les résultats d’estimation d’un ARFIMA(0,d,0) pour n=1000 par la mé-

thode de Whittle. . . . 49 3.9 Les résultats d’estimation d’un ARFIMA(0,d,1) pour n=200 par la mé-

thode de Whittle. . . . 50

iv

(6)

Liste des tableaux v

3.10 Les résultats d’estimation d’un ARFIMA(0,d,1) pour n=1000 par la mé- thode de Whittle. . . . . 50 3.11 Les résultats d’estimation d’un ARFIMA(1,d,0) pour n=200 par la mé-

thode de Whittle. . . . . 51 3.12 Les résultats d’estimation d’un ARFIMA(1,d,0) pour n=1000 par la mé-

thode de Whittle. . . . 51

3.13 La table des critères du choix de meilleur modèle. . . . 59

3.14 La table des prévisions. . . . 61

(7)

TABLE DES FIGURES

3.1 Le graphe d’un processus ARFIMA(0,0.1,0). . . . 41

3.2 Le corrélogramme d’un processus ARFIMA(0,0.1,0). . . . 41

3.3 Le corrélogramme partiel d’un processus ARFIMA(0,0.1,0). . . . 41

3.4 Le périodogramme d’un processus ARFIMA(0,0.1,0). . . . 41

3.5 Le graphe d’un processus ARFIMA(0,-0.1,0). . . . 42

3.6 Le corrélogramme d’un processus ARFIMA(0,-0.1,0). . . . 42

3.7 Le corrélogramme partiel d’un processus ARFIMA(0,-0.1,0). . . . 42

3.8 Le corrélogramme partiel d’un processus ARFIMA(0,-0.1,0). . . . 42

3.9 Le graphe d’un processus ARFIMA(0.3,0.1,0). . . . 42

3.10 Le corrélogramme d’un processus ARFIMA(0.3,0.1,0). . . . 42

3.11 Le corrélogramme partiel d’un processus ARFIMA(0.3,0.1,0). . . . 43

3.12 Le périodogramme d’un processus ARFIMA(0.3,0.1,0). . . . 43

3.13 Le graphe d’un processus ARFIMA(0.7,-0.1,0). . . . 43

3.14 Le corrélogramme d’un processus ARFIMA(0.7,-0.1,0). . . . 43

3.15 Le corrélogramme partiel d’un processus ARFIMA(0.7,-0.1,0). . . . 43

3.16 Le péridogramme d’un processus ARFIMA(0.7,-0.1,0). . . . . 43

vi

(8)

Table des figures vii

3.17 Le graphe d’un processus ARFIMA(0,0.1,0.3). . . . 44

3.18 Le corrélogramme d’un processus ARFIMA(0,0.1,0.3). . . . 44

3.19 Le corrélogramme partiel d’un processus ARFIMA(0,0.1,0.3). . . . 44

3.20 Le périodogramme d’un processus ARFIMA(0,0.1,0.3). . . . 44

3.21 Le graphe d’un processus ARFIMA(0,-0.1,0.7). . . . 44

3.22 Le corrélogramme d’un processus ARFIMA(0,-0.1,0.7). . . . 44

3.23 Le corrélogramme partiel d’un processus ARFIMA(0,-0.1,0.7). . . . 45

3.24 Le périodogramme d’un processus ARFIMA(0,-0.1,0.7). . . . 45

3.25 Le graphe de la série tmpyr . . . . . 52

3.26 Le corrélogramme de la série tmpyr . . . . 53

3.27 Le corrélogramme partiel de la série tmpyr . . . . 53

3.28 Le graphe de la série différenciée. . . . 54

3.29 Le corrélogramme de la série différenciée. . . . . 54

3.30 Le corrélogramme partiel de la série différenciée. . . . . 54

3.31 Le graphe de la série résiduelle pour le modèle AR(1). . . . 56

3.32 Le corrélogramme de la série résiduelle pour le modèle AR(1). . . . 56

3.33 Le corrélogramme partiel de la série résiduelle pour le modèle AR(1). . . . 57

3.34 Le périodogramme de la série résiduelle pour le modèle AR(1). . . . 57

3.35 Le graphe de la série résiduelle pour le modèle MA(1). . . . . 57

3.36 Le corrélogramme de la série résiduelle pour le modèle MA(1). . . . 57

3.37 Le corrélogramme de la série résiduelle pour le modèle MA(1). . . . 58

3.38 Le corrélogramme partiel de la série résiduelle pour le modèle MA(1). . . . 58

3.39 Le graphe de la série résiduelle pour le modèle ARMA(1,1). . . . 58

3.40 Le corrélogramme de la série résiduelle pour le modèle ARMA(1,1). . . . . 58

3.41 Le corrélogramme partiel de la série résiduelle pour le modèle ARMA(1,1). 59

3.42 Le périodogramme de la série résiduelle pour le modèle ARMA(1,1). . . . . 59

(9)

Table des figures viii

3.43 L’histogramme des résidus pour le modèle ARMA(1,1). . . . 60

(10)

NOTATIONS

T t : La tendance S t : La saisonalité ε t : Le résidu bb : Bruit blanc

i.i.d : Indépandant identiquement distribué

E : Espérance

Var : Variance Cov : Covariance Corr : Corrélation

ACF : Auto correlation function "Fonction d’autocorrélation"

PACF : Partial auto correlation function "Fonction d’autocorrelation partiel"

ARMA : Auto regressive moving average "Autorégressif moyenne mobile"

AR : Auto regressive "Autorégressif"

MA : Moving average "Moyenne mobile"

ARIMA : Autorégressif intégré moyenne mobile

SARIMA : Autorégressif moyenne mobile integré saisonier ARFIMA : Autorégressif fractionnée intégré moyenne mobile DS : Differency stationary "Marche aléatoire"

TS : Trend stationary

H : Hurst exponent "Exposant de Hurst"

R/S : Scaled Range Method

GPH : La méthode de Geweke et Porter Hudak

Whittle : La méthode du maximum de vraisemblance approché par la fonction de Whittle RMSE : La racine de l’erreur quadratique moyenne

MAE : L’erreur absolue moyenne

ix

(11)

INTRODUCTION GÉNÉRALE

Une série chronologique est un ensemble d’observations qui est obtenu de façon sé- quentielle à des intervalles de temps régulièrs ou non. La modélisation et la prévision des séries chronologiques est un enjeu important dans de nombreux domaines : l’économétrie financière, l’économétrie classique, les sciences sociales et médicales, la démographie, et les sciences du climat .

Les objectifs pour l’étude des séries chronologiques est la description et la compréhen- sion du mécanisme de production de la série d’une part, et la prévision des valeurs futures d’une autre part.

Les séries chronologiques linéaires peuvent être divisées en deux principales catégo- ries. Les processus à mémoire courte et les processus à mémoire longue. Nous disons qu’un processus linéaire est à mémoire courte si sa fonction d’autocovariance est abso- lument sommable i.e P h∈Z |γ(h)| < ∞. On dit que le processus est à mémoire longue si

P

h∈Z |γ(h)| = ∞. Les processus à mémoire courte sont largement utilisés dans de nom- breux domaines et de multiples modèles ont été proposés : AR, MA, ARMA. En revanche, les modèles permettant de représenter les processus à mémoire longue ne sont apparus qu’au début des années 50, historiquement pour l’étude du comportement inhabituel des niveaux du fleuve Nil en Egypte.

Les processus à mémoire longue s’avèrent plus adaptés à l’étude des séries chronolo- giques issues par exemple de l’économie, la climatologie et l’économétrie financière. On peut, dans cette situation, adapter un modèle plus large appelé modèle ARMA fraction- naire et qui présente « une longue mémoire » .

L’objet de notre travail porte sur l’inférence statistique dans une classe de modèles

x

(12)

Introduction générale xi

à longue mémoire, plus précisément, les modèles autorégressif moyennes mobile fraction- nairement integrés ARFIMA(p,d,q).

Ce mémoire se compose de trois chapitres.

Dans le premier chapitre intitulé "Introduction aux modèles linéaires ARIMA", nous rappelerons les notions fondamentales sur les séries chronologiques, ce chapitre est consa- cré à l’étude des processus ARMA, leurs cas particulières "AR", "MA" et leurs proprietés, des processus ARIMA et SARIMA et aussi les processus non stationnaires TS et DS.

Le deuxième chapitre intitulé "Les processus ARFIMA" est consacré à la présentation du modèle ARFIMA(p,d,q), ses propriétés de causalité et d’inversibilité, l’expression de sa fonction d’autocovariance ainsi que sa représentation spectrale, et à l’estimation du paramètre d’intégration fractionnaire "d" du modèle ARFIMA(p,d,q). Trois méthodes d’estimation sont présentées : la méthode de "Hurst", la méthode de Geweke et Porter Hudak "GPH" et la méthode du maximum de vraisemblance approché par la fonction de Whittle "Whittle". Ce chapitre a été clôturé par les prévisions basées sur les processus ARFIMA(p,d,q).

Enfin, le dernier chapitre intitulé "Application" divisé en deux parties, la première est consacrée à la simulation de différents modèles ARFIMA(p,d,q) et l’estimation du paramètre d’integration fractionnaire "d" par deux méthodes : "GPH" et "Whittle", ensuite on fait compléter notre chapitre par une application de la méthode de Box-Jenkins utilisée pour la prévision sur la série de température annuelle "tmpyr" de package "arfima" du logiciel R.

A la fin, une conclusion générale dresse une synthèse des principaux résultats obtenus

au cours de notre travail.

(13)

CHAPITRE 1

INTRODUCTION AUX MODÈLES LINÉAIRES ARIMA

Dans ce chapitre nous essayerons de présenter brièvement les notions classiques des séries chronologiques et des processus aléatoires , on reprendre brièvement la théorie sur les processus ARMA, ARIMA et SARIMA qui servira dans la modélisation à mémoire courte et moyenne des séries chronologiques qu’on rencontre assez souvent dans la vie caurante. Ces processus développés dans les années quarante du siècle passé, on connu un grand intérêt de la part des chercheurs en statistique.

On étudierait par la suite les caractéristiques statistiques en terme de stationnarité et d’inversibilité de ces processus, leurs fonctions d’autocovariances, d’autocorrélations et leurs densité spectrale. Enfin, on présente un panorama des processus linéaire non stationnaires TS et DS.

1.1 Introduction aux séries chronologiques

Définition 1.1.1. On considère q’une série temporelle (chronologique) observeé {x t , t = 1, ..., T } est la réalisation d’un processus aléatoire {X t , t = 1, ..., T }. Les X t sont des variables aléatoires, et x t est la valeur prise par X t , ce qui advient à la date t, T = Z ou N (espace d’évolution discrèt), et E = R (espace des états continu).

1

(14)

1.1. Introduction aux séries chronologiques 2

1.1.1 Approches temps/fréquences : un peu d’histoire

De façon générale, quand on parle de séries stationnaires, on a en tête une repré- sentation de la forme X t , où t ∈ Z , dont on peut définir un ensemble d’autocovariance par :

γ(t, s) = E([X tµ][X sµ]), qui ne dépend que la distance entre t et s tel que γ(t, s) tend vers zéro lorsque (t − s) tend vers l’infini.

Cette approche, basée sur l’utilisation des corrélations, correspond à l’analyse de type

temporelle  : elle consiste à étudier les corrélations croisées de fonctions de la série (X t ). Ces méthodes sont généralement paramétriques de type moyenne-mobiles (moving average MA) ou autorégressives (AR).

L’autre approche également utilisée est celle basée sur l’étude des  fréquences . Cette vision est une généralisation des méthodes utilisées en analyse de Fourier. L’idée est ici d’approximer une fonction analytique par une somme pondérée de fonctions sinus ou cosinus.

1.1.1.1 Analyse harmonique

Les astronomes ont été les premiers à utiliser l’analyse de Fourier pour des séries chronologiques. Leur but était de détecter des saisonalités cachées au sein de leurs données.

Ainsi, Lagrange a utilisé ces méthodes pour détecter de la périodicité cachée en 1772 et en 1778. Un demi-siècle plus tard, en 1847, Buys et Ballot, dans Les changements périodiques de températuresont proposé des méthodes pour étudier la périodicité de données astronomiques. Toutefois, il a fallu attendre 1889 pour que Sir Arthur Shuster introduise le périodogramme, qui constitue la base des méthodes spectrales d’analyse de séries chronologiques. L’idée est la suivante : on recherche un modèle sous-jacent de la forme :

X t = X h α j cos(w j t) + β j sin(w j t) i + ε t ,

où (ε t ) est une suite de variables aléatoires indépendantes identiquement distribuées, qui correspondront à un bruit blanc.

1.1.1.2 Modèles autoregressifs et moyennes mobiles

Deux articles en 1927 ont ouvert une autre voie : l’article de Yule (on the method of

investigating periodicities in disturbated series with sepcial reference to Wolfer’s sunspot

numbers) et celui de Slutsky (the summation of random causes as the source of cyclical

(15)

1.1. Introduction aux séries chronologiques 3

processes).

Yule a introduit dans la littérature les modèles autorégressifs , en considérant des modèles de la forme :

X t = αX t−1 + βX t−2 ,

Cette suite présente un comportement saisonnier, Yule remarque qu’en fait, le comporte- ment dépend des racines (complexes) de léquation z 2 −αz −β = 0, et plus particulièrement de leur position par rapport au disque unité.

Le modèle autorégressif proposé par Yule est le suivant :

X t = φ 1 X t−1 + φ 2 X t−2 + ε t , (1.1) où (ε t ) correspond à un bruit blanc.

Slutsky a introduit les moyennes mobiles la même année que Yule a introduit les processus autorégressifs, la forme générale était la suivante :

X t = µ 0 ε t + µ 1 ε t−1 + ... + µ q ε t−q , µ i , i = 0, ..., q sont des constantes. (1.2) où (ε t ) est un bruit blanc, Cette écriture a suggéré d’élargir la relation (1.1) sous une forme proche de (1.2), à savoir :

φ 0 X t + φ 1 X t−1 + .. + φ p X t−p = ε t , φ i , i = 0, ..., p sont des constantes.

Les processus introduits par Yule deviendront les processus AR(p) et ceux introduits par Slutsky les processus MA(q). L’analogie entre les deux processus sera même poussée plus loin lorsqu’il sera montré que les processus AR(p) et MA(q) sont respectivement des processus MA(∞) et AR(∞), sous certaines conditions.

1.1.1.3 L’approche temporelle : concept de corrélation sérielle

Si l’approche spectrale repose sur l’utilisation du spectre (ou du périodogramme), l’ap-

proche temporelle repose sur l’autocorrélogramme, ou plus généralement sur l’utilisation

de la corrélation sérielle. Poynting est le premier a introduire cette idée en 1884. Le coef-

ficient de corrélation sérielle a été définit par Hooker en 1901. Etant données deux séries

temporelles, (X t ) et (Y t ), la covariance sérielle est définie par c k (X, Y ) = cov(X t , Y t )

et la corrélation sérielle sera alors r k (X, Y ) = c k (X, Y )/c 0 (X, Y ). Le coefficient d’au-

tocorrélation est alors obtenu en considérant ρ k = corr(X t , X t+k ) = r k (X, X). Les années

30 ont alors vu l’éclosion des résultats de base dans le domaine des séries chronologiques,

sous l’impulsion de Khintchine, Cramer, Wold, Kolmogorov, Wiener...etc. Ces auteurs ont

développé une théorie des séries temporelles, en considérant qu’une série chronologique

est une réalisation d’un processus aléatoire.

(16)

1.2. Processus stochastique 4

1.1.2 Les composantes principales d’une série temporelle

On peut souvent décomposer une série temporelle en trois termes :

1) La tendance ( T t ) : représente l’évolution à long terme de la grandeur étudieé, et traduit l’aspect général de la série, c’est une fonction monotone, polynomiale, exponentielle... .

2) La saisonalité ( S t ) : est une fonction déterministe périodique de période d.

3) Le résidut ) : est un bruit aléatoire stationnaire correspond á des fluctuations irréguliéres, en général de faible intensité.

1.1.3 Les modèles de décomposition déterministe

On distingue trois modéles de décomposition : 1) Le modèle additif :

X(t) = T (t) + S(t) + ε(t) 2) Le modèle multiplicatif :

X(t) = T (t).S(t).ε(t) 3) Le modèle mixte :

X(t) = (T (t) + S(t)).ε(t)

1.1.4 Estimation et élimination de la partie déterministe (T(t) et S(t))

Il ya plusieures méthodes d’estimation comme la méthode des moindres carrée or- dinaires (MCO), la méthode des moyenne mobile pour la tendence, et la méthode de différentiation pour éliminer les deux composantes.

1.2 Processus stochastique

1.2.1 Définitions

Définition 1.2.1. Un processus stochastique est une famille de variables aléatoires indi-

cées par t, noté (X(t), t ∈ Z ) où encore X t .

(17)

1.2. Processus stochastique 5

Définition 1.2.2. Un bruit blanc fort est une suite de variables aléatoires indépen- dantes et identiquement distribuées (i.i.d)t ) t∈ Z centrées et de variance σ ε 2 . On notet ) ∼ bbf (0, σ ε 2 ).

Définition 1.2.3. On appelle bruit blanc faible, toute suite de v.a.rt ) t∈ Z centrée, non corréleés et de variance σ ε 2 . On notet ) ∼ bb(0, σ ε 2 ).

Définition 1.2.4. On dit que (X t ) t∈ Z est un processus linéaire de moyenne µ s’il peut être écrit sous la forme :

X t = µ +

+∞

X

i=−∞

ψ i ε t−i ,

t ) ∼ bbf(0, σ 2 ε ) et

+∞

P

i=−∞ ψ i 2 < +∞.

Définition 1.2.5. Le processus X t est stationnaire au sens strict si pour tout (t 1 , t 2 , ..., t n ) avec t iT , i = 1, ..., n et si pour tout τT avec t i + τT , {X t

1

, ..., X t

n

} a la même distribution de probabilité jointe que {X t

1

, ..., X t

n

}.

Exemples 1.2.1.

Par la définition d’un bruit blanc fort (ε t ) ∼ bbf(0, σ 2 ε ) est strictement (fortement) stationnaire.

Définition 1.2.6. Un processus X t est stationnaire au second ordre si : (1) E(X t ) = m < +∞ ∀t ∈ Z ;

(2) E(X t 2 ) < +∞ ∀t ∈ Z ;

(3) Cov(X t , X t+h ) = γ(h) (ne dépend pas de t)t, h ∈ Z . γ(h) est la fonction d’autocovariance du processus.

Exemples 1.2.2.

1 Par définition un processus bruit blanc faible (ε t ) ∼ bb(0, σ ε 2 ) est faiblement sta- tionnaire.

2 − Un processus linéaire X t =

+∞

P

i=−∞

ψ i ε t−i , où

+∞

P

i=−∞

ψ i 2 < +∞ est stationnaire au second ordre car :

(1) E(X t ) = E

+∞

P

i=−∞

ψ i ε t−i

=

+∞

P

i=−∞

ψ i E(ε t−i ) = 0 < +∞.

(18)

1.2. Processus stochastique 6

(2)

E X t 2 = V ar(X t ) = E

+∞

X

i=−∞

ψ i ε t−i

2

= E

+∞

X

i=−∞

+∞

X

j=−∞

ψ i ψ j ε t−i ε t−j

= E

+∞

X

i=−∞, i=j

ψ 2 i ε 2 t−i +

+∞

X

i=−∞, i6=j

ψ i ψ j ε t−i ε t−j

= E

+∞

X

i=−∞

ψ 2 i ε 2 t−i

=

+∞

X

i=−∞

ψ i 2 E ε 2 t−i = σ ε 2

+∞

X

i=−∞

ψ 2 i < +∞.

(3)

Cov(X t , X t+h ) = E(X t X t+h ) − E(X t )E(X t+h ) = E(X t X t+h )

= E

+∞

X

i=−∞

ψ i ε t−i

+∞

X

j=−∞

ψ j ε t+h−j

= E

+∞

X

i=−∞

+∞

X

j=−∞

ψ i ψ j ε t−i ε t+h−j

= E

+∞

X

i=−∞, i=j−h

ψ i ψ j ε t−i ε t−(j−h) +

+∞

X

i=−∞, i6=j−h

ψ i ψ j ε t−i ε t−(j−h)

= E

+∞

X

i=−∞

ψ i ψ i+h ε 2 t−i

=

+∞

X

i=−∞

ψ i ψ i+h E(ε 2 t−i )

= σ 2 ε

+∞

X

i=−∞

ψ i ψ i+h .

Définition 1.2.7. Un processus linéaire (X t ) t∈ Z s’appelle causal s’il peut être représenté sous la forme :

X t =

+∞

X

i=0

ψ i ε t−i ,

ε t est un bruit blanc et

+∞

P

i=0

ψ 2 i < +∞.

Définition 1.2.8. Un processus (X t ) t∈ Z est dit inversible s’il existe une suite de constantes i ) telle que : :

ε t =

+∞

X

i=0

π i X t−i ,

+∞ P

i=0

π i 2 < +∞.

(19)

1.2. Processus stochastique 7

1.2.2 Les autocorrélations et la densité spectrale

1.2.2.1 Définitions

Définition 1.2.9. Soit X t un processus stationnaire de variance finie. On appelle fonction d’autocovariance γ(h) de X t la fonction :

γ(h) = Cov(X t , X t−h ) = E[(X tE(X t ))(X t−hE(X t−h ))] , ∀h ∈ Z .

Définition 1.2.10. Soit X t un processus stationnaire. On appelle fonction d’autocorré- lation ρ(h) de X t la fonction

ρ(h) = Corr(X t , X t−h ) = Cov(X t , X t−h )

q V ar(X t ) q V ar(X t−h )

= γ(h)

γ(0) , ∀h ∈ Z .

Théorème 1.2.1. La fonction d’autocovariance (resp. d’autocorrélation) d’un processus X t stationnaire vérifiée les propiétés suivantes :

γ(0) = Cov(X t , X t ) = E[(X tE(X t )) 2 ] = V ar(X t ) = σ X 2 > 0 ;

|γ(h)| 6 γ (0) ;

γ(h) = γ(−h) (fonction paire).

( resp. ρ(0) = 1, |ρ(h)| 6 ρ(0), ρ(h) = ρ(−h) ).

Définition 1.2.11. L’autocorrélation partielle d’ordre h désigne la corrélation entre X

t

et X t−h obtenue lorsque l’influence des variables X t−h+i avec i < h à été retirée .

Corollaire 1.2.1. De façon générale, la fonction d’autocorrélation partielle d’un processus stationnaire (X t ) t∈ Z , satisfaite la relation :

φ hh = |p h |

|p h | , ∀h ∈ N ,

avec p h la matrice symétrique formée des (h − 1) premières autocorrélations de X t , donnée par :

p h =

1 ρ(1) . . . ρ(h − 1) ρ(1) 1 . . . ρ(h − 2)

: : . . . :

ρ(h − 1) ρ(h − 2) . . . 1

et p h est donnée par :

p h =

1 ρ(1) . . . ρ(1) ρ(1) 1 . . . ρ(2)

: : . . . :

ρ(h − 1) ρ(h − 2) . . . ρ(h)

(20)

1.2. Processus stochastique 8

p h est ainsi la matrice p h dans laquelle on a remplacé la dernière colonne par le vecteur

h ρ(1) ρ(2) ... ρ(h) i 0 .

Définition 1.2.12. La densité spectrale d’un processus aléatoire stationnaire est donnée par :

f (w) = 1 2π

+∞

X

h=−∞

γ(h) exp(−iwh) , ∀w ∈ R

γ(h) est la fonction d’autocovariance du processus.

propriété 1.2.1. La densité spectrale est une fonction paire, positive, continue et pério- dique de période.

Remarque 1.2.1. la fonction d’autocovariance γ(h) s’écrit : γ(h) = Cov(X t , X t−h )

=

Z π

−π

f (w)cos(wh)dw

=

Z π

−π f (w) exp(iwh)dw.

Exemples 1.2.3. Un bruit blanct ) est caractérisé par :

 

 

γ(0) = V ar(ε t ) = σ ε 2 , pour h = 0 γ(h) = 0 , pour h 6= 0

(1.3)

alors sa densité spectrale est donnée par :

f(w) = σ ε 2. propriété 1.2.2.

La densité spectrale d’une série (X t ) est constante, alors (X t ) est un bruit blanc.

Démonstration γ(h) =

R

−π

f (w) exp(iwh)dw = k

R

−π

exp(iwh)dw, avec R π

−π

exp(iwh)dw = 0 , sauf si h=0.

Cette nullité de la fonction d’autocorrélation est donc une caractéristique du bruit

blanc.

(21)

1.2. Processus stochastique 9

1.2.2.2 Estimation des autocorrélations

Considérons un ensemble d’observations X 1 , ..., X T . La moyenne empirique est donnée par :

X ¯ T = 1 T

T

X

t=1

X t .

La fonction d’autocovariance empirique est donnée par : ˆ

γ T (h) = 1 Th

T −h

X

t=1

(X tX ¯ T )(X t−hX ¯ T ).

Et la fonction d’autocorrélation empirique est donnée par : ρ ˆ T (h) = ˆ γ T (h)

ˆ γ T (0) . propriété 1.2.3.

Les moments empiriques convergent vers les moments téhoriques : X ¯ T −→ m, ˆ γ T (h) −→ γ (h) et ˆ ρ T (h) −→ ρ(h), quand T −→ ∞.

Remarque 1.2.2.

Bien que ces fonctions soient définies pour tout h tel que −T 6 h 6 T , la fonction d’autocovariance empirique fournit un estimateur trés pauvre de γ(h) pour des valeurs h proche de T. Autre indicatif, Box et Jenkins recommandent de n’utiliser ces quantités que si T > 50 et h 6 T 4 .

Afin, par exemple, de faire la selection de modèles, il important de pouvoir dire si les autocovariances empiriques sont significativement non nulles. Il est alors possibles d’utiliser le résultat suivant :

propriété 1.2.4.

Si (X t ) est un processus linéaire, au sens où il satisfait X t = P

j∈Z

φ j ε t−j où (ε t ) est une suite de variables i.i.d centrées, telle que E(ε 4 t ) = ηE(ε 2 t ) 2 < +∞, où les φ j définissent une série absolument convergente, et où η est une constante positive, alors , on a la formule dite de Bartlett :

T lim →∞ T Cov γ ˆ T (h), ˆ γ T (k) = ηγ(h)γ(k) +

+∞

P

i=−∞

γ(i)γ(i + kh) + γ(i + k)γ(ih).

(22)

1.3. Processus ARMA 10

propriété 1.2.5.

Si (X t ) est un processus linéaire, au sens où il satisfait X t = P

j∈Z

φ j ε t−j où (ε t ) est une suite de variables i.i.d centrées, telle que E(ε 4 t ) = ηE2 t ) 2 < +∞, où les φ j définissent une série absolument convergente, et où η est une constante positive, alors , on a pour tout p > 0 :

n

ˆ γ T (0)

: ˆ γ T (p)

−→ N

γ(0) : γ(p)

, V

V est la matrix de variance-covariance définie par : V =

ηγ(h)γ(k) +

+∞

X

i=−∞

γ(i)γ(i + kh) + γ(i + k)γ(ih)

h,k=0,...,p

.

1.2.2.3 Estimation de la densité spectrale

Le périodogramme est défini comme le module au carré de la transformé de Fourier discrète des observations, i.e.

I T (x) = 1 2πT

T

X

t=1

X t exp(itx)

2

= 1 2π

X

h∈Z

ˆ

γ T (h) exp(iwx).

Le plus souvent, on estime le périodogramme aux fréquences de Fourier, i.e.

x k = 2kπ/T pour k = 1, ..., T , noté I T ,k .

Sous des hypothèses de régularité de la densité spectrale, le périodogramme est un es- timateur asymptotiquement sans biais de la densité spectrale. Mais il n’est pas consistant (on ne peut estimer que les T premier γ(h) intervenant dans la définition du périodo- gramme à partir de T observations).

1.3 Processus ARMA

1.3.1 Processus MA(q)

Définition 1.3.1. On appelle processus moyennes mobile d’ordre q MA(q) un processus linéaire (X t ) t∈ Z vérifiant une relation :

X t =

q

X

j=0

θ j ε t−j , ∀t ∈ Z (1.4)

(23)

1.3. Processus ARMA 11

ε(t)bb(0, σ ε 2 ), θ 0 = 1 et θ i (i = 1, ..., q) sont des réels.

En introduisant l’opérateur de retard B défini par : BX t = X t−1 , la relation (1.4) peut encore s’écrire : X t = Θ(B)ε(t).

Θ(B) = 1+ P q

j=1

θ j B j est appelé polynôme caractéristique en B de degré q du processus X t .

1.3.1.1 Les propriétés d’un processus MA(q)

1) La stationnarité : Soit (X t ) t∈Z un processus MA(q), alors X t est stationnaire.

Démonstration on a :

(1) E(X t ) = E(

q

P

j=0

θ j ε t−j ) =

q

P

j=0

θ j Et−j ) = 0 < ∞ (car(ε t ) t∈Zbb(0, σ ε 2 ))

(2)

γ (h) = Cov(X t , X t+h ) = E(X t X t+h ) − E(X t )E(X t+h ) = E(X t X t+h )

= E

q

X

j=0

θ j ε t−j

X q

k=0

θ k ε t+h−k

= E

q

X

j=0 q

X

k=0

θ j θ k ε t−j ε t+h−k

=

q

X

j,k=0

θ j θ k E(ε t−j ε t−(k−h) )

=

 

 

q−h

P

j=0

θ j θ j+h σ ε 2 si j = kh

0 sinon

=

 

 

σ ε 2

q−h

P

j=0

θ j θ j+h si 0 6 h 6 q 0 si h > q donc γ(h) ne dépend pas de t.

(3) E(X t 2 ) = V ar(X t ) = γ (0) = σ 2 ε

q

P

j=0

θ j 2 < ∞.

2) La causalité : Par la définition d’un processus causale, le processus moyenne mo- bille est causale car P q

i=0

θ 2 i < ∞ (car MA(q) linéaire).

3) L’inversibilité : Un processus moyenne mobile est inversible ssi le polynôme ca- ractéristique θ(z) = P q

j=0

θ j z jθ 0 = 1 est tel que : θ(z) 6= 0 pour tout z ∈ C tel que |z| 6 1,

(autrement dit, θ(z) = 0, pour tout z ∈ C tel que |z| > 1 ).

(24)

1.3. Processus ARMA 12

1.3.1.2 La fonction d’autocovariance d’un processus MA(q) La fonction d’autocovariance d’un processus MA(q) est donnée par :

γ(h) = Cov(X t , X t+h ) =

 

 

σ 2 ε

q−h

P

j=0

θ j θ j+h si 0 6 h 6 q

0 si h > q

θ 0 = 1.

Démonstration

Voir la preuve de la stationnarité d’un processus MA(q).

1.3.1.3 La fonction d’autocorrélation d’un processus MA(q) La fonction d’autocorrélation d’un processus MA(q) est :

ρ(h) =

 

 

θ

h

1

θ

h+1

+...+θ

q−h

θ

q

1+θ

21

22

+...+θ

q2

si 0 6 h 6 q

0 si h > q

propriété :

Pour un processus MA(q), ρ(h) = 0, pour h > q.

1.3.1.4 La fonction d’autocorrélation partielle d’un processus MA(q)

Proposition 1.3.1. La fonction d’autocorrélation partielle φ h,h d’un processus MA(q) (X t ) t∈ Z défini par X t = ε t +

q

P

j=1

θ j ε t−j se comporte comme une exponentielle ou une sinusodale amortie.

1.3.1.5 La densité spectrale d’un MA(q) Soit X t un processus MA(q) : X t = Θ(B)ε t

alors sa densité spectrale est donnée par :

f(w) = σ ε 2 |Θ(exp(−iw))| 2

.

(25)

1.3. Processus ARMA 13

1.3.2 Le processus AR(p)

Définition 1.3.2. Un processus stationnaire (X t ) t∈ Z sera appellé processus autorégressif linéaire d’ordre p, AR(p) s’il existe un bruit blanc ε t , et des réels ϕ i , i = 1, ..., p tel qu’une relation de réccurence :

X t =

p

X

i=1

ϕ i X t−i + ε t , ∀t ∈ Z (1.5)

est vérifiée.

La notation des pôlynomes de retard ramène (1.5) à la forme : Φ(B )X t = ε t . Φ(B) = 1 − P p

i=1

ϕ i B i est le pôlynome caractéristique en B de degré p du processus X t .

1.3.2.1 Les propriétés d’un processus processus AR(p)

1) La stationnarité et la causalité : Un processus autorégressif est stationnaire et causale ssi le polynôme caractéristique en z : Φ(z) = 1 − P p

i=1

ϕ i z i tel que Φ(z) 6= 0 pour tout z ∈ C , tel que |z| 6 1 (autrement dit : Φ(z) = 0 pour tout z ∈ C , tel que |z| > 1).

2) L’inversibilité : Un processus AR(p)est toujours inversible car

p

P

i=1

ϕ 2 i est finie.

1.3.2.2 L’écriture AR() d’un processus MA(q)

Proposition 1.3.2. Soit (X t ) t∈ Z un processus MA(q) : X t = Θ(B)ε t , si Θ(z) = 0 pour tout z ∈ C tel que |z| > 1 (inversible), alors on peut écrire X t sous la forme AR(∞) :

ε t = Θ −1 (B)X t =

X

i=0

β i X t−i ,

avec β 0 = 1 et P

i=0

β i 2 <.

Exemples 1.3.1. L’écriture d’un MA(1) sous la forme d’un AR(∞).

Considérons le modéle MA(1) : X t = ε t + θε t−1

alors : X t = ε t + θBε t = (1 + θB)ε t donc : Θ(B) = 1 + θB

(X t ) t∈ Z est inversible si Θ(z) = 0 pour tout z ∈ C tel que |z| > 1

(26)

1.3. Processus ARMA 14

Θ(z) = 0 ⇔ 1 + θz = 0 ⇔ z = −1 θ

pour que X t inversible il faut que |z| = 1 θ

> 1 donc |θ| < 1 alors on peut écrire :

ε t = (1 + θB) −1 X t = 1 1 + θB X t

=

X

i=0

−π i B i X t =

X

i=0

−π i X t−i

π 0 = −1.

La série de Taylor : 1

1 − x = 1 + x + x 2 + x 3 + ..., |x| < 1 donc :

1

1 + θB = 1

1 − (−θB) = 1 + (−θB) + (−θB) 2 + (−θB) 3 + (−θB) 4 + ...

= 1 − θB + θ 2 B 2θ 3 B 3 + θ 4 B 4...

=

X

i=0

(−θ) i B i d’où :

P

i=0

(−θ) i B i = P

i=0

−π i B i on trouve que :

π i = (−1) i+1 θ i , i = 1, 2, ... et π 0 = −1 alors :

X t = P

i=1

π i B i X t + ε t

1.3.2.3 L’écriture MA (∞) d’un processsus AR(p)

Proposition 1.3.3. Soit (X t ) t∈ Z un processus AR(p) : Φ(B)X t = ε t , si Φ(z) = 0 pour tout z ∈ C , |z| > 1 (causale), alors on peut écrire X t sous la forme M A(∞) :

X t = Φ −1 (B)ε t =

X

j=0

ψ j ε t−j ,

avec : ψ 0 = 1 et

P

j=0

ψ j 2 < ∞.

(27)

1.3. Processus ARMA 15

Exemples 1.3.2. La représentation M A(∞) d’un processus AR(2).

Considérons le modéle AR(2) :

X t = ϕ 1 X t−1 + ϕ 2 X t−2 + ε t X t = ϕ 1 B + ϕ 2 B 2 + ε t

(1 − ϕ 1 Bϕ 2 B 2 )X t = ε t Φ(B)X t = ε t si Φ(z) = 0, ∀z ∈ C , |z| > 1 alors on peut écrire.

X t = Φ −1 (B )ε t = 1

1 − ϕ 1 Bϕ 2 B 2 ε t = P

j=0

ψ j ε t−j = Ψ(B)ε t les coefficients ψ j sont déterminés par :

Φ(B )Ψ(B) = 1

(1 − ϕ 1 Bϕ 2 B 2 )(ψ 0 + ψ 1 B + ψ 2 B 2 + ψ 3 B 3 + ...) = 1

ψ 0 + (ψ 1ϕ 1 ψ 0 )B + (−ϕ 1 ψ 1 − ϕ 2 ψ 0 + ψ 0 )B 2 + ... = 1 donc

 

 

 

 

 

 

ψ 0 = 1

ψ 1 − ϕ 1 ψ 0 = 0

−ϕ 1 ψ 1ϕ 2 ψ 0 + ψ 2 = 0

(1.6)

⇐⇒

 

 

 

 

 

 

ψ 0 = 1 ψ 1 = ϕ 1 ψ 2 = ϕ 2 + ϕ 2

(1.7)

1.3.2.4 Propriétés des autocorrélations - Equations de Yulle Walker Soit (X t ) t∈ Z un processus AR(p) vérifiée l’équation :

X t = ϕ 1 X t−1 + ϕ 2 X t−2 + ... + ϕ p X t−p + ε t ,

on a : γ(h) = Cov(X t , X t−h ) = E(X t X t−h ) − E (X t )E(X t−h ) = E(X t X t−h ).

(28)

1.3. Processus ARMA 16

car E(X t ) = E(X t−h ) = 0 (AR(p) possède une représentation MA(∞)).

alors :

γ(h) = ϕ 1 E(X t−1 X t−h ) + ... + ϕ p E (X t−p X t−h ) + E(ε t X t−h )

= ϕ 1 γ(h − 1) + ... + ϕ p γ (h−p) + E(ε t X t−h ).

avec : E(ε t X t−h ) =

 

 

σ ε 2 si h = 0

0 sinon

donc :

γ(h) =

 

 

ϕ 1 γ(h − 1) + ... + ϕ p γ(hp) si h > 0 ϕ 1 γ(1) + ... + ϕ p γ(p) + σ ε 2 si h = 0

=

 

 

p

P

i=1

ϕ i γ(hi) si h > 0

p

P

i=1

ϕ i γ(i) + σ 2 ε si h = 0

(1.8)

en divisant la relation (1.8) par γ(0), on obtient la fonction d’autocorrélation :

ρ(h) =

p

X

i=1

ϕ i ρ(hi)

en écrivant cette relation pour différentes valeur de h (h=1,2,...,p), on arrive au système Yulle-Walker :

R p ϕ = ρR p est la matrice de corrélation symétrique :

R p =

1 ρ 1 ... ρ p−1

ρ 1 1 ... ρ p−2

: : ... :

ρ p−1 ρ p−2 ... 1

, ϕ =

ϕ 1 ϕ 2 : ϕ p

et ρ =

ρ 1 ρ 2 : ρ p

.

1.3.2.5 La fonction d’autocorrélation partielle d’un processus AR(p) propriété 1.3.1.

Pour un processus autorégressif AR(p), φ h,h = 0, ∀ h > p. En d’autres termes, pour

un processus AR(p), les autocorrélations partielles s’annulent à partir du rang p+1.

(29)

1.3. Processus ARMA 17

1.3.2.6 La densité spectrale d’un AR(p) Soit X t un processus AR(p) :

ε t = Φ(B)X t , alors sa densité spectrale est :

f (w) = σ ε 2

2π|Φ(exp(−iw))| 2 .

1.3.3 Processus ARMA(p,q)

Définition 1.3.3. On appelle processus ARMA(p,q) un processus stationnaire (X t ) t∈ Z vérifiant une relation de récurrence :

X t

p

X

i=1

ϕ i X t−i = ε t +

q

X

j=1

θ j ε t−j , ∀t ∈ Z (1.9)

où les ϕ i , θ j sont des réels et ε t est un bruit blanc de variance σ 2 ε . La notation des polynômes de retard ramène (1.9) à la forme :

Φ(B)X t = Θ(B)ε t avec Φ(B) = 1 − P p

i=1

ϕ i B i et Θ(B) = 1 +

q

P

j=1

θ j B j . Remarque 1.3.1.

Un processus AR(p) est un processus ARMA(p,0), et un processus MA(q) est un processus ARMA(0,q).

1.3.3.1 Propriétés d’un processus ARMA(p,q) 1) La stationarités et la causalité

Un processus ARMA(p,q) est stationnaire et causal si le polynôme Φ(z) a toutes ses racines à l’extérieur du disque unité, autrement dit :Φ(z) = 0 pour tout z ∈ C tel que

|z| > 1.

2) L’inversibilité

On dit que un processus ARMA(p,q) est inversible si Θ(z) = 0 pour tout z ∈ C tel

que |z| > 1.

(30)

1.3. Processus ARMA 18

1.3.3.2 L’écriture M A(∞) d’un processus ARMA(p,q)

Proposition 1.3.4. Soit (X t ) t∈ Z un processus ARMA(p,q) : Φ(B )X t = Θ(B)ε t Φ(z) = 0 pour tout z ∈ C tel que |z| > 1 (causal), alors X t admet la représentation M A(∞) :

X t = Φ −1 (B)Θ(B)ε t =

X

i=0

α i ε t−i

avec

P

i=0

α 2 i <et α 0 = 1.

1.3.3.3 L’écriture AR(∞) d’un processus ARMA(p,q)

Proposition 1.3.5. Soit (X t ) t∈ Z un processus ARMA(p,q) Φ(B )X t = Θ(B )ε t tel que Θ(z) = 0 pour tout z ∈ C tel que |z| > 1 (inversible), alors X t admet une représentation AR(∞) :

ε t = Θ −1 (B)Φ(B)X t =

X

i=0

β i X t−i

avec P

i=0

i | <et β 0 = 1.

1.3.3.4 Les propriétés des autocovariances

La fonction d’autocovariance d’un processus ARMA(p,q) est donnée par : γ(h)

p

X

i=1

ϕ i γ(hi) = 0 , pour hq + 1 et

γ(h)

p

X

i=1

ϕ i γ(hi) = σ ε 2

q

X

j=h

θ j ψ j−h , pour 0 ≤ hq où les ψ k correspondent aux coefficients de la forme M A(∞) de (X t ) :

X t =

X

k=0

ψ k ε t−k .

Démonstration

Soit (X t ) t∈ Z un processus ARMA(p,q) de représentation minimale et causale, il admet alors la représentation M A(∞) :

X t =

X

i=0

ψ i ε(ti)

Références

Documents relatifs

Comme arccos donne une valeur entre 0 et π, donc positive, elle donne la bonne valeur d’angle seulement dans le cas où l’image de z est située au dessus de l’axe des abscisses

Chaque mot doit pouvoir se lire horizontalement et verticalement.. Mots en

Sur des pages A4 se trouvent des détails pris dans les doubles pages..

[r]

Connaître les tables d’addition (de 1 à 9) et de multiplication (de 2 à 9) et les utiliser pour calculer une somme, une différence ou un complément, un produit ou un quotient

trouver, à l’aide d’un développement de Taylor au voisinage de , les relations entre les coefficients pour que l’erreur de troncature contient des termes , avec

Dans un zoo, l’unique activité d’un manchot est l’utilisation d’un bassin aquatique équipé d’un toboggan et d’un plongeoir.. On a observé que si un

125 Passage à l’échelle mémoire et impact des allocations dynamiques dans l’application GYSELA. Memory scalability and dynamic allocation overheads of Gysela code F ABIEN