des s´eries chronologiques - Projet de Fin d Etudes *****

1. S´eries non stationnaires : (a) Processus TS :

Un processus TS (trend stationary) s’´ecrit :X_t = α+βt+ε_t.

C’est un processus non stationnaire car E(X_t) = α+βt dépend de t. Nous stationnarisons le processus Xt en retranchant la valeur estimée par la méthode des moindres carrés ordinaires ˆα+ ˆβt .

(b) Processus DS :

Un processus DS (differency stationary) avec dérive s’écrit sous la fome : X_t = X_t−1 +β + ε_t. C’est une marche aléatoire avec dérive. Il s’agit d’un processus non stationnaire car :

E(X_t) = X₀+βt ; V ar(X_t) = tσ². Un processus DS sans d´erive s’´ecrit : X_t= X_t−1+ε_t. 2. Processus stationnaires :

(a) Processus Moyenne Mobile :

On appelle processus moyenne mobile d’ordre q M A(q), un processus Xt d´efini par :

X_t= µ+a_t+θ₁a_t−1+. . .+θ_qa_t−q =µ+a_t+

j=1

θ_ja_t−j Avecat BB(0; σ²) et les θj sont des r´eels.

E(X_t) = µ;

γ(k) =

(σ²(θ_k+Pq−k

j=1θ_jθ_k+j) si 1≤k≤q

0 si k ≥q

La fonction de corr´elation permet d’indiquer si un processus est MA(q) ou pas.

Si Xt est un processus MA(q) alors :

ρ(k)6= 0 si 0≤k ≤q ρ(k) = 0 si k > q+ 1 (b) Processus Autoregressif :

On appelle processus autoregressif d’ordre p AR(p), un processus temporel X_t qui s’´ecrit sous la forme :

X_t = µ+ϕ₁X_t−1+. . .+ϕ_pX_t−p+a_t Aveca_t BB(0; σ²)

La fonction d’autocorr´elation d’un processus autoregressif est : ρ(k) =

j=1

ϕ_jρ_k−j ;k ≥1

Pour le processus AR(p), c’est la fonction d’autocorr´elation partielle qui nous permet d’indiquer si la s´erie est un AR(p).

3. Bruit Blanc :

Un processusX_t est un bruit blanc (White Noise) si : E(X_t) = 0;

V ar(X_t) = σ²;

γ(k) = cov(X_t, X_t+k) = 0 pour k6= 0 . Nous notons :Xt ∼BB(0; σ²).

4. Mod`ele ARMA (p, q) :

La classe des modèles ARMA permet de combiner deux types de processus temporels : les processus autorégressifs (AR), et les processus moyennes mobiles (MA). Dans les modèles ARMA, la valeur prise au temps t par la variable étudiée est une fonction linéaire de ses valeurs passées et des valeurs présentes ou passées

La forme g´en´erale d’un processus ARMA (p, q) :

X_t−ϕ₁X_t−1−. . .−ϕ_pX_t−p= µ+a_t+θ₁a_t−1+. . .+θ_qa_t−q Aveca_t est un bruit blanc.

5. Test de Dickey-Fuller :

Dickey et Fuller proposent un test qui permet de détecter la stationnarité d’une série temporelle. En considérant une série chronologique X_t, le test est basé sur l’hypothèse nulle de racine unitaire.

Il repose sur les hypoth`eses suivantes :

H0 : P rocessus non stationnaire, les f ormes de non stationnarit´e sont [1]X_t =ϕX_t−1+a_t

[2]X_t =ϕX_t−1+a+a_t [3]X_t=ϕX_t−1+a+βt+a_t

ou ϕ` = 1 H₁ : ϕ <1

Ces hypoth`eses peuvent encore s’´ecrire sous la forme suivante :



H₀ :P rocessus non stationnaire, les f ormes de non stationnarit´e sont [1] ∆Xt = (ϕ−1)X_t−1+at

H₀ :P rocessus non stationnaire, les f ormes de non stationnarit´e sont [1] ∆X_t =ρX_t−1+a_t

[2] ∆X_t =ρX_t−1+α+a_t [3] ∆X_t =ρX_t−1+α+βt+a_t o`u ρ= ϕ−1 = 0 et a_t∼> iid(0, σ²)

H₁: ρ <1

H0 : ρ = 0H1 : ρ <1 Par la m´ethode des moindres carr´es :

La procédure de ce test repose sur le fait de faire une analyse successive des trois formes possibles de non stationnarité, c’est-à-dire du modèle (3) au modèle (1) de la série en question. Or, sous H₀ vraie, le processus étudié est non stationnaire et l’estimateur de ρ ne suit pas une distribution normale et par la suite, le t-Student de ρ ne peut pas être comparé aux valeurs critiques de la table de Student. C’est pourquoi Dickey et Fuller ont donc étudié la distribution asymptotique des estimateurs pour des échantillons de différentes tailles.

Nous commen¸cons le test par l’analyse du modèle (3) et par une comparaison de la statistiquet_ρ_âux seuils tabulés par Dickey et Fuller (sit_ρ_ˆ> t_DF nous acceptons H₀).

Si l’hypothèse nulle ρ = 0 est rejetée, nous comparons le t-Student de l’estimateur de α aux valeurs critiques déterminées par Dickey et Fuller pour la tendance. Si la tendance n’est pas significative, nous poursuivons le test par l’analyse du modèle (2) et ainsi de suite.

6. Test de Dickey et Fuller augment´e (ADF) :

Dans le test de Dickey et Fuller simple que nous venons de présenter, le processus a_t est par hypothèse un bruit blanc. Or il n’y a aucune raison que les résidus soient des bruits blancs (non corrélés). Le test de Dickey et Fuller Augmenté prend en considération cette hypothèse (autocorrélation des erreurs en proposant une représentation AR(p-1) pour l’erreur).

Les hypoth`eses du test deviennent alors :



H₀ :P rocessus non stationnaire, les f ormes de non stationnarit´e sont [1] ∆X_t =ρX_t−1+Pp

1. Pr´esentation th´eorique de l’ACP : Introduction :

L’ACP, introduite par Karl Pearson et Thurston dans les années 1920, est une technique des statistiques descriptives destinée à l’analyse des données multidimensionnelles.

Elle permet de réduire la dimension de l’espace des variables. On cherche à réduire le nombre de variables avec le minimum de perte d’information et préservant les relations existant déjà entre les différentes variables.

(a) Repr´esentation math´ematique :

On possède un tableau rectangulaire de mesure (une matrice) dont les colonnes sont des variables (mensurations, taux, températures, ...) et dont les lignes représentent des individus statistiques (unités élémentaires telles que des ˆ

etres humains, des pays, des ann´ees ...). On note X ce tableau de donn´ees.

X : Tableau de donn´ees

X_ij : Valeur de l’i`eme observation pour la j`eme variable

Xi. : i`eme observation du tableau

n : Effectif des individus

p : Nombre de variables

(b) Objectif :

Notre objectif est d’extraire l’essentiel de l’information contenue dans le tableau de données X et d’en fournir une représentation se prêtant plus aisément à l’interprétation. Autrement dit, nous nous proposons de rechercher une représentation des n individus dans un sous espace de l’espace initial.

Nous cherchons donc à définir k nouvelles variables, combinaison des p de l’espace initial, qui font perdre le moins d’information possible. Ces k variables seront appelées composantes principales et les axes qu’elles déterminent axes principaux.

L’analyse du nuage de points utilise la notion fondamentale de distance. On munit l’espace des individus de la distance euclidienne classique.

On d´esigne par g le centre de gravit´e du nuage :

g est donc un vecteur de dimension p.

La matrice X est généralement centrée sur le centre de gravité :

On peut alors calculer les matrices de covariances et de corrélations. En effet une fois la matrice X est transformée, il suffit de la multiplier par sa transposée pour obtenir la matrice de variance-covariance si X est juste centrée, la matrice de corrélation si X est centrée réduite, autrement dit normée.

Ces deux matrices sont des matrices carrées de taille p, symétrique, et réelle.

Elles sont diagonalisables dans une base orthonormée. Dans la suite nous noterons par X la matrice centrée ou celle centrée réduite.

(d) Principe d’ACP :

Le principe de l’ACP est de trouver un axe u, issu d’une combinaison lin´eaire des X_.j , tel que la variance du nuage autour de cet axe soit maximale.

Nous cherchons donc le vecteur u tel que la projection orthogonale du nuage sur u ait une variance maximale. Soit C la matrice de covariance ou de corrélation précédemment calculée. La projection de l’échantillon des observations sur u s’écrit : π_u(X) = X . u

La variance empirique de π_u(X) vaut donc :

Comme nous l’avons vu plus haut C est diagonalisable dans une base orthonormée, notons P la matrice de changement de base associée et ∆ la matrice diagonale associée. On obtient ainsi que :

∆ en ordre d´ecroissant. On peut rapidement v´erifier qu’il suffit de prendre le premier vecteur unitaire pour obtenir : v^t.∆.v =λ₁

On a donc que la diagonalisation de la matrice de corrélation (ou de covariance si on se place dans un modèle non réduit), nous a permis d’écrire que le vecteur qui explique le plus d’inertie du nuage est le premier vecteur propre correspondant au vecteur propre de la plus grande valeur propre. De même le deuxième vecteur qui explique la plus grande part de l’inertie restante est le deuxième vecteur propre, etc. Finalement, la question de l’ACP se ramène donc à un problème de diagonalisation de la matrice de corrélation.

(e) R´ecapitulation :

Observation géométrique de la réduction de dimension :

Dans le document Projet de Fin d Etudes ***** (Page 149-158)