Module 4 : vérification des hypothèses d’application de la régression et robustesse du modèle

(1)

L3MS2_M5.doc 1/12

Module 4 : vérification des hypothèses d’application de la régression et robustesse du modèle

Dans les paragraphes précédents on a supposé que les hypothèses d’application de la régression étaient vérifiées ce qui permet de montrer les propriétés remarquables (BLUE) des estimateurs, de construire des tests des paramètres et du coefficient de détermination et enfin d’élaborer des intervalles de confiance prévisionnels. L’importance de ces hypothèses étant manifeste, il est indispensable de les vérifier pour contrôler la qualité statistique et donc opérationnelle du modèle de régression.

L’hypothèse d’indépendance de la variable explicative est une hypothèse ad hoc. Il en est de même dans ce cours de celle concernant le sens de causalité entre deux variables ainsi que l’absence de tendances communes pouvant conduire à une « spurious régression » (régression factice, c'est-à-dire une régression qui semble de bonne qualité à cause d’une tendance semblable entre les deux variables (r² élevé) mais qui dans la réalité n’est qu’une covariation).

En définitive, ce sont les hypothèses sur l’aléa qui font l’objet de ce paragraphe. Rappelons que l’aléa est une succession temporelle (pour le modèle choisi ici) de variables aléatoires centrées, homoscédastiques, non autocorrélées et obéissant à une loi normale. Cet aléa est inconnu.

L’hypothèse fondamentale sur laquelle repose le modèle de régression c’est que le résidu du modèle (connu)

e

_t

= Y

_t

− Y ˆ

_t est un échantillon de cette famille de variables aléatoires. De ce fait, si le résidu vérifie, à partir de ses caractéristiques, les propriétés de l’aléa, on dira qu’il est issu de la famille des variables aléatoires. On utilise ainsi la moyenne, la variance, l’autocorrélation, et l’histogramme des résidus pour vérifier les hypothèses d’application du modèle de régression (unités 1, 2, 3 et 4).

Il est enfin possible de vérifier si le modèle estimé est valide dans diverses circonstances : c’est la robustesse (unité 5)

1 L’hypothèse de nullité de l’espérance mathématique de l’erreur ^E [ ] ε

t

= ⁰

On veut tester

^E [ ] ε

t

= ⁰

On utilise la moyenne des résidus

= ∑

t

e

t

n

e 1

pour vérifier cette hypothèse.

On sait que : 



 





σ

≡ N m , n

e

^e soit

^e ^m ⁿ ^N ( ) ⁰ ^, ¹

e

σ ≡

−

On construit alors le test de signification :

H

₀

: m = 0 contre H

₁

: m ≠ 0

Si

e 0 n 1 , 96

e

σ <

−

(le quantile à 95% de la loi normale centrée réduite) alors l’hypothèse

H

₀ est

vérifiée.

Cette hypothèse ne joue pas un rôle important dans la régression puisqu’on sait que

e

_t

= y

_t

− yˆ

_t^et donc par construction

e = 0

. Il s’agit donc d’une hypothèse ad hoc et l’utilité de ce test ne se justifie que dans d’autres applications (séries temporelles par exemple)

2 L’hypothèse de non autocorrélation des erreurs ^E [ ε

t

ε

t'

] = ⁰

On va tester

^E [ ε

t

ε

t'

] = ⁰ ∀ ^t ^, ∀ ^t ^' ^, ^t ≠ ^t ^'

2.1 Détection de l’autocorrélation

(2)

L3MS2_M5.doc 2/12 L’autocorrélation concerne les résidus :

e

_t

= Y

_t

− Y ˆ

_t. Il y a autocorrélation toutes les fois où on peut trouver un coefficient de corrélation linéaire significativement différent de 0 entre la chronique des résidus et cette même chronique décalée d’un ou de plusieurs pas de temps.

Si on note k le pas de temps du décalage temporel

( ) ^k ^∈ ^N

^* ^et

^r

^k le coefficient de corrélation linéaire simple correspondant, on peut construire la Fonction d’AutoCorrélation des résidus :

[ ¹ ^, ¹ ]

r N

k ∈

^*

  →

^FAC



_k

∈ − +

dont la représentation graphique est le corrélogramme :

K est le décalage maximal pour lequel

r

_k a un sens statistique (le nombre de points permettant le calcul de

r

_k). En général

3 K n 6 n ≤ ≤

Si les résidus sont une bonne représentation de l’aléa, ils doivent vérifier l’hypothèse de non autocorrélation ; cela signifie que toutes les autocorrélations successives doivent être non significativement différentes de 0.

2.2 Principales causes de l’autocorrélation

Plusieurs raisons peuvent être la cause d’une autocorrélation. On peut citer :

- Les variables de départ ne vérifient pas l’hypothèse de stationnarité, c’est-à-dire qu’elles peuvent contenir des tendances déterministes (trend linéaire) ou stochastiques (promenade aléatoire) communes, ce qui est générateur d’une régression factice pour laquelle le

r

² est proche de 1 avec une autocorrélation importante du résidu.

- Les variables de départ étaient saisonnières et elles ont été mal désaisonnalisées.

- Les variables contiennent des phénomènes exceptionnels (grèves,…) qui sont mal expliqués par le modèle.

- Les variables de départ possédaient des « non informations » qui ont été corrigées par extrapolation linéaire…

2.3 Les effets de l’autocorrélation des erreurs

Considérons le modèle sous la forme : t

t

x

y = β + ε

Et supposons que :

ε

t obéisse à un processus autorégressif d’ordre 1, c’est-à-dire qu’il existe entre

ε

_t et

ε

_t₋₁ un modèle de régression linéaire :

r

k

r

1

r

2

r

3

r

k…

k

-1 0 +1

K

(3)

L3MS2_M5.doc 3/12 t

1 t t

= ρε + η

ε

₋ avec

< 1

ρ

(qui assure la stabilité du modèle) et

[ ] [ ]

[ ]









= η η

σ

= η

0 0

2

' t t

n t t

Cov V E

On sait que :

∑ ∑

∑

∑ ₌ ₌

=

β

2

t t t

t 2 t

t t t

x w x

avec y

w x

y ˆ x

( )

₁₂₃

0 t t

t t

t

Y Y w Y Y w

ˆ w

=

∑

∑ − = −

= β

D’où

( )

∑

ε + β

=

ε + β

+ α

=

ε + β + α

= β

= t t

t t 1

t t 0

t

t t t

w

w X

w w

X ˆ w

43 42 1 3 2 1

D’où

[ ] [ ]

t

0 t

E ˆ w

E β = β + ε

=

∑

23 1

L’estimateur reste sans biais quelque soit

E [ ] ε

t . On peut vérifier cependant que :

t 1 t t

= ρε + η

ε

₋ s’écrit :

( )

L L

etc

t 1 t 2 2 t

t 1 t 2 t t

η + ρη + ε ρ

=

η + η + ρε ρ

= ε

−

∑

^∞

+

=

θ θ −θ

−

η ρ

=

+ η ρ + ρη + η

= ε

0 t

2 2 t 1 t t

t L

[ ]

^+∞

^∑ [ ]

=

θ =

θ θ

η

−

ρ

= ε

0 0

t

E

14243

La variance de

β ˆ

s’écrit :

[ ] ^β ⁼ ^σ

ε

^∑

2

⁼ [ ^β ⁻ [ ] ^β ]

2 t

2

/ x E ˆ E ˆ

V ˆ

Comme

[ ]

_{

[ ]

²

[ ]

²^t

0 t t

t

E E E

V = ε













ε

− ε

= ε

= On a :

(4)

L3MS2_M5.doc 4/12

+

L

η ρ + ρη + η

=

ε

_t _t _t₋₁ ² _t₋₂

L L

+ ρη η + +

η ρ + η

=

ε

₋

− t t 1

2 2 2 2

t

2

1 t t

D’où

[ ] ^[ ^]

(

^L^K

)

43 L 42 L 1

+ ρ + σ

=

+ + σ ρ + σ

=

+ η η ρ +



+

 



η ρ



+

 



η

= ε

η

η η

=

− −

2 2

2 2 2

0 1 t 2 t

2 2 2

t

1

0 E 2 E

E E

1 t t

Or :

ρ < 1

d’où :

[ ]

2 ² ²

2

t

1 E 1 σ

_η

= σ

_ε

ρ

= − ε

De ce fait :

[ ] ⁻ ^ρ ∑

= σ

β

^η

t

x

t

V ˆ

2 2

2 1

1

En conclusion, lorsqu’il y a autocorrélation des erreurs (ici d’ordre 1) - les estimateurs restent sans biais.

- les variances d’échantillon des coefficients de régression ne sont plus minimales : plus l’autocorrélation est forte

( ^ρ ^→ ¹ )

plus la quantité

1

2

1 ρ

−

est grande et donc plus forte est la sous-estimation de la variance de

β ˆ

_.

La méthode des MCO n’est donc pas, dans ce cas, la meilleure des méthodes pour estimer le modèle. Elle sous-estime les variances vraies dans le cas d’une autocorrélation positive par exemple, ce qui a pour conséquence une surestimation de la prévision de l’estimation. Dans le cas d’une prévision, on n’aura plus des valeurs de la variable endogène les meilleures possibles.

L’autocorrélation remet en cause l’estimation du MLGS par les MCO ; on doit disposer de tests permettant de la détecter.

2.4 Tests d’autocorrélation des résidus

Le plus utilisé est le test de Durbin-Watson. Ces auteurs proposent la statistique suivante :

( )

∑

=

−

= +

−

=

n

1 t

2 t 1 n

1 t

t 2 1 t

e e e DW

Pour n grand :

∑

=

−

=

−

= +

≈ ≈

ⁿ

1 t

2 t 1

n 1 t

2 t 1

n 1 t

2 1

t

e e

e

; on peut alors approximer DW par la quantité :

^DW ⁼ ² ( ¹ ⁻ ^ρ ^ˆ )

(5)

L3MS2_M5.doc 5/12 avec

∑

=

+

ρ

_n

1 t

2 t t

t 1 t

e e e ˆ

ρ ˆ

est l’estimation, par les MCO, du modèle

e

_t₊₁

= ρ e

_t

+ ε

_t

avec ρ < 1

- si

ρ ˆ → 0

, absence de corrélation dans les résidus ⇒

DW → 2

_; - si

ρ ˆ → 1

, forte autocorrélation positive dans les résidus ⇒

DW → 0

- si

ρ ˆ → − 1

, forte autocorrélation négative dans les résidus ⇒

DW → 4

Durbin-Watson ont montré que la statistique DW dépendait de deux valeurs

d

₁ et

d

₂, indépendantes de

X

_t ; ce sont des variables aléatoires fonction de

ε

_t. Ils en ont tabulé les valeurs pour n (nombre d’observations), K (nombre de variables exogènes) données et deux seuils 5% et 10%. Le test se déroule de la façon suivante :

- On calcule

DW

_c (avec

e

_t et la formule non simplifiée) ; - On place le résultat trouvé dans le tableau suivant :

Ce test présente l’inconvénient de ne pouvoir déceler que les autocorrélations d’ordre 1. On peut remédier à ce problème en utilisant les résultats de la FAC (Fonction d’autocorrélation). Chaque autocorrélation peut être testée par un test classique de signification de Student :

0 : H 0 :

H

₀

ρ

_k

=

₁

ρ

_k

≠

) 2 n ( T 2 n r 1

t r

_lu

2 k k

c

− < −

−

=

on est sous l’hypothèse H0.

3 L’hypothèse d’homoscédasticité des erreurs ^E [ ] ^ε

²^t

⁼ ^σ

²^ε

On va tester

^E [ ] ^ε

²^t

⁼ ^σ

²^ε

^∀ ^t

3.1 Définition

L’homoscédasticité peut être considérée comme un cas particulier de la non autocorrélation

[ ] ⁰

E ε

_t

ε

_t_'

=

; lorsque t = t’ alors :

[ ^ε

t

, ^ε

t'

] ⁼ Cov [ ^ε

t

, ^ε

t

] ⁼ E [ [ ^ε

t

⁻ E [ ] ^ε

t

] [ ^ε

t

⁻ E [ ] ^ε

t

] ] ⁼ E [ ] ^ε

²t

⁼ ^σ

²^ε

Cov

Il y a hétéroscédasticité lorsque la variance des variables aléatoires qui composent

ε

_t sont différentes au cours du temps. Les conséquences de l’hétéroscédasticité sont, par construction, identiques à celles de l’autocorrélation :

- les estimateurs des paramètres restent sans biais.

d

1

d

₂ ²

4 − d

₂

4 − d

₁ ⁴

0

Autocorrélation

<0 Autocorrélation

>0

Doute indépendance Doute

(6)

L3MS2_M5.doc 6/12 - les estimateurs des paramètres ne sont plus de variance minimale.

Il faut donc, comme pour l’autocorrélation, détecter une présence possible d’hétéroscédasticité en utilisant le résidu

e

_t, seule information disponible concernant

ε

_t^.

3.2 Tests d’hétéroscédasticité

Test paramétrique de Goldfeld-Quandt

Il s’applique toutes les fois où l’écart type de l’erreur du modèle s’accroît proportionnellement avec la variable explicative du modèle.

Ecriture de cette hypothèse :

[ ]

²^t

^aX

^t

^E [ ]

²^t

^a

²

^X

²^t

E ε = ⇔ ε =

Principe du test :

On ordonne les observations des variables

Y

_t

et X

_t en fonction des valeurs croissantes de

X

_t. On néglige les observations centrales de l’échantillon. On appelle m le nombre de ces observations négligées.

Comme m dépend de n, on prend pour n = 30, m = 8 et pour n = 60, m = 16, etc.

On obtient deux sous échantillons, l’un correspond aux faibles valeurs de

X

_t (premier échantillon), l’autre aux fortes valeurs ( deuxième échantillon). On applique les MCO sur les

2 m n −

observations faibles et sur les

2 m n −

observations fortes. (Il faut que les deux échantillons soient suffisamment importants).

On appelle SCR1 la somme des carrés des résidus du premier échantillon, SCR2 la somme des carrés des résidus du second échantillon. On démontre alors que :



 





− − − −

≡

₋

2 4 m

; n 2

4 m F n

SCR SCR

p 1 1 2

Les hypothèses du test sont :

H0 : homoscédasticité H1 : hétéroscédasticité (SCR2 > SCR1) Règle de décision :











→

≥

⇒

→

<

⇒

ρ

− ρ

−

asticité hétéroscéd

p espèce 1

de rique au rejetée H

SCR F si SCR

ité oscédastic hom

p espèce 1

de rique au acceptée H

SCR F si SCR

0 ère 1

1 2

ère 0

1 1 2

Test de Glejser

Ce test propose de régresser la valeur absolue des résidus de la régression avec la variable explicative

X

_t. On considère des fonctions simples du type, (selon l’hypothèse précédente) :

t t 1 0

t

a a X

e = + + η

avec

η

_t=aléa vérifiant les hypothèses de base

t t 0 1

t

X

a a

e = + + η

t t 1 0

t

a a X

e = + + η

(7)

L3MS2_M5.doc 7/12 t

t 0 1

t

X

a a

e = + + η

L’hypothèse d’homoscédasticité est vérifiée si le paramètre a1 n’est pas significativement différent de zéro.

D’où le test :

) asticité hétéroscéd

( 0 a : H ) ité oscédastic (hom

0 a :

H

₀ ₁

=

₁ ₁

≠

On applique alors la méthode des MCO aux différents modèles proposés par Glejser :

( ⁿ ² )

aˆ T t

aˆ1

c 1

≡ −

= σ

Si

^t

c

< ^T

lu

( ⁿ − ² )

⇒

^H

0

^acceptée ^au ^risque ^de ¹

^ère

êspèce ^p → ^hom ôscédastic îté

Test Arch - LM

Il s’agit d’un test de conception différente utilisé principalement pour les séries temporelles. Les modèles AutoRégressifs Conditionnellement Hétéroscédastique (ARCH) ont été introduits par Engle en 1982 pour modéliser la volatilité des cours boursiers. Un représentant de ce modèle est associé au test du Multiplicateur de Lagrange (test du

χ

²) pour vérifier l’hypothèse d’homoscédasticité du résidu

e

t (qui est une série chronologique).

Déroulement du test :

- On considère le modèle suivant, appelé modèle autorégressif de retard p, sur le carré des résidus : 2 t

p p t 2

1 1 t 2 0

t

e e

e = φ + φ

₋

+

L

+ φ

₋

+ η

- On estime le modèle par la méthode des MCO (il s’agit d’un modèle à plusieurs variables qui sera étudié ultérieurement).

2 p p t 2

1 1 t 2 0

t

ˆ ˆ e ˆ e

eˆ = φ + φ

₋

+

L

+ φ

₋ - On calcule la statistique :

nR

2 avec

R

² le coefficient de détermination du modèle n le nombre d’observations

- On démontre que :

nR

²

≡ χ

²

( p )

Sous l’hypothèse H0 du test, les coefficients du modèle ne sont pas significativement différents de zéro (ils sont donc significativement égal à zéro) :

φ

₁

=

L

φ

_p

= 0

De ce fait :

e

²_t

= φ

₀

+ ε

_t et

[ ]

2

(

0 t

)

0 0 t t

n e 1 n e 1

V = ∑ = ∑ φ + ε = ε + φ = φ

, il y a homoscédasticité D’où le test :

0 :

H

₀

φ

₁

=

L

φ

_p

=

(homoscédasticité)

H

₁ : un au moins des coefficients ≠ de 0 (hétéroscédasticité) Si

^nR

²

< χ

²

( ) ^p

on est sous l’hypothèse H0 donc homoscédasticité.

p le nombre de retard est choisi successivement dans N*.

Test de White

(8)

L3MS2_M5.doc 8/12 On effectue une régression entre le carré du résidu et une ou plusieurs variables explicatives en niveau et au carré (ici, on considère une seule variable explicative puisque l’on se place dans le cas du modèle linéaire général simple à 2 variables), c’est-à-dire :

t 2

t 1 1 t 1 1 0 2

t

a a X b X

e = + + + η

Si l’un de ces coefficients de régression (

a

₁ou

b

₁) est significativement différent de 0, on accepte l’hypothèse d’hétéroscédasticité. Deux manières pour effectuer le test :

1) On effectue un test de Fisher :

H

₀

: a

₁

= b

₁

= a

₀

= 0

On construit le Fisher calculé suivant :

1 k

k n R 1 F R

2 2

c

−

= −

où k représente le nombre total de paramètres estimés (ici, k=3)

( ^k ¹ ^, ⁿ ^k )

F

_c

≡ − −

Règle de décision :

Si

^F

c

< ^F

1₋p

( ^k − ¹ ^, ⁿ − ^k )

^{alors H}o acceptée au risque de 1^ère espèce p ⇒ homoscédasticité Si

^F

c

≥ ^F

1₋p

( ^k − ¹ ^, ⁿ − ^k )

^{alors H}o rejetée au risque de 1^ère espèce p ⇒ hétéroscédasticité 2) Soit on recourt à la statistique

^LM ^≡ ^χ

²

( ^p ⁼ ^K )

K étant le nombre de variable explicatives, ici K=2

( ) ^p

nR

LM =

²

> χ

² H0 rejetée au risque de 1^ère espèce p ⇒ hétéroscédasticité

( ) ^p

nR

LM =

²

< χ

² H0 acceptée au risque de 1^ère espèce p ⇒ homoscédasticité

4. L’hypothèse de normalité des erreurs : ^ε

t

^≡ ^N ( ⁰ ^, ^σ

_ε

)

On veut tester

^ε

t

^≡ ^N ( ⁰ ^, ^σ

_ε

)

Cette hypothèse est indispensable pour calculer les estimateurs du maximum de vraisemblance mais aussi et surtout pour réaliser nombre de tests concernant les caractéristiques du modèle de régression (test de Student des paramètres, test de Fisher du r² etc …). On utilise dans la pratique le test de Jarque et Béra fondé sur la notion de skewness (asymétrie) et du Kurtosis (aplatissement).

Néanmoins il est toujours possible de recourir aux tests standards d’ajustement d’une loi normale à une distribution empirique (comme le test du

χ

²).

Principales étapes du test de Jarque et Béra :

On construit l’histogramme du résidu

e

_t en découpant l’étendu du résidu en classes d’amplitudes égales. On calcule alors après avoir affecté à chacune des classes le nombre de fois que le résidu se répète :

Le coefficient du skewness :

3 3 1²

1

σ

= µ

β

où

µ

₃ est le moment centré d’ordre 3 de la distribution.

Le coefficient du Kurtosis

4 4

2

σ

= µ

β

^où

µ

4 est le moment centré d’ordre 4 de la distribution.

On démontre que :

(9)

L3MS2_M5.doc 9/12











≡



β n

, 6 0

2

N

1

1 et 









≡



β n

, 24 3

2

N

Remarque : il est donc possible de réaliser un test de symétrie et d’aplatissement en utilisant les lois normales centrées réduites. :

( ) ⁰ ^, ¹

N n 6

2

0

1

β

1

− ≡

ν

₌ et

^N ( ) ⁰ ^, ¹

n 24

2

3

2

β − ≡

ν

₌

Les tests de symétrie et d’aplatissement normal se font ainsi :

•

H

₀ : aplatissement normal

si

1 , 96

n 6

2

0

1

− <

β

(le quantile à 95% de la loi normale centrée réduite) alors

H

₀ est acceptée au

risque de 5% donc aplatissement normal.

si

1 , 96

n 6

2

0

1

− ≥

β

alors

H

₀ est rejetée au risque de 5%.

•

H

₀ : symétrie normale

Si

1 , 96

n 24

2

− 3 <

β

alors

H

₀ est acceptée au risque de 5% donc symétrie normale.

Si

1 , 96

n 24

2

− 3 ≥

β

alors

H

₀ est rejetée au risque de 5%.

Pour vérifier l’hypothèse de normalité, il faut à la fois l’aplatissement normal et la symétrie normale.

De ce fait la statistique (due à Jarque Béra) notée JB s’écrit :

(

2

)

²

1

3 24 n 6

JB = n β + β −

Elle obéït à un

^χ

²

( ) ²

(somme de deux lois normales au carré). Le test se déroule de la façon suivante :

- Hypothèse :

H

₀ : la distribution obéit à une loi normale

H

₁ : la distribution n’obéit pas à une loi normale

- Calcul de JB

- Si JB <

^χ

²

( ) ²

(égal à 5,99 au seuil

α = 0 , 05

) on est sous l’hypothèse

H

₀ de normalité.

(10)

L3MS2_M5.doc 10/12

5. La robustesse du modèle

Un modèle est dit robuste lorsqu’il est valide dans des circonstances différentes.

Exemple : l’estimation de la fonction de consommation pendant la première moitié du XXè siècle est- elle restée identique à celle de la deuxième moitié ?

La relation prix – récolte de vin est-elle restée identique après l’introduction de la viticulture dans le marché commun en 1970 ?

Dans ces exemples, appelés exemples de robustesses structurelles, l’étude porte sur des époques de temps consécutives, mais elle peut concerner des périodes qui se chevauchent. Cette robustesse peut aussi être liée à des problèmes d’homogénéité spatiale. La robustesse concerne aussi le sens de la causalité de la relation économique.

Dans ce cours, on dira qu’un modèle est robuste, si quels que soient les sous-ensembles constitués à partir d’observations consécutives sur la période [1,n], les estimateurs du même modèle sur chacun de ces sous-ensembles sont :

- valides (test des paramètres, R², résidus…)

- stables : les paramètres estimés ne sont pas significativement différents entre eux, et différents de

α ˆ

et

β ˆ

_.

Cette définition amène sur le plan statistique à comparer les estimations des paramètres entre eux et les qualités de la régression entre elles. Trois tests de stabilité sont présentés

5.1 Tests de comparaison de deux coefficients de corrélation

Ils permettent de s’assurer que les relations sont bien de type linéaire et qu’elles ne sont pas globalement différentes.

Supposons que, sur la période [1,n], on construise 2 sous périodes de cardinal

n

₁ et

n

₂. Soient

r

₁ et

r

2, les coefficients de corrélation linéaire des deux sous périodes échantillons.

On montre qu’un coefficient de corrélation ne suit pas une distribution d’expression simple autour de son espérance mathématique : la distribution est fortement asymétrique pour les valeurs éloignées de zéro. Ainsi pour comparer deux coefficients de corrélation on peut utiliser au préalable la transformation non linéaire de FISHER :

ρ

− ρ

= + ρ

= 1

Log 1 2 Argth 1

z

avec Argth : fonction Argument tangente hyperbolique et Log le logarithme népérien :

( ) [ ]

( ) ( )







= −

=

ρ

= ρ

=

3 n z 1 s z V

r E avec Argth

z E

2

Si on note alors :





ρ

=

ρ

=

2 2

1 1

Argth z

La différence

d = z

₁

− z

₂ a pour caractéristique :

( ) ( ) ( ) ^d ^E ^z ^E ^z ⁰

E =

₁

−

₂

=

( ) ( ) ( )

3 n

1 3 n

1 Z V z V d V

2 1

+ −

= −

+

=

La valeur estimée de d est

dˆ

. Elle est égale à

dˆ = z

₁^'

− z

^'₂

(11)

L3MS2_M5.doc 11/12 Avec



















−

= +

=









−

= +

=

2 2 2

2

1 1 1

' 1

r 1

r Log 1 2 r 1 Argth z

r 1

r Log 1 2 r 1 Argth z

On teste alors l’hypothèse

H

₀

: d = 0 H

₁

: d ≠ 0

Sous l’hypothèse

H

₀ on a :

^t

^c

⁼ ^s ^dˆ ( ) ^dˆ ^≡ ^N ^{( )} ⁰ ^, ¹

^avec

^s ( ) ^dˆ _n ¹ ₃ _n ¹ ₃

2

1

+ −

= −

La règle de décision est alors la suivante :





<

⇒

≥

⇒

% 5 de rique au acceptée H

96 , 1 t si

% 5 de rique au rejetée H

96 , 1 t si

0 c

Si

H

₀ acceptée, la différence entre les deux coefficients

r

₁ et

r

₂ n’est pas significativement différente de 0.

5.2 Tests de comparaison de deux coefficients de régression

Soient

β ˆ

¹^et

β ˆ

², les deux coefficients de régression estimés sur les deux sous-ensembles de cardinal

n

₁ et

n

₂.Considérons l’hypothèse

H

₀ : les deux coefficients ne sont pas significativement différents. Si cette hypothèse est vraie alors

dˆ = β ˆ

¹

− β ˆ

² n’est pas significativement différente de zéro. En effet, le caractère non biaisé de

β ˆ

¹ et

β ˆ

² permet d’écrire que :

β

= β

= β ˆ ] E [ ˆ ] [

E

¹ ² D’où :

E [ β ˆ

¹

] − E [ β ˆ

²

] = E [ β ˆ

¹

− β ˆ

²

] = 0

De plus comme

β ˆ

¹ et

β ˆ

² sont deux variables aléatoires indépendantes on a :

ˆ ]

[ s ˆ ] [ s ] dˆ [

s

²

=

²

β

¹

+

²

β

² D’où :

[ ] ^dˆ ^T ⁽ ⁿ ⁿ ⁴ ⁾

s

t

_c

= dˆ ≡

₁₋_α ₁

+

₂

−

D’où le test :

H

₀

: d = β

¹

− β

²

= 0 H

₁

: d ≠ 0

Et la règle de décision :

Si

^t

^c

⁼ ^s ^dˆ [ ] ^dˆ ^< ^T

¹⁻^α

⁽ ⁿ

¹

⁺ ⁿ

²

⁻ ⁴ ⁾

on est sous l’hypothèse

H

₀ et donc les deux coefficients ne sont pas significativement différents.

5.3 Tests de stabilité du modèle : test de Chow

Ce test est une présentation différente du test de comparaison de deux coefficients de régression.

Soit

SCR

₀ : la somme des carrés des résidus du modèle sur toute la période et

SCR

₁ et

SCR

₂ la somme des carrés des résidus sur chacune des deux sous périodes.

On teste

H

₀

: β

¹

= β

²

H

₁

: β

¹

≠ β

²

(12)

L3MS2_M5.doc 12/12

Sous

H

₀ :

( ) ( ) ^F ( ² ^, ⁿ ⁴ )

SCR SCR

SCR 4

F n

₁ _p

2 1

c 0

≡ −

+

−

= −

₋

Règle de décision :

Si

^F

c

≥ ^F

1₋p

( ² ^, ⁿ − ⁴ ) H

₀ rejetée au risque de 1^ère espèce p

Si

^F

c

< ^F

1₋p

( ² ^, ⁿ − ⁴ ) H

₀ acceptée au risque de 1^ère espèce p donc les deux coefficients sont significativement différents.

5.4 Une étude simple de la robustesse : les régressions roulantes

La régression roulante consiste à régresser le modèle sur un nombre suffisant (

n

₁) d’observations en début de période puis de réitérer l’estimation en rajoutant une observation à

n

₁ jusqu’en fin de période. (en accroissant le nombre d’observations sur l’axe du temps). Pour chacune des régressions on mémorise une ou plusieurs caractéristiques (t de Student,

r

², DWc…) que l’on représente graphiquement. La stabilité au cours du temps de ces caractéristiques est une indication de la robustesse du modèle.

Remarque : il est possible d’utiliser les régressions roulantes de l’instant 1 vers l’instant n (régression Forward) ou au contraire de n vers 1 (régression backward)

Bibliographie :

Régis BOURBONNAIS (2009) : Econométrie - Dunod - 7^ième édition

J JOHNSTON, J DINARDO (1999) : Méthodes économétriques – Economica - 4^ième édition

Module 4 : vérification des hypothèses d’application de la régression et robustesse du modèle