Économétrie des Données de Panel
Ch 1. Modèles Linéaires Non Dynamiques
Pr. Philippe Polomé, Université Lumière Lyon 2
M1 APE Analyse des Politiques Économiques M1 RISE Gouvernance des Risques Environnementaux
2016 – 2017
Next year (2016/17) improvements : Present starting from FE,
then get more restricted. Discuss the Breushc Pagan test & the
usefulness of testing Het & autocrrel
Plan du Ch 1
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Sommaire
Les données de panel
Modèles à Données de Panel Estimateurs pour données de panel Inférence en données de panel Effets Fixes vs. Effets Aléatoires
Données de panel non-cylindré (Unbalanced)
Les données de panel
I i =
1
, ...,N: agent (individu, firme, pays...)
I t =
1
, ...,T: temps
I En généralTi : nombre de périodes diffère d’agent à agent
I Panel “non-cylindré” (unbalanced)
I Attrition, on y reviendra en fin de chapitre
I Pour simplifier la notation, la théorie utiliseT
I Les logiciels gèrentTi
I yit
une observation de la variable
dépendanteyI xit
une observation du vecteur
K ⇥1 des variables
indépendantesI “régresseurs”
I Possiblement endogènes – Ch. 2
Organisation des données
obs agent
itemps
t y x1 . . . xK1 1 1
y11 x111 xK11... ...
t 1 t
y1t x11t xK1t... ...
T 1 T
y1T x11T xK1TT+1 2 1
y21 x121 xK21... ...
it i t
yit x1it xKit... ...
NT N T
yNT x1NT xKNTSommaire
Les données de panel
Modèles à Données de Panel
Estimateurs pour données de panel Inférence en données de panel Effets Fixes vs. Effets Aléatoires
Données de panel non-cylindré (Unbalanced)
Modèles & Estimateurs
I
Plus grand choix de modèles et d’estimateurs qu’avec les coupes transversales
I
3 modèles standards dans la présente Section
I 5 estimateurs dans la prochaine Section
I On fera cette distinction modèle / estimateur dans chaque chapitre
I
Chaque estimateur “peut” être appliqué à chaque modèle
I Avec des résultats divers
I On ne sait jamais quel modèle s’applique
I Table 5x3 des propriétés des estimateurs dans chaque modèle
Modèle Général
I
Le modèle linéaire le plus général pour un panel
I intercept & pentechangent suri& t yit =↵it+xit it0 +uit
I uit un élément scalaire du vecteur du terme d’erreuru
I
Identification des paramètres
I Est-il possible de les estimer ?
I
Ce modèle
yit =↵it+xit it0 +uitest trop général
I Nonestimable : + de paramètres à estimer que d’observations
I Restrictions supplémentaires requises sur
I la manière dont↵itet itvarient aveci &t
I le comportement de l’erreuruit
Modèle 1. MRL - Modèle de régression linéaire classique
I
Le modèle le + restricif
I impose descoefficients constantsentre i
yit =↵+xit0 +uit
(1)
I
Si ce modèle est le bon (correctement spécifié)
I et si les régresseurs ne sont pas corrélés à l’erreur
I Alors il pourra être estimé, de façon consistante, comme une coupe transversale
Dichotomiques Individuelles et Temporelles
I
Une variante simple du MRL (1)
I Interceptsqui changent entre individus et entre période
I Mais pas les deux à la fois
I Pentes constantes
yit =↵i+ t+xit0 +uit
(2) ou
yit =XN j=1
↵jdj,it+ XT s=2
sds,it+xit0 +uit
où les
Ndichotomiques individuelles
dj,it=1 si
i =j&
=0 sinon
les
T1 dichotomiques temporelles
ds,it =1 si
t =s&
=0 sinon
Données de panel avec dichotomiques
obs i i=1 . . . i=N t t=1 . . . t=T 1 y x1 . . . xK
1 1 1 0 1 1 0 y11 x111 xK11
... ...
t 1 1 0 t 0 0 y1t x11t xK1t
... ...
T 1 1 0 T 0 0 y1T x11T xK1T
T+1 2 0 0 1 1 0 y21 x121 xK21
... ...
it i 0 0 t 0 0 yit x1it xKit
... ...
NT N 0 1 T 0 0 yNT x1NT xKNT
Dichotomiques Individuelles et Temporelles
I xit
n’inclut pas d’intercept
I Si on en met un
I alors une desNdichotomiques individuelles doit être retirée
I Beaucoup de logiciels font ça
I
Focus sur les
panels courtsoù
N ! 1mais pas
TI Alors (coef. des dich. temp.) peuvent être estimés de façon consistante
I Au moins au sens où il y a un nombre fini de ces dich. temp.
I T 1 dich. temp. sont simplement incorporées aux régresseursxit
I Par contre, si on insérait l’ensemble desNdich. individuelles dj,it
I Ça poserait un problème lorsqueN! 1
I On ne peut estimer de façon consistante un nombre1de paramètres
I L’information ne croît pas sur↵i lorsqueNcroît I
Challenge : estimer les paramètres
I en contrôlant pour lesN dich. indiv.↵i
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Modèle à Effets Individuels
I
Chaque agent
ia son intercept, mais toutes les
pentessont les mêmes entre agents
yit =↵i+xit0 +✏it
(3)
où
✏itest iid sur
iet
tI
= une façon plus parcimonieuse d’exprimer le précédent modèle (2)
I Les dic. temp. sont incluses dans les régresseursxit
I C’est le modèle linéaire, non-dynamique, à données de panel
“standard”
I ↵i variables aléatoires
I Capture hétérogénéité inobservéeinvariante dans le temps
I = caractéristiques individuelles inobservées
I En fait : un modèle à paramètres aléatoires
Rappel : l’hétérogénéité inobservée
I
Modèle correct :
Y = 0+ 1x1+ 2x2+✏I
Modèle estimé :
Y = 0+ 1x1+⌫I
L’effet du régresseur manquant
x2sur
Yest implicite dans le terme d’erreur du modèle estimé :
⌫ = 2x2+✏I = hétérogénéité inobservée : Des facteurs (individuels) inobservés influent surY
I
Si
x2n’est pas corrélé avec
x1I Pas de souci
I
Si
x2est corrélé avec
x1,
I l’erreur⌫ est corrélée avec x1
I MC inconsistant
Rappel : l’hétérogénéité inobservée
Mêmes pentes
Exogénéité
I
Dans ce Ch. 1 : on assume
l’exogénéité forte/stricteE[eit|ai,xi1, ...,xiT] =
0,
t =1, ...,
T(4)
I
C’est-à-dire : hypothèse que
✏itI Espérance de zéro conditionnellement aux valeurs passées, présentes et futures des régresseurs
I Équivalent à zéro covariance
I Rien n’est supposé entre la variable aléatoire↵i et les régresseursxi
I
Exclut des modèles avec une variable dépendante retardée
I Pas deyi(t s) dans xit = Modèledynamique
I Commeyit 1=↵i+xit0 1 +✏it 1 : il est diffcile d’affirmer queE(✏it✏it 1) =0
I Et aussi avec des régresseurs endogènes (Ch. 2)
Modèle à Effets Fixes
I
2 variantes du modèle (3)
yit =↵i+xit0 +✏itselon hyp. sur
↵iI Toutes deux ont “2” erreurs↵i et✏it I Modèles à erreurs composées
I Toutes deux traitent ↵i comme une v.a. inobservée
I
Variante 1 : modèle à
effets fixes(EF)
I ↵i estcorréléavec (la partie invariante au temps) des régresseurs observésxit
I C’est une forme d’hétérogénéité inobservée
I “fixe” parce que, anciennement,↵i était traité comme un paramètre (non-aléatoire) à estimer
Modèle à Effets Aléatoires
I
Variante 2 : modèle à
effets aléatoires(EA)
I ↵i distribué indépendamment dex
I Habituellement, assume de plus que les effets aléatoires↵i et les termes d’erreurs✏it dans (3) sont iid :
↵i ⇠ ↵, 2↵
✏it⇠ 0, 2✏ (5)
I
Pas d’hyp. sur la distribution de ces v.a. dans (5)
I ✏it
peut présenter de l’autocorrélation
I Souvent, il est supposé quecov(✏it,✏is)6=0
I Mais aussi quecov(✏it,✏jt) =0 etcov(↵i,↵j) =0
I Sauf dans les modèles spatiaux
I
Dans le modèle EA,
↵est vu comme l’intercept
Autres noms des modèles EF/EA (3)
I
Modèle à effets individuels une voie (One-way)
I
Deux voies (Two-way) = inclusion de dich. de temps ou d’effets aléatoires de temps
I
Modèle à intercept aléatoire
I Pour distinguer de modèles plus généraux, p.e. à pentes aléatoires
I
Modèles à composants aléatoires
Modèle EA équicorrélé
I
Le modèle EA
yit=↵i +xit0 +✏itI peut être vu comme la régression deyit surxit I avec erreur composéeuit=↵i+"it
I Les hyp. EA usuelles (5) (↵i et✏it iid) impliquent que Cov[(ai +eit),(ai+eis)] =
⇢ sv2a, t 6=s
sv2a+sv2e, t =s
(6)
I
Le modèle EA impose donc que l’erreur composée
uitsoit
équicorreléeI CarCor[uit,uis] = ↵2/[ ↵2+ 2"]pourt 6=s ne change pas avec la duréet s
I Le modèle EA est aussi appelé équicorrélé ou à erreurs interchangeables
Synthèse des modèles à données de panel
MRL (1)
yit =↵+xit0 +uit uit ⇠0
, u2EF
yit =↵i+xit0 +✏it(3)
Cov(↵i,xit)6=0
EA
↵i ⇠ ↵, 2↵✏it ⇠
0,
✏2(5)
I
Ces 3 modèles supposent l’hétérogénéité stricte 4
I D’autres modèles panel existent, en particulier dynamiques
Sommaire
Les données de panel
Modèles à Données de Panel
Estimateurs pour données de panelInférence en données de panel Effets Fixes vs. Effets Aléatoires
Données de panel non-cylindré (Unbalanced)
Introduction
I
Il y a 5 estimateurs utilisés couramment pour en données de panel
I Dans ce contexte non-dynamique, sans endogénéité : variantes MC
I
Diffèrent selon leurs utilisations des variations transversales (entre
i) et temporelles
I Leurs propriétés dépendent de quel est le modèle approprié (MRL - EF - EA)
I
Un régresseur
xitpeut être soit
I invariant dans le temps,xit=xi pour t=1, ...,T ,
I ou variable dans le temps
I Certains estimateurs ne peuvent identifier que les coefficients des régresseurs variables dans le temps
I
On va voir les estimateurs du plus simple au plus complexe
I On regarde la consistance et l’efficience
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Efficience des Estimateurs
I
L’efficience n’est pertinente que pour les estimateurs consistants
I
L’efficience est la précision de l’estimateur
I Essentiellement l’inverse de sa matrice de var-cov⌃ˆ
I Qui donc dépend de la matrice de var-cov des erreurs⌃u
Hypothèses sur les erreurs
I
Les modèles à données de panel ont différents types d’erreur
I uit pour MRL
I ↵i+"it pour EF et EA
I
Dans beaucoup d’applications de microéconomie
I raisonnable de supposer indépendance entrei
I Sauf en spatial
I Pas le cas en macro
I
Toutes ces erreurs sont potentiellement
1. Autocorrélées (corrélées surt pour un certaini )
I Corrélation sérielle, temporelle 2. Hétéroscédastiques entre lesi
I
L’inférence (tests) stat. valide requiert de prendre en compte ces caractéristiques
I Section suivante
I Dans cette section-ci
I structure de la mat. de var-cov des erreurs
I Efficience
Matrice ⌃
ude variance-covariance des erreurs en panel
I
Sans distinguer entre les trois modèles
I On écrit l’erreur du modèleuit
I Peut être↵i+✏it ou pas I
Entre
ion a
Cor[uit,ujs] =0
I pouri 6=j ett=ou6=s
I
Pour un certain
iI Cor[uit,uis] = its : corrélation quelconque dans le temps
I t =s, its = 2it : hétérocédasticité quelconque
I
Ça donne la matrice var-cov des erreurs
⌃usuivante
Matrice ⌃
ubloc-diagonale de var-cov des erreurs panel
0 BB BB BB BB BB BB BB BB BB BB BB
@
sv211 sv112 · · · sv11T
sv212 ... ... ... ... ... sv1(T 1)T
SYM · · · sv21T
0 · · · 0
0 ... ... ...
... ... ... 0
0 · · · 0
sv2N1 svN12 · · · svN1T
sv2N2 ... ...
... ... ... svN(T 1)T
SYM · · · sv2NT
1 CC CC CC CC CC CC CC CC CC CC CC A
Modèle EA
I
Le modèle EA met plus de structure dans la matrice
⌃u IModèle EA
yit =↵i +xit0 +✏itavec
I ↵i iid (donc non-corrélés àxit)
I ✏it iid
I Corrélations comme dans l’hyp. EA (5)
↵i ⇠ ↵, 2↵
✏it⇠ 0, 2✏ I
La matrice
⌃uprend la forme suivante
0 BB BB BB BB BB BB BB BB BB BB BB B@
sv2a+sv2e sv2a · · · sv2a
sv2a sv2a+sv2e ... ... ... ... ... sv2a
sv2a · · · sv2a sv2a+sv2e
0 · · · 0
0 ... ... ...
... ... ... 0
0 · · · 0
sv2a+sv2e sv2a · · · sv2a
sv2a sv2a+sv2e ... ... ... ... ... sv2a
sv2a · · · sv2a sv2a+sv2e
1 CC CC CC CC CC CC CC CC CC CC CC CA
En mots
I
La matrice s’organise en blocs carrés autour de la diagonale principale
I
Chaque carré tient en 2 chiffres
I Hors de sa diagonale principale, une corrélation entre périodes
2↵
I la même pour tous lesi
I Sur sa diagonale principale, une variance 2↵+ ✏2 homoscédastique
I
Entre différentes
i, toutes les corrélations sont nulles
I Hors des blocs diagonaux
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Estimateur MCO
I
MCO estime
↵et dans
yit=↵+xit0 +uit IMCO est
consistant(pour
N ! 1, t constant) si
I Cov[uit,xit] =0 et
I MRL (1) est approprié, ou si
I EA est approprié
I
La mat
⌃un’est pas diagonale
I MCO inefficient
I
L’estimateur MCO de la matrice
⌃ˆ ˆ2(X0X) 1est
biaiséI
MCO est inconsistant si EF est approprié
I Ré-écrire EFyit =↵i+xit0 +✏it comme yit =a+xit�b+ (ai−a+eit)
I Donc l’erreur MCO,uit=↵i ↵+✏it, est corrélé àxit par↵i
Estimateur Between
I
Étapes
1. Prendre les moyennes sur le temps par individu
I y¯i = 1 T
XT t=1
yit, idem pourx¯i
2. Estimer par MCOy¯i =↵+ ¯xi0 + ¯"i
I Régressery¯i sur un intercept et le vecteur¯xi
I
Pour estimer , MCO utilise toutes les données
I Donc les variations à la fois sur le temps et en transversal
I
Between n’utilise que les variations transversales
I Entre(between)différents individus
I Analogue à une régression en coupe transversale
I Les variations internes(within)à chaque individu sont écartées
Propriétés de l’estimateur Between
I
Le modèle implicite derrière l’estimateur between est
¯
yi =↵+ ¯xi0 +ui i =
1, ...,
N(7)
I
Between est consistant si les régresseurs
x¯isont indépendants de l’erreur
uiI C’est le cas pour le MRL (1)
I Si par contre le modèle est à erreurs composées (3) yit=↵i+xit0 +✏it
I Alors,ui = (↵i ↵+ ¯✏i)
I Dans EA,↵i est indépendant de x
I Donc Between est consistant pour EA
I Dans EF,↵i est corrélé àxit et donc àx¯i
I Between est donc inconsistant
Propriétés de l’estimateur Between
I
Between gaspille beaucoup d’informations
I C’est un estimateur didactique
I Ne pas l’utiliser dans vos applications
I
Sans regarder formellement
I between est très inefficient à cause du gaspillage d’information
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Estimateur Within
I
Principe : Les
déviationsindividuelles de la variable dépendante de ses moyennes temporelles
I sontexpliquées par
I lesdéviationsindividuelles des régresseurs de leurs moyennes temporelles
I
Soit le modèle à effets individuels 3
yit =↵i +xit0 +✏itI Prendre le moyenne surt :y¯i=↵i+ ¯xi0 + ¯"i
I Soustraire :les termes ↵i s’annulent = la transformation within
yit y¯i = (xit x¯i)0 + (✏it ¯✏i)
1
, ...,N, t =1
, ...,T(8)
Estimateur Within
I
Estimateur Within = MCO sur les données transformées
yit y¯i = (xit x¯i)0 + (✏it ¯✏i)I Comme↵i a disparu par différence, Within est consistant dans EF, EA et MRL
I En tout cas quand l’hyp d’exogénéité forte tient
I
Within est aussi appelé estimateur Effets Fixes
I
Chaque
idoit être observé au moins
deux foisdans l’échantillon
I sinonxit x¯i =0
Consistance de l’estimateur Within / Effets Fixes
I
Within traite
↵icomme des paramètres dits
nuisanceI que l’on peut ignorer si notre intérêt porte sur les pentes
I qui n’ont pas besoin d’être estimés de façon consistante pour obtenir une estimation consistante des
I Ce résultats ne se propage généralement pas aux modèles non-linéaires
I
La consistance requiert plus précisément
E(✏it ¯✏i|xit x¯i) =0 dans le modèle transformé
yit y¯i = (xit x¯i)0 + (✏it ¯✏i)
I À cause des moyennes, cela exige plus queE(✏it|xit) =0
I Il faut l’exogénéité stricte (4)
E[eit|ai,xi1, ...,xiT] =0, t =1, ...,T
Estimations des effets fixes
I
Si les effets fixes
↵isont d’intérêt , ils
peuventêtre estimés par
↵ˆi = ¯yi x¯i0ˆI Cet estimateur de↵i non-biaisé
I Dans des panels courts (petitT), cet estimateur est inconsistant
I Parce que l’information ne s’accumule pas (T ne croît pas)
I Par contre, la distribution des↵ˆi, par rapport à une variable clef ou pas, peut être informative
I
Si
Nn’est pas trop grand, une alternative pour estimer Within est l’estimateur
MC à dichotomiquesI On définitNdich.di, une par individu, di =1 pouri
I Ensuite, estimeryit=X
i
↵idi+xit0 +✏it par MCO
I Régression deyit surxit etNdich. individuelles
I Cela produit l’estimation Within pour , ainsi que les estimations desN effets fixes
I Dans les limites des capacités de l’ordinateur
Within et les régresseurs invariants dans le temps
I
Une limitation majeure de Within
I les coefficients des régresseurs invariants dans le temps ne sont pas identifiés
I Puisque sixit=xi alorsx¯i=xi et(xit x¯i) =0
I
Beaucoup d’études ont précisément pour objet des régresseurs invariants dans le temps
I P.e. les effets du genre ou de l’origine ethnique sur le salaire
I
Pour cette raison, des praticiens évitent d’utiliser within
I
MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent d’estimer ces coefficients
I mais sont inconsitants si EF est le modèle approprié
I On verra un estimateur qui permet parfois de les identifier
Estimateur différences premières
I
Principe : Les changements individuels
d’une période à l’autrede la variable dépendante
I sont expliqués par
I les changements individuelsd’une période à l’autredes régresseurs
I
Soit le modèle à effets individuels (3)
yit =↵i+xit0 +✏itI retarder d’une périodeyi,t 1=↵i+xi,t0 1 +"i,t 1 I Soustraire = la transformationdifférences premières
yit yi,t 1 = (xit xi,t 1)0 + (✏it ✏i,t 1)
i =
1
, ...,N, t=2
, ...,T(9)
Estimateur différences premières
I
L’estimateur différences premières (D1) est MCO appliqué à la transformation différences premières (9)
I
Cet estimateur est
consistantpour dans tous les modèles
I Pour les mêmes raisons que Within
I Pareillement, les coefficients des régresseurs invariants dans le temps ne sontpas identifiés
I
D1 est
moins efficientque within
I si"it est iid (pourT >2)
I car une période d’obsevation est écartée
I
Cependant, D1 peut préserver contre des variables I(1)
I Qui amènerait sinon à des résultats spurieux
Efficience des estimateurs pour EF
I
Ces estimateurs font peu d’hypothèses sur la structure du terme d’erreur
I
Leur efficience n’est généralement pas discutée
I Car la priorité est l’estimation consistante
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Rappel du modèle EA
I
Modèle à effets individuels (3)
yit=↵i +xit0 +✏itavec
I ↵i iid (donc non-corrélés àxit)
I ✏it iid
I Corrélations comme dans l’hyp. EA (5)
↵i ⇠ ↵, 2↵
✏it⇠ 0, 2✏
I
Dans ce cas, MCO consistant (car
↵inon-corrélés à
xit)
I MaisMoindres Carrés Généralisés MCGseraplus efficient
Rappel : MCG en coupe transversale
I
Quand toutes les hyp. du modèle linéaire sont satisfaites
I sauf que la matrice var-cov⌃des erreurs n’est pas l’identité, alors
I MCO consistant
I mais pas efficient (Gauss-Markov ne s’applique plus)
I Si on connait⌃, on peut retrouver l’efficience
I
Soit le MRL en coupe transversale
y=x0 +✏avec
E⇣✏✏0⌘
=⌃6= 2I
I On peut montrer qu’il existe toujoursP telle queP0P=⌃ 1
I Décomposition de Cholesky, non-unique pour les matrices réelles sdp
I Prémultiplier le modèle linéaire parP :Py =Px +P✏
I y⇤=x⇤ +✏⇤
I AlorsVar(✏⇤) =E⇣
P✏✏0P0⌘
=PE⇣
✏✏0⌘ P0
I =P⌃P0 =P⇣
P0P⌘ 1
P0 =PP 1⇣ P0⌘ 1
P0 =I
Rappel : MCG en coupe transversale
I
Donc, le modèle transformé a des erreurs dites
sphériquesI Donc, MCO sur les données transformées estefficient
I C’est MCG
I
En pratique,
⌃est inconnue, il nous en faut un estimateur consistant
I Tout estimateur consistant de⌃,⌃, définit l’estimateur MCGˆ faisables (consistant)
I
En panel, le modèle EA implique une matrice
⌃comme dans la diapo suivante
I Comme détaillé précédemment
Matrice ⌃ bloc-diagonale de var-cov des erreurs panel EA
0 BB BB BB BB BB BB BB BB BB BB BB
@
sv2a+sv2e sv2a · · · sv2a
sv2a sv2a+sv2e ... ... ... ... ... sv2a
sv2a · · · sv2a sv2a+sv2e
0 · · · 0
0 ... ... ...
... ... ... 0
0 · · · 0
sv2a+sv2e sv2a · · · sv2a
sv2a sv2a+sv2e ... ... ... ... ... sv2a
sv2a · · · sv2a sv2a+sv2e
1 CC CC CC CC CC CC CC CC CC CC CC A
Estimateur EA
I
On appelle estimateur EA l’estimateur MCG
I dans lequel la matrice⌃des erreurs est celle de la diapo précédente
I
La version
faisablede cet estimateur est MCO
I appliqué aux données transformées de la façon suivante : yit ˆ ¯yi =⇣
1
ˆ⌘µ+⇣
xit ˆ ¯xi
⌘0
+⌫it
(10) où
⌫it = (1 ˆ)↵i+ ("it ˆ ¯"i)est asymptotiquement iid, et
I ˆ
est un estimateur consistant pour
=
1
p 2 ✏✏ +T ↵2
(11)
Estimateur EA
I
On ajoute l’intercept (non-aléatoire) scalaire
µafin de normaliser les effets aléatoires
↵ià une espérance nulle
I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)
I C’est-à-direµcorrespond à↵dans (5)
I
La dérivation de cet estimateur (10) et des manières d’estimer
2↵
et
2", et donc ,
I sont détaillés dans Cameron & Trivedi
I
Remarque
I ˆ =0 correspond à l’estimateur MCO
I ˆ =1 correspond à l’estimateur within
I ˆ!1 lorsqueT ! 1(regardez la formule)
I
Il s’agit d’un estimateur en deux étapes de
1. estimer2. estimer à partir des données transformées
Propriétés de l’estimateur EA
I Consistant
et
efficientsi le modèle EA est le bon
I Le gain d’efficience par rapport à l’estimateur MCO n’est pas nécessairement élevé
I Probablement inefficient
si l’hypothèse d’équicorrélation n’est pas vraie
I Dans un processusAR(1)
I Si le MRL est le bon
I Inconsistant
si le modèle EF est le bon car alors
↵iest corrélé
avec
xitSommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Discussion sur EA et EF
I
La plupart des disciplines de stat appliquées
I traitent l’hétérogénéité inobservée (individuelle)↵i comme distribuée indépendamment des régresseurs
I Sauf la microéconométrie I
Cette hyp d’indépendance
I a l’avantage de permettre une estimation consistante de tous les paramètres
I y-compris ceux invariants dans le temps
I si l’hyp est vraie
I est souvent considérée par les économistes commenon supportée par les données
I
Les deux modèles ont des intérêts distincts
I EA : Précise la structure temporelle!Efficience
I EF : Endogénéité de l’hétérogénéité inobservée!Consistance
Prédictions et effets individuels
I
Le modèle est
yit=↵i +xit0 +✏itaussi bien pour EA que pour EF
I L’effet individuel↵i est une v.a. dans les deux modèles
I
On prend l’espérance conditionnelle aux régresseurs
I E[yit|xit] =E[↵i|xit] +xit0
I Que peut-on en dire ? (prochaine dia)
Prédictions et effets individuels
I
Dans le modèle EA, il est
supposéque
E[↵i|xit] =↵I DoncE[yit|xit] =↵+xit0
I Si EA est le bon modèle,↵peut être estimé de façon consistante
I Donc on peut prédireyit parE[yit|xit]
I
Dans EF,
E[↵i|xit]varie avec
xitet on ne sait pas comment
I C’est raisonnable car↵i comprend des characteristiques inobservées
I DoncE[yit|xit]ne peut être identifié :pas de prédiction
I Malgré cela, on peut estimer les de façon consistante
I Et donc les effets marginaux sont identifiés
=@E[yit|↵i,xit]/@xit
I Par exemple, l’effet d’un changement de population sur les émissions
I Mais seulement pour les régresseurs variant dans le temps
Résumé estimateurs et modèles linéaires communs pour panel
Modèle
Estimateur de MRL (1) EA (3) & (5) EF (3) MCO (1) Consistant Consistant Inconsistant Between (7) Consistant Consistant Inconsistant Within (EF) (8) Consistant Consistant Consistant D1 (9) Consistant Consistant Consistant EA (10) Consistant Consistant Inconsistant Cette table ne considère que la consistance des estimateurs de
I
L’estimation des
↵iest toujours inconsistante, sauf lorsque
↵i =↵8i
.
Le seul estimateur efficient est EA lorsque le bon modèle est aussi
EA.
Sommaire
Les données de panel Modèles à Données de Panel
Effets Fixes & Effets Aléatoires Estimateurs pour données de panel
Efficience et Erreurs
Estimateurs appropriés pour le MRL
Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2
Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White
Inférence robuste en panel : Bootstrap
Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires
Éléments du choix hors tests Test de Hausman
Données de panel non-cylindré (Unbalanced)
Émissions de CO
2I
Convergence dans ce contexte est 2 choses
1. Dans le temps vers un “État stationnaire” (Steady State)
I Non testé ici
2. En supposant la convergence dans le temps,
I Des groupes de pays convergent-ils à la mêmevitesse
I C’est ce qui est testé ici
I
Importance de la convergence lors de négociations internationales
I Si les émissions tendent à se rapprocher entre pays ou non
I les négociations ne sont pas les mêmes
I Émissions par habitant ou par travailleur effectif, pas au total
I
On peut essayer de comprendre les différences entre vitesse de convergence
I Technologie ? Politique ? Ressources naturelles ? Niveau de développement ?
Théorie en état stationnaire
I
La croissance du stock de capital est déterminée par
I la croissance de la populationn
I le taux d’épargnes
I le progrès techniqueg (paramètre inconnu)
I un paramètre exogène de dépréciation
I Les auteurs posentg+ =.05, constant
I On ne va pas explorer cette question, on oublie
I
Il est supposé que les émissions per capita
E/Lcroissent de la même manière que le stock de capital
I Ceci permet d’obtenir une équation pour les émissions en état stationnaire
ln(E/L) =lnA+ t+↵ln
✓ s n+g+
◆
(12)
I Aest le niveau technologique
I permettra de définir une constante pays-spécifique
Dynamique
I
L’économie n’est pas à l’état stationnaire
I
Soit
I ✏⇤ les émissionsE/Là l’état stationnaire
I ✏les émissions à l’instantt
I
L’équation de convergence dans le temps est
dln
✏tdt =⇢[ln✏⇤
ln
✏t](13)
I Équation différentielle
I Dit essentiellement que le mouvement vers l’état stationnaire est une proportion de la distance actuelle
I Théorie sans fondement empirique, l’existence même d’un état stationnaire n’étant pas certaine
I Résolution (intégration)
ln✏t2= 1 e ⇢⌧ ln✏⇤+e ⇢⌧ln✏t1 (14)
Dynamique
I
En substituant
✏⇤selon l’équation 12 dans la solution 14
I et en notant =e ⇢⌧, on a
ln
✏t2 = (1 )↵ln
⇣s n+g+
⌘+ (1 )A+g(t2 t1) +
ln
✏t1I
Le progrès technologique
g(t2 t1)I modélisé (ad hoc) comme un jeu de dummies temporelles de coefficients⇡t
I
Les différences de technologie
Aentre pays
I donnent naissance à des intercepts par pays✓i
I
Il est supposé que
I les coefficients de lns et de ln(n+g+ )peuvent être différents
I commeg + =0.05 par faute de données, on n’a ques etn
Modèle estimé
I
Le modèle opérationnel est donc
ln
✏t2 =ln
✏t1+ 1ln
s+ 2ln
n+⇡t+✓i+⌫it(15)
I Le paramètre d’intérêt est⇢= 1 5ln
I Puisque ce paramètre indique la vitesse de convergence vers l’état stationnaire selon eq. 13
I Modèle dynamique par la présence de✏t1 I que l’on traite en statique dans ce chapitre
I Les régresseurs lns et lnn
I aident à limiter (“contrôler”) l’hétérogénéité inobservée
I Il pourrait y en avoir d’autres : prix du pétrole, température en hiver...
Penn World Table PWT
I
Jeu de données
I maintenu conjointement par des chercheurs de
I U Californie à Davis
I Growth Development Centre de U Groningen
I Données de comptes nationaux
I PIB réel au cours du temps
I dans 189 pays dans la version utilisée (7)
I Non-cylindré 1950-2009
I Semblables à celles de la Banque Mondiale
I Plus long pour certains pays
I Beaucoup moins de variables I
“Extended Penn World Tables” EPWT
I Ajoute quelques variables et change certaines définitions
I Émissions nationales deCO2
I Combustion de combustibles fossiles, fabrication de ciment et rejet de gaz naturel
I “CO2pur” vs. “CO2 - équivalent”
Retard
I
Le retard considéré est 5 ans
I Pour un effet long terme selon les auteurs
I ⌧=t2 t1=5ans
I Différents⌧ influencent-ils les résultats ?
I Les données post 2005 ne sont pas dans la EPWT pour plusieurs pays
Stata
I
Charger les données
I .dta : double-click
I capacité d’import très limitée : .csv
I pas de méta-donnée
I
Suivre le fichier 20160727CvgceCO2.do
I
Ci-dessous
I présentation des données
I Graphique temporel par pays
I menu graphics!panel data line plots
I
Var. qualn
I NA, 4, 3, 2, 1
I summarize em if (qualn<4)&(year<2009)
year<2009 # Moy Éc.ty. min Max
Tout y compris NA 5 660 2 487 3 315 .4
32 615 qualn<5 5 352 2 478 3 280 4.3
qualn<4 4 397 2 783 3 442 9.1
qualn<3 1 364 5 305 3 366 637 27 359 qualn<2 818 6 385 3 695 1 404
I
Restreint beaucoup l’échantillon
I Les états qui tiennent bien les comptes pourraient être ceux qui font plus d’effort sur les émissions
I Biais de sélection
I Les résultats sont-ils sensibles à la qualité des données ?
Échantillons
I
Cfr papier : Sélection préalable
I "118 countries for which information from 1970 to 2008 was available"
I “Cylindrage” du panel - quelle justification ?
I
Les pays sont regroupés dans différents sous-ensembles
I peu explicites dans le papier
I La question principale est de voir si différents sous-ensembles ont des convergences différentes
I En supposant qu’il y ait convergence dans le temps
Échantillons
I
NOIL
I tous les pays de l’échantillon sauf les gros producteurs de pétrole
I
INTER - ok (je crois)
I tous les pays de l’échantillon sauf
I ceux de moins d’un million d’habitants
I les données douteuses selon EPWT (qualn)
I
OECD - ok
I
ASIA - ok
I
LAC
I pays d’Amérique Latine / Caraïbe
Régression dans Stata
I
Principe englobant
I Du modèle général vers le plus restrictif
I
Modèle + général : effets fixes
I Estimateur Within
I Estimateur Diff1ere
I
Second modèle : effets aléatoires
I
Modèle plus restrictif : MRL
I Estimateur MCO
I Estimateur Between
Estimateur Within
I
Stata présente un intercept - pourquoi ?
I
Stata réécrit le modèle 3
yit =↵i +xit0 +✏itcomme
yit =↵+↵i+xit0 +✏itI Cela amène la multicollinéarité
I
Il faut normaliser
I Dans la théorie, on a pris↵=0 pour simplifier la notation
I Stata prendP
i↵i =0 par analogie avec l’hyp. EA : E(↵i) ↵=0
I Dans aucun cas, cela n’a de conséquence sur les estimations de
Estimateurs D1, EA
I
Diff. 1
eresI Pas disponible directement dans Stata
I Construire les Diff. 1eres puis appliquer MCO
I Retards 1 période dans Stata :by idn : gen lnem1 = lnem[_n-1]
I nindice les observations,by idnindique de retarder par individu
I Ensuiteby idn : gen lnemD1 = lnem-lnem1
I Par conséquent : intercept nul en théorie
I
EA : 2 versions
I GLS = MCG faisable comme présenté plus avant
I ML = maximum de vraisemblance
I Je ne détaille pas - on laisse tomber
Estimateurs MCO, Between
I
Between - directement dans Stata
I Nombre d’observations réellement utilisées = nombre de groupes
I
MCO
I Utiliser la commande/menuregress
Estimations
I
Rappel du modèle 15 :
ln
✏t2 =ln
✏t1+ 1ln
s + 2ln
n+⇡t+✓i+⌫itI Le paramètre d’intérêt est⇢= 1 5ln
I indique la vitesse de cvgce à l’ES
I C’est le modèle “conditionnel”
I Le modèle ln✏t2= ln✏t1+⇡t+✓i+⌫it est dit “absolu”
I Il n’est pas clair si les auteurs mettent des dich. de temps dans tous les modèles
I
calculs dans do file 20160727CvgceCO2.do
I Ne pas double-cliquer, sinon exécute tout d’un coup