Économétrie des Données de Panel

(1)

Économétrie des Données de Panel

Ch 1. Modèles Linéaires Non Dynamiques

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques Économiques M1 RISE Gouvernance des Risques Environnementaux

2016 – 2017

(2)

Next year (2016/17) improvements : Present starting from FE,

then get more restricted. Discuss the Breushc Pagan test & the

usefulness of testing Het & autocrrel

(3)

Plan du Ch 1

Les données de panel Modèles à Données de Panel

Eﬀets Fixes & Eﬀets Aléatoires Estimateurs pour données de panel

Eﬃcience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO₂

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO₂ Eﬀets Fixes vs. Eﬀets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(4)

Sommaire

Les données de panel

Modèles à Données de Panel Estimateurs pour données de panel Inférence en données de panel Eﬀets Fixes vs. Eﬀets Aléatoires

Données de panel non-cylindré (Unbalanced)

(5)

Les données de panel

I i =

1

, ...,N

: agent (individu, firme, pays...)

I t =

1

, ...,T

: temps

I En généralTi : nombre de périodes diﬀère d’agent à agent

I Panel “non-cylindré” (unbalanced)

I Attrition, on y reviendra en fin de chapitre

I Pour simplifier la notation, la théorie utiliseT

I Les logiciels gèrentTi

I yit

une observation de la variable

dépendantey

I xit

une observation du vecteur

K ⇥

1 des variables

indépendantes

I “régresseurs”

I Possiblement endogènes – Ch. 2

(6)

Organisation des données

obs agent

i

temps

t y x₁ . . . xK

1 1 1

y₁₁ x₁₁₁ xK11

... ...

t 1 t

y_1t x_11t xK1t

... ...

T 1 T

y_1T x_11T x_K1T

T+1 2 1

y₂₁ x₁₂₁ x_K21

... ...

it i t

yit x_1it xKit

... ...

NT N T

yNT x_1NT xKNT

(7)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel Inférence en données de panel Eﬀets Fixes vs. Eﬀets Aléatoires

Données de panel non-cylindré (Unbalanced)

(8)

Modèles & Estimateurs

I

Plus grand choix de modèles et d’estimateurs qu’avec les coupes transversales

I

3 modèles standards dans la présente Section

I 5 estimateurs dans la prochaine Section

I On fera cette distinction modèle / estimateur dans chaque chapitre

I

Chaque estimateur “peut” être appliqué à chaque modèle

I Avec des résultats divers

I On ne sait jamais quel modèle s’applique

I Table 5x3 des propriétés des estimateurs dans chaque modèle

(9)

Modèle Général

I

Le modèle linéaire le plus général pour un panel

I intercept & pentechangent suri& t y_it =↵_it+x_{it it}⁰ +u_it

I u_it un élément scalaire du vecteur du terme d’erreuru

I

Identification des paramètres

I Est-il possible de les estimer ?

I

Ce modèle

yit =↵it+x_{it it}⁰ +uit

est trop général

I Nonestimable : + de paramètres à estimer que d’observations

I Restrictions supplémentaires requises sur

I la manière dont↵itet itvarient aveci &t

I le comportement de l’erreuruit

(10)

Modèle 1. MRL - Modèle de régression linéaire classique

I

Le modèle le + restricif

I impose descoeﬃcients constantsentre i

yit =↵+x_it⁰ +uit

(1)

I

Si ce modèle est le bon (correctement spécifié)

I et si les régresseurs ne sont pas corrélés à l’erreur

I Alors il pourra être estimé, de façon consistante, comme une coupe transversale

(11)

Dichotomiques Individuelles et Temporelles

I

Une variante simple du MRL (1)

I Interceptsqui changent entre individus et entre période

I Mais pas les deux à la fois

I Pentes constantes

yit =↵_i+ t+x_it⁰ +uit

(2) ou

yit =

XN j=1

↵_jdj,it+ XT s=2

sds,it+x_it⁰ +uit

où les

N

dichotomiques individuelles

dj,it=

1 si

i =j

&

=

0 sinon

les

T

1 dichotomiques temporelles

ds,it =

1 si

t =s

&

=

0 sinon

(12)

Données de panel avec dichotomiques

obs i i=1 . . . i=N t t=1 . . . t=T 1 y x₁ . . . xK

1 1 1 0 1 1 0 y11 x111 x_K11

... ...

t 1 1 0 t 0 0 y_1t x_11t xK1t

... ...

T 1 1 0 T 0 0 y_1T x_11T xK1T

T+1 2 0 0 1 1 0 y₂₁ x₁₂₁ x_K21

... ...

it i 0 0 t 0 0 yit x_1it x_Kit

... ...

NT N 0 1 T 0 0 y_NT x_1NT x_KNT

(13)

Dichotomiques Individuelles et Temporelles

I xit

n’inclut pas d’intercept

I Si on en met un

I alors une desNdichotomiques individuelles doit être retirée

I Beaucoup de logiciels font ça

I

Focus sur les

panels courts

où

N ! 1

mais pas

T

I Alors (coef. des dich. temp.) peuvent être estimés de façon consistante

I Au moins au sens où il y a un nombre fini de ces dich. temp.

I T 1 dich. temp. sont simplement incorporées aux régresseursxit

I Par contre, si on insérait l’ensemble desNdich. individuelles dj,it

I Ça poserait un problème lorsqueN! 1

I On ne peut estimer de façon consistante un nombre1de paramètres

I L’information ne croît pas sur↵i lorsqueNcroît I

Challenge : estimer les paramètres

I en contrôlant pour lesN dich. indiv.↵_i

(14)

Sommaire

(15)

Modèle à Eﬀets Individuels

I

Chaque agent

i

a son intercept, mais toutes les

pentes

sont les mêmes entre agents

yit =↵_i+x_it⁰ +✏_it

(3)

où

✏it

est iid sur

i

et

t

I

= une façon plus parcimonieuse d’exprimer le précédent modèle (2)

I Les dic. temp. sont incluses dans les régresseursx_it

I C’est le modèle linéaire, non-dynamique, à données de panel

“standard”

I ↵i variables aléatoires

I Capture hétérogénéité inobservéeinvariante dans le temps

I = caractéristiques individuelles inobservées

I En fait : un modèle à paramètres aléatoires

(16)

Rappel : l’hétérogénéité inobservée

I

Modèle correct :

Y = ₀+ ₁x₁+ ₂x₂+✏

I

Modèle estimé :

Y = ₀+ ₁x₁+⌫

I

L’eﬀet du régresseur manquant

x₂

sur

Y

est implicite dans le terme d’erreur du modèle estimé :

⌫ = ₂x₂+✏

I = hétérogénéité inobservée : Des facteurs (individuels) inobservés influent surY

I

Si

x₂

n’est pas corrélé avec

x₁

I Pas de souci

I

Si

x₂

est corrélé avec

x₁

,

I l’erreur⌫ est corrélée avec x₁

I MC inconsistant

(17)

Rappel : l’hétérogénéité inobservée

Mêmes pentes

(18)

Exogénéité

I

Dans ce Ch. 1 : on assume

l’exogénéité forte/stricte

E[eit|ai,xi1, ...,xiT] =

0,

t =

1, ...,

T

(4)

I

C’est-à-dire : hypothèse que

✏_it

I Espérance de zéro conditionnellement aux valeurs passées, présentes et futures des régresseurs

I Équivalent à zéro covariance

I Rien n’est supposé entre la variable aléatoire↵_i et les régresseursx_i

I

Exclut des modèles avec une variable dépendante retardée

I Pas dey_{i(t s)} dans x_it = Modèledynamique

I Commey_it ₁=↵_i+x_it⁰ ₁ +✏_it ₁ : il est diﬀcile d’aﬃrmer queE(✏_it✏_it ₁) =0

I Et aussi avec des régresseurs endogènes (Ch. 2)

(19)

Modèle à Eﬀets Fixes

I

2 variantes du modèle (3)

selon hyp. sur

↵_i

I Toutes deux ont “2” erreurs↵i et✏it I Modèles à erreurs composées

I Toutes deux traitent ↵_i comme une v.a. inobservée

I

Variante 1 : modèle à

eﬀets fixes

(EF)

I ↵i estcorréléavec (la partie invariante au temps) des régresseurs observésx_it

I C’est une forme d’hétérogénéité inobservée

I “fixe” parce que, anciennement,↵i était traité comme un paramètre (non-aléatoire) à estimer

(20)

Modèle à Eﬀets Aléatoires

I

Variante 2 : modèle à

eﬀets aléatoires

(EA)

I ↵_i distribué indépendamment dex

I Habituellement, assume de plus que les eﬀets aléatoires↵_i et les termes d’erreurs✏_it dans (3) sont iid :

↵_i ⇠ ↵, ²_↵

✏_it⇠ 0, ²✏ (5)

I

Pas d’hyp. sur la distribution de ces v.a. dans (5)

I ✏it

peut présenter de l’autocorrélation

I Souvent, il est supposé quecov(✏_it,✏is)6=0

I Mais aussi quecov(✏it,✏jt) =0 etcov(↵i,↵j) =0

I Sauf dans les modèles spatiaux

I

Dans le modèle EA,

↵

est vu comme l’intercept

(21)

Autres noms des modèles EF/EA (3)

I

Modèle à eﬀets individuels une voie (One-way)

I

Deux voies (Two-way) = inclusion de dich. de temps ou d’eﬀets aléatoires de temps

I

Modèle à intercept aléatoire

I Pour distinguer de modèles plus généraux, p.e. à pentes aléatoires

I

Modèles à composants aléatoires

(22)

Modèle EA équicorrélé

I

Le modèle EA

yit=↵_i +x_it⁰ +✏_it

I peut être vu comme la régression deyit surxit I avec erreur composéeuit=↵i+"it

I Les hyp. EA usuelles (5) (↵i et✏_it iid) impliquent que Cov[(ai +eit),(ai+eis)] =

⇢ sv²_a, t 6=s

sv²_a+sv²_e, t =s

(6)

I

Le modèle EA impose donc que l’erreur composée

uit

soit

équicorrelée

I CarCor[u_it,u_is] = _↵²/[ _↵²+ ²_"]pourt 6=s ne change pas avec la duréet s

I Le modèle EA est aussi appelé équicorrélé ou à erreurs interchangeables

(23)

Synthèse des modèles à données de panel

MRL (1)

yit =↵+x_it⁰ +uit uit ⇠

0

, _u²

EF

(3)

Cov(↵i,xit)6=

0 EA

↵_i ⇠ ↵, ²_↵

✏it ⇠

0,

_✏²

(5)

I

Ces 3 modèles supposent l’hétérogénéité stricte 4

I D’autres modèles panel existent, en particulier dynamiques

(24)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel Eﬀets Fixes vs. Eﬀets Aléatoires

Données de panel non-cylindré (Unbalanced)

(25)

Introduction

I

Il y a 5 estimateurs utilisés couramment pour en données de panel

I Dans ce contexte non-dynamique, sans endogénéité : variantes MC

I

Diﬀèrent selon leurs utilisations des variations transversales (entre

i

) et temporelles

I Leurs propriétés dépendent de quel est le modèle approprié (MRL - EF - EA)

I

Un régresseur

xit

peut être soit

I invariant dans le temps,x_it=x_i pour t=1, ...,T ,

I ou variable dans le temps

I Certains estimateurs ne peuvent identifier que les coeﬃcients des régresseurs variables dans le temps

I

On va voir les estimateurs du plus simple au plus complexe

I On regarde la consistance et l’eﬃcience

(26)

Sommaire

(27)

Eﬃcience des Estimateurs

I

L’eﬃcience n’est pertinente que pour les estimateurs consistants

I

L’eﬃcience est la précision de l’estimateur

I Essentiellement l’inverse de sa matrice de var-cov⌃_ˆ

I Qui donc dépend de la matrice de var-cov des erreurs⌃u

(28)

Hypothèses sur les erreurs

I

Les modèles à données de panel ont diﬀérents types d’erreur

I uit pour MRL

I ↵i+"it pour EF et EA

I

Dans beaucoup d’applications de microéconomie

I raisonnable de supposer indépendance entrei

I Sauf en spatial

I Pas le cas en macro

I

Toutes ces erreurs sont potentiellement

1. Autocorrélées (corrélées surt pour un certaini )

I Corrélation sérielle, temporelle 2. Hétéroscédastiques entre lesi

I

L’inférence (tests) stat. valide requiert de prendre en compte ces caractéristiques

I Section suivante

I Dans cette section-ci

I structure de la mat. de var-cov des erreurs

I Eﬃcience

(29)

Matrice ⌃

u

de variance-covariance des erreurs en panel

I

Sans distinguer entre les trois modèles

I On écrit l’erreur du modèleu_it

I Peut être↵i+✏it ou pas I

Entre

i

on a

Cor[uit,ujs] =

0

I pouri 6=j ett=ou6=s

I

Pour un certain

i

I Cor[u_it,u_is] = _its : corrélation quelconque dans le temps

I t =s, its = ²_it : hétérocédasticité quelconque

I

Ça donne la matrice var-cov des erreurs

⌃u

suivante

(30)

Matrice ⌃

u

bloc-diagonale de var-cov des erreurs panel

0 BB BB BB BB BB BB BB BB BB BB BB

@

sv²₁₁ sv112 · · · sv11T

sv²₁₂ ... ... ... ... ... sv_1(T _1)T

SYM · · · sv²_1T

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv²_N1 svN12 · · · svN1T

sv²_N2 ... ...

... ... ... sv_N(T _1)T

SYM · · · sv²_NT

1 CC CC CC CC CC CC CC CC CC CC CC A

(31)

Modèle EA

I

Le modèle EA met plus de structure dans la matrice

⌃u I

Modèle EA

yit =↵_i +x_it⁰ +✏_it

avec

I ↵_i iid (donc non-corrélés àx_it)

I ✏_it iid

I Corrélations comme dans l’hyp. EA (5)

↵i ⇠ ↵, ²_↵

✏it⇠ 0, ²✏ I

La matrice

⌃u

prend la forme suivante

(32)

0 BB BB BB BB BB BB BB BB BB BB BB B@

sv²_a+sv²_e sv²_a · · · sv²_a

sv²_a sv²_a+sv²_e ... ... ... ... ... sv²_a

sv²_a · · · sv²_a sv²_a+sv²_e

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv²_a sv²_a+sv²_e ... ... ... ... ... sv²_a

1 CC CC CC CC CC CC CC CC CC CC CC CA

(33)

En mots

I

La matrice s’organise en blocs carrés autour de la diagonale principale

I

Chaque carré tient en 2 chiﬀres

I Hors de sa diagonale principale, une corrélation entre périodes

2↵

I la même pour tous lesi

I Sur sa diagonale principale, une variance ²↵+ _✏² homoscédastique

I

Entre diﬀérentes

i

, toutes les corrélations sont nulles

I Hors des blocs diagonaux

(34)

Sommaire

(35)

Estimateur MCO

I

MCO estime

↵

et dans

yit=↵+x_it⁰ +uit I

MCO est

consistant

(pour

N ! 1

, t constant) si

I Cov[uit,xit] =0 et

I MRL (1) est approprié, ou si

I EA est approprié

I

La mat

⌃u

n’est pas diagonale

I MCO ineﬃcient

I

L’estimateur MCO de la matrice

⌃ˆ ˆ2(X⁰X) ¹

est

biaisé

I

MCO est inconsistant si EF est approprié

I Ré-écrire EFy_it =↵_i+x_it⁰ +✏_it comme y_it =a+x_it^�b+ (a_i−a+e_it)

I Donc l’erreur MCO,uit=↵i ↵+✏it, est corrélé àxit par↵i

(36)

Estimateur Between

I

Étapes

1. Prendre les moyennes sur le temps par individu

I y¯i = 1 T

XT t=1

yit, idem pourx¯i

2. Estimer par MCOy¯i =↵+ ¯x_i⁰ + ¯"i

I Régressery¯i sur un intercept et le vecteur¯xi

I

Pour estimer , MCO utilise toutes les données

I Donc les variations à la fois sur le temps et en transversal

I

Between n’utilise que les variations transversales

I Entre(between)diﬀérents individus

I Analogue à une régression en coupe transversale

I Les variations internes(within)à chaque individu sont écartées

(37)

Propriétés de l’estimateur Between

I

Le modèle implicite derrière l’estimateur between est

¯

yi =↵+ ¯x_i⁰ +ui i =

1, ...,

N

(7)

I

Between est consistant si les régresseurs

x¯i

sont indépendants de l’erreur

ui

I C’est le cas pour le MRL (1)

I Si par contre le modèle est à erreurs composées (3) yit=↵i+x_it⁰ +✏it

I Alors,ui = (↵i ↵+ ¯✏i)

I Dans EA,↵i est indépendant de x

I Donc Between est consistant pour EA

I Dans EF,↵i est corrélé àx_it et donc àx¯_i

I Between est donc inconsistant

(38)

Propriétés de l’estimateur Between

I

Between gaspille beaucoup d’informations

I C’est un estimateur didactique

I Ne pas l’utiliser dans vos applications

I

Sans regarder formellement

I between est très ineﬃcient à cause du gaspillage d’information

(39)

Sommaire

(40)

Estimateur Within

I

Principe : Les

déviations

individuelles de la variable dépendante de ses moyennes temporelles

I sontexpliquées par

I lesdéviationsindividuelles des régresseurs de leurs moyennes temporelles

I

Soit le modèle à eﬀets individuels 3

yit =↵i +x_it⁰ +✏it

I Prendre le moyenne surt :y¯i=↵i+ ¯x_i⁰ + ¯"i

I Soustraire :les termes ↵i s’annulent = la transformation within

yit y¯i = (xit x¯i)⁰ + (✏it ¯✏i)

1

, ...,N, t =

1

, ...,T

(8)

(41)

Estimateur Within

I

Estimateur Within = MCO sur les données transformées

yit y¯i = (xit x¯i)⁰ + (✏it ¯✏_i)

I Comme↵i a disparu par diﬀérence, Within est consistant dans EF, EA et MRL

I En tout cas quand l’hyp d’exogénéité forte tient

I

Within est aussi appelé estimateur Eﬀets Fixes

I

Chaque

i

doit être observé au moins

deux fois

dans l’échantillon

I sinonxit x¯i =0

(42)

Consistance de l’estimateur Within / Eﬀets Fixes

I

Within traite

↵_i

comme des paramètres dits

nuisance

I que l’on peut ignorer si notre intérêt porte sur les pentes

I qui n’ont pas besoin d’être estimés de façon consistante pour obtenir une estimation consistante des

I Ce résultats ne se propage généralement pas aux modèles non-linéaires

I

La consistance requiert plus précisément

E(✏it ¯✏i|xit x¯i) =

0 dans le modèle transformé

yit y¯i = (xit x¯i)⁰ + (✏it ¯✏_i)

I À cause des moyennes, cela exige plus queE(✏it|xit) =0

I Il faut l’exogénéité stricte (4)

E[eit|ai,x_i1, ...,xiT] =0, t =1, ...,T

(43)

Estimations des eﬀets fixes

I

Si les eﬀets fixes

↵_i

sont d’intérêt , ils

peuvent

être estimés par

↵ˆ_i = ¯yi x¯_i⁰ˆ

I Cet estimateur de↵_i non-biaisé

I Dans des panels courts (petitT), cet estimateur est inconsistant

I Parce que l’information ne s’accumule pas (T ne croît pas)

I Par contre, la distribution des↵ˆi, par rapport à une variable clef ou pas, peut être informative

I

Si

N

n’est pas trop grand, une alternative pour estimer Within est l’estimateur

MC à dichotomiques

I On définitNdich.d_i, une par individu, d_i =1 pouri

I Ensuite, estimery_it=X

i

↵_id_i+x_it⁰ +✏_it par MCO

I Régression deyit surxit etNdich. individuelles

I Cela produit l’estimation Within pour , ainsi que les estimations desN eﬀets fixes

I Dans les limites des capacités de l’ordinateur

(44)

Within et les régresseurs invariants dans le temps

I

Une limitation majeure de Within

I les coeﬃcients des régresseurs invariants dans le temps ne sont pas identifiés

I Puisque sixit=xi alorsx¯i=xi et(xit x¯i) =0

I

Beaucoup d’études ont précisément pour objet des régresseurs invariants dans le temps

I P.e. les eﬀets du genre ou de l’origine ethnique sur le salaire

I

Pour cette raison, des praticiens évitent d’utiliser within

I

MCO et l’estimateur Eﬀets Aléatoires (ci-dessous) permettent d’estimer ces coeﬃcients

I mais sont inconsitants si EF est le modèle approprié

I On verra un estimateur qui permet parfois de les identifier

(45)

Estimateur diﬀérences premières

I

Principe : Les changements individuels

d’une période à l’autre

de la variable dépendante

I sont expliqués par

I les changements individuelsd’une période à l’autredes régresseurs

I

Soit le modèle à eﬀets individuels (3)

yit =↵i+x_it⁰ +✏it

I retarder d’une périodeyi,t 1=↵i+x_i,t⁰ ₁ +"i,t 1 I Soustraire = la transformationdiﬀérences premières

yit yi,t 1 = (xit xi,t 1)⁰ + (✏it ✏i,t 1)

i =

1

, ...,N, t=

2

, ...,T

(9)

(46)

Estimateur diﬀérences premières

I

L’estimateur diﬀérences premières (D1) est MCO appliqué à la transformation diﬀérences premières (9)

I

Cet estimateur est

consistant

pour dans tous les modèles

I Pour les mêmes raisons que Within

I Pareillement, les coeﬃcients des régresseurs invariants dans le temps ne sontpas identifiés

I

D1 est

moins eﬃcient

que within

I si"it est iid (pourT >2)

I car une période d’obsevation est écartée

I

Cependant, D1 peut préserver contre des variables I(1)

I Qui amènerait sinon à des résultats spurieux

(47)

Eﬃcience des estimateurs pour EF

I

Ces estimateurs font peu d’hypothèses sur la structure du terme d’erreur

I

Leur eﬃcience n’est généralement pas discutée

I Car la priorité est l’estimation consistante

(48)

Sommaire

(49)

Rappel du modèle EA

I

Modèle à eﬀets individuels (3)

yit=↵i +x_it⁰ +✏it

avec

I ↵i iid (donc non-corrélés àxit)

I ✏it iid

I Corrélations comme dans l’hyp. EA (5)

↵_i ⇠ ↵, ²_↵

✏it⇠ 0, ²_✏

I

Dans ce cas, MCO consistant (car

↵_i

non-corrélés à

xit

)

I MaisMoindres Carrés Généralisés MCGseraplus eﬃcient

(50)

Rappel : MCG en coupe transversale

I

Quand toutes les hyp. du modèle linéaire sont satisfaites

I sauf que la matrice var-cov⌃des erreurs n’est pas l’identité, alors

I MCO consistant

I mais pas eﬃcient (Gauss-Markov ne s’applique plus)

I Si on connait⌃, on peut retrouver l’eﬃcience

I

Soit le MRL en coupe transversale

y=x⁰ +✏

avec

E⇣

✏✏⁰⌘

=⌃6= ²I

I On peut montrer qu’il existe toujoursP telle queP⁰P=⌃ ¹

I Décomposition de Cholesky, non-unique pour les matrices réelles sdp

I Prémultiplier le modèle linéaire parP :Py =Px +P✏

I y^⇤=x^⇤ +✏^⇤

I AlorsVar(✏^⇤) =E⇣

P✏✏⁰P⁰⌘

=PE⇣

✏✏⁰⌘ P⁰

I =P⌃P⁰ =P⇣

P⁰P⌘ 1

P⁰ =PP ¹⇣ P⁰⌘ 1

P⁰ =I

(51)

Rappel : MCG en coupe transversale

I

Donc, le modèle transformé a des erreurs dites

sphériques

I Donc, MCO sur les données transformées esteﬃcient

I C’est MCG

I

En pratique,

⌃

est inconnue, il nous en faut un estimateur consistant

I Tout estimateur consistant de⌃,⌃, définit l’estimateur MCGˆ faisables (consistant)

I

En panel, le modèle EA implique une matrice

⌃

comme dans la diapo suivante

I Comme détaillé précédemment

(52)

Matrice ⌃ bloc-diagonale de var-cov des erreurs panel EA

0 BB BB BB BB BB BB BB BB BB BB BB

@

sv²_a sv²_a+sv²_e ... ... ... ... ... sv²_a

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv²_a sv²_a+sv²_e ... ... ... ... ... sv²_a

1 CC CC CC CC CC CC CC CC CC CC CC A

(53)

Estimateur EA

I

On appelle estimateur EA l’estimateur MCG

I dans lequel la matrice⌃des erreurs est celle de la diapo précédente

I

La version

faisable

de cet estimateur est MCO

I appliqué aux données transformées de la façon suivante : yit ˆ ¯yi =⇣

1

ˆ⌘

µ+⇣

xit ˆ ¯xi

⌘⁰

+⌫_it

(10) où

⌫_it = (1 ˆ)↵i+ ("it ˆ ¯"_i)

est asymptotiquement iid, et

I ˆ

est un estimateur consistant pour

=

1

p ₂ ^✏

✏ +T _↵²

(11)

(54)

Estimateur EA

I

On ajoute l’intercept (non-aléatoire) scalaire

µ

afin de normaliser les eﬀets aléatoires

↵_i

à une espérance nulle

I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)

I C’est-à-direµcorrespond à↵dans (5)

I

La dérivation de cet estimateur (10) et des manières d’estimer

2↵

et

²_"

, et donc ,

I sont détaillés dans Cameron & Trivedi

I

Remarque

I ˆ =0 correspond à l’estimateur MCO

I ˆ =1 correspond à l’estimateur within

I ˆ!1 lorsqueT ! 1(regardez la formule)

I

Il s’agit d’un estimateur en deux étapes de

1. estimer

2. estimer à partir des données transformées

(55)

Propriétés de l’estimateur EA

I Consistant

et

eﬃcient

si le modèle EA est le bon

I Le gain d’eﬃcience par rapport à l’estimateur MCO n’est pas nécessairement élevé

I Probablement ineﬃcient

si l’hypothèse d’équicorrélation n’est pas vraie

I Dans un processusAR(1)

I Si le MRL est le bon

I Inconsistant

si le modèle EF est le bon car alors

↵i

est corrélé

avec

xit

(56)

Sommaire

(57)

Discussion sur EA et EF

I

La plupart des disciplines de stat appliquées

I traitent l’hétérogénéité inobservée (individuelle)↵_i comme distribuée indépendamment des régresseurs

I Sauf la microéconométrie I

Cette hyp d’indépendance

I a l’avantage de permettre une estimation consistante de tous les paramètres

I y-compris ceux invariants dans le temps

I si l’hyp est vraie

I est souvent considérée par les économistes commenon supportée par les données

I

Les deux modèles ont des intérêts distincts

I EA : Précise la structure temporelle!Eﬃcience

I EF : Endogénéité de l’hétérogénéité inobservée!Consistance

(58)

Prédictions et eﬀets individuels

I

Le modèle est

yit=↵_i +x_it⁰ +✏_it

aussi bien pour EA que pour EF

I L’eﬀet individuel↵_i est une v.a. dans les deux modèles

I

On prend l’espérance conditionnelle aux régresseurs

I E[yit|xit] =E[↵i|xit] +x_it⁰

I Que peut-on en dire ? (prochaine dia)

(59)

Prédictions et eﬀets individuels

I

Dans le modèle EA, il est

supposé

que

E[↵i|xit] =↵

I DoncE[y_it|x_it] =↵+x_it⁰

I Si EA est le bon modèle,↵peut être estimé de façon consistante

I Donc on peut prédireyit parE[yit|x^it]

I

Dans EF,

E[↵i|xit]

varie avec

xit

et on ne sait pas comment

I C’est raisonnable car↵i comprend des characteristiques inobservées

I DoncE[yit|xit]ne peut être identifié :pas de prédiction

I Malgré cela, on peut estimer les de façon consistante

I Et donc les eﬀets marginaux sont identifiés

=@E[yit|↵i,xit]/@xit

I Par exemple, l’eﬀet d’un changement de population sur les émissions

I Mais seulement pour les régresseurs variant dans le temps

(60)

Résumé estimateurs et modèles linéaires communs pour panel

Modèle

Estimateur de MRL (1) EA (3) & (5) EF (3) MCO (1) Consistant Consistant Inconsistant Between (7) Consistant Consistant Inconsistant Within (EF) (8) Consistant Consistant Consistant D1 (9) Consistant Consistant Consistant EA (10) Consistant Consistant Inconsistant Cette table ne considère que la consistance des estimateurs de

I

L’estimation des

↵_i

est toujours inconsistante, sauf lorsque

↵i =↵8i

.

Le seul estimateur eﬃcient est EA lorsque le bon modèle est aussi

EA.

(61)

Sommaire

(62)

Émissions de CO

₂

I

Convergence dans ce contexte est 2 choses

1. Dans le temps vers un “État stationnaire” (Steady State)

I Non testé ici

2. En supposant la convergence dans le temps,

I Des groupes de pays convergent-ils à la mêmevitesse

I C’est ce qui est testé ici

I

Importance de la convergence lors de négociations internationales

I Si les émissions tendent à se rapprocher entre pays ou non

I les négociations ne sont pas les mêmes

I Émissions par habitant ou par travailleur eﬀectif, pas au total

I

On peut essayer de comprendre les diﬀérences entre vitesse de convergence

I Technologie ? Politique ? Ressources naturelles ? Niveau de développement ?

(63)

Théorie en état stationnaire

I

La croissance du stock de capital est déterminée par

I la croissance de la populationn

I le taux d’épargnes

I le progrès techniqueg (paramètre inconnu)

I un paramètre exogène de dépréciation

I Les auteurs posentg+ =.05, constant

I On ne va pas explorer cette question, on oublie

I

Il est supposé que les émissions per capita

E/L

croissent de la même manière que le stock de capital

I Ceci permet d’obtenir une équation pour les émissions en état stationnaire

ln(E/L) =lnA+ t+↵ln

✓ s n+g+

◆

(12)

I Aest le niveau technologique

I permettra de définir une constante pays-spécifique

(64)

Dynamique

I

L’économie n’est pas à l’état stationnaire

I

Soit

I ✏^⇤ les émissionsE/Là l’état stationnaire

I ✏les émissions à l’instantt

I

L’équation de convergence dans le temps est

d

ln

✏_t

dt =⇢[ln✏^⇤

ln

✏_t]

(13)

I Équation diﬀérentielle

I Dit essentiellement que le mouvement vers l’état stationnaire est une proportion de la distance actuelle

I Théorie sans fondement empirique, l’existence même d’un état stationnaire n’étant pas certaine

I Résolution (intégration)

ln✏_t2= 1 e ^⇢⌧ ln✏^⇤+e ^⇢⌧ln✏_t1 (14)

(65)

Dynamique

I

En substituant

✏^⇤

selon l’équation 12 dans la solution 14

I et en notant =e ^⇢⌧, on a

ln

✏_t2 = (1 )↵

ln

⇣

s n+g+

⌘+ (1 )A+g(t₂ t₁) +

ln

✏_t1

I

Le progrès technologique

g(t₂ t₁)

I modélisé (ad hoc) comme un jeu de dummies temporelles de coeﬃcients⇡t

I

Les diﬀérences de technologie

A

entre pays

I donnent naissance à des intercepts par pays✓_i

I

Il est supposé que

I les coeﬃcients de lns et de ln(n+g+ )peuvent être diﬀérents

I commeg + =0.05 par faute de données, on n’a ques etn

(66)

Modèle estimé

I

Le modèle opérationnel est donc

ln

✏_t2 =

ln

✏_t1+ ₁

ln

s+ ₂

ln

n+⇡_t+✓_i+⌫_it

(15)

I Le paramètre d’intérêt est⇢= 1 5ln

I Puisque ce paramètre indique la vitesse de convergence vers l’état stationnaire selon eq. 13

I Modèle dynamique par la présence de✏t1 I que l’on traite en statique dans ce chapitre

I Les régresseurs lns et lnn

I aident à limiter (“contrôler”) l’hétérogénéité inobservée

I Il pourrait y en avoir d’autres : prix du pétrole, température en hiver...

(67)

Penn World Table PWT

I

Jeu de données

I maintenu conjointement par des chercheurs de

I U Californie à Davis

I Growth Development Centre de U Groningen

I Données de comptes nationaux

I PIB réel au cours du temps

I dans 189 pays dans la version utilisée (7)

I Non-cylindré 1950-2009

I Semblables à celles de la Banque Mondiale

I Plus long pour certains pays

I Beaucoup moins de variables I

“Extended Penn World Tables” EPWT

I Ajoute quelques variables et change certaines définitions

I Émissions nationales deCO₂

I Combustion de combustibles fossiles, fabrication de ciment et rejet de gaz naturel

I “CO2pur” vs. “CO2 - équivalent”

(68)

Retard

I

Le retard considéré est 5 ans

I Pour un eﬀet long terme selon les auteurs

I ⌧=t2 t1=5ans

I Diﬀérents⌧ influencent-ils les résultats ?

I Les données post 2005 ne sont pas dans la EPWT pour plusieurs pays

(69)

Stata

I

Charger les données

I .dta : double-click

I capacité d’import très limitée : .csv

I pas de méta-donnée

I

Suivre le fichier 20160727CvgceCO2.do

I

Ci-dessous

I présentation des données

I Graphique temporel par pays

I menu graphics!panel data line plots

(70)

(71)

(72)

(73)

(74)

(75)

(76)

(77)

(78)

(79)

I

Var. qualn

I NA, 4, 3, 2, 1

I summarize em if (qualn<4)&(year<2009)

year<2009 # Moy Éc.ty. min Max

Tout y compris NA 5 660 2 487 3 315 .4

32 615 qualn<5 5 352 2 478 3 280 4.3

qualn<4 4 397 2 783 3 442 9.1

qualn<3 1 364 5 305 3 366 637 27 359 qualn<2 818 6 385 3 695 1 404

I

Restreint beaucoup l’échantillon

I Les états qui tiennent bien les comptes pourraient être ceux qui font plus d’eﬀort sur les émissions

I Biais de sélection

I Les résultats sont-ils sensibles à la qualité des données ?

(80)

Échantillons

I

Cfr papier : Sélection préalable

I "118 countries for which information from 1970 to 2008 was available"

I “Cylindrage” du panel - quelle justification ?

I

Les pays sont regroupés dans diﬀérents sous-ensembles

I peu explicites dans le papier

I La question principale est de voir si diﬀérents sous-ensembles ont des convergences diﬀérentes

I En supposant qu’il y ait convergence dans le temps

(81)

Échantillons

I

NOIL

I tous les pays de l’échantillon sauf les gros producteurs de pétrole

I

INTER - ok (je crois)

I tous les pays de l’échantillon sauf

I ceux de moins d’un million d’habitants

I les données douteuses selon EPWT (qualn)

I

OECD - ok

I

ASIA - ok

I

LAC

I pays d’Amérique Latine / Caraïbe

(82)

Régression dans Stata

I

Principe englobant

I Du modèle général vers le plus restrictif

I

Modèle + général : eﬀets fixes

I Estimateur Within

I Estimateur Diﬀ1^ere

I

Second modèle : eﬀets aléatoires

I

Modèle plus restrictif : MRL

I Estimateur MCO

I Estimateur Between

(83)

Estimateur Within

I

Stata présente un intercept - pourquoi ?

I

Stata réécrit le modèle 3

yit =↵_i +x_it⁰ +✏_it

comme

yit =↵+↵_i+x_it⁰ +✏_it

I Cela amène la multicollinéarité

I

Il faut normaliser

I Dans la théorie, on a pris↵=0 pour simplifier la notation

I Stata prendP

i↵i =0 par analogie avec l’hyp. EA : E(↵_i) ↵=0

I Dans aucun cas, cela n’a de conséquence sur les estimations de

(84)

Estimateurs D1, EA

I

Diﬀ. 1

^eres

I Pas disponible directement dans Stata

I Construire les Diﬀ. 1^eres puis appliquer MCO

I Retards 1 période dans Stata :by idn : gen lnem1 = lnem[_n-1]

I nindice les observations,by idnindique de retarder par individu

I Ensuiteby idn : gen lnemD1 = lnem-lnem1

I Par conséquent : intercept nul en théorie

I

EA : 2 versions

I GLS = MCG faisable comme présenté plus avant

I ML = maximum de vraisemblance

I Je ne détaille pas - on laisse tomber

(85)

Estimateurs MCO, Between

I

Between - directement dans Stata

I Nombre d’observations réellement utilisées = nombre de groupes

I

MCO

I Utiliser la commande/menuregress

(86)

Estimations

I

Rappel du modèle 15 :

ln

✏_t2 =

ln

✏_t1+ ₁

ln

s + ₂

ln

n+⇡t+✓i+⌫it

I Le paramètre d’intérêt est⇢= 1 5ln

I indique la vitesse de cvgce à l’ES

I C’est le modèle “conditionnel”

I Le modèle ln✏t2= ln✏t1+⇡t+✓i+⌫it est dit “absolu”

I Il n’est pas clair si les auteurs mettent des dich. de temps dans tous les modèles

I

calculs dans do file 20160727CvgceCO2.do

I Ne pas double-cliquer, sinon exécute tout d’un coup