• Aucun résultat trouvé

Économétrie des Données de Panel

N/A
N/A
Protected

Academic year: 2022

Partager "Économétrie des Données de Panel"

Copied!
161
0
0

Texte intégral

(1)

Économétrie des Données de Panel

Ch 1. Modèles Linéaires Non Dynamiques

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques Économiques M1 RISE Gouvernance des Risques Environnementaux

2016 – 2017

(2)

Next year (2016/17) improvements : Present starting from FE,

then get more restricted. Discuss the Breushc Pagan test & the

usefulness of testing Het & autocrrel

(3)

Plan du Ch 1

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(4)

Sommaire

Les données de panel

Modèles à Données de Panel Estimateurs pour données de panel Inférence en données de panel Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

(5)

Les données de panel

I i =

1

, ...,N

: agent (individu, firme, pays...)

I t =

1

, ...,T

: temps

I En généralTi : nombre de périodes diffère d’agent à agent

I Panel “non-cylindré” (unbalanced)

I Attrition, on y reviendra en fin de chapitre

I Pour simplifier la notation, la théorie utiliseT

I Les logiciels gèrentTi

I yit

une observation de la variable

dépendantey

I xit

une observation du vecteur

K ⇥

1 des variables

indépendantes

I “régresseurs”

I Possiblement endogènes – Ch. 2

(6)

Organisation des données

obs agent

i

temps

t y x1 . . . xK

1 1 1

y11 x111 xK11

... ...

t 1 t

y1t x11t xK1t

... ...

T 1 T

y1T x11T xK1T

T+1 2 1

y21 x121 xK21

... ...

it i t

yit x1it xKit

... ...

NT N T

yNT x1NT xKNT

(7)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel Inférence en données de panel Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

(8)

Modèles & Estimateurs

I

Plus grand choix de modèles et d’estimateurs qu’avec les coupes transversales

I

3 modèles standards dans la présente Section

I 5 estimateurs dans la prochaine Section

I On fera cette distinction modèle / estimateur dans chaque chapitre

I

Chaque estimateur “peut” être appliqué à chaque modèle

I Avec des résultats divers

I On ne sait jamais quel modèle s’applique

I Table 5x3 des propriétés des estimateurs dans chaque modèle

(9)

Modèle Général

I

Le modèle linéaire le plus général pour un panel

I intercept & pentechangent suri& t yit =↵it+xit it0 +uit

I uit un élément scalaire du vecteur du terme d’erreuru

I

Identification des paramètres

I Est-il possible de les estimer ?

I

Ce modèle

yit =↵it+xit it0 +uit

est trop général

I Nonestimable : + de paramètres à estimer que d’observations

I Restrictions supplémentaires requises sur

I la manière dont↵itet itvarient aveci &t

I le comportement de l’erreuruit

(10)

Modèle 1. MRL - Modèle de régression linéaire classique

I

Le modèle le + restricif

I impose descoefficients constantsentre i

yit =↵+xit0 +uit

(1)

I

Si ce modèle est le bon (correctement spécifié)

I et si les régresseurs ne sont pas corrélés à l’erreur

I Alors il pourra être estimé, de façon consistante, comme une coupe transversale

(11)

Dichotomiques Individuelles et Temporelles

I

Une variante simple du MRL (1)

I Interceptsqui changent entre individus et entre période

I Mais pas les deux à la fois

I Pentes constantes

yit =↵i+ t+xit0 +uit

(2) ou

yit =

XN j=1

jdj,it+ XT s=2

sds,it+xit0 +uit

où les

N

dichotomiques individuelles

dj,it=

1 si

i =j

&

=

0 sinon

les

T

1 dichotomiques temporelles

ds,it =

1 si

t =s

&

=

0 sinon

(12)

Données de panel avec dichotomiques

obs i i=1 . . . i=N t t=1 . . . t=T 1 y x1 . . . xK

1 1 1 0 1 1 0 y11 x111 xK11

... ...

t 1 1 0 t 0 0 y1t x11t xK1t

... ...

T 1 1 0 T 0 0 y1T x11T xK1T

T+1 2 0 0 1 1 0 y21 x121 xK21

... ...

it i 0 0 t 0 0 yit x1it xKit

... ...

NT N 0 1 T 0 0 yNT x1NT xKNT

(13)

Dichotomiques Individuelles et Temporelles

I xit

n’inclut pas d’intercept

I Si on en met un

I alors une desNdichotomiques individuelles doit être retirée

I Beaucoup de logiciels font ça

I

Focus sur les

panels courts

N ! 1

mais pas

T

I Alors (coef. des dich. temp.) peuvent être estimés de façon consistante

I Au moins au sens où il y a un nombre fini de ces dich. temp.

I T 1 dich. temp. sont simplement incorporées aux régresseursxit

I Par contre, si on insérait l’ensemble desNdich. individuelles dj,it

I Ça poserait un problème lorsqueN! 1

I On ne peut estimer de façon consistante un nombre1de paramètres

I L’information ne croît pas sur↵i lorsqueNcroît I

Challenge : estimer les paramètres

I en contrôlant pour lesN dich. indiv.↵i

(14)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(15)

Modèle à Effets Individuels

I

Chaque agent

i

a son intercept, mais toutes les

pentes

sont les mêmes entre agents

yit =↵i+xit0 +✏it

(3)

it

est iid sur

i

et

t

I

= une façon plus parcimonieuse d’exprimer le précédent modèle (2)

I Les dic. temp. sont incluses dans les régresseursxit

I C’est le modèle linéaire, non-dynamique, à données de panel

“standard”

Ii variables aléatoires

I Capture hétérogénéité inobservéeinvariante dans le temps

I = caractéristiques individuelles inobservées

I En fait : un modèle à paramètres aléatoires

(16)

Rappel : l’hétérogénéité inobservée

I

Modèle correct :

Y = 0+ 1x1+ 2x2+✏

I

Modèle estimé :

Y = 0+ 1x1+⌫

I

L’effet du régresseur manquant

x2

sur

Y

est implicite dans le terme d’erreur du modèle estimé :

⌫ = 2x2+✏

I = hétérogénéité inobservée : Des facteurs (individuels) inobservés influent surY

I

Si

x2

n’est pas corrélé avec

x1

I Pas de souci

I

Si

x2

est corrélé avec

x1

,

I l’erreur⌫ est corrélée avec x1

I MC inconsistant

(17)

Rappel : l’hétérogénéité inobservée

Mêmes pentes

(18)

Exogénéité

I

Dans ce Ch. 1 : on assume

l’exogénéité forte/stricte

E[eit|ai,xi1, ...,xiT] =

0,

t =

1, ...,

T

(4)

I

C’est-à-dire : hypothèse que

it

I Espérance de zéro conditionnellement aux valeurs passées, présentes et futures des régresseurs

I Équivalent à zéro covariance

I Rien n’est supposé entre la variable aléatoire↵i et les régresseursxi

I

Exclut des modèles avec une variable dépendante retardée

I Pas deyi(t s) dans xit = Modèledynamique

I Commeyit 1=↵i+xit0 1 +✏it 1 : il est diffcile d’affirmer queE(✏itit 1) =0

I Et aussi avec des régresseurs endogènes (Ch. 2)

(19)

Modèle à Effets Fixes

I

2 variantes du modèle (3)

yit =↵i+xit0 +✏it

selon hyp. sur

i

I Toutes deux ont “2” erreurs↵i et✏it I Modèles à erreurs composées

I Toutes deux traitent ↵i comme une v.a. inobservée

I

Variante 1 : modèle à

effets fixes

(EF)

Ii estcorréléavec (la partie invariante au temps) des régresseurs observésxit

I C’est une forme d’hétérogénéité inobservée

I “fixe” parce que, anciennement,↵i était traité comme un paramètre (non-aléatoire) à estimer

(20)

Modèle à Effets Aléatoires

I

Variante 2 : modèle à

effets aléatoires

(EA)

Ii distribué indépendamment dex

I Habituellement, assume de plus que les effets aléatoires↵i et les termes d’erreurs✏it dans (3) sont iid :

i ⇠ ↵, 2

it⇠ 0, 2 (5)

I

Pas d’hyp. sur la distribution de ces v.a. dans (5)

Iit

peut présenter de l’autocorrélation

I Souvent, il est supposé quecov(✏it,✏is)6=0

I Mais aussi quecov(✏it,✏jt) =0 etcov(↵i,↵j) =0

I Sauf dans les modèles spatiaux

I

Dans le modèle EA,

est vu comme l’intercept

(21)

Autres noms des modèles EF/EA (3)

I

Modèle à effets individuels une voie (One-way)

I

Deux voies (Two-way) = inclusion de dich. de temps ou d’effets aléatoires de temps

I

Modèle à intercept aléatoire

I Pour distinguer de modèles plus généraux, p.e. à pentes aléatoires

I

Modèles à composants aléatoires

(22)

Modèle EA équicorrélé

I

Le modèle EA

yit=↵i +xit0 +✏it

I peut être vu comme la régression deyit surxit I avec erreur composéeuit=↵i+"it

I Les hyp. EA usuelles (5) (↵i et✏it iid) impliquent que Cov[(ai +eit),(ai+eis)] =

⇢ sv2a, t 6=s

sv2a+sv2e, t =s

(6)

I

Le modèle EA impose donc que l’erreur composée

uit

soit

équicorrelée

I CarCor[uit,uis] = 2/[ 2+ 2"]pourt 6=s ne change pas avec la duréet s

I Le modèle EA est aussi appelé équicorrélé ou à erreurs interchangeables

(23)

Synthèse des modèles à données de panel

MRL (1)

yit =↵+xit0 +uit uit

0

, u2

EF

yit =↵i+xit0 +✏it

(3)

Cov(↵i,xit)6=

0

EA

i ⇠ ↵, 2

it

0,

2

(5)

I

Ces 3 modèles supposent l’hétérogénéité stricte 4

I D’autres modèles panel existent, en particulier dynamiques

(24)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

(25)

Introduction

I

Il y a 5 estimateurs utilisés couramment pour en données de panel

I Dans ce contexte non-dynamique, sans endogénéité : variantes MC

I

Diffèrent selon leurs utilisations des variations transversales (entre

i

) et temporelles

I Leurs propriétés dépendent de quel est le modèle approprié (MRL - EF - EA)

I

Un régresseur

xit

peut être soit

I invariant dans le temps,xit=xi pour t=1, ...,T ,

I ou variable dans le temps

I Certains estimateurs ne peuvent identifier que les coefficients des régresseurs variables dans le temps

I

On va voir les estimateurs du plus simple au plus complexe

I On regarde la consistance et l’efficience

(26)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(27)

Efficience des Estimateurs

I

L’efficience n’est pertinente que pour les estimateurs consistants

I

L’efficience est la précision de l’estimateur

I Essentiellement l’inverse de sa matrice de var-cov⌃ˆ

I Qui donc dépend de la matrice de var-cov des erreurs⌃u

(28)

Hypothèses sur les erreurs

I

Les modèles à données de panel ont différents types d’erreur

I uit pour MRL

Ii+"it pour EF et EA

I

Dans beaucoup d’applications de microéconomie

I raisonnable de supposer indépendance entrei

I Sauf en spatial

I Pas le cas en macro

I

Toutes ces erreurs sont potentiellement

1. Autocorrélées (corrélées surt pour un certaini )

I Corrélation sérielle, temporelle 2. Hétéroscédastiques entre lesi

I

L’inférence (tests) stat. valide requiert de prendre en compte ces caractéristiques

I Section suivante

I Dans cette section-ci

I structure de la mat. de var-cov des erreurs

I Efficience

(29)

Matrice ⌃

u

de variance-covariance des erreurs en panel

I

Sans distinguer entre les trois modèles

I On écrit l’erreur du modèleuit

I Peut être↵i+✏it ou pas I

Entre

i

on a

Cor[uit,ujs] =

0

I pouri 6=j ett=ou6=s

I

Pour un certain

i

I Cor[uit,uis] = its : corrélation quelconque dans le temps

I t =s, its = 2it : hétérocédasticité quelconque

I

Ça donne la matrice var-cov des erreurs

u

suivante

(30)

Matrice ⌃

u

bloc-diagonale de var-cov des erreurs panel

0 BB BB BB BB BB BB BB BB BB BB BB

@

sv211 sv112 · · · sv11T

sv212 ... ... ... ... ... sv1(T 1)T

SYM · · · sv21T

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv2N1 svN12 · · · svN1T

sv2N2 ... ...

... ... ... svN(T 1)T

SYM · · · sv2NT

1 CC CC CC CC CC CC CC CC CC CC CC A

(31)

Modèle EA

I

Le modèle EA met plus de structure dans la matrice

u I

Modèle EA

yit =↵i +xit0 +✏it

avec

Ii iid (donc non-corrélés àxit)

Iit iid

I Corrélations comme dans l’hyp. EA (5)

i ⇠ ↵, 2

it⇠ 0, 2 I

La matrice

u

prend la forme suivante

(32)

0 BB BB BB BB BB BB BB BB BB BB BB B@

sv2a+sv2e sv2a · · · sv2a

sv2a sv2a+sv2e ... ... ... ... ... sv2a

sv2a · · · sv2a sv2a+sv2e

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv2a+sv2e sv2a · · · sv2a

sv2a sv2a+sv2e ... ... ... ... ... sv2a

sv2a · · · sv2a sv2a+sv2e

1 CC CC CC CC CC CC CC CC CC CC CC CA

(33)

En mots

I

La matrice s’organise en blocs carrés autour de la diagonale principale

I

Chaque carré tient en 2 chiffres

I Hors de sa diagonale principale, une corrélation entre périodes

2

I la même pour tous lesi

I Sur sa diagonale principale, une variance 2+ 2 homoscédastique

I

Entre différentes

i

, toutes les corrélations sont nulles

I Hors des blocs diagonaux

(34)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(35)

Estimateur MCO

I

MCO estime

et dans

yit=↵+xit0 +uit I

MCO est

consistant

(pour

N ! 1

, t constant) si

I Cov[uit,xit] =0 et

I MRL (1) est approprié, ou si

I EA est approprié

I

La mat

u

n’est pas diagonale

I MCO inefficient

I

L’estimateur MCO de la matrice

ˆ ˆ2(X0X) 1

est

biaisé

I

MCO est inconsistant si EF est approprié

I Ré-écrire EFyit =↵i+xit0 +✏it comme yit =a+xitb+ (ai−a+eit)

I Donc l’erreur MCO,uit=↵i ↵+✏it, est corrélé àxit par↵i

(36)

Estimateur Between

I

Étapes

1. Prendre les moyennes sur le temps par individu

Ii = 1 T

XT t=1

yit, idem pourx¯i

2. Estimer par MCOy¯i =↵+ ¯xi0 + ¯"i

I Régressery¯i sur un intercept et le vecteur¯xi

I

Pour estimer , MCO utilise toutes les données

I Donc les variations à la fois sur le temps et en transversal

I

Between n’utilise que les variations transversales

I Entre(between)différents individus

I Analogue à une régression en coupe transversale

I Les variations internes(within)à chaque individu sont écartées

(37)

Propriétés de l’estimateur Between

I

Le modèle implicite derrière l’estimateur between est

¯

yi =↵+ ¯xi0 +ui i =

1, ...,

N

(7)

I

Between est consistant si les régresseurs

i

sont indépendants de l’erreur

ui

I C’est le cas pour le MRL (1)

I Si par contre le modèle est à erreurs composées (3) yit=↵i+xit0 +✏it

I Alors,ui = (↵i ↵+ ¯✏i)

I Dans EA,↵i est indépendant de x

I Donc Between est consistant pour EA

I Dans EF,↵i est corrélé àxit et donc àx¯i

I Between est donc inconsistant

(38)

Propriétés de l’estimateur Between

I

Between gaspille beaucoup d’informations

I C’est un estimateur didactique

I Ne pas l’utiliser dans vos applications

I

Sans regarder formellement

I between est très inefficient à cause du gaspillage d’information

(39)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(40)

Estimateur Within

I

Principe : Les

déviations

individuelles de la variable dépendante de ses moyennes temporelles

I sontexpliquées par

I lesdéviationsindividuelles des régresseurs de leurs moyennes temporelles

I

Soit le modèle à effets individuels 3

yit =↵i +xit0 +✏it

I Prendre le moyenne surt :y¯i=↵i+ ¯xi0 + ¯"i

I Soustraire :les termes ↵i s’annulent = la transformation within

yiti = (xiti)0 + (✏it ¯✏i)

1

, ...,N, t =

1

, ...,T

(8)

(41)

Estimateur Within

I

Estimateur Within = MCO sur les données transformées

yiti = (xiti)0 + (✏it ¯✏i)

I Comme↵i a disparu par différence, Within est consistant dans EF, EA et MRL

I En tout cas quand l’hyp d’exogénéité forte tient

I

Within est aussi appelé estimateur Effets Fixes

I

Chaque

i

doit être observé au moins

deux fois

dans l’échantillon

I sinonxiti =0

(42)

Consistance de l’estimateur Within / Effets Fixes

I

Within traite

i

comme des paramètres dits

nuisance

I que l’on peut ignorer si notre intérêt porte sur les pentes

I qui n’ont pas besoin d’être estimés de façon consistante pour obtenir une estimation consistante des

I Ce résultats ne se propage généralement pas aux modèles non-linéaires

I

La consistance requiert plus précisément

E(✏it ¯✏i|xiti) =

0 dans le modèle transformé

yiti = (xiti)0 + (✏it ¯✏i)

I À cause des moyennes, cela exige plus queE(✏it|xit) =0

I Il faut l’exogénéité stricte (4)

E[eit|ai,xi1, ...,xiT] =0, t =1, ...,T

(43)

Estimations des effets fixes

I

Si les effets fixes

i

sont d’intérêt , ils

peuvent

être estimés par

↵ˆi = ¯yii0ˆ

I Cet estimateur de↵i non-biaisé

I Dans des panels courts (petitT), cet estimateur est inconsistant

I Parce que l’information ne s’accumule pas (T ne croît pas)

I Par contre, la distribution des↵ˆi, par rapport à une variable clef ou pas, peut être informative

I

Si

N

n’est pas trop grand, une alternative pour estimer Within est l’estimateur

MC à dichotomiques

I On définitNdich.di, une par individu, di =1 pouri

I Ensuite, estimeryit=X

i

idi+xit0 +✏it par MCO

I Régression deyit surxit etNdich. individuelles

I Cela produit l’estimation Within pour , ainsi que les estimations desN effets fixes

I Dans les limites des capacités de l’ordinateur

(44)

Within et les régresseurs invariants dans le temps

I

Une limitation majeure de Within

I les coefficients des régresseurs invariants dans le temps ne sont pas identifiés

I Puisque sixit=xi alorsx¯i=xi et(xiti) =0

I

Beaucoup d’études ont précisément pour objet des régresseurs invariants dans le temps

I P.e. les effets du genre ou de l’origine ethnique sur le salaire

I

Pour cette raison, des praticiens évitent d’utiliser within

I

MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent d’estimer ces coefficients

I mais sont inconsitants si EF est le modèle approprié

I On verra un estimateur qui permet parfois de les identifier

(45)

Estimateur différences premières

I

Principe : Les changements individuels

d’une période à l’autre

de la variable dépendante

I sont expliqués par

I les changements individuelsd’une période à l’autredes régresseurs

I

Soit le modèle à effets individuels (3)

yit =↵i+xit0 +✏it

I retarder d’une périodeyi,t 1=↵i+xi,t0 1 +"i,t 1 I Soustraire = la transformationdifférences premières

yit yi,t 1 = (xit xi,t 1)0 + (✏iti,t 1)

i =

1

, ...,N, t=

2

, ...,T

(9)

(46)

Estimateur différences premières

I

L’estimateur différences premières (D1) est MCO appliqué à la transformation différences premières (9)

I

Cet estimateur est

consistant

pour dans tous les modèles

I Pour les mêmes raisons que Within

I Pareillement, les coefficients des régresseurs invariants dans le temps ne sontpas identifiés

I

D1 est

moins efficient

que within

I si"it est iid (pourT >2)

I car une période d’obsevation est écartée

I

Cependant, D1 peut préserver contre des variables I(1)

I Qui amènerait sinon à des résultats spurieux

(47)

Efficience des estimateurs pour EF

I

Ces estimateurs font peu d’hypothèses sur la structure du terme d’erreur

I

Leur efficience n’est généralement pas discutée

I Car la priorité est l’estimation consistante

(48)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(49)

Rappel du modèle EA

I

Modèle à effets individuels (3)

yit=↵i +xit0 +✏it

avec

Ii iid (donc non-corrélés àxit)

Iit iid

I Corrélations comme dans l’hyp. EA (5)

i ⇠ ↵, 2

it⇠ 0, 2

I

Dans ce cas, MCO consistant (car

i

non-corrélés à

xit

)

I MaisMoindres Carrés Généralisés MCGseraplus efficient

(50)

Rappel : MCG en coupe transversale

I

Quand toutes les hyp. du modèle linéaire sont satisfaites

I sauf que la matrice var-cov⌃des erreurs n’est pas l’identité, alors

I MCO consistant

I mais pas efficient (Gauss-Markov ne s’applique plus)

I Si on connait⌃, on peut retrouver l’efficience

I

Soit le MRL en coupe transversale

y=x0 +✏

avec

E⇣

✏✏0

=⌃6= 2I

I On peut montrer qu’il existe toujoursP telle queP0P=⌃ 1

I Décomposition de Cholesky, non-unique pour les matrices réelles sdp

I Prémultiplier le modèle linéaire parP :Py =Px +P✏

I y=x +✏

I AlorsVar(✏) =E⇣

P✏✏0P0

=PE⇣

✏✏0⌘ P0

I =P⌃P0 =P⇣

P0P⌘ 1

P0 =PP 1⇣ P01

P0 =I

(51)

Rappel : MCG en coupe transversale

I

Donc, le modèle transformé a des erreurs dites

sphériques

I Donc, MCO sur les données transformées estefficient

I C’est MCG

I

En pratique,

est inconnue, il nous en faut un estimateur consistant

I Tout estimateur consistant de⌃,⌃, définit l’estimateur MCGˆ faisables (consistant)

I

En panel, le modèle EA implique une matrice

comme dans la diapo suivante

I Comme détaillé précédemment

(52)

Matrice ⌃ bloc-diagonale de var-cov des erreurs panel EA

0 BB BB BB BB BB BB BB BB BB BB BB

@

sv2a+sv2e sv2a · · · sv2a

sv2a sv2a+sv2e ... ... ... ... ... sv2a

sv2a · · · sv2a sv2a+sv2e

0 · · · 0

0 ... ... ...

... ... ... 0

0 · · · 0

sv2a+sv2e sv2a · · · sv2a

sv2a sv2a+sv2e ... ... ... ... ... sv2a

sv2a · · · sv2a sv2a+sv2e

1 CC CC CC CC CC CC CC CC CC CC CC A

(53)

Estimateur EA

I

On appelle estimateur EA l’estimateur MCG

I dans lequel la matrice⌃des erreurs est celle de la diapo précédente

I

La version

faisable

de cet estimateur est MCO

I appliqué aux données transformées de la façon suivante : yit ˆ ¯yi =⇣

1

ˆ⌘

µ+⇣

xit ˆ ¯xi

0

+⌫it

(10) où

it = (1 ˆ)↵i+ ("it ˆ ¯"i)

est asymptotiquement iid, et

I ˆ

est un estimateur consistant pour

=

1

p 2

+T 2

(11)

(54)

Estimateur EA

I

On ajoute l’intercept (non-aléatoire) scalaire

µ

afin de normaliser les effets aléatoires

i

à une espérance nulle

I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)

I C’est-à-direµcorrespond à↵dans (5)

I

La dérivation de cet estimateur (10) et des manières d’estimer

2

et

2"

, et donc ,

I sont détaillés dans Cameron & Trivedi

I

Remarque

I ˆ =0 correspond à l’estimateur MCO

I ˆ =1 correspond à l’estimateur within

I ˆ!1 lorsqueT ! 1(regardez la formule)

I

Il s’agit d’un estimateur en deux étapes de

1. estimer

2. estimer à partir des données transformées

(55)

Propriétés de l’estimateur EA

I Consistant

et

efficient

si le modèle EA est le bon

I Le gain d’efficience par rapport à l’estimateur MCO n’est pas nécessairement élevé

I Probablement inefficient

si l’hypothèse d’équicorrélation n’est pas vraie

I Dans un processusAR(1)

I Si le MRL est le bon

I Inconsistant

si le modèle EF est le bon car alors

i

est corrélé

avec

xit

(56)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(57)

Discussion sur EA et EF

I

La plupart des disciplines de stat appliquées

I traitent l’hétérogénéité inobservée (individuelle)↵i comme distribuée indépendamment des régresseurs

I Sauf la microéconométrie I

Cette hyp d’indépendance

I a l’avantage de permettre une estimation consistante de tous les paramètres

I y-compris ceux invariants dans le temps

I si l’hyp est vraie

I est souvent considérée par les économistes commenon supportée par les données

I

Les deux modèles ont des intérêts distincts

I EA : Précise la structure temporelle!Efficience

I EF : Endogénéité de l’hétérogénéité inobservée!Consistance

(58)

Prédictions et effets individuels

I

Le modèle est

yit=↵i +xit0 +✏it

aussi bien pour EA que pour EF

I L’effet individuel↵i est une v.a. dans les deux modèles

I

On prend l’espérance conditionnelle aux régresseurs

I E[yit|xit] =E[↵i|xit] +xit0

I Que peut-on en dire ? (prochaine dia)

(59)

Prédictions et effets individuels

I

Dans le modèle EA, il est

supposé

que

E[↵i|xit] =↵

I DoncE[yit|xit] =↵+xit0

I Si EA est le bon modèle,↵peut être estimé de façon consistante

I Donc on peut prédireyit parE[yit|xit]

I

Dans EF,

E[↵i|xit]

varie avec

xit

et on ne sait pas comment

I C’est raisonnable car↵i comprend des characteristiques inobservées

I DoncE[yit|xit]ne peut être identifié :pas de prédiction

I Malgré cela, on peut estimer les de façon consistante

I Et donc les effets marginaux sont identifiés

=@E[yit|↵i,xit]/@xit

I Par exemple, l’effet d’un changement de population sur les émissions

I Mais seulement pour les régresseurs variant dans le temps

(60)

Résumé estimateurs et modèles linéaires communs pour panel

Modèle

Estimateur de MRL (1) EA (3) & (5) EF (3) MCO (1) Consistant Consistant Inconsistant Between (7) Consistant Consistant Inconsistant Within (EF) (8) Consistant Consistant Consistant D1 (9) Consistant Consistant Consistant EA (10) Consistant Consistant Inconsistant Cette table ne considère que la consistance des estimateurs de

I

L’estimation des

i

est toujours inconsistante, sauf lorsque

i =↵8i

.

Le seul estimateur efficient est EA lorsque le bon modèle est aussi

EA.

(61)

Sommaire

Les données de panel Modèles à Données de Panel

Effets Fixes & Effets Aléatoires Estimateurs pour données de panel

Efficience et Erreurs

Estimateurs appropriés pour le MRL

Estimateurs appropriés pour EF Estimateur approprié pour EA Interprétation : EF vs. EA Application : Convergence des émissions deCO2

Inférence en données de panel Matrice des erreurs en panel Inférence robuste en panel : White

Inférence robuste en panel : Bootstrap

Application : Emissions deCO2 Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests Test de Hausman

Données de panel non-cylindré (Unbalanced)

(62)

Émissions de CO

2

I

Convergence dans ce contexte est 2 choses

1. Dans le temps vers un “État stationnaire” (Steady State)

I Non testé ici

2. En supposant la convergence dans le temps,

I Des groupes de pays convergent-ils à la mêmevitesse

I C’est ce qui est testé ici

I

Importance de la convergence lors de négociations internationales

I Si les émissions tendent à se rapprocher entre pays ou non

I les négociations ne sont pas les mêmes

I Émissions par habitant ou par travailleur effectif, pas au total

I

On peut essayer de comprendre les différences entre vitesse de convergence

I Technologie ? Politique ? Ressources naturelles ? Niveau de développement ?

(63)

Théorie en état stationnaire

I

La croissance du stock de capital est déterminée par

I la croissance de la populationn

I le taux d’épargnes

I le progrès techniqueg (paramètre inconnu)

I un paramètre exogène de dépréciation

I Les auteurs posentg+ =.05, constant

I On ne va pas explorer cette question, on oublie

I

Il est supposé que les émissions per capita

E/L

croissent de la même manière que le stock de capital

I Ceci permet d’obtenir une équation pour les émissions en état stationnaire

ln(E/L) =lnA+ t+↵ln

✓ s n+g+

(12)

I Aest le niveau technologique

I permettra de définir une constante pays-spécifique

(64)

Dynamique

I

L’économie n’est pas à l’état stationnaire

I

Soit

I les émissionsE/Là l’état stationnaire

I ✏les émissions à l’instantt

I

L’équation de convergence dans le temps est

d

ln

t

dt =⇢[ln✏

ln

t]

(13)

I Équation différentielle

I Dit essentiellement que le mouvement vers l’état stationnaire est une proportion de la distance actuelle

I Théorie sans fondement empirique, l’existence même d’un état stationnaire n’étant pas certaine

I Résolution (intégration)

ln✏t2= 1 e ⇢⌧ ln✏+e ⇢⌧ln✏t1 (14)

(65)

Dynamique

I

En substituant

selon l’équation 12 dans la solution 14

I et en notant =e ⇢⌧, on a

ln

t2 = (1 )↵

ln

s n+g+

⌘+ (1 )A+g(t2 t1) +

ln

t1

I

Le progrès technologique

g(t2 t1)

I modélisé (ad hoc) comme un jeu de dummies temporelles de coefficients⇡t

I

Les différences de technologie

A

entre pays

I donnent naissance à des intercepts par pays✓i

I

Il est supposé que

I les coefficients de lns et de ln(n+g+ )peuvent être différents

I commeg + =0.05 par faute de données, on n’a ques etn

(66)

Modèle estimé

I

Le modèle opérationnel est donc

ln

t2 =

ln

t1+ 1

ln

s+ 2

ln

n+⇡t+✓i+⌫it

(15)

I Le paramètre d’intérêt est⇢= 1 5ln

I Puisque ce paramètre indique la vitesse de convergence vers l’état stationnaire selon eq. 13

I Modèle dynamique par la présence de✏t1 I que l’on traite en statique dans ce chapitre

I Les régresseurs lns et lnn

I aident à limiter (“contrôler”) l’hétérogénéité inobservée

I Il pourrait y en avoir d’autres : prix du pétrole, température en hiver...

(67)

Penn World Table PWT

I

Jeu de données

I maintenu conjointement par des chercheurs de

I U Californie à Davis

I Growth Development Centre de U Groningen

I Données de comptes nationaux

I PIB réel au cours du temps

I dans 189 pays dans la version utilisée (7)

I Non-cylindré 1950-2009

I Semblables à celles de la Banque Mondiale

I Plus long pour certains pays

I Beaucoup moins de variables I

“Extended Penn World Tables” EPWT

I Ajoute quelques variables et change certaines définitions

I Émissions nationales deCO2

I Combustion de combustibles fossiles, fabrication de ciment et rejet de gaz naturel

I “CO2pur” vs. “CO2 - équivalent”

(68)

Retard

I

Le retard considéré est 5 ans

I Pour un effet long terme selon les auteurs

I ⌧=t2 t1=5ans

I Différents⌧ influencent-ils les résultats ?

I Les données post 2005 ne sont pas dans la EPWT pour plusieurs pays

(69)

Stata

I

Charger les données

I .dta : double-click

I capacité d’import très limitée : .csv

I pas de méta-donnée

I

Suivre le fichier 20160727CvgceCO2.do

I

Ci-dessous

I présentation des données

I Graphique temporel par pays

I menu graphics!panel data line plots

(70)
(71)
(72)
(73)
(74)
(75)
(76)
(77)
(78)
(79)

I

Var. qualn

I NA, 4, 3, 2, 1

I summarize em if (qualn<4)&(year<2009)

year<2009 # Moy Éc.ty. min Max

Tout y compris NA 5 660 2 487 3 315 .4

32 615 qualn<5 5 352 2 478 3 280 4.3

qualn<4 4 397 2 783 3 442 9.1

qualn<3 1 364 5 305 3 366 637 27 359 qualn<2 818 6 385 3 695 1 404

I

Restreint beaucoup l’échantillon

I Les états qui tiennent bien les comptes pourraient être ceux qui font plus d’effort sur les émissions

I Biais de sélection

I Les résultats sont-ils sensibles à la qualité des données ?

(80)

Échantillons

I

Cfr papier : Sélection préalable

I "118 countries for which information from 1970 to 2008 was available"

I “Cylindrage” du panel - quelle justification ?

I

Les pays sont regroupés dans différents sous-ensembles

I peu explicites dans le papier

I La question principale est de voir si différents sous-ensembles ont des convergences différentes

I En supposant qu’il y ait convergence dans le temps

(81)

Échantillons

I

NOIL

I tous les pays de l’échantillon sauf les gros producteurs de pétrole

I

INTER - ok (je crois)

I tous les pays de l’échantillon sauf

I ceux de moins d’un million d’habitants

I les données douteuses selon EPWT (qualn)

I

OECD - ok

I

ASIA - ok

I

LAC

I pays d’Amérique Latine / Caraïbe

(82)

Régression dans Stata

I

Principe englobant

I Du modèle général vers le plus restrictif

I

Modèle + général : effets fixes

I Estimateur Within

I Estimateur Diff1ere

I

Second modèle : effets aléatoires

I

Modèle plus restrictif : MRL

I Estimateur MCO

I Estimateur Between

(83)

Estimateur Within

I

Stata présente un intercept - pourquoi ?

I

Stata réécrit le modèle 3

yit =↵i +xit0 +✏it

comme

yit =↵+↵i+xit0 +✏it

I Cela amène la multicollinéarité

I

Il faut normaliser

I Dans la théorie, on a pris↵=0 pour simplifier la notation

I Stata prendP

ii =0 par analogie avec l’hyp. EA : E(↵i) ↵=0

I Dans aucun cas, cela n’a de conséquence sur les estimations de

(84)

Estimateurs D1, EA

I

Diff. 1

eres

I Pas disponible directement dans Stata

I Construire les Diff. 1eres puis appliquer MCO

I Retards 1 période dans Stata :by idn : gen lnem1 = lnem[_n-1]

I nindice les observations,by idnindique de retarder par individu

I Ensuiteby idn : gen lnemD1 = lnem-lnem1

I Par conséquent : intercept nul en théorie

I

EA : 2 versions

I GLS = MCG faisable comme présenté plus avant

I ML = maximum de vraisemblance

I Je ne détaille pas - on laisse tomber

(85)

Estimateurs MCO, Between

I

Between - directement dans Stata

I Nombre d’observations réellement utilisées = nombre de groupes

I

MCO

I Utiliser la commande/menuregress

(86)

Estimations

I

Rappel du modèle 15 :

ln

t2 =

ln

t1+ 1

ln

s + 2

ln

n+⇡t+✓i+⌫it

I Le paramètre d’intérêt est⇢= 1 5ln

I indique la vitesse de cvgce à l’ES

I C’est le modèle “conditionnel”

I Le modèle ln✏t2= ln✏t1+⇡t+✓i+⌫it est dit “absolu”

I Il n’est pas clair si les auteurs mettent des dich. de temps dans tous les modèles

I

calculs dans do file 20160727CvgceCO2.do

I Ne pas double-cliquer, sinon exécute tout d’un coup

Références

Documents relatifs

Par ailleurs, la théorie de l’agence montre deux effets contradictoires de l’endettement sur la profitabilité à savoir : Un effet positif et d’autre négatif, le premier effet

I Peut être un travail original I Données prochaine diapo I Reproductibilité. I Comment trouver

1 Format de qualité professionnelle -2 si absent Code STATA en annexe du rapport -2 si absent Données en fichier à part au

2 Documentation des données &amp; présentation, y-compris graphiques 2 Construction du modèle économique &amp; documentation (références) 3 Qualité économétrique : modèle

I Vous présentez de l’état d’avancement de votre rapport de recherche utilisant des données de panel. I En podcast comme pour les cours (diapos + voix) I

Les données de panel Modèles à données de panel Estimateurs pour données de panel Inférence avec données de panel Effets Fixes vs. Effets Aléatoires Autres tests.. Données de

Les données de panel Modèles à données de panel Estimateurs pour données de panel Inférence avec données de panel Effets Fixes vs. Effets Aléatoires Autres tests.. Données de

Modèles à Données de Panel Estimateurs pour données de panel Inférence avec données de panel Effets Fixes vs. Effets Aléatoires Autres tests.. Données de panel