• Aucun résultat trouvé

Économétrie II

N/A
N/A
Protected

Academic year: 2022

Partager "Économétrie II"

Copied!
29
0
0

Texte intégral

(1)

Économétrie II

L3 Économétrie – L3 MASS

Prof. Philippe Polomé, U. Lyon 2 Année 2014-2015

(2)

Rappel

1. E(✏t) =08t :espérance nulle

2. Xvar(✏t) = 28t :Homoscédasticité

3. Xcov(✏t,✏s) =08t 6=s :Pas d’auto-corrélation 4. XE(✏txt) =08t :Exogénéité

5. XLa matrice X est de plein rang :Pas de multicolinéarité 6. Le modèle est correctement spécifié

7. La variable dépendante Y est continue

(3)

Ch. 6. Spécification

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(4)

Introduction

I 2 aspects : Régresseurs – Coefficients

I Forme fonctionnelle

I Quels régresseurs faut-il inclure dans le modèle ?

I Sous quelle forme (linéaire, polynomiale, logarithmique...) ?

I Manque t-il des régresseurs ? Y en a t-il de trop ? Faut-il inclure une constante ?

I Quelles conséquences ?

I Le modèle est-il effectivement linéaire en les coefficients ?

I Les coefficients sont-il stochastiques ?

I Non traité sauf erreurs de mesure en Ch 5

(5)

Ch. 6. Spécification Formes fonctionnelles

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(6)

Quelle forme fonctionnelle ?

I Une régression linéaire (en les coefficients) peut donner de

“bons” résultats même si la relation sous-jacente est non linéaire

I Approximation locale – théorème de Taylor

I Si le modèle estY =F(X, ) +par exemple,

I On peut l’approximer parY 0+ 1X+ 2X2+RRest leRestede Taylor, qui se trouvera dans le terme d’erreur

I C’est surtout pour des variables expliquées discontinues que le modèle doit vraiment être non-linéaire

I Une infinité de formes fonctionnelle est envisageable :

I Logarithmes sur les variables expliquées ou explicatives

I Formes quadratiques sur les régresseurs

I Interactions entre régresseurs

I . . .

(7)

Ch. 6. Spécification Formes fonctionnelles

Forme fonctionnelle : approche interprétative vs. test

I Interprétative

I Que dit la théorie économique ?

I Nature de la relation connue (exponentielle, linéaire. . . ) ?

I Concavité / convexité attendue ?

I Quelle interprétation peut-on dériver des résultats ?

I y=1+ 1x

I y=2+ 2x+ 2x2

I y=3+ 3x1+ 3x2+ 3x1x2 I y=4+ 4ln(x)

I ln(y) =5+ 5ln(x)

I ... interprétation de @y

@x, @y

@x1, élasticités...

(8)

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(9)

Ch. 6. Spécification Tests

Test 1 : significativité

I Tester l’inclusion de termes quadratiques ou de termes croisés par des tests sur la significativité des coefficients associés

I t-tests, F-tests

I Rapidement contraignant de tester toutes les combinaisons possibles

(10)

Exemple : prix immobilier

I Données hprice1.gdtde Wooldridge dans Gretl

I 88 prix de ventes déclarés de maisons, 1990, Boston

I price= p =prix de vente

I lotsize= s =surface de la propriété

I sqrft= h = surface habitable

I bedrooms= c = nombre dechambres

I p = 0+ 1s+ 2h+ 3c+✏ ou bien

I p = 0+ 1s+ 12s2+ 2h+ 22h2+ 3c+µ

I Test H0 : 12= 22=0

(11)

Ch. 6. Spécification Tests

Exécution dans Gretl

I Menu “ajouter” “carrés des variables sélectionnées”

I Menu MCO p= 0+ 1s+ 12s2+ 2h+ 22h2+ 3c+µ

I Post-estimation : “Tests” “Omission de variables” : mettres2 et h2

I Test Wald : F(2, 82) = 14.5 ; p. valeurt4e-06

I Donc RH0: 12= 22=0

I Les carrés sont significatifs : manquaient dans la forme linéaire ?

(12)

Test 2 : Le test de Ramsey : RESET

I Idée simplificatrice : Au lieu d’inclure toutes les spécifications possibles des régresseurs, tester significativité de fonctionsde la variable ajustée yˆ

I Effet « combiné » desX

I Procédure en 4 étapes

1. Estimation de la forme linéaire :y = 0+ 1x1+...+ kxk+ 2. Valeurs ajustées :yˆ

3. Estimation de :y = 0+ 1x1+...+ kxk+ 1yˆ2+ 2yˆ3+ 4. Test deH0: 1= 2=0 ; test de FisherFF2.n k 3

(13)

Ch. 6. Spécification Tests

Exemple Gretl : prix immobilier

I Mêmes données que dans l’exemple précédent

I Ramsey “à la main”

I Estimerp= 0+ 1s+ 2h+ 3c+

I pˆ= ˆ0+ ˆ1s+ ˆ2h+ ˆ3c

I Post-estimation : “sauvegarder” “valeurs ajustées”

I Créer le carré de yhat puis le cube

I “définir une nouvelle variable” : Cube_yhat=yhat^3

I Estimerp= 0+ 1s+ 2h+ 3c+ 1pˆ2+ 2pˆ3+

I Les coef. de ce modèle ne sont pas interprétables

I TesterH0: 1= 2=0

I R hypothèse : F(2, 82) = 4.67, avec p. valeur = 0.012

I 9variabilité danspqui n’est pas expliquée par les variables incluses mais pourrait l’être par leurs carrés/cubes

I Ramsey en post estimation : “tests”

I Résultats identiques

(14)

Test 3 : Alternatives non-imbriquées/anidées/emboîtées

I Deux cas polaires

1. Mêmes régresseurs mais formes fonctionnelles6=

I Par ex. :y= 0+ 1x1+...+ kxk +

I Contre :y = 0+ 1lnx1+...+ klnxk+ 2. Mêmes formes fonctionnelles mais régresseurs6=

I Par ex. A :y=X +

I Contre B :y =Z +

I avecXTZ 6=Ø(pas nécessairement vide mais peut être vide)

I 2 approches

I Minzon & Richard :Principe “englobant”

I Davidson & MacKinnon :Prédiction

(15)

Ch. 6. Spécification Tests

1. Mêmes régresseurs mais formes fonctionnelles 6 =

Approche Minzon & Richard : Modèle englobant

I Estimation d’un modèle complet incluant toutes les formes fonctionnelles des explicatives (possiblement sans

interprétation)

I y = 0+ 1x1+...+ kxk + 1lnx1+...+ klnxk +µ

I On teste2 hypothèses nulles (test F par ex.)

I H0X : 1=...= k=0

I H0lnX: 1=...= k=0

I Si on RH0X mais pasH0lnX alors le modèle en ln estvalidé par rapport au modèle en niveau

I Nombre important de coef. à estimer

I Multicolinéarité (forte corrélation xm et lnxm)

(16)

1. Mêmes régresseurs mais formes fonctionnelles 6 =

Approche Davidson & MacKinnon : Prédiction

I Si y= 0+ 1x1+...+ kxk +✏est la bonne spécification

I et doncy= 0+ 1lnx1+...+ klnxk+ la mauvaise

I Alors yˆ= ˆ0+ ˆ1lnx1+...+ ˆklnxk ne doit pas être significative dansy = 0+ 1x1+...+ kxk +↵yˆ+✏

I Sin’est pas significatif, le modèle en niveau estvalidé par rapport au modèle en ln

I S’il est significatif, on ne peut conclure

I On procède pareillement avec l’autre modèle

(17)

Ch. 6. Spécification Tests

2. Mêmes formes fonctionnelles mais régresseurs 6 =

Approche Minzon & Richard : Modèle englobant

I Soit X2 les régresseurs présents dans Ay =X +✏mais pas dans B y=Z +⌫

I Soit Z2 les régresseurs présents dans B mais pas dans A

I On estime lemodèle englobant selon B: Y =Z +X2 2+2

I On testeH0: 2=0 (test enz)

I Si 2 n’est pas significativement6=0, alors A n’apporte rien de plus que B

I On dit que B est englobant par rapport à A

I Ce quivalide B

I On teste pareillement le modèle englobant selon A : Y =X +Z2 2+2

I Mêmes remarques que pour le cas polaire 1

I Beaucoup de coef., multicolinéarité

(18)

Interprétation des tests de spécification

I Il est possible qu’aucune des deux spécifications n’apparaisse dominer l’autre :

I Les deux spécifications sont rejetées

I Significativité des coefficients pour les deux alternatives dans le test de Davidson et MacKinnon

I H0: 1=...= k=0 etH0: 1=...= k=0 sont acceptées dans le test de Minzon et Richard

I Nécessité de spécifier un modèle plus complet

I Les deux sont acceptées

I Les deux spécifications sont « également » acceptables.

I On peut comparer les valeurs desR2 pour choisir la spécification.

I Les données sont “trop molles” pour pouvoir trancher (si tant est qu’il faut trancher)

I Rejeter une spécification contre une autre ne signifie pas que la deuxième est la « bonne »

I Elle pourrait être rejetée contre une troisième

(19)

Ch. 6. Spécification Tests

Exemple Davidson & MacKinnon : prix immobiliers

I Mêmes données que dans l’exemple précédent

I Estimer (par exemple) modèle A : lnp = 0+ 1s+ 2h+ 3c+✏

I Prédire “in-sample” lnˆp= ˆ0+ ˆ1s+ ˆ2h+ ˆ3c via Post-estimation : “sauvegarder” “valeurs ajustées”

I Estimer modèle B : lnp= 0+ 1lns+ 2lnh+ 3lnc+µ et prédire de façon semblable, on note la prédiction ln˜p (avec un tilde)

I Tests de validation

I Estimer modèle A avecln˜p:

lnp= 0+ 1s+ 2h+ 3c+1ln˜p+

I Si1 n’est pas significatif, le modèle A est validé

I Estimer modèle B aveclnˆp:

lnp= 0+ 1lns+ 2lnh+ 3lnc+2lnˆp+

I Si2 n’est pas significatif, le modèle B est validé

(20)

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(21)

Ch. 6. Spécification

Régresseurs omis ou superflus

Régresseur omis (hétérogéneité)

I Modèle correctement spécifié Y = 0+ 1x1+ 2x2+✏

I Modèle estiméY = 0+ 1x1+

I Alors l’effet du régresseur manquant se retrouve dans l’erreur du modèle estimé : ⌫= 2x2+✏

1. Régresseur manquant n’est corrélé avecaucun régresseur présent

I Hétéroscédasticité vraisemblablement si var(x2t)6=var(x2s),t6=s

I Peut-être autocorrélation sicorr(x2t,x2s)6=0,t 6=s

I Terme d’erreur n’a plus une espérance nulle : ci-dessous

2. Régresseur manquant estcorrélé à un régresseur présent

I Alors, en plus des problèmes ci-dessus :inconsistance

I Exemple de régresseur manquant avec & sans endogénéité : fichier tableur Regr manquant.ods

(22)

Régresseur superflu

I Si le modèle correctement spécifié estY = 0+ 1x1+⌫

I Mais que le modèle estimé estY = 0+ 1x1+ 2x2+✏

I Si le modèle Y = 0+ 1x1+⌫ était correctement spécifié au départ, le terme d’erreur est un bruit blanc

I = 2x2+✏, bruit blanc, comme 2=0,est aussi un bruit blanc

I En particulier, il n’est pas corrélé (avec quoi que ce soit)

I DoncE ˆ2

=0

I Mais si corrélation(x1,x2)6=0, alors il peut apparaître de la multicolinéarité, qui induit une perte de significativité de tous les régresseurs (1er semestre)

I Exemple fichier tableur Regr manquant.ods

(23)

Ch. 6. Spécification

Régresseurs omis ou superflus

Étendue du problème

I Inhérent à toute analyse économétrique

I Certains régresseurs sont inobservables ou difficilement mesurables

I dynamisme, charisme, capital social d’un individu, esprit d’équipe dans une entreprise . . .

I Certains régresseurs sont indisponibles

I questions non posées, réponses biaisées sur des sujets sensibles . . .

I Il faut bien rester conscient que certaines variables peuvent capter des effets plus larges “confondants” que ce pourquoi elles sont incluses dans le modèle

(24)

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(25)

Ch. 6. Spécification Sélection de régresseur

Sélection de régresseur

I En pratique, quel est l’ensemble des régresseurs pertinents ?

I La théorie n’aide pas toujours car se concentre sur quelques régresseurs

I p.e. équation de demande d’un bien

I devrait dépendre du prix et du revenu de l’acheteur,

I peut aussi dépendre d’autres caractéristiques du bien (packaging, marketing...) ou de l’acheteur (profil sociologique)...

I Sélection successiveforward step : intégrer régresseurs 1 à 1

I Dans beaucoup de logiciels

I À exclure car statistiquement incorrect

I Les régressions antérieures peuvent présenter de

l’inconsistance suite à l’absence de regresseurs pertinents

I Les tests effectués dans la régressions sont conditionnels aux décisions prises sur les régressions antérieures

(26)

Méthodologie la plus couramment admise

I Partir d’un ensemble général de régresseurs sur base d’arguments économiques / théoriques / intuitifs mais pas statistiques

I Éviter multicolinéarité

I Éviter data mining (inclusion de régresseurs sur base d’erreurs de type I ou faux positifs)

I Enlever des régresseurs non significatifs si on juge le modèle trop complexe ou trop colinéaire

I Mais pas une obligation : intéressant de montrer la non-significativité

I Utiliser le test de Wald / F (nullité de plusieurs coefficients) et le test des modèles non-emboîtés

(27)

Ch. 6. Spécification

E(✏)6=0 & rôle de la constante

Table des matières

Ch. 6. Spécification Formes fonctionnelles Tests

Régresseurs omis ou superflus Sélection de régresseur

E(✏)6=0 & rôle de la constante

(28)

E (✏) 6 = 0

I Ne peut être détecté car Xn i=1

ˆ

✏=0 dès que le modèle comporte une constante (sans preuve)

I Nature du problème

I 8on peut écrire=a+µ, avecE(µ) =0

I doncY = 0+ 1X += 0+ 1X+a+µ= + 1X +µ

I ˆ biaisé & inconsistant pour 0 et/oua : problème d’identification

I Pas d’effet sur autres coefficients

I Sauf si E(✏)6=0 à cause de l’omission d’un régresseur

I Dans ce cas, si le régresseur omis est corrélé aux régresseurs présents...

(29)

Ch. 6. Spécification

E(✏)6=0 & rôle de la constante

Flexibilité & rôle de la constante

I Sans point autour du zéro, l’intercept est estimé avec une variance importante

I QueE(✏)soit=0 ou non n’a alors guère d’importance

I 0 alors paramètre de flexibilité : permet que la pente s’ajuste

I Pour cette raison, en général on inclut une constante, même non significative, dans tout modèle

Références

Documents relatifs

I Multiples données réelles sur l’économie et autres. I On aimerait pouvoir évaluer quantitativement

Modèle de Régression Linéaire (MRL) formel Causalité contre corrélation?. Distribution d’échantillonnage & propriétés

I L’inférence classique ne dépend donc de l’hypothèse de normalité des erreurs que pour les petits échantillons. I L’avantage du bootstrap est moindre

White : basé sur un résultat plus récent (1980) que MCP ; requiert une plus grande puissance de calcul.

I D’où chaque investisseur détient un portefeuille dit mean variance efficient. I qui donne le return maximum pour un niveau de risque donné : le risque maximum accepté

I Une relation spurieuse peut aussi être trouvée entre séries qui ont un trend. I Si ces séries sont faiblement dépendante autour de leur trend, le problème se résoud en insérant

Estimation en présence d’endogénéité Doubles moindres carrés MC2E (2SLS) Tests..

Fichier Gretl MROZ (tab Wooldridge).. Variables Dépendantes Dichotomiques Interprétation des modèles Logit & Probit &