ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2013, Steve Ambler Hiver 2013
Voici quelques consignes importants.
– Il est important d’´ecrire lisiblement. Je ne vais pas passer trop de temps `a d´echiffrer les r´eponses barbouill´ees.
– J’accorde toujours plus de points pour le raisonnement que pour la r´eponse finale. Si la r´eponse est erron´ee et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Mˆeme si la r´eponse est bonne, je ne don- nerai que des points partiels s’il n’y a pas d’explication.
– Les justifications peuvent ˆetre graphiques, alg´ebriques, ou en mots : la co- h´erence et la logique sont primordiales.
– Ne pas simplifier les r´eponses.Si vous simplifiez vos r´eponses, je ne peux retracer vos erreurs ´eventuelles, ce qui ne me permettra pas d’accorder des points partiels.
– Les calculatricesne sont pas permises. Relire le consigne pr´ec´edent.
1 R´eponses courtes (15 points)
1. L’ajustement statistique (R2) peut augmenter ou diminuer suite `a l’addition d’une variable explicative additionnelle `a un mod`ele de r´egression. Vrai, faux ou incertain ? Expliquez en d´etail.
2. Dans quelles circonstances doit-on tester une hypoth`ese nulle jointe en util- isant des statistiques tpour tester chacune des hypoth`eses nulles individu- elles de l’hypoth`ese jointe ? Sans rentrer dans les d´etails, quelle m´ethodologie doit-on utiliser dans ce cas ?
3. Voici deux mod`eles lin´eaires de r´egression multiple pour expliquer les vari- ations de la variableY.
Yi =β0+β1X1i+β2X2i+β3X3i+ui; (Yi−X3i) = β0+β1(X1i+X3i) +β2X2i+ ˜ui.
Est-ce qu’il y a un mod`ele dont laSSR(somme des r´esidus au carr´e) devrait ˆetre moins ´elev´ee ? Est-ce que les estim´es deβ0, deβ1et deβ2devraient ˆetre identiques ou diff´erents ? Expliquez en d´etail.
2 Propri´et´es d’estimateurs (20 points)
Soit le mod`ele de r´egression multiple habituelle. En notation non matricielle, Yi =β0+β1X1i+β2X2i+. . .+βkXki+ui.
1. ´Ecrivez le mod`ele de r´egression multiple en notation matricielle. Donnez la d´efinition et les dimensions de toutes les variables du mod`ele.
2. ´Ecrivez la fonction (en notation non matricielle) qu’il faut minimiser pour trouver les estimateursβˆ0, βˆ1, . . . , βˆk.
3. Quelle sont les variables de choix de ce probl`eme de minimisation ? 4. Montrez que l’estimateur deβ0, soitβb0doit ˆetre ´egal `a
βb0 = ¯Y −βb1X¯1−. . .−βbkX¯k,
o`u, comme d’habitude, les barres indiquent des moyennes ´echantillonnales.
5. Montrer que pour des variables al´eatoires quelconquesXetY et un ´echantillon quelconque de taillen,
n
X
i=1
Xi Yi−Y¯
=
n
X
i=1
Xi−X¯
Yi−Y¯ .
6. Pour le cas simple o`uk = 1, montrez que βb1 =
n
X
i=1
X1i−X¯1
Y1i−Y¯1 X1i−X¯12 .
Indice — vous allez devoir utiliser le r´esultat de la sous-question pr´ec´edente.
3 Mod`ele de r´egression multiple (45 points)
Soit le mod`ele de r´egression multiple estim´e avec des donn´ees sur 872 maga- sins. Les variables sont :
– Y : la variable d´ependante, la valeur du caf´e vendue, mesur´ee en logs.
– X1 : le log du prix du caf´e.
– X2 : le log du prix du th´e.
– X3 : le log de la valeur des ventes totales du magasin.
– X4 : le prix moyen des maisons dans le quartier du magasin, en logs.
– X5 : le revenu moyen des individus dans le quartier du magasin, en logs.
Le mod`ele estim´e est
Yi =β0+β1X1i+β2X2i+β3X3i+β4X4i+β5X5i+ui
Les r´esultats de l’estimation sont comme suit.
Coefficient Variable Estim´e Ecart type´
βˆ0 Constante 4.53 0.571
βˆ1 X1 -1.439 0.466
βˆ2 X2 0.341 0.120
βˆ3 X3 0.937 0.102
βˆ4 X4 0.198 0.132
βˆ5 X5 0.288 9.194
R2 : 0.18 R¯2 0.18
SSR 645.26
F (3,868) 3.41e+2 Prob> F 0.000 Le mod`ele a ´et´e estim´esansl’optionrobuste.
1. Montrez comment calculer l’´ecart type de la r´egression.
2. ´Ecrivez les statistiques que l’on pourrait utiliser pour tester la significativit´e de chacun des coefficients individuels (tests d’hypoth`eses simples). ´Ecrivez les valeurs num´eriques des ces statistiques,sans les simplifier. ´Ecrivez ex- plicitement quelle est l’hypoth`ese nulle test´ee dans chaque cas.
3. Sansutiliser de table, est-ce les coefficients individuels sont significatifs `a un niveau de 10% ? De 5% ? De 1% ? Expliquez.
4. Quelle est l’hypoth`ese nulle test´ee par la Statistique F dans la deuxi`eme partie du tableau ? Quelle est l’hypoth`ese alternative ?
5. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.
6. D´ecrivez comment tester l’hypoth`ese que les ventes de caf´e sont proportion- nelles aux ventes totales du magasin (autrement, l’hypoth`ese nulle d’une
´elasticit´e unitaire des ventes de caf´e par rapport aux ventes totales). Sans utiliser de table, est-ce que l’hypoth`ese nulle est rejet´ee ?
7. Serait-il possible de tester l’hypoth`ese de la sous-question pr´ec´edente en estimant une version contrainte du mod`ele ? Quel serait le mod`ele estim´e ? Quelle hypoth`ese doit tenir pour que cette approche soit valide ?
8. Expliquez comment tester l’hypoth`ese de la significativit´e des deux derni`eres variables (le prix des maisons et le revenu des individus) avec une approche matricielle.
9. Expliquez en d´etail comment construire la statistiqueF de la sous-question pr´ec´edente en estimant une version contrainte du mod`ele.
10. Par rapport `a la sous-question pr´ec´edente, quelle hypoth`ese faut-il faire con- cernant le terme d’erreur du mod`ele pour que cette approche soit valide ? 11. Supposez que vous rejetez l’hypoth`ese nulle (jointe) dans les sous-questions
(7) et (8). `A la lumi`ere de votre r´eponse `a la sous-question (2), fournissez une explication possible pour ce que vous trouvez.
12. Expliquez bri`evement comment construire l’intervalle de confiance de 95%
pour l’impact du prix du th´e sur les ventes du caf´e.
13. Quelle serait la forme g´eom´etrique de l’ensemble de confiance de 95% pour les impacts des deux derni`eres variables. Vous ne devez pas fournir une formule alg´ebrique.
4 Mod`eles de r´egression non lin´eaires (20 points)
Soit le mod`ele de r´egression non lin´eaire suivant :
Yi =β0+β1X1i+β2X1i2 +β3X1iX2i+ui
Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYid’une augmen- tation duniveaudeX2i.
1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez claire- ment en donnant une r´eponse math´ematique ainsi qu’en mots.
2. D´erivez une expression alg´ebrique pour le changement pr´edit ∆Y ≡ (Y2−Y1)suite `a un changement de la valeur de la variable explicativeX1
deX11 `aX12. Autrement dit,∆X1 =X12−X11. Ici,Y2 indique la valeur deY apr`es le changement de la valeur deX1, etY1 indique sa valeur avant le changement.X11indique la valeur initiale deX1 etX12indique sa valeur apr`es le changement. La valeur deX2reste inchang´ee. Vous pouvez utilisez l’approximation suivante (approximation de Taylor d’ordre un deX122 au- tour du pointX112
) :
X122
≈X112+ 2×X11(X12−X11)
⇒X122 −X112 ≈2×X11(X12−X11).
3. Exprimez ce changement en notation matricielle (vectorielle) comme
∆Y = ∆X1δ0β.ˆ
Autrement dit, pr´ecisez les ´el´ements du veteurδ. Notez queβest un vecteur qui comprend tous les coefficients du mod`ele.
4. ´Ecrivez une expression pour la variance de∆Y ou Var(∆Y)
en fonction de l’expression du cˆot´e droit de l’´equation ci-dessus. Simplifiez cette expression et exprimez la variance de ∆Y en fonction de la matrice variance-covariance de l’estimateurβ.ˆ
5. ´Etant donn´e cette variance, expliquez en d´etail comment construire l’inter- valle de confiance de 95% pour∆Y.
6. ´Ecrivez une version ´equivalente du mod`ele o`u le δβˆ de la partie 3 (ou plutˆotδβ si vous ´ecrivez le mod`ele de la population) est directement un des param`etres du mod`ele transform´e (de cette fac¸on, le logiciel de r´egression calcule automatiquement l’´ecart type dont nous avons besoin pour calculer l’intervalle de confiance).
5 Variables instrumentales (20 points en bonus)
Soit le mod`ele de r´egression multiple donn´e par Y =Xβ+U
avec la notation habituelle et avec(k+ 1)variables explicatives avec la constante.
Supposons que l’hypoth`ese d’ind´ependance conditionnelle des termes d’erreurs n’est pas v´erifi´ee et donc
E(U|X)6= 0.
Il y a par contre des variables Z (une matrice de dimensions n ×(k2 + 1) o`u k2 ≥k) qui satisfait l’hypoth`ese
Cov(U, Z) = 0.
Consid´erez le mod`ele de r´egression modifi´e suivant.
Y =Xβb +Ue
o`u on remplace les variablesXpar leurs valeurs pr´edites provenant de r´egressions lin´eaires de chaque variable dansXsur lesZcomme variables explicatives. Autrement dit,
Xb =Z(Z0Z)−1Z0X ≡Zbγ o`u donc
bγ ≡(Z0Z)−1Z0X
est lamatricede param`etres estim´es provenant de ces r´egressions.
1. Quelles sont les dimensions de la matriceXb et de la matricebγ? 2. Montrez en d´etail qu’on peut ´ecrire l’estimateur comme
βbV I =β+
X0Z(Z0Z)−1Z0X −1
X0Z(Z0Z)−1Z0U.
3. Montrez que l’estimateur converge en probabilit´e `a β. (Pour l’estimateur
`a variables instrumentales, on ne peut pas montrer l’absence de biais en
´echantillon fini.) Vous pouvez utiliser le r´esultat suivant : Z0U
n
−p
→Cov(U, Z)
document cr´e´e le : 20/04/2013