ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2011, Steve Ambler Hiver 2012
Voici quelques consignes importants.
– Il est important d’´ecrire lisiblement. Je ne vais pas passer trop de temps `a d´echiffrer les r´eponses barbouill´ees.
– J’accorde toujours plus de points pour le raisonnement que pour la r´eponse finale. Si la r´eponse est erron´ee et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Mˆeme si la r´eponse est bonne, je ne donnerai que des points partiels s’il n’y a pas d’explication.
– Les justifications peuvent ˆetre graphiques, alg´ebriques, ou en mots : la coh´erence et la logique sont primordiales.
– Ne pas simplifier les r´eponses.Si vous simplifiez vos r´eponses, je ne peux retracer vos erreurs ´eventuelles, ce qui ne me permettra pas d’accorder des points partiels.
– Les calculatricesne sont pas permises.
1 R´eponses courtes (15 points)
1. Vous avez estim´e un mod`ele de r´egression multiple avec trois variables explicatives (`a part la constante). Le mod`ele est
Vous voulez tester l’hypoth`ese nulle que le produit des trois coefficientsβ1, β2 etβ3est ´egal `a un. Pouvez-vous utiliser un testt? Un testF ? Expliquez pourquoi ou pourquoi pas.
2. Vous avez un article publi´e qui rapporte les coefficients estim´es d’un mod`ele de r´egression lin´eaire avec leurs ´ecarts types individuels. Vous voulez tester une hypoth`ese jointe qui n’est pas test´ee par les auteurs de l’article. Pouvez-vous construire une statistiqueF pour effectuer le test ? Est-ce qu’il y a moyen d’effectuer le test ? Expliquezbri`evementsans donner tous les d´etails.
3. Voici deux mod`eles lin´eaires de r´egression multiple pour expliquer les variations de la variableY.
Yi =β0+β1X1i+β2X2i+β3X3i+ui;
Yi =γ0+γ1(X1i−X3i) +γ2X2i+ ˜ui.
Est-ce qu’il y a un mod`ele dont laSSR(somme des r´esidus au carr´e) devrait ˆetre moins ´elev´ee ? Expliquez en d´etail.
2 Propri´et´es d’estimateurs (15 points)
1. Expliquez en mots et en d´etail ce que veut dire βˆ−→p β pour l’estimateurβˆd’un param`etreβ.
2. Expliquez en mots et en d´etail ce que veut dire βˆ−→d N β , σ2β pour l’estimateurβˆd’un param`etreβ.
3. Sous quelles conditions est-ce que l’estimateur MCO deβdans le mod`ele de r´egression multiple est l’estimateur le plus efficient ?
4. Soit la variable al´eatoireY qui converge en probabilit´e `aY¯ : Y −→p Y ,¯
et soit la variable al´eatoireZ qui converge en distribution `a une loi normale :
Z −→d N µZ , σZ2 .
A quoi doit converger le produit des deux variables al´eatoires` Y Z? Expliquez et justifiez votre r´eponse.
3 Mod`ele de r´egression multiple (50 points)
Soit le mod`ele de r´egression multiple estim´e avec des donn´ees sur 1 660 individus. Les variables sont :
– Y : la variable d´ependante, la grandeur de l’individu (en pousses – il s’agit d’une ´etude am´ericaine) ;
– X1: la grandeur du p`ere de l’individu ; – X2: la grandeur de la m`ere de l’individu ;
– X3: le sexe de l’individu (1 = homme, 0 = femme) Le mod`ele estim´e est
Yi =β0+β1X1i+β2X2i+β3X3i+ui
Les r´esultats de l’estimation sont comme suit.
Coefficient Variable Estim´e Ecart type´ βˆ0 Constante : 16.967 4.658
βˆ1 X1: 0.299 0.069
βˆ2 X2: 0.412 0.051
βˆ3 X3 5.298 0.364
R2 : 0.660
R¯2 0.659
SSR 8633.165
F (3,1656) 1.044e+3 Prob> F 0.000 Le mod`ele a ´et´e estim´esansl’optionrobuste.
1. D´ecrivez comment calculer l’´ecart type de la r´egression.
2. ´Ecrivez les statistiques que l’on pourrait utiliser pour tester la significativit´e de chacun des coefficients individuels (tests d’hypoth`ese simples). ´Ecrivez
3. Sansutiliser de table ou de calculatrice, est-ce les coefficients individuels sont significatifs `a un niveau de 10% ? De 5% ? De 1% ? Expliquez.
4. Quelle est l’hypoth`ese test´ee par la StatistiqueF dans la deuxi`eme partie du tableau ?
5. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.
6. Est-ce que la p-value de cette statistique a ´et´e calcul´ee utilisant ce que nous avons appel´e dans le cours l’inf´erence asymptotique (utilisant la
convergence en distribution) ? Expliquez.
7. Est-ce qu’il y aurait une grande diff´erence dans ce cas-ci entre la p-value asymptotique et la p-value qui suppose que la statistiqueF calcul´ee suit une distributionF exacte ? Expliquez.
8. Expliquez comment tester la significativit´e (jointe) de la grandeur des parents. ´Ecrivez la restriction qui est test´ee sous forme matricielle.
9. Tel qu’indiqu´e dans l’´enonc´e de la question, les r´esultatsne sont pasbas´es sur l’estimation robuste. Expliquez une fac¸on de tester la significativit´e (jointe) de la grandeur des parents en estimant une version contrainte du mod`ele. ´Ecrivez cette version du mod`ele sous forme non matricielle.
10. Expliquez comment construire la statistiqueF de la partie pr´ec´edente sur la base de l’output standard du logiciel. Je ne vous demande pas d’´ecrire la formule compl`ete. Il suffit d’indiquer quelles sont les informations
requises.
11. Vous soupc¸onnez que l’impact de la grandeur de chacun des parents d´epend du sexe de l’individu. Quel serait le mod`ele si c’est le cas ?
12. Expliquez comment tester si l’impact de la grandeur des parents d´epend du sexe de l’individu (hypoth`ese jointe).
13. Expliquez bri`evement comment construire l’intervalle de confiance de 95% pour l’impact de la grandeur de la m`ere (dans le cas plus simple ou cet impact ne d´epend pas du sexe de l’individu).
14. Quelle serait la forme g´eom´etrique de l’ensemble de confiance de 95%
pour les impacts des grandeurs des parents sur la grandeur de l’individu ? Vous ne devez pas fournir une formule alg´ebriques.
4 Mod`eles de r´egression non lin´eaires (20 points)
Soit le mod`ele de r´egression non lin´eaire suivant : Yi =β0+β1X1i+β2X1i2
+β3X2i+ui
Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYi d’une augmentation duniveaudeX2i.
1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez clairement en donnant une r´eponse math´ematique ainsi qu’en mots.
2. D´erivez une expression alg´ebrique pour le changement pr´edit
∆Y ≡Y2−Y1 suite `a un changement de la valeur de la variable explicative deX11 `aX12. Autrement dit,∆X1 =X12−X11. Ici,Y2 indique la valeur deY apr`es le changement de la valeur deX1, etY1 indique sa valeur avant le changement.X11indique la valeur initiale deX1 etX12indique sa valeur apr`es le changement. La valeur deX2 reste inchang´ee. Vous pouvez utiliser l’approximation suivante :
X122−X112 ≈2X11(X12−X11) = 2X11∆X1.
3. Exprimez ce changement en notation matricielle (vectorielle) comme
∆Y = ∆X1δβ.ˆ Autrement dit, pr´ecisez les ´el´ements deδ.
4. ´Ecrivez une expression pour la variance de∆Y ou Var(∆Y)
en fonction de l’expression du cˆot´e droit de l’´equation ci-dessus.
Simplifiez cette expression et exprimez la variance de∆Y en fonction de la matrice variance-covariance de l’estimateurβ.ˆ
5. ´Etant donn´e cette variance, expliquez en d´etail comment construire l’intervalle de confiance de 95% pour∆Y.
6. ´Ecrivez une version ´equivalente du mod`ele o`u leδβˆde la partie 3 (ou plutˆotδβ si vous ´ecrivez le mod`ele de la population) est directement un des param`etres du mod`ele transform´e (de cette fac¸on, le logiciel de r´egression calcule automatiquement l’´ecart type dont nous avons besoin pour calculer
5 Variables instrumentales (15 points)
Oui, le nombre total de points est 115. Consid´erez cette question comme une question bonus.
Soit le mod`ele de r´egression multiple donn´e par Y =Xβ+U
avec la notation habituelle et avec(k+ 1)variables explicatives avec la
constante. Supposons que l’hypoth`ese d’ind´ependance conditionnelle des termes d’erreurs n’est pas v´erifie et donc
E(U|X)6= 0.
Par contre, il y al > k+ 1variablesW qui satisfont l’hypoth`ese Cov(U, W) = 0
Consid´erez les valeurs pr´edites desX r´esultant d’une s´erie de r´egressions des variables dansX sur les variables instrumentales :
Xˆ ≡W(W0W)−1W0X.
Consid´erez le mod`ele transform´e par rapport au mod`ele initial et obtenu en pr´emultipliant le mod`ele initial parW(W0W)−1W0:
W(W0W)−1W0Y =W(W0W)−1W0Xβ+W(W0W)−1W0U qui peut ˆetre ´ecrit
Yˆ = ˆXβ+ ˜U .
Consid´erez maintenant l’estimateur MCO du mod`ele transform´e. Indice — cet estimateur prend la forme habituelle dans les variables transform´eesYˆ etX.ˆ
1. ´Ecrivez l’estimateur MCO (βˆV I o`uV I veut direvariables
instrumentales) en termes des variables transform´eesYˆ etX. Oui, il fautˆ se souvenir de la formule matricielle pour l’estimateur MCO : c’est la seule occasion o`u je vous demande de vous souvenir par coeur d’une formule.
2. Montrez que l’estimateur peut s’´ecrire comme βˆV I =
X0W(W0W)−1W0X−1
X0W(W0W)−1W0Y Il s’agit de substituer et de simplifier.
3. Montrez que l’estimateur peut s’´erire βˆV I =β+
X0W(W0W)−1W0X−1
X0W(W0W)−1W0U.
Indice — substituezY =Xβ+U dans la d´efinition de l’estimateur et simplifiez.
4. `A cause de la pr´esence deX dans la d´efinition de l’estimateur, on ne peut montrer l’absence de biais de l’estimateur. Si, par contre,
W0U n
−p
→Cov(U, W), montrez que l’estimateurβˆV I est convergent.
document r´evis´e le : 22/12/2012