ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2012, Steve Ambler Automne 2012
Voici quelques consignes importants.
– Il est important d’´ecrire lisiblement. Je ne vais pas passer trop de temps `a d´echiffrer les r´eponses barbouill´ees.
– J’accorde toujours plus de points pour le raisonnement que pour la r´eponse finale. Si la r´eponse est erron´ee et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Mˆeme si la r´eponse est bonne, je ne donne- rai que des points partiels s’il n’y a pas d’explication.
– Les justifications peuvent ˆetre graphiques, alg´ebriques, ou en mots : la co- h´erence et la logique sont primordiales.
– Ne pas simplifier les r´eponses.Si vous simplifiez vos r´eponses, je ne peux retracer vos erreurs ´eventuelles, ce qui ne me permettra pas d’accorder des points partiels.
– Les calculatricesne sont pas permises. Relire le consigne pr´ec´edent.
1 R´eponses courtes (15 points)
1. Il est toujours possible d’´ecrire un mod`ele qui permet d’expliquer toute la variation de la variable d´ependante autour de sa moyenne. Vrai, faux ou incertain ? Expliquez en d´etail.
2. Cette question s’enchaˆıne par rapport `a la sous-question pr´ec´edente. Est- ce qu’un mod`ele qui explique toute la variation de la variable d´ependante autour de sa moyenne sera un bon mod`ele pour pr´edire les valeurs de la variable d´ependante ? Expliquez en d´etail.
3. Voici deux mod`eles lin´eaires de r´egression multiple pour expliquer les va- riations de la variableY.
Yi =β0+β1X1i+β2X2i+β3X3i+ui;
Yi =β0+ (β1+β2)X1i+β2(X2i−X1i) +β3X3i+ ˜ui.
Est-ce qu’il y a un mod`ele dont la SSR (somme des r´esidus au carr´e) de- vrait ˆetre moins ´elev´ee ? Est-ce que les estim´es deβ0 et deβ3 devraient ˆetre diff´erents ? Expliquez en d´etail.
2 Propri´et´es d’estimateurs (15 points)
1. ´Ecrivez le mod`ele de r´egression multiple en notation matricielle. Donnez la d´efinition et les dimensions de toutes les variables du mod`ele.
2. Nous savons que l’estimateur MCO du mod`ele de r´egression multiple est donn´e par
βˆ= (X0X)−1X0Y.
Montrezen d´etailque l’estimateur doit ˆetre ´egal `a βˆ=β+ (X0X)−1X0U.
3. Quelle hypoth`ese statistique concernant le mod`ele de r´egression multiple permet de d´emontrer que l’estimateur MCO est non biais´e ?
4. Montrez en d´etail que la variance (matrice variance-covariance) de l’esti- mateur√
nβˆdoit converger `a Q−1E
(X0U)
√n
(U0X)
√n
Q−1 o`u
Q=E(X0X) n . Notez que je ne vous demande pas d’´evaluer E
(X√0U) n
(U√0X) n
.
3 Mod`ele de r´egression multiple (50 points)
Soit le mod`ele de r´egression multiple estim´e avec des donn´ees sur 2 735 indi- vidus. Les variables sont :
– Y : la variable d´ependante, le salaire-horaire r´eel de ’individu en dollars constants par heure ;
– X1: le nombre d’ann´ees de scolarisation de l’individu (11 pour un diplˆome secondaire, 13 pour un diplˆome du niveau C ´EGEP, etc.) ;
– X2 : une variable dichotomique qui prend la valeur 1 si l’individu est un homme, 0 si l’individu est une femme ;
– X3 : le revenu familial annuel des parents de l’individu en dizaines de mil- liers de dollars.
Le mod`ele estim´e est
Yi =β0+β1X1i+β2X2i+β3X3i+ui Les r´esultats de l’estimation sont comme suit.
Coefficient Variable Estim´e Ecart type´ βˆ0 Constante : 3.241 0.487
βˆ1 X1: 0.675 0.129
βˆ2 X2: 1.341 0.297
βˆ3 X3 0.148 0.002
R2: 0.134
R¯2 0.133
SSR 394.126
F (3,2371) 1.23e+2 Prob> F 0.000 Le mod`ele a ´et´e estim´esansl’optionrobuste.
1. Montrez comment calculer l’´ecart type de la r´egression.
2. ´Ecrivez les statistiques que l’on pourrait utiliser pour tester la significativit´e de chacun des coefficients individuels (tests d’hypoth`ese simples). ´Ecrivez les valeurs num´eriques des ces statistiques,sans les simplifier. ´Ecrivez ex- plicitement quelle est l’hypoth`ese nulle test´ee dans chaque cas.
3. Sansutiliser de table, est-ce les coefficients individuels sont significatifs `a un niveau de 10% ? De 5% ? De 1% ? Expliquez.
4. Quelle est l’hypoth`ese nulle test´ee par la Statistique F dans la deuxi`eme partie du tableau ? Quelle est l’hypoth`ese alternative ?
5. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.
6. Quel serait le salaire-horaire pr´edit pour un homme avec un diplˆome de Bacc. (16 ans de scolarisation) dont les parents ont un revenu annuel de 57.6 milliers de dollars ?
7. De quelle information auriez-vous besoin pour pr´edire le salaire-horaire d’un homme avec le nombre moyen d’ann´ees de scolarisation et dont les parents gagnent le revenu annuel moyen ?
8. Vous soupc¸onnez que l’impact de l’´education sur le revenu pourrait d´ependre du sexe de l’individu. Comment pourriez-vous modifier le mod`ele pour tenir compte de cette possibilit´e ?
9. Dans le contexte de ce mod`ele modifi´e, expliquez comment tester la significativit´e (jointe) de l’impact de l’´education sur le salaire, soit ind´ependamment du sexe de l’individu soit d´ependant du sexe de l’individu.
Ecrivez l’hypoth`ese nulle qui est test´ee sous forme matricielle.´
10. Soit la variable dichotomiqueX4i qui prend la valeur 1 si l’individu est une femme, 0 si l’individu est un homme. Vous ajoutez cette variable au mod`ele original. Qu’est-ce qui arrive lorsque vous estimez le mod`ele ?
11. Tel qu’indiqu´e dans l’´enonc´e de la question, les r´esultatsne sont pasbas´es sur l’estimation robuste. Expliquez une fac¸on de tester la significativit´e (jointe) de l’impact de l’´education (pour le mod`ele modifi´e) en estimant une version contrainte du mod`ele. ´Ecrivez cette version du mod`ele sous forme non matricielle.
12. Expliquez comment construire la statistique F de la partie pr´ec´edente sur la base de l’output standard du logiciel. Je ne vous demande pas d’´ecrire la formule compl`ete. Il suffit d’indiquer quelles sont les informations requises.
13. Expliquez bri`evement comment construire l’intervalle de confiance de 95%
pour l’impact de l’´education sur le salaire (pour la version originale du mod`ele).
14. Quelle serait la forme g´eom´etrique de l’ensemble de confiance de 95% pour les impacts de l’´education et le sexe sur le salaire (version originale du mod`ele) ? Vous ne devez pas fournir une formule alg´ebrique.
4 Mod`eles de r´egression non lin´eaires (20 points)
Soit le mod`ele de r´egression non lin´eaire suivant :
Yi =β0+β1X1i+β2X1iX2i+β3X2i+β4X2i2+ui
Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYid’une augmen- tation duniveaudeX2i.
1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez clai- rement en donnant une r´eponse math´ematique ainsi qu’en mots.
2. D´erivez une expression alg´ebrique pour le changement pr´edit∆Y ≡(Y2 −Y1) suite `a un changement de la valeur de la variable explicative deX21 `aX22. Autrement dit, ∆X2 = X22−X21. Ici, Y2 indique la valeur de Y apr`es le changement de la valeur de X2, et Y1 indique sa valeur avant le change- ment.X21indique la valeur initiale deX2 etX22indique sa valeur apr`es le changement. La valeur deX1 reste inchang´ee.
3. Exprimez ce changement en notation matricielle (vectorielle) comme
∆Y = ∆X2δβ.ˆ Autrement dit, pr´ecisez les ´el´ements deδ.
4. ´Ecrivez une expression pour la variance de∆Y ou Var(∆Y)
en fonction de l’expression du cˆot´e droit de l’´equation ci-dessus. Simplifiez cette expression et exprimez la variance de ∆Y en fonction de la matrice variance-covariance de l’estimateurβ.ˆ
5. ´Etant donn´e cette variance, expliquez en d´etail comment construire l’inter- valle de confiance de 95% pour∆Y.
6. ´Ecrivez une version ´equivalente du mod`ele o`u leδβˆde la partie 3 (ou plutˆot δβ si vous ´ecrivez le mod`ele de la population) est directement un des pa- ram`etres du mod`ele transform´e (de cette fac¸on, le logiciel de r´egression calcule automatiquement l’´ecart type dont nous avons besoin pour calculer l’intervalle de confiance).
5 Moindres carr´es pond´er´es (Weighted Least Squares) (15 points en bonus)
Soit le mod`ele de r´egression multiple donn´e par Y =Xβ+U
avec la notation habituelle et avec(k+ 1)variables explicatives avec la constante.
Supposons que l’hypoth`ese d’ind´ependance conditionnelle des termes d’erreurs est v´erifie et donc
E(U|X) = 0.
L’hypoth`ese d’homosc´edasticit´e n’est pas v´erifi´ee, mais par contre on sait que la matrice variance-covariance des erreurs satisfait
Var(U|X) = Ω
avecΩune matrice diagonale o`u l’i`eme ´el´ement sur la diagonale est ´egal `a Var(ui)≡ σi2.
1. Consid´erez le vecteur d’erreurs transform´e en pr´emultipliant par Ω−1/2, la matrice diagonale avec ´el´ements sur la diagonale ´egaux `a1/σi. Autrement dit, consid´erez
Ue ≡Ω−1/2U
Quelle serait sa matrice variance-covariance ? Indice — il faut calculer l’esp´erance deUeUe0.
2. Quel serait l’estimateur MCO du mod`ele o`u on pr´emultiplie le mod`ele entier par Ω−1/2? Indice — On peut ´ecrire le mod`ele en variables transform´ees comme
Ye =Xβe +U .e
3. Si on ne connaˆıt pas les valeurs desσi, sugg´erez un estimateur bas´e sur des choses observables. Indice — l’estimateur MCO dans ce cas est convergent mais non efficient. Pensez `a un estimateur en deux ´etapes, o`u dans la premi`ere
´etape on estime le mod`ele non transform´e par MCO. Je ne vous demande pas bien sˆur de d´emontrer la convergence de cet estimateur.
4. Est-ce que vous pensez que ce nouvel estimateur serait plus ´efficient que l’estimateur MCO du mod`ele non transform´e ? Pourquoi ou pourquoi pas ? document cr´e´e le : 20/12/2012