ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2011, Steve Ambler Hiver 2011
Voici quelques consignes importants.
– Il est important d’´ecrire lisiblement. Je ne vais pas passer trop de temps `a d´echiffrer les r´eponses barbouill´ees.
– J’accorde toujours plus de points pour le raisonnement que pour la r´eponse finale. Si la r´eponse est erron´ee et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Mˆeme si la r´eponse est bonne, je ne donne- rai que des points partiels s’il n’y a pas d’explication.
– Les justifications peuvent ˆetre graphiques, alg´ebriques, ou en mots : la coh´erence et la logique sont primordiales.
– Ne pas simplifier les r´eponses.Si vous simplifiez vos r´eponses, je ne peux retracer vos erreurs ´eventuelles, ce qui ne me permettra pas d’accorder des points partiels.
– Les calculatricesne sont pas permises.
1 R´eponses courtes (20 points)
1. Voici un exemple d’hypoth`ese jointe pour un mod`ele de r´egression mul- tiple :
H0 :β1 = 1, β2 = 3, β1−2β2+β3 =β4.
Est-ce que cette hypoth`ese jointe peut ˆetre test´ee avec une statistique F ? Expliquez clairement pourquoi ou pourquoi pas.
2. Est-il possible de tester l’hypoth`ese nulle H0 :β1 = 0.5 contre l’hypoth`ese alternative
H1 :β1 >0.5
avec une statistiqueF ? Expliquez clairement pourquoi ou pourquoi pas.
3. Vous avez un article publi´e qui rapporte les coefficients estim´es d’un mod`ele de r´egression lin´eaire avec leurs ´ecarts types individuels. Vous voulez une hypoth`ese jointe qui n’est pas test´ee par les auteurs de l’article. Pouvez-vous construire une statistique F pour effectuer le test ? Est-ce qu’il y a moyen d’effectuer le test ? Expliquez.
4. Expliquer clairement en mots pourquoi, lorsqu’on ajoute une variable ex- plicative `a un mod`ele de r´egression lin´eaire, la mesure de l’ajustement sta- tistiqueR2 ne peut diminuer.
2 Propri´et´es d’estimateurs (20 points)
1. Donnez une d´efinition de l’absence de biais d’un estimateur. Expliquez en mots ce que l’on veut dire parestimateur non biais´e.
2. Expliquez en mots ce que veut dire laconvergence en probabilit´e. 3. Expliquez en mots ce que veut dire laconvergence en distribution. 4. Lorsqu’on ´etudie la matrice variance-covariance de l’estimateur βˆdans le
mod`ele de r´egression multiple, il est habituel d’analyser le comportement
de √
n
βˆ−β
au lieu d’´etudier le comportement du vecteur βˆlui-mˆeme. Expliquez clai- rement pourquoi.
5. Expliquez le concept de l’efficience d’un estimateur lorsqu’il s’agit d’un estimateur d’un param`etre scalaire. Expliquez en mots (ou, si vous pr´ef´erez, utilisant une expression alg´ebrique), le concept de l’efficience d’un estimateur lorsqu’il s’agit d’un vecteur de param`etres comme βˆ dans le mod`ele de r´egression multiple.
6. Avec les hypoth`eses de base que nous utilisons afin de d´eriverΣˆβˆ(la matrice de variance-covariance de l’estimateur MCO dans le mod`ele de r´egression multiple), est-ce que nous savons si l’estimateur MCO est l’estimateur le plus efficient ? Expliquez.
3 Mod`ele de r´egression multiple (40 points)
Soit le mod`ele de r´egression multiple estim´e avec des donn´ees sur 28 155 hommes am´ericains qui ´etaient employ´es en mars 1988. La variable d´ependante est le salaire annuel en milliers de dollars, calcul´e en logs. Les variables explica- tives sont l’´education (EDU, en nombre d’ann´ees), l’exp´erience (EXP, en nombre d’ann´ees) et la race (AFR, une variable dichotomique qui s´epare l’´echantillon en deux cat´egories (0 si blanc et 1 si afro-am´ericain).
Les r´esultats de l’estimation sont comme suit.
Coefficient Variable Estim´e Ecart type´ βˆ0 Constante : 4.321395 0.019174
βˆ1 EXP : 0.077473 0.000880
βˆ2 EXP2 -0.001316 0.000019
βˆ3 EDU : 0.086673 0.001272
βˆ4 AFR : -0.243364 0.012918
Ecart type de la r´egression :´ 0.584
Degr´es de libert´e : 28150
R2: 0.335
R¯2 0.335
StatistiqueF 3.54e+3
Degr´es de libert´e de la statistiqueF 4, 28150 P-value de la statistiqueF <2e-16 Le mod`ele a ´et´e estim´e sans l’optionrobuste.
1. ´Ecrivez les statistiques que l’on pourrait utiliser pour tester la significativit´e de chacun des coefficients individuels (tests d’hypoth`ese simples). ´Ecrivez les valeurs num´eriques des ces statistiques,sans les simplifier.
2. Sans utiliser de tables ou de calculatrices, est-ce que les coefficients indivi- duels sont significatifs ? `A quel niveau (10%, 5%, 1% etc.) ? Expliquez.
3. Quelle est l’hypoth`ese test´ee par la StatistiqueF dans la deuxi`eme partie du tableau ?
4. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.
5. Est-ce que la p-value de cette statistique a ´et´e calcul´ee utilisant ce que nous avons appel´e dans le cours l’inf´erence asymptotique (utilisant la conver- gence en distribution) ? Expliquez.
6. Est-ce qu’il y aurait une grande diff´erence dans ce cas-ci entre la p-value asymptotique et la p-value qui suppose que la statistique F calcul´ee suit une distributionF exacte ? Expliquez.
7. Expliquez comment tester la significativit´e de l’exp´erience pour expliquer le salaire. (Notez que cette variable paraˆıt dans le mod`ele aux premier et deuxi`eme degr´es). ´Ecrivez la restriction qui est test´ee sous forme matri- cielle.
8. Tel qu’indiqu´e dans l’´enonc´e de la question, les r´esultats ne sont pas bas´es sur l’estimation robuste. Expliquez une fac¸on d’obtenir la statistiqueF du tableau bas´ee sur l’estimation d’une version contrainte du mod`ele. ´Ecrivez cette version du mod`ele sous forme non matricielle.
9. Expliquez comment construire la statistiqueF de la partie pr´ec´edente sur la base de l’output standard du logiciel.
10. Vous soupc¸onner que l’impact de l’´education sur le salaire d´epend de la race de l’individu. Expliquez comment estimer l’impact de l’´education en permettant une diff´erence entre les blancs et les afro-am´ericains. Expliquez comment tester si l’impact est diff´erent.
11. Expliquez comment tester si l’impact de toutes les variables explicatives (sauf la constante) est diff´erent entre les blancs et les afro-am´ericains.
12. Pour le mod`ele de base (dont les r´esultats sont rapport´es dans le tableau), expliquez comment pr´edire l’impact sur le salaire d’une ann´ee additionnelle d’exp´erience.
13. Expliquez bri`evement comment construire l’intervalle de confiance de 95%
pour cet impact sur le log du salaire.
14. Puisque la variable d´ependante de la r´egression est mesur´ee en logs, est-ce que l’intervalle de confiance pour le changement du salaire en niveau va ˆetre sym´etrique autour de la valeur du changement pr´edit ? Expliquez.
4 Moindres carr´es pond´er´es (20 points)
Soit le mod`ele de r´egression multiple donn´e par Y =Xβ+U
avec la notation habituelle. Supposons que la variance conditionnelle de l’erreur ui est donn´ee par
Var(ui|X) =σi2.
Supposons aussi que nous connaissons les valeurs exactes des σi2. Consid´erons maintenent le mod`ele transform´e qui peut s’´ecrire en forme non matricielle comme
1
σiYi = 1
σiβ0+ 1
σiβ1X1i+ 1
σiβ2X2i+. . .+ 1
σiβkXki+u0i, avec u0i ≡ σ1
iui. Nous avons mulipli´e chaque ´equation (des deux cˆot´es) par l’in- verse de la racine carr´ee de la variance de l’erreur.
1. Calculez la variance conditionnelle deu0i.
2. Soit la matrice diagonale W avec l’i`eme ´el´ement sur la diagonale donn´ee par σ1
i. Montrez que nous pouvons ´ecrire le mod`ele en notation matricielle comme
W Y =W Xβ+W U.
Indice – Il s’agit tout simplement de v´erifier que l’i`eme ´equation de ce syst`eme est de la forme du mod`ele transform´e en notation non matricielle.
3. La forme habituelle de l’estimateur MCO du mod`ele de r´egression multiple est donn´ee par(X0X)−1X0Y. Montrez alg´ebriquement que pour le mod`ele transform´e l’estimateur MCO peut s’´ecrire
(X0ZX)−1X0ZY
o`uZ ≡ W0W = W W. Indice – Si vous savez comment calculer la trans- pos´ee du produit de deux matrices vous ˆetes capables de r´epondre `a cette question.
4. Est-ce que l’estimateur est l’estimateur MCO ? Justifiez votre r´eponse.
5. Pour des points suppl´ementaires, montrez que l’estimateur est non bias´e.
Indice – Substituez Y par Xβ +U dans la d´efinition de l’estimateur et simplifiez.
6. Pourquoi serait-il avantageux d’utiliser cet estimateur au lieu d’utiliser l’es- timateur MCO standard ? Indice – Pensez aux hypoth`eses qu’il faut utiliser pour prouver le th´eor`eme Gauss-Markov.
5 Mod`eles de r´egression non lin´eaires (20 points)
Soit le mod`ele de r´egression non lin´eaire suivant :
Yi =β0+β1log (X1i) +β2X2i+β3X1iX2i+ui
Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYid’une augmen- tation du niveau deX1i.
1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez clai- rement en donnant une r´eponse math´ematique ainsi qu’en mots.
2. D´erivez une expression alg´ebrique pour le changement pr´edit∆Yi ≡Y2−Y1 suite `a un changement de la valeur de la premi`ere variable explicative deX11
`aX12, pour une valeur constante de la deuxi`eme variable donn´ee par X21. Autrement dit,∆X1 =X12−X11. (Notez queY2 se r´ef`ere `a la valeur deY apr`es le changement de la valeur deX1, etY1 se r´ef`ere `a sa valeur avant le changement.X11se r´ef`ere `a la valeur initiale deX1etX12`a sa valeur apr`es le changement. La valeur deX2 reste constante.)
3. Exprimez ce changement en notation matricielle (vectorielle) comme
∆Yi = ∆X1iδβ.ˆ Autrement dit, pr´ecisez les ´el´ements deδ.
4. ´Ecrivez une expression pour la variance de∆Yiou Var(∆Yi)
en fonction de l’expression du cˆot´e droit de l’´equation. Simplifiez cette ex- pression et exprimez la variance de∆Yien fonction de la matrice variance- covariance de l’estimateurβ.ˆ
5. ´Etant donn´e cette variance, expliquez en d´etail comment construire l’inter- valle de confiance de 95% pour∆Yi.
6. ´Ecrivez une version ´equivalente du mod`ele o`u leδβ de la partie pr´ec´edente est directement un des param`etres du mod`ele transform´e (de cette fac¸on, le logiciel de r´egression calcule automatiquement l’´ecart type dont nous avons besoin pour calculer l’intervalle de confiance.
document cr´e´e le : 25/04/2011