Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

(1)

ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

c 2011, Steve Ambler Hiver 2012

Voici quelques consignes importants.

– Il est important d’écrire lisiblement. Je ne vais pas passer trop de temps à déchiffrer les réponses barbouillées.

– J’accorde toujours plus de points pour le raisonnement que pour la réponse finale. Si la réponse est erronée et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Même si la réponse est bonne, je ne donnerai que des points partiels s’il n’y a pas d’explication.

– Les justifications peuvent être graphiques, algébriques, ou en mots : la cohérence et la logique sont primordiales.

– Ne pas simplifier les réponses.Si vous simplifiez vos réponses, je ne peux retracer vos erreurs éventuelles, ce qui ne me permettra pas d’accorder des points partiels.

– Les calculatricesne sont pas permises.

1 R´eponses courtes (15 points)

1. Vous avez estimé un modèle de régression multiple avec trois variables explicatives (à part la constante). Le modèle est

(2)

Vous voulez tester l’hypothèse nulle que le produit des trois coefficientsβ₁, β₂ etβ₃est égal à un. Pouvez-vous utiliser un testt? Un testF ? Expliquez pourquoi ou pourquoi pas.

2. Vous avez un article publié qui rapporte les coefficients estimés d’un modèle de régression linéaire avec leurs écarts types individuels. Vous voulez tester une hypothèse jointe qui n’est pas testée par les auteurs de l’article. Pouvez-vous construire une statistiqueF pour effectuer le test ? Est-ce qu’il y a moyen d’effectuer le test ? Expliquezbrièvementsans donner tous les détails.

3. Voici deux modèles linéaires de régression multiple pour expliquer les variations de la variableY.

Y_i =β₀+β₁X_1i+β₂X_2i+β₃X_3i+u_i;

Y_i =γ₀+γ₁(X_1i−X_3i) +γ₂X_2i+ ˜u_i.

Est-ce qu’il y a un modèle dont laSSR(somme des résidus au carré) devrait être moins élevée ? Expliquez en détail.

2 Propri´et´es d’estimateurs (15 points)

1. Expliquez en mots et en d´etail ce que veut dire βˆ−→^p β pour l’estimateurβˆd’un param`etreβ.

2. Expliquez en mots et en d´etail ce que veut dire βˆ−→^d N β , σ²_β pour l’estimateurβˆd’un param`etreβ.

3. Sous quelles conditions est-ce que l’estimateur MCO deβdans le mod`ele de r´egression multiple est l’estimateur le plus efficient ?

4. Soit la variable aléatoireY qui converge en probabilité àY¯ : Y −→^p Y ,¯

(3)

et soit la variable al´eatoireZ qui converge en distribution `a une loi normale :

Z −→^d N µZ , σ_Z² .

A quoi doit converger le produit des deux variables al´eatoires` Y Z? Expliquez et justifiez votre r´eponse.

3 Mod`ele de r´egression multiple (50 points)

Soit le modèle de régression multiple estimé avec des données sur 1 660 individus. Les variables sont :

– Y : la variable dépendante, la grandeur de l’individu (en pousses – il s’agit d’une étude américaine) ;

– X₁: la grandeur du p`ere de l’individu ; – X₂: la grandeur de la m`ere de l’individu ;

– X₃: le sexe de l’individu (1 = homme, 0 = femme) Le mod`ele estim´e est

Yi =β0+β1X1i+β2X2i+β3X3i+ui

Les r´esultats de l’estimation sont comme suit.

Coefficient Variable Estim´e Ecart type´ βˆ₀ Constante : 16.967 4.658

βˆ₁ X₁: 0.299 0.069

βˆ₂ X₂: 0.412 0.051

βˆ₃ X₃ 5.298 0.364

R² : 0.660

R¯² 0.659

SSR 8633.165

F (3,1656) 1.044e+3 Prob> F 0.000 Le modèle a été estimésansl’optionrobuste.

1. Décrivez comment calculer l’écart type de la régression.

2. Écrivez les statistiques que l’on pourrait utiliser pour tester la significativité de chacun des coefficients individuels (tests d’hypothèse simples). Écrivez

(4)

3. Sansutiliser de table ou de calculatrice, est-ce les coefficients individuels sont significatifs `a un niveau de 10% ? De 5% ? De 1% ? Expliquez.

4. Quelle est l’hypothèse testée par la StatistiqueF dans la deuxième partie du tableau ?

5. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.

6. Est-ce que la p-value de cette statistique a été calculée utilisant ce que nous avons appelé dans le cours l’inférence asymptotique (utilisant la

convergence en distribution) ? Expliquez.

7. Est-ce qu’il y aurait une grande diff´erence dans ce cas-ci entre la p-value asymptotique et la p-value qui suppose que la statistiqueF calcul´ee suit une distributionF exacte ? Expliquez.

8. Expliquez comment tester la significativité (jointe) de la grandeur des parents. Écrivez la restriction qui est testée sous forme matricielle.

9. Tel qu’indiqué dans l’énoncé de la question, les résultatsne sont pasbasés sur l’estimation robuste. Expliquez une façon de tester la significativité (jointe) de la grandeur des parents en estimant une version contrainte du modèle. Écrivez cette version du modèle sous forme non matricielle.

10. Expliquez comment construire la statistiqueF de la partie précédente sur la base de l’output standard du logiciel. Je ne vous demande pas d’écrire la formule complète. Il suffit d’indiquer quelles sont les informations

requises.

11. Vous soupçonnez que l’impact de la grandeur de chacun des parents dépend du sexe de l’individu. Quel serait le modèle si c’est le cas ?

12. Expliquez comment tester si l’impact de la grandeur des parents d´epend du sexe de l’individu (hypoth`ese jointe).

13. Expliquez brièvement comment construire l’intervalle de confiance de 95% pour l’impact de la grandeur de la mère (dans le cas plus simple ou cet impact ne dépend pas du sexe de l’individu).

14. Quelle serait la forme g´eom´etrique de l’ensemble de confiance de 95%

pour les impacts des grandeurs des parents sur la grandeur de l’individu ? Vous ne devez pas fournir une formule alg´ebriques.

(5)

4 Modèles de régression non linéaires (20 points)

Soit le modèle de régression non linéaire suivant : Yi =β0+β1X1i+β2X1i2

+β3X2i+ui

Vous avez estimé ce modèle et vous voulez prédire l’impact surY_i d’une augmentation duniveaudeX_2i.

1. Est-ce que ce modèle est non linéaire dans les paramètres ? Expliquez clairement en donnant une réponse mathématique ainsi qu’en mots.

2. Dérivez une expression algébrique pour le changement prédit

∆Y ≡Y₂−Y₁ suite à un changement de la valeur de la variable explicative deX₁₁ àX₁₂. Autrement dit,∆X₁ =X₁₂−X₁₁. Ici,Y₂ indique la valeur deY après le changement de la valeur deX₁, etY₁ indique sa valeur avant le changement.X₁₁indique la valeur initiale deX₁ etX₁₂indique sa valeur après le changement. La valeur deX₂ reste inchangée. Vous pouvez utiliser l’approximation suivante :

X₁₂²−X₁₁² ≈2X₁₁(X₁₂−X₁₁) = 2X₁₁∆X₁.

3. Exprimez ce changement en notation matricielle (vectorielle) comme

∆Y = ∆X₁δβ.ˆ Autrement dit, précisez les éléments deδ.

4. ´Ecrivez une expression pour la variance de∆Y ou Var(∆Y)

en fonction de l’expression du côté droit de l’équation ci-dessus.

Simplifiez cette expression et exprimez la variance de∆Y en fonction de la matrice variance-covariance de l’estimateurβ.ˆ

5. Étant donné cette variance, expliquez en détail comment construire l’intervalle de confiance de 95% pour∆Y.

6. Écrivez une version équivalente du modèle où leδβˆde la partie 3 (ou plutôtδβ si vous écrivez le modèle de la population) est directement un des paramètres du modèle transformé (de cette façon, le logiciel de régression calcule automatiquement l’écart type dont nous avons besoin pour calculer

(6)

5 Variables instrumentales (15 points)

Oui, le nombre total de points est 115. Consid´erez cette question comme une question bonus.

Soit le modèle de régression multiple donné par Y =Xβ+U

avec la notation habituelle et avec(k+ 1)variables explicatives avec la

constante. Supposons que l’hypothèse d’indépendance conditionnelle des termes d’erreurs n’est pas vérifie et donc

E(U|X)6= 0.

Par contre, il y al > k+ 1variablesW qui satisfont l’hypoth`ese Cov(U, W) = 0

Considérez les valeurs prédites desX résultant d’une série de régressions des variables dansX sur les variables instrumentales :

Xˆ ≡W(W⁰W)⁻¹W⁰X.

Considérez le modèle transformé par rapport au modèle initial et obtenu en prémultipliant le modèle initial parW(W⁰W)⁻¹W⁰:

W(W⁰W)⁻¹W⁰Y =W(W⁰W)⁻¹W⁰Xβ+W(W⁰W)⁻¹W⁰U qui peut ˆetre ´ecrit

Yˆ = ˆXβ+ ˜U .

Considérez maintenant l’estimateur MCO du modèle transformé. Indice — cet estimateur prend la forme habituelle dans les variables transforméesYˆ etX.ˆ

1. ´Ecrivez l’estimateur MCO (βˆ_{V I} o`uV I veut direvariables

instrumentales) en termes des variables transform´eesYˆ etX. Oui, il fautˆ se souvenir de la formule matricielle pour l’estimateur MCO : c’est la seule occasion o`u je vous demande de vous souvenir par coeur d’une formule.

2. Montrez que l’estimateur peut s’´ecrire comme βˆ_{V I} =

X⁰W(W⁰W)⁻¹W⁰X⁻¹

X⁰W(W⁰W)⁻¹W⁰Y Il s’agit de substituer et de simplifier.

(7)

3. Montrez que l’estimateur peut s’´erire βˆ_{V I} =β+

X⁰W(W⁰W)⁻¹W⁰X−1

X⁰W(W⁰W)⁻¹W⁰U.

Indice — substituezY =Xβ+U dans la d´efinition de l’estimateur et simplifiez.

4. À cause de la présence deX dans la définition de l’estimateur, on ne peut montrer l’absence de biais de l’estimateur. Si, par contre,

W⁰U n

−p

→Cov(U, W), montrez que l’estimateurβˆV I est convergent.

document r´evis´e le : 22/12/2012