Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

(1)

ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

c 2011, Steve Ambler Hiver 2011

Voici quelques consignes importants.

– Il est important d’écrire lisiblement. Je ne vais pas passer trop de temps à déchiffrer les réponses barbouillées.

– J’accorde toujours plus de points pour le raisonnement que pour la réponse finale. Si la réponse est erronée et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Même si la réponse est bonne, je ne donne- rai que des points partiels s’il n’y a pas d’explication.

– Les justifications peuvent être graphiques, algébriques, ou en mots : la cohérence et la logique sont primordiales.

– Ne pas simplifier les réponses.Si vous simplifiez vos réponses, je ne peux retracer vos erreurs éventuelles, ce qui ne me permettra pas d’accorder des points partiels.

– Les calculatricesne sont pas permises.

1 R´eponses courtes (20 points)

1. Voici un exemple d’hypothèse jointe pour un modèle de régression multiple :

H0 :β1 = 1, β2 = 3, β1−2β2+β3 =β4.

(2)

Est-ce que cette hypothèse jointe peut être testée avec une statistique F ? Expliquez clairement pourquoi ou pourquoi pas.

2. Est-il possible de tester l’hypoth`ese nulle H0 :β1 = 0.5 contre l’hypoth`ese alternative

H₁ :β₁ >0.5

avec une statistiqueF ? Expliquez clairement pourquoi ou pourquoi pas.

3. Vous avez un article publié qui rapporte les coefficients estimés d’un modèle de régression linéaire avec leurs écarts types individuels. Vous voulez une hypothèse jointe qui n’est pas testée par les auteurs de l’article. Pouvez-vous construire une statistique F pour effectuer le test ? Est-ce qu’il y a moyen d’effectuer le test ? Expliquez.

4. Expliquer clairement en mots pourquoi, lorsqu’on ajoute une variable explicative à un modèle de régression linéaire, la mesure de l’ajustement sta- tistiqueR² ne peut diminuer.

2 Propri´et´es d’estimateurs (20 points)

1. Donnez une d´efinition de l’absence de biais d’un estimateur. Expliquez en mots ce que l’on veut dire parestimateur non biais´e.

2. Expliquez en mots ce que veut dire laconvergence en probabilit´e. 3. Expliquez en mots ce que veut dire laconvergence en distribution. 4. Lorsqu’on ´etudie la matrice variance-covariance de l’estimateur βˆdans le

mod`ele de r´egression multiple, il est habituel d’analyser le comportement

de √

n

βˆ−β

au lieu d’´etudier le comportement du vecteur βˆlui-mˆeme. Expliquez clairement pourquoi.

5. Expliquez le concept de l’efficience d’un estimateur lorsqu’il s’agit d’un estimateur d’un paramètre scalaire. Expliquez en mots (ou, si vous préférez, utilisant une expression algébrique), le concept de l’efficience d’un estimateur lorsqu’il s’agit d’un vecteur de paramètres comme βˆ dans le modèle de régression multiple.

(3)

6. Avec les hypothèses de base que nous utilisons afin de dériverΣˆβˆ(la matrice de variance-covariance de l’estimateur MCO dans le modèle de régression multiple), est-ce que nous savons si l’estimateur MCO est l’estimateur le plus efficient ? Expliquez.

3 Mod`ele de r´egression multiple (40 points)

Soit le modèle de régression multiple estimé avec des données sur 28 155 hommes américains qui étaient employés en mars 1988. La variable dépendante est le salaire annuel en milliers de dollars, calculé en logs. Les variables explicatives sont l’éducation (EDU, en nombre d’années), l’expérience (EXP, en nombre d’années) et la race (AFR, une variable dichotomique qui sépare l’échantillon en deux catégories (0 si blanc et 1 si afro-américain).

Les r´esultats de l’estimation sont comme suit.

Coefficient Variable Estim´e Ecart type´ βˆ0 Constante : 4.321395 0.019174

βˆ₁ EXP : 0.077473 0.000880

βˆ₂ EXP² -0.001316 0.000019

βˆ3 EDU : 0.086673 0.001272

βˆ₄ AFR : -0.243364 0.012918

Ecart type de la r´egression :´ 0.584

Degr´es de libert´e : 28150

R²: 0.335

R¯² 0.335

StatistiqueF 3.54e+3

Degrés de liberté de la statistiqueF 4, 28150 P-value de la statistiqueF <2e-16 Le modèle a été estimé sans l’optionrobuste.

1. Écrivez les statistiques que l’on pourrait utiliser pour tester la significativité de chacun des coefficients individuels (tests d’hypothèse simples). Écrivez les valeurs numériques des ces statistiques,sans les simplifier.

2. Sans utiliser de tables ou de calculatrices, est-ce que les coefficients individuels sont significatifs ? `A quel niveau (10%, 5%, 1% etc.) ? Expliquez.

(4)

3. Quelle est l’hypothèse testée par la StatistiqueF dans la deuxième partie du tableau ?

4. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.

5. Est-ce que la p-value de cette statistique a été calculée utilisant ce que nous avons appelé dans le cours l’inférence asymptotique (utilisant la conver- gence en distribution) ? Expliquez.

6. Est-ce qu’il y aurait une grande diff´erence dans ce cas-ci entre la p-value asymptotique et la p-value qui suppose que la statistique F calcul´ee suit une distributionF exacte ? Expliquez.

7. Expliquez comment tester la significativité de l’expérience pour expliquer le salaire. (Notez que cette variable paraˆıt dans le modèle aux premier et deuxième degrés). Écrivez la restriction qui est testée sous forme matricielle.

8. Tel qu’indiqué dans l’énoncé de la question, les résultats ne sont pas basés sur l’estimation robuste. Expliquez une façon d’obtenir la statistiqueF du tableau basée sur l’estimation d’une version contrainte du modèle. Écrivez cette version du modèle sous forme non matricielle.

9. Expliquez comment construire la statistiqueF de la partie pr´ec´edente sur la base de l’output standard du logiciel.

10. Vous soupçonner que l’impact de l’éducation sur le salaire dépend de la race de l’individu. Expliquez comment estimer l’impact de l’éducation en permettant une différence entre les blancs et les afro-américains. Expliquez comment tester si l’impact est différent.

11. Expliquez comment tester si l’impact de toutes les variables explicatives (sauf la constante) est diff´erent entre les blancs et les afro-am´ericains.

12. Pour le modèle de base (dont les résultats sont rapportés dans le tableau), expliquez comment prédire l’impact sur le salaire d’une année additionnelle d’expérience.

13. Expliquez bri`evement comment construire l’intervalle de confiance de 95%

pour cet impact sur le log du salaire.

14. Puisque la variable dépendante de la régression est mesurée en logs, est-ce que l’intervalle de confiance pour le changement du salaire en niveau va être symétrique autour de la valeur du changement prédit ? Expliquez.

(5)

4 Moindres carrés pondérés (20 points)

Soit le modèle de régression multiple donné par Y =Xβ+U

avec la notation habituelle. Supposons que la variance conditionnelle de l’erreur ui est donn´ee par

Var(u_i|X) =σ_i².

Supposons aussi que nous connaissons les valeurs exactes des σ_i². Considérons maintenent le modèle transformé qui peut s’écrire en forme non matricielle comme

1

σ_iY_i = 1

σ_iβ₀+ 1

σ_iβ₁X_1i+ 1

σ_iβ₂X_2i+. . .+ 1

σ_iβ_kX_ki+u⁰_i, avec u⁰_i ≡ _σ¹

iu_i. Nous avons muliplié chaque équation (des deux côtés) par l’in- verse de la racine carrée de la variance de l’erreur.

1. Calculez la variance conditionnelle deu⁰_i.

2. Soit la matrice diagonale W avec l’ième élément sur la diagonale donnée par _σ¹

i. Montrez que nous pouvons ´ecrire le mod`ele en notation matricielle comme

W Y =W Xβ+W U.

Indice – Il s’agit tout simplement de vérifier que l’ième équation de ce système est de la forme du modèle transformé en notation non matricielle.

3. La forme habituelle de l’estimateur MCO du modèle de régression multiple est donnée par(X⁰X)⁻¹X⁰Y. Montrez algébriquement que pour le modèle transformé l’estimateur MCO peut s’écrire

(X⁰ZX)⁻¹X⁰ZY

oùZ ≡ W⁰W = W W. Indice – Si vous savez comment calculer la trans- posée du produit de deux matrices vous êtes capables de répondre à cette question.

4. Est-ce que l’estimateur est l’estimateur MCO ? Justifiez votre r´eponse.

5. Pour des points suppl´ementaires, montrez que l’estimateur est non bias´e.

Indice – Substituez Y par Xβ +U dans la d´efinition de l’estimateur et simplifiez.

6. Pourquoi serait-il avantageux d’utiliser cet estimateur au lieu d’utiliser l’estimateur MCO standard ? Indice – Pensez aux hypothèses qu’il faut utiliser pour prouver le théorème Gauss-Markov.

(6)

5 Modèles de régression non linéaires (20 points)

Soit le modèle de régression non linéaire suivant :

Y_i =β₀+β₁log (X_1i) +β₂X_2i+β₃X_1iX_2i+u_i

Vous avez estimé ce modèle et vous voulez prédire l’impact surY_id’une augmen- tation du niveau deX_1i.

1. Est-ce que ce modèle est non linéaire dans les paramètres ? Expliquez clairement en donnant une réponse mathématique ainsi qu’en mots.

2. Dérivez une expression algébrique pour le changement prédit∆Y_i ≡Y₂−Y₁ suite à un changement de la valeur de la première variable explicative deX₁₁

àX₁₂, pour une valeur constante de la deuxième variable donnée par X₂₁. Autrement dit,∆X₁ =X₁₂−X₁₁. (Notez queY₂ se réfère à la valeur deY après le changement de la valeur deX₁, etY₁ se réfère à sa valeur avant le changement.X₁₁se réfère à la valeur initiale deX₁etX₁₂à sa valeur après le changement. La valeur deX₂ reste constante.)

3. Exprimez ce changement en notation matricielle (vectorielle) comme

∆Y_i = ∆X_1iδβ.ˆ Autrement dit, précisez les éléments deδ.

4. ´Ecrivez une expression pour la variance de∆Y_iou Var(∆Y_i)

en fonction de l’expression du côté droit de l’équation. Simplifiez cette expression et exprimez la variance de∆Y_ien fonction de la matrice variance- covariance de l’estimateurβ.ˆ

5. Étant donné cette variance, expliquez en détail comment construire l’intervalle de confiance de 95% pour∆Y_i.

6. Écrivez une version équivalente du modèle où leδβ de la partie précédente est directement un des paramètres du modèle transformé (de cette façon, le logiciel de régression calcule automatiquement l’écart type dont nous avons besoin pour calculer l’intervalle de confiance.

document cr´e´e le : 25/04/2011