3 Tests d’hypoth`ese (20 points)

(1)

Examen intra Examen final x

Sigle Groupe Trimestre

ECO4272 50 20181

Titre Introduction à l’économétrie

Enseignant(e) Steve Ambler

Consignes importants

1. Ecrivez lisiblement.´

2. Justifiez vos réponses. La majorité des points seront attribuées pour le raisonnement.

3. Je ne pourrai accorder des pointspour une mauvaise r´eponse sans justification. Voir le point 2.

4. La documentation n’est pas permise.

5. Ne simplifiez pas vos r´eponses. Cela va me permettre de suivre plus facilement votre raisonnement. Voir le point 2.

6. Les calculatrices ne sont pas permises. Voir le point 5.

7. Les t´el´ephones ne sont pas permis.

8. Si je vous demande si une statistique calculée est significative,sans consulter les tables, vous pouvez donner une réponse approximative. Je vous donne par contre les égalités suivantes :Φ (−1.645)≈0.05

Φ (−1.96) ≈0.025etΦ (−2.57)≈0.005, où la fonctionΦ (·)est la loi normale centrée réduite cumulée.

1 R´eponses courtes (20 points)

1. Expliquez en mots pourquoi une statistiqueF calculée pour tester des hypothèses jointes doit forcément être positive.

(2)

2. Décrivez en détail comment tester un ensemble d’hypothèses jointes portant sur les coefficients individuels d’un modèle de régression multiple si on a seulement les coefficients estimés et leurs écarts types individuels.

(Ceci pourrait être le cas si on a accès à des résultats publiés dans un article mais non aux données originales.)

3. Décrivez de quoi dépend l’impact de l’ajout d’une variable explicative à un modèle de régression sur leR¯². Est-ce que le critère pour savoir le signe de l’impact surR¯² a une interprétation statistique ? Expliquez.

4. Décrivez de quoi dépend le signe et la taille du biais introduit par l’omission d’une variable explicative significative d’un modèle de régression multiple.

5. Dans le cadre du modèle de régression multiple, que signifietester la significativité de la régression?

2 Propri´et´es d’estimateurs (30 points)

Soit l’estimateurβ˜d’un vecteur de paramètresβ d’un modèle de régression linéaire multiple.

1. Si l’estimateurβ˜est non biais´e, cela veut direen notation math´ematiqueque . . .

2. Expliquez en mots la signification rigoureuse deconvergence en probabilit´e.

3. L’erreur d’un estimateur peut ˆetre ´ecrit comme βb−β

où vous pouvez supposer (pour cette sous-question) queβ est un scalaire (un seul paramètre et non un vecteur),βest sa valeur etβbest sa valeur estimée. Écrivez une expression pour ce qu’on appelle l’erreur

quadratique moyenne (qui est en fait une espérance). Montrez que l’erreur quadratique moyenne est la somme de la variance de l’estimateur plus le carré du biais de l’estimateur (indice — il suffit d’ajouter et de soustraire l’espérance de l’estimateur et ensuite de simplifier l’expression que vous obtenez). Cette sous-question est légèrement plus difficile que les autres.

(3)

4. Si un estimateur est non biaisé et si sa variance tend vers zéro lorsque la taille de l’échantillon tend vers l’infini, vers quoi tend son erreur

quadratique moyenne ? Vous pouvez répondre sans avoir démontré le résultat de la sous-question précédente.

5. Dans le cours, quelle est la façon habituelle de démontrer la convergence en probabilité d’un estimateur ? (Indice — pensez à la sous-question précédente.)

6. Expliquez en mots ce que veut dire la notation suivante : β˜−→^d N

β,Σ˜_β .

7. Dans le modèle de régression multiple (linéaire), qu’est-ce qui arrive àΣ˜_β_ˆ (est-ce que les éléments de la matrice tendent vers quelque chose ?) lorsque la taille de l’échantillon augmente ?

8. Décrivez en mots ce que veut dire l’efficience d’un estimateur linéaireβ˜ dans le contexte de la régression multiple(et où doncβ est unvecteur de paramètres). Décrivez aussi ce que cela veut dire en notation

math´ematique.

9. Sous quelles conditions est-ce que l’estimateur MCO deβ(β) estb

efficient dans le modèle de régression multiple ? Est-ce que ces conditions font partie des hypothèses de base du modèle de régression multiple, au moins la version du modèle présentée dans le chapitre 6 du manuel de Stock & Watson ou dans les notes de cours ?

10. En mots, décrivez pourquoi le fait d’avoir un échantillon d’observations plus grand peut être une solution au problème de multicollinéarité imparfaite.

11. Définissez en mots le problème de multicollinéarité parfaite. Quelle est la conséquence de la multicollinéarité parfaite ?

3 Tests d’hypoth`ese (20 points)

Vous venez d’estimer le mod`ele de r´egression suivant :

Y_i =β₀+β₁X_1i+β₂X_2i+β₃X_3i+β₄X_4i+β₅X_5i+u_i

(4)

Vous voulez tester l’hypoth`ese suivante :

H₀ :β₁ + 2β₂ = 3

contre l’hypoth`ese alternative bilat´erale

H₀ :β₁+ 2β₂ 6= 3.

1. Montrez comment tester l’hypothèse en écrivant un modèleéquivalenten termes d’un nouveau paramètre qui est la combinaison linéaire pertinente deβ₁et deβ₂.

2. Décrivez comment tester l’hypothèse en utilisant la formule générale pour tester des hypothèses linéaires (possiblement mais non nécessairement jointes). Pas nécessaire d’écire la formule au complet, mais je vous demande d’écrire la restriction qui tient sousH₀ sous forme matricielle.

3. Comment est-ce que la statistique de la sous-question précédente est distribuée ?

4. Décrivez comment tester l’hypothèse en écrivant et estimant un modèle contraint qui impose l’hypothèse nulle que vous voulez tester.

5. Pour les trois façons de tester cette hypothèse nulle, expliquez s’il est possible (et comment) d’utiliser des écarts types robustes (des paramètres estimés) pour effectuer le test.

4 Modèles de régression non linéaires (20 points)

Soit le modèle de régression non linéaire suivant :

Y_i =β₀+β₁X_1i+β₂X_1i²+β₃X_2iX_1i+β₄X_3i+u_i Vous avez estimé ce modèle et vous voulez prédire l’impact surY_i d’une augmentation deX_1i.

1. Est-ce que ce modèle est non linéaire dans les paramètres ? Expliquez clairement en donnant une réponse mathématique ainsi qu’en mots.

2. Dérivez une expression algébrique pour le changement prédit

∆ ˆY ≡Yˆ2−Yˆ1 suite `a un changement de la valeur deX1

(∆X₁ ≡X₁₂−X₁₁),pour des valeurs constantes des autres variables.

Notez queY₂ fait référence à la valeur deY après le changement de la

(5)

valeur deX₁, etY₁fait référence à sa valeur avant le changement. Vous pouvez utiliser l’approximation

X₁₂² = (X₁₁+ ∆X₁)²

=X₁₁²+ 2×∆X₁×X₁₁+ (∆X₁)²

≈X₁₁²+ 2×∆X₁ ×X₁₁ si∆X₁ est suffisamment petit.

3. En ´ecrivant∆ ˆY /∆X₁sous la formeδ⁰β, ´ecrivez une expressionb

algébrique pour l’écart type du changement prédit. Montrez votre travail.

4. Utilisant l’écart type calculé à la sous-question précédente, écrivez l’intervalle de confiance autour du changement prédit. Vous pouvez supposer un niveau de confiance de 95%.

5. Écrivez un modèle équivalentqui permet de calculer l’écart type du changement prédit en fonction de l’écart type d’un des coefficients estimés. Écrivez l’intervalle de confiance pour le changement prédit basé sur cette estimation, utilisant l’écart type estimé du coefficient tranformé.

6. Écrivez sous forme matricielle l’hypothèse nulle jointe à tester qui permettrait de calculer l’écart type du changement prédit. Écrivez l’intervalle de confiance pour le changement prédit basé sur cette méthode.

5 Tests diagnostics (10 points)

1. Décrivez quelque façons informelles de détecter l’hétéroscédasticité du terme d’erreur dans le modèle de régression multiple.

2. Décrivez deux façons différentes de tester formellement l’hypothèse nulle de l’homoscédasticité du terme d’erreur dans le modèle de régression multiple.

6 Biais d ˆu `a des variables omises (20 points en bonus)

Soit le modèle de régression multiple donné par

Y =Xβ+U =X₁β₁+X₂β₂+U

(6)

avec la notation habituelle, et o`uX₁etX₂ regroupent des sous-ensembles des variables explicatives. (Cela veut dire queβ₁etβ₂sont desvecteursde

paramètres.) On suppose que le modèle obéit aux hypothèses statistiques de base du modèle de régression multiple. Vous estimez le modèle donné par

Y =X₁β₁+ ˜U o`uU˜ ≡X₂β₂+U.

1. Écrivez le problème de minimisation à résoudre pour trouver l’estimateur MCO deβ₁.

2. ´Ecrivez les conditions du premier ordre pour ce probl`eme de minimisation.

3. Écrivez une expression algébrique pour l’estimateur MCO deβ₁,βˆ₁. Notez qu’il n’est pas forcément nécessaire d’avoir répondu aux deux premières sous-questions pour répondre à celle-ci.

4. D´erivez une expression pour le biais dˆu aux variables omises. Cette sous-question est probablement la sous-question la plus difficile de cette question.

5. `A quoi doit converger (en probabilit´e) ce biais ?

6. Donnez une interpr´etation en mots de cette expression pour le biais.

7. Qu’est-ce qu’on peut dire concernant le signe du biais ? Expliquez.

N’oubliez pas qu’iciβ₁ etβ₂ sont desvecteursde param`etres.

document cr´e´e le : 15/04/2018