• Aucun résultat trouvé

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal

N/A
N/A
Protected

Academic year: 2022

Partager "D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal"

Copied!
6
0
0

Texte intégral

(1)

ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal

c 2012, Steve Ambler Automne 2012

Voici quelques consignes importants.

– Il est important d’´ecrire lisiblement. Je ne vais pas passer trop de temps `a d´echiffrer les r´eponses barbouill´ees.

– J’accorde toujours plus de points pour le raisonnement que pour la r´eponse finale. Si la r´eponse est erron´ee et il n’y a pas de raisonnement, je ne peux pas accorder des points partiels. Mˆeme si la r´eponse est bonne, je ne donne- rai que des points partiels s’il n’y a pas d’explication.

– Les justifications peuvent ˆetre graphiques, alg´ebriques, ou en mots : la co- h´erence et la logique sont primordiales.

– Ne pas simplifier les r´eponses.Si vous simplifiez vos r´eponses, je ne peux retracer vos erreurs ´eventuelles, ce qui ne me permettra pas d’accorder des points partiels.

– Les calculatricesne sont pas permises. Relire le consigne pr´ec´edent.

1 R´eponses courtes (15 points)

1. Il est toujours possible d’´ecrire un mod`ele qui permet d’expliquer toute la variation de la variable d´ependante autour de sa moyenne. Vrai, faux ou incertain ? Expliquez en d´etail.

(2)

2. Cette question s’enchaˆıne par rapport `a la sous-question pr´ec´edente. Est- ce qu’un mod`ele qui explique toute la variation de la variable d´ependante autour de sa moyenne sera un bon mod`ele pour pr´edire les valeurs de la variable d´ependante ? Expliquez en d´etail.

3. Voici deux mod`eles lin´eaires de r´egression multiple pour expliquer les va- riations de la variableY.

Yi01X1i2X2i3X3i+ui;

Yi0+ (β12)X1i2(X2i−X1i) +β3X3i+ ˜ui.

Est-ce qu’il y a un mod`ele dont la SSR (somme des r´esidus au carr´e) de- vrait ˆetre moins ´elev´ee ? Est-ce que les estim´es deβ0 et deβ3 devraient ˆetre diff´erents ? Expliquez en d´etail.

2 Propri´et´es d’estimateurs (15 points)

1. ´Ecrivez le mod`ele de r´egression multiple en notation matricielle. Donnez la d´efinition et les dimensions de toutes les variables du mod`ele.

2. Nous savons que l’estimateur MCO du mod`ele de r´egression multiple est donn´e par

βˆ= (X0X)−1X0Y.

Montrezen d´etailque l’estimateur doit ˆetre ´egal `a βˆ=β+ (X0X)−1X0U.

3. Quelle hypoth`ese statistique concernant le mod`ele de r´egression multiple permet de d´emontrer que l’estimateur MCO est non biais´e ?

4. Montrez en d´etail que la variance (matrice variance-covariance) de l’esti- mateur√

nβˆdoit converger `a Q−1E

(X0U)

√n

(U0X)

√n

Q−1 o`u

Q=E(X0X) n . Notez que je ne vous demande pas d’´evaluer E

(X0U) n

(U0X) n

.

(3)

3 Mod`ele de r´egression multiple (50 points)

Soit le mod`ele de r´egression multiple estim´e avec des donn´ees sur 2 735 indi- vidus. Les variables sont :

– Y : la variable d´ependante, le salaire-horaire r´eel de ’individu en dollars constants par heure ;

– X1: le nombre d’ann´ees de scolarisation de l’individu (11 pour un diplˆome secondaire, 13 pour un diplˆome du niveau C ´EGEP, etc.) ;

– X2 : une variable dichotomique qui prend la valeur 1 si l’individu est un homme, 0 si l’individu est une femme ;

– X3 : le revenu familial annuel des parents de l’individu en dizaines de mil- liers de dollars.

Le mod`ele estim´e est

Yi01X1i2X2i3X3i+ui Les r´esultats de l’estimation sont comme suit.

Coefficient Variable Estim´e Ecart type´ βˆ0 Constante : 3.241 0.487

βˆ1 X1: 0.675 0.129

βˆ2 X2: 1.341 0.297

βˆ3 X3 0.148 0.002

R2: 0.134

2 0.133

SSR 394.126

F (3,2371) 1.23e+2 Prob> F 0.000 Le mod`ele a ´et´e estim´esansl’optionrobuste.

1. Montrez comment calculer l’´ecart type de la r´egression.

2. ´Ecrivez les statistiques que l’on pourrait utiliser pour tester la significativit´e de chacun des coefficients individuels (tests d’hypoth`ese simples). ´Ecrivez les valeurs num´eriques des ces statistiques,sans les simplifier. ´Ecrivez ex- plicitement quelle est l’hypoth`ese nulle test´ee dans chaque cas.

3. Sansutiliser de table, est-ce les coefficients individuels sont significatifs `a un niveau de 10% ? De 5% ? De 1% ? Expliquez.

(4)

4. Quelle est l’hypoth`ese nulle test´ee par la Statistique F dans la deuxi`eme partie du tableau ? Quelle est l’hypoth`ese alternative ?

5. ´Ecrivez cette hypoth`ese (jointe) sous forme matricielle.

6. Quel serait le salaire-horaire pr´edit pour un homme avec un diplˆome de Bacc. (16 ans de scolarisation) dont les parents ont un revenu annuel de 57.6 milliers de dollars ?

7. De quelle information auriez-vous besoin pour pr´edire le salaire-horaire d’un homme avec le nombre moyen d’ann´ees de scolarisation et dont les parents gagnent le revenu annuel moyen ?

8. Vous soupc¸onnez que l’impact de l’´education sur le revenu pourrait d´ependre du sexe de l’individu. Comment pourriez-vous modifier le mod`ele pour tenir compte de cette possibilit´e ?

9. Dans le contexte de ce mod`ele modifi´e, expliquez comment tester la significativit´e (jointe) de l’impact de l’´education sur le salaire, soit ind´ependamment du sexe de l’individu soit d´ependant du sexe de l’individu.

Ecrivez l’hypoth`ese nulle qui est test´ee sous forme matricielle.´

10. Soit la variable dichotomiqueX4i qui prend la valeur 1 si l’individu est une femme, 0 si l’individu est un homme. Vous ajoutez cette variable au mod`ele original. Qu’est-ce qui arrive lorsque vous estimez le mod`ele ?

11. Tel qu’indiqu´e dans l’´enonc´e de la question, les r´esultatsne sont pasbas´es sur l’estimation robuste. Expliquez une fac¸on de tester la significativit´e (jointe) de l’impact de l’´education (pour le mod`ele modifi´e) en estimant une version contrainte du mod`ele. ´Ecrivez cette version du mod`ele sous forme non matricielle.

12. Expliquez comment construire la statistique F de la partie pr´ec´edente sur la base de l’output standard du logiciel. Je ne vous demande pas d’´ecrire la formule compl`ete. Il suffit d’indiquer quelles sont les informations requises.

13. Expliquez bri`evement comment construire l’intervalle de confiance de 95%

pour l’impact de l’´education sur le salaire (pour la version originale du mod`ele).

14. Quelle serait la forme g´eom´etrique de l’ensemble de confiance de 95% pour les impacts de l’´education et le sexe sur le salaire (version originale du mod`ele) ? Vous ne devez pas fournir une formule alg´ebrique.

(5)

4 Mod`eles de r´egression non lin´eaires (20 points)

Soit le mod`ele de r´egression non lin´eaire suivant :

Yi01X1i2X1iX2i3X2i4X2i2+ui

Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYid’une augmen- tation duniveaudeX2i.

1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez clai- rement en donnant une r´eponse math´ematique ainsi qu’en mots.

2. D´erivez une expression alg´ebrique pour le changement pr´edit∆Y ≡(Y2 −Y1) suite `a un changement de la valeur de la variable explicative deX21 `aX22. Autrement dit, ∆X2 = X22−X21. Ici, Y2 indique la valeur de Y apr`es le changement de la valeur de X2, et Y1 indique sa valeur avant le change- ment.X21indique la valeur initiale deX2 etX22indique sa valeur apr`es le changement. La valeur deX1 reste inchang´ee.

3. Exprimez ce changement en notation matricielle (vectorielle) comme

∆Y = ∆X2δβ.ˆ Autrement dit, pr´ecisez les ´el´ements deδ.

4. ´Ecrivez une expression pour la variance de∆Y ou Var(∆Y)

en fonction de l’expression du cˆot´e droit de l’´equation ci-dessus. Simplifiez cette expression et exprimez la variance de ∆Y en fonction de la matrice variance-covariance de l’estimateurβ.ˆ

5. ´Etant donn´e cette variance, expliquez en d´etail comment construire l’inter- valle de confiance de 95% pour∆Y.

6. ´Ecrivez une version ´equivalente du mod`ele o`u leδβˆde la partie 3 (ou plutˆot δβ si vous ´ecrivez le mod`ele de la population) est directement un des pa- ram`etres du mod`ele transform´e (de cette fac¸on, le logiciel de r´egression calcule automatiquement l’´ecart type dont nous avons besoin pour calculer l’intervalle de confiance).

(6)

5 Moindres carr´es pond´er´es (Weighted Least Squares) (15 points en bonus)

Soit le mod`ele de r´egression multiple donn´e par Y =Xβ+U

avec la notation habituelle et avec(k+ 1)variables explicatives avec la constante.

Supposons que l’hypoth`ese d’ind´ependance conditionnelle des termes d’erreurs est v´erifie et donc

E(U|X) = 0.

L’hypoth`ese d’homosc´edasticit´e n’est pas v´erifi´ee, mais par contre on sait que la matrice variance-covariance des erreurs satisfait

Var(U|X) = Ω

avecΩune matrice diagonale o`u l’i`eme ´el´ement sur la diagonale est ´egal `a Var(ui)≡ σi2.

1. Consid´erez le vecteur d’erreurs transform´e en pr´emultipliant par Ω−1/2, la matrice diagonale avec ´el´ements sur la diagonale ´egaux `a1/σi. Autrement dit, consid´erez

Ue ≡Ω−1/2U

Quelle serait sa matrice variance-covariance ? Indice — il faut calculer l’esp´erance deUeUe0.

2. Quel serait l’estimateur MCO du mod`ele o`u on pr´emultiplie le mod`ele entier par Ω−1/2? Indice — On peut ´ecrire le mod`ele en variables transform´ees comme

Ye =Xβe +U .e

3. Si on ne connaˆıt pas les valeurs desσi, sugg´erez un estimateur bas´e sur des choses observables. Indice — l’estimateur MCO dans ce cas est convergent mais non efficient. Pensez `a un estimateur en deux ´etapes, o`u dans la premi`ere

´etape on estime le mod`ele non transform´e par MCO. Je ne vous demande pas bien sˆur de d´emontrer la convergence de cet estimateur.

4. Est-ce que vous pensez que ce nouvel estimateur serait plus ´efficient que l’estimateur MCO du mod`ele non transform´e ? Pourquoi ou pourquoi pas ? document cr´e´e le : 20/12/2012

Références

Documents relatifs

Nous l’avons pas d´emontr´e, mais il y a une preuve dans la section 7.6.1 des notes de cours que la variance ´echantillonnale est un estimateur non biais´e de

Notez que pour r´epondre `a cette partie vous allez devoir r´eestimer le mod`ele avec des variables explicatives additionnelles qui tiennent compte de l’interac- tion entre

J’ai accept´e aussi un mod`ele avec seulement des termes d’interac- tion (donc on laisserait tomber saf rica, asiae et laam comme variables explicatives et on garderait ce que

Ajoutez la variable school au mod`ele comme proxy pour s h , avec un terme d’interaction pour les pays de l’OCDE.. Le mod`ele maintenant ´equivaut au mod`ele de Solow avec l’ajout

Vous devriez fournir avec vos r´eponses un script en R, GRETL, STATA ou dans le langage que vous avez utilis´e pour r´epondre aux questions.. Lorsque je vous demande de commenter ce

Maintenant, testez la significativit´e jointe de ces deux variables ensemble, avec et sans ´ecarts types robustes.. Expliquez ce que

Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur de n) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero

Si vous jouez avec cette commande, vous allez constatez qu’elle produit des nombres positifs dont la majorit´e sont inf´erieurs `a 1 λ = 0.5.. Ceci refl`ete le fait que c’est