ECO 4272: Introduction `a l’ ´ Econom´etrie Examen Final: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2008, Steve Ambler Hiver 2008
1 Estimateur MCO
1. Le probl`eme de minimisation peut s’´ecrire : minβ
n
X
i=1
(Yi−β0−β1X1i−β2X2i−. . .−βkXki)2, o`uβest le vecteur de coefficients qui est `a estimer. Il y a(k+ 1) conditions du premier ordre. Il ne fallait pas les ´ecrire.
2. Pour pouvoir calculer num´eriquement une solution au probl`eme, les erreurs peuvent essentiellement ˆetre quelconques. Tout ce qui est
n´ecessaire est une matriceX0Xqui est de plein rang (et donc inversible), ce qui implique plus d’observations que de variables explicatives
(n >(k+ 1)) et une absence de multicollin´earit´e parfaite. L’existence d’une telle solution n’est absolument pas une garantie que l’estimateur MCO a les propri´et´es d´esirables qui tiennent sous les hypoth`eses du mod`ele de r´egression lin´eaire, qui pourraient ne pas ˆetre v´erifi´ees dans le contexte d’un mod`ele estim´e donn´e.
3. La CPO par rapport `aβ0 donne :
−2
n
X
i=1
Yi −βˆ0−βˆ1X1i−βˆ2X2i−. . .−βˆkXki
= 0
→nβˆ0 =
n
X
i=1
Yi−
n
X
i=1
βˆ1X1i−. . .−
n
X
i=1
βˆkXki
→βˆ0 = 1 n
n
X
i=1
Yi−βˆ11 n
n
X
i=1
X1i−. . .−βˆk1 n
n
X
i=1
Xki
≡Y¯ −βˆ1X¯1−. . .−βˆkX¯k, ce qui fut `a d´emontrer.
2 Mod`ele de r´egression lin´eaire
– Les propri´et´es souhaitables sont 1) l’absence de biais, 2) la convergence et 3) l’efficience. Notez bien que je vous aidonn´ela r´eponse `a cette partie dans l’´enonc´e de la premi`ere question, o`u je mentionne ces trois propri´et´es explicitement. Vous n’aviez qu’`a les recopier.
– Pour obtenir un estimateur non biais´e, on a besoin essentiellement de
l’hypoth`ese selon laquelle la moyenne conditionnelle des erreurs est nulle, une des hypoth`eses de base du mod`ele de r´egression multiple.
– Pour obtenir la convergence, on a besoin de l’hypoth`ese qui nous donne un estimateur non biais´e (voir le point pr´ec´edent), plus l’hypoth`ese que nos observations sont i.i.d. et que leurs variances soient finies afin de pouvoir invoquer la loi des grands nombres et d´emonter la convergence en probabilit´e de l’estimateur.
– On a besoin de l’hypoth`ese d’erreurs homosc´edastiques pour montrer l’efficience par le biais du th´eor`eme Gauss-Markov.
3 Tests d’hypoth`ese (50 points)
1. Dans l’´equation (2), l’ordonn´ee `a l’origine pour les femmes est(γ0+γ3), la sensibilit´e du revenu `a l’´education chez les femmes est donn´ee par (γ1+γ4), et la sensibilit´e du revenu par rapport `a l’exp´erience chez les femmes est donn´ee par(γ2 +γ5).
2. L’´ecart type de l’ordonn´ee `a l’origine pour les femmes est l’´ecart type de (γ0+γ3). Nous pouvons facilement calculer la variance de(γ0+γ3)qui est, ´evidemment, le carr´e de l’´ecart type. Tel qu’indiqu´e dans l’´enonc´e de la question, il s’agit d’une application directe des r`egles de l’encadr´e 2.3
du manuel ou de la derni`ere page de mes notes de cours sur la th´eorie des probabilit´es. Nous avons :
Var(ˆγ0+ ˆγ3) = Var(ˆγ0) +Var(ˆγ3) + 2Cov(ˆγ0 , ˆγ3). Un logiciel de r´egression commeSTATAva calculer la matrice de variance-covariance, que nous avons appel´eΣˆβˆ. Si les variables sont ordonn´ees comme dans l’´equation (2), nous avons :
Var(ˆγ0) = ( ˆΣβˆ)11, Var(ˆγ3) = ( ˆΣβˆ)44, et
Cov(ˆγ0,γˆ3) = ( ˆΣβˆ)14,
o`u les indices inf´erieurs en dehors des parenth`eses font r´ef´erence aux
´el´ements appropri´es de la matrice variance-covariance. Les formules pour les autres variances (de(ˆγ1+ ˆγ4)et de(ˆγ2+ ˆγ5)) sont identiques `a part les changements appropri´es des indices inf´erieurs.
3. On a trois hypoth`eses jointes. Dans le cas de l’´equation (1), les trois hypoth`eses sontα0 =β0,α1 =β1 etα2 =β2. Dans le cas de l’´equation (2), les trois hypoth`eses sontγ3 = 0,γ4 = 0etγ5 = 0. Sous forme matricielle pour les deux cas, on a :
1 0 0 −1 0 0 0 1 0 0 −1 0 0 0 1 0 0 −1
α0 α1 α2 β0 β1 β2
=
0 0 0
et
0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1
γ0
γ1 γ2 γ3
γ4 γ5
=
0 0 0
.
Tel qu’indiqu´e dans l’´enonc´e de la question, mˆeme si vous n’avez pas bien
´ecrit l’hypoth`ese nulle jointe `a tester, je vous donne des points pour la
coh´erence entre la fac¸on non matricielle et la fac¸on matricielle de l’´ecrire.
Les contraintes dans les deux cas sont de la formeRβ =r.
4. La statistique `a calculer est :
F ≡Rβˆ−r0hRΣˆβˆR0i−1Rβˆ−r/q.
Il faut tout simplement brancher la bonne version deR, deβ, deˆ ret deΣˆβˆ
dans la formule.
5. Il faut que les erreurs soient homosc´edastiques.
6. La statistique est :
F ≡Rβˆ−r0hRΣ˜βˆR0i−1Rβˆ−r/q.
La seule diff´erence, tel que j’ai ´ecrit dans l’´enonc´e de la question, est l’estimateur de la matrice variance-covariance, qui est la forme plus simple qui tient seulement sous l’hypoth`ese que les erreurs sont
homosc´edastiques.
7. Je vous donne dans l’´enonc´e de la question queSSR3+SSR4 =SSR1, o`u le dernier terme est la somme des r´esidus carr´es de l’estimation de l’´equation (1). J’ai accept´e en r´eponse `a cette partie l’utilisation soit de SSR1 ou deSSR3+SSR4. La version contrainte du mod`ele est
´evidemment l’´equation (5), puisqu’elle est estim´ee avec l’´echantillon complet des donn´ees (observations sur les femmes et sur les hommes) et il n’y a qu’une seule ordonn´ee `a l’origine, un seul coefficient de pente par rapport `a l’´education, et un seul coefficient de pente sur l’´exp´erience.
Donc, les ordonn´ees `a l’origine et les coefficients de pente sont identiques pour les hommes et pour les femmes, ce qui est justement l’hypoth`ese nulle que nous voulons tester. Appliquant la formule standard, on a :
F = (SSR5−SSR1)/q SSR1/(n−kunrestricted−1).
Evidemment, il est possible de remplacer´ SSR1par(SSR3+SSR4).
8. C’´etait `a vous de choisir l’´equation (1) ou l’´equation (2). Dans le premier cas, on pourrait estimer cette ´equation :
Yi =α0Fi+β0Hi+α1EDUi+α2EXPi+Ui. Dans le cas de l’´equation (2), on pourrait estimer :
Yi =γ0+γ1EDUi+γ2EXPi+γ3Fi+Ui. Les noms attribu´es aux coefficients n’ont pas d’importance.
4 Mod`eles de r´egression non lin´eaires (20 points)
(a) Il faut calculer le niveau deYi avant et apr`es le changement, et soustraire les deux. On a :
Y2i =β0+β19 +β292+β393+β4X2i+Ui
et
Y1i =β0+β18 +β282+β383+β4X2i+Ui,
o`u j’utilise l’indice inf´erieur«2» sur la variable d´ependante pour indiquer la situation apr`es le changement et, ´evidemment, l’indice inf´erieur«1» pour indiquer la situation avant le changement.
Soustrayant, on obtient :
∆Yi =β1+β217 +β3217.
(L`a, je vous ai oblig´e `a faire quelques multiplications simples sans calculatrice !) Donc, le changement pr´edit est donn´e par :
∆Ydi = ˆβ1+ 17 ˆβ2+ 217 ˆβ3.
(b) Pour calculer l’´ecart type du changement pr´edit moyennant l’estimation d’une version transform´ee du mod`ele, ´ecrivons :
Yi =β0+ (β1+ 17β2+ 217β3)X1i +β2
X1i2−17X1i
+β3
X1i3−217X1i
+Ui.
Evidemment, en ajoutant et soustrayant les mˆemes termes, on ne´ modifie pas la valeur de l’expression du cˆot´e droit de l’´egalit´e. On peut r´e´ecrire cette ´equation comme :
Yi =β0+γX1i+β2Z1i+β3Z2i+Ui,
o`u les d´efinitions des nouvelles variables sont ´evidentes. Si on estime cette ´equation transform´ee par MCO, l’´ecart type du coefficientγ nous donne l’´ecart type voulu.
(c) Le calcul de l’´ecart type du changement pr´edit peut aussi passer par le calcul de la variance de cette combinaison lin´eaire des coefficients estim´es. Encore une fois, une application directe de l’encadr´e 2.3.
Nous avons :
Var(∆Yi) = Varβˆ1+ 17 ˆβ2 + 217 ˆβ3
=Varh 0 1 17 217 0 iβˆ
=E
h
0 1 17 217 0 i βˆ−β βˆ−β0h 0 1 17 217 0 i0
=h 0 1 17 217 0 iE
βˆ−β βˆ−β0
h
0 1 17 217 0 i0
=h 0 1 17 217 0 iΣˆβˆ
h 0 1 17 217 0 i0.
Donc, si notre logiciel de r´egression nous donne la matrice variance-covariance des coefficients estim´es nous pouvons tout simplement effectuer cette multiplicaton matricielle simple, soit par ordinateur si notre logiciel effectue les multiplications matricielles soit `a la mitaine.
Vous pouvez v´erifier facilement (ce n’´etait pas n´ecessaire de le faire pour l’examen) que cette expression matricielle nous donne
automatiquement l’expression suivante : Varβˆ1+ 17 ˆβ2+ 217 ˆβ3
=
Varβˆ1+ 172×Varβˆ2+ 2172×Varβˆ3 +2×17×Covβˆ1 , βˆ2
+2×217×Covβˆ1 , βˆ3 +2×17×217×Covβˆ2 , βˆ3.
Ceci est la mˆeme chose que ce que nous donnerait une application directe des r`egles de calcul de l’encadr´e 2.3 pour calculer
Varβˆ1+ 16 ˆβ2+ 217 ˆβ3
. Ce n’´etait pas n´ecessaire d’´ecrire la r´eponse de ces deux fac¸ons. J’ai accept´e l’une ou l’autre des fac¸ons d’´ecrire la r´eponse comme un r´eponse correcte.
document cr´e´e le : 27/04/2008