ECO 4272: Introduction `a l’ ´ Econom´etrie Examen final : r´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal
c 2013, Steve Ambler Hiver 2013
1 R´eponses courtes (15 points)
1. LeR2 doit augmenter ou au moins non diminuer. Si on compare les fonc- tions `a minimiser avec et sans la variable additionnelle, on constate que la fonction `a minimiser sans la variable additionnelle est identique au probl`eme de minimiser la fonction avec la variable additionnelle mais avec une contrainte additionnelle. La solution au probl`eme avec une contrainte additionnelle doit ˆetre au moins aussi ´elev´ee, et donc le R2 sera inf´erieur sinon stricte- ment inf´erieur.
2. Pour calculer la statistique F pour effectuer le test d’hypoth`eses jointes, il faut utiliser la matrice variance-covariance de β. Si on n’a pas acc`es `ab la matrice variance-covariance compl`ete des param`etres estim´es (souvent le cas dans le cas d’´etudes publi´ees), la seule possibilit´e est de faire une suite de teststdes hypoth`eses individuelles. Il faut utiliser la m´ethodologie d´evelopp´ee par Bonferroni. L’in´egalit´e de Bonferroni dit que la probabi- lit´e qu’au moins une des hypoth`eses simples est rejet´ee est inf´erieure `a la somme des probabilit´es que les deux hypoth`eses sont rejet´ees. (Il ne fallait pas d´efinir l’in´egalit´e de Bonferroni pour avoir tous les points.)
3. Le deuxi`eme mod`ele est l’´equivalent au premier en imposant la contrainte β3 = 1 +β1. En imposant cette contrainte, nous obtenons
Yi =β0+β1X1i+β2X2i+ (1 +β1)X3i+ui. Maintenant, si on soustraitX3ides deux cˆot´es on obtient
(Yi−X3i) = β0+β1(X1i+X3i) +β2X2i+ ˜ui.
Donc, le deuxi`eme mod`ele est une version contrainte du premier. Il a seule- ment 3 param`etres libres, tandis que le premier en a 4. LaSSRdu deuxi`eme mod`ele doit ˆetre au moins aussi ´elev´e. Dans la mesure o`u la contrainte est mordante, les estim´es des param`etresβ0,β1 estβ2seront diff´erents.
2 Propri´et´es d’estimateurs (20 points)
1. Le mod`ele peut s’´ecrire
Y =Xβ+U.
Ici, Y est le vecteur de dimensions n × 1 d’observations sur la variable d´ependante,X est la matrice de dimensionsn×k+ 1o`u chaque colonne contient les n observations sur une variable explicative individuelle, et U est le vecteur de dimensionsn×1de termes d’erreur. Nous avons
Y0 =
Y1 , Y2 , . . . , Yn , β0 =
β0 , β1 , . . . , βk , U0 =
U1 , U2 , . . . , Un ,
X =
1 X11 X21 X31 . . . Xk1 1 X12 X22 X32 . . . Xk2 ... ... ... ... ... ... 1 X1n X2n X3n . . . Xkn
.
2. Le probl`eme de minimisation peut s’´ecrire min
β0,β1,...,βk
n
X
i=1
(Yi−β0−β1X1i−β2X2i−. . .−βkXki)2.
3. Les variables de choix du probl`eme sontβ0,β1,. . .,βk. 4. La CPO par rapport `aβ0 est
−2
n
X
i=1
(Yi−β0−β1X1i−β2X2i−. . .−βkXki) = 0.
On peut r´e´ecrire cette ´egalit´e comme β0
n
X
i=1
=
n
X
i=1
Yi−β1
n
X
i=1
Xi1−β2
n
X
i=1
X2i−. . .−βk
n
X
i=1
Xki
⇒nβ0 =
n
X
i=1
Yi−β1
n
X
i=1
Xi1−β2
n
X
i=1
X2i−. . .−βk
n
X
i=1
Xki
⇒β0 = 1 n
n
X
i=1
Yi−β11 n
n
X
i=1
Xi1−β21 n
n
X
i=1
X2i−. . .−βk1 n
n
X
i=1
Xki
⇒βb0 = ¯Y −βb1X¯1−. . .−βbkX¯k, ce qui fut `a montrer.
5. Nous avons
n
X
i=1
X Y¯ i−Y¯
= ¯X
n
X
i=1
Yi−Y¯
= ¯X n1 n
n
X
i=1
Yi−nY¯
!
= ¯X nY¯ −nY¯
= 0.
Donc nous avons
n
X
i=1
Xi Yi−Y¯
=
n
X
i=1
Xi Yi−Y¯
−
n
X
i=1
X Y¯ i−Y¯
=
n
X
i=1
Xi−X¯
Yi−Y¯ , ce qui fut `a montrer.
6. Dans ce cas, la CPO par rapport `aβ1est
−2
n
X
i=1
X1i(Yi−β0−β1X1i) = 0.
⇒
n
X
i=1
X1i(Yi−β0−β1X1i) = 0.
Substituant la solution que nous avons d´ej`a trouv´ee pourβb0, nous avons
n
X
i=1
X1i Yi−Y¯ +β1X¯1−β1X1i
= 0
⇒
n
X
i=1
X1i Yi−Y¯
=β1
n
X
i=1
X1i X1i−X¯1
⇒
n
X
i=1
X1i−X¯1
Yi−Y¯
=β1
n
X
i=1
X1i−X¯1
X1i−X¯1
⇒βb1 = Pn
i=1 X1i−X¯1
Yi−Y¯ Pn
i=1 X1i−X¯12 ,
ce qui fut `a montrer. Pour passer `a l’avant-derni`ere ligne, nous avons utilis´e le r´esultat de la sous-question pr´ec´edente.
3 Mod`ele de r´egression multiple (45 points)
1. L’´ecart type de la r´egression est donn´e par r SSR
n−k−1 =
r 645.26 872−5−1. 2. Nous avons
(a) Significativit´e deβb0:
H0 :β0 = 0, H1 :β0 6= 0.
tact=
βˆ0−0 ˆ σβˆ
0
= 4.53 0.571.
(b) Significativit´e deβb1:
H0 :β1 = 0, H1 :β1 6= 0.
tact=
βˆ1−0 ˆ σβˆ
1
= −1.439 0.466 . (c) Significativit´e deβb2:
H0 :β2 = 0, H1 :β2 6= 0.
tact=
βˆ2−0 ˆ σβˆ2
= 0.341 0.120. (d) Significativit´e deβb3:
H0 :β3 = 0, H1 :β3 6= 0.
tact=
βˆ3−0 ˆ σβˆ3
= 0.937 0.102. (e) Significativit´e deβb4:
H0 :β4 = 0, H1 :β4 6= 0.
tact=
βˆ4−0 ˆ σβˆ4
= 0.198 0.132. (f) Significativit´e deβb5:
H0 :β5 = 0, H1 :β5 6= 0.
tact= βˆ5−0 ˆ σβˆ5
= 0.288 9.194. 3. Regardant les six tests, nous avons
(a) Significativit´e deβb0: La valeur calcul´ee de la statistique est sup´erieure
`a 7 en valeur absolue. Donc, la p-value du test est inf´erieure `a 1%.
Nous rejetons l’hypoth`ese nulle `a tous les niveaux conventionnels.
(b) Significativit´e deβb1: La valeur calcul´ee de la statistique est sup´erieure
`a 3 en valeur absolue. Donc, la p-value du test est inf´erieure `a 1%.
Nous rejetons l’hypoth`ese nulle `a tous les niveaux conventionnels.
(c) Significativit´e deβb2: La valeur calcul´ee de la statistique est sup´erieure
`a 2.6 en valeur absolue. Donc, lap-value du test est inf´erieure `a 1%.
Nous rejetons l’hypoth`ese nulle `a tous les niveaux conventionnels. (Ce cas est le seul cas qui implique une connaisance pr´ecise de la valeur de z pour laquelleΦ (z) = 0.005. J’ai interpr´et´e la r´eponse `a cette partie de fac¸on g´en´ereuse.)
(d) Significativit´e deβb3: La valeur calcul´ee de la statistique est sup´erieure
`a 9 en valeur absolue. Donc, la p-value du test est inf´erieure `a 1%.
Nous rejetons l’hypoth`ese nulle `a tous les niveaux conventionnels.
(e) Significativit´e deβb4 : La valeur calcul´ee de la statistique est approxi- mativement ´egale `a 1.5. Nous pouvons rejeter l’hypoth`ese nulle `a un niveau de 10% mais non `a 5%.
(f) Significativit´e de βb5 : La valeur absolue calcul´ee de la statistique est inf´erieure `a 0.1. `A tous les niveaux de significativit´e convinetionnels, nous ne pouvons rejeter l’hypoth`ese nulle.
4. L’hypoth`ese nulle qui est test´ee est que tous les coefficients du mod`ele `a partβ0 sont ´egaux `a z´ero.
H0 :β1 =β2 =β3 =β4 =β5 = 0.
L’hypoth`ese alternative qui est test´ee est :
H1 :∃i, i= 1,2, . . . ,5tel queβi 6= 0.
Il est tr`es important de comprendre ceci. L’hypoth`ese nulle est que tous les coefficients saufβ0 sont ´egaux `a z´ero. Si l’hypoth`ese nulle ne tient pas, cela impliquequ’au moins undes coefficients n’est pas ´egal `a z´ero. Il ne fallait surtout pas ´ecrire que l’hypoth`ese alternative est que tous les coefficients `a partβ0 ne sont pas ´egaux `a z´ero.
5. Sous forme matricielle, l’hypoth`ese nulle est
0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1
β0 β1 β2 β3 β4 β5
=
0 0 0 0 0
.
6. L’hypoth`ese nulle est
H0 :β3 = 1.
Puisque la variable d´ependante et la valeur totale des ventes sont toutes les deux mesur´ees en logs, le param`etreβ3qui est ´egal `a∂X∂Y
3 est l’´elasticit´e de la valeur du caf´e vendue par rapport `a la valeur des ventes totales. L’hypoth`ese alternative est
H1 :β3 6= 1.
La statistiquetpour tester cette hypoth`ese peut s’´ecrire tact = βb3−1
ˆ σβb
3
= 0.937−1.0 0.102 , et on a
|tact|<1, doncH0 n’est pas rejet´ee.
7. Oui. Si on impose la contrainteβ3 = 1nous obtenons le mod`ele suivant : (Yi−X3i) =β0+β1X1i+β2X2i+β4X4i+β5X5i+ui.
En d´efinissant une nouvelle variable d´ependante, nous pouvons facilement estimer la version contrainte du mod`ele. Pour que cette d´emarche soit va- lide, il faut supposer que le terme d’erreur du mod`ele est homosc´edastique.
8. L’hypoth`ese nulle (jointe) est
H0 :β4 =β5 = 0.
L’hypoth`ese alternative est
H1 :β4 6= 0 et/ouβ5 6= 0.
Sous forme matricielle :
0 0 0 0 1 0 0 0 0 0 0 1
β0 β1 β2 β3 β4 β5
=
0 0 0 0 0
,
qui est de la forme Rβ = r. La statistique F peut s’ecrire `a l’aide de
Rβb−r
et la matrice variance-covariance de l’estim´e β. Il ne fallait pasb l’´ecrire pour avoir tous les points, mais la voici :
Fact =
Rβb−r0h R
Σb
βb
R0i−1
Rβb−r /q, o`uq= 2, le nombre de restrictions test´e.
9. Il faut estimer le mod`ele
Yi =β0+β1X1i+β2X2i+β3X3i+ ˜ui.
Ensuite, il faut construire la statistique F utilisant soit les R2 des deux mod`eles, soit les SSR des deux mod`eles. Les formules sont disponibles
`a la page 70 des notes de cours. Il ne fallait pas les ´ecrire pour avoir tous les points.
10. Il faut supposer un terme d’erreur homosc´edastique.
11. Individuellement, les deux coefficients sont non significatifs. (β4 est signi- ficatif `a un niveau de 10% seulement.) Chaque fois qu’il y a un bloc de coefficients qui est significatif tandis que les coefficients individuels ne le sont pas, il faut soupc¸onner la multicollin´earit´e. C’est probablement dˆu au fait que les deux variables sont fortement corr´el´ees. Il s’agit d’un probl`eme de multicollin´earit´e imparfaite. La multicollin´earit´e peut rendre impossible (avec les donn´ees qu’on a) de distinguer entre l’impact individuel de cha- cune d’un groupe de variables, mˆeme si le groupe a un impact significatif.
12. Pour construire l’intervalle de confiance, il faut utiliser la valeur estim´ee du coefficient et son ´ecart type. Nous avons
β2 =βb2±z×σˆβb
2
o`u z > 0et 0.025 = Φ (−z), la fonction Φ (·) ´etant la la normale centr´ee r´eduite cumul´ee.
13. Il prendrait la forme d’une ellipse.
4 Mod`eles de r´egression non lin´eaires (20 points)
1. Ce n’est pas non lin´eaire dans les param`etres. Dans tous les cas, nous avons
∂Yi
∂βi
n’est pas une fonction des param`etres.
2. Nous avons
Yb2 =βb0 +βb1X12+βb2X122 +βb3X12X21 et nous avons
Yb1 =βb0+βb1X11+βb2X112 +βb3X11X21. Donc nous avons
∆Yb =Yb2−Yb1
=βb1∆X1 +βb2 X122 −X112
+βb3X21∆X1. Utilisant l’approximation fournie dans l’´enonc´e, nous avons
∆Yb =βb1∆X1+βb22X11∆X1+βb3X21∆X1. 3. Nous avons
∆Yb = ∆X1δ0β.ˆ o`u
δ0 =
0 1 2X11 X21 4. Nous avons
Var
∆Yb
=Var
∆X1δ0βˆ
= (∆X1)2Var
δ0βˆ
= (∆X1)2Var δ0
βˆ−β
= (∆X1)2E
δ0
βˆ−β2
= (∆X1)2E
δ0
βˆ−β βˆ−β0
δ
= (∆X1)2δ0E
βˆ−β βˆ−β 0
δ
= (∆X1)2δ0Σb
βbδ, ce qui fut `a montrer.
5. L’intervalle de confiance de 95% est donn´e par
∆Y = ∆Yb ±z r
Var
∆Yb o`uz >0tel que0.025 = Φ (−z).
6. Le mod`ele ´equivalent peut s’´ecrire
Yi =β0+ (β1+β22X11+β3X21)X1i +β2 X2i2−2X11X1i
+β3(X1iX2i−X21X1i) +ui.
Chaque fois que nous avons ajout´e un terme nous l’avons soustrait, et donc le mod`ele est ´equivalent au mod`ele initial. Le coefficient associ´e `a X1i est la combinaison lin´eaire dont nous avons besoin pour calculer l’´ecart type n´ecessaire pour calculer l’intervalle de confiance.
5 Variables instrumentales (20 points en bonus)
1. Le nombre de rang´ees dansZ(qui pr´e-multiplie l’expression qui d´efinitX)b est n. Le nombre de colonnes dans X (qui post-multiplie l’expression qui d´efinitX) estb (k+ 1). Donc,Xbest de dimensionsnpar(k+ 1). Le nombre de rang´ees dansZ0 (qui pr´e-multiplie l’expression qui d´efinitbγ) est(k2+ 1) Le nombre de colonnes dansX (qui post-multiplie l’expression qui d´efinit bγ) est(k+ 1). Doncbγ est de dimensions(k2+ 1)par(k+ 1).
2. L’estimateur MCO s’´ecrit de la fac¸on habituelle (en fonction deX) :b βbV I =
Xb0Xb−1
Xb0Y
=
Z(Z0Z)−1Z0X0
Z(Z0Z)−1Z0X−1
Z(Z0Z)−1Z0X0
Y
=
X0Z(Z0Z)−1Z0Z(Z0Z)−1Z0X−1
X0Z(Z0Z)−1Z0Y
=
X0Z(Z0Z)−1Z0X−1
X0Z(Z0Z)−1Z0(Xβ+U)
=
X0Z(Z0Z)−1Z0X−1
X0Z(Z0Z)−1Z0X β
+
X0Z(Z0Z)−1Z0X−1
X0Z(Z0Z)−1Z0U
=β+
X0Z(Z0Z)−1Z0X−1
X0Z(Z0Z)−1Z0U ce qui fut `a montrer.
3. Il faut diviser et multiplier plusiers fois parn. Nous avons
βbV I =β+ X0Z n
Z0Z n
−1 Z0X
n
!−1
X0Z n
Z0Z n
−1 Z0U
n . On peut facilement v´erifier qu’on a divis´e par n le mˆeme nombre de fois qu’on a multipli´e parn. On peut supposer que toutes les matrices de deuxi`eme moments bruts convergent `a leurs esp´erances dans la population, ou au moins `a des matrices des constantes finies. Par exemple, on peut supposer que
X0Z n
−p
→E
X0Z n
. Maintenant, puisque l’´enonc´e nous donne que
Z0U n
−p
→Cov(U, Z) = 0, nous avons tout de suite par le th´eor`eme de Slutsky
βbV I −→p β+ E X0Z
n E
Z0Z n
−1
E
Z0X n
!−1
E X0Z
n E
Z0Z n
−1
Cov(U, Z)
⇒βbV I −→p β, ce qui fut `a montrer.
document cr´e´e le : 20/04/2013