ECO 4272: Introduction `a l’´econom´etrie Examen intra: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2012, Steve Ambler Automne 2012
1 Variance ´echantillonnale d’une fonction de deux variables al´eatoires (15 points)
Notez qu’il s’agit de lavariance ´echantillonnaled’une combinaison lin´eaire de variables al´eatoires, non de la variance dans la population. J’ai ´et´e relativement s´ev`ere dans le cas de r´eponses o`u on introduisait des op´erateurs d’esp´erance, par exemple (un concept propre `a la population, non `a un ´echantillon donn´e).
Nous avons
Var(aX +bY)
≡ 1 n−1
n
X
i=1
aXi+bYi−aX +bY2
. Nous avons
aX+bY ≡ 1 n
n
X
i=1
(aXi+bYi)
=a1 n
X
i=1
Xi+b1 n
X
i=1
Xi
≡aX+bY .
Donc nous pouvons ´ecrire 1 n−1
n
X
i=1
aXi+bYi−aX+bY2
.
= 1
n−1
n
X
i=1
a Xi−X
+b Yi −Y2
=a2 1 n−1
n
X
i=1
Xi−X2
+b2 1 n−1
n
X
i=1
Yi−Y2
+ab 1 n−1
n
X
i=1
Xi−X
Yi−Y
≡a2Var(X) +b2Var(Y) + 2abCov(X , Y), ce qui fut `a d´emontrer.
2 Distributions de probabilit´e jointes (20 points)
1. Le tableau compl´et´e est donn´e par
X\Y Y=1 Y=2 Y=3 Pr(X)
X=1 0.10 0.05 0.05 0.20 X=2 0.05 0.10 0.05 0.20 X=3 0.05 0.05 0.10 0.20 X=4 0.10 0.05 0.05 0.20 X=5 0.05 0.05 0.10 0.20 Pr(Y) 0.35 0.30 0.35 1.00 2. La formule est
E(X|Y = 1).
=
5
X
i=1
XiPr(X =Xi|Y = 1)
=
5
X
i=1
XiPr(X =Xi, Y = 1) Pr(Y = 1)
= 1×0.10
0.35+ 2× 0.05
0.35 + 3× 0.05
0.35 + 4× 0.10
0.35 + 5× 0.05 0.35
= 0.10
0.35+ 0.10
0.35+0.15
0.35+ 0.40
0.35 +0.25 0.35
= 1.00 0.35. Ce n’´etait pas n´ecessaire de simplifier.
3. De mani`ere semblable,
E(Y|X = 3).
=
3
X
i=1
YiPr(Y =Yi|X = 3)
=
3
X
i=1
Xi
Pr(Y =Yi, X = 3) Pr(X = 3)
= 1× 0.05
0.20 + 2× 0.05
0.20 + 3× 0.10 0.20
= 0.25 + 0.50 + 1.50 = 2.25.
Ce n’´etait pas n´ecessaire de simplifier.
4. Nous avons
E(X)
=
5
X
i=1
XiPr(X =Xi)
= 1×0.20 + 2×0.20 + 3×0.20 + 4×0.20 + 5×0.20
= 15×0.20 = 3.0.
Ce n’´etait pas n´ecessaire de simplifier.
5. De mani`ere semblable
E(Y)
=
3
X
i=1
YiPr(Y =Yi)
= 1×0.35 + 2×0.30 + 3×0.35
= 0.35 + 0.60 + 1.05 = 2.0.
Ce n’´etait pas n´ecessaire de simplifier.
6. Non. Nous avons
Pr(X = 1, Y = 1) = 0.106= 0.35×0.20 =Pr(X = 1)Pr(Y = 1). Il suffit d’un contre exemple comme ceci pour montrer que les deux variables ne sont pas ind´ependantes.
3 Diff´erences entre les esp´erances de deux populations (20 points)
1. On ´ecrit une statistique normalis´ee qui, sous l’hypoth`ese nulle, a une moyenne de z´ero et une variance unitaire. La statistique est
tact= X¯ −Y¯ −0 qσˆX2
350 + 300ˆσ2Y .
Le d´enominateur est la racine carr´ee d’un estimateur convergent de la variance de X¯ −Y¯
.
2. Il faut que les observations des deux ´echantillons soit i.i.d. et que les deux
´echantillons soient ind´ependants l’un de l’autre.
3. Puisqu’on a des centaines d’observations, on peut supposer une convergence approximative vers une loi normale centr´ee r´eduite.
4. Non, puisque le d´enominateur a des propri´et´es inconnues en petit
´echantillon. Si on suppose une variance ´egale des deux variables al´eatoires, et en plus on est prˆet `a supposer la normalit´e des deux populations, on peut utiliser un estimateur de cette variance pour construire une statistique qui suit une distributiontde Student. (Si vous avez ´ecrit ceci, je vous ai donn´e tous les points. Il n’´etait pas n´ecessaire d’´ecrire la formule pour
l’estimateur de la variance.) La statistique est donn´ee par tact =
X¯ −Y¯ −0 q
s2pooledp
1/350 + 1/300 .
et nous avons
s2pooled= 1
(350 + 300−2)
350
X
i=1
Xi−X¯2
+
300
X
i=1
Yi−Y¯2
! ,
= 1
(350 + 300−2) (350−1)ˆσX2 + (300−1)ˆσ2Y . 5. L’hypoth`ese nulle est bilat´erale. Donc nous avons
p= 2Φ (−|tact|)
o`u, comme d’habitude,Φ(z)est la fonction de la distribution normale centr´ee r´eduite cumul´ee ´evalu´ee au pointz.
6. L’hypoth`ese alternative est que
µX −µY <0.
Donc, une statistiquetfortement n´egative nous m`ene `a rejeter l’hypoth`ese nulle. Lap-value est donn´ee par
p= Φ (tact).
4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (45 points)
1. Nous savons que
T SS =ESS+SSR
⇒ESS =T SS −SSR= 436.21−114.31 2. Nous savons que
R2 ≡ ESS
T SS = 1−SSR
T SS = 1−114.31 436.21. 3. Nous savons que
suˆ ≡q s2uˆ =
rSSR n−2 =
r114.31 423 . 4. L’hypoth`ese nulle `a tester est
H0 :β1 = 0, contre l’hypoth`ese alternative bilat´erale que H1 :β1 6= 0.
Nous avons
tact = βˆ1−0 ˆ σβˆ1
= 1.342 0.379
5. Avec une hypoth`ese alternative bilat´erale, lap-value est donn´ee par p= 2Φ (−|tact|).
6. La statistiquetest sup´erieure `a 3 en valeur absolue. Donc, on sait que la p-value est inf´erieure `a 0.01. (Dans l’´enonc´e de la sous-question 10, je vous donne queΦ (−2.58)≈0.005. Donc, le coefficient est significatif `a un niveau de 1%. A fortiori, il est significatif `a un niveau de 5%.
7. La statistiquetpour le test est donn´ee par tact =
βˆ1−2.0 ˆ σβˆ1
= 1.342−2.0 0.379
8. C’est une valeur fortement n´egative qui nous m`ene `a rejeter l’hypoth`ese nulle dans ce cas. Lap-value est donn´ee par
p= Φ (tact) 9. Nous avons
0.95 =Pr(−1.96≤Z ≤1.96) o`uZsuit une loi normale centr´ee r´eduite. Nous avons donc
0.95 = Pr −1.96≤ βˆ1 −β1 ˆ σβˆ1
≤1.96
!
=Pr
−1.96ˆσβˆ
1 ≤
βˆ1−β1
≤1.96ˆσβˆ
1
=Pr
−1.96ˆσβˆ1 ≤
β1−βˆ1
≤1.96ˆσβˆ1
=Pr
βˆ1−1.96ˆσβˆ
1 ≤β1 ≤βˆ1+ 1.96ˆσβˆ
1
. Donc l’intervalle de confiance de 95% pourβ1est
βˆ1±1.96ˆσβˆ1. 10. De mani`ere semblable nous avons
0.99 =Pr(−2.58≤Z ≤2.58)
=Pr −2.58≤ βˆ0−β0 ˆ σβˆ0
≤2.58
!
=Pr
−2.58ˆσβˆ
0 ≤
βˆ0−β0
≤2.58ˆσβˆ
0
=Pr
−2.58ˆσβˆ0 ≤
β0−βˆ0
≤2.58ˆσβˆ0
=Pr
βˆ0−2.58ˆσβˆ
0 ≤β0 ≤βˆ0+ 2.58ˆσβˆ
0
. Donc l’intervalle de confiance de 95% pourβ0est
βˆ0±2.58ˆσβˆ
0.
5 R´egression simple : propri´et´es d’estimateurs (15 points en bonus)
Soit le mod`ele lin´eaire suivant sans constante : Yi =β1Xi+ui.
Vous pouvez supposer que E(ui|Xi) = 0, et que les observations sur lesXiet les Yi sont i.i.d.
Soit l’estimateur suivant pour le coefficientβ: βe=
Pn i=1Yi Pn
i=1Xi.
R´epondez aux questions suivantes. Justifiez vos r´eponses dans tous les cas.
1. Ce n’est pas l’estimateur MCO deβ, qui serait la solution au probl`eme minβ
n
X
i=1
(Yi−βXi)2
qui a comme seule CPO
−2
n
X
i=1
(Yi−βXi)Xi = 0
⇒βˆ= Pn
i=1XiYi Pn
i=1Xi2 .
2. Oui c’est non biais´e. Voici la preuve.
βe= Pn
i=1Yi Pn
i=1Xi.
= Pn
i=1βXi+ui Pn
i=1Xi
=β+ Pn
i=1ui Pn
i=1Xi
⇒E
βe
=β+E Pn
i=1ui Pn
i=1Xi
=β+E
E Pn
i=1ui Pn
i=1Xi|X
=β+E Pn
i=1E(ui|X) Pn
i=1Xi
=β 3. Nous pouvons ´ecrire
βe=β+
1 n
Pn i=1ui
1 n
Pn i=1Xi.
Le d´enominateur converge en probabilit´e `aµX, la moyenne dans la population deX. Le num´erateur converge en probabilit´e `a z´ero. Par le th´eor`eme de Slutsky, le ratio converge en proababilit´e `a z´ero. Donc notre estimateur converge en probabilit´e `aβ.
4. Pas forc´ement. Sans connaˆıtre la loi exacte qui g´en`ere l’erreuruion ne peut savoir si l’estimateur est le plus efficient parmi une classe d’estimateurs.
cr´e´e le : 10/11/2012