ECO 4272: Introduction l’´econom´etrie Exercice 1: solutions
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2010, Steve Ambler Hiver 2010
1 Propri´et´es de la covariance (10 points)
Nous avons Cov(aX , bY) =
m
X
i=1 n
X
j=1
(aXi−E(aX)) (bYj −E(bY))Pr(X =Xi , Y =Yj).
=
m
X
i=1 n
X
j=1
(aXi−aE(X)) (bYj −bE(Y))Pr(X =Xi , Y =Yj).
=
m
X
i=1 n
X
j=1
ab(Xi−E(X)) (Yj−E(Y))Pr(X =Xi , Y =Yj)
=ab
m
X
i=1 n
X
j=1
(Xi−E(X)) (Yj−E(Y))Pr(X =Xi , Y =Yj)
≡abCov(X , Y).
2 Tests d’hypoth`ese, intervalles de confiance, etc. (30 points)
Appelons le poids moyen des qu´eb´ecoisX et le poids moyen des ontariensY. Nous avons, utilisant la notation habituelle :
X¯ 85
Y¯ 90
¯
σX2 152
Var X¯
= σ400¯2X 0.5625
¯
σY2 202
Var X¯
= 350¯σ2Y 1.1429
Y¯ −X¯ 5
Var X¯ −Y¯
= σ¯2
X
400 + 350¯σ2Y
1.7054 1. Nous avons
2×Φ (−1.96) = 0.05,
o`u, comme d’habitude, Φ(z) nous donne la valeur `a z de la distribution normale standardis´ee cumul´ee. Donc, d’abord pour le Qu´ebec :
0.95 =Pr
−1.96< µX −85
√0.5625 <1.96
=Pr
85−1.96×√
0.5625< µX <85 + 1.96×√
0.5625 .
Donc, l’intervalle de confiance de 95% pour la moyenne du poids des qu´eb´ecois est
85±1.96×√
0.5625 = 85±1.47.
Maintenant, pour les ontariens nous avons 0.95 =Pr
−1.96< µY −90
√1.1429 <1.96
=Pr
90−1.96×√
1.1429< µY <90 + 1.96×√ 1.1429
. Donc, l’intervalle de confiance de 95% pour la moyenne du poids des onta- riens est
90±1.96×√
1.1429 = 90±2.0954.
2. Nous avons
2×Φ (−1.64) = 0.10,
Donc, d’abord pour le Qu´ebec : 0.90 =Pr
−1.64< µX −85
√0.5625 <1.64
=Pr
85−1.64×√
0.5625< µX <85 + 1.64×√ 0.5625
.
Donc, l’intervalle de confiance de 90% pour la moyenne du poids des qu´eb´ecois est
85±1.64×√
0.5625 = 85±1.23.
Maintenant, pour les ontariens nous avons 0.90 =Pr
−1.64< µY −90
√1.1429 <1.64
=Pr
90−1.64×√
1.1429< µY <90 + 1.64×√
1.1429 . Donc, l’intervalle de confiance de 90% pour la moyenne du poids des onta- riens est
90±1.64×√
1.1429 = 90±1.753.
3. La statistique normali´ee est donn´ee par t= 85−83
√0.5625 = 2.67,
L’hypoth`ese alternative est bilat´erale. Nous avons 2×Φ (−2.67)≈0.0076.
Nous rejetons l’hypoth`ese nulle `a un niveau de significativit´e marginal de 1%.
4. La statistique normali´ee est donn´ee par t= 85−83
√0.5625 = 2.67,
la mˆeme que pour la partie pr´ec´edente. L’hypoth`ese alternative est uni- lat´erale. Ce que nous voulons mesurer est la surface en dessous de la distri- bution cumul´ee `a droite de la statistique calcul´ee. Nous avons
1−Φ (2.67)≈1−0.996207≈0.0038.
Nous rejetons l’hypoth`ese nulle `a un niveau de significativit´e marginal de 1%.
5. Nous avons
0.95 =Pr
−1.96< (µX −µY)−(−5)
√1.7054 <1.96
=Pr
−5−1.96×√
1.7054<(µX −µY)<−5 + 1.96×√
1.7054 . Donc, l’intervalle de confiance de 95% pour la diff´erence entre les poids moyens est
−5±1.96×√
1.7054 =−5±2.5596.
6. La statistique normalis´ee est
t= (85−90)−0
√1.7054 =−3.8287 L’hypoth`ese alternative est bilat´erale. Nous avons
2×Φ (−3.8287)≈0.0013.
Nous rejetons l’hypoth`ese nulle `a un niveau de significativit´e marginal de 1%.
7. Rejeter `a 5% n´ecessiterait une statistique normalis´ee de
−
−5−0 q152
n + 20n2
=−1.96.
Nous obtenons
5 1.96 =
r625 n
⇒n = 625
(5/1.96)2 ≈96.04.
Nous aurions besoin d’´echantillons d’au moins 97 observations afin de pou- voir rejeter l’hypoth`ese nulle `a un taux marginal de 5%.
3 Convergence (20 points)
Je d´eveloppe la r´eponse pour la version corrig´ee de la question. Si on remplace Yi par Y1 dans la premi`ere sommation ci-dessous, l’estimateur est toujours non biais´e et sa variance diminue avecn, mais la variance ne tend pas vers z´ero lorsque ntend vers l’infini. Donc, il n’est pas convergent.
1. Nous avons E
Ye
= 1 2n
(n/2)
X
i=1
E(Yi) + 3 2n
n
X
i=(n/2)+1
E(Yi)
= 1 2n
(n/2)
X
i=1
µY + 3 2n
n
X
i=(n/2)+1
µY
= 1 2n
n
2µY + 3 2n
n
2µY =µY. L’estimateur est non biais´e.
2. Si les observations sont ind´ependantes, nous avons Var
Ye
= 1 4n2
(n/2)
X
i=1
Var(Yi) + 9 4n2
n
X
i=(n/2)+1
Var(Yi)
= 1 4n2
n
2σY2 + 9 4n2
n
2σ2Y = 1.25 n σY2.
L’ind´ependance est cruciale ici. Sinon, il y aura des covariances non nulles entre des observations diff´erentes.
3. Lorsquen → ∞, nous avons Var
Ye
→0.
4. Oui. Il est non biais´e et sa variance tend vers z´ero lorsque la taille de l’´echantillon tend vers l’infini.
5. Nous avons
Var Yˆ
= 1 nσY2.
La variance de Ye est plus ´elev´ee. Nous savons que l’estimateur MCO est l’estimateur qui minimise la somme des erreurs au carr´e. Il est l’estima- teur le plus efficient de la moyenne lorsque la variance des observations est constante, ce qui est le cas ici.
4 Convergence et th´eor`eme de la limite centrale (40 points)
1. Selon le manuel,
1 σ2
n
X
i=1
(Yi−µY)2
suit une loi chi-carr´e avec n degr´es de libert´e. Nous avons une expression o`uµY est remplac´e par un estimateur convergent. Selon l’article que je vous ai donn´e,
1 σ2
n
X
i=1
Yi−Y¯2
suit une distribution chi-carr´e avecn−1degr´es de libert´e.
2. Nous savons que la variance d’une variable al´eatoire chi-carr´e avecn −1 degr´es de libert´e est2(n−1).
3. Nous avons
Var
n−1 σ2 s2
= 2(n−1)
⇒Var s2
= σ2
n−1 2
2(n−1) = 2σ4 n−1 4. Voir le fichier test2.inp sur mon site.
5. Vous devriez obtenir des histogrammes o`u la dispersion diminue avec la taille de l’´echantillon. Ceci illustre le principe que nous estimons le mo- ment de la population (dans ce cas-ci sa variance) avec de plus en plus de pr´ecision au fur et `a mesure que la taille de l’´echantillon augmente.
6. Vous devriez obtenir des histogrammes o`u la dispersion ne diminue pas avec la taille de l’´echantillon, puisqu’on normalise la variable al´eatoire utilis´ee pour g´en´erer l’histogramme. En normalisant, on divise par un ´ecart type qui diminue avec la taille de l’´echantillon afin d’obtenir une variable al´eatoire avec une variance qui est toujours unitaire. Par contre, l’histogramme de- vrait ressembler de plus en plus `a une distribution normale standardis´ee au fur et `a mesure que la taille de l’´echantillon augmente.
7. Voir les r´eponses aux deux parties pr´ec´edentes.