ECO 4272: Introduction l’´econom´etrie Exercice 1 : R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2011, Steve Ambler Hiver 2011
1 Propri´et´es de la covariance (10 points)
Cov(X , Y) =
m
X
i=1 n
X
j=1
(Xi−E(X)) (Yj −E(Y))Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
XiYiPr(X=Xi , Y =Yj)
−
m
X
i=1 n
X
j=1
XiE(Y)Pr(X =Xi , Y =Yj)
−
m
X
i=1 n
X
j=1
E(X)YjPr(X =Xi , Y =Yj)
+
m
X
i=1 n
X
j=1
E(X)E(Y)Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
XiYiPr(X=Xi , Y =Yj)
−E(Y)
m
X
i=1 n
X
j=1
XiPr(X =Xi , Y =Yj)
−E(X)
m
X
i=1 n
X
j=1
YjPr(X =Xi , Y =Yj)
+E(X)E(Y)
m
X
i=1 n
X
j=1
Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
XiYiPr(X=Xi , Y =Yj)
−E(Y)
m
X
i=1
XiPr(X =Xi)
−E(X)
n
X
j=1
YjPr(Y =Yj) +E(X)E(Y)
=
m
X
i=1 n
X
j=1
XiYiPr(X=Xi , Y =Yj)
−E(X)E(Y)−E(X)E(Y) +E(X)E(Y)
=E(XY)−E(X)E(Y), ce qui fut `a montrer.
2 Tests d’hypoth`ese, intervalles de confiance, etc.
(30 points)
1. SoitYila taille mesur´ee de l’i`eme homme de l’´echantillon. Nous pouvons supposer un ´echantillon al´eatoire et donc une moyenne (dans la
population) constante que nous pouvons appelerµY. Nous avons : 1
n−1
n
X
i=1
Yi−Y¯
≡σˆ2Y ≡s2Y = 7.22,
la variance ´echantillonnale (qui est tout simplement le carr´e de l’´ecart type
´echantillonnal — je vous ai envoy´e un courriel `a cet effet pour pr´eciser), ce qui est un estimateur non biais´e et convergent de la variance deY. Donc, nous avons que
1
ns2Y ≡σˆ2Y¯
est un estimateur non bias´e et convergent de la variance deY¯, la moyenne
´echantillonnale, et
ˆ
σY¯ = sY
√n
est l’´ecart type de la moyenne ´echantillonnale (par opposition `a l’´ecart type
´echantillonnal). Donc, la statistique Y¯ −µY
ˆ σY¯
est une variable al´eatoire avec une esp´erance de z´ero et une variance unitaire. si l’´echantillon est assez grand, nous pouvons supposer qu’elle est approximativement une variable normale centr´ee r´eduite. Nous avons
0.95 =Pr
−1.96≤ Y¯ −µY
ˆ σY¯
≤1.96
=Pr Y¯ −1.96ˆσY¯ ≤µY ≤Y¯ + 1.96ˆσY¯
,
=Pr
177−1.96 6.5
√800 ≤µY ≤177 + 1.96 6.5
√800
=Pr(177−0.45≤µY ≤177 + 0.45).
L’intervalle de confiance de 95% pour la taille des hommes qu´eb´ecois en centim`etres est
177±0.45.
De mani`ere semblable, pour les hommes ontariens, nous avons 0.95 =Pr
179−1.96 7.2
√1000 ≤µY ≤179 + 1.96 7.2
√1000
=Pr(179−0.446≤µY ≤179 + 0.446)
L’intervalle de confiance de 95% pour la taille des hommes ontariens en centim`etres est
179±0.446
2. De mani`ere semblable que pour la sous-question pr´ec´edente, nous avons 0.99 = Pr
177−2.57 6.5
√800 ≤µY ≤177 + 2.57 6.5
√800
=Pr(177−0.591≤µY ≤177 + 0.591).
L’intervalle de confiance de 99% pour la taille des hommes qu´eb´ecois en centim`etres est
177±0.591.
De mani`ere semblable, nous avons 0.99 =Pr
179−2.57 7.2
√1000 ≤µY ≤179 + 2.57 7.2
√1000
=Pr(179−0.585≤µY ≤179 + 0.585).
L’intervalle de confiance de 99% pour la taille des hommes ontariens en centim`etres est
179±0.585.
3. L’´ecart type de la moyenne ´echantillonnale est donn´ee par
√6.5
800 = 0.230 La valeur calcul´ee de la statistique est
177−179
0.230 =−8.70.
Le test est pour une hypoth`ese alternative bilat´erale. La p-value est donn´ee par
p−value = 2Φ (−| −8.70|) = 0.00006.
L’hypoth`ese nulle est rejet´ee (massivement).
4. La valeur calcul´ee de la statistique est encore donn´ee par 177−179
0.230 =−8.70.
Le test est maintenant pour une hypoth`ese unilat´erale. La p-value est donn´ee par
p−value = 1−Φ (−8.70) = 0.99997.
Evidemment, notre ´echantillon de donn´ees ne fournit pas d’´evidence en´ faveur de l’hypoth`ese alternative que la taille moyenne des hommes qu´eb´ecois est sup´erieure `a 179cm.
5. La formule pertinente est donn´ee au milieu de la page 24 des notes de cours sur l’estimation et l’inf´erence statistique. La diff´erence entre les deux moyennes ´echantillonnales peut s’´ecrire
Y¯q−Y¯o = 177−179 =−2.
La variance de cette diff´erence est donn´ee par Var Y¯q−Y¯o
=σY2¯
q+σY2¯
o = 1
nq
σY2q + 1 no
σ2Yo, puisque nous pouvons supposer que les deux ´echantillons sont
ind´ependants. Puisque nous ne connaissons pas les vraies valeurs de ces variances, nous utilisons un estimateur convergent donn´e par
ˆ
σ2 Y¯q−Y¯o
= ˆσY2¯q + ˆσ2Y¯o
= s2q nq
+ s2o no
= 6.52
800 + 7.22
1000 = 0.105.
Donc nous avons sous l’hypoth`ese nulle Y¯q−Y¯o
qs2
q
nq + ns2o
o
−d
→N(0,1)
Sachant ceci, l’intervalle de confiance de 95% est donn´e par
95% =Pr
−1.96≤
Y¯q−Y¯o
− µYq −µYo
qs2
q
nq +ns2o
o
≤1.96
=
Pr Y¯q−Y¯o
−1.96 ss2q
nq
+ s2o no
≤ µYq −µYo
≤ Y¯q−Y¯o
+ 1.96 ss2q
nq
+ s2o no
!
=Pr
−2−1.96×√
0.105 ≤ µYq −µYo
≤ −2 + 1.96×√
0.105 . Donc l’intervalle de confiance pour la diff´erence des tailles moyennes est
−2±0.635.
6. La statistique normalis´ee est donn´ee par Y¯q−Y¯o
−0 qs2
q
nq +ns2o
o
= −2
0.105 =−19.05.
La p-value du test (l’hypoth`ese alternative est bilat´erale) est p−value= 2Φ (−| −19.05|). Cette p-value est `a toutes fins pratiques ´egale `a z´ero.
7. La valeur de la statistique normalis´ee pour avoir une p-value de 0.05 serait -1.96. Notre estimateur de la variance deY¯q−Y¯o est maintenant
6.52+ 7.22 n
ounest la taille (commune) de chacun des deux ´echantillons. Donc nous cherchons la solution `a
−1.96 = −2 q6.52+7.22
n
⇒√
n = 1.96 2
√
6.52+ 7.22
⇒n=
1.96 2
2
6.52+ 7.22
= 90.36.
Nous avons toujours un nombre entier d’observations. Donc, il faudrait au moins 91 observations pour rejeter l’hypoth`ese nulle avec une p-value de 0.05.
3 Convergence (20 points)
1. Pour montrer l’absence de biais, il faut calculer l’esp´erance de l’estimateur.
Nous avons E
Ye
= 1
4E(Y1) + 1
4E(Y2) + 1 2(n−2)
n
X
i=3
E(Yi)
o`u nous avons appliqu´e la r`egle E(AY) =AE(Y),
⇒E Ye
= 1
4µY +1
4µY + 1 2(n−2)
n
X
i=3
µY
= 1
4µY +1
4µY + (n−2) 2(n−2)µY
= 1
4 +1 4 +1
2
µY =µY, ce qui fut `a montrer.
2. Nous avons
Var Ye
= 1
16Var(Y1) + 1
16Var(Y2) +1
4 1 (n−2)2
n
X
i=3
Var(Yi)
= 1
8σY2 + 1 4
(n−2) (n−2)2σY2
= 1
8σY2 +1 4
1 (n−2)σY2 3. La variance diminue avecnmais on a
n→∞lim = 1 8σY2.
4. Mˆeme lorsquentend vers l’infini, la variance de l’estimateur est positive.
Si on choisit un intervalle arbitrairement petit autour de la vraie valeurµY, disonsµY ±, la probabilit´e que la valeur calcul´ee de notre estimateur se retrouve `a l’int´erieur de cet intervalle ne tend pas vers un `a cause de sa variance qui n’est jamais inf´erieure `a 18σ2Y.
5. La variance de l’estimateur MCO est donn´ee par Var Y¯
= 1 n2
n
X
i=1
Var(Yi) = 1 nσ2Y.
Il est facile de v´erifier que pourn = 4, les deux variances sont ´egales (dans ce cas les deux estimateurs mettent le mˆeme poids sur les deux derni`eres observations), et que pourn = 3etn ≥5, la variance deY¯ est plus petite.
4 Convergence et th´eor`eme de la limite centrale (40 points)
1. Je ne vais pas reproduire ici les d´erivations alg´ebriques provenant des notes de cours. La moyenne th´eorique est donn´ee par
0.3 + 1.5
2 = 0.9.
2. Encore une fois, je ne vais pas reproduire les d´erivations alg´ebriques, qui sont disponibles dans les notes de cours. La variance est donn´ee par
(1.5−0.3)2 12 .
3. Soitσ2ula variance th´eorique calcul´ee dans la partie pr´ec´edente. SoitYu notre variable uniforme avec un support de[0.3,1.5]. Nous avons
Var 1 n
n
X
i=1
Yu
!
= 1
n 2 n
X
i=1
Var(Yu)
= 1 nσu2.
Il s’agit d’une application standard de nos r`egles de base pour le calcul de variances. Le r´esultat d´epend du fait que les observations dans un
´echantillon donn´e sont ind´ependantes.
4. Pour les autres parties de la question, voir le script suivant : http:
//www.er.uqam.ca/nobel/r10735/4272/tp1.2011.inp Puisqu’on sauvegarde les 500 observations pour des ´echantillons de taille n `a la fin de chaque boucle, il est possible de g´en´erer les histogrammes de fac¸on interactive une fois que le script a ´et´e ex´ecut´e. Mˆeme pour un
´echantillon de taille 4, j’ai ´et´e capable dans certains cas d’obtenir des r´esultats o`u on ne rejetait pas l’hypoth`ese nulle de la normalit´e. Si on augmente le nombre de r´ep´etitions `a 10,000 (essayez-le, il faut juste remplacer 500 par 10,000 dans chaque boucle), on rej`ete toujours la normalit´e pour des ´echantillons de taille 4, et `a un taux marginal de significativit´e tr`es faible. Par compte, on accepte la normalit´e pour des
´echantillons de taille 50 et de taille 500.
cr´e´e le 18/03/2011