ECO 4272: Introduction l’´econom´etrie Exercice 1: solutions
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2009, Steve Ambler Hiver 2009
1 Propri´et´es de la variance (15 points)
Nous avons :
Var(aX+bY)≡X
i
X
j
(aX+bY −E(aX +bY))2Pr(X =Xi , Y =Yj). Ici, implicitementicouvre toutes les valeurs possibles distinctes de la variable al´eatoireX, etj couvre toutes les valeurs possibles distinctes de la variable al´eatoireY. Tel que sp´ecifi´e dans le questionnaire, je suppose des distributions de probabilit´e discr`etes. Ceci est ´egal `a
X
i
X
j
(a(X−E(X)) +b(Y −E(Y)))2Pr(X =Xi , Y =Yj)
=X
i
X
j
a2(X−E(X))2+b2(Y −E(Y))2+ 2ab(X−E(X)) (Y −E(Y))
×
Pr(X =Xi , Y =Yj)
=a2X
i
X
j
(X−E(X))2Pr(X =Xi , Y =Yj)
+b2X
i
X
j
(Y −E(Y))2Pr(X =Xi , Y =Yj) +2abX
i
X
j
(X−E(X)) (Y −E(Y))Pr(X =Xi , Y =Yj)
=a2X
i
(X−E(X))2Pr(X =Xi) +b2X
j
(Y −E(Y))2Pr(Y =Yj) +2abX
i
X
j
(X−E(X)) (Y −E(Y))Pr(X =Xi , Y =Yj)
≡a2Var(X) +b2Var(Y) + 2abCov(X, Y), ce qui fut `a d´emontrer.
2 Tests d’hypoth`ese, intervalles de confiance, etc.
(25 points)
Notez que cette question est presqu’identique au cas analys´e dans l’encadr´e `a la page 86 du manuel. La cl´e pour r´epondre `a la question est de noter que si les donn´ees ont ´et´e cueuillies par ´echantillonnage al´eatoire, les deux ´echantillons devraient ˆetre ind´ependants et la covariance entre les moyennes ´echantillonnales devraient ˆetre z´ero. Donc, la variance de la diff´erence entre les deux moyennes
´echantillonnales sera la somme des variances des deux moyennes
´echantillonnales. Appelons le salaire en Alberta la variable al´eatoireXet le salaire au Qu´ebecY. Nous avons :
X¯ 33000
Y¯ 27400
¯
σX2 23002
Var X¯
= 750σ¯X2 7053.33
¯
σY2 17002
Var X¯
= 600σ¯2Y 4816.67
X¯−Y¯ 5600
Var X¯ −Y¯
=¯σ2 X
750 +600σ¯2Y
11870
o`u j’ai utilis´e la notation Var X¯
pour d´enoter notre estim´e de la variance de la moyenne ´echantillonnale des salaires albertains (la variance ´echantillonnale divis´e par le nombre d’observations dans l’´echantillon), etc.
1. Nous avons
2×Φ (−1.96) = 0.05,
o`u, comme d’habitude,Φ(z)nous donne la valeur `az de la distribution normale standardis´ee cumul´ee. Donc, d’abord pour l’Alberta :
0.95 =Pr
−1.96< µX −33000
√7053.33 <1.96
=Pr
33000−1.96×√
7053.33< µX <33000 + 1.96×√
7053.33 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est
33000±1.96×√
7053.33 = 33000±164.61.
Ensuite, pour le Qu´ebec : 0.95 =Pr
−1.96< µX −27400
√4816.67 <1.96
=Pr
27400−1.96×√
4816.67< µX <27400 + 1.96×√
4816.67 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est
27400±1.96×√
4816.67 = 27400±136.03.
2. La statistique normalis´ee (t) pour le test est donn´ee par t = 33000−30000
√7053.33 = 35.72.
Nous avons
1−Φ (35.72)≈0.
L’hypoth`ese nulle est massivement rejet´ee.
3. La statistique normalis´ee (t) pour le test est donn´ee par t = 5600−0
√11870 = 51.40.
Nous avons
1−Φ (51.40)≈0.
L’hypoth`ese nulle est massivement rejet´ee.
4. Nous avons
2×Φ (−1.645) = 0.10.
Donc, nous avons 0.90 =Pr
−1.645< (µX −µY)−5600
√11870 <1.645
=Pr
5600−1.645×√
11870<(µX −µY)<5600 + 1.645×√ 11870
. Donc, l’intervalle de confiance de 90% pour la diff´erence entre les
moyennes est
5600±1.645×√
11870 = 5600±179.22.
5. La statistique normalis´ee (t) pour le test est donn´ee par t = 5600−0
√11870 = 51.40.
Nous avons
2×Φ (−51.40)≈0.
L’hypoth`ese nulle est massivement rejet´ee.
6. La statistique normalis´ee (t) pour le test est donn´ee par t = 27400−25000
√4816.67 = 34.58.
Nous avons
1−Φ (34.58)≈0.
L’hypoth`ese nulle est massivement rejet´ee.
3 Convergence (20 points)
1. Nous avons :
E 1
mY1+m−1 m
1 (n−1)
n
X
i=2
Yi
!
= 1
mE(Y1) + m−1 m
1 (n−1)
n
X
i=2
E(Yi)
= 1
mµY + m−1 m
1 (n−1)
n
X
i=2
µY
= 1
mµY +m−1 m
1
(n−1)(n−1)µY
= 1
m + m−1 m
µY =µY.
L’esp´erance de l’estimateur est ´egale `a sa vraie valeur, donc l’estimateur est non biais´e.
2. Nous avons : Var
Ye
=Var 1
mY1+ m−1 m
1 (n−1)
n
X
i=2
Yi
!
= 1
m 2
Var(Y1) +
m−1 m
1 (n−1)
2 n
X
i=2
Var(Yi)
= 1
m 2
σ2Y +
m−1 m
1 (n−1)
2
(n−1)σ2Y
= 1
m 2
+
m−1 m
2
1 (n−1)
! σY2
3. La variance d´ecroˆıt avecn. Lorsquentend vers l’infini, nous avons :
n→∞lim 1
m 2
+
m−1 m
2
1 (n−1)
! σY2 =
1 m
2
σY2 >0.
4. Non, ce n’est pas un estimateur convergent. La variance qui provient du premier terme enY1ne d´ecroˆıt pas avec la taille de l’´echantillon.
5. Si on choisit une valeur pourmqui augmente avec la taille de l’´echantillon de fac¸on lin´eaire, nous obtiendrons un estimateur convergent. Par exemple, si nous choisissonsm=n, nous avons :
Var Ye
= 1
n
σ2Y,
ce qui nous donnerait un estimateur convergent. En fait, ce choix nous donne l’estimateur MCO.
4 Th´eor`eme de la limite centrale (40 points)
— Unscript (programme)GRETLpour r´epondre `a la question se trouve
`a :
http://www.er.uqam.ca/nobel/r10735/4272/test1.inp
— Le programme g´en`ere les fichiers de donn´eeststat1.gdt,tstat2.gdt, tstat5.gdt,tstat100.gdt,tstat1000.gdtettstat10000.gdt. Le chiffre dans le nom du fichier correspond `a la taille de l’´echantillonn.
— Chaque fichier contient 10 000 observations (j’ai demand´e 100 dans le questionnaire – ceci est facile `a modifier) sur la moyenne ´echantillonnale denvariables al´eatoires dont le support est[5,10].
— Je n’ai pas trouv´e la fac¸on avecGRETLde lire, `a l’int´erieur de chaque boucle, le fichier de donn´ees et de g´en´erer un graphique. Mais, une fois le script ex´ecut´e, on peut facilement charger les donn´ees et g´en´erer un graphique `a partir du menu.
— J’ai fait plusieurs essais, et je constate qu’avec des moyennes
´echantillonnales de taille 1, 2 et 5 l’hypoth`ese de la normalit´e est toujours rejet´ee. Aussitˆot quen= 100, l’hypoth`ese de la normalit´e est accept´ee (GRETLfait ce test automatiquement – vous n’avez pas besoin de savoir comment, mais ce qui s’int´eressent `a la question peuvent aller consulter l’articleJarque-Bera test sur Wikipedia).
— Avecn = 1, le graphique ressemble `a un rectangle (`a la distribution uniforme elle-mˆeme). Puisque la variance a ´et´e normalis´e `a 1 et la moyenne `a z´ero, les bornes du rectangle se situent `a±√
12/2. Avec n = 2, le graphique ressemble `a un triangle. D´ej`a avecn= 5, `a l’oeil nu le graphique commence `a ressembler `a une cloche normale, mˆeme si l’hypoth`ese nulle de la normalit´e est rejet´ee par le test Jarque-Bera.
cr´e´e le 13/02/2009
correction le 10/02/2018 – j’avais invers´e les r´eponses aux sous-questions 5 et 6 de la question 2.