ECO 4272: Introduction `a l’´econom´etrie Exercice 1: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2013, Steve Ambler Hiver 2013
1 La corr´elation ´echantillonnale (15 points)
Nous avons
Corr(aX, bY)
≡ Cov(aX, bY) q
Var(aX) q
Var(bY)
=
1 n−1
Pn
i=1 aXi−aX
bYi−bY q 1
n−1
Pn
i=1 aXi−aX2q
1 n−1
Pn
i=1 bYi−bY2
=
1 n−1
Pn
i=1a Xi−X
b Yi−Y q 1
n−1
Pn
i=1a2 Xi−X2q
1 n−1
Pn
i=1b2 Yi−Y2
= abn−11 Pn
i=1 Xi−X
Yi−Y
ab q 1
n−1
Pn
i=1 Xi−X2q
1 n−1
Pn
i=1 Yi−Y2
=
1 n−1
Pn
i=1 Xi−X
Yi−Y q 1
n−1
Pn
i=1 Xi−X2q
1 n−1
Pn
i=1 Yi−Y2
≡Corr(X, Y),
o`u je prends pour acquis que la moyenne ´echantillonnale deaX est ´egale `aaX.
2 Distributions de probabilit´e jointes (25 points)
1. Il y a trois valeurs distinctes possibles pour X (1,2,3) et trois valeurs dis- tinctes possibles pourY (1,2,3). Nous avons le tableau suivant au d´epart.
Y
1 2 3
1 1/9 1/9 1/9 X 2 1/6 0 1/6
3 1/4 1/12 0
Les probabilit´es marginales sont donn´ees par le tableau suivant.
Y
1 2 3 Pr(X)
1 1/9 1/9 1/9 1/3
X 2 1/6 0 1/6 1/3
3 1/4 1/12 0 1/3
Pr(Y) 19/36 7/36 10/36 2. Nous avons :
E(X|Y = 1)
= 1×Pr(X = 1|Y = 1) +2×Pr(X = 2|Y = 1) +3×Pr(X = 3|Y = 1)
= 1× Pr(X = 1, Y = 1) Pr(Y = 1) +2× Pr(X = 2, Y = 1)
Pr(Y = 1) +3× Pr(X = 3, Y = 1)
Pr(Y = 1)
= 1× 1/9
19/36+ 2× 1/6
19/36+ 3× 1/4 19/36
= 1×4/19 + 2×6/19 + 3×9/19 = 43/19.
De mani`ere semblable :
E(X|Y = 2)
= 1× 1/9
7/36 + 2× 0
7/36 + 3× 1/12 7/36
= 1×4/7 + 2×0 + 3×3/7 = 13/7.
De mani`ere semblable :
E(X|Y = 3)
= 1× 1/9
10/36+ 2× 1/6
10/36+ 3× 0 10/36
= 1×4/10 + 2×6/10 + 3×0 = 16/10.
3. De mani`ere semblable, nous avons :
E(Y|X = 1)
= 1× 1/9
1/3 + 2× 1/9
1/3+ 3×1/9 1/3
= 1×1/3 + 2×1/3 + 3×1/3 = 2.
De mani`ere semblable :
E(Y|X = 2)
= 1× 1/6
1/3 + 2× 0
1/3+ 3×1/6 1/3
= 1×1/2 + 2×0 + 3×1/2 = 2.
De mani`ere semblable :
E(Y|X = 3)
= 1×1/4
1/3 + 2× 1/12
1/3 + 3× 0 1/3
= 1×3/4 + 2×1/4 + 3×0 = 5/4.
4. Nous avons :
E(X)
= 1×Pr(X = 1) + 2×Pr(X = 2) + 3×Pr(X = 3)
= 1×1/3 + 2×1/3 + 3×1/3 = 2.
5. De mani`ere semblable :
E(Y)
= 1×19/36 + 2×7/36 + 3×10/36 = 63/36.
6. Les deux variables ne sont pas ind´ependantes. Nous avons
Pr(X = 3, Y = 3) = 06=Pr(X = 3)×Pr(Y = 3) = 1/3×10/36.
Il suffit d’un contre-exemple pour montrer que les deux variables al´eatoires ne sont pas ind´ependantes.
3 Efficience (25 points)
1. Nous avons
E(¯µ) = E aX¯ + (1−a) ¯Y
=aE(X) + (1−a)E(Y)
=aµ+ (1−a)µ=µ, ce qui fut `a d´emontrer.
2. Nous avons
Var(¯µ) = Var aX¯ + (1−a) ¯Y
=a2Var X¯
+ (1−a)2Var Y¯
+ 2a(1−a)Cov(X, Y)
=a2Var X¯
+ (1−a)2Var Y¯
=a2Var 1 nX
nX
X
i=1
Xi
!
+ (1−a)2Var 1 nY
nY
X
i=1
Yi
!
=a2 1 nx2Var
nX
X
i=1
σX2
!
+ (1−a)2 1 n2Var
nY
X
i=1
σY2
!
=a2σX2
nX + (1−a)2σY2 nY.
3. Le probl`eme est
mina =a2σX2
nX + (1−a)2σ2Y nY . La CPO est
2aσ2X
nX −2(1−a)σY2 nY = 0
⇒aσX2
nX +aσY2 nY = σY2
nY
⇒a=
σY2 nY
σ2X nX + σn2Y
Y
⇒a= 1 1 + nnY
X
σ2X σ2Y
.
Le r´esultat est logique. Plus grand est l’´echantillon (soit le premier, soit le deuxi`eme), plus grand est son poids dans l’estimateur efficient. Plus petite est la variance de la variable al´eatoire (soit la premi`ere, soit la deuxi`eme), plus grand est son poids dans l’estimateur. Cela revient `a dire que le fait d’avoir plus d’observations ou d’avoir des observations d’une variable avec une plus petite variance permet d’estimer la moyenne avec plus de pr´ecision.
4. Sinx tend vers l’infini, on voudrait ´ecarter le deuxi`eme ´echantillon. SinY tend vers l’infini, on voudrait ´ecarter le premier ´echantillon. SiσX2 tend vers z´ero, on voudrait ´ecarter le deuxi`eme ´echantillon. SiσY2 tend vers z´ero, on voudrait ´ecarter le premier ´echantillon.
5. Il s’agit de calculer la condition du deuxi`eme ordre. Nous avons
∂2Var(¯µ)
∂a2
= 2σX2
nX + 2σ2Y nY >0,
qui ne d´epend pas dea. Donc il s’agit d’un minimum et non d’un maximum.
6. ´Etant donnee l’expression pour la variance de l’estimateur, elle restera plus grande que z´ero dans la mesure ou un des deux ´echantillons (ou les deux) n’augmente pas en nombre d’observations. Il faut que la taille des deux
´echantillons tende vers l’infini pour que l’estimateur soit convergent, pour une valeurdonn´eedea.
4 Th´eor`eme limite centrale (35 points)
1. Voir le script tp1.R. Tel qu’indiqu´e dans le message que je vous ai envoy´e, la fonctiondice()g´en`ere des r´esultats qui, pour les fins de certains calculs, ne sont pas consid´er´es num´eriques.
2. Je normalise les valeurs g´en´er´ees `a l’int´erieur de chaque boucle.
3. Dans chaque cas (pour chaque valeur den) la moyenne ´echantillonnale des 10000 r´ep´etitions devrait ˆetre pr`es de z´ero, et la variance pr`es de 1.
4. Voir le script.
5. Pourn= 1, l’histogramme devrait ˆetre presque rectangulaire. Chacune des 6 valeurs a une fr´equence approximativement ´egale `a 16. Pour n = 100 et n = 1000l’histogramme devrait ressembler `a une cloche normale.
6. Voir la sous-question suivante
7. Le test devrait rejeter l’hypoth`ese nulle, mˆeme `a un niveau de 1%, pour n = 1, n = 2 et n = 10. Pour n = 100, le r´esultat peut d´ependre de l’´echantillon individuel. Pour n = 1000, lap-value devrait ˆetre facilement au-dessus de 0.5.
cr´e´e le 04/02/2013