ECO 4272: Introduction `a l’´econom´etrie Examen intra: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2012, Steve Ambler Hiver 2012
1 Variance de la somme de variables al´eatoires ind´ependantes (15 points)
Nous avons
Var(X+Y) =
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi+Yj −E(X+Y))2
=
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi+Yj−E(X)−E(Y))2
=
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) ((Xi−E(X)) + (Yj −E(Y)))2
=
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi−E(X))2+ (Yj −E(Y))2+ 2 (Xi−E(X)) (Yj−E(Y))
=
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi−E(X))2
+
n
X
j=1 m
X
i=1
Pr(X =Xi)Pr(Y =Yj) (Yj −E(Y))2
+2
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi−E(X)) (Yj−E(Y))
=
m
X
i=1
Pr(X =Xi) (Xi−E(X))2
n
X
j=1
Pr(Y =Yj)
+
n
X
j=1
Pr(Y =Yj) (Yj−E(Y))2
m
X
i=1
Pr(X =Xi)
+2
m
X
i=1
Pr(X =Xi) (Xi−E(X))
n
X
j=1
Pr(Y =Yj) (Yj−E(Y))
=
m
X
i=1
Pr(X =Xi) (Xi−E(X))2+
n
X
j=1
Pr(Y =Yj) (Yj−E(Y))2+ 2×0×0
≡Var(X) +Var(Y),
ce qui fut `a montrer. Notez qu’il faut montrerdirectementque +2
m
X
i=1 n
X
j=1
Pr(X =Xi)Pr(Y =Yj) (Xi−E(X)) (Yj −E(Y)) = 0.
Il ne suffit pas d’invoquer Cov(X , Y) = 0, puisqu’on utilise indirectement ce qu’on veut montrer.
2 Distributions de probabilit´e jointes (20 points)
La variableY peut prendre 6 valeurs distinctes, de 1 `a 6. Nous avons Pr(X = 0, Y = 1) =Pr(Y = 1|X = 0)Pr(X = 0) = 1
6× 1 2 = 1
12. De mani`ere semblable,
Pr(X = 0, Y =i) = 1
12, i= 1. . .6.
Nous avons aussi
Pr(X = 1 , Y = 1) =Pr(Y = 1|X = 1)Pr(X = 1) = 1 4 ×1
2 = 1 8. De mani`ere semblable,
Pr(X = 1, Y =i) = 1
8, i= 1. . .4, et
Pr(X = 1, Y = 5) =Pr(Y = 5|X = 1)Pr(X = 1) = 0×1 2 = 0.
De mani`ere semblable, Pr(X = 1 , Y = 6) = 0.
Nous pouvons maintenant r´epondre aux sous-questions.
1. Nous avons le tableau suivant
X : Y : 1 2 3 4 5 6 Pr(X)
0 1/12 1/12 1/12 1/12 1/12 1/12 1/2
1 1/8 1/8 1/8 1/8 0 0 1/2
Pr(Y) 5/24 5/24 5/24 5/24 1/12 1/12 1
2. Nous avons
E(X) =Pr(X = 0)×0 +Pr(X = 1)×1
= 1
2 ×0 + 1
2 ×1 = 1 2. 3. Nous avons
E(Y) =Pr(Y = 1)×1 +Pr(Y = 2)×2 +Pr(Y = 3)×3 +Pr(Y = 4)×4 +Pr(Y = 5)×5 +Pr(Y = 6)×6
= 5 24 +10
24+ 15 24+ 20
24+ 5 12 + 6
12 = 72 24 = 3.
Ce n’´etait pas n´ecessaire de simplifier la r´eponse.
4. Nous avons
E(Y|X = 1) =Pr(Y = 1|X = 1)×1+Pr(Y = 2|X = 1)×2+Pr(Y = 3|X = 1)×3 +Pr(Y = 4|X = 1)×4 +Pr(Y = 5|X = 1)×5 +Pr(Y = 6|X = 1)×6
= 1
4 ×1 + 1
4×2 + 1
4 ×3 + 1
4 ×4 + 0×5 + 0×6
= 10
4 = 2.5.
Ce n’´etait pas n´ecessaire de simplifier.
5. Nous avons
E(X|Y = 2) =Pr(X = 0|Y = 2)×0 +Pr(X = 1|Y = 2)×1
= 2
5×0 + 3
5×1 = 3 5
6. Les deux variables al´eatoires ne sont pas ind´ependantes. Nous avons Pr(X = 1, Y = 6) = 06= 1
2 × 1
12 =Pr(X = 1)×Pr(Y = 6).
On a trouv´e un contre-exemple o`u cette ´egalit´e ne tient pas et donc les deux variables al´eatoires ne sont pas ind´ependantes.
3 Estimateur de l’esp´erance (20 points)
1. Non. Pour augmenter la pr´ecision de l’estimateur, nous devrions accorder un poids plus ´elev´e aux observations qui permettent d’estimer le param`etre d’int´erˆet plus pr´ecis´ement, cela veut dire aux observations o`u la variance autour de la moyenne est plus petite. Le fait d’observer une r´ealisation donn´ee deY1 donne pour cette raisondavantaged’information que d’observer une r´ealisation donn´ee deY2. La 4e partie de la question donne un estimateur˚Y qui pond`ere les deux ´echantillons de fac¸on arbitraire.
Ensuite, je vous demande dans la 5e partie de montrer que la pond´eration qui minimise la variance de l’estimateur (et qui donne donc l’estimateur le plus efficient parmi les valeurs possibles dem) donne un poids plus ´elev´e aux observations sur lesYi1. Donc, je vous donne la r´eponse `a cette sous-question dans l’´enonc´e de la 5e partie.
Une autre fac¸on de penser `a la r´eponse de mani`ere intuitive est la suivante.
Pensez `a un cas extr`eme, o`u la variance deY1, au lieu d’ˆetre la moiti´e de la variance deY2, tend vers z´ero. Dans tel cas, observer une r´ealisation deY1 nous r´ev´eleraitsans erreurl’esp´erance de la distributionµY. On
accorderait tout le poids aux observations surY1 et aucun poids aux observations surY2.
2. Nous avons
E
Ye
=E 1 2n
n
X
i=1
Y1i+ 1 2n
n
X
i=1
Y2i
!
= 1 2n
n
X
i=1
µY + 1 2n
n
X
i=1
µY
= n
2nµY + n
2nµY =µY. 3. Nous avons
Var Ye
=Var 1 2n
n
X
i=1
Y1i+ 1 2n
n
X
i=1
Y2i
!
= 1 4n2
n
X
i=1
Var(Y1i) + 1 4n2
n
X
i=1
Var(Y2i)
= n
4n2σ2Y + n 4n22σY2
= 3 4
1 nσY2.
4. Nous avons (notez qu’il est facile de montrer queY˚est non biais´e, mais je ne vous ai pas demand´e de le faire)
Var Y˚
=Var m n
n
X
i=1
Y1i+ (1−m) n
n
X
i=1
Y2i
!
= m2 n2
n
X
i=1
Var(Y1i) + (1−m)2 n2
n
X
i=1
Var(Y2i)
= m2
n σ2Y +(1−m)2 n 2σY2
= 1
n m2+ 2(1−m)2 σY2.
5. Nous voulons trouvez la r´eponse au probl`eme minm m2+ 2(1−m)2
σY2. Nous avons comme CPO
∂(m2+ 2(1−m)2)
∂m = 0
⇒2m−2×2(1−m) = 0
⇒6m−4 = 0
⇒m= 2 3.
4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (45 points)
1. Le coefficientβ1 donne la part du travail dans le paiement aux facteurs par la firme et donne aussi l’´elasticit´e de la production de la firme part rapport au travail.
2. Nous avons
T SS =SSR+ESS= 451.78 + 236.49 = 688.27 3. Nous avons
R2 = ESS
T SS = 236.49 688.27 4. Nous avons
rSSR n−2 =
r451.78 278 5. Pour un test de significativit´e, l’hypoth`ese nulle est
H0 :β1 = 0, et l’hypoth`ese alternative est
H1 :β1 6= 0.
La statistiquetest donn´ee par t =
βˆ1−0 ˆ σβˆ
1
= 0.690 0.023
6. Nous avons
p= 2Φ
−
0.690 0.023
.
Puisque la fonctionΦ(·)est la fonction de distribution cumul´ee pour la loi normale centr´ee r´eduite, nous supposons implicitement qu’il y a assez d’observations pour que notre statistiquetsoit approximativement distribu´ee selon une loi normale (centr´ee r´eduite).
7. La valeur absolue de la statistiquetest sup´erieure `a 30. Avec une valeur aussi grande en valeur absolue, nous allons pouvoir rejeter l’hypoth`ese nulle `a tous les taux marginaux de significativit´e conventionnels.
8. Nous avons
t = 0.690−0.66 0.023
9. Une grande valeur (positive) de la statistique calcul´ee constitue de l’´evidence contre l’hypoth`ese nulle. Lap-value est donn´ee par
p= 1−Φ
−
0.690−0.66 0.023
10. Nous avons pour la loi normale centr´ee r´eduite 0.95Pr −1.96≤ βˆ1−β1
ˆ σβˆ1
≤1.96
!
=Pr
−1.96ˆσβˆ1 ≤βˆ1−β1 ≤1.96ˆσβˆ1
=Pr
1.96ˆσβˆ
1 ≥β1−βˆ1 ≥ −1.96ˆσβˆ
1
=Pr
βˆ1+ 1.96ˆσβˆ1 ≥β1 ≥βˆ1−1.96ˆσβˆ1
=Pr
βˆ1−1.96ˆσβˆ
1 ≤β1 ≤βˆ1+ 1.96ˆσβˆ
1
. Donc, l’intervalle de confiance est donn´e par
0.690±1.96×0.023.
11. Nous avons pour la loi normale centr´ee r´eduite 0.99Pr −2.58≤ βˆ0−β0
ˆ σβˆ0
≤2.58
!
=Pr
−2.58ˆσβˆ0 ≤βˆ0−β0 ≤1.96ˆσβˆ0
=Pr
2.58ˆσβˆ0 ≥β0−βˆ0 ≥ −2.58ˆσβˆ0
=Pr
βˆ0+ 2.58ˆσβˆ
0 ≥β0 ≥βˆ0−2.58ˆσβˆ
0
=Pr
βˆ0−2.58ˆσβˆ0 ≤β0 ≤βˆ0+ 2.58ˆσβˆ0
. Donc, l’intervalle de confiance est donn´e par
0.130±2.58×5.371.
Notez que cet intervalle contient z´ero. Un test de significativit´e pourβˆ0 ne rejetterait pas l’hypoth`ese nulle aux taux de significativit´e marginale conventionnels.
5 R´egression simple : estimateurs non biais´es (20 points (bonus))
1. La CPO pour minimiser la somme des r´esidus au carr´e est
n
X
i=2
−2∆Xi(∆Yi−β1∆Xi) = 0
⇒βˆ1 = Pn
i=2∆Yi∆Xi
Pn
i=2(∆Xi)2 2. Nous avons
βˆ1 = Pn
i=2∆Xi(β1∆Xi+vi) Pn
i=2(∆Xi)2
=β1 Pn
i=2(∆Xi)2 Pn
i=2(∆Xi)2 + Pn
i=2∆Xivi Pn
i=2(∆Xi)2
=β1+ Pn
i=2∆Xivi Pn
i=2(∆Xi)2. Nous avons tout de suite
E βˆ1
=β1+E Pn
i=2∆Xivi
Pn
i=2(∆Xi)2
!
=β1+E Pn
i=2∆XiE(vi|∆Xi) Pn
i=2(∆Xi)2
!
=β1. 3. Nous avons
βe1 =
1 n
Pn i=2∆Yi 1
n
Pn i=2∆Xi
=
1 n
Pn
i=2(β1∆Xi+vi)
1 n
Pn i=2∆Xi
=β1
1 n
Pn i=2∆Xi
1 n
Pn
i=2∆Xi +
1 n
Pn i=2vi
1 n
Pn i=2∆Xi
=β1 +
1 n
Pn i=2vi 1
n
Pn i=2∆Xi
.
Nous avons tout de suite E
βe1
=β1+E 1
n
Pn i=2vi
1 n
Pn i=2∆Xi
=β1+E 1
n
Pn
i=2E(vi|∆Xi)
1 n
Pn i=2∆Xi
=β1
4. En cas d’homosc´edasticit´e,βˆ1serait l’estimateur `a variance minimale. (Les deux estimateurs sont lin´eaires enβ1.) Nous n’avons fait aucune hypoth`ese concernant la variance du terme d’erreur, et pour cette raison nous ne pouvons conclure avec certitude queβˆ1a une plus petite variance queβe1. cr´e´e le : 19/02/2012