1 Variance de la somme de variables al´eatoires ind´ependantes (15 points)

(1)

ECO 4272: Introduction à l’économétrie Examen intra: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2012, Steve Ambler Hiver 2012

1 Variance de la somme de variables al´eatoires ind´ependantes (15 points)

Nous avons

Var(X+Y) =

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i+Y_j −E(X+Y))²

=

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i+Y_j−E(X)−E(Y))²

=

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) ((X_i−E(X)) + (Y_j −E(Y)))²

=

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i−E(X))²+ (Y_j −E(Y))²+ 2 (X_i−E(X)) (Y_j−E(Y))

=

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i−E(X))²

(2)

+

n

X

j=1 m

X

i=1

Pr(X =Xi)Pr(Y =Yj) (Yj −E(Y))²

+2

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i−E(X)) (Y_j−E(Y))

=

m

X

i=1

Pr(X =X_i) (X_i−E(X))²

n

X

j=1

Pr(Y =Y_j)

+

n

X

j=1

Pr(Y =Y_j) (Y_j−E(Y))²

m

X

i=1

Pr(X =X_i)

+2

m

X

i=1

Pr(X =X_i) (X_i−E(X))

n

X

j=1

Pr(Y =Y_j) (Y_j−E(Y))

=

m

X

i=1

Pr(X =X_i) (X_i−E(X))²+

n

X

j=1

Pr(Y =Y_j) (Y_j−E(Y))²+ 2×0×0

≡Var(X) +Var(Y),

ce qui fut `a montrer. Notez qu’il faut montrerdirectementque +2

m

X

i=1 n

X

j=1

Pr(X =X_i)Pr(Y =Y_j) (X_i−E(X)) (Y_j −E(Y)) = 0.

Il ne suffit pas d’invoquer Cov(X , Y) = 0, puisqu’on utilise indirectement ce qu’on veut montrer.

2 Distributions de probabilit´e jointes (20 points)

La variableY peut prendre 6 valeurs distinctes, de 1 `a 6. Nous avons Pr(X = 0, Y = 1) =Pr(Y = 1|X = 0)Pr(X = 0) = 1

6× 1 2 = 1

12. De mani`ere semblable,

Pr(X = 0, Y =i) = 1

12, i= 1. . .6.

(3)

Nous avons aussi

Pr(X = 1 , Y = 1) =Pr(Y = 1|X = 1)Pr(X = 1) = 1 4 ×1

2 = 1 8. De mani`ere semblable,

Pr(X = 1, Y =i) = 1

8, i= 1. . .4, et

Pr(X = 1, Y = 5) =Pr(Y = 5|X = 1)Pr(X = 1) = 0×1 2 = 0.

De mani`ere semblable, Pr(X = 1 , Y = 6) = 0.

Nous pouvons maintenant r´epondre aux sous-questions.

1. Nous avons le tableau suivant

X : Y : 1 2 3 4 5 6 Pr(X)

0 1/12 1/12 1/12 1/12 1/12 1/12 1/2

1 1/8 1/8 1/8 1/8 0 0 1/2

Pr(Y) 5/24 5/24 5/24 5/24 1/12 1/12 1

2. Nous avons

E(X) =Pr(X = 0)×0 +Pr(X = 1)×1

= 1

2 ×0 + 1

2 ×1 = 1 2. 3. Nous avons

E(Y) =Pr(Y = 1)×1 +Pr(Y = 2)×2 +Pr(Y = 3)×3 +Pr(Y = 4)×4 +Pr(Y = 5)×5 +Pr(Y = 6)×6

= 5 24 +10

24+ 15 24+ 20

24+ 5 12 + 6

12 = 72 24 = 3.

Ce n’était pas nécessaire de simplifier la réponse.

4. Nous avons

(4)

= 1

4 ×1 + 1

4×2 + 1

4 ×3 + 1

4 ×4 + 0×5 + 0×6

= 10

4 = 2.5.

Ce n’´etait pas n´ecessaire de simplifier.

5. Nous avons

E(X|Y = 2) =Pr(X = 0|Y = 2)×0 +Pr(X = 1|Y = 2)×1

= 2

5×0 + 3

5×1 = 3 5

6. Les deux variables al´eatoires ne sont pas ind´ependantes. Nous avons Pr(X = 1, Y = 6) = 06= 1

2 × 1

12 =Pr(X = 1)×Pr(Y = 6).

On a trouvé un contre-exemple où cette égalité ne tient pas et donc les deux variables aléatoires ne sont pas indépendantes.

3 Estimateur de l’esp´erance (20 points)

1. Non. Pour augmenter la précision de l’estimateur, nous devrions accorder un poids plus élevé aux observations qui permettent d’estimer le paramètre d’intérêt plus précisément, cela veut dire aux observations où la variance autour de la moyenne est plus petite. Le fait d’observer une réalisation donnée deY₁ donne pour cette raisondavantaged’information que d’observer une réalisation donnée deY₂. La 4e partie de la question donne un estimateur˚Y qui pondère les deux échantillons de façon arbitraire.

Ensuite, je vous demande dans la 5e partie de montrer que la pondération qui minimise la variance de l’estimateur (et qui donne donc l’estimateur le plus efficient parmi les valeurs possibles dem) donne un poids plus élevé aux observations sur lesY_i1. Donc, je vous donne la réponse à cette sous-question dans l’énoncé de la 5e partie.

Une autre façon de penser à la réponse de manière intuitive est la suivante.

Pensez à un cas extrème, où la variance deY₁, au lieu d’être la moitié de la variance deY₂, tend vers zéro. Dans tel cas, observer une réalisation deY₁ nous révéleraitsans erreurl’espérance de la distributionµY. On

accorderait tout le poids aux observations surY₁ et aucun poids aux observations surY₂.

(5)

2. Nous avons

E

Ye

=E 1 2n

n

X

i=1

Y_1i+ 1 2n

n

X

i=1

Y_2i

!

= 1 2n

n

X

i=1

µ_Y + 1 2n

n

X

i=1

µ_Y

= n

2nµ_Y + n

2nµ_Y =µ_Y. 3. Nous avons

Var Ye

=Var 1 2n

n

X

i=1

Y_1i+ 1 2n

n

X

i=1

Y_2i

!

= 1 4n²

n

X

i=1

Var(Y_1i) + 1 4n²

n

X

i=1

Var(Y_2i)

= n

4n²σ²_Y + n 4n²2σ_Y²

= 3 4

1 nσ_Y².

4. Nous avons (notez qu’il est facile de montrer queY˚est non biais´e, mais je ne vous ai pas demand´e de le faire)

Var Y˚

=Var m n

n

X

i=1

Y_1i+ (1−m) n

n

X

i=1

Y_2i

!

= m² n²

n

X

i=1

Var(Y1i) + (1−m)² n²

n

X

i=1

Var(Y2i)

= m²

n σ²_Y +(1−m)² n 2σ_Y²

= 1

n m²+ 2(1−m)² σ_Y².

(6)

5. Nous voulons trouvez la r´eponse au probl`eme minm m²+ 2(1−m)²

σ_Y². Nous avons comme CPO

∂(m²+ 2(1−m)²)

∂m = 0

⇒2m−2×2(1−m) = 0

⇒6m−4 = 0

⇒m= 2 3.

4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (45 points)

1. Le coefficientβ₁ donne la part du travail dans le paiement aux facteurs par la firme et donne aussi l’´elasticit´e de la production de la firme part rapport au travail.

2. Nous avons

T SS =SSR+ESS= 451.78 + 236.49 = 688.27 3. Nous avons

R² = ESS

T SS = 236.49 688.27 4. Nous avons

rSSR n−2 =

r451.78 278 5. Pour un test de significativit´e, l’hypoth`ese nulle est

H₀ :β₁ = 0, et l’hypoth`ese alternative est

H₁ :β₁ 6= 0.

La statistiquetest donn´ee par t =

βˆ₁−0 ˆ σ_β_ˆ

1

= 0.690 0.023

(7)

6. Nous avons

p= 2Φ

−

0.690 0.023

.

Puisque la fonctionΦ(·)est la fonction de distribution cumulée pour la loi normale centrée réduite, nous supposons implicitement qu’il y a assez d’observations pour que notre statistiquetsoit approximativement distribuée selon une loi normale (centrée réduite).

7. La valeur absolue de la statistiquetest supérieure à 30. Avec une valeur aussi grande en valeur absolue, nous allons pouvoir rejeter l’hypothèse nulle à tous les taux marginaux de significativité conventionnels.

8. Nous avons

t = 0.690−0.66 0.023

9. Une grande valeur (positive) de la statistique calculée constitue de l’évidence contre l’hypothèse nulle. Lap-value est donnée par

p= 1−Φ

−

0.690−0.66 0.023

10. Nous avons pour la loi normale centr´ee r´eduite 0.95Pr −1.96≤ βˆ₁−β₁

ˆ σβˆ1

≤1.96

!

=Pr

−1.96ˆσβˆ1 ≤βˆ₁−β₁ ≤1.96ˆσβˆ1

=Pr

1.96ˆσ_β_ˆ

1 ≥β₁−βˆ₁ ≥ −1.96ˆσ_β_ˆ

1

=Pr

βˆ₁+ 1.96ˆσβˆ1 ≥β₁ ≥βˆ₁−1.96ˆσβˆ1

=Pr

βˆ₁−1.96ˆσ_β_ˆ

1 ≤β₁ ≤βˆ₁+ 1.96ˆσ_β_ˆ

1

. Donc, l’intervalle de confiance est donn´e par

0.690±1.96×0.023.

(8)

11. Nous avons pour la loi normale centr´ee r´eduite 0.99Pr −2.58≤ βˆ₀−β₀

ˆ σβˆ0

≤2.58

!

=Pr

−2.58ˆσβˆ0 ≤βˆ₀−β₀ ≤1.96ˆσβˆ0

=Pr

2.58ˆσβˆ0 ≥β₀−βˆ₀ ≥ −2.58ˆσβˆ0

=Pr

βˆ₀+ 2.58ˆσ_β_ˆ

0 ≥β₀ ≥βˆ₀−2.58ˆσ_β_ˆ

0

=Pr

βˆ₀−2.58ˆσβˆ0 ≤β₀ ≤βˆ₀+ 2.58ˆσβˆ0

. Donc, l’intervalle de confiance est donn´e par

0.130±2.58×5.371.

Notez que cet intervalle contient zéro. Un test de significativité pourβˆ₀ ne rejetterait pas l’hypothèse nulle aux taux de significativité marginale conventionnels.

5 R´egression simple : estimateurs non biais´es (20 points (bonus))

1. La CPO pour minimiser la somme des r´esidus au carr´e est

n

X

i=2

−2∆X_i(∆Y_i−β₁∆X_i) = 0

⇒βˆ₁ = Pn

i=2∆Yi∆Xi

Pn

i=2(∆X_i)² 2. Nous avons

βˆ₁ = Pn

i=2∆Xi(β1∆Xi+vi) Pn

i=2(∆X_i)²

=β₁ Pn

i=2(∆X_i)² Pn

i=2(∆X_i)² + Pn

i=2∆X_iv_i Pn

i=2(∆X_i)²

(9)

=β₁+ Pn

i=2∆X_iv_i Pn

i=2(∆X_i)². Nous avons tout de suite

E βˆ₁

=β₁+E Pn

i=2∆Xivi

Pn

i=2(∆X_i)²

!

=β₁+E Pn

i=2∆X_iE(v_i|∆X_i) Pn

i=2(∆X_i)²

!

=β1. 3. Nous avons

βe₁ =

1 n

Pn i=2∆Yi 1

n

Pn i=2∆Xi

=

1 n

Pn

i=2(β₁∆X_i+v_i)

1 n

Pn i=2∆X_i

=β₁

1 n

Pn i=2∆X_i

1 n

Pn

i=2∆X_i +

1 n

Pn i=2v_i

1 n

Pn i=2∆X_i

=β₁ +

1 n

Pn i=2vi 1

n

Pn i=2∆Xi

.

Nous avons tout de suite E

βe₁

=β₁+E 1

n

Pn i=2v_i

1 n

Pn i=2∆X_i

=β1+E 1

n

Pn

i=2E(v_i|∆X_i)

1 n

Pn i=2∆X_i

=β₁

4. En cas d’homoscédasticité,βˆ₁serait l’estimateur à variance minimale. (Les deux estimateurs sont linéaires enβ₁.) Nous n’avons fait aucune hypothèse concernant la variance du terme d’erreur, et pour cette raison nous ne pouvons conclure avec certitude queβˆ₁a une plus petite variance queβe₁. créé le : 19/02/2012