Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

(1)

ECO 4272: Introduction à l’économétrie Examen intra: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2012, Steve Ambler Automne 2012

1 Variance ´echantillonnale d’une fonction de deux variables al´eatoires (15 points)

Notez qu’il s’agit de lavariance échantillonnaled’une combinaison linéaire de variables aléatoires, non de la variance dans la population. J’ai été relativement sévère dans le cas de réponses où on introduisait des opérateurs d’espérance, par exemple (un concept propre à la population, non à un échantillon donné).

Nous avons

Var(aX +bY)

≡ 1 n−1

n

X

i=1

aX_i+bY_i−aX +bY2

. Nous avons

aX+bY ≡ 1 n

n

X

i=1

(aX_i+bY_i)

=a1 n

X

i=1

X_i+b1 n

X

i=1

X_i

≡aX+bY .

(2)

Donc nous pouvons ´ecrire 1 n−1

n

X

i=1

aX_i+bY_i−aX+bY2

.

= 1

n−1

n

X

i=1

a X_i−X

+b Y_i −Y2

=a² 1 n−1

n

X

i=1

X_i−X2

+b² 1 n−1

n

X

i=1

Y_i−Y2

+ab 1 n−1

n

X

i=1

X_i−X

Y_i−Y

≡a²Var(X) +b²Var(Y) + 2abCov(X , Y), ce qui fut `a d´emontrer.

2 Distributions de probabilit´e jointes (20 points)

1. Le tableau complété est donné par

X\Y Y=1 Y=2 Y=3 Pr(X)

X=1 0.10 0.05 0.05 0.20 X=2 0.05 0.10 0.05 0.20 X=3 0.05 0.05 0.10 0.20 X=4 0.10 0.05 0.05 0.20 X=5 0.05 0.05 0.10 0.20 Pr(Y) 0.35 0.30 0.35 1.00 2. La formule est

E(X|Y = 1).

=

5

X

i=1

XiPr(X =Xi|Y = 1)

=

5

X

i=1

X_iPr(X =X_i, Y = 1) Pr(Y = 1)

= 1×0.10

0.35+ 2× 0.05

0.35 + 3× 0.05

0.35 + 4× 0.10

0.35 + 5× 0.05 0.35

= 0.10

0.35+ 0.10

0.35+0.15

0.35+ 0.40

0.35 +0.25 0.35

(3)

= 1.00 0.35. Ce n’´etait pas n´ecessaire de simplifier.

3. De mani`ere semblable,

E(Y|X = 3).

=

3

X

i=1

Y_iPr(Y =Y_i|X = 3)

=

3

X

i=1

Xi

Pr(Y =Yi, X = 3) Pr(X = 3)

= 1× 0.05

0.20 + 2× 0.05

0.20 + 3× 0.10 0.20

= 0.25 + 0.50 + 1.50 = 2.25.

Ce n’´etait pas n´ecessaire de simplifier.

4. Nous avons

E(X)

=

5

X

i=1

X_iPr(X =X_i)

= 1×0.20 + 2×0.20 + 3×0.20 + 4×0.20 + 5×0.20

= 15×0.20 = 3.0.

5. De mani`ere semblable

E(Y)

=

3

X

i=1

Y_iPr(Y =Y_i)

= 1×0.35 + 2×0.30 + 3×0.35

= 0.35 + 0.60 + 1.05 = 2.0.

6. Non. Nous avons

Pr(X = 1, Y = 1) = 0.106= 0.35×0.20 =Pr(X = 1)Pr(Y = 1). Il suffit d’un contre exemple comme ceci pour montrer que les deux variables ne sont pas ind´ependantes.

(4)

3 Diff´erences entre les esp´erances de deux populations (20 points)

1. On écrit une statistique normalisée qui, sous l’hypothèse nulle, a une moyenne de zéro et une variance unitaire. La statistique est

t_act= X¯ −Y¯ −0 qσˆ_X²

350 + ₃₀₀^ˆ^σ²^Y .

Le d´enominateur est la racine carr´ee d’un estimateur convergent de la variance de X¯ −Y¯

.

2. Il faut que les observations des deux ´echantillons soit i.i.d. et que les deux

´echantillons soient ind´ependants l’un de l’autre.

3. Puisqu’on a des centaines d’observations, on peut supposer une convergence approximative vers une loi normale centr´ee r´eduite.

4. Non, puisque le dénominateur a des propriétés inconnues en petit

échantillon. Si on suppose une variance égale des deux variables aléatoires, et en plus on est prêt à supposer la normalité des deux populations, on peut utiliser un estimateur de cette variance pour construire une statistique qui suit une distributiontde Student. (Si vous avez écrit ceci, je vous ai donné tous les points. Il n’était pas nécessaire d’écrire la formule pour

l’estimateur de la variance.) La statistique est donn´ee par t_act =

X¯ −Y¯ −0 q

s²_pooledp

1/350 + 1/300 .

et nous avons

s²_pooled= 1

(350 + 300−2)

350

X

i=1

Xi−X¯2

+

300

X

i=1

Yi−Y¯2

! ,

= 1

(350 + 300−2) (350−1)ˆσ_X² + (300−1)ˆσ²_Y . 5. L’hypoth`ese nulle est bilat´erale. Donc nous avons

p= 2Φ (−|t_act|)

où, comme d’habitude,Φ(z)est la fonction de la distribution normale centrée réduite cumulée évaluée au pointz.

(5)

6. L’hypoth`ese alternative est que

µ_X −µ_Y <0.

Donc, une statistiquetfortement négative nous mène à rejeter l’hypothèse nulle. Lap-value est donnée par

p= Φ (tact).

4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (45 points)

1. Nous savons que

T SS =ESS+SSR

⇒ESS =T SS −SSR= 436.21−114.31 2. Nous savons que

R² ≡ ESS

T SS = 1−SSR

T SS = 1−114.31 436.21. 3. Nous savons que

s_u_ˆ ≡q s²_u_ˆ =

rSSR n−2 =

r114.31 423 . 4. L’hypoth`ese nulle `a tester est

H₀ :β₁ = 0, contre l’hypoth`ese alternative bilat´erale que H1 :β1 6= 0.

Nous avons

t_act = βˆ₁−0 ˆ σβˆ1

= 1.342 0.379

5. Avec une hypothèse alternative bilatérale, lap-value est donnée par p= 2Φ (−|t_act|).

(6)

6. La statistiquetest supérieure à 3 en valeur absolue. Donc, on sait que la p-value est inférieure à 0.01. (Dans l’énoncé de la sous-question 10, je vous donne queΦ (−2.58)≈0.005. Donc, le coefficient est significatif à un niveau de 1%. A fortiori, il est significatif à un niveau de 5%.

7. La statistiquetpour le test est donn´ee par t_act =

βˆ₁−2.0 ˆ σβˆ1

= 1.342−2.0 0.379

8. C’est une valeur fortement négative qui nous mène à rejeter l’hypothèse nulle dans ce cas. Lap-value est donnée par

p= Φ (t_act) 9. Nous avons

0.95 =Pr(−1.96≤Z ≤1.96) oùZsuit une loi normale centrée réduite. Nous avons donc

0.95 = Pr −1.96≤ βˆ₁ −β₁ ˆ σβˆ1

≤1.96

!

=Pr

−1.96ˆσ_β_ˆ

1 ≤

βˆ₁−β₁

≤1.96ˆσ_β_ˆ

1

=Pr

−1.96ˆσβˆ1 ≤

β₁−βˆ₁

≤1.96ˆσβˆ1

=Pr

βˆ₁−1.96ˆσ_β_ˆ

1 ≤β₁ ≤βˆ₁+ 1.96ˆσ_β_ˆ

1

. Donc l’intervalle de confiance de 95% pourβ₁est

βˆ1±1.96ˆσβˆ1. 10. De mani`ere semblable nous avons

0.99 =Pr(−2.58≤Z ≤2.58)

=Pr −2.58≤ βˆ₀−β₀ ˆ σβˆ0

≤2.58

!

=Pr

−2.58ˆσ_β_ˆ

0 ≤

βˆ₀−β₀

≤2.58ˆσ_β_ˆ

0

(7)

=Pr

−2.58ˆσβˆ0 ≤

β₀−βˆ₀

≤2.58ˆσβˆ0

=Pr

βˆ₀−2.58ˆσ_β_ˆ

0 ≤β₀ ≤βˆ₀+ 2.58ˆσ_β_ˆ

0

. Donc l’intervalle de confiance de 95% pourβ₀est

βˆ₀±2.58ˆσ_β_ˆ

0.

5 Régression simple : propriétés d’estimateurs (15 points en bonus)

Soit le mod`ele lin´eaire suivant sans constante : Y_i =β₁X_i+u_i.

Vous pouvez supposer que E(u_i|X_i) = 0, et que les observations sur lesX_iet les Y_i sont i.i.d.

Soit l’estimateur suivant pour le coefficientβ: βe=

Pn i=1Y_i Pn

i=1X_i.

R´epondez aux questions suivantes. Justifiez vos r´eponses dans tous les cas.

1. Ce n’est pas l’estimateur MCO deβ, qui serait la solution au probl`eme minβ

n

X

i=1

(Y_i−βX_i)²

qui a comme seule CPO

−2

n

X

i=1

(Yi−βXi)Xi = 0

⇒βˆ= Pn

i=1X_iY_i Pn

i=1X_i² .

(8)

2. Oui c’est non biais´e. Voici la preuve.

βe= Pn

i=1Y_i Pn

i=1X_i.

= Pn

i=1βX_i+u_i Pn

i=1X_i

=β+ Pn

i=1u_i Pn

i=1X_i

⇒E

βe

=β+E Pn

i=1u_i Pn

i=1Xi

=β+E

E Pn

i=1u_i Pn

i=1X_i|X

=β+E Pn

i=1E(u_i|X) Pn

i=1X_i

=β 3. Nous pouvons ´ecrire

βe=β+

1 n

Pn i=1u_i

1 n

Pn i=1X_i.

Le dénominateur converge en probabilité àµX, la moyenne dans la population deX. Le numérateur converge en probabilité à zéro. Par le théorème de Slutsky, le ratio converge en proababilité à zéro. Donc notre estimateur converge en probabilité àβ.

4. Pas forcément. Sans connaˆıtre la loi exacte qui génère l’erreuru_ion ne peut savoir si l’estimateur est le plus efficient parmi une classe d’estimateurs.

cr´e´e le : 10/11/2012