Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

(1)

ECO 4272: Introduction à l’économétrie Examen intra: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2013, Steve Ambler Hiver 2013

1 Variance d’une combinaison lin´eaire de variables al´eatoires (15 points)

Nous avons

Var((a₀+a₁X) + (b₀+b₁Y))≡

k

X

i=1 n

X

j=1

((a₀+a₁X_i) + (b₀+b₁Y_j)−E[(a₀+a₁X) + (b₀+b₁Y)])²h_ij

=

k

X

i=1 n

X

j=1

(a₀+a₁X_i+b₀+b₁Y_j−a₁−a₁EX−b₀−b₁EY)²h_ij (Il fallait, tel que spécifié dans l’énoncé de la question, partir de la définition donnée ci-dessus.)

=

k

X

i=1 n

X

j=1

(a₁(X_i−EX) +b₁(Y_j −EY))²h_ij

=

k

X

i=1 n

X

j=1

a₁²(X_i−EX)² +b₁²(Y_j−EY)²+ 2a₁b₁(X_i−EX) (Y_j−EY) h_ij

(2)

=

k

X

i=1 n

X

j=1

a₁(X_i−EX)²h_ij +

k

X

i=1 n

X

j=1

b₁²(Y_j −EY)²h_ij

+

k

X

i=1 n

X

j=1

2a₁b₁(X_i−EX) (Y −EY_j)h_ij

=a_i²

k

X

i=1 n

X

j=1

(X_i−EX)²h_ij+b₁²

n

X

j=1 k

X

i=1

(Y_j−EY)²h_ij

+2a1b1 k

X

i=1 n

X

j=1

(Xi−EX) (Yj−EY)hij

(Ici, j’ai fait deux petites transformations. Les constantes ne dépendent ni deini dej, et donc on peut les écrire devant les sommations. Ensuite, j’ai inversé l’ordre des deux sommations dans le deuxième terme en prévision de la prochaine étape.)

=a_i²

k

X

i=1

(X_i−EX)²

n

X

j=1

h_ij+b₁²

n

X

j=1

(Y_j−EY)²

k

X

i=1

h_ij

+2a₁b₁

k

X

i=1 n

X

j=1

(X_i−EX) (Y_j−EY)h_ij

(Ici, j’ai écrit le terme (X_i−EX)², qui ne dépend pas de j, devant la deuxième sommation du premier terme et (Yj −EY)² devant la deuxième sommation du deuxième terme.)

=a_i²

k

X

i=1

(X_i−EX)²h_i+b₁²

n

X

j=1

(Y_j−EY)²h_j

+2a₁b₁

k

X

i=1 n

X

j=1

(X_i−EX) (Y −EY_j)h_ij (Ici, je remplace Pn

j=1h_ij parh_i dans le premier terme et Pk

i=1h_ij par h_j dans le deuxième terme. Cette étape est cruciale. On retrouve de cette façon les proba- bilités marginales à partir des probabilités jointes.)

≡a₁²Var(X) +b₁²Var(Y) + 2a₁b₁Cov(X, Y), ce qui fut `a montrer.

(3)

2 Distributions de probabilit´e jointes (20 points)

Voici encore les donn´ees :

Pr(X = 2, Y = 5): 1/8 Pr(X = 2, Y = 6): 1/16 Pr(X = 2, Y = 7): 1/16 Pr(X = 3, Y = 5): 1/4 Pr(X = 3, Y = 6): 1/8 Pr(X = 3, Y = 7): — Pr(X = 4, Y = 5): 1/16 Pr(X = 4, Y = 6): 1/32 Pr(X = 4, Y = 7): 1/32 Pr(X = 5, Y = 5): 1/16 Pr(X = 5, Y = 6): 1/32 Pr(X = 5, Y = 7): 1/32

1. La somme de toutes les valeurs doit être égale à 1. Donc, nous avons Pr(X = 3, Y = 7) = 1−4 + 2 + 2 + 8 + 4 + 2 + 1 + 1 + 2 + 1 + 1

32 = 4

32 = 1 8. 2. Le tableau est donn´e par

X\Y Y=5 Y=6 Y=7 Pr(X)

X=2 1/8 1/16 1/16 1/4

X=3 1/4 1/8 1/8 1/2

X=4 1/16 1/32 1/32 1/8 X=5 1/16 1/32 1/32 1/8 Pr(Y) 1/2 1/4 1/4 1 3. Nous avons

Pr(X = 3|Y = 7)

= Pr(X = 3, Y = 7) Pr(Y = 7)

= 1/8

1/4 = 1/2.

(4)

4. Nous avons

Pr(Y = 5|X = 2)

= Pr(X = 2, Y = 5) Pr(X = 2)

= 1/8

1/4 = 1/2.

5. Nous avons

E(X|Y = 5).

= 2×Pr(X = 2|Y = 5)+3×Pr(X = 3|Y = 5)+4×Pr(X = 4|Y = 5)+5×Pr(X = 5|Y = 5)

= 2× Pr(X = 2, Y = 5)

Pr(Y = 5) + 3×Pr(X = 3, Y = 5) Pr(Y = 5) +4× Pr(X = 4, Y = 5)

Pr(Y = 5) + 5× Pr(X= 5, Y = 5) Pr(Y = 5)

= 2× 1/8

1/2+ 3×1/4

1/2+ 4×1/16

1/2 + 5× 1/16 1/2

= 2×1/4 + 3×1/2 + 4×1/8 + 5×1/8 = 25/8.

6. Nous avons

E(Y|X = 4).

5×Pr(Y = 5|X = 4) + 6×Pr(Y = 6|X = 4) + 7×Pr(Y = 7|X = 4) 5×Pr(Y = 5, X = 4)

Pr(X = 4) + 6×Pr(Y = 6, X = 4)

Pr(X = 4) + 7×Pr(Y = 7, X = 4) Pr(X = 4)

= 5× 1/16

1/8 + 6× 1/32

1/8 + 7× 1/32 1/8

= 5×1/2 + 6×1/4 + 7×1/4 = 23/4.

7. Nous avons

EX = 2×Pr(X = 2) + 3×Pr(X = 3) + 4×Pr(X = 4) + 5×Pr(X = 5)

= 2×1/4 + 3×1/2 + 4×1/8 + 5×1/8 = 25/8.

8. Nous avons

EY = 5×Pr(Y = 5) + 6×Pr(Y = 6) + 7×Pr(Y = 7)

= 5×1/2 + 6×1/4 + 7×1/4 = 23/4.

9. Oui. On peut v´erifier que pour chaqueiet chaquej,

Pr(X =X_i, Y =Y_j) = Pr(X =X_i)Pr(Y =Y_j).

(5)

3 Tests d’hypoth`ese (20 points)

1. Comme d’habitude, on écrit la statistique normalisée comme la valeur cal- sulée de notre estimé moins sa valeur sous l’hypothèse nulle, divisé par son

´ecart type. Dans ce cas, nous avons

t_act = s²_Y −s²_Y₀ qσ_s²2

Y

2. L’énoncé de la question dit que l’estimé est non biaisé. Donc nous avons

E(t_act) =E





s²_Y −s²_Y₀ qσ_s²2

Y





= 1

qσ_s²2 Y

E s²_Y

−s²_Y₀

= 0

si l’hypoth`ese nulle est vraie. Nous avons aussi

Var





s²_Y −s²_Y₀ qσ_s²2

Y





= 1 σ²_s2

Y

Var s²_Y

= σ²_s2

Y

σ²_s2 Y

= 1.

Notez que pour calculer l’espérance et la variance de la statistique, il ne faut pas invoquer la convergence en distribution de la statistique. J’ai cal- culé l’éspérance en utilisant seulement l’hypothèse de l’absence de biais de l’estimateur. J’ai calculé la variance en appliquant les règles de base pour le calcule de variances que nous avons vues au début du cours. En fait, le calcul de l’espérance et de la variance est une étape préliminaire afin de démontrer la convergence en distribution de l’estimateur.

3. L’énoncé de la question ne spécifie rien concernant la loi qui génèreY. Il faut supposer que l’échantillon est suffisamment grand pour invoquer une version du théorème de la limite centrale. Si c’est le cas, la statistique nor- malisée suit approximativement une loi normale centrée réduite.

(6)

4. Pour une hypothèse alternative bilatérale, lap-value est donnée par p= 2Φ (−|t_act|).

5. Il faut utiliser le truc habituel de remplacer la valeur non observ´ee de la population par un estim´e convergent. Appelon cet estimeσˆ²_s2

Y. La statistique normalis´ee devient

tact= s²_Y −s²_Y₀ qσˆ²_s2

Y

.

Notez queσˆ_s²2 Y

est un estimateur de la variance de s²_Y, qui lui-mˆeme est un estimateur d’une variance (la variance de la variable al´eatoireY).

6. L’espérance est toujours zéro. La variance est toujours unitaire. Si l’échantillon est assez grand, on peut traiter notre estimé convergentσˆ_s²2

Y

approximativement comme une constante lorsqu’on calcule l’esp´erance et la variance.

4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (45 points)

Voici encore l’output du mod`ele.

Coefficient Estim´e Ecart type´

β₀ 15.13 10.38

β1 0.33 0.18

On a aussi

n 310

SSR 543.4 T SS 789.1 1. Nous savons queT SS =ESS+SSR. Donc

ESS =T SS−SSR= 789.1−543.4 = 245.7.

2. Nous avons

R² = ESS

T SS = 1− SSR

T SS = 543.4 789.1.

(7)

3. Nous savons que dans le mod`ele de r´egression simple, R² = (Corr(X, Y))²

⇒Corr(X, Y) = √ R².

Nous prenons la racine carr´ee positive puisque le coefficient estim´e est posi- tif.

4. Nous avons par d´efinition s_ˆ_u =

q s²_ˆ_u =

rSSR n−2 =

r543.4 308 .

5. Comme d’habitude, nous écrivons la valeur calculée de la statistique moins sa valeur sous H₀, le tout divisé par l’écart type de la statistique. L’hy- pothèse nulle qui est testée dans ce cas estH₀ :β₁ = 0. Donc, nous avons

t_act=

βˆ₁ −0 s_β_ˆ

1

= 0.33−0 0.18 .

Pour un test de significativité, l’hypothèse alternative est bilatérale : H₁ :β₁ 6= 0.

6. Puisque l’hypothèse alternative est bilatérale, une grande valeur positiveo ù une grande valeur négative constitue de l’évidence contreH₀. Nous avons

p= 2Φ (−|tact) = 2Φ

−0.33 0.18

.

Puisque la fonction Φ(·)est la normale centrée réduite cumulée, nous sup- posons que la statistique calculée est générée au moins approximativement par une loi normale centrée réduite.

7. Je vous donne Φ (−1.96) ≈ 0.025 dans l’´enonc´e de la sous-question 10.

(Mais même sans cela une réponse qualitative aurait été acceptable). La valeur absolue de la statistique est inférieure à 1.96 (C’est quelque part entre 1.8 et 1.9). Donc, on ne rejette pas à 5%.

8. Maintenant, on a

t_act =

βˆ₁−0.5 s_β_ˆ

1

.

(8)

9. Puisque H₁ est unilatérale est nous dit H₁ : β₁ < 0.5, seulement des valeurs largement négatives de la statisque normalisée constituenet de l’évidence contreH0. Nous avons

p= Φ (t_act) = Φ

0.33−0.5 0.18

. 10. Nous avons

0.95 =Pr(−1.96< z < 1.96)

oùzest une variable normale centrée réduite. Donc nous avons 0.95 =Pr −1.96<

βˆ₀ −β₀ σβˆ0

<1.96

!

=Pr

−1.96σβˆ0 <βˆ₀−β₀ <1.96σβˆ0

=Pr

−1.96σβˆ0 < β₀−βˆ₀ <1.96σβˆ0

=Pr

βˆ₀−1.96σ_β_ˆ

0 < β₀ <βˆ₀+ 1.96σ_β_ˆ

0

.

Nous pouvons donc ´ecrire l’intervalle de confiance pourβ0comme βˆ₀ ±1.96ˆσβˆ0

= 15.13±1.96×10.38, où j’ai remplacé l’écart type deσ_β_ˆ

0par l’estimé convergent calculé lorsqu’on estime le modèle par MCO.

11. Nous avons

0.99 =Pr(−2.58< z < 2.58)

oùzest une variable normale centrée réduite. Donc nous avons 0.99 =Pr −2.58<

βˆ1 −β1

σβˆ1

<2.58

!

=Pr

−2.58σβˆ1 <βˆ₁−β₁ <2.58σβˆ1

=Pr

−2.58σ_β_ˆ

1 < β₁−βˆ₁ <2.58σ_β_ˆ

1

(9)

=Pr

βˆ₁−2.58σβˆ1 < β₁ <βˆ₁+ 2.58σβˆ1

.

Nous pouvons donc ´ecrire l’intervalle de confiance pourβ1comme βˆ₁ ±2.58ˆσ_β_ˆ

1

= 0.33±2.58×0.18,

où j’ai remplacé l’écart type deσβˆ1par l’estimé convergent calculé lorsqu’on estime le modèle par MCO.

5 Efficience (20 points en bonus)

1. Pour trouver la restriction pour que l’estimateur soit non biaisé, substituons (tel que suggéré dans l’énoncé)Yidans la définition deβ, et (après quelques˜ simplifications) calculons son espérance :

β˜=

n

X

i=1

a_iY_i

=

n

X

i=1

a_i(βX_i+u_i)

=β

n

X

i=1

aiXi+

n

X

i=1

aiui

⇒E

β|X˜ ₁. . . X_n

=β

n

X

i=1

a_iX_i+E

n

X

i=1

a_iu_i|X₁. . . X_n

!

=β

n

X

i=1

a_iX_i+

n

X

i=1

a_iE(u_i|X₁. . . X_n)

=β

n

X

i=1

a_iX_i.

Pour que cette ´egalit´e tienne pour n’importe quelle valeur deβ, il faut que

n

X

i=1

a_iX_i = 1.

(10)

2. Sachant quePn

i=1a_iX_i = 1, nous avons β˜=β+

n

X

i=1

aiui

⇒Var

β|X˜ 1. . . Xn

=Var β+

n

X

i=1

a_iu_i|X₁. . . X_n

!

=Var

n

X

i=1

a_iu_i|X₁. . . X_n

!

=

n

X

i=1

Var(a_iu_i|X₁. . . X_n)

=

n

X

i=1

a_i²Var(u_i|X₁. . . X_n)

=σ²_u

n

X

i=1

a_i².

Notez qu’il est beaucoup plus facile de calculer cette variance si on utilise le résultat calculé dans la sous-question précédente, quePn

i=1aiXi = 1.

3. Nous avons

β¯≡ Pn

i=1Y_i Pn

i=1X_i.

=

n

X

i=1

1 Pn

i=1X_iY_i =

n

X

i=1

¯ a_iY_i, o`u¯a_i ≡ ^Pn¹

i=1Xi, et

βˆ≡ Pn

i=1X_iY_i Pn

i=1Xi2

=

n

X

i=1

X_i Pn

i=1X_i²Y_i =

n

X

i=1

ˆ a_iY_i, o`uˆai ≡ ^Pn^Xⁱ

i=1Xi2. Nous venons de montrer que les estimateurs sont lin´eaires dans lesY_i.

(11)

4. Pour montrer l’absence de biais, il faut montrer que, dans le cas deβ,¯

n

X

i=1

¯

a_iX_i = 1

⇔

n

X

i=1

1 Pn

i=1X_iX_i = 1

⇔ 1 Pn

i=1Xi n

X

i=1

X_i = 1,

ce qui est le cas, et dans le cas deβˆque

n

X

i=1

ˆ

a_iX_i = 1

⇔

n

X

i=1

X_i Pn

i=1X_i²X_i = 1

⇔ 1

Pn i=1Xi2

n

X

i=1

X_i² = 1, ce qui est le cas.

Il est beaucoup plus facile de montrer l’absence de biais si on utilise le r´esultat de la premi`ere sous-question, que Pn

i=1a_iX_i = 1. On peut aussi le démontrer directement à partir des définitions des deux estimateurs, mais c’est plus long.

5. Nous avons

Var β|X¯ ₁. . . X_n

=σ_u²

n

X

i=1

¯ a²_i =σ_u²

n

X

i=1

1 P

i=1X_i 2

=σ²_u 1 (P

i=1X_i)²

n

X

i=1

1

=σ_u² n (P

i=1X_i)² pourβ¯et, pourβ,ˆ

Var

β|Xˆ 1. . . Xn

(12)

=σ²_u

n

X

i=1

X_i P

i=1X_i² 2

=σ_u² 1 P

i=1X_i²2 n

X

i=1

Xi2

=σ²_u 1 P

i=1X_i². Je vous ai donné dans l’énoncé que nPn

i=1Xi2 ≥ (Pn

i=1Xi)², et donc il s’ensuit imm´ediatement que

Var β|X¯ ₁. . . X_n

≥Var

β|Xˆ ₁. . . X_n .

Ceci n’est pas du tout surprenant, puisqueβêst en fait l’estimateur MCO de β, et les hypothèses données dans l’énoncé de la question sont suffisantes pour que le théorème Gauss-Markov tienne.

cr´e´e le : 07/03/2013