Steve Ambler

(1)

ECO 4272: Introduction à l’économétrie Exercice 1: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2013, Steve Ambler Hiver 2013

1 La corr´elation ´echantillonnale (15 points)

Nous avons

Corr(aX, bY)

≡ Cov(aX, bY) q

Var(aX) q

Var(bY)

=

1 n−1

Pn

i=1 aX_i−aX

bY_i−bY q 1

n−1

Pn

i=1 aX_i−aX2q

1 n−1

Pn

i=1 bY_i−bY2

=

1 n−1

Pn

i=1a X_i−X

b Y_i−Y q 1

n−1

Pn

i=1a² X_i−X2q

1 n−1

Pn

i=1b² Y_i−Y2

= ab_n−1¹ Pn

i=1 X_i−X

Y_i−Y

ab q 1

n−1

Pn

i=1 X_i−X2q

1 n−1

Pn

i=1 Y_i−Y2

=

1 n−1

Pn

i=1 X_i−X

Y_i−Y q 1

n−1

Pn

i=1 X_i−X2q

1 n−1

Pn

i=1 Y_i−Y2

(2)

≡Corr(X, Y),

où je prends pour acquis que la moyenne échantillonnale deaX est égale àaX.

2 Distributions de probabilit´e jointes (25 points)

1. Il y a trois valeurs distinctes possibles pour X (1,2,3) et trois valeurs distinctes possibles pourY (1,2,3). Nous avons le tableau suivant au d´epart.

Y

1 2 3

1 1/9 1/9 1/9 X 2 1/6 0 1/6

3 1/4 1/12 0

Les probabilit´es marginales sont donn´ees par le tableau suivant.

Y

1 2 3 Pr(X)

1 1/9 1/9 1/9 1/3

X 2 1/6 0 1/6 1/3

3 1/4 1/12 0 1/3

Pr(Y) 19/36 7/36 10/36 2. Nous avons :

E(X|Y = 1)

= 1×Pr(X = 1|Y = 1) +2×Pr(X = 2|Y = 1) +3×Pr(X = 3|Y = 1)

= 1× Pr(X = 1, Y = 1) Pr(Y = 1) +2× Pr(X = 2, Y = 1)

Pr(Y = 1) +3× Pr(X = 3, Y = 1)

Pr(Y = 1)

= 1× 1/9

19/36+ 2× 1/6

19/36+ 3× 1/4 19/36

(3)

= 1×4/19 + 2×6/19 + 3×9/19 = 43/19.

De mani`ere semblable :

E(X|Y = 2)

= 1× 1/9

7/36 + 2× 0

7/36 + 3× 1/12 7/36

= 1×4/7 + 2×0 + 3×3/7 = 13/7.

E(X|Y = 3)

= 1× 1/9

10/36+ 2× 1/6

10/36+ 3× 0 10/36

= 1×4/10 + 2×6/10 + 3×0 = 16/10.

3. De mani`ere semblable, nous avons :

E(Y|X = 1)

= 1× 1/9

1/3 + 2× 1/9

1/3+ 3×1/9 1/3

= 1×1/3 + 2×1/3 + 3×1/3 = 2.

E(Y|X = 2)

= 1× 1/6

1/3 + 2× 0

1/3+ 3×1/6 1/3

= 1×1/2 + 2×0 + 3×1/2 = 2.

E(Y|X = 3)

= 1×1/4

1/3 + 2× 1/12

1/3 + 3× 0 1/3

= 1×3/4 + 2×1/4 + 3×0 = 5/4.

4. Nous avons :

E(X)

= 1×Pr(X = 1) + 2×Pr(X = 2) + 3×Pr(X = 3)

= 1×1/3 + 2×1/3 + 3×1/3 = 2.

(4)

5. De mani`ere semblable :

E(Y)

= 1×19/36 + 2×7/36 + 3×10/36 = 63/36.

6. Les deux variables ne sont pas ind´ependantes. Nous avons

Pr(X = 3, Y = 3) = 06=Pr(X = 3)×Pr(Y = 3) = 1/3×10/36.

Il suffit d’un contre-exemple pour montrer que les deux variables al´eatoires ne sont pas ind´ependantes.

3 Efficience (25 points)

1. Nous avons

E(¯µ) = E aX¯ + (1−a) ¯Y

=aE(X) + (1−a)E(Y)

=aµ+ (1−a)µ=µ, ce qui fut `a d´emontrer.

2. Nous avons

Var(¯µ) = Var aX¯ + (1−a) ¯Y

=a²Var X¯

+ (1−a)²Var Y¯

+ 2a(1−a)Cov(X, Y)

=a²Var X¯

+ (1−a)²Var Y¯

=a²Var 1 nX

nX

X

i=1

X_i

!

+ (1−a)²Var 1 nY

nY

X

i=1

Y_i

!

=a² 1 n_x²Var

nX

X

i=1

σ_X²

!

+ (1−a)² 1 n²Var

nY

X

i=1

σ_Y²

!

=a²σ_X²

n_X + (1−a)²σ_Y² n_Y.

(5)

3. Le probl`eme est

mina =a²σ_X²

n_X + (1−a)²σ²_Y n_Y . La CPO est

2aσ²_X

n_X −2(1−a)σ_Y² n_Y = 0

⇒aσ_X²

n_X +aσ_Y² n_Y = σ_Y²

n_Y

⇒a=

σ_Y² nY

σ²_X nX + ^σ_n²^Y

Y

⇒a= 1 1 + ⁿ_n^Y

X

σ²_X σ²_Y

.

Le résultat est logique. Plus grand est l’échantillon (soit le premier, soit le deuxième), plus grand est son poids dans l’estimateur efficient. Plus petite est la variance de la variable aléatoire (soit la première, soit la deuxième), plus grand est son poids dans l’estimateur. Cela revient à dire que le fait d’avoir plus d’observations ou d’avoir des observations d’une variable avec une plus petite variance permet d’estimer la moyenne avec plus de précision.

4. Sin_x tend vers l’infini, on voudrait écarter le deuxième échantillon. Sin_Y tend vers l’infini, on voudrait écarter le premier échantillon. Siσ_X² tend vers zéro, on voudrait écarter le deuxième échantillon. Siσ_Y² tend vers zéro, on voudrait écarter le premier échantillon.

5. Il s’agit de calculer la condition du deuxi`eme ordre. Nous avons

∂²Var(¯µ)

∂a²

= 2σ_X²

n_X + 2σ²_Y n_Y >0,

qui ne d´epend pas dea. Donc il s’agit d’un minimum et non d’un maximum.

6. Étant donnee l’expression pour la variance de l’estimateur, elle restera plus grande que zéro dans la mesure ou un des deux échantillons (ou les deux) n’augmente pas en nombre d’observations. Il faut que la taille des deux

´echantillons tende vers l’infini pour que l’estimateur soit convergent, pour une valeurdonn´eedea.

(6)

4 Th´eor`eme limite centrale (35 points)

1. Voir le script tp1.R. Tel qu’indiqué dans le message que je vous ai envoyé, la fonctiondice()génère des résultats qui, pour les fins de certains calculs, ne sont pas considérés numériques.

2. Je normalise les valeurs générées à l’intérieur de chaque boucle.

3. Dans chaque cas (pour chaque valeur den) la moyenne échantillonnale des 10000 répétitions devrait être près de zéro, et la variance près de 1.

4. Voir le script.

5. Pourn= 1, l’histogramme devrait être presque rectangulaire. Chacune des 6 valeurs a une fréquence approximativement égale à ¹₆. Pour n = 100 et n = 1000l’histogramme devrait ressembler à une cloche normale.

6. Voir la sous-question suivante

7. Le test devrait rejeter l’hypothèse nulle, même à un niveau de 1%, pour n = 1, n = 2 et n = 10. Pour n = 100, le résultat peut dépendre de l’échantillon individuel. Pour n = 1000, lap-value devrait être facilement au-dessus de 0.5.

cr´e´e le 04/02/2013