1 Propri´et´es de la covariance (10 points)

(1)

ECO 4272: Introduction l’´econom´etrie Exercice 1: solutions

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2010, Steve Ambler Hiver 2010

1 Propri´et´es de la covariance (10 points)

Nous avons Cov(aX , bY) =

m

X

i=1 n

X

j=1

(aX_i−E(aX)) (bY_j −E(bY))Pr(X =X_i , Y =Y_j).

=

m

X

i=1 n

X

j=1

(aX_i−aE(X)) (bY_j −bE(Y))Pr(X =X_i , Y =Y_j).

=

m

X

i=1 n

X

j=1

ab(X_i−E(X)) (Y_j−E(Y))Pr(X =X_i , Y =Y_j)

=ab

m

X

i=1 n

X

j=1

(X_i−E(X)) (Y_j−E(Y))Pr(X =X_i , Y =Y_j)

≡abCov(X , Y).

(2)

2 Tests d’hypoth`ese, intervalles de confiance, etc. (30 points)

Appelons le poids moyen des qu´eb´ecoisX et le poids moyen des ontariensY. Nous avons, utilisant la notation habituelle :

X¯ 85

Y¯ 90

¯

σ_X² 15²

Var X¯

= ^σ₄₀₀^¯²^X 0.5625

¯

σ_Y² 20²

Var X¯

= ₃₅₀^¯^σ²^Y 1.1429

Y¯ −X¯ 5

Var X¯ −Y¯

= _σ_¯2

X

400 + ₃₅₀^¯^σ²^Y

1.7054 1. Nous avons

2×Φ (−1.96) = 0.05,

où, comme d’habitude, Φ(z) nous donne la valeur à z de la distribution normale standardisée cumulée. Donc, d’abord pour le Québec :

0.95 =Pr

−1.96< µ_X −85

√0.5625 <1.96

=Pr

85−1.96×√

0.5625< µ_X <85 + 1.96×√

0.5625 .

Donc, l’intervalle de confiance de 95% pour la moyenne du poids des qu´eb´ecois est

85±1.96×√

0.5625 = 85±1.47.

Maintenant, pour les ontariens nous avons 0.95 =Pr

−1.96< µ_Y −90

√1.1429 <1.96

=Pr

90−1.96×√

1.1429< µ_Y <90 + 1.96×√ 1.1429

. Donc, l’intervalle de confiance de 95% pour la moyenne du poids des ontariens est

90±1.96×√

1.1429 = 90±2.0954.

(3)

2. Nous avons

2×Φ (−1.64) = 0.10,

Donc, d’abord pour le Qu´ebec : 0.90 =Pr

−1.64< µ_X −85

√0.5625 <1.64

=Pr

85−1.64×√

0.5625< µX <85 + 1.64×√ 0.5625

.

Donc, l’intervalle de confiance de 90% pour la moyenne du poids des qu´eb´ecois est

85±1.64×√

0.5625 = 85±1.23.

Maintenant, pour les ontariens nous avons 0.90 =Pr

−1.64< µ_Y −90

√1.1429 <1.64

=Pr

90−1.64×√

1.1429< µ_Y <90 + 1.64×√

1.1429 . Donc, l’intervalle de confiance de 90% pour la moyenne du poids des ontariens est

90±1.64×√

1.1429 = 90±1.753.

3. La statistique normali´ee est donn´ee par t= 85−83

√0.5625 = 2.67,

L’hypoth`ese alternative est bilat´erale. Nous avons 2×Φ (−2.67)≈0.0076.

Nous rejetons l’hypothèse nulle à un niveau de significativité marginal de 1%.

4. La statistique normali´ee est donn´ee par t= 85−83

√0.5625 = 2.67,

(4)

la même que pour la partie précédente. L’hypothèse alternative est uni- latérale. Ce que nous voulons mesurer est la surface en dessous de la distribution cumulée à droite de la statistique calculée. Nous avons

1−Φ (2.67)≈1−0.996207≈0.0038.

5. Nous avons

0.95 =Pr

−1.96< (µ_X −µ_Y)−(−5)

√1.7054 <1.96

=Pr

−5−1.96×√

1.7054<(µ_X −µ_Y)<−5 + 1.96×√

1.7054 . Donc, l’intervalle de confiance de 95% pour la diff´erence entre les poids moyens est

−5±1.96×√

1.7054 =−5±2.5596.

6. La statistique normalis´ee est

t= (85−90)−0

√1.7054 =−3.8287 L’hypoth`ese alternative est bilat´erale. Nous avons

2×Φ (−3.8287)≈0.0013.

7. Rejeter à 5% nécessiterait une statistique normalisée de

−

−5−0 q15²

n + ²⁰_n²

=−1.96.

Nous obtenons

5 1.96 =

r625 n

⇒n = 625

(5/1.96)² ≈96.04.

Nous aurions besoin d’échantillons d’au moins 97 observations afin de pou- voir rejeter l’hypothèse nulle à un taux marginal de 5%.

(5)

3 Convergence (20 points)

Je développe la réponse pour la version corrigée de la question. Si on remplace Y_i par Y₁ dans la première sommation ci-dessous, l’estimateur est toujours non biaisé et sa variance diminue avecn, mais la variance ne tend pas vers zéro lorsque ntend vers l’infini. Donc, il n’est pas convergent.

1. Nous avons E

Ye

= 1 2n

(n/2)

X

i=1

E(Y_i) + 3 2n

n

X

i=(n/2)+1

E(Y_i)

= 1 2n

(n/2)

X

i=1

µ_Y + 3 2n

n

X

i=(n/2)+1

µ_Y

= 1 2n

n

2µ_Y + 3 2n

n

2µ_Y =µ_Y. L’estimateur est non biais´e.

2. Si les observations sont ind´ependantes, nous avons Var

Ye

= 1 4n²

(n/2)

X

i=1

Var(Y_i) + 9 4n²

n

X

i=(n/2)+1

Var(Y_i)

= 1 4n²

n

2σ_Y² + 9 4n²

n

2σ²_Y = 1.25 n σ_Y².

L’ind´ependance est cruciale ici. Sinon, il y aura des covariances non nulles entre des observations diff´erentes.

3. Lorsquen → ∞, nous avons Var

Ye

→0.

4. Oui. Il est non biaisé et sa variance tend vers zéro lorsque la taille de l’échantillon tend vers l’infini.

5. Nous avons

Var Yˆ

= 1 nσ_Y².

La variance de Ye est plus élevée. Nous savons que l’estimateur MCO est l’estimateur qui minimise la somme des erreurs au carré. Il est l’estimateur le plus efficient de la moyenne lorsque la variance des observations est constante, ce qui est le cas ici.

(6)

4 Convergence et th´eor`eme de la limite centrale (40 points)

1. Selon le manuel,

1 σ²

n

X

i=1

(Y_i−µ_Y)²

suit une loi chi-carré avec n degrés de liberté. Nous avons une expression oùµ_Y est remplacé par un estimateur convergent. Selon l’article que je vous ai donné,

1 σ²

n

X

i=1

Y_i−Y¯2

suit une distribution chi-carré avecn−1degrés de liberté.

2. Nous savons que la variance d’une variable aléatoire chi-carré avecn −1 degrés de liberté est2(n−1).

3. Nous avons

Var

n−1 σ² s²

= 2(n−1)

⇒Var s²

= σ²

n−1 2

2(n−1) = 2σ⁴ n−1 4. Voir le fichier test2.inp sur mon site.

5. Vous devriez obtenir des histogrammes où la dispersion diminue avec la taille de l’échantillon. Ceci illustre le principe que nous estimons le mo- ment de la population (dans ce cas-ci sa variance) avec de plus en plus de précision au fur et à mesure que la taille de l’échantillon augmente.

6. Vous devriez obtenir des histogrammes où la dispersion ne diminue pas avec la taille de l’échantillon, puisqu’on normalise la variable aléatoire utilisée pour générer l’histogramme. En normalisant, on divise par un écart type qui diminue avec la taille de l’échantillon afin d’obtenir une variable aléatoire avec une variance qui est toujours unitaire. Par contre, l’histogramme de- vrait ressembler de plus en plus à une distribution normale standardisée au fur et à mesure que la taille de l’échantillon augmente.

7. Voir les réponses aux deux parties précédentes.