Steve Ambler

(1)

ECO 4272: Introduction à l’économétrie Exercice 1: Solutions

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2014, Steve Ambler Automne 2014

1 Distributions de probabilit´e jointes (20 points)

1. La somme de toutes les probabilités jointes doit être égale à 1. Donc, la valeur manquante doit être égale à 0.20.

2. Voici le tableau :

Y \X 1 2 3 4 Pr(Y)

5 0.10 0.05 0.05 0.20 0.40 6 0.20 0.05 0.05 0.10 0.40 7 0.05 0.05 0.05 0.05 0.20 Pr(X) 0.35 0.15 0.15 0.35 1.00

La dernière rangée du tableau contient les probabilités marginales pour la variable X, c’est à dire Pr(X =X_i , X_i = 1,2,3,4). La dernière colonne contient les probabilités marginales pour la variable Y, c’est à dire Pr(Y =Y_i , Y_i = 5,6,7). La somme des valeurs dans la dernière colonne et des valeurs dans la dernière rangée doit être égale à un.

3. Nous avons

E(X|Y = 5) = 1× Pr(X = 1, Y = 5)

Pr(Y = 5) + 2×Pr(X = 2, Y = 5) Pr(Y = 5)

(2)

+3× Pr(X = 3, Y = 5)

Pr(Y = 2) + 4× Pr(X= 4, Y = 5) Pr(Y = 5)

= 1× 0.10

0.40 + 2× 0.05

0.40+ 3× 0.05

0.40+ 4× 0.20

0.40 = 1.375.

De mani`ere semblable, nous avons

E(X|Y = 6) = 1× Pr(X = 1, Y = 6)

Pr(Y = 6) + 2×Pr(X = 2, Y = 6) Pr(Y = 6) +3× Pr(X = 3, Y = 6)

Pr(Y = 6) + 4× Pr(X= 4, Y = 6) Pr(Y = 6)

= 1× 0.20

0.40+ 2×0.05

0.40+ 3×0.05

0.40+ 4× 0.10

0.40 = 2.125 et

E(X|Y = 7) = 1× Pr(X = 1, Y = 7)

Pr(Y = 7) + 2×Pr(X = 2, Y = 7) Pr(Y = 7) +3× Pr(X = 3, Y = 7)

Pr(Y = 7) + 4× Pr(X= 4, Y = 7) Pr(Y = 7)

= 1× 0.35

0.20+ 2×0.15

0.20+ 3×0.15

0.20+ 4× 0.35

0.20 = 12.5.

Vous devriez déjà commencer à soupçonner fortement qu’il s’agit de variables aléatoires qui ne sont pas indépendantes, puisque les probabilités conditionnelles ne sont pas égales pour toutes les réalisations possibles de X aux probabilités non conditionnelles ou marginales.

4. Il faut procéder de manière semblable à la sous-question précédente. Nous avons

E(Y|X = 1) = 5×Pr(X = 1, Y = 5)

Pr(X = 1) + 6×Pr(X = 1, Y = 6)

Pr(X = 1) + 7×Pr(X = 1, Y = 7) Pr(X = 1)

= 5×0.10

0.35+ 6× 0.20

0.35 + 7× 0.05

0.35 ≈5.85714.

De mani`ere semblable, nous avons

E(Y|X = 2) =

(3)

5×Pr(X = 2, Y = 5)

Pr(X = 2) + 6×Pr(X = 2, Y = 6)

Pr(X = 2) + 7×Pr(X = 2, Y = 7) Pr(X = 2)

= 5× 0.05

0.15+ 6×0.05

0.15+ 7×0.05

0.15 = 6.0, E(Y|X = 3) =

5×Pr(X = 3, Y = 5)

Pr(X = 3) + 6×Pr(X = 3, Y = 6)

Pr(X = 3) + 7×Pr(X = 3, Y = 7) Pr(X = 4)

= 5× 0.05

0.15+ 6×0.05

0.15+ 7×0.05

0.15 = 6.0, et

E(Y|X = 4) = 5×Pr(X = 4, Y = 5)

Pr(X = 4) + 6×Pr(X = 4, Y = 6)

Pr(X = 4) + 7×Pr(X = 4, Y = 7) Pr(X = 4)

= 5×0.20

0.35+ 6× 0.10

0.35 + 7× 0.05

0.35 ≈5.57143.

Encore une fois, les esp´erances conditionnelles ne sont pas toutes ´egales.

5. Nous avons

E(X) = 1×Pr(X = 1)+2×Pr(X = 2)+3×Pr(X = 3)+4×Pr(X = 4)

= 1×0.35 + 2×0.15 + 3×0.15 + 4×0.35 = 2.5 6. Nous avons

E(Y) = 5×Pr(Y = 5) + 6×Pr(Y = 6) + 7×Pr(Y = 7)

= 5×0.40 + 6×0.40 + 7×0.20 = 5.8.

7. Il suffit de trouver un contre-exemple. Nous avons

Pr(X = 1, Y = 5) = 0.106=Pr(X = 1)×Pr(Y = 5). Les deux variables ne sont pas ind´ependantes.

(4)

2 Efficience (40 points)

1. Nous avons

E(¯µ) =E m

m+nX¯ + n m+nY¯

= m

m+nE X¯

+ n

m+nE Y¯

= m

m+n 1 m

m

X

i=1

E(X_i) + n m+n

1 n

n

X

i=1

E(Y_i)

= m

m+n 1

mmµ+ n m+n

1

nnµ=µ.

L’estimateur est non biais´e.

2. Le probl`eme est minµ¯

m

X

i=1

(X_i−µ)¯ ²+

n

X

i=1

(Y_i−µ)¯ ²

! .

Il n’y a qu’une seule variable de choix. La condition du premier ordre est

−2

m

X

i=1

(X_i−µ)¯ −2

n

X

i=1

(Y_i−µ) = 0¯

⇒

m

X

i=1

X_i−mµ¯+

n

X

i=1

Y_i−nµ¯= 0

⇒m 1 m

m

X

i=1

X_i+n1 n

n

X

i=1

Y_i = (m+n) ¯µ

⇒µ= m m+n

X¯ + n m+n

Y ,¯ ce qui fut `a d´emontrer.

3. Nous avons

Var(¯µ) =Var m

m+n

X¯ + n m+n

Y¯

= m

m+n 2

Var X¯ +

n m+n

2

Var Y¯

(5)

=

m m+n

2

1 m²

m

X

i=1

Var(Xi) + m

m+n 2

1 n²

n

X

i=1

Var(Yi)

=

m m+n

2

1

m²mσ_X² + m

m+n 2

1 n²nσ_Y²

= m

(m+n)²σ_X² + n

(m+n)²σ²_Y.

4. Il faut montrer que le nouvel estimateur propos´e est non biais´e. Nous avons E(˜µ) = E aX¯ + (1−a) ¯Y

=aE X¯

+ (1−a)E Y¯

=a 1 m

m

X

i=1

E(X_i) + (1−a)

n

X

i=1

E(Y_i)

=am

mµ+ (1−a)n

nµ=µ, ce qui fut `a d´emontrer.

5. La variance est donn´ee par

Var aX¯ + (1−a) ¯Y

=a² 1 m²

m

X

i=1

Var(Xi) + (1−a)² 1 n²

n

X

i=1

Var(Yi)

= a²

mσ_X² + (1−a)² n σ_Y.

6. C’est un probl`eme de minimisation relativement simple. On peut l’´ecrire mina

a²

mσ_X² + (1−a)² n σY

!

La condition du premier ordre est 2aσ_X²

m −2 (1−a)σ_Y² n = 0

⇒2a σ_X²

m +σ_Y² n

= 2σ_Y² n

(6)

⇒a=

σ²_Y n

_σ2 X

m + ^σ_n²^Y = mσ²_Y mσ²_Y +nσ²_X 7. Nous avons les r´esultats suivants.

(a) acroˆıt avec la taille du premier ´echantillon m, et tend vers 1 lorsque mtend vers l’infini.

(b) adécroˆıt avec la taille du deuxième échantillonn, et tend vers 0 lorsque ntend vers l’infini.

(c) a croˆıt lorsque la variance σ_X² diminue et tend vers 1 lorsque cette variance tend vers 0.

(d) a d´ecroˆıt lorsque la variance σ²_Y diminue et tend vers 0 lorsque cette variance tend vers 0.

On donne plus de poids à l’échantillon avec le plus grand nombre d’observations et à l’échantillon où la variance de la variable aléatoire observée est plus petite.

8. Nous cherchons une solution pour a = mσ_Y²

mσ_Y² +nσ_X² = m m+n.

Une condition suffisante est que les deux variancesσ²_X etσ²_Y soient ´egales.

Quelle est la morale de cette histoire ? Nous venons de voir que, face

`a des observations qui ont une variance non constante, nous allons ac- corder davantage de poids aux observations provenant d’une distribution avec uneplus petite variance. L’intuition de ce r´esultat est simple.

Une observation tirée d’une distribution avec une variance qui est très petite nous permet d’estimer notre paramètre inconnu (µ) avec plus de précision. L’observation contient plus d’information concernant µ qu’une observation provenant d’une distribution avec une très grande variance. Donc, il serait logique de mettre un poids plus élevé sur les observations qui ont une plus petite variance.

Nous venons en fait de démontrer la logique derrière l’estimateur des moindres carrés généralisés, que vous pourrez apprendre dans le cours ECO5272. Lorsque les variances dans les deux échantillons sont égales,

(7)

on met le même poids sur chaque observation (on pondère quand même utilisant la taille relative des deux échantillons). Donc, l’estimateur MCO est en fait un cas particulier de l’estimateur des moindres carrés généralisés.

3 Th´eor`eme limite centrale (40 points)

J’inclus un fichier avec un code comment´e. Voir l’adresse suivante : www.er.uqam.ca/nobel/r10735/4272/tps/exer1431b.R

J’ai inclus presque toutes les commandes n´ecessaires sauf celles pour sauvegarder les graphiques dans des fichiers.