1 Propri´et´es de la variance (15 points)

(1)

ECO 4272: Introduction l’´econom´etrie Exercice 1: solutions

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2009, Steve Ambler Hiver 2009

1 Propri´et´es de la variance (15 points)

Nous avons :

Var(aX+bY)≡X

i

X

j

(aX+bY −E(aX +bY))²Pr(X =X_i , Y =Y_j). Ici, implicitementicouvre toutes les valeurs possibles distinctes de la variable aléatoireX, etj couvre toutes les valeurs possibles distinctes de la variable aléatoireY. Tel que spécifié dans le questionnaire, je suppose des distributions de probabilité discrètes. Ceci est égal à

X

i

X

j

(a(X−E(X)) +b(Y −E(Y)))²Pr(X =X_i , Y =Y_j)

=X

i

X

j

a²(X−E(X))²+b²(Y −E(Y))²+ 2ab(X−E(X)) (Y −E(Y))

×

Pr(X =X_i , Y =Y_j)

=a²X

i

X

j

(X−E(X))²Pr(X =X_i , Y =Y_j)

(2)

+b²X

i

X

j

(Y −E(Y))²Pr(X =X_i , Y =Y_j) +2abX

i

X

j

(X−E(X)) (Y −E(Y))Pr(X =X_i , Y =Y_j)

=a²X

i

(X−E(X))²Pr(X =X_i) +b²X

j

(Y −E(Y))²Pr(Y =Y_j) +2abX

i

X

j

(X−E(X)) (Y −E(Y))Pr(X =X_i , Y =Y_j)

≡a²Var(X) +b²Var(Y) + 2abCov(X, Y), ce qui fut `a d´emontrer.

2 Tests d’hypoth`ese, intervalles de confiance, etc.

(25 points)

Notez que cette question est presqu’identique au cas analysé dans l’encadré à la page 86 du manuel. La clé pour répondre à la question est de noter que si les données ont été cueuillies par échantillonnage aléatoire, les deux échantillons devraient être indépendants et la covariance entre les moyennes échantillonnales devraient être zéro. Donc, la variance de la différence entre les deux moyennes

´echantillonnales sera la somme des variances des deux moyennes

échantillonnales. Appelons le salaire en Alberta la variable aléatoireXet le salaire au QuébecY. Nous avons :

X¯ 33000

Y¯ 27400

¯

σ_X² 2300²

Var X¯

= ₇₅₀^σ^¯^X² 7053.33

¯

σ_Y² 1700²

Var X¯

= ₆₀₀^σ^¯²^Y 4816.67

X¯−Y¯ 5600

Var X¯ −Y¯

=_¯_σ2 X

750 +₆₀₀^σ^¯²^Y

11870

(3)

o`u j’ai utilis´e la notation Var X¯

pour dénoter notre estimé de la variance de la moyenne échantillonnale des salaires albertains (la variance échantillonnale divisé par le nombre d’observations dans l’échantillon), etc.

1. Nous avons

2×Φ (−1.96) = 0.05,

où, comme d’habitude,Φ(z)nous donne la valeur àz de la distribution normale standardisée cumulée. Donc, d’abord pour l’Alberta :

0.95 =Pr

−1.96< µX −33000

√7053.33 <1.96

=Pr

33000−1.96×√

7053.33< µ_X <33000 + 1.96×√

7053.33 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est

33000±1.96×√

7053.33 = 33000±164.61.

Ensuite, pour le Qu´ebec : 0.95 =Pr

−1.96< µ_X −27400

√4816.67 <1.96

=Pr

27400−1.96×√

4816.67< µ_X <27400 + 1.96×√

4816.67 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est

27400±1.96×√

4816.67 = 27400±136.03.

2. La statistique normalis´ee (t) pour le test est donn´ee par t = 33000−30000

√7053.33 = 35.72.

Nous avons

1−Φ (35.72)≈0.

L’hypoth`ese nulle est massivement rejet´ee.

(4)

√11870 = 51.40.

Nous avons

1−Φ (51.40)≈0.

4. Nous avons

2×Φ (−1.645) = 0.10.

Donc, nous avons 0.90 =Pr

−1.645< (µ_X −µ_Y)−5600

√11870 <1.645

=Pr

5600−1.645×√

11870<(µX −µY)<5600 + 1.645×√ 11870

. Donc, l’intervalle de confiance de 90% pour la diff´erence entre les

moyennes est

5600±1.645×√

11870 = 5600±179.22.

√11870 = 51.40.

Nous avons

2×Φ (−51.40)≈0.

√4816.67 = 34.58.

Nous avons

1−Φ (34.58)≈0.

(5)

3 Convergence (20 points)

1. Nous avons :

E 1

mY1+m−1 m

1 (n−1)

n

X

i=2

Yi

!

= 1

mE(Y₁) + m−1 m

1 (n−1)

n

X

i=2

E(Y_i)

= 1

mµ_Y + m−1 m

1 (n−1)

n

X

i=2

µ_Y

= 1

mµ_Y +m−1 m

1

(n−1)(n−1)µ_Y

= 1

m + m−1 m

µ_Y =µ_Y.

L’espérance de l’estimateur est égale à sa vraie valeur, donc l’estimateur est non biaisé.

2. Nous avons : Var

Ye

=Var 1

mY₁+ m−1 m

1 (n−1)

n

X

i=2

Y_i

!

= 1

m 2

Var(Y₁) +

m−1 m

1 (n−1)

2 n

X

i=2

Var(Y_i)

= 1

m 2

σ²_Y +

m−1 m

1 (n−1)

2

(n−1)σ²_Y

= 1

m 2

+

m−1 m

2

1 (n−1)

! σ_Y²

3. La variance d´ecroˆıt avecn. Lorsquentend vers l’infini, nous avons :

n→∞lim 1

m 2

+

m−1 m

2

1 (n−1)

! σ_Y² =

1 m

2

σ_Y² >0.

4. Non, ce n’est pas un estimateur convergent. La variance qui provient du premier terme enY₁ne d´ecroˆıt pas avec la taille de l’´echantillon.

(6)

5. Si on choisit une valeur pourmqui augmente avec la taille de l’échantillon de façon linéaire, nous obtiendrons un estimateur convergent. Par exemple, si nous choisissonsm=n, nous avons :

Var Ye

= 1

n

σ²_Y,

ce qui nous donnerait un estimateur convergent. En fait, ce choix nous donne l’estimateur MCO.

4 Th´eor`eme de la limite centrale (40 points)

— Unscript (programme)GRETLpour r´epondre `a la question se trouve

`a :

http://www.er.uqam.ca/nobel/r10735/4272/test1.inp

— Le programme génère les fichiers de donnéeststat1.gdt,tstat2.gdt, tstat5.gdt,tstat100.gdt,tstat1000.gdtettstat10000.gdt. Le chiffre dans le nom du fichier correspond à la taille de l’échantillonn.

— Chaque fichier contient 10 000 observations (j’ai demandé 100 dans le questionnaire – ceci est facile à modifier) sur la moyenne échantillonnale denvariables aléatoires dont le support est[5,10].

— Je n’ai pas trouvé la façon avecGRETLde lire, à l’intérieur de chaque boucle, le fichier de données et de générer un graphique. Mais, une fois le script exécuté, on peut facilement charger les données et générer un graphique à partir du menu.

— J’ai fait plusieurs essais, et je constate qu’avec des moyennes

échantillonnales de taille 1, 2 et 5 l’hypothèse de la normalité est toujours rejetée. Aussitôt quen= 100, l’hypothèse de la normalité est acceptée (GRETLfait ce test automatiquement – vous n’avez pas besoin de savoir comment, mais ce qui s’intéressent à la question peuvent aller consulter l’articleJarque-Bera test sur Wikipedia).

— Avecn = 1, le graphique ressemble à un rectangle (à la distribution uniforme elle-même). Puisque la variance a été normalisé à 1 et la moyenne à zéro, les bornes du rectangle se situent à±√

12/2. Avec n = 2, le graphique ressemble à un triangle. Déjà avecn= 5, à l’oeil nu le graphique commence à ressembler à une cloche normale, même si l’hypothèse nulle de la normalité est rejetée par le test Jarque-Bera.

(7)

cr´e´e le 13/02/2009

correction le 10/02/2018 – j’avais invers´e les r´eponses aux sous-questions 5 et 6 de la question 2.