• Aucun résultat trouvé

1 Propri´et´es de la variance (15 points)

N/A
N/A
Protected

Academic year: 2022

Partager "1 Propri´et´es de la variance (15 points)"

Copied!
7
0
0

Texte intégral

(1)

ECO 4272: Introduction l’´econom´etrie Exercice 1: solutions

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

c 2009, Steve Ambler Hiver 2009

1 Propri´et´es de la variance (15 points)

Nous avons :

Var(aX+bY)≡X

i

X

j

(aX+bY −E(aX +bY))2Pr(X =Xi , Y =Yj). Ici, implicitementicouvre toutes les valeurs possibles distinctes de la variable al´eatoireX, etj couvre toutes les valeurs possibles distinctes de la variable al´eatoireY. Tel que sp´ecifi´e dans le questionnaire, je suppose des distributions de probabilit´e discr`etes. Ceci est ´egal `a

X

i

X

j

(a(X−E(X)) +b(Y −E(Y)))2Pr(X =Xi , Y =Yj)

=X

i

X

j

a2(X−E(X))2+b2(Y −E(Y))2+ 2ab(X−E(X)) (Y −E(Y))

×

Pr(X =Xi , Y =Yj)

=a2X

i

X

j

(X−E(X))2Pr(X =Xi , Y =Yj)

(2)

+b2X

i

X

j

(Y −E(Y))2Pr(X =Xi , Y =Yj) +2abX

i

X

j

(X−E(X)) (Y −E(Y))Pr(X =Xi , Y =Yj)

=a2X

i

(X−E(X))2Pr(X =Xi) +b2X

j

(Y −E(Y))2Pr(Y =Yj) +2abX

i

X

j

(X−E(X)) (Y −E(Y))Pr(X =Xi , Y =Yj)

≡a2Var(X) +b2Var(Y) + 2abCov(X, Y), ce qui fut `a d´emontrer.

2 Tests d’hypoth`ese, intervalles de confiance, etc.

(25 points)

Notez que cette question est presqu’identique au cas analys´e dans l’encadr´e `a la page 86 du manuel. La cl´e pour r´epondre `a la question est de noter que si les donn´ees ont ´et´e cueuillies par ´echantillonnage al´eatoire, les deux ´echantillons devraient ˆetre ind´ependants et la covariance entre les moyennes ´echantillonnales devraient ˆetre z´ero. Donc, la variance de la diff´erence entre les deux moyennes

´echantillonnales sera la somme des variances des deux moyennes

´echantillonnales. Appelons le salaire en Alberta la variable al´eatoireXet le salaire au Qu´ebecY. Nous avons :

X¯ 33000

Y¯ 27400

¯

σX2 23002

Var X¯

= 750σ¯X2 7053.33

¯

σY2 17002

Var X¯

= 600σ¯2Y 4816.67

X¯−Y¯ 5600

Var X¯ −Y¯

=¯σ2 X

750 +600σ¯2Y

11870

(3)

o`u j’ai utilis´e la notation Var X¯

pour d´enoter notre estim´e de la variance de la moyenne ´echantillonnale des salaires albertains (la variance ´echantillonnale divis´e par le nombre d’observations dans l’´echantillon), etc.

1. Nous avons

2×Φ (−1.96) = 0.05,

o`u, comme d’habitude,Φ(z)nous donne la valeur `az de la distribution normale standardis´ee cumul´ee. Donc, d’abord pour l’Alberta :

0.95 =Pr

−1.96< µX −33000

√7053.33 <1.96

=Pr

33000−1.96×√

7053.33< µX <33000 + 1.96×√

7053.33 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est

33000±1.96×√

7053.33 = 33000±164.61.

Ensuite, pour le Qu´ebec : 0.95 =Pr

−1.96< µX −27400

√4816.67 <1.96

=Pr

27400−1.96×√

4816.67< µX <27400 + 1.96×√

4816.67 . Donc, l’intervalle de confiance de 95% pour la moyennes des salaires des diplˆom´es en Alberta est

27400±1.96×√

4816.67 = 27400±136.03.

2. La statistique normalis´ee (t) pour le test est donn´ee par t = 33000−30000

√7053.33 = 35.72.

Nous avons

1−Φ (35.72)≈0.

L’hypoth`ese nulle est massivement rejet´ee.

(4)

3. La statistique normalis´ee (t) pour le test est donn´ee par t = 5600−0

√11870 = 51.40.

Nous avons

1−Φ (51.40)≈0.

L’hypoth`ese nulle est massivement rejet´ee.

4. Nous avons

2×Φ (−1.645) = 0.10.

Donc, nous avons 0.90 =Pr

−1.645< (µX −µY)−5600

√11870 <1.645

=Pr

5600−1.645×√

11870<(µX −µY)<5600 + 1.645×√ 11870

. Donc, l’intervalle de confiance de 90% pour la diff´erence entre les

moyennes est

5600±1.645×√

11870 = 5600±179.22.

5. La statistique normalis´ee (t) pour le test est donn´ee par t = 5600−0

√11870 = 51.40.

Nous avons

2×Φ (−51.40)≈0.

L’hypoth`ese nulle est massivement rejet´ee.

6. La statistique normalis´ee (t) pour le test est donn´ee par t = 27400−25000

√4816.67 = 34.58.

Nous avons

1−Φ (34.58)≈0.

L’hypoth`ese nulle est massivement rejet´ee.

(5)

3 Convergence (20 points)

1. Nous avons :

E 1

mY1+m−1 m

1 (n−1)

n

X

i=2

Yi

!

= 1

mE(Y1) + m−1 m

1 (n−1)

n

X

i=2

E(Yi)

= 1

Y + m−1 m

1 (n−1)

n

X

i=2

µY

= 1

Y +m−1 m

1

(n−1)(n−1)µY

= 1

m + m−1 m

µYY.

L’esp´erance de l’estimateur est ´egale `a sa vraie valeur, donc l’estimateur est non biais´e.

2. Nous avons : Var

Ye

=Var 1

mY1+ m−1 m

1 (n−1)

n

X

i=2

Yi

!

= 1

m 2

Var(Y1) +

m−1 m

1 (n−1)

2 n

X

i=2

Var(Yi)

= 1

m 2

σ2Y +

m−1 m

1 (n−1)

2

(n−1)σ2Y

= 1

m 2

+

m−1 m

2

1 (n−1)

! σY2

3. La variance d´ecroˆıt avecn. Lorsquentend vers l’infini, nous avons :

n→∞lim 1

m 2

+

m−1 m

2

1 (n−1)

! σY2 =

1 m

2

σY2 >0.

4. Non, ce n’est pas un estimateur convergent. La variance qui provient du premier terme enY1ne d´ecroˆıt pas avec la taille de l’´echantillon.

(6)

5. Si on choisit une valeur pourmqui augmente avec la taille de l’´echantillon de fac¸on lin´eaire, nous obtiendrons un estimateur convergent. Par exemple, si nous choisissonsm=n, nous avons :

Var Ye

= 1

n

σ2Y,

ce qui nous donnerait un estimateur convergent. En fait, ce choix nous donne l’estimateur MCO.

4 Th´eor`eme de la limite centrale (40 points)

— Unscript (programme)GRETLpour r´epondre `a la question se trouve

`a :

http://www.er.uqam.ca/nobel/r10735/4272/test1.inp

— Le programme g´en`ere les fichiers de donn´eeststat1.gdt,tstat2.gdt, tstat5.gdt,tstat100.gdt,tstat1000.gdtettstat10000.gdt. Le chiffre dans le nom du fichier correspond `a la taille de l’´echantillonn.

— Chaque fichier contient 10 000 observations (j’ai demand´e 100 dans le questionnaire – ceci est facile `a modifier) sur la moyenne ´echantillonnale denvariables al´eatoires dont le support est[5,10].

— Je n’ai pas trouv´e la fac¸on avecGRETLde lire, `a l’int´erieur de chaque boucle, le fichier de donn´ees et de g´en´erer un graphique. Mais, une fois le script ex´ecut´e, on peut facilement charger les donn´ees et g´en´erer un graphique `a partir du menu.

— J’ai fait plusieurs essais, et je constate qu’avec des moyennes

´echantillonnales de taille 1, 2 et 5 l’hypoth`ese de la normalit´e est toujours rejet´ee. Aussitˆot quen= 100, l’hypoth`ese de la normalit´e est accept´ee (GRETLfait ce test automatiquement – vous n’avez pas besoin de savoir comment, mais ce qui s’int´eressent `a la question peuvent aller consulter l’articleJarque-Bera test sur Wikipedia).

— Avecn = 1, le graphique ressemble `a un rectangle (`a la distribution uniforme elle-mˆeme). Puisque la variance a ´et´e normalis´e `a 1 et la moyenne `a z´ero, les bornes du rectangle se situent `a±√

12/2. Avec n = 2, le graphique ressemble `a un triangle. D´ej`a avecn= 5, `a l’oeil nu le graphique commence `a ressembler `a une cloche normale, mˆeme si l’hypoth`ese nulle de la normalit´e est rejet´ee par le test Jarque-Bera.

(7)

cr´e´e le 13/02/2009

correction le 10/02/2018 – j’avais invers´e les r´eponses aux sous-questions 5 et 6 de la question 2.

Références

Documents relatifs

Numéro du billet d'entrée Date et l’heure du billet d'entrée Période de l'absence de l’élève Code du motif d'absence ou de

Un même billet d’entrée peut servir pour plusieurs élèves de la même classe, s’ils ont le même motif d’absence, sachant qu’on doit prendre en charge dans cette base

Ainsi dans le triangle ABE les droites (I N ) et (BE ) sont pa- rallèles et I est le milieu de [AB], donc d’après le théorème « de la droite des milieux » le point N est le milieu

[r]

On dira qu’une homographie f v´ erifie la propri´ et´ e C si, pour tout nombre complexe z tel que la suite (f ◦n (z)) des it´ er´ es de z par f existe, les termes de cette suite

[r]

c’est appliquer la tactique R´ e´ ecrire de fa¸con intelligente jusqu’` a obtenir une forme que tout le monde est d’accord pour trouver optimale. On peut donner un sens pr´ ecis `

En déduire la nature du triangle