• Aucun résultat trouvé

1 Propri´et´es de la covariance (10 points)

N/A
N/A
Protected

Academic year: 2022

Partager "1 Propri´et´es de la covariance (10 points)"

Copied!
9
0
0

Texte intégral

(1)

ECO 4272: Introduction l’´econom´etrie Exercice 1 : R´eponses

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

c 2011, Steve Ambler Hiver 2011

1 Propri´et´es de la covariance (10 points)

Cov(X , Y) =

m

X

i=1 n

X

j=1

(Xi−E(X)) (Yj −E(Y))Pr(X =Xi , Y =Yj)

=

m

X

i=1 n

X

j=1

XiYiPr(X=Xi , Y =Yj)

m

X

i=1 n

X

j=1

XiE(Y)Pr(X =Xi , Y =Yj)

m

X

i=1 n

X

j=1

E(X)YjPr(X =Xi , Y =Yj)

+

m

X

i=1 n

X

j=1

E(X)E(Y)Pr(X =Xi , Y =Yj)

(2)

=

m

X

i=1 n

X

j=1

XiYiPr(X=Xi , Y =Yj)

−E(Y)

m

X

i=1 n

X

j=1

XiPr(X =Xi , Y =Yj)

−E(X)

m

X

i=1 n

X

j=1

YjPr(X =Xi , Y =Yj)

+E(X)E(Y)

m

X

i=1 n

X

j=1

Pr(X =Xi , Y =Yj)

=

m

X

i=1 n

X

j=1

XiYiPr(X=Xi , Y =Yj)

−E(Y)

m

X

i=1

XiPr(X =Xi)

−E(X)

n

X

j=1

YjPr(Y =Yj) +E(X)E(Y)

=

m

X

i=1 n

X

j=1

XiYiPr(X=Xi , Y =Yj)

−E(X)E(Y)−E(X)E(Y) +E(X)E(Y)

=E(XY)−E(X)E(Y), ce qui fut `a montrer.

2 Tests d’hypoth`ese, intervalles de confiance, etc.

(30 points)

1. SoitYila taille mesur´ee de l’i`eme homme de l’´echantillon. Nous pouvons supposer un ´echantillon al´eatoire et donc une moyenne (dans la

(3)

population) constante que nous pouvons appelerµY. Nous avons : 1

n−1

n

X

i=1

Yi−Y¯

≡σˆ2Y ≡s2Y = 7.22,

la variance ´echantillonnale (qui est tout simplement le carr´e de l’´ecart type

´echantillonnal — je vous ai envoy´e un courriel `a cet effet pour pr´eciser), ce qui est un estimateur non biais´e et convergent de la variance deY. Donc, nous avons que

1

ns2Y ≡σˆ2Y¯

est un estimateur non bias´e et convergent de la variance deY¯, la moyenne

´echantillonnale, et

ˆ

σY¯ = sY

√n

est l’´ecart type de la moyenne ´echantillonnale (par opposition `a l’´ecart type

´echantillonnal). Donc, la statistique Y¯ −µY

ˆ σY¯

est une variable al´eatoire avec une esp´erance de z´ero et une variance unitaire. si l’´echantillon est assez grand, nous pouvons supposer qu’elle est approximativement une variable normale centr´ee r´eduite. Nous avons

0.95 =Pr

−1.96≤ Y¯ −µY

ˆ σY¯

≤1.96

=Pr Y¯ −1.96ˆσY¯ ≤µY ≤Y¯ + 1.96ˆσY¯

,

=Pr

177−1.96 6.5

√800 ≤µY ≤177 + 1.96 6.5

√800

=Pr(177−0.45≤µY ≤177 + 0.45).

L’intervalle de confiance de 95% pour la taille des hommes qu´eb´ecois en centim`etres est

177±0.45.

De mani`ere semblable, pour les hommes ontariens, nous avons 0.95 =Pr

179−1.96 7.2

√1000 ≤µY ≤179 + 1.96 7.2

√1000

(4)

=Pr(179−0.446≤µY ≤179 + 0.446)

L’intervalle de confiance de 95% pour la taille des hommes ontariens en centim`etres est

179±0.446

2. De mani`ere semblable que pour la sous-question pr´ec´edente, nous avons 0.99 = Pr

177−2.57 6.5

√800 ≤µY ≤177 + 2.57 6.5

√800

=Pr(177−0.591≤µY ≤177 + 0.591).

L’intervalle de confiance de 99% pour la taille des hommes qu´eb´ecois en centim`etres est

177±0.591.

De mani`ere semblable, nous avons 0.99 =Pr

179−2.57 7.2

√1000 ≤µY ≤179 + 2.57 7.2

√1000

=Pr(179−0.585≤µY ≤179 + 0.585).

L’intervalle de confiance de 99% pour la taille des hommes ontariens en centim`etres est

179±0.585.

3. L’´ecart type de la moyenne ´echantillonnale est donn´ee par

√6.5

800 = 0.230 La valeur calcul´ee de la statistique est

177−179

0.230 =−8.70.

Le test est pour une hypoth`ese alternative bilat´erale. La p-value est donn´ee par

p−value = 2Φ (−| −8.70|) = 0.00006.

L’hypoth`ese nulle est rejet´ee (massivement).

(5)

4. La valeur calcul´ee de la statistique est encore donn´ee par 177−179

0.230 =−8.70.

Le test est maintenant pour une hypoth`ese unilat´erale. La p-value est donn´ee par

p−value = 1−Φ (−8.70) = 0.99997.

Evidemment, notre ´echantillon de donn´ees ne fournit pas d’´evidence en´ faveur de l’hypoth`ese alternative que la taille moyenne des hommes qu´eb´ecois est sup´erieure `a 179cm.

5. La formule pertinente est donn´ee au milieu de la page 24 des notes de cours sur l’estimation et l’inf´erence statistique. La diff´erence entre les deux moyennes ´echantillonnales peut s’´ecrire

q−Y¯o = 177−179 =−2.

La variance de cette diff´erence est donn´ee par Var Y¯q−Y¯o

Y2¯

qY2¯

o = 1

nq

σY2q + 1 no

σ2Yo, puisque nous pouvons supposer que les deux ´echantillons sont

ind´ependants. Puisque nous ne connaissons pas les vraies valeurs de ces variances, nous utilisons un estimateur convergent donn´e par

ˆ

σ2q−Y¯o

= ˆσY2¯q + ˆσ2Y¯o

= s2q nq

+ s2o no

= 6.52

800 + 7.22

1000 = 0.105.

Donc nous avons sous l’hypoth`ese nulle Y¯q−Y¯o

qs2

q

nq + ns2o

o

d

→N(0,1)

Sachant ceci, l’intervalle de confiance de 95% est donn´e par

95% =Pr

−1.96≤

q−Y¯o

− µYq −µYo

qs2

q

nq +ns2o

o

≤1.96

=

(6)

Pr Y¯q−Y¯o

−1.96 ss2q

nq

+ s2o no

≤ µYq −µYo

≤ Y¯q−Y¯o

+ 1.96 ss2q

nq

+ s2o no

!

=Pr

−2−1.96×√

0.105 ≤ µYq −µYo

≤ −2 + 1.96×√

0.105 . Donc l’intervalle de confiance pour la diff´erence des tailles moyennes est

−2±0.635.

6. La statistique normalis´ee est donn´ee par Y¯q−Y¯o

−0 qs2

q

nq +ns2o

o

= −2

0.105 =−19.05.

La p-value du test (l’hypoth`ese alternative est bilat´erale) est p−value= 2Φ (−| −19.05|). Cette p-value est `a toutes fins pratiques ´egale `a z´ero.

7. La valeur de la statistique normalis´ee pour avoir une p-value de 0.05 serait -1.96. Notre estimateur de la variance deY¯q−Y¯o est maintenant

6.52+ 7.22 n

ounest la taille (commune) de chacun des deux ´echantillons. Donc nous cherchons la solution `a

−1.96 = −2 q6.52+7.22

n

⇒√

n = 1.96 2

6.52+ 7.22

⇒n=

1.96 2

2

6.52+ 7.22

= 90.36.

Nous avons toujours un nombre entier d’observations. Donc, il faudrait au moins 91 observations pour rejeter l’hypoth`ese nulle avec une p-value de 0.05.

(7)

3 Convergence (20 points)

1. Pour montrer l’absence de biais, il faut calculer l’esp´erance de l’estimateur.

Nous avons E

Ye

= 1

4E(Y1) + 1

4E(Y2) + 1 2(n−2)

n

X

i=3

E(Yi)

o`u nous avons appliqu´e la r`egle E(AY) =AE(Y),

⇒E Ye

= 1

Y +1

Y + 1 2(n−2)

n

X

i=3

µY

= 1

Y +1

Y + (n−2) 2(n−2)µY

= 1

4 +1 4 +1

2

µYY, ce qui fut `a montrer.

2. Nous avons

Var Ye

= 1

16Var(Y1) + 1

16Var(Y2) +1

4 1 (n−2)2

n

X

i=3

Var(Yi)

= 1

Y2 + 1 4

(n−2) (n−2)2σY2

= 1

Y2 +1 4

1 (n−2)σY2 3. La variance diminue avecnmais on a

n→∞lim = 1 8σY2.

4. Mˆeme lorsquentend vers l’infini, la variance de l’estimateur est positive.

Si on choisit un intervalle arbitrairement petit autour de la vraie valeurµY, disonsµY ±, la probabilit´e que la valeur calcul´ee de notre estimateur se retrouve `a l’int´erieur de cet intervalle ne tend pas vers un `a cause de sa variance qui n’est jamais inf´erieure `a 18σ2Y.

(8)

5. La variance de l’estimateur MCO est donn´ee par Var Y¯

= 1 n2

n

X

i=1

Var(Yi) = 1 nσ2Y.

Il est facile de v´erifier que pourn = 4, les deux variances sont ´egales (dans ce cas les deux estimateurs mettent le mˆeme poids sur les deux derni`eres observations), et que pourn = 3etn ≥5, la variance deY¯ est plus petite.

4 Convergence et th´eor`eme de la limite centrale (40 points)

1. Je ne vais pas reproduire ici les d´erivations alg´ebriques provenant des notes de cours. La moyenne th´eorique est donn´ee par

0.3 + 1.5

2 = 0.9.

2. Encore une fois, je ne vais pas reproduire les d´erivations alg´ebriques, qui sont disponibles dans les notes de cours. La variance est donn´ee par

(1.5−0.3)2 12 .

3. Soitσ2ula variance th´eorique calcul´ee dans la partie pr´ec´edente. SoitYu notre variable uniforme avec un support de[0.3,1.5]. Nous avons

Var 1 n

n

X

i=1

Yu

!

= 1

n 2 n

X

i=1

Var(Yu)

= 1 nσu2.

Il s’agit d’une application standard de nos r`egles de base pour le calcul de variances. Le r´esultat d´epend du fait que les observations dans un

´echantillon donn´e sont ind´ependantes.

(9)

4. Pour les autres parties de la question, voir le script suivant : http:

//www.er.uqam.ca/nobel/r10735/4272/tp1.2011.inp Puisqu’on sauvegarde les 500 observations pour des ´echantillons de taille n `a la fin de chaque boucle, il est possible de g´en´erer les histogrammes de fac¸on interactive une fois que le script a ´et´e ex´ecut´e. Mˆeme pour un

´echantillon de taille 4, j’ai ´et´e capable dans certains cas d’obtenir des r´esultats o`u on ne rejetait pas l’hypoth`ese nulle de la normalit´e. Si on augmente le nombre de r´ep´etitions `a 10,000 (essayez-le, il faut juste remplacer 500 par 10,000 dans chaque boucle), on rej`ete toujours la normalit´e pour des ´echantillons de taille 4, et `a un taux marginal de significativit´e tr`es faible. Par compte, on accepte la normalit´e pour des

´echantillons de taille 50 et de taille 500.

cr´e´e le 18/03/2011

Références

Documents relatifs

D’apr`es le lemme 1, l’anneau B ( Q ) est principal puisque c’est un anneau de Dedekind qui a pour seuls id´eaux maximaux les id´eaux engendr´es par les id´eaux maximaux de

c’est appliquer la tactique R´ e´ ecrire de fa¸con intelligente jusqu’` a obtenir une forme que tout le monde est d’accord pour trouver optimale. On peut donner un sens pr´ ecis `

– polynome ` a une ind´ etermin´ ee sur un corps commutatif K, anneau K[X] ; fonction polynˆ ome ; degr´ e d’un polynˆ ome non nul, multiplicativit´ e du degr´ e ;. – diviseur

Calculez la p-value pour un test de l’hypoth`ese nulle que le poids moyen des qu´eb´ecois est ´egal `a 83kg, contre l’hypoth`ese alternative qu’il est diff´erent de 83kg..

Vous devriez obtenir des histogrammes o`u la dispersion ne diminue pas avec la taille de l’´echantillon, puisqu’on normalise la variable al´eatoire utilis´ee pour

Calculez la p-value pour un test de l’hypoth`ese nulle que la taille moyenne des hommes qu´eb´ecois est ´egale `a 179cm, contre l’hypoth`ese alternative qu’elle est diff´erente

Si les deux ´echantillons sont de taille ´egale, et si les moyennes ´echantillonnales et les ´ecarts types ´echantillonnaux ne changent pas, quelle serait la taille mi- nimale

Cette solution est tout `a fait logique, puisque nous savons que l’estimateur le plus efficient en pr´esence d’homosc´edasticit´e (toutes les observations ont une variance ´egale)