• Aucun résultat trouvé

1 Propri´et´es de la covariance (10 points)

N/A
N/A
Protected

Academic year: 2022

Partager "1 Propri´et´es de la covariance (10 points)"

Copied!
11
0
0

Texte intégral

(1)

ECO 4272: Introduction `a l’´econom´etrie Exercice 1: R´eponses

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

c 2012, Steve Ambler Hiver 2012

1 Propri´et´es de la covariance (10 points)

Nous avons (utilisant la d´efinition donn´ee dans l’´enonc´e) Cov(a+bX , c+dY)

=

m

X

i=1 n

X

j=1

(a+bXi−E(a+bX)) (c+dYj −E(c+dY))Pr(a+bX =a+bXi , c+dY =c+dYj)

=

m

X

i=1 n

X

j=1

(a+bXi−a−E(bX)) (c+dYj−c−E(dY))Pr(X =Xi , Y =Yj)

=

m

X

i=1 n

X

j=1

(bXi−E(bX)) (dYj −E(dY))Pr(X =Xi , Y =Yj)

=

m

X

i=1 n

X

j=1

(bXi−bE(X)) (dYj−dE(Y))Pr(X =Xi , Y =Yj)

=

m

X

i=1 n

X

j=1

b(Xi −E(X))d(Yj −E(Y))Pr(X =Xi , Y =Yj)

(2)

=bd

m

X

i=1 n

X

j=1

(Xi−E(X)) (Yj−E(Y))Pr(X =Xi , Y =Yj)

≡bdCov(X Y), ce qui fut `a montrer.

2 Distributions de probabilit´e jointes (15 points)

Il y a trois valeurs distinctes possibles pourX(-1,0,1) et trois valeurs distinctes possibles pourY (-1,0,1). Nous avons le tableau suivant au d´epart.

Y

-1 0 1

-1 – 1/4 –

X 0 1/4 – 1/4

1 – 1/4 –

C’est une distribution de probabilit´e, et les probabilit´es donn´ees ont une somme de 1, donc les autres probabilit´es doivent ˆetre ´egales `a z´ero. Nous avons la tableau de probabilit´es jointes suivant.

Y

-1 0 1

-1 0 1/4 0

X 0 1/4 0 1/4

1 0 1/4 0

1. Les probabilit´es marginales sont donn´ees par le tableau suivant.

Y

-1 0 1 Pr(X)

-1 0 1/4 0 1/4

X 0 1/4 0 1/4 1/2

1 0 1/4 0 1/4

Pr(Y) 1/4 1/2 1/4 2. Nous avons

E(X) = 1

4× −1 + 1

2 ×0 + 1

4 ×1 = 0,

(3)

et

E(Y) = 1

4× −1 + 1

2 ×0 + 1

4 ×1 = 0.

Appliquant la formule standard pour le calcul d’une covariance, nous avons Cov(X , Y)

= 1

4(−1−0) (0−0) + 1

4(0−0) (−1−0) +1

4(0−0) (1−0) + 1

4(1−0) (0−0)

= 0.

J’ai omis tous les termes pond´er´es par des probabilit´es de z´ero.

3. Puisque la covariance est z´ero, la corr´elation est forc´ement z´ero.

4. Pour montrer que les deux variablesne sont pasind´ependantes, il suffit de montrer qu’il y a au moins un cas o`u

Pr(X =Xi , Y =Yj)6=Pr(X =Xi)×Pr(Y =Yj). En fait,

Pr(X =−1, Y =−1) = 06=Pr(X =Xi)×Pr(Y =Yj) = 1 4 × 1

4. Nous avons notre preuve par contre-exemple. C’est un exemple qui illustre le fait qu’une covariance de z´ero n’implique pas forc´ement l’ind´ependance entre les deux variables al´eatoires.

3 Tests d’hypoth`ese, intervalles de confiance, etc.

(30 points)

1. Nous avons

0.95 =Pr(−1.96≤Z ≤1.96),

pour une variable al´eatoireZ qui ob´eit `a une loi normale centr´ee r´eduite.

Dans le cas du nouveau type de pile, la moyenne ´echantillonnale de sa dur´ee est ´egale `a200. L’´ecart type ´echantillonnale de la dur´ee est40, et donc l’´ecart type de la moyenne ´echantillonnale est ´egal `a40/√

100 = 4.

(4)

Si nous supposons un ´echantillon suffisamment grand pour approximer la distribution de la dur´ee des piles par une loi normale et pour penser que l’´ecart type ´echantillonnal donne un estim´e suffisamment pr´ecis de l’´ecart type de la dur´ee dans la population, nous avons

0.95 = Pr

−1.96≤ 200−µ1

4 ≤1.96

,

=Pr(−4×1.96≤200−µ1 ≤4×1.96)

=Pr(−4×1.96≤µ1−200≤4×1.96)

=Pr(200−4×1.96≤µ1 ≤200 + 4×1.96).

L’intervalle de confiance de 95% pour la dur´ee du nouveau type de pile est 200±4×1.96.

De mani`ere semblable, l’´ecart type de la moyenne ´echantillonnal du vieux type de pile est20/√

100 = 2. L’intervalle de confiance de 95% pour le vieux type de pile est donc

190±2×1.96

2. Pour une variable al´eatoire normale centr´ee r´eduite, nous avons 0.99 =Pr(−2.58≤Z ≤2.58),

Donc, l’intervalle de confiance de 99% pour la dur´ee du nouveau type de pile est

200±4×2.58.

De mani`ere semblable, l’intervalle de confiance de 99% pour le vieux type de pile est donc

190±2×2.58.

3. Il faut calculer la statist.ique normalis´ee. Pour ce faire, il faut calculer l’´ecart type de la diff´erence entre les deux moyennes ´echantillonnales. Si les deux ´echantillons sont ind´ependants, un estim´e convergent de la variance de la diff´erence entre moyennes ´echantillonnales est donn´e par

r402

100 + 202 100 =√

20≈4.472.

(5)

La statistiquetpour tester l’hypoth`ese nulle est donn´ee par (200−190)−7

4.472 ≈0.671

L’hypoth`ese alternative est unilat´erale. Une valeur tr`es grande de la statistique constitue de l’´evidence contre l’hypoth`ese nulle. Nous rejetons si le pourcentage de la distribution `a droite de la valeur calcul´ee est suffisamment petite. La valeur de la distribution cumul´ee de la normale centr´ee r´eduite `a 0.671 est approximativement 0.75. Mˆeme siH0 est vraie, nous allons obtenir une valeur au moins aussi ´elev´ee de la statistique que la statistique calcul´ee dans 25% des cas. Lap-value du test est 0.25. Elle n’est pas suffisamment petite pour rejeter l’hypoth`ese nulle.

4. L’estim´e convergent de la variance de la diff´erence entre les moyennes

´echantillonnales est donn´e par 402

n + 202

n = 2000 n ,

o`uY est la taille des deux ´echantillons. Nous cherchons la solution `a (200−190)−7

2000 n

≈1.64

⇒√ n≈

√2000×1.64 3

⇒n ≈597.69.

Il faudrait des ´echantillons (de taille ´egale) d’au moins 598 pour conclure `a un taux marginal de 5% que les piles du nouveau type ont une dur´ee d’au moins 7 minutes plus longue que le vieux type.

5. Pour rejeter `a un taux marginal de 5%, il faudrait que lap-value soit ´egale `a 0.05 ou moins. Nous cherchons la valeur deX qui est la solution `a

(200−190)−X

4.472 ≈1.64.

Nous obtenons

X ≈2.67.

(6)

4 Convergence (20 points)

1. Nous avons E

Ye

=E

 1 nm

n/2

X

i=1

Y2i−1+2m−1 nm

n/2

X

i=1

Y2i

=

 1 nm

n/2

X

i=1

E(Y2i−1) + 2m−1 nm

n/2

X

i=1

E(Y2i)

= 1 nm

n/2

X

i=1

µY +2m−1 nm

n/2

X

i=1

µY

= 1 nm

n

Y +2m−1 nm

n 2µY

= 1

2mµY +2m−1 2m µY

Y. 2. Nous avons

Var Ye

=Var

 1 nm

n/2

X

i=1

Y2i−1+2m−1 nm

n/2

X

i=1

Y2i

= 1

nm 2 n/2

X

i=1

Var(Y2i−1) +

2m−1 nm

2 n/2

X

i=1

Var(Y2i)

= 1

nm 2

n 2σ2Y +

2m−1 nm

2

n 2σY2

= 1 n

1 2

1 m

2

+

2m−1 m

2! σY2 3. Nous avons

n→∞lim Var Ye

= 0.

La variance de l’estimateur tend vers z´ero lorsque le nombre d’observations tend vers l’infini.

(7)

4. L’estimateur est non biais´e et sa variance tend vers z´ero lorsque le nombre d’observations tend vers l’infin. Ce n’est pas une preuve formelle de sa convergence en probabilit´e, mais notre estimateur satisfait au moins les conditions n´ecessaires pour ˆetre un estimateur convergent.

5. Il faut choisirmpour minimiser 1

m 2

+

2m−1 m

2! .

Cela revient `a minimiser minm

2

m2 + 4− 4 m

.

La CPO pour minimiser cette fonction est

− 4 m3 + 4

m2 = 0

⇒ 4 m = 4

⇒m= 1.

Cette solution donne une pond´eration ´egale `a toutes les observations. Elle donne l’estimateur MCO, qui n’est pas du tout surprenant si la variance de toutes les observations est ´egale. Cette solution est tout `a fait logique, puisque nous savons que l’estimateur le plus efficient en pr´esence d’homosc´edasticit´e (toutes les observations ont une variance ´egale) est l’estimateur MCO.

5 Convergence et th´eor`eme de la limite centrale (25 points)

Je vous fournis le code enR. Je vais demander `a Patrick de vous montrer un exemple de code enSTATA. Le code enRpeut facilement ˆetre bas´e sur le code pour une loi uniforme dans la section 9.1 des notes de cours sur laTh´eorie des probabilit´es et statistique. Il est mˆeme plus simple.

(8)

Le code qui suit g´en`ere un nombreRrepd’observations sur une variable binomialeXavecRnr´ep´etitions o`uRpest la probabilit´e de succ`es, cr´ee la variable normalis´eeYo`u on soustrait la moyenne (th´eorique) et on divise par la variance (th´eorique), et finalement on produit un histogramme.

R> Rrep <- 500 R> Rp <- 0.25 R> Rn <- 1

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 5

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 20

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 100

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 500

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE)

Le code est suffisamment simple qu’il peut ˆetre ex´ecut´e dans une fenˆetre de commandes. Il peut aussi ˆetre sauvegard´e comme unscriptet ex´ecut´e.

On peut sauvegarder chaque graphique avec le bout de code suivant.

dev.copy(pdf,’graph1.pdf’

dev.off()

Ces commandes peuvent bien sˆur ˆetre incorpor´ees dans lescript, avec un changement du nom du fichier pour ne pas ´ecraser les graphiques pr´ec´edents.

(9)

On note qu’au fur et `a mesure que la valeur deRnaugmente, la variable normalis´ee devient de plus en plus sym´etrique autour de sa moyenne de z´ero et l’histogramme prend de plus en plus la forme d’une cloche normale.

J’inclus des graphiques, dans l’ordre.

Histogram of Y

Y

Density

−0.5 0.0 0.5 1.0 1.5

0123

(10)

Histogram of Y

Y

Density

−1 0 1 2 3 4

0.00.20.40.60.8

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3

0.00.10.20.3

(11)

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.5

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3 4

0.00.10.20.30.4

cr´e´e le 14/02/2012

Références

Documents relatifs

Pour simplifier, vous pouvez supposer qu’il s’agit d’une variable al´eatoire discr`ete, avec un nombre fini de r´ealisations distinctes possibles, et non une variable

Calculez la p-value pour un test de l’hypoth`ese nulle que les deux salaires on la mˆeme moyenne, contre l’hypoth`ese alternative que le salaire moyen en Alberta est plus ´elev´e5.

D´ej`a avec n = 5, `a l’oeil nu le graphique commence `a ressembler `a une cloche normale, mˆeme si l’hypoth`ese nulle de la normalit´e est rejet´ee par le

Calculez la p-value pour un test de l’hypoth`ese nulle que le poids moyen des qu´eb´ecois est ´egal `a 83kg, contre l’hypoth`ese alternative qu’il est diff´erent de 83kg..

Vous devriez obtenir des histogrammes o`u la dispersion ne diminue pas avec la taille de l’´echantillon, puisqu’on normalise la variable al´eatoire utilis´ee pour

Calculez la p-value pour un test de l’hypoth`ese nulle que la taille moyenne des hommes qu´eb´ecois est ´egale `a 179cm, contre l’hypoth`ese alternative qu’elle est diff´erente

Donc, il faudrait au moins 91 observations pour rejeter l’hypoth`ese nulle avec une p-value de 0.05..7. Je ne vais pas reproduire ici les d´erivations alg´ebriques provenant des

Si les deux ´echantillons sont de taille ´egale, et si les moyennes ´echantillonnales et les ´ecarts types ´echantillonnaux ne changent pas, quelle serait la taille mi- nimale