1 Propri´et´es de la covariance (10 points)

(1)

ECO 4272: Introduction à l’économétrie Exercice 1: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2012, Steve Ambler Hiver 2012

1 Propri´et´es de la covariance (10 points)

Nous avons (utilisant la définition donnée dans l’énoncé) Cov(a+bX , c+dY)

=

m

X

i=1 n

X

j=1

(a+bX_i−E(a+bX)) (c+dY_j −E(c+dY))Pr(a+bX =a+bX_i , c+dY =c+dY_j)

=

m

X

i=1 n

X

j=1

(a+bX_i−a−E(bX)) (c+dY_j−c−E(dY))Pr(X =X_i , Y =Y_j)

=

m

X

i=1 n

X

j=1

(bX_i−E(bX)) (dY_j −E(dY))Pr(X =X_i , Y =Y_j)

=

m

X

i=1 n

X

j=1

(bX_i−bE(X)) (dY_j−dE(Y))Pr(X =X_i , Y =Y_j)

=

m

X

i=1 n

X

j=1

b(X_i −E(X))d(Y_j −E(Y))Pr(X =X_i , Y =Y_j)

(2)

=bd

m

X

i=1 n

X

j=1

(Xi−E(X)) (Yj−E(Y))Pr(X =Xi , Y =Yj)

≡bdCov(X Y), ce qui fut `a montrer.

2 Distributions de probabilit´e jointes (15 points)

Il y a trois valeurs distinctes possibles pourX(-1,0,1) et trois valeurs distinctes possibles pourY (-1,0,1). Nous avons le tableau suivant au d´epart.

Y

-1 0 1

-1 – 1/4 –

X 0 1/4 – 1/4

1 – 1/4 –

C’est une distribution de probabilité, et les probabilités données ont une somme de 1, donc les autres probabilités doivent être égales à zéro. Nous avons la tableau de probabilités jointes suivant.

Y

-1 0 1

-1 0 1/4 0

X 0 1/4 0 1/4

1 0 1/4 0

1. Les probabilit´es marginales sont donn´ees par le tableau suivant.

Y

-1 0 1 Pr(X)

-1 0 1/4 0 1/4

X 0 1/4 0 1/4 1/2

1 0 1/4 0 1/4

Pr(Y) 1/4 1/2 1/4 2. Nous avons

E(X) = 1

4× −1 + 1

2 ×0 + 1

4 ×1 = 0,

(3)

et

E(Y) = 1

4× −1 + 1

2 ×0 + 1

4 ×1 = 0.

Appliquant la formule standard pour le calcul d’une covariance, nous avons Cov(X , Y)

= 1

4(−1−0) (0−0) + 1

4(0−0) (−1−0) +1

4(0−0) (1−0) + 1

4(1−0) (0−0)

= 0.

J’ai omis tous les termes pondérés par des probabilités de zéro.

3. Puisque la covariance est zéro, la corrélation est forcément zéro.

4. Pour montrer que les deux variablesne sont pasind´ependantes, il suffit de montrer qu’il y a au moins un cas o`u

Pr(X =X_i , Y =Y_j)6=Pr(X =X_i)×Pr(Y =Y_j). En fait,

Pr(X =−1, Y =−1) = 06=Pr(X =X_i)×Pr(Y =Y_j) = 1 4 × 1

4. Nous avons notre preuve par contre-exemple. C’est un exemple qui illustre le fait qu’une covariance de zéro n’implique pas forcément l’indépendance entre les deux variables aléatoires.

3 Tests d’hypoth`ese, intervalles de confiance, etc.

(30 points)

1. Nous avons

0.95 =Pr(−1.96≤Z ≤1.96),

pour une variable aléatoireZ qui obéit à une loi normale centrée réduite.

Dans le cas du nouveau type de pile, la moyenne échantillonnale de sa durée est égale à200. L’écart type échantillonnale de la durée est40, et donc l’écart type de la moyenne échantillonnale est égal à40/√

100 = 4.

(4)

Si nous supposons un échantillon suffisamment grand pour approximer la distribution de la durée des piles par une loi normale et pour penser que l’écart type échantillonnal donne un estimé suffisamment précis de l’écart type de la durée dans la population, nous avons

0.95 = Pr

−1.96≤ 200−µ₁

4 ≤1.96

,

=Pr(−4×1.96≤200−µ1 ≤4×1.96)

=Pr(−4×1.96≤µ₁−200≤4×1.96)

=Pr(200−4×1.96≤µ₁ ≤200 + 4×1.96).

L’intervalle de confiance de 95% pour la dur´ee du nouveau type de pile est 200±4×1.96.

De manière semblable, l’écart type de la moyenne échantillonnal du vieux type de pile est20/√

100 = 2. L’intervalle de confiance de 95% pour le vieux type de pile est donc

190±2×1.96

2. Pour une variable aléatoire normale centrée réduite, nous avons 0.99 =Pr(−2.58≤Z ≤2.58),

Donc, l’intervalle de confiance de 99% pour la dur´ee du nouveau type de pile est

200±4×2.58.

De mani`ere semblable, l’intervalle de confiance de 99% pour le vieux type de pile est donc

190±2×2.58.

3. Il faut calculer la statist.ique normalisée. Pour ce faire, il faut calculer l’écart type de la différence entre les deux moyennes échantillonnales. Si les deux échantillons sont indépendants, un estimé convergent de la variance de la différence entre moyennes échantillonnales est donné par

r40²

100 + 20² 100 =√

20≈4.472.

(5)

La statistiquetpour tester l’hypoth`ese nulle est donn´ee par (200−190)−7

4.472 ≈0.671

L’hypothèse alternative est unilatérale. Une valeur très grande de la statistique constitue de l’évidence contre l’hypothèse nulle. Nous rejetons si le pourcentage de la distribution à droite de la valeur calculée est suffisamment petite. La valeur de la distribution cumulée de la normale centrée réduite à 0.671 est approximativement 0.75. Même siH₀ est vraie, nous allons obtenir une valeur au moins aussi élevée de la statistique que la statistique calculée dans 25% des cas. Lap-value du test est 0.25. Elle n’est pas suffisamment petite pour rejeter l’hypothèse nulle.

4. L’estim´e convergent de la variance de la diff´erence entre les moyennes

´echantillonnales est donn´e par 40²

n + 20²

n = 2000 n ,

oùY est la taille des deux échantillons. Nous cherchons la solution à (200−190)−7

√

√2000 n

≈1.64

⇒√ n≈

√2000×1.64 3

⇒n ≈597.69.

Il faudrait des échantillons (de taille égale) d’au moins 598 pour conclure à un taux marginal de 5% que les piles du nouveau type ont une durée d’au moins 7 minutes plus longue que le vieux type.

5. Pour rejeter à un taux marginal de 5%, il faudrait que lap-value soit égale à 0.05 ou moins. Nous cherchons la valeur deX qui est la solution à

(200−190)−X

4.472 ≈1.64.

Nous obtenons

X ≈2.67.

(6)

4 Convergence (20 points)

1. Nous avons E

Ye

=E



 1 nm

n/2

X

i=1

Y2i−1+2m−1 nm

n/2

X

i=1

Y_2i





=



 1 nm

n/2

X

i=1

E(Y2i−1) + 2m−1 nm

n/2

X

i=1

E(Y2i)





= 1 nm

n/2

X

i=1

µ_Y +2m−1 nm

n/2

X

i=1

µ_Y

= 1 nm

n

2µ_Y +2m−1 nm

n 2µ_Y

= 1

2mµY +2m−1 2m µY

=µ_Y. 2. Nous avons

Var Ye

=Var



 1 nm

n/2

X

i=1

Y2i−1+2m−1 nm

n/2

X

i=1

Y_2i





= 1

nm 2 n/2

X

i=1

Var(Y2i−1) +

2m−1 nm

2 n/2

X

i=1

Var(Y_2i)

= 1

nm 2

n 2σ²_Y +

2m−1 nm

2

n 2σ_Y²

= 1 n

1 2

1 m

2

+

2m−1 m

2! σ_Y² 3. Nous avons

n→∞lim Var Ye

= 0.

La variance de l’estimateur tend vers z´ero lorsque le nombre d’observations tend vers l’infini.

(7)

4. L’estimateur est non biaisé et sa variance tend vers zéro lorsque le nombre d’observations tend vers l’infin. Ce n’est pas une preuve formelle de sa convergence en probabilité, mais notre estimateur satisfait au moins les conditions nécessaires pour être un estimateur convergent.

5. Il faut choisirmpour minimiser 1

m 2

+

2m−1 m

2! .

Cela revient `a minimiser minm

2

m² + 4− 4 m

.

La CPO pour minimiser cette fonction est

− 4 m³ + 4

m² = 0

⇒ 4 m = 4

⇒m= 1.

Cette solution donne une pondération égale à toutes les observations. Elle donne l’estimateur MCO, qui n’est pas du tout surprenant si la variance de toutes les observations est égale. Cette solution est tout à fait logique, puisque nous savons que l’estimateur le plus efficient en présence d’homoscédasticité (toutes les observations ont une variance égale) est l’estimateur MCO.

5 Convergence et th´eor`eme de la limite centrale (25 points)

Je vous fournis le code enR. Je vais demander à Patrick de vous montrer un exemple de code enSTATA. Le code enRpeut facilement être basé sur le code pour une loi uniforme dans la section 9.1 des notes de cours sur laThéorie des probabilités et statistique. Il est même plus simple.

(8)

Le code qui suit génère un nombreRrepd’observations sur une variable binomialeXavecRnrépétitions oùRpest la probabilité de succès, crée la variable normaliséeYoù on soustrait la moyenne (théorique) et on divise par la variance (théorique), et finalement on produit un histogramme.

R> Rrep <- 500 R> Rp <- 0.25 R> Rn <- 1

R> X <- rbinom(Rrep,Rn,Rp)

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 5

R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE)

Le code est suffisamment simple qu’il peut être exécuté dans une fenêtre de commandes. Il peut aussi être sauvegardé comme unscriptet exécuté.

On peut sauvegarder chaque graphique avec le bout de code suivant.

dev.copy(pdf,’graph1.pdf’

dev.off()

Ces commandes peuvent bien sûr être incorporées dans lescript, avec un changement du nom du fichier pour ne pas écraser les graphiques précédents.

(9)

On note qu’au fur et à mesure que la valeur deRnaugmente, la variable normalisée devient de plus en plus symétrique autour de sa moyenne de zéro et l’histogramme prend de plus en plus la forme d’une cloche normale.

J’inclus des graphiques, dans l’ordre.

Histogram of Y

Y

Density

−0.5 0.0 0.5 1.0 1.5

0123

(10)

Histogram of Y

Y

Density

−1 0 1 2 3 4

0.00.20.40.60.8

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3

0.00.10.20.3

(11)

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3

0.00.10.20.30.40.5

Histogram of Y

Y

Density

−3 −2 −1 0 1 2 3 4

0.00.10.20.30.4

cr´e´e le 14/02/2012