ECO 4272: Introduction `a l’´econom´etrie Exercice 1: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2012, Steve Ambler Hiver 2012
1 Propri´et´es de la covariance (10 points)
Nous avons (utilisant la d´efinition donn´ee dans l’´enonc´e) Cov(a+bX , c+dY)
=
m
X
i=1 n
X
j=1
(a+bXi−E(a+bX)) (c+dYj −E(c+dY))Pr(a+bX =a+bXi , c+dY =c+dYj)
=
m
X
i=1 n
X
j=1
(a+bXi−a−E(bX)) (c+dYj−c−E(dY))Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
(bXi−E(bX)) (dYj −E(dY))Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
(bXi−bE(X)) (dYj−dE(Y))Pr(X =Xi , Y =Yj)
=
m
X
i=1 n
X
j=1
b(Xi −E(X))d(Yj −E(Y))Pr(X =Xi , Y =Yj)
=bd
m
X
i=1 n
X
j=1
(Xi−E(X)) (Yj−E(Y))Pr(X =Xi , Y =Yj)
≡bdCov(X Y), ce qui fut `a montrer.
2 Distributions de probabilit´e jointes (15 points)
Il y a trois valeurs distinctes possibles pourX(-1,0,1) et trois valeurs distinctes possibles pourY (-1,0,1). Nous avons le tableau suivant au d´epart.
Y
-1 0 1
-1 – 1/4 –
X 0 1/4 – 1/4
1 – 1/4 –
C’est une distribution de probabilit´e, et les probabilit´es donn´ees ont une somme de 1, donc les autres probabilit´es doivent ˆetre ´egales `a z´ero. Nous avons la tableau de probabilit´es jointes suivant.
Y
-1 0 1
-1 0 1/4 0
X 0 1/4 0 1/4
1 0 1/4 0
1. Les probabilit´es marginales sont donn´ees par le tableau suivant.
Y
-1 0 1 Pr(X)
-1 0 1/4 0 1/4
X 0 1/4 0 1/4 1/2
1 0 1/4 0 1/4
Pr(Y) 1/4 1/2 1/4 2. Nous avons
E(X) = 1
4× −1 + 1
2 ×0 + 1
4 ×1 = 0,
et
E(Y) = 1
4× −1 + 1
2 ×0 + 1
4 ×1 = 0.
Appliquant la formule standard pour le calcul d’une covariance, nous avons Cov(X , Y)
= 1
4(−1−0) (0−0) + 1
4(0−0) (−1−0) +1
4(0−0) (1−0) + 1
4(1−0) (0−0)
= 0.
J’ai omis tous les termes pond´er´es par des probabilit´es de z´ero.
3. Puisque la covariance est z´ero, la corr´elation est forc´ement z´ero.
4. Pour montrer que les deux variablesne sont pasind´ependantes, il suffit de montrer qu’il y a au moins un cas o`u
Pr(X =Xi , Y =Yj)6=Pr(X =Xi)×Pr(Y =Yj). En fait,
Pr(X =−1, Y =−1) = 06=Pr(X =Xi)×Pr(Y =Yj) = 1 4 × 1
4. Nous avons notre preuve par contre-exemple. C’est un exemple qui illustre le fait qu’une covariance de z´ero n’implique pas forc´ement l’ind´ependance entre les deux variables al´eatoires.
3 Tests d’hypoth`ese, intervalles de confiance, etc.
(30 points)
1. Nous avons
0.95 =Pr(−1.96≤Z ≤1.96),
pour une variable al´eatoireZ qui ob´eit `a une loi normale centr´ee r´eduite.
Dans le cas du nouveau type de pile, la moyenne ´echantillonnale de sa dur´ee est ´egale `a200. L’´ecart type ´echantillonnale de la dur´ee est40, et donc l’´ecart type de la moyenne ´echantillonnale est ´egal `a40/√
100 = 4.
Si nous supposons un ´echantillon suffisamment grand pour approximer la distribution de la dur´ee des piles par une loi normale et pour penser que l’´ecart type ´echantillonnal donne un estim´e suffisamment pr´ecis de l’´ecart type de la dur´ee dans la population, nous avons
0.95 = Pr
−1.96≤ 200−µ1
4 ≤1.96
,
=Pr(−4×1.96≤200−µ1 ≤4×1.96)
=Pr(−4×1.96≤µ1−200≤4×1.96)
=Pr(200−4×1.96≤µ1 ≤200 + 4×1.96).
L’intervalle de confiance de 95% pour la dur´ee du nouveau type de pile est 200±4×1.96.
De mani`ere semblable, l’´ecart type de la moyenne ´echantillonnal du vieux type de pile est20/√
100 = 2. L’intervalle de confiance de 95% pour le vieux type de pile est donc
190±2×1.96
2. Pour une variable al´eatoire normale centr´ee r´eduite, nous avons 0.99 =Pr(−2.58≤Z ≤2.58),
Donc, l’intervalle de confiance de 99% pour la dur´ee du nouveau type de pile est
200±4×2.58.
De mani`ere semblable, l’intervalle de confiance de 99% pour le vieux type de pile est donc
190±2×2.58.
3. Il faut calculer la statist.ique normalis´ee. Pour ce faire, il faut calculer l’´ecart type de la diff´erence entre les deux moyennes ´echantillonnales. Si les deux ´echantillons sont ind´ependants, un estim´e convergent de la variance de la diff´erence entre moyennes ´echantillonnales est donn´e par
r402
100 + 202 100 =√
20≈4.472.
La statistiquetpour tester l’hypoth`ese nulle est donn´ee par (200−190)−7
4.472 ≈0.671
L’hypoth`ese alternative est unilat´erale. Une valeur tr`es grande de la statistique constitue de l’´evidence contre l’hypoth`ese nulle. Nous rejetons si le pourcentage de la distribution `a droite de la valeur calcul´ee est suffisamment petite. La valeur de la distribution cumul´ee de la normale centr´ee r´eduite `a 0.671 est approximativement 0.75. Mˆeme siH0 est vraie, nous allons obtenir une valeur au moins aussi ´elev´ee de la statistique que la statistique calcul´ee dans 25% des cas. Lap-value du test est 0.25. Elle n’est pas suffisamment petite pour rejeter l’hypoth`ese nulle.
4. L’estim´e convergent de la variance de la diff´erence entre les moyennes
´echantillonnales est donn´e par 402
n + 202
n = 2000 n ,
o`uY est la taille des deux ´echantillons. Nous cherchons la solution `a (200−190)−7
√
√2000 n
≈1.64
⇒√ n≈
√2000×1.64 3
⇒n ≈597.69.
Il faudrait des ´echantillons (de taille ´egale) d’au moins 598 pour conclure `a un taux marginal de 5% que les piles du nouveau type ont une dur´ee d’au moins 7 minutes plus longue que le vieux type.
5. Pour rejeter `a un taux marginal de 5%, il faudrait que lap-value soit ´egale `a 0.05 ou moins. Nous cherchons la valeur deX qui est la solution `a
(200−190)−X
4.472 ≈1.64.
Nous obtenons
X ≈2.67.
4 Convergence (20 points)
1. Nous avons E
Ye
=E
1 nm
n/2
X
i=1
Y2i−1+2m−1 nm
n/2
X
i=1
Y2i
=
1 nm
n/2
X
i=1
E(Y2i−1) + 2m−1 nm
n/2
X
i=1
E(Y2i)
= 1 nm
n/2
X
i=1
µY +2m−1 nm
n/2
X
i=1
µY
= 1 nm
n
2µY +2m−1 nm
n 2µY
= 1
2mµY +2m−1 2m µY
=µY. 2. Nous avons
Var Ye
=Var
1 nm
n/2
X
i=1
Y2i−1+2m−1 nm
n/2
X
i=1
Y2i
= 1
nm 2 n/2
X
i=1
Var(Y2i−1) +
2m−1 nm
2 n/2
X
i=1
Var(Y2i)
= 1
nm 2
n 2σ2Y +
2m−1 nm
2
n 2σY2
= 1 n
1 2
1 m
2
+
2m−1 m
2! σY2 3. Nous avons
n→∞lim Var Ye
= 0.
La variance de l’estimateur tend vers z´ero lorsque le nombre d’observations tend vers l’infini.
4. L’estimateur est non biais´e et sa variance tend vers z´ero lorsque le nombre d’observations tend vers l’infin. Ce n’est pas une preuve formelle de sa convergence en probabilit´e, mais notre estimateur satisfait au moins les conditions n´ecessaires pour ˆetre un estimateur convergent.
5. Il faut choisirmpour minimiser 1
m 2
+
2m−1 m
2! .
Cela revient `a minimiser minm
2
m2 + 4− 4 m
.
La CPO pour minimiser cette fonction est
− 4 m3 + 4
m2 = 0
⇒ 4 m = 4
⇒m= 1.
Cette solution donne une pond´eration ´egale `a toutes les observations. Elle donne l’estimateur MCO, qui n’est pas du tout surprenant si la variance de toutes les observations est ´egale. Cette solution est tout `a fait logique, puisque nous savons que l’estimateur le plus efficient en pr´esence d’homosc´edasticit´e (toutes les observations ont une variance ´egale) est l’estimateur MCO.
5 Convergence et th´eor`eme de la limite centrale (25 points)
Je vous fournis le code enR. Je vais demander `a Patrick de vous montrer un exemple de code enSTATA. Le code enRpeut facilement ˆetre bas´e sur le code pour une loi uniforme dans la section 9.1 des notes de cours sur laTh´eorie des probabilit´es et statistique. Il est mˆeme plus simple.
Le code qui suit g´en`ere un nombreRrepd’observations sur une variable binomialeXavecRnr´ep´etitions o`uRpest la probabilit´e de succ`es, cr´ee la variable normalis´eeYo`u on soustrait la moyenne (th´eorique) et on divise par la variance (th´eorique), et finalement on produit un histogramme.
R> Rrep <- 500 R> Rp <- 0.25 R> Rn <- 1
R> X <- rbinom(Rrep,Rn,Rp)
R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 5
R> X <- rbinom(Rrep,Rn,Rp)
R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 20
R> X <- rbinom(Rrep,Rn,Rp)
R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 100
R> X <- rbinom(Rrep,Rn,Rp)
R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE) R> Rn <- 500
R> X <- rbinom(Rrep,Rn,Rp)
R> Y <- (X-Rn*Rp)/(sqrt(Rn*Rp*(1-Rp))) R> hist(Y,nclass=10,probability=TRUE)
Le code est suffisamment simple qu’il peut ˆetre ex´ecut´e dans une fenˆetre de commandes. Il peut aussi ˆetre sauvegard´e comme unscriptet ex´ecut´e.
On peut sauvegarder chaque graphique avec le bout de code suivant.
dev.copy(pdf,’graph1.pdf’
dev.off()
Ces commandes peuvent bien sˆur ˆetre incorpor´ees dans lescript, avec un changement du nom du fichier pour ne pas ´ecraser les graphiques pr´ec´edents.
On note qu’au fur et `a mesure que la valeur deRnaugmente, la variable normalis´ee devient de plus en plus sym´etrique autour de sa moyenne de z´ero et l’histogramme prend de plus en plus la forme d’une cloche normale.
J’inclus des graphiques, dans l’ordre.
Histogram of Y
Y
Density
−0.5 0.0 0.5 1.0 1.5
0123
Histogram of Y
Y
Density
−1 0 1 2 3 4
0.00.20.40.60.8
Histogram of Y
Y
Density
−3 −2 −1 0 1 2 3
0.00.10.20.3
Histogram of Y
Y
Density
−3 −2 −1 0 1 2 3
0.00.10.20.30.40.5
Histogram of Y
Y
Density
−3 −2 −1 0 1 2 3 4
0.00.10.20.30.4
cr´e´e le 14/02/2012