ECO 4272: Introduction `a l’´econom´etrie Examen intra: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2010, Steve Ambler Hiver 2011
1 Variances et covariances (10 points)
1. L’expression qu’il fallait ´ecrire est le ratio de la covariance
´echantillonnaleet du produit des ´ecarts types´echantillonnaux:
1 n−1
Pn
i=1(Y1i−Y¯1)(Y2i−Y¯2) q 1
n−1
Pn
i=1(Y1i−Y¯1)2q
1 n−1
Pn
i=1(Y2i−Y¯2)2
o`uY¯1etY¯2 sont les moyennes ´echantillonnales. Il ´etait tr`es important d’utiliser la covariance et les variances ´echantillonnales. J’ai ´et´e
relativement s´ev`ere si vous avez utilis´e des moments de la populations, par exemple des op´erateurs d’esp´erance, j’ai enlev´e des points. L’´enonc´e de la question dit clairementsur la base d’un ´echantillon denobservations. Il y a encore beaucoup de confusion entre moments dans la population et moments ´echantillonnaux.
2. La moyenne ´echantillonnale dea+bY1est tout simplementa+bY¯1o`uY¯1 est la moyenne ´echantillonnale deY1, et la moyenne ´echantillonnale de c+dY2estc+dY¯2. Nous avons
Corr(a+bY1, c+dY2)
=
1 n−1
Pn
i=1(a+bY1i−a−bY¯1)(c+dY2i −c−dY¯2) q 1
n−1
Pn
i=1(a+bY1i−a−bY¯1)2q
1 n−1
Pn
i=1(c+dY2i−c−dY¯2)2
=
1 n−1
Pn
i=1(bY1i−bY¯1)(dY2i−dY¯2) q 1
n−1
Pn
i=1(bY1i−bY¯1)2q
1 n−1
Pn
i=1(dY2i−dY¯2)2
=
1 n−1
Pn
i=1bd(Y1i−Y¯1)(Y2i −Y¯2) q 1
n−1
Pn
i=1b2(Y1i−Y¯1)2 q 1
n−1
Pn
i=1d2(Y2i−Y¯2)2
= bdn−11 Pn
i=1(Y1i−Y¯1)(Y2i−Y¯2) bdq
1 n−1
Pn
i=1(Y1i−Y¯1)2q
1 n−1
Pn
i=1(Y2i−Y¯2)2
=
Pn
i=1(Y1i−Y¯1)(Y2i−Y¯2) pPn
i=1(Y1i−Y¯1)2pPn
i=1(Y2i −Y¯2)2
≡Corr(Y1, Y2), ce qui fut `a d´emontrer.
2 Distributions de probabilit´e jointes (15 points)
1. Nous avons
E(Y) = 0×Pr(Y = 0) + 1×Pr(Y = 1)
= 0×0.046 + 1×0.954 = 0.954.
2. C’est la mˆeme chose que la probabilit´e d’ˆetre au chˆomage, soit 0.046.
3. Nous avons
E(Y|X = 1) = 0×Pr(Y = 0|X = 1) + 1×Pr(Y = 1|X = 1)
= 0× Pr(Y = 0, X = 1)
Pr(X = 1) + 1×Pr(Y = 1, X = 1) Pr(X = 1)
= 0×0.009
0.341 + 1× 0.332
0.341 = 0.332 0.341.
4. Nous avons
E(Y|X = 0) = 0×Pr(Y = 0|X = 0) + 1×Pr(Y = 1|X = 0)
= 0× Pr(Y = 0, X = 0)
Pr(X = 0) + 1×Pr(Y = 1, X = 0) Pr(X = 0)
= 0×0.037
0.659 + 1× 0.622
0.659 = 0.622 0.659. 5. Le taux de chˆomage des diplˆom´es est donn´e par
Pr(Y = 0|X = 1) = Pr(Y = 0, X = 1)
Pr(X = 1) = 0.009
0.341 <0.03.
Le taux de chˆomage des non diplˆom´es est donn´e par Pr(Y = 0|X = 0) = Pr(Y = 0, X = 0)
Pr(X = 0) = 0.037
0.659 >0.03.
6. Pour l’ind´ependance, il faut que
Pr(X =Xi, Y =Yj) = Pr(X =Xi)×Pr(Y =Yj) ∀i, j.
Il est toujours le cas que
Pr(X =Xi, Y =Yj) = Pr(Y =Yj|X =Xi)×Pr(X =Xj) ∀i, j, et donc il faut que
Pr(Y =Yj|X =Xi) = Pr(Y =Yj) ∀i, j.
Donc, une fac¸on simple de voir si les variables sont ind´ependantes serait de v´erifier si le taux de chˆomage est identique pour les diplˆom´es et les non diplˆom´es, ce qui ´evidemment n’est pas le cas ´etant donn´ee la r´eponse `a la partie pr´ec´edente. C’est possible aussi de r´epondre `a la question en v´erifiant directement la premi`ere ´egalit´e.
3 Estimateur de l’asym´etrie d’une variable al´eatoire (15 points)
1. La r´eponse est tr`es simple. Il s’agit encore de l’application d’une de nos r`egles de base. Nous avons
Var A˜Y
=Var 1 n−1
n
X
i=1
Yi−Y¯3
!
= 1
n−1 2 n
X
i=1
Var
Yi−Y¯3
= 1
n−1 2 n
X
i=1
σA2
= n
(n−1)2σ2A
La variance de la somme est la somme des variances puisque (par
hypoth`ese) les observations sont ind´ependantes. La variance de1/(n−1) fois la somme est1/(n−1)2 fois la variance de la somme.
2. Nous utilisons la statistique normalis´ee habituelle pour effectuer un test d’hypoth`ese simple, `a savoir la valeur calcul´ee de la statistique moins sa valeur sous l’hypoth`ese nulle, divis´ee par la racine carr´ee d’un estimateur convergent de la variance de la statistique calcul´ee. De cette fac¸on, comme d’habitude, on a une statistique normalis´ee dont la moyenne est z´ero si l’hypoth`ese nulle est vraie et dont la variance est unitaire. L’hypoth`ese nulle est que la distribution estsym´etrique. Pour n’importe quelle distribution sym´etrique, la valeur de la mesure de l’asym´etrie estz´ero.
J’´etais assez surpris par le nombre d’´el`eves qui n’ont pas compris ce principe simple. L’estimateur convergent de la variance de la statistique est
n
(n−1)2s2A,
puisque par hypoth`eses2Aest un estimateur convergent deσA2. Donc la statistique pour effectuer le test serait
A˜Y −0 q .
3. Dans l’´enonc´e, on ne dit pas quelle est la distribution qui g´en`ereY (j’ai mˆeme ´ecritexplicitementqueY provenait d’une distribution inconnue).
Pour cette raison, la statistique, qui est la somme de fonctions non lin´eaires de variables al´eatoires provenant d’une distribution inconnue doit suivre une loi qui estinconnue. J’essaie d’insister sur ce principe depuis le d´ebut du trimestre. Une statistique est une fonction des observations, donc des valeurs r´ealis´ees d’une ou de plusieurs variables al´eatoires. Si nous ne connaissons pas la loi exacte qui g´en`ere la ou les variables al´eatoires,en
´echantillon fininous ne pouvons connaˆıtre `a quelle loi ob´eit la statistique.
D’o`u l’int´erˆet, si nous avons assez d’observations, d’utiliser une version du th´eor`eme de la limite centrale et de construire des statistiques qui vont se comporter (approximativement) comme si elles ob´eissent `a une loi normale centr´ee r´eduite.
4. Par hypoth`ese on a des observations ind´ependantes. La statistique propos´ee est la moyenne d’observations ind´ependantes d’une variable al´eatoire. Par hypoth`ese la variance de chaque terme de la sommation est constante. En principe, en grand ´echantillon la statistique devrait suivre
approximativementune loi normale centr´ee r´eduite.
5. C’est une version du th´eor`eme de la limite centrale.
4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (40 points)
1. Le coefficient donne l’impact d’une variation du prix par citation sur le nombre d’abonnements. Puisque les deux variables sont mesur´ees en logs, l’impact a l’interpr´etation d’une ´elasticit´e (variation proportionnelle dans le nombre d’abonnements r´esultant d’une variation proportionnelle donn´ee dans le prix par citation). Ce n’´etait pas n´ecessaire d’utiliser ce terme pour avoir tous les points. Plusieurs ´etudiants ont ´ecrit que cela mesurait le nombre moyen d’abonnements, ce qui n’est clairement pas le cas.
2. Il fallait utiliser l’identit´e suivante, sur laquelle on a pass´e beaucoup de temps au cours :
T SS =ESS+SSR= 125.9 + 100.1 = 226.0.
3. Deux fac¸ons ´equivalentes de le calculer : R2 = ESS
T SS = 1− SSR
T SS = 125.9 226.0. 4. La r´eponse est
rSSR n−2.
5. L’hypoth`ese nulle est que la variable n’est pas significative, ce qui veut dire qu’elle n’aide pas `a expliquer les variations dans le nombre
d’abonnements, ce qui veut dire que sa valeur estz´ero. J’ai insist´e `a plusieurs reprises en classe quetest de significativit´esignifiait un test de l’hypoth`ese nulleHo: ˆβ1 = 0. La statistique est
t =
βˆ1−0 sβˆ
1
= −0.5331−0 0.0356 , o`usβˆ
1 est la racine carr´ee d’un estimateur convergent de la variance deβˆ1. Sa valeur vous ´etait donn´ee.
6. Un test de significativit´e est toujours bilat´eral (l’hypoth`ese alternative ´etant que la variable en question aide `a expliquer les variations de la variable d´ependante, peu importe le signe). La p-value est donn´ee par
p-value = 2Φ
−
−0.5331 0.0356
.
On suppose que le nombre d’observations est suffisamment ´elev´e pour que la statistique utilis´ee suive approximativement une loi normale centr´ee r´eduite.
7. La valeur absolue de la statistique d´epasse 10. Il ne fallait pas se souvenir du chiffre exact de 1.96 pour savoir qu’on est tr`es tr`es tr`es loin de la moyenne de la statistique si l’hypoth`ese nulle tient (z´ero). On va rejeter `a 5%. On va rejeter `a 1%. On va probablement rejeter `a 0.0001% (je n’ai pas v´erifi´e).
8. Il s’agit maintenant d’une hypoth`ese avec une alternative unilat´erale, mais la forme de la statistique ne change pas :
−
= −0.5331−(−0.5)
0.0356 = −0.0331 0.0356 .
9. On va rejeter si la surface `a gauchede la valeur calcul´ee est suffisamment petite. On a
p-value= Φ
−0.0331 0.0356
.
Je remarque en passant (je ne vous l’ai pas demand´e) qu’en valeur absolue la statistique est inf´erieure `a 1, donc on ne rejette ni `a 5% ni `a 10%.
10. On a
X
100 =Pr −z ≤ βˆ1−β1 ˆ σβˆ
1
≤z
!
=Pr
−zσˆβˆ
1 ≤
βˆ1−β1
≤zσˆβˆ
1
=Pr
−zσˆβˆ1 ≤
β1−βˆ1
≤zσˆβˆ1
=Pr
βˆ1−zσˆβˆ
1 ≤β1 ≤βˆ1+zˆσβˆ
1
=Pr(−0.5331−z0.0356≤β1 ≤ −0.5331 +z0.0356). L’intervalle de confiance est
−0.5331±z×0.0356 =−0.5331±1.96×0.0356.
Evidemment, il n’´etait pas n´ecessaire de savoir que dans ce cas´ z = 1.96 pour avoir tous les points.
5 R´egression simple : estimateurs non biais´es (20 points)
1. L’estimateur MCO est donn´e par le ratio de la covariance ´echantillonnale entreY etXsur la variance ´echantillonnale deX. L’estimateur propos´e n’est ´evidemment pas l’estimateur MCO. Il ne minimise pas donc la somme des erreurs au carr´ePn
i=1(Yi−β0−β1Xi)2.
2. Nous avons
β˜1 =
n
X
i=2
Yi−Yi−1
Xi−Xi−1
=−Y1 1
X2−X1 +Y2
1
X2−X1 − 1 X3−X2
+Y3
1 X3−X2
− 1 X4−X3
+. . . +Yn−1
1 Xn−1 −Xn−2
− 1
Xn−Xn−1
+Yn 1 Xn−Xn−1
,
ce qui est clairement une fonction lin´eaire desYi. J’ai pos´e cette question pour renforcer la notion d’unestimateur lin´eaire lorsqu’on parle d’un estimateurBLUE.
3. Nous avons
n
X
i=2
Yi−Yi−1
Xi−Xi−1
=
n
X
i=2
β0+β1Xi+ui−β0−β1Xi−1−ui−1
Xi−Xi−1
=
n
X
i=2
β1(Xi−Xi−1) +ui−ui−1
Xi−Xi−1
=β1
n
X
i=2
(Xi−Xi−1) (Xi−Xi−1) +
n
X
i=2
ui−ui−1
Xi−Xi−1.
= (n−1)β1+
n
X
i=2
ui−ui−1
Xi−Xi−1
.
A ce stade-ci, j’ai une confession `a faire. J’ai ´ecrit l’estimateur avec` l’intention de revenir en arri`ere et le multiplier par une fraction qui allait faire en sorte qu’il soit non biais´e. ´Evidemment, la fraction en question est
1
n−1 et, ´evidemment, j’ai oubli´e de l’´ecrire. J’ai donn´e tous les points `a
ceux qui ont suivi la bonne d´emarche jusqu’`a l’avant-derni`ere ligne ci-dessus. Si on a
β˜1 = 1 n−1
n
X
i=2
Yi−Yi−1
Xi−Xi−1
ceci nous donne
β˜1 =β1+ 1 n−1
n
X
i=2
ui−ui−1
Xi−Xi−1
.
Appliquant l’op´erateur d’esp´erance, on a E
β˜1
=β1+E 1 n−1
n
X
i=2
ui−ui−1
Xi−Xi−1
!
=β1+E 1 n−1
n
X
i=2
E(ui|Xi)−E(ui−1|Xi−1) Xi−Xi−1
!
= 0.
Dans l’avant-derni`ere ligne, j’utilise la loi des esp´erances it´er´ees.
4. L’estimateur est non bais´e, mˆeme en ´echantillon fini. Sa variance est donn´ee par
Var β˜1
=
Var 1
n−1
n
X
i=2
ui−ui−1
Xi−Xi−1
!
= 1
n−1 2
Var
n
X
i=2
ui−ui−1
Xi−Xi−1 !
.
Sans faire d’argument formel, on constate que la variance de la somme augmente de fac¸on lin´eaire enn, mais elle est divis´ee par un terme qui augmente proportionellement avecn2. Donc, la variance devrait tendre vers 0 lorsquentend vers l’infini. L’absence de biais et une variance qui tend vers 0 ne sont pas tout `a fait suffisants pour la convergence. On peut trouver des exceptions, mais des exceptions qui sont assez tordues. Donc, on peut avoir confiance que l’estimateur est convergent.
5. Nous savons qu’en pr´esence d’homosc´edasticit´e (et avec une variance finie des erreurs), l’estimateur MCO est plus efficient. Il fallait ´ecrire pouquoi (erreurs homosc´edastiques) l’estimateur MCO est le plus efficient dans ce cas.
cr´e´e le : 09/03/2011