• Aucun résultat trouvé

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

N/A
N/A
Protected

Academic year: 2022

Partager "D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal"

Copied!
10
0
0

Texte intégral

(1)

ECO 4272: Introduction `a l’´econom´etrie Examen intra: R´eponses

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

c 2010, Steve Ambler Hiver 2011

1 Variances et covariances (10 points)

1. L’expression qu’il fallait ´ecrire est le ratio de la covariance

´echantillonnaleet du produit des ´ecarts types´echantillonnaux:

1 n−1

Pn

i=1(Y1i−Y¯1)(Y2i−Y¯2) q 1

n−1

Pn

i=1(Y1i−Y¯1)2q

1 n−1

Pn

i=1(Y2i−Y¯2)2

o`uY¯1etY¯2 sont les moyennes ´echantillonnales. Il ´etait tr`es important d’utiliser la covariance et les variances ´echantillonnales. J’ai ´et´e

relativement s´ev`ere si vous avez utilis´e des moments de la populations, par exemple des op´erateurs d’esp´erance, j’ai enlev´e des points. L’´enonc´e de la question dit clairementsur la base d’un ´echantillon denobservations. Il y a encore beaucoup de confusion entre moments dans la population et moments ´echantillonnaux.

2. La moyenne ´echantillonnale dea+bY1est tout simplementa+bY¯1o`uY¯1 est la moyenne ´echantillonnale deY1, et la moyenne ´echantillonnale de c+dY2estc+dY¯2. Nous avons

Corr(a+bY1, c+dY2)

(2)

=

1 n−1

Pn

i=1(a+bY1i−a−bY¯1)(c+dY2i −c−dY¯2) q 1

n−1

Pn

i=1(a+bY1i−a−bY¯1)2q

1 n−1

Pn

i=1(c+dY2i−c−dY¯2)2

=

1 n−1

Pn

i=1(bY1i−bY¯1)(dY2i−dY¯2) q 1

n−1

Pn

i=1(bY1i−bY¯1)2q

1 n−1

Pn

i=1(dY2i−dY¯2)2

=

1 n−1

Pn

i=1bd(Y1i−Y¯1)(Y2i −Y¯2) q 1

n−1

Pn

i=1b2(Y1i−Y¯1)2 q 1

n−1

Pn

i=1d2(Y2i−Y¯2)2

= bdn−11 Pn

i=1(Y1i−Y¯1)(Y2i−Y¯2) bdq

1 n−1

Pn

i=1(Y1i−Y¯1)2q

1 n−1

Pn

i=1(Y2i−Y¯2)2

=

Pn

i=1(Y1i−Y¯1)(Y2i−Y¯2) pPn

i=1(Y1i−Y¯1)2pPn

i=1(Y2i −Y¯2)2

≡Corr(Y1, Y2), ce qui fut `a d´emontrer.

2 Distributions de probabilit´e jointes (15 points)

1. Nous avons

E(Y) = 0×Pr(Y = 0) + 1×Pr(Y = 1)

= 0×0.046 + 1×0.954 = 0.954.

2. C’est la mˆeme chose que la probabilit´e d’ˆetre au chˆomage, soit 0.046.

3. Nous avons

E(Y|X = 1) = 0×Pr(Y = 0|X = 1) + 1×Pr(Y = 1|X = 1)

= 0× Pr(Y = 0, X = 1)

Pr(X = 1) + 1×Pr(Y = 1, X = 1) Pr(X = 1)

= 0×0.009

0.341 + 1× 0.332

0.341 = 0.332 0.341.

(3)

4. Nous avons

E(Y|X = 0) = 0×Pr(Y = 0|X = 0) + 1×Pr(Y = 1|X = 0)

= 0× Pr(Y = 0, X = 0)

Pr(X = 0) + 1×Pr(Y = 1, X = 0) Pr(X = 0)

= 0×0.037

0.659 + 1× 0.622

0.659 = 0.622 0.659. 5. Le taux de chˆomage des diplˆom´es est donn´e par

Pr(Y = 0|X = 1) = Pr(Y = 0, X = 1)

Pr(X = 1) = 0.009

0.341 <0.03.

Le taux de chˆomage des non diplˆom´es est donn´e par Pr(Y = 0|X = 0) = Pr(Y = 0, X = 0)

Pr(X = 0) = 0.037

0.659 >0.03.

6. Pour l’ind´ependance, il faut que

Pr(X =Xi, Y =Yj) = Pr(X =Xi)×Pr(Y =Yj) ∀i, j.

Il est toujours le cas que

Pr(X =Xi, Y =Yj) = Pr(Y =Yj|X =Xi)×Pr(X =Xj) ∀i, j, et donc il faut que

Pr(Y =Yj|X =Xi) = Pr(Y =Yj) ∀i, j.

Donc, une fac¸on simple de voir si les variables sont ind´ependantes serait de v´erifier si le taux de chˆomage est identique pour les diplˆom´es et les non diplˆom´es, ce qui ´evidemment n’est pas le cas ´etant donn´ee la r´eponse `a la partie pr´ec´edente. C’est possible aussi de r´epondre `a la question en v´erifiant directement la premi`ere ´egalit´e.

(4)

3 Estimateur de l’asym´etrie d’une variable al´eatoire (15 points)

1. La r´eponse est tr`es simple. Il s’agit encore de l’application d’une de nos r`egles de base. Nous avons

Var A˜Y

=Var 1 n−1

n

X

i=1

Yi−Y¯3

!

= 1

n−1 2 n

X

i=1

Var

Yi−Y¯3

= 1

n−1 2 n

X

i=1

σA2

= n

(n−1)2σ2A

La variance de la somme est la somme des variances puisque (par

hypoth`ese) les observations sont ind´ependantes. La variance de1/(n−1) fois la somme est1/(n−1)2 fois la variance de la somme.

2. Nous utilisons la statistique normalis´ee habituelle pour effectuer un test d’hypoth`ese simple, `a savoir la valeur calcul´ee de la statistique moins sa valeur sous l’hypoth`ese nulle, divis´ee par la racine carr´ee d’un estimateur convergent de la variance de la statistique calcul´ee. De cette fac¸on, comme d’habitude, on a une statistique normalis´ee dont la moyenne est z´ero si l’hypoth`ese nulle est vraie et dont la variance est unitaire. L’hypoth`ese nulle est que la distribution estsym´etrique. Pour n’importe quelle distribution sym´etrique, la valeur de la mesure de l’asym´etrie estz´ero.

J’´etais assez surpris par le nombre d’´el`eves qui n’ont pas compris ce principe simple. L’estimateur convergent de la variance de la statistique est

n

(n−1)2s2A,

puisque par hypoth`eses2Aest un estimateur convergent deσA2. Donc la statistique pour effectuer le test serait

Y −0 q .

(5)

3. Dans l’´enonc´e, on ne dit pas quelle est la distribution qui g´en`ereY (j’ai mˆeme ´ecritexplicitementqueY provenait d’une distribution inconnue).

Pour cette raison, la statistique, qui est la somme de fonctions non lin´eaires de variables al´eatoires provenant d’une distribution inconnue doit suivre une loi qui estinconnue. J’essaie d’insister sur ce principe depuis le d´ebut du trimestre. Une statistique est une fonction des observations, donc des valeurs r´ealis´ees d’une ou de plusieurs variables al´eatoires. Si nous ne connaissons pas la loi exacte qui g´en`ere la ou les variables al´eatoires,en

´echantillon fininous ne pouvons connaˆıtre `a quelle loi ob´eit la statistique.

D’o`u l’int´erˆet, si nous avons assez d’observations, d’utiliser une version du th´eor`eme de la limite centrale et de construire des statistiques qui vont se comporter (approximativement) comme si elles ob´eissent `a une loi normale centr´ee r´eduite.

4. Par hypoth`ese on a des observations ind´ependantes. La statistique propos´ee est la moyenne d’observations ind´ependantes d’une variable al´eatoire. Par hypoth`ese la variance de chaque terme de la sommation est constante. En principe, en grand ´echantillon la statistique devrait suivre

approximativementune loi normale centr´ee r´eduite.

5. C’est une version du th´eor`eme de la limite centrale.

4 R´egression simple, tests d’hypoth`ese et intervalles de confiance (40 points)

1. Le coefficient donne l’impact d’une variation du prix par citation sur le nombre d’abonnements. Puisque les deux variables sont mesur´ees en logs, l’impact a l’interpr´etation d’une ´elasticit´e (variation proportionnelle dans le nombre d’abonnements r´esultant d’une variation proportionnelle donn´ee dans le prix par citation). Ce n’´etait pas n´ecessaire d’utiliser ce terme pour avoir tous les points. Plusieurs ´etudiants ont ´ecrit que cela mesurait le nombre moyen d’abonnements, ce qui n’est clairement pas le cas.

2. Il fallait utiliser l’identit´e suivante, sur laquelle on a pass´e beaucoup de temps au cours :

T SS =ESS+SSR= 125.9 + 100.1 = 226.0.

(6)

3. Deux fac¸ons ´equivalentes de le calculer : R2 = ESS

T SS = 1− SSR

T SS = 125.9 226.0. 4. La r´eponse est

rSSR n−2.

5. L’hypoth`ese nulle est que la variable n’est pas significative, ce qui veut dire qu’elle n’aide pas `a expliquer les variations dans le nombre

d’abonnements, ce qui veut dire que sa valeur estz´ero. J’ai insist´e `a plusieurs reprises en classe quetest de significativit´esignifiait un test de l’hypoth`ese nulleHo: ˆβ1 = 0. La statistique est

t =

βˆ1−0 sβˆ

1

= −0.5331−0 0.0356 , o`usβˆ

1 est la racine carr´ee d’un estimateur convergent de la variance deβˆ1. Sa valeur vous ´etait donn´ee.

6. Un test de significativit´e est toujours bilat´eral (l’hypoth`ese alternative ´etant que la variable en question aide `a expliquer les variations de la variable d´ependante, peu importe le signe). La p-value est donn´ee par

p-value = 2Φ

−0.5331 0.0356

.

On suppose que le nombre d’observations est suffisamment ´elev´e pour que la statistique utilis´ee suive approximativement une loi normale centr´ee r´eduite.

7. La valeur absolue de la statistique d´epasse 10. Il ne fallait pas se souvenir du chiffre exact de 1.96 pour savoir qu’on est tr`es tr`es tr`es loin de la moyenne de la statistique si l’hypoth`ese nulle tient (z´ero). On va rejeter `a 5%. On va rejeter `a 1%. On va probablement rejeter `a 0.0001% (je n’ai pas v´erifi´e).

8. Il s’agit maintenant d’une hypoth`ese avec une alternative unilat´erale, mais la forme de la statistique ne change pas :

(7)

= −0.5331−(−0.5)

0.0356 = −0.0331 0.0356 .

9. On va rejeter si la surface `a gauchede la valeur calcul´ee est suffisamment petite. On a

p-value= Φ

−0.0331 0.0356

.

Je remarque en passant (je ne vous l’ai pas demand´e) qu’en valeur absolue la statistique est inf´erieure `a 1, donc on ne rejette ni `a 5% ni `a 10%.

10. On a

X

100 =Pr −z ≤ βˆ1−β1 ˆ σβˆ

1

≤z

!

=Pr

−zσˆβˆ

1

βˆ1−β1

≤zσˆβˆ

1

=Pr

−zσˆβˆ1

β1−βˆ1

≤zσˆβˆ1

=Pr

βˆ1−zσˆβˆ

1 ≤β1 ≤βˆ1+zˆσβˆ

1

=Pr(−0.5331−z0.0356≤β1 ≤ −0.5331 +z0.0356). L’intervalle de confiance est

−0.5331±z×0.0356 =−0.5331±1.96×0.0356.

Evidemment, il n’´etait pas n´ecessaire de savoir que dans ce cas´ z = 1.96 pour avoir tous les points.

5 R´egression simple : estimateurs non biais´es (20 points)

1. L’estimateur MCO est donn´e par le ratio de la covariance ´echantillonnale entreY etXsur la variance ´echantillonnale deX. L’estimateur propos´e n’est ´evidemment pas l’estimateur MCO. Il ne minimise pas donc la somme des erreurs au carr´ePn

i=1(Yi−β0−β1Xi)2.

(8)

2. Nous avons

β˜1 =

n

X

i=2

Yi−Yi−1

Xi−Xi−1

=−Y1 1

X2−X1 +Y2

1

X2−X1 − 1 X3−X2

+Y3

1 X3−X2

− 1 X4−X3

+. . . +Yn−1

1 Xn−1 −Xn−2

− 1

Xn−Xn−1

+Yn 1 Xn−Xn−1

,

ce qui est clairement une fonction lin´eaire desYi. J’ai pos´e cette question pour renforcer la notion d’unestimateur lin´eaire lorsqu’on parle d’un estimateurBLUE.

3. Nous avons

n

X

i=2

Yi−Yi−1

Xi−Xi−1

=

n

X

i=2

β01Xi+ui−β0−β1Xi−1−ui−1

Xi−Xi−1

=

n

X

i=2

β1(Xi−Xi−1) +ui−ui−1

Xi−Xi−1

1

n

X

i=2

(Xi−Xi−1) (Xi−Xi−1) +

n

X

i=2

ui−ui−1

Xi−Xi−1.

= (n−1)β1+

n

X

i=2

ui−ui−1

Xi−Xi−1

.

A ce stade-ci, j’ai une confession `a faire. J’ai ´ecrit l’estimateur avec` l’intention de revenir en arri`ere et le multiplier par une fraction qui allait faire en sorte qu’il soit non biais´e. ´Evidemment, la fraction en question est

1

n−1 et, ´evidemment, j’ai oubli´e de l’´ecrire. J’ai donn´e tous les points `a

(9)

ceux qui ont suivi la bonne d´emarche jusqu’`a l’avant-derni`ere ligne ci-dessus. Si on a

β˜1 = 1 n−1

n

X

i=2

Yi−Yi−1

Xi−Xi−1

ceci nous donne

β˜11+ 1 n−1

n

X

i=2

ui−ui−1

Xi−Xi−1

.

Appliquant l’op´erateur d’esp´erance, on a E

β˜1

1+E 1 n−1

n

X

i=2

ui−ui−1

Xi−Xi−1

!

1+E 1 n−1

n

X

i=2

E(ui|Xi)−E(ui−1|Xi−1) Xi−Xi−1

!

= 0.

Dans l’avant-derni`ere ligne, j’utilise la loi des esp´erances it´er´ees.

4. L’estimateur est non bais´e, mˆeme en ´echantillon fini. Sa variance est donn´ee par

Var β˜1

=

Var 1

n−1

n

X

i=2

ui−ui−1

Xi−Xi−1

!

= 1

n−1 2

Var

n

X

i=2

ui−ui−1

Xi−Xi−1 !

.

Sans faire d’argument formel, on constate que la variance de la somme augmente de fac¸on lin´eaire enn, mais elle est divis´ee par un terme qui augmente proportionellement avecn2. Donc, la variance devrait tendre vers 0 lorsquentend vers l’infini. L’absence de biais et une variance qui tend vers 0 ne sont pas tout `a fait suffisants pour la convergence. On peut trouver des exceptions, mais des exceptions qui sont assez tordues. Donc, on peut avoir confiance que l’estimateur est convergent.

(10)

5. Nous savons qu’en pr´esence d’homosc´edasticit´e (et avec une variance finie des erreurs), l’estimateur MCO est plus efficient. Il fallait ´ecrire pouquoi (erreurs homosc´edastiques) l’estimateur MCO est le plus efficient dans ce cas.

cr´e´e le : 09/03/2011

Références

Documents relatifs

Notez que pour r´epondre `a cette partie vous allez devoir r´eestimer le mod`ele avec des variables explicatives additionnelles qui tiennent compte de l’interac- tion entre

J’ai accept´e aussi un mod`ele avec seulement des termes d’interac- tion (donc on laisserait tomber saf rica, asiae et laam comme variables explicatives et on garderait ce que

Ajoutez la variable school au mod`ele comme proxy pour s h , avec un terme d’interaction pour les pays de l’OCDE.. Le mod`ele maintenant ´equivaut au mod`ele de Solow avec l’ajout

Vous devriez fournir avec vos r´eponses un script en R, GRETL, STATA ou dans le langage que vous avez utilis´e pour r´epondre aux questions.. Lorsque je vous demande de commenter ce

Maintenant, testez la significativit´e jointe de ces deux variables ensemble, avec et sans ´ecarts types robustes.. Expliquez ce que

Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur de n) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero

Si vous jouez avec cette commande, vous allez constatez qu’elle produit des nombres positifs dont la majorit´e sont inf´erieurs `a 1 λ = 0.5.. Ceci refl`ete le fait que c’est

Pour le mod`ele de r´egression (avec mv comme variable d´ependante) que vous avez estim´e, effectuez le test Breusch-Pagan pour la pr´esence de l’h´et´erosc´edasticit´e avec