ECO 4272: Introduction `a l’´econom´etrie Exercice 3: R´eponses
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2013, Steve Ambler Automne 2013
Exercice empirique
Exercice
1. Voir le script. Il y a peu de corr´elations sup´erieures `a 0.5 en valeur absolue : Corr(nox,indus) = 0.7347,
Corr(dis,indus) =−0.7613, Corr(dis,nox) =−0.7922, Corr(dis,age) =−0.7782, Corr(tax,rad) = 0.8505, Corr(townid,tax) = 0.7079.
2. Ces corr´elations indiquenet un probl`eme potentiel de multicollin´earit´e im- parfaite. La corr´elation maximale en valeur absolue est 0.85, ce qui n’est pas assez ´elev´ee pour provoquer de grandes erreurs num´eriques.
3. Voir le script.
1
4. Voir le script. La statistiqueF dans le cas non robuste est fournie automati- quement par la commandesummary(mod1). Elle est ´egale `a 187.2. Pour tester la significativit´e avec la matrice variance-covariance robuste, il faut utiliser la commande linearHypothesis(·), puisque la commande coeftest(·)donne seulement les ´ecarts types robustes des coefficients individuels. La statistique F est ´egale `a 100.0 avec la matrice variance- covariance robuste. Dans les deux cas, on rejette l’hypoth`ese nulle (coeffi- cients ´egaux `a z´ero) `a tous les taux conventionnels.
5. Voir le script. En invoquant la commandebptest(mod1), la statistique calcul´ee est ´egale `a 77.45. La statistique F pour la significativit´e des va- riables dans la r´egression auxiliaire est ´egale `a 30.24. La diff´erence peut ˆetre due au fait que l’option par d´efaut de la commande bptest(·)est d’utiliser les r´esidus normalis´es (voir le dernier chapitre des notes).
6. Voir le script. La variabledisn’est plus significative selon un testt. L’ex- plication probable est le fait d’ajouter une autre variable qui est fortement corr´el´ee avec elle (nox). Selon la section 2.1 des notes de cours sur le mod`ele de r´egression multiple, le signe du bias lorsque la variablenoxest omise du mod`ele doit ˆetre ´egal au signe du coefficient sur la variablenox (qui est n´egatif) fois le signe de la corr´elation entre nox etdis, qui est n´egatif. Donc, le biais est positif, et la valeur estim´ee du coefficient devrait baisser apr`es l’ajout de la variablenox. Ceci est le cas. La valeur estim´ee passe de 0.10496 `a -0.02367.
7. Voir le script. Le test RESET semble indiquer que la relation lin´eaire est mal sp´ecifi´ee. On a vu la versionresettest(mod3,type=¨fitted¨) en classe. Les deux autres variations sur le test indiquent un probl1`eme aussi (vous n’´etiez pas cens´es connaˆıtre ces formes du test). La commande avPlots(mod3) sort des graphiques qui ne sont pas tr`es concluants.
L’impact de la variable rmsemble diminuer lorsque sa valeur augmente, mais lorsqu’on ajoutermau carr´e au mod`ele, le coefficient estim´e surrm2 est positif est significatif, et le coefficient estim´e sur rm devient n´egatif et non significatif. Notez qu’il n’y a pas une seule bonne r´eponse `a cette question. Je m’attendais `a ce que vous utilisiez des m´ethodes informelles (surtout graphiques) pour essayer de d´etecter des non-lin´earit´es). Il y a une non-lin´earit´e, mais la source du probl`eme n’est pas facile `a rep´erer.
8. Voir le script. Je vous donne deux m´ethodes pour inclure le terme d’inter- action. La deuxi`eme m´ethode d´emontre queRest capable de tenir compte
2
automatiquement de l’interaction entre une variable qualitative (dichoto- mique) et une variable continue.
9. Voici les trois m´ethodes. D’abord, ´ecrivons le mod`ele comme mvi =β0+β1rmi+β2rm2i+β3disi+β4radi
+β5noxi+β6chasi+β7chasi×rmi+ui.
Tel qu’indiqu´e dans le questionnaire,rmest mesur´ee d´ej`a dans le carr´e du nombre de pi`eces. Donc, une augmentation de 5 `a 6 pi`eces ´equivaut `a une augmentation dermde 25 `a 36, ce qui implique que (dans la notation des notes de cours) ∆rm = 11. Nous avons aussi par une approximation de Taylor autour du point initialrm1 = 25que
rm22 ≈rm21+ 2×rm1×∆rm
De cette fac¸on, nous obtenons
⇒ rm22−rm21
≈2×rm1×∆rm.
L’impact d’une augmentation du nombre de pi`eces devient
∆mv
∆rm ≈βˆ1+ ˆβ2×2×25 +β7×chas1.
Notez que la pr´ediction de l’impact d’une augmentation du nombre de pi`eces de 5 `a 6 d´epend de la proximit´e de la maison vis `a vis la rivi`ere Charles. Donc, il y a en principe deux calculs diff´erents `a faire. J’illustre ici le cas g´en´eral. Il faut substituer la bonne valeur initial dechas(soit 0 soit 1). Nous pouvons ´ecrire l’impact comme
∆mv
∆rm =δ0βˆ o`u
δ=
0 1 50 0 0 0 0 chas1 0 .
Il est possible de calculer ceci dans R en cr´eant le vecteur de constantes appropri´e et utilisant la commande coefficients(·), o`u l’argument est le nom du mod`ele estim´e. Il est aussi possible de le calculer l’impact `a la mitaine.
3
(a) La premi`ere passe par une utilisation de la matrice variance-covariance.
Tel qu’on voit dans les notes de cours, Var
δ0βˆ
=δ0Σˆβˆδ,
et donc l’´ecart type est la racine carr´e de ceci. Voir le script.
(b) La deuxi`eme implique l’estimation d’un mod`ele ´equivalent. Dans le cas o`u on ´evalue l’impact sur le prix d’une maison sur la rive de la rivi`ere Charles (chas1 = 1), nous avons
mvi =β0+ (β1+ 50β2 +β7×chas1)rmi+β2 rm2i−50rmi
+β3disi+β4radi+β5noxi+β6chasi +β7(chasi×rmi−chas1rmi) +ui.
Nous avons ajout´e et soustrait les mˆemes termes. Il y a deux nouvelles variables `a d´efinir dans le cas o`uchas1 = 1. Dans le cas o`uchas1 = 0, il y a seulement une nouvelle variable `a d´efinir. Maintenant, l’´ecart type associ´e au coefficient estim´e de la variablermnous donne ´l’´ecart type voulu. Voir le script.
(c) La troisi`eme m´ethode passe par le test de l’hypoth`ese nulle appropri´ee.
On peut l’´ecrire
H0 :β1+ 50β2+chas1β7 = 0 ou
0 1 50 0 0 0 0 chas1 βˆ= 0.
Encore une fois, l’hypoth`ese nulle `a tester d´epend de la valeur initiale dechas.
Nous avons donc
∆mv= ∆rmδ0βˆ±z ∆rmσˆδ0βˆ
o`uσˆδ0βˆest l’´ecart type deδ0βˆcalcul´e par une des trois m´ethodes.
10. Il n’y a vraiment pas de bonne r´eponse ici. `A vous de donner vos arguments pour votre mod`ele pr´ef´er´e.
cr´e´e le 09/12/2013
4