ECO 4272: Introduction `a l’´econom´etrie Exercice 3
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2012, Steve Ambler Automne 2013
Veuillez ´ecrire lisiblement. Veuillez bien agraferles feuilles de votre tp en- semble avant de le remettre. Date de remise du tp : avant la fin du labo le 9 d´ecembre. Je vais afficher les solutions tout de suite apr`es la date de remise. Pour cette raison, les copies remises en retard ne seront pas accept´ees. Vous ˆetes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les coll`egues est sans doute la meilleure fac¸on d’apprendre. Par contre, le nombre maximal de noms sur chaque copie est 4, et vous devez produire les r´esultats et ´ecrire les r´eponses finales ind´ependamment par rapport aux autres ´equipes.
Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la premi`ere page.
En r´epondant `a toutes les questions du tp, expliquez ce que vous faites et montrez votre travail. Vous devriez fournir avec vos r´eponses un script en R, GRETL,STATAou dans le langage que vous avez utilis´e pour r´epondre aux ques- tions. Lorsque je vous demande de commenter ce que vous trouvez, vous pouvez inclure ces r´eponses sur une feuille `a part.
1
Exercice empirique
Pr´eambule
Je vous demande de travailler (comme pour le tp2) avec la base de donn´ees Hedonic venant de la libraryEcdat. Si la library n’est pas install´ee et si vous utilisezR, vous pouvez facilement l’installer en commenc¸ant l’exercice. Une courte description des variables dans la base de donn´ees Hedonicse retrouve dans le manuel du packageEcdat, disponible `a l’adresse suivante :
http://cran.r-project.org/web/packages/Ecdat/Ecdat.pdf
Une description encore plus d´etall´ee se retrouve dans l’article original, Harri- son et Rubinfeld (1978). Si vous utilisez un autre logiciel, je peux (sur demande) convertir les donn´ees dans un autre format qui va vous faciliter votre travail.
Exercice
1. Vous avez d´ej`a sorti des statistiques descriptives des donn´ees pour le tp2 (et des histogrammes). Sortez une matrice de corr´elations entre toutes les paires possibles de variables dans la base de donn´ees afin de d´eceler des probl`emes potentiels de multicollin´earit´e. Attention : certaines des s´eries dans la base de donn´ees ne sont pas en valeurs “num´eriques”. Par exemple, la variablechas(est-ce que le quartier est sur la rive de la rivi`ere Charles) peut prendre les valeurs “oui” ou “non”. Si vous utilisez la commande cor(Hedonic) R va sortir un message d’erreur (essayez cette com- mande pour voir). Il faudra utiliser cor(data.matrix(Hedonic)) afin d’´eviter ce probl`eme.
2. `A la lumi`ere des r´esultats de la sous-question pr´ec´edente, expliquez quelles sont les variables qui, potentiellement, pourraient mener `a des probl`emes de multicollin´earit´e imparfaite.
3. Estimez un mod`ele de r´egression lin´eaire avec comme variables explica- tives le nombre de pi`ecesrm, la distance normalis´ee vers les centres d’em- ploidis, et la variablerad, l’indice d’accessibilit´e aux autoroutes.
4. Testez la significativit´e de cette r´egression utilisant les matrices variance- covariance des param`etres estim´es non robuste et robuste.
2
5. Avec les mˆemes m´ethodes que dans le tp2, (r´egression avec les r´esidus au carr´e comme variable d´ependante et test Breusch-Pagan), testez l’hy- poth`ese nulle d’absence d’h´et´erosc´edasticit´e du terme d’erreur du mod`ele.
6. Ajoutez la variablenox, qui mesure la (mauvaise) qualit´e de l’air dans le quartier, au mod`ele. Testez sa significativit´e (m´ethodes non robuste et ro- buste). Commentez ce que vous trouvez. Qu’est-ce qui arrive au coefficient associ´e `a la variabledis? Pourquoi ? Essayez de donner une explication d´etaill´ee. `A partir de cette sous-question, gardez la variablenox comme variable explicative dans le mod`ele.
7. L’impact du nombre de pi`eces sur le prix pourraient ne pas ˆetre lin´eaire.
Essayez de d´etecter des non-lin´earit´es dans la r´eponse du prix au nombre de pi`eces. Justifiez votre d´ecision. Indice – il n’y a pas forc´ement une r´eponse non ambigu¨e `a cette question. Vous pourriez d´ecider d’ajouter des termes non lin´eaires dans la variablermau mod`ele. Notez que la variable rm, dont la valeur minimale dans la base de donn´ees est 12.68 et la valeur maximale es 77.09, est d´ej`a mesur´ee comme le carr´e du nombre moyen de pi`eces. Vous pourriez d´ecider de d´efinir une nouvelle variable ´egale au nombre moyen de pi`eces tout court.
8. L’impact du nombre de pi`eces sur le prix pourraient d´ependre de la proxi- mit´e `a la rivi`ere Charles (la variable chas). Estimez un autre mod`ele o`u vous ajoutez un terme d’interaction entre le nombre de pi`eces et la va- riableschas. Ce mod`ele pourrait ´eventuellement aussi contenir les termes non lin´eaires dansrm. Commentez les r´esultats. Indice – la variablechas est une variable qualitative qui prend les valeurs “yes” ou “non”. Essayez la commandeas.numeric(chas). Vous allez trouver que les r´eponses sont converties en (respectivement) 2 ou 1. Je sugg`ere de cr´eer une variable dichotomique avec la commande suivante :
chasn <- as.numeric(chas)-1.
Cette commande convertira les r´eponses en valeurs de 1 ou 0.
9. Avec votre sp´ecification pr´ef´er´ee pour comment la variablermaffecte le prix des maisons, utilisez les trois m´ethodes que nous avons vues en classe afin de pr´edire l’impact d’une augmentation du nombre moyen de pi`eces de 5 `a 6 (notez la remarque `a la fin de la sous-question 6 quermmesurele carr´edu nombre de pi`eces)
10. Question `a laquelle il n’y a pas forc´ement une r´eponse parfaite (ou unique) – trouvez votre sp´ecification pr´ef´er´ee d’un mod`ele pour expliquer le prix
3
des maisons. Justifiez votre choix sur la base du R2, du R¯2, de la signi- ficativit´e des coefficients, de probl`emes potentiels de non-convergence en probabilit´e des estimateurs `a cause de variables omises, etc.
R´ef´erence
Harrison, David et Daniel Rubinfeld (1978), “Hedonic Housing Prices and the De- mand for Clean Air.”Journal of Enviornomental Economics and Management 5, 81–102
cr´e´e le 23/11/2013
4