ECO 4272: Introduction `a l’´econom´etrie Exercice 3
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2016, Steve Ambler Automne 2016
Veuillez ´ecrire lisiblement. Veuillez bienagraferles feuilles de votre tp ensemble avant de le remettre. Date de remise du tp : avant la fin du labo du 8 d´ecembre. Je vais afficher les solutions tout de suite apr`es la date de remise. Pour cette raison, les copies remises en retard ne seront pas accept´ees. Vous ˆetes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les coll`egues est sans doute la meilleure fac¸on d’apprendre. Par contre, le nombre maximal de noms sur chaque copie est 4, et vous devez produire les r´esultats et
´ecrire les r´eponses finales ind´ependamment par rapport aux autres ´equipes.
Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la premi`ere page.
En r´epondant `a toutes les questions du tp,expliquezce que vous faites et montrezvotre travail. Vous devriez fournir avec vos r´eponses un script enR, GRETL,STATAou dans le langage que vous avez utilis´e pour r´epondre aux questions. Lorsque je vous demande de commenter ce que vous trouvez, vous pouvez inclure ces r´eponses sur une feuille `a part.
1
Exercice empirique
Pr´eambule
Je vous demande de travailler (comme c’´etait le cas pour le tp2) avec la base de donn´eesceosal1.dtasur les salaires de cadres d’entreprises provenant du manuel de Wooldridge. En principe, vous avez t´el´echarg´e les donn´ees pour r´epondre aux questions du tp2. Sinon, je vous rappelle que la base de donn´ees est disponible sur mon site. Utilisez les commandes suivantes pour t´el´echarger les donn´ees.
library(foreign) ceosal <-
read.dta("http://steveambler.uqam.ca/4272/tps/ceosal1.dta") Evidemment, vous n’ˆetes pas oblg´es d’utiliser le nom´ ceosal. Je vous
rappelle qu’une description des donn´ees dans la base de donn´ees est disponible `a l’adresse suivante :
http://fmwww.bc.edu/ec-p/data/wooldridge/ceosal1.des Vous pouvez aussi obtenir une description des donn´ees avec la commande attributes(ceosal).
Exercice
1. Vous avez d´ej`a sorti des statistiques descriptives des donn´ees pour le tp2.
Sortez une matrice de corr´elations entre toutes les paires possibles de variables dans la base de donn´ees afin de d´eceler des probl`emes potentiels de multicollin´earit´e.
2. `A la lumi`ere des r´esultats de la sous-question pr´ec´edente, expliquez quelles sont les variables qui, potentiellement, pourraient mener `a des probl`emes de multicollin´earit´e imparfaite.
3. Les variablesindus,finance,consprodetutilitysont des variablesbinairesoudichotomiquesqui prennent la valeur 1 si le cadre travaille dans le secteur et z´ero sinon. On ne sp´ecifie pas dans la
description des donn´ees s’il y a plus de quatre secteurs dans la base de donn´ees. Calculez et faites imprimer la somme des quatre s´eries.
Expliquez ce que vous trouvez. Est-ce que les quatre s´eries peuvent ˆetre 2
utilis´ees (avec une constante) comme variables explicatives dans un mod`ele de r´egression ? Expliquez. Pour plus de renseignements sur les variables dichotomiques voir le manuel, les notes de cours, ou l’article de Fox (2010) (voir la r´ef´erence ci-dessous).
4. Estimez un mod`ele de r´egression lin´eaire avec le salaire (salary) comme variable d´ependante et comme variables explicatives le taux de rendement sur les ´equit´es (roe), le taux de rendement sur les actions (ros) le log des ventes (lsales), et les secteurs (`a vous de choisir parmi les 4 variables sectorielles `a la lumi`ere de votre r´eponses `a la sous-question pr´ec´edente).
5. Avec le mod`ele estim´e, utilisez la commandesummarypour obtenir un r´esum´e des r´esultats et la commandecoeftest(·)pour obtenir des r´esultats avec la matrice variance-covariance robuste. Commentez les diff´erences. (Commentez ce que vous trouvez –R2, significativit´e des coefficients individuels, significativit´e de la r´egression, diff´erences entre
´ecarts types non robustes et robustes, etc).
6. Testez la significativit´e de la r´egression, utilisant la matrice variance-covariance robuste et aussi utilisant la matrice
variance-covariance non robuste. Y a-t-il une fac¸on simple de tester la significativit´e de la r´egression de fac¸on non robuste ? Expliquez.
Commentez la diff´erence entre les deux versions du test.
7. Avec les mˆemes m´ethodes que dans le tp2, (r´egression avec les r´esidus au carr´e comme variable d´ependante et test Breusch-Pagan), testez
l’hypoth`ese nulle d’absence d’h´et´erosc´edasticit´e du terme d’erreur du mod`ele.
8. Testez l’hypoth`ese nulle jointe de la non-significativit´e des secteurs comme une influence importante sur le salaire des cadre d’entreprises.
Effectuez le test avec la matrice variance-covariance non robuste et avec la matrice variance-covariance robuste (pour le dernier, utilisez la commandelinearHypothesis(·)du packagecar– voir les notes de cours pour un exemple d´etaill´e). Commentez ce que vous trouvez et commentez les diff´erences entre les r´esultats avec les deux fac¸ons d’effectuer le test.
9. Testez la mˆeme hypoth`ese que dans la sous-question pr´ec´edente, mais cette fois-ci en estimant la version contrainte du mod`ele et utilisant les deux formules ´etudi´ees en classe pour calculer la statistiqueF.
Commentez ce que vous trouvez.
3
10. Comparez les r´esultats de tester la significativit´e des secteurs lorsque vous estimez le mod`ele avecindus,finance,consprodparmi les variables explicatives et lorsque vous estimez le mod`ele avecindus, finance, etutilityparmi les variables explicatives. Comparez aussi les coefficients estim´es et lesR2 des deux mod`eles. Expliquez ce que vous trouvez. Expliquez ce que cela veut dire pour
11. Calculez l’intervalle de confiance de 95% pour la diff´erence moyenne entre le salaire d’un cadre dans le secteur textttindus et le salaire d’un cadre dans le secteurfinance. Utilisez la matrice variance-covariance robuste. (Indice – par rapport `a une diff´erence entre deux moyennes de deux ´echantillons al´eatoires diff´erents et ind´ependants, il faut tenir compte ici de la covariance entre les estim´es des deux coefficients
associ´es `aindusetfinance. Calculez une expression pour la variance de la diff´erence. Vous allez devoir utilisez la commande
vcovHC(nomdumod`eleestim´e)provenant du package sandwich.)
12. Question avec plus d’une r´eponse possible. Trouvez votre
sp´ecification pr´ef´er´ee du mod`ele (autrement dit, votre choix pr´ef´er´e de variables explicatives). Justifiez votre choix en ´ecrivant quelques paragraphes qui justifient l’inclusion ou l’exclusion des variables dans la base de donn´ees. Vous pouvez d´ecider d’utiliser soitsalarysoit lsalarycomme variable d´ependante et d’utiliser la ou les
transformation(s) des variables explicatives (logs, polynˆomes, etc.) que vous voulez dans la mesure ou vous justifiez la ou les transformation(s).
R´ef´erence
Fox, John (2010), “Dummy-Variable Regression.”
http://socserv.socsci.mcmaster.ca/jfox/Courses/
SPIDA/dummy-regression-notes.pdf cr´e´e le 19/11/2016
4