• Aucun résultat trouvé

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

N/A
N/A
Protected

Academic year: 2022

Partager "D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal"

Copied!
4
0
0

Texte intégral

(1)

ECO 4272: Introduction `a l’´econom´etrie Exercice 3

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal

c 2017, Steve Ambler Hiver 2017

Veuillez ´ecrire lisiblement. Veuillez bienagraferles feuilles de votre tp

ensemble avant de le remettre. Date de remise du tp : avant la fin du labo du 12 d´ecembre. Je vais afficher les solutions tout de suite apr`es la date de remise. Pour cette raison, les copies remises en retard ne seront pas accept´ees. Vous ˆetes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les coll`egues est sans doute la meilleure fac¸on d’apprendre. Par contre, le nombre maximal de noms sur chaque copie est 4, et vous devez produire les r´esultats et

´ecrire les r´eponses finales ind´ependamment par rapport aux autres ´equipes.

Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la premi`ere page.

En r´epondant `a toutes les questions du tp,expliquezce que vous faites et montrezvotre travail. Vous devriez fournir avec vos r´eponses un script enR, GRETL,STATAou dans le langage que vous avez utilis´e pour r´epondre aux questions. Lorsque je vous demande de commenter ce que vous trouvez, vous pouvez inclure ces r´eponses sur une feuille `a part.

1

(2)

Exercice empirique

Pr´eambule

Je vous demande de travailler avec la mˆeme base de donn´ees que pour le tp2, soit

CPS1985, d´ecrite en d´etail `a la page 25 du document suivant :

https://cran.r-project.org/web/packages/AER/AER.pdf.

Vous devez utiliser les mˆemes commandes pour les importer que pour le tp2, `a moins de les avoir sauvegard´e en formatR. D’abord, installer le packageAER.

Utilisez (enLinuxc’est mieux de le faire comme super-utilisateur ou root) : R> library("AER")

R> data(CPS1985) R> attach(CPS1985)

La derni`ere commande vous permet d’appeler les variables dans la base de donn´ees directement, sans faire r´ef´erence au nom de la base de donn´ees.

Si vous utilisez un autre logiciel, je peux (sur demande) convertir les donn´ees dans un autre format qui va vous faciliter votre travail.

Exercice

1. Vous avez d´ej`a sorti des statistiques descriptives des donn´ees pour le tp2.

Sortez une matrice de corr´elations entre toutes les paires possibles de variables dans la base de donn´ees (avec les quelques exceptions – voir plus loin) afin de d´eceler des probl`emes potentiels de multicollin´earit´e.

Indice : certaines des variables dans la base de donn´ees n’ont pas des valeurs num´eriques, ce qui est n´ecessaire pour calculer un coefficient de corr´elation. Dans ce cas-ci, l’op´eration n’est pas facile. On peut convertir une variable non num´erique en une variable num´erique avec la

commandeas.numeric(·), mais si on essaie de le faire `a l’ensemble de donn´ees au complet, on rec¸oit un message d’erreur, i.e.

as.numeric(CPS1985)ne fonctionne pas. Pour le faire, cr´eer une base de donn´ees num´eriques avec les commandes suivantes.

nregion <- as.numeric(region) ngender <- as.numeric(gender) nunion <- as.numeric(union) nmarried < as.numeric(married)

2

(3)

NCPS <- data.frame(wage, education, experience, age, nregion, ngender, nunion, nmarried)

Comme c¸a, vous cr´eez une nouvelle base de donn´ees avec des variables num´erique seulement, ce qui permet d’utiliser la commandecor(·) appliqu´ee `a la base de donn´ees enti`ere. Pour les variables qui prennent plus que deux valeurs (ethnicity,occupation,sector) je sugg`ere de ne pas convertir en valeurs num´eriques pour calculer des corr´elations. Est-ce que vous pouvez expliquer pourquoi ?

2. `A la lumi`ere des r´esultats de la sous-question pr´ec´edente, expliquez quelles sont les variables qui, potentiellement, pourraient mener `a des probl`emes de multicollin´earit´e imparfaite.

3. Estimez un mod`ele lin´eaire o`uoccupationest la seule variable explicative et o`ulog(wage)est la variable d´ependante. Sortez un graphique des r´esultats avec les commandesplot(·)

abline(·).Commentez ce que vous trouvez. (Le but de cette

sous-question est de vous apprendre ce que faitRen pr´esence de variables cat´egoriques qui ont plus que deux cat´egories possibles).

4. R´ep´etez l’exercice pr´ec´edent mais avecgendercomme la seule variable explicative. Commentez ce que vous trouvez.

5. Estimez un mod`ele de r´egression lin´eaire avec le salaire (log(wage)) comme variable d´ependante et comme variables explicatives l’´education (education), l’exp´erience (experience), l’ˆage (age), l’ethnicit´e (ethnicity), l’occupation (occupation) et le sexe (gender).

Sortez le r´esum´e des r´esultats avec la commandesummary(·).

Commentez ce que vous trouvez (R2, significativit´e des coefficients, significativit´e de la r´egression, etc.).

6. Utilisez la commandecoeftest(·)pour obtenir des r´esultats avec la matrice variance-covariance robuste. Commentez les diff´erences par rapport `asummary(·).

7. Avec les mˆemes m´ethodes que dans le tp2, (r´egression avec les r´esidus au carr´e comme variable d´ependante et test Breusch-Pagan), testez

l’hypoth`ese nulle d’absence d’h´et´erosc´edasticit´e du terme d’erreur du mod`ele.

8. Testez l’hypoth`ese nulle jointe de la non-significativit´e de l’occupation comme une influence importante sur le salaire. (Indice : la variable

3

(4)

occupationest une variable cat´egorique avec 6 cat´egories diff´erentes.

Rcr´ee automatiquement des variables dichotomiques et ´evite le prob1`eme de latrappe des variables dichotomiques. La

non-significativit´e de la variableoccupationrevient `a dire qu’il n’y a aucune h´et´erog´en´eit´e entre les occupations diff´erentes. Pour plus de d´etails voir la r´ef´erence `a Fox (2010).) Effectuez le test avec la matrice variance-covariance non robuste et avec la matrice variance-covariance robuste (utilisez la commandelinearHypothesis(·)du package car– voir les notes de cours pour un exemple d´etaill´e). Commentez ce que vous trouvez et commentez les diff´erences entre les r´esultats avec les deux fac¸ons d’effectuer le test.

9. Testez la mˆeme hypoth`ese que dans la sous-question pr´ec´edente, mais cette fois-ci en estimant la version contrainte du mod`ele et utilisant les deux formules ´etudi´ees en classe pour calculer la statistiqueF (celle qui utilise leR2et celle qui utilise la somme des r´esidus au carr´e).

Commentez ce que vous trouvez.

10. Calculez l’intervalle de confiance de 95% pour la diff´erence moyenne entre le log du salaire d’un travailleur dans le secteurofficeet d’un travailleur dans le secteurservices.

11. Maintenant, avec le mod`ele estim´e dans la sous-question (5), et o`u les r´esultats ont ´et´e sauvegard´es (par exemple) dans l’objetmodelname ex´ecutez la commandeplot(modelname,which=1:6).

Commentez bri`evement ce que vous trouvez. (Ceci est bas´e sur le dernier chapitre des notes de cours.) Je ne demande pas une r´eponse trop ´elabor´ee ici puisque nous allons ´etudier le sujet des tests diagnostics seulement lors du dernier cours.

R´ef´erence

Fox, John (2010), “Dummy-Variable Regression.”

http://socserv.socsci.mcmaster.ca/jfox/Courses/

SPIDA/dummy-regression-notes.pdf cr´e´e le 24/03/2017

4

Références

Documents relatifs

Notez que pour r´epondre `a cette partie vous allez devoir r´eestimer le mod`ele avec des variables explicatives additionnelles qui tiennent compte de l’interac- tion entre

J’ai accept´e aussi un mod`ele avec seulement des termes d’interac- tion (donc on laisserait tomber saf rica, asiae et laam comme variables explicatives et on garderait ce que

Ajoutez la variable school au mod`ele comme proxy pour s h , avec un terme d’interaction pour les pays de l’OCDE.. Le mod`ele maintenant ´equivaut au mod`ele de Solow avec l’ajout

Vous devriez fournir avec vos r´eponses un script en R, GRETL, STATA ou dans le langage que vous avez utilis´e pour r´epondre aux questions.. Lorsque je vous demande de commenter ce

Maintenant, testez la significativit´e jointe de ces deux variables ensemble, avec et sans ´ecarts types robustes.. Expliquez ce que

Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur de n) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero

Si vous jouez avec cette commande, vous allez constatez qu’elle produit des nombres positifs dont la majorit´e sont inf´erieurs `a 1 λ = 0.5.. Ceci refl`ete le fait que c’est

Pour le mod`ele de r´egression (avec mv comme variable d´ependante) que vous avez estim´e, effectuez le test Breusch-Pagan pour la pr´esence de l’h´et´erosc´edasticit´e avec