Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

(1)

ECO 4272: Introduction à l’économétrie Exercice 3: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2013, Steve Ambler Automne 2013

Exercice empirique

Exercice

1. Voir le script. Il y a peu de corrélations supérieures à 0.5 en valeur absolue : Corr(nox,indus) = 0.7347,

Corr(dis,indus) =−0.7613, Corr(dis,nox) =−0.7922, Corr(dis,age) =−0.7782, Corr(tax,rad) = 0.8505, Corr(townid,tax) = 0.7079.

2. Ces corrélations indiquenet un problème potentiel de multicollinéarité im- parfaite. La corrélation maximale en valeur absolue est 0.85, ce qui n’est pas assez élevée pour provoquer de grandes erreurs numériques.

3. Voir le script.

1

(2)

4. Voir le script. La statistiqueF dans le cas non robuste est fournie automatiquement par la commandesummary(mod1). Elle est égale à 187.2. Pour tester la significativité avec la matrice variance-covariance robuste, il faut utiliser la commande linearHypothesis(·), puisque la commande coeftest(·)donne seulement les écarts types robustes des coefficients individuels. La statistique F est égale à 100.0 avec la matrice variance- covariance robuste. Dans les deux cas, on rejette l’hypothèse nulle (coefficients égaux à zéro) à tous les taux conventionnels.

5. Voir le script. En invoquant la commandebptest(mod1), la statistique calculée est égale à 77.45. La statistique F pour la significativité des variables dans la régression auxiliaire est égale à 30.24. La différence peut être due au fait que l’option par défaut de la commande bptest(·)est d’utiliser les résidus normalisés (voir le dernier chapitre des notes).

6. Voir le script. La variabledisn’est plus significative selon un testt. L’ex- plication probable est le fait d’ajouter une autre variable qui est fortement corrélée avec elle (nox). Selon la section 2.1 des notes de cours sur le modèle de régression multiple, le signe du bias lorsque la variablenoxest omise du modèle doit être égal au signe du coefficient sur la variablenox (qui est négatif) fois le signe de la corrélation entre nox etdis, qui est négatif. Donc, le biais est positif, et la valeur estimée du coefficient devrait baisser après l’ajout de la variablenox. Ceci est le cas. La valeur estimée passe de 0.10496 à -0.02367.

7. Voir le script. Le test RESET semble indiquer que la relation linéaire est mal spécifiée. On a vu la versionresettest(mod3,type=¨fitted¨) en classe. Les deux autres variations sur le test indiquent un probl1ème aussi (vous n’étiez pas censés connaˆıtre ces formes du test). La commande avPlots(mod3) sort des graphiques qui ne sont pas très concluants.

L’impact de la variable rmsemble diminuer lorsque sa valeur augmente, mais lorsqu’on ajoutermau carré au modèle, le coefficient estimé surrm² est positif est significatif, et le coefficient estimé sur rm devient négatif et non significatif. Notez qu’il n’y a pas une seule bonne réponse à cette question. Je m’attendais à ce que vous utilisiez des méthodes informelles (surtout graphiques) pour essayer de détecter des non-linéarités). Il y a une non-linéarité, mais la source du problème n’est pas facile à repérer.

8. Voir le script. Je vous donne deux méthodes pour inclure le terme d’interaction. La deuxième méthode démontre queRest capable de tenir compte

2

(3)

automatiquement de l’interaction entre une variable qualitative (dichoto- mique) et une variable continue.

9. Voici les trois méthodes. D’abord, écrivons le modèle comme mv_i =β0+β1rm_i+β2rm²_i+β3dis_i+β4rad_i

+β₅nox_i+β₆chas_i+β₇chas_i×rm_i+u_i.

Tel qu’indiqué dans le questionnaire,rmest mesurée déjà dans le carré du nombre de pièces. Donc, une augmentation de 5 à 6 pièces équivaut à une augmentation dermde 25 à 36, ce qui implique que (dans la notation des notes de cours) ∆rm = 11. Nous avons aussi par une approximation de Taylor autour du point initialrm₁ = 25que

rm²₂ ≈rm²₁+ 2×rm₁×∆rm

De cette fac¸on, nous obtenons

⇒ rm²₂−rm²₁

≈2×rm₁×∆rm.

L’impact d’une augmentation du nombre de pi`eces devient

∆mv

∆rm ≈βˆ₁+ ˆβ₂×2×25 +β₇×chas₁.

Notez que la prédiction de l’impact d’une augmentation du nombre de pièces de 5 à 6 dépend de la proximité de la maison vis à vis la rivière Charles. Donc, il y a en principe deux calculs différents à faire. J’illustre ici le cas général. Il faut substituer la bonne valeur initial dechas(soit 0 soit 1). Nous pouvons écrire l’impact comme

∆mv

∆rm =δ⁰βˆ o`u

δ=

0 1 50 0 0 0 0 chas₁ ⁰ .

Il est possible de calculer ceci dans R en créant le vecteur de constantes approprié et utilisant la commande coefficients(·), où l’argument est le nom du modèle estimé. Il est aussi possible de le calculer l’impact à la mitaine.

3

(4)

(a) La premi`ere passe par une utilisation de la matrice variance-covariance.

Tel qu’on voit dans les notes de cours, Var

δ⁰βˆ

=δ⁰Σˆβˆδ,

et donc l’´ecart type est la racine carr´e de ceci. Voir le script.

(b) La deuxième implique l’estimation d’un modèle équivalent. Dans le cas où on évalue l’impact sur le prix d’une maison sur la rive de la rivière Charles (chas₁ = 1), nous avons

mv_i =β0+ (β1+ 50β2 +β7×chas₁)rm_i+β2 rm²_i−50rmi

+β₃dis_i+β₄rad_i+β₅nox_i+β₆chas_i +β₇(chas_i×rm_i−chas₁rm_i) +u_i.

Nous avons ajouté et soustrait les mêmes termes. Il y a deux nouvelles variables à définir dans le cas oùchas₁ = 1. Dans le cas oùchas₁ = 0, il y a seulement une nouvelle variable à définir. Maintenant, l’écart type associé au coefficient estimé de la variablermnous donne ´l’écart type voulu. Voir le script.

(c) La troisième méthode passe par le test de l’hypothèse nulle appropriée.

On peut l’´ecrire

H₀ :β₁+ 50β₂+chas₁β₇ = 0 ou

0 1 50 0 0 0 0 chas₁ βˆ= 0.

Encore une fois, l’hypothèse nulle à tester dépend de la valeur initiale dechas.

Nous avons donc

∆mv= ∆rmδ⁰βˆ±z ∆rmσˆ_δ0βˆ

oùσˆ_δ0βêst l’écart type deδ⁰βˆcalculé par une des trois méthodes.

10. Il n’y a vraiment pas de bonne réponse ici. À vous de donner vos arguments pour votre modèle préféré.

cr´e´e le 09/12/2013

4