ECO 4272 : Introduction ` a l’´ Econom´ etrie Notes sur les mod` eles de r´ egression non lin´ eaires
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion´ Universit´e du Qu´ebec `a Montr´eal
2018: Steve Amblerc
Hiver 2018
Introduction
I But : pr´esenter quelques strat´egies g´en´erales pour sp´ecifier et estimer des mod`eles ´econom´etriques non lin´eaires.
I Mod`eles non lin´eaires dans lesvariables, non les mod`eles non lin´eaires dans lesparam`etres.
I But secondaire : r´eviser un certain nombre de concepts.
1. Calcul d’intervalles de confiance pour des pr´edictions de changement.
2. Calcul de variances de combinaisons lin´eaires de variables al´eatoires.
3. Estimation d’une version ´equivalente d’un mod`ele.
4. Tests d’hypoth`ese et relation entre statistiquesF ett.
Non-lin´ earit´ es : param` etres versus variables
I Mod`ele de r´egression multiple g´en´eral : Yi =F(Xi , β) +ui
I Le terme d’erreur est additif.
Non-lin´ earit´ es dans les variables seulement
I Pour βj , j = 0,1, . . .k nous avons
∂Yi
∂βj =G(Xi).
I Les d´eriv´ees partielles ne d´ependent pas des param`etres.
I Nous pouvons r´e´ecrire le mod`ele sous la forme Y =Xβ+U
avec une red´efinition appropri´ee des variables dans la matrice X.
Non-lin´ earit´ es : param` etres
I Pour au moins un param`etreβj , i = 0,1, . . .k nous avons
∂Yi
∂βj = ˜G(Xi, β).
I Le mod`ele est non lin´eaire dans les param`etres.
MCNL
I Il est toujours possible de d´efinir le probl`eme min
β n
X
i=1
ui2 =
n
X
i=1
(Yi−F(Xi , β))2
I Un ordinateur avec un algorithme sophistiqu´e peut r´esoudre ce probl`eme.
I Il est possible aussi de calculer (au moins approximativement) une solution num´erique pour
E
βˆ−β βˆ−β0
.
I Etudier comment et pourquoi ce genre d’approximation´ fonctionne d´epasse le cadre de ce cours.
Exemple
I Fonction de production CES :
Yi = (θNiγ+ (1−θ)Kiγ)(1/γ)+ui.
I Les param`etres sontθ et γ.
I Il n’y a pas de transformation de ce mod`ele qui donne un mod`ele lin´eaire.
Transformation
I Mod`ele :
Yi =NiαKiβexp (ui),
I En logs :
ln (Yi) =αln (Ni) +βln (Ki) +ui.
I Avec rendements constants (α+β = 1 => β= 1−α) : ln (Yi)−ln (Ki) =α(ln (Ni)−ln (Ki)) +ui.
Strat´ egies pour d´ etecter les non-lin´ earit´ es
1. M´ethodes formelles : `a suivre dans le prochain chapitre.
2. M´ethodes graphiques :
2.1 Graphique des r´esidus contre soit la variable d´ependante soit une des variables explicatives.
2.2 Graphique avec la ligne de r´egression (conditionnelle) et les paires (Yi, Xji) o`uXji est l’ie observation sur la je variable explicative.
2.3 “Partial plots”
Mod` eles polynomiales
I Exemple :
Yi =β0+β1Xi+β2Xi2+β3Xi3+. . .+βrXir +ui.
I Pas de difficult´es pour l’estimation.
I Multicollin´earit´e possible.
I Tester la significativit´e de X.
I Intervalles de confiance pour les changements pr´edits.
Mod` eles logarithmiques
I Log–lin´eaire :
ln (Yi) =β0+β1X1i+. . .+βkXki +ui.
I Lin´eaire–log :
Yi =β0+β1ln (X1i) +. . .+βkln (Xki) +ui.
I Log–log :
ln (Yi) =β0+β1ln (X1i) +. . .+βkln (Xki) +ui.
I Les R2 de deux r´egressions o`u la variable d´ependante n’est pas d´efinie de la mˆeme fa¸con (par exemple en logs et en niveaux) ne sont pas strictement comparables.
Effets d’interaction entre variables explicatives
1. Variable dichotomique – variable dichotomique : Yi =β0+β1D1i+β2D2i +ui. D1 : diplˆome, D2 : masculin/f´eminin.
2. L’impact de l’obtention d’un diplˆome sur le salaire pourrait d´ependre aussi du sexe.
Yi =β0+β1D1i +β2D2i+β3D1iD2i +ui.
Effets d’interaction (suite)
I Variables dichotomiques – variables continues.
Yi =β0+β1Di +β2Xi +ui, X : ann´ees d’exp´erience,D diplˆome ou non.
I On pourrait avoir
Yi =β0+β1Di+β2Xi+β3DiXi+ui.
I Troisi`eme possibilit´e :
Yi =β0+β1Xi +β2DiXi +ui.
Variables continues – variables continues
I Interaction entre variables continues et variables continues : Yi =β0+β1X1i +β2X2i+β3X1iX2i+ui. X1 : ann´ees d’exp´erience,X2 : nombre d’ann´ees d’´etudes.
Strat´ egie g´ en´ erale
I Identifier des non-lin´earit´es possibles (intuition, raisonnement
´
economique, etc.).
I Sp´ecifier une fonction non lin´eaire et l’estimer.
I Juger si la fonction non lin´eaire est une am´elioration (tests t, testsF,R2, etc.). Noter la qualification concernant
l’utilisation du R2 dans la sous-section sur les transformation logarithmiques.
I Faire un graphique de la relation estim´ee pour identifier des probl`emes ´eventuels.
I Utiliser des tests formels.
Exemple
I Mod`ele de r´egression simple estim´e : Yi =β0+β1Xi+ui.
I Les r´esidus sont en moyenne n´egatifs pour des valeurs faibles deXi, positifs pour des valeurs interm´ediaires, et encore n´egatifs pour des valeurs ´elev´es.
I L’impact de Xi sur Yi diminue avecXi.
Exemple (suite)
I Deux sp´ecifications alternatives non lin´eaires possibles : Yi =β0+β1ln (Xi) +ui;
Yi =β0+β1Xi +β2Xi2+ui.
I Tester la significativit´e de ˆβ2, comparer lesR2 ou les ¯R2, regarder encore des graphiques des r´esidus contreXi.
Exemple (suite)
I Estimer un mod`ele g´en´eral quiemboˆıte les deux autres : Yi =β0+β1Xi +β2Xi2+β3ln(Xi) +ui.
I Les 2 mod`eles sont des versions contraintes de celui-ci.
I Tester les deux H0 suivantes :
H0 :β3 = 0 H1 :β3 6= 0;
H0:β1=β2= 0 H1:β16= 0et/ouβ2 6= 0.
I Retenir le mod`ele dont le rejet est le plus fort (la p-value la plus faible).
I Pour des versions plus formelles de ce test, voir Davidson et MacKinnon (1982).
Changements pr´ edits
I Mod`ele illustratif :
Yi =β0+β1X1i +β2X2i+β3X1iX2i+ui.
I Nous avons
∆ ˆY ≡Yˆ2−Yˆ1 =h
βˆ0+ ˆβ1X12+ ˆβ2X21+ ˆβ3X12X21i
−h
βˆ0+ ˆβ1X11+ ˆβ2X21+ ˆβ3X11X21i
= ˆβ1(X12−X11) + ˆβ3X21(X12−X11)
= ˆβ1(∆X1) + ˆβ3X21(∆X1)
⇒ ∆ ˆY
∆X1
= ˆβ1+ ˆβ3X21.
Changements pr´ edits : intervalles de confiance.
I Trois m´ethodes principales.
1. Matrice variance-covariance des param`etres.
2. Estimation d’une version ´equivalente du mod`ele.
3. StatistiqueFpour tester une restriction lin´eaire.
Matrice variance-covariance des param` etres
I Le changement peut ˆetre exprim´e comme une fonction lin´eaire des param`etres du mod`ele.
∆ ˆY
∆X1
=δ0β,ˆ
δ : vecteur de constantes de dimensions (k+ 1)×1.
I Dans l’exemple de la section pr´ec´edente :
∆ ˆY
∆X1
= [0, 1, 0, X21]
βˆ0
βˆ1 βˆ2 βˆ3
.
Matrice variance-covariance des param` etres (suite)
I Nous avons :
E βˆ−β
= 0, E
βˆ−β βˆ−β0
= Σβˆ.
I Appliquant nos r`egles de base : Var
δ0βˆ
= Var δ0
βˆ−β
= E
δ0
βˆ−β βˆ−β0
δ
=δ0E
βˆ−β βˆ−β 0
δ
δ0E
βˆ−β βˆ−β 0
δ
=δ0Σβˆδ
Matrice variance-covariance des param` etres (suite)
I L’´ecart type associ´e `a notre pr´evision est SE
∆X1δ0βˆ
= ∆X1
q δ0Σˆβˆδ,
I Nous avons remplac´e Σβˆ par un estimateur convergent.
I Nous avons
∆ ˆY = ∆X1δ0βˆ±z∆X1 q
δ0Σˆβˆδ, z >0 o`u
Φ (−z) = (1−X)/2.
Estimation d’une version ´ equivalente du mod` ele
I Dans le cas de l’exemple :
Yi =β0+ (β1+β3X21)X1i+β2X2i+β3(X1iX2i−X21X1i) +ui
≡β0+γ1X1i+β2X2i +β3Zi +ui
I L’estimation du mod`ele transform´e nous donne ˆγ1 et son ´ecart type, et nous pouvons facilement ´ecrire l’intervalle de
confiance pour la pr´ediction.
Estimation d’une version ´ equivalente du mod` ele (suite)
I Dans le cas g´en´eral on peut ´ecrire la combinaison lin´eaire de coefficients pour laquelle on veut calculer l’´ecart type sous la forme
δ0β=δ0+δ1β1+δ2β2+. . .+δkβk.
I Ceci donne δ0β
δ1 = δ0
δ1 +β1+ δ2
δ1β2+. . .+δk
δ1βk
I Le mod`ele transform´e devient Yi =β0−δ0
δ1
X1i + δ0
δ1
+β1+δ2 δ1
β2+. . .+δk δ1
βk
X1i
+β2
X2i −δ2
δ1X1i
+. . .+βk
Xki−δk δ1X1i
+ui.
Estimation d’une version ´ equivalente du mod` ele (suite)
I Int´egrant le terme δδ0
1X1i avec la variable d´ependante on obtient
Yi +δ0
δ1
X1i
=β0+ δ0
δ1
+β1+δ2
δ1
β2+. . .+δk
δ1
βk
X1i
+β2
X2i−δ2
δ1X1i
+. . .+βk
Xki −δk
δ1X1i
+ui
≡β0+γ1X1i+β2Z2i +. . .+βkZki+ui.
Estimation d’une version ´ equivalente du mod` ele (suite)
I L’´ecart type associ´e `a ˆγ1 nous donne une fa¸con de calculer un intervalle de confiance.
SE(γb1) =SE δ0βˆ δ1
! .
I Donc
SE
δ0βˆ
=δ1SE( ˆγ1).
Statistique F pour tester une restriction lin´ eaire
I Dans le cas de l’exemple :
H0: β1+β3X21= 0, H1 : β1+β3X216= 0
⇒F =t2=
βˆ1+ ˆβ3X21 SE
βˆ1+ ˆβ3X21
2
.
I Nous avons tout de suite que SE
βˆ1+ ˆβ3X21
=
βˆ1+ ˆβ3X21
√F .
Statistique F pour tester une restriction lin´ eaire
I Forme g´en´erale :
H0 : δ0β = 0, H1: δ0β6= 0.
Nous avons :
SE
δ0βˆ
=
δ0βˆ
√ F
.
Concepts ` a retenir
1. La distinction entre non-lin´earit´es dans les variables et non-lin´earit´es dans les param`etres.
2. Une compr´ehension intuitive des fa¸cons de d´etecter la pr´esence de relations non lin´eaires entre les variables d’un mod`ele ´econom´etrique.
3. Une compr´ehension intuitive des principaux types de mod`eles non lin´eaires.
4. La fa¸con de calculer l’impact pr´edit de la variation d’une variable explicative sur la variable d´ependante. L’id´ee qu’en g´en´eral cet impact pr´edit peut d´ependre de niveauxd’une ou de plusieurs variables explicatives.
5. Les trois fa¸cons principales de calculer des ´ecarts types et les intervalles de confiance pour les changements pr´edits : par l’utilisation de la matrice variance-covariance des param`etres estim´es, par l’estimation du mod`ele ´equivalent appropri´e, ou par le calcule de la statistiqueF pour tester la restriction appropri´ee sur une combinaison lin´eaire des coefficients du mod`ele.