Non-lin´ earit´ es : param` etres

(1)

ECO 4272 : Introduction ` a l’´ Econom´ etrie Notes sur les mod` eles de r´ egression non lin´ eaires

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion´ Université du Québec à Montréal

2018: Steve Amblerc

Hiver 2018

(2)

Introduction

I But : présenter quelques stratégies générales pour spécifier et estimer des modèles économétriques non linéaires.

I Modèles non linéaires dans lesvariables, non les modèles non linéaires dans lesparamètres.

I But secondaire : r´eviser un certain nombre de concepts.

1. Calcul d’intervalles de confiance pour des pr´edictions de changement.

2. Calcul de variances de combinaisons lin´eaires de variables al´eatoires.

3. Estimation d’une version ´equivalente d’un mod`ele.

4. Tests d’hypoth`ese et relation entre statistiquesF ett.

(3)

Non-lin´ earit´ es : param` etres versus variables

I Modèle de régression multiple général : Y_i =F(X_i , β) +u_i

I Le terme d’erreur est additif.

(4)

Non-lin´ earit´ es dans les variables seulement

I Pour βj , j = 0,1, . . .k nous avons

∂Y_i

∂β_j =G(X_i).

I Les dérivées partielles ne dépendent pas des paramètres.

I Nous pouvons réécrire le modèle sous la forme Y =Xβ+U

avec une red´efinition appropri´ee des variables dans la matrice X.

(5)

Non-lin´ earit´ es : param` etres

I Pour au moins un param`etreβ_j , i = 0,1, . . .k nous avons

∂Y_i

∂β_j = ˜G(X_i, β).

I Le modèle est non linéaire dans les paramètres.

(6)

MCNL

I Il est toujours possible de d´efinir le probl`eme min

β n

X

i=1

u_i² =

n

X

i=1

(Y_i−F(X_i , β))²

I Un ordinateur avec un algorithme sophistiqué peut résoudre ce problème.

I Il est possible aussi de calculer (au moins approximativement) une solution num´erique pour

E

βˆ−β βˆ−β0

.

I Etudier comment et pourquoi ce genre d’approximation´ fonctionne d´epasse le cadre de ce cours.

(7)

Exemple

I Fonction de production CES :

Y_i = (θN_i^γ+ (1−θ)K_i^γ)^(1/γ)+u_i.

I Les param`etres sontθ et γ.

I Il n’y a pas de transformation de ce modèle qui donne un modèle linéaire.

(8)

Transformation

I Mod`ele :

Yi =NiαKiβexp (ui),

I En logs :

ln (Y_i) =αln (N_i) +βln (K_i) +u_i.

I Avec rendements constants (α+β = 1 => β= 1−α) : ln (Yi)−ln (Ki) =α(ln (Ni)−ln (Ki)) +ui.

(9)

Strat´ egies pour d´ etecter les non-lin´ earit´ es

1. M´ethodes formelles : `a suivre dans le prochain chapitre.

2. M´ethodes graphiques :

2.1 Graphique des r´esidus contre soit la variable d´ependante soit une des variables explicatives.

2.2 Graphique avec la ligne de régression (conditionnelle) et les paires (Yi, Xji) oùXji est l’iê observation sur la jê variable explicative.

2.3 “Partial plots”

(10)

Mod` eles polynomiales

I Exemple :

Y_i =β₀+β₁X_i+β₂X_i²+β₃X_i³+. . .+β_rX_i^r +u_i.

I Pas de difficult´es pour l’estimation.

I Multicollin´earit´e possible.

I Tester la significativit´e de X.

I Intervalles de confiance pour les changements pr´edits.

(11)

Mod` eles logarithmiques

I Log–lin´eaire :

ln (Y_i) =β₀+β₁X_1i+. . .+β_kX_ki +u_i.

I Lin´eaire–log :

Yi =β0+β1ln (X1i) +. . .+βkln (Xki) +ui.

I Log–log :

ln (Y_i) =β0+β1ln (X_1i) +. . .+β_kln (X_ki) +u_i.

I Les R² de deux régressions où la variable dépendante n’est pas définie de la même fa¸con (par exemple en logs et en niveaux) ne sont pas strictement comparables.

(12)

Effets d’interaction entre variables explicatives

1. Variable dichotomique – variable dichotomique : Y_i =β₀+β₁D_1i+β₂D_2i +u_i. D₁ : diplˆome, D₂ : masculin/f´eminin.

2. L’impact de l’obtention d’un diplˆome sur le salaire pourrait d´ependre aussi du sexe.

Y_i =β₀+β₁D_1i +β₂D_2i+β₃D_1iD_2i +u_i.

(13)

Effets d’interaction (suite)

I Variables dichotomiques – variables continues.

Y_i =β₀+β₁D_i +β₂X_i +u_i, X : années d’expérience,D diplôme ou non.

I On pourrait avoir

Y_i =β₀+β₁D_i+β₂X_i+β₃D_iX_i+u_i.

I Troisi`eme possibilit´e :

Yi =β0+β1Xi +β2DiXi +ui.

(14)

Variables continues – variables continues

I Interaction entre variables continues et variables continues : Y_i =β₀+β₁X_1i +β₂X_2i+β₃X_1iX_2i+u_i. X1 : années d’expérience,X2 : nombre d’années d’études.

(15)

Strat´ egie g´ en´ erale

I Identifier des non-lin´earit´es possibles (intuition, raisonnement

´

economique, etc.).

I Sp´ecifier une fonction non lin´eaire et l’estimer.

I Juger si la fonction non lin´eaire est une am´elioration (tests t, testsF,R², etc.). Noter la qualification concernant

l’utilisation du R² dans la sous-section sur les transformation logarithmiques.

I Faire un graphique de la relation estimée pour identifier des problèmes éventuels.

I Utiliser des tests formels.

(16)

Exemple

I Modèle de régression simple estimé : Y_i =β₀+β₁X_i+u_i.

I Les résidus sont en moyenne négatifs pour des valeurs faibles deX_i, positifs pour des valeurs intermédiaires, et encore négatifs pour des valeurs élevés.

I L’impact de X_i sur Y_i diminue avecX_i.

(17)

Exemple (suite)

I Deux sp´ecifications alternatives non lin´eaires possibles : Y_i =β0+β1ln (X_i) +u_i;

Y_i =β₀+β₁X_i +β₂X_i²+u_i.

I Tester la significativit´e de ˆβ2, comparer lesR² ou les ¯R², regarder encore des graphiques des r´esidus contreX_i.

(18)

Exemple (suite)

I Estimer un modèle général quiemboˆıte les deux autres : Y_i =β₀+β₁X_i +β₂X_i²+β₃ln(X_i) +u_i.

I Les 2 mod`eles sont des versions contraintes de celui-ci.

I Tester les deux H0 suivantes :

H0 :β3 = 0 H1 :β3 6= 0;

H₀:β₁=β₂= 0 H₁:β₁6= 0et/ouβ₂ 6= 0.

I Retenir le mod`ele dont le rejet est le plus fort (la p-value la plus faible).

I Pour des versions plus formelles de ce test, voir Davidson et MacKinnon (1982).

(19)

Changements pr´ edits

I Mod`ele illustratif :

Y_i =β₀+β₁X_1i +β₂X_2i+β₃X_1iX_2i+u_i.

I Nous avons

∆ ˆY ≡Yˆ₂−Yˆ₁ =h

βˆ₀+ ˆβ₁X₁₂+ ˆβ₂X₂₁+ ˆβ₃X₁₂X₂₁i

−h

βˆ₀+ ˆβ₁X₁₁+ ˆβ₂X₂₁+ ˆβ₃X₁₁X₂₁i

= ˆβ1(X12−X11) + ˆβ3X21(X12−X11)

= ˆβ₁(∆X₁) + ˆβ₃X₂₁(∆X₁)

⇒ ∆ ˆY

∆X1

= ˆβ₁+ ˆβ₃X₂₁.

(20)

Changements pr´ edits : intervalles de confiance.

I Trois m´ethodes principales.

1. Matrice variance-covariance des param`etres.

2. Estimation d’une version ´equivalente du mod`ele.

3. StatistiqueFpour tester une restriction lin´eaire.

(21)

Matrice variance-covariance des param` etres

I Le changement peut être exprimé comme une fonction linéaire des paramètres du modèle.

∆ ˆY

∆X1

=δ⁰β,ˆ

δ : vecteur de constantes de dimensions (k+ 1)×1.

I Dans l’exemple de la section pr´ec´edente :

∆ ˆY

∆X1

= [0, 1, 0, X21]





 βˆ0

βˆ₁ βˆ₂ βˆ3





 .

(22)

Matrice variance-covariance des param` etres (suite)

I Nous avons :

E βˆ−β

= 0, E

= Σ_β_ˆ.

I Appliquant nos r`egles de base : Var

δ⁰βˆ

= Var δ⁰

βˆ−β

= E

δ⁰

δ

=δ⁰E

βˆ−β βˆ−β 0

δ

δ⁰E

βˆ−β βˆ−β 0

δ

=δ⁰Σβˆδ

(23)

Matrice variance-covariance des param` etres (suite)

I L’écart type associé à notre prévision est SE

∆X1δ⁰βˆ

= ∆X1

q δ⁰Σˆβˆδ,

I Nous avons remplac´e Σ_β_ˆ par un estimateur convergent.

I Nous avons

∆ ˆY = ∆X₁δ⁰βˆ±z∆X₁ q

δ⁰Σˆ_β_ˆδ, z >0 o`u

Φ (−z) = (1−X)/2.

(24)

Estimation d’une version ´ equivalente du mod` ele

I Dans le cas de l’exemple :

Yi =β0+ (β1+β3X21)X1i+β2X2i+β3(X1iX2i−X21X1i) +ui

≡β0+γ1X1i+β2X2i +β3Zi +ui

I L’estimation du modèle transformé nous donne ˆγ1 et son écart type, et nous pouvons facilement écrire l’intervalle de

confiance pour la pr´ediction.

(25)

Estimation d’une version ´ equivalente du mod` ele (suite)

I Dans le cas général on peut écrire la combinaison linéaire de coefficients pour laquelle on veut calculer l’écart type sous la forme

δ⁰β=δ0+δ1β1+δ2β2+. . .+δkβk.

I Ceci donne δ⁰β

δ₁ = δ0

δ₁ +β1+ δ2

δ₁β2+. . .+δk

δ₁β_k

I Le mod`ele transform´e devient Y_i =β₀−δ₀

δ1

X_1i + δ₀

δ1

+β₁+δ₂ δ1

β₂+. . .+δ_k δ1

β_k

X_1i

+β2

X_2i −δ2

δ₁X_1i

+. . .+β_k

X_ki−δ_k δ₁X_1i

+u_i.

(26)

Estimation d’une version ´ equivalente du mod` ele (suite)

I Int´egrant le terme ^δ_δ⁰

1X1i avec la variable d´ependante on obtient

Yi +δ0

δ1

X1i

=β0+ δ0

δ1

+β1+δ2

δ1

β2+. . .+δk

δ1

βk

X1i

+β2

X2i−δ2

δ₁X1i

+. . .+β_k

X_ki −δk

δ₁X1i

+ui

≡β₀+γ₁X_1i+β₂Z_2i +. . .+β_kZ_ki+u_i.

(27)

Estimation d’une version ´ equivalente du mod` ele (suite)

I L’écart type associé à ˆγ₁ nous donne une fa¸con de calculer un intervalle de confiance.

SE(γb₁) =SE δ⁰βˆ δ₁

! .

I Donc

SE

δ⁰βˆ

=δ1SE( ˆγ1).

(28)

Statistique F pour tester une restriction lin´ eaire

I Dans le cas de l’exemple :

H0: β1+β3X21= 0, H1 : β1+β3X216= 0

⇒F =t²=





βˆ₁+ ˆβ₃X₂₁ SE

βˆ1+ ˆβ3X21





2

.

I Nous avons tout de suite que SE

βˆ1+ ˆβ3X21

=

βˆ1+ ˆβ3X21

√F .

(29)

Statistique F pour tester une restriction lin´ eaire

I Forme g´en´erale :

H0 : δ⁰β = 0, H1: δ⁰β6= 0.

Nous avons :

SE

δ⁰βˆ

=

δ⁰βˆ

√ F

.

(30)

Concepts ` a retenir

1. La distinction entre non-linéarités dans les variables et non-linéarités dans les paramètres.

2. Une compréhension intuitive des fa¸cons de détecter la présence de relations non linéaires entre les variables d’un modèle économétrique.

3. Une compréhension intuitive des principaux types de modèles non linéaires.

4. La fa¸con de calculer l’impact prédit de la variation d’une variable explicative sur la variable dépendante. L’idée qu’en général cet impact prédit peut dépendre de niveauxd’une ou de plusieurs variables explicatives.

5. Les trois fa¸cons principales de calculer des écarts types et les intervalles de confiance pour les changements prédits : par l’utilisation de la matrice variance-covariance des paramètres estimés, par l’estimation du modèle équivalent approprié, ou par le calcule de la statistiqueF pour tester la restriction appropriée sur une combinaison linéaire des coefficients du modèle.