• Aucun résultat trouvé

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal

N/A
N/A
Protected

Academic year: 2022

Partager "D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal"

Copied!
27
0
0

Texte intégral

(1)

ECO 4272 : Introduction `a l’´econom´etrie Notes sur les mod`eles de r´egression non

lin´eaires

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal

2018 : Steve Ambler c

Hiver 2018

Ces notes sont en cours de d´eveloppement. J’ai besoin de vos commentaires et de vos sug- gestions pour les am´eliorer. Vous pouvez me faire part de vos commentaires en personne ou en envoyant un message `aambler.steven@uqam.ca.

(2)

Table des mati`eres

1 Introduction 4

2 Non-lin´earit´es dans les param`etres et dans les variables 5 2.1 Non-lin´earit´e dans les variables seulement . . . 5 2.2 Non-lin´earit´e dans les param`etres. . . 6 2.3 Exemple simple d’un mod`ele non lin´eaire . . . 7 2.4 Tranformation d’un mod`ele non lin´eaire en mod`ele lin´eaire . . . . 7

3 Strat´egies pour d´etecter des non-lin´earit´es 8

3.1 M´ethodes graphiques . . . 9

4 Principaux types de mod`eles non lin´eaires 9

4.1 Mod`eles polynomiales . . . 9 4.2 Mod`eles logarithmiques. . . 10 4.3 Effets d’interaction entre variables explicatives . . . 11

5 Une strat´egie g´en´erale face aux mod`eles non lin´eaires 12 5.1 Exemple . . . 13

6 Changements pr´edits 15

7 Intervalles de confiance pour les changements pr´edits 16 7.1 Matrice de variance-covariance des param`etres . . . 16 7.2 Estimation d’une version ´equivalente du mod`ele . . . 20

(3)

7.2.1 Forme g´en´erale . . . 22 7.3 StatistiqueFpour tester une restriction lin´eaire . . . 24 7.3.1 Forme g´en´erale . . . 25

8 Concepts `a retenir 26

(4)

1 Introduction

Ce chapitre a pour but de pr´esenter quelques strat´egies g´en´erales pour sp´ecifier et estimer des mod`eles ´econom´etriques non lin´eaires.

On ne traite que les mod`eles qui sont non lin´eaires dans lesvariables, et non les mod`eles qui sont non lin´eaires dans lesparam`etres. Voir la section suivante pour plus de d´etails concernant la diff´erence entre ces deux types de non-lin´earit´e. Le dernier type de mod`ele existe. Il est fr´equemment utilis´e en ´econom´etrie

appliqu´ee. Par contre, son ´etude d´epasse le cadre de ce cours.

Le chapitre permettra aussi de r´eviser un certain nombre de concepts que nous avons vus dans les chapitres ant´erieurs du cours, notamment la section sur le calcul d’intervalles de confiance pour des pr´edictions de changement. La m´ethode qui passe par l’utilisation de la matrice variance-covariance des

param`etres sera une r´evision sur le calcul de variances de combinaisons lin´eaires de variables al´eatoires. Par la suite, la section7.2sera une r´evision du principe de comment estimer une version ´equivalente d’un mod`ele o`u notre logiciel

´econom´etrique nous fournira automatiquement l’´ecart type auquel nous nous int´eressons. Finalement, la section7.3sera une r´evision des tests d’hypoth`ese et de la relation entre la statistiqueF et la statistiquetdans le cas d’une hypoth`ese simple.

(5)

2 Non-lin´earit´es dans les param`etres et dans les variables

Une version g´en´erale d’´ecrire le mod`ele de r´egression multiple serait :

Yi =F (Xi , β) +ui

o`uXi est un vecteur de dimensions(k+ 1)×1d’observations sur(k+ 1) variables explicatives, qui en g´en´eral vont inclure une constante,β est un vecteur (de dimensions(k+ 1)×1pour simplifier) de param`etres etui est un terme d’erreur. Ce n’est pas tout `a fait g´en´eral, puisque l’on suppose que le terme d’erreur est additif. Sinon, on aurait pu ´ecrire :

Yi =F (Xi , β , ui).

Une distinction primordiale est `a faire entre les mod`eles qui sont non lin´eaires dans les variables seulement, et les mod`eles qui sont non lin´eaires dans les param`etres.

2.1 Non-lin´earit´e dans les variables seulement

Si, pour un param`etre quelconqueβi , i= 0,1, . . . knous avons

∂Yi

∂βi =G(Xi),

(6)

ce qui veut dire que la d´eriv´ee partielle ne d´epend pas des param`etres, le mod`ele est lin´eaire dans les param`etres. Avec des red´efinitions appropri´ees des variables explicatives, nous pouvons r´e´ecrire le mod`ele sous la forme

Y =Xβ+U.

Parmi les variables explicatives dans la matriceX, on admet la possibilit´e de la pr´esence de fonctions non lin´eaires des variables explicatives individuelles.

L’estimateur MCO des param`etresβest toujours donn´e par

βˆ= (X0X)−1X0Y.

2.2 Non-lin´earit´e dans les param`etres

Si, pour au moins un param`etreβi , i= 0,1, . . . knous avons

∂Yi

∂βi = ˜G(Xi, β),

le mod`ele est non lin´eaire dans les param`etres. Il n’est plus possible d’´ecrire le mod`ele sous la forme

Y =Xβ+U.

Il est toujours possible de minimiser la somme des erreurs au carr´e du mod`ele, mais il n’y a plus d’expression alg´ebrique simple pour la solution `a ce probl`eme.

Il s’agit de l’estimateurMCNL(moindres carr´es non lin´eaires). Les ordinateurs

(7)

modernes et les logiciels de r´egression commeR,STATAouGRETLont des algorithmes num´eriques puissants pour calculer ce type d’estimateur, mais nous n’allons pas ´etudier ce sujet dans le cadre du cours. ´Evidemment, le calcul de la matrice de variance-covariance des param`etres estim´es est plus ardu dans ce cas.

2.3 Exemple simple d’un mod`ele non lin´eaire

On a des donn´ees concernant les intrants (travail et capital) d’un certain nombre de firmes et concernant la valeur en dollars constants de leur output. Nous voulons estimer une fonction de production CES (´elasticit´e de substitution constante) de la forme :

Yi = (θNiγ

+ (1−θ)Kiγ

)(1/γ)+ui.

Les param`etres de la fonction sontθ, le poids relatif du travail, etγ, qui donne l’´elasticit´e de substitution entre les intrants.

2.4 Tranformation d’un mod`ele non lin´eaire en mod`ele lin´eaire

Il est souvent possible, par une transformation, de convertir un mod`ele non lin´eaire en un mod`ele lin´eaire. L’exemple classique est l’estimation d’une fonction de production Cobb-Douglas avec erreur multiplicative. Le mod`ele est

(8)

donn´e par

Yi =NiαKiβexp (ui),

o`uYiest l´output de la firmeNi mesure l’intrant travail etKi mesure l’intrant capital. Si on calcule le log de chaque cˆot´e de l’´equation, on obtient

ln (Yi) =αln (Ni) +βln (Ki) +ui.

Si on veut imposer les rendements constants `a l’´echelle sur le mod`ele, c’est `a dire α+β = 1ouβ = (1−α), on peut l’´ecrire comme

ln (Yi)−ln (Ki) = α(ln (Ni)−ln (Ki)) +ui.

Le mod`ele devient un mod`ele de r´egression simple avec(ln (Ni)−ln (Ki)) comme la seule variable explicative, et avec(ln (Yi)−ln (Ki))comme variable d´ependante transform´ee.

3 Strat´egies pour d´etecter des non-lin´earit´es

Il y a des tests formels pour d´etecter la non-lin´earit´e, comme il y a des tests formels pour d´etecter la pr´esence de l’h´et´erosc´edasticit´e. Ici, nous allons mettre l’accent sur des fac¸ons informelles de proc´eder. Dans le dernier chapitre sur les tests diagnostics nous allons voir quelques m´ethodes un peu plus formelles.

(9)

3.1 M´ethodes graphiques

• Graphique avec lesuˆisur l’axe vertical et une des variables explicatives sur l’axe horizontal.

• Graphique avec la ligne de r´egression (conditionnelle) et les pairs (Yi , Xji)o`uXjiest l’ieobservation sur la je variable explicative.

4 Principaux types de mod`eles non lin´eaires

4.1 Mod`eles polynomiales

• La variable d´ependante d´epend d’un polynˆome dans une ou pluseurs des variables explicatives. Dans le cas d’une seule variable explicative on pourrait avoir, par exemple

Yi01Xi2Xi23Xi2+. . .+βrXir+ui.

• Le mod`ele ne pr´esente pas de difficult´es pour l’estimation par rapport au mod`ele de r´egression multiple d´ej`a ´etudi´e.

• Notez que la corr´elation entreXetXj, j >1risque d’ˆetre ´elev´ee. Elle ne sera pas parfaite, puisque le coefficient de corr´elation capte le degr´e auquel une relationlin´eaireentre deux variables est fexacte. Donc, le fait d’estimer un mod`ele polynomial ne peut engendrer un probl`eme de multicollin´earit´eparfaite, mais pourtant l’inclusion de plusieurs

puissances diff´erentes deXj peut certainement engendrer un probl`eme de

(10)

multicollin´earit´e, avec tous les probl`emes que cela peut entraˆıner (´ecarts types tr`es ´elev´es, tests avec puissance r´eduite, etc.).

• La seule nouveaut´e est au niveau de calculer les intervalles de confiance pour l’impact de changements dans une variable explicative sur la variable d´ependante. Voir la section (7) ci-dessous.

4.2 Mod`eles logarithmiques

• Log–lin´eaire.

ln (Yi) = β01X1i+. . .+βkXki+ui.

• Lin´eaire–log.

Yi01ln (X1i) +. . .+βkln (Xki) +ui.

• Log–log.

ln (Yi) =β01ln (X1i) +. . .+βkln (Xki) +ui.

Notez que lesR2de deux r´egressions o`u la variable d´ependante n’est pas d´efinie de la mˆeme fac¸on (par exemple en logs et en niveaux)ne sont pas strictement comparables. Donc, on ne peut pas utiliser lesR2 comme crit`ere de s´election entre deux sp´ecifications diff´erentes.

(11)

4.3 Effets d’interaction entre variables explicatives

• Une premi`ere possibilit´e est celle de l’interaction entre variables dichotomiques et variables dichotomiques. Prenons l’exemple o`u on essaie d’expliquer le revenu d’un individu par sa diplˆomation et par son sexe. SoitD1i une variable qui prend la valeur 1 si l’individu a un diplˆome universitaire et 0 sinon. SoitD2i une variable dichotomique qui prend la valeur 1 si l’individu est une femme et 0 sinon. SoitYi le revenu en logs. Un mod`ele possible serait

Yi01D1i2D2i+ui.

On pourrait penser que l’impact de l’obtention d’un diplˆome sur son salaire pourrait d´ependre aussi de son sexe. Si c’est le cas, on pourrait estimer le mod`ele suivant :

Yi01D1i2D2i3D1iD2i+ui.

• Interaction entre variables dichotomiques et variables continues. Prenons un mod`ele o`u le revenu de l’individu est expliqu´e par le nombre d’ann´ees d’exp´erience et par la diplˆomation. Le mod`ele pourrait ˆetre

Yi01Di2Xi+ui,

(12)

ou on pourrait incorporer un terme d’interaction entre les deux variables :

aYi01Di2Xi3DiXi+ui.

Une troisi`eme possibilit´e serait

Yi01Xi2DiXi+ui.

Dans ce dernier cas, l’ordonn´ee `a l’origine est identique, mais la pente de la relation entreYietXi est diff´erente. Voir le Graphique 8.8 dans le livre pour une illustration des trois diff´erentes possibilit´es.

• Interaction entre variables continues et variables continues. Un exemple serait un mod`ele o`uX1iserait le nombre d’ann´ees d’exp´erience etX2i serait le nombre d’ann´ees d’´etudes. On pourrait estimer le mod`ele

Yi01X1i2X2i3X1iX2i+ui.

5 Une strat´egie g´en´erale face aux mod`eles non lin´eaires

1. Identifier des non-lin´earit´es possibles (intuition, raisonnement

´economique, etc.).

2. Sp´ecifier une fonction non lin´eaire et l’estimer.

(13)

3. Juger si la fonction non lin´eaire est une am´elioration (testst, testsF,R2, etc.). Noter la qualification concernant l’utilisation duR2dans la

sous-section sur les transformation logarithmiques.

4. Faire un graphique de la relation estim´ee pour identifier des probl`emes

´eventuels.

5. Il y a des tests formels pour d´etecter la non-lin´earit´e, mais c’est un sujet qui d´epasse le cadre de ce cours.

Notez que l’utilisation duR2 pour comparer deux mod`eles diff´erents peut ˆetre probl´ematique si la variable d´ependante a ´et´e red´efinie entre les deux mod`eles.

C’est le cas notamment lorsqu’on transforme la variable d´ependante en la calculant en logs.

5.1 Exemple

Consid´erons l’exemple suivant. On a un mod`ele de r´egression simple estim´e en niveaux :

Yi01Xi+ui.

Un graphique de la ligne de r´egression avec les observations surYi etXifait ressortir une non-lin´earit´e ´evidente, `a la mani`ere du Grapique 8.2 du manuel. Les r´esidus sont en moyenne n´egatifs pour des valeurs faibles deXi, positifs pour des valeurs interm´ediaires, et encore n´egatifs pour des valeurs ´elev´es. L’impact deXi surYidiminue avec la valeur deXi. Nous essayons deux sp´ecifications

(14)

alternatives non lin´eaires, la premi`ere polynomiale et la deuxi`eme logarithmique :

Yi01ln (Xi) +ui;

Yi01Xi2Xi2+ui.

Nous pouvons tester la significativit´e du coefficientβˆ2 dans la deuxi`eme r´egression et comparer lesR2 des deux sp´ecifications. Si on compare lesR2, il faut faire attention puisque le deuxi`eme mod`ele contient une variable explicative additionnelle par rapport au premier : donc il serait prudent de regarder aussi la mesureR¯2.

Dans ce cas, nous pouvons aussi estimer un mod`ele g´en´eral quiemboˆıteles deux autres. Consid´erons le mod`ele suivant, qui contient toutes les variables

explicatives des deux mod`eles (une constante,Xi en niveau,ln(Xi)en logs, et Xi2).

Yi01Xi2Xi23ln(Xi) +ui.

L’ordre des variables n’est pas important. Notez que nos deux mod`eles sont des versions contraintes de celui-ci. On peut ensuite tester les deux hypoth`eses nulles diff´erentes suivantes :

H03 = 0 H13 6= 0;

H012 = 0 H11 6= 0 et/ouβ2 6= 0.

La premi`ere est une hypoth`ese simple. La deuxi`eme est une hypoth`ese jointe. On

(15)

retient le mod`ele dont le rejet est le plus fort (la p-value est la plus faible).

6 Changements pr´edits

Mod`ele de base illustratif :

Yi01X1i2X2i3X1iX2i+ui.

Changement pr´edit suite `a un changement donn´e de la variableX1i. Valeur initiale deX1i:X11. Valeur finale deX1i:X12.

∆ ˆY ≡Yˆ2−Yˆ1 =h

βˆ0 + ˆβ1X12+ ˆβ2X21+ ˆβ3X12X21i

−h

βˆ0+ ˆβ1X11+ ˆβ2X21+ ˆβ3X11X21i

= ˆβ1(X12−X11) + ˆβ3X21(X12−X11)

= ˆβ1(∆X1) + ˆβ3X21(∆X1)

⇒ ∆ ˆY

∆X1 = ˆβ1+ ˆβ3X21.

• Notez que l’on suppose que la valeur deX2ine change pas.

• Ceci est typique. On consid`ere l’impact sur la variable d´ependante d’un seul changement au niveau des variables explicatives.

• Notez que le changement pr´edit d´epend de la valeur deX2i, qui ne change pas, et de la taille du changement deX1i.

(16)

• Le point important `a saisir ici, c’est que le changement pr´edit (par unit´e de changement deX1i, n’est pas constant et d´epend duniveaud’une autre variable explicative dans le mod`ele.

• Ceci dit, le calcul du changement pr´edit ne pr´esente pas de difficult´es particuli`eres. Par contre, le calcul des intervalles de confiance pour ces pr´edictions est plus compliqu´e. Voir la section suivante.

7 Intervalles de confiance pour les changements pr´edits

Le calcul d’intervalles de confiance pour les changements pr´edits est plus compliqu´e dans le cadre de non-lin´earit´es dans les variables. Par exemple, dans l’exemple de la section pr´ec´edente, pour calculer l’´ecart type de∆ ˆY, il faut calculer l’´ecart type deβˆ1∆X1+ ˆβ3X21∆X1. Encore une fois, cela va d´ependre duniveaud’une autre variable explicative dans le mod`ele.

Il y a trois m´ethodes principales qui permettent de calculer les intervalles de confiance pour un changement pr´edit.

7.1 Matrice de variance-covariance des param`etres

Soit la matrice estim´ee de variance-covariance des param`etres donn´ee parΣˆβˆ. Puisque nous consid´erons des mod`eles non lin´eaires dans les variables

seulement, et puisque nous ´evaluons le changement pr´edit `a des niveaux donn´es

(17)

de toutes les variables explicatives `a part celle dont on veut pr´edire l’impact, le changement peut ˆetre exprim´e comme une fonction lin´eaire des param`etres du mod`ele. Autrement dit,

∆ ˆY

∆X10β,ˆ

o`uδest un vecteur de constantes de dimensions(k+ 1)×1dont les valeurs peuvent d´ependre de valeurs des variables explicatives. Dans l’exemple de la section pr´ec´edente, nous avons

∆ ˆY

∆X1 = [0, 1, 0, X21]

 βˆ0

βˆ1 βˆ2 βˆ3

 .

Nous avons :

E

βˆ−β

= 0

et

E

βˆ−β βˆ−β0

= Σβˆ,

ce qui est tout simplement la matrice estim´ee de variance-covariance deβ.ˆ Appliquant nos r`egles de base concernant les combinaisons lin´eaires de variables al´eatoires, nous avons :

Var

δ0βˆ

=Var δ0

βˆ−β

(18)

=E

δ0

βˆ−β βˆ−β0

δ

0E

βˆ−β βˆ−β0 δ

δ0E

βˆ−β βˆ−β0 δ

0Σβˆδ.

Il est important de noter que pour arriver `a cette expression nous avons trait´eδ comme un vecteur deconstantes. Le vecteur peut contenir des valeurs de variables explicatives, mais c’est nous qui imposons ces valeurs. C’est pour cela que ce ne sont pas des variables al´eatoires.

Il faut bien comprendre pourquoi

E

βˆ−β βˆ−β 0

= Σβˆ.

L’´el´ement dans la rang´eei+ 1et la colonnej+ 1deβˆβˆ0 est tout simplement

´egal `a

βˆiβˆj,

et l’´el´ement dans la rang´eei+ 1et la colonnej+ 1de

βˆ−β βˆ−β0

est tout simplement ´egal `a

βˆi−βi βˆj −βj

(19)

Si notre estimateur MCO est non biais´e il faut que

E

βˆi −βi

=E

βˆj −βj

= 0

Une des identit´es pour le calcul de covariances implique que

Cov

βˆi−βi ,

βˆj−βj

=E

βˆi−βi βˆj −βj

−E

βˆi−βi E

βˆj−βj

=E

βˆi−βi βˆj−βj .

Sii=j ce raisonnement s’applique ´egalement `a la variance. Donc, nous avons

Cov

βˆi,βˆj

=Cov

βˆi−βi ,

βˆj−βj

=E

βˆi−βi βˆj−βj .

Donc, nous avons

Σβˆ≡Var βˆ

=E

βˆi−βi βˆj−βj .

Nous venons de calculer la variance deδ0β. Son ´ecart type est la racine carr´ee deˆ

(20)

la variance. Donc, l’´ecart type associ´e `a notre pr´evision, donn´e par SE

∆X1δ0βˆ

est tout simplement

SE

∆ ˆY

= SE

∆X1δ0βˆ

= ∆X1

q δ0Σˆβˆδ,

o`u nous avons remplac´eΣβˆ par l’estimateur convergent habituel. Soyez sˆurs de comprendre pourquoiδ0Σˆβˆδest unscalaire.

L’´ecart type peut (sous l’hypoth`ese queδ0βˆest approximativement distribu´ee suivant une loi normale) ˆetre utilis´e de la mani`ere standard pour construire des intervalles de confiance pour le changement pr´edit. Nous avons

∆ ˆY = ∆X1δ0βˆ±z∆X1 q

δ0Σˆβˆδ, z >0

o`u

Φ (−z) = (1−X)/2

o`u le niveau de confiance voulu pour l’intervalle est de(100×X)%.

7.2 Estimation d’une version ´equivalente du mod`ele

Il s’agit de transformer le mod`ele pour que l’un des coefficients estim´es soit associ´e `a la combinaison lin´eaire de coefficients dont nous voulons calculer l’´ecart type. Dans le cas de l’exemple de la section (6), la combinaison lin´eaire

(21)

dont il faut calculer l’´ecart type est donn´e par

β13X21.

Si on peut transformer le mod`ele pour que cette combinaison lin´eaire soit un des coefficients du mod`ele, une estimation par MCO va nous donner directement l’´ecart type voulu. Le coefficientβ1 est d´ej`a associ´e avec la variable explicative X1i. Il serait naturel donc d’ajouter le terme(β3X21)X1i au mod`ele. Si on ajoute ce terme, il faut soustraireexactementle mˆeme terme pour que le mod`ele transform´e soit ´equivalentau mod`ele initial. Nous pouvons ´ecrire :

Yi0+ (β13X21)X1i2X2i3(X1iX2i−X21X1i) +ui.

Donc, on vient d’ajouter le termeβ3X21X1i, et on a soustrait exactement le mˆeme terme. On peut r´e´ecrire le mod`ele de la fac¸on suivante :

Yi01X1i2X2i3Zi+ui

avec les d´efinitions suivantes :

γ1 ≡(β13X21)

et

Zi ≡(X1iX2i−X21X1i),

(22)

et o`u, bien sˆur,X21prend une valeur donn´ee, sa valeur au point de d´epart pour lequel nous voulons pr´edire l’impact d’un changement deX1. Clairement, puisque nous avons ajout´e et soustrait la mˆeme chose du mod`ele initial, ce qui le laisse inchang´e. Si nous estimons cette ´equation transform´ee par MCO, l’´ecart type de l’estim´e du coefficientγ1nous donne l’´ecart type qui nous int´eresse, et nous pouvons l’utiliser directement pour construire des intervalles de confiance pour le changement pr´edit.

On aura comme intervalle de confiance

∆ ˆY = ∆X1γˆ1±z∆X1σˆγˆ1, z >0

o`uσˆˆγ1 est l’´ecart type estim´e de la valeur estim´eeγˆ1 et ou

Φ (−z) = (1−X)/2

o`u le niveau de confiance voulu pour l’intervalle est de(100×X)%.

7.2.1 Forme g´en´erale

De fac¸on plus g´en´erale, on peut ´ecrire la combinaison lin´eaire de coefficients pour laquelle on veut calculer l’´ecart type sous la forme

δ0β =δ01β12β2+. . .+δkβk.

(23)

La valeur desδiva d´ependre en g´en´eral des valeurs impos´ees desXi, que nous traitons comme des constantes. On veut ´ecrire un mod`ele transform´e qui permet de tester directement l’hypoth`ese nulleH0 : δ0β = 0avec une statistiquet standard. D’abord, on normalise par rapport `a un desδi (ce choix est arbitraire – son identit´e n’est pas importante dans la mesure o`u il n’est pas ´egal `a z´ero), par exempleδ1. Nous avons

δ0β δ1 = δ0

δ11+ δ2

δ1β2+. . .+δk δ1βk.

Nous avons r´eussi `a isoler le coefficientβ1, qui est associ´e `a la variable

explicativeX1i. ´Etant donn´ee cette normalisation, on va ajouter (et soustraire) les autres termes n´ecessaires multipli´es parX1i. On obtient le mod`ele transform´e suivant :

Yi0 −δ0

δ1X1i+ δ0

δ112

δ1β2+. . .+ δk

δ1βk

X1i

2

X2i− δ2 δ1X1i

+. . .+βk

Xki− δk δ1X1i

+ui. Int´egrant le terme δδ0

1X1iavec la variable d´ependante on obtient

Yi+ δ0 δ1X1i

0+ δ0

δ112

δ1β2+. . .+ δk δ1βk

X1i

2

X2i− δ2 δ1X1i

+. . .+βk

Xki− δk δ1X1i

+ui.

≡β01X1i2Z2i +. . .+βkZki+ui

(24)

o`u les d´efinitions des nouvelles variables (et coefficients) sont ´evidentes. Si nous estimons cette ´equation par MCO, l’´ecart type associ´e au coefficient estim´eγˆ1va nous donner directement une fac¸on de calculer un intervalle de confiance pour notre changement pr´edit. Nous avons

SE (bγ1) = SE δ0βˆ δ1

!

⇒SE

δ0βˆ

1SE (ˆγ1).

Nous pouvons utiliser cet ´ecart type afin de construire l’intervalle de confiance voulu, que nous pouvons ´ecrire comme

∆ ˆY = ∆X1δ0βˆ±z∆X1δ1σˆγˆ1, z >0

o`uσˆˆγ1 est l’´ecart type estim´e de la valeur estim´eeγˆ1 et ou

Φ (−z) = (1−X)/2

o`u le niveau de confiance voulu pour l’intervalle est de(100×X)%.

7.3 Statistique F pour tester une restriction lin´eaire

Si notre logiciel de r´egression nous permet de calculer la statistiqueF pour tester une hypoth`ese quelconque concernant une combinaison lin´eaire des coefficients, nous pouvons l’utiliser afin de calculer l’´ecart type de notre changement pr´edit.

(25)

Sachant que, dans le cas d’une hypoth`ese simple, la statistiqueF est tout

simplement le carr´e de la statistiquet, nous avons (dans le cas de l’exemple de la section (6) :

H0 : β13X21= 0, H1 : β13X21 6= 0

⇒F =t2 =

βˆ1+ ˆβ3X21 SE

βˆ1+ ˆβ3X21

2

o`u, encore une fois,X21prend une valeur donn´ee, sa valeur au point de d´epart pour lequel nous voulons pr´edire l’impact d’un changement deX1. Nous avons tout de suite que

SE

βˆ1+ ˆβ3X21

=

βˆ1+ ˆβ3X21

√F .

7.3.1 Forme g´en´erale

De fac¸on plus g´en´erale, la restriction `a tester peut ˆetre ´ecrite sous la forme suivante :

H0 : δ0β = 0, H1 : δ0β 6= 0.

Notez bien que dans ce cas-ci, il s’agit d’une seule restriction portant sur une combinaison lin´eaire des param`etres du mod`ele. C’est de la formeRβ =r, mais icidelta0 joue le rˆole deRet c’est un vecteur de dimensions1×(k+ 1)etrest un scalaire. Nous avons :

SE δ0βˆ

=

δ0βˆ

√F .

(26)

Nous pouvons utiliser cet ´ecart type pour construire l’intervalle de confiance voulu :

∆ ˆY = ∆X1δ0βˆ±z∆X1SE δ0βˆ

, z >0

o`uσˆˆγ1 est l’´ecart type estim´e de la valeur estim´eeγˆ1 et ou

Φ (−z) = (1−X)/2

o`u le niveau de confiance voulu pour l’intervalle est de(100×X)%.

8 Concepts `a retenir

• La distinction entre non-lin´earit´es dans les variables et non-lin´earit´es dans les param`etres.

• Une compr´ehension intuitive des fac¸ons de d´etecter la pr´esence de relations non lin´eaires entre les variables d’un mod`ele ´econom´etrique.

• Une compr´ehension intuitive des principaux types de mod`eles non lin´eaires.

• La fac¸on de calculer l’impact pr´edit de la variation d’une variable explicative sur la variable d´ependante. L’id´ee qu’en g´en´eral cet impact pr´edit peut d´ependre deniveauxd’une ou de plusieurs variables explicatives.

• Les trois fac¸ons principales de calculer des ´ecarts types et les intervalles de confiance pour les changements pr´edits.

(27)

R´ef´erences

Voir ce lien : http:

//www.steveambler.uqam.ca/4272/chapitres/referenc.pdf

Derni`ere modification : 05/01/2018

Références

Documents relatifs

Notez que pour r´epondre `a cette partie vous allez devoir r´eestimer le mod`ele avec des variables explicatives additionnelles qui tiennent compte de l’interac- tion entre

J’ai accept´e aussi un mod`ele avec seulement des termes d’interac- tion (donc on laisserait tomber saf rica, asiae et laam comme variables explicatives et on garderait ce que

Ajoutez la variable school au mod`ele comme proxy pour s h , avec un terme d’interaction pour les pays de l’OCDE.. Le mod`ele maintenant ´equivaut au mod`ele de Solow avec l’ajout

Vous devriez fournir avec vos r´eponses un script en R, GRETL, STATA ou dans le langage que vous avez utilis´e pour r´epondre aux questions.. Lorsque je vous demande de commenter ce

Maintenant, testez la significativit´e jointe de ces deux variables ensemble, avec et sans ´ecarts types robustes.. Expliquez ce que

Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur de n) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero

Si vous jouez avec cette commande, vous allez constatez qu’elle produit des nombres positifs dont la majorit´e sont inf´erieurs `a 1 λ = 0.5.. Ceci refl`ete le fait que c’est

Pour le mod`ele de r´egression (avec mv comme variable d´ependante) que vous avez estim´e, effectuez le test Breusch-Pagan pour la pr´esence de l’h´et´erosc´edasticit´e avec