• Aucun résultat trouvé

o`uρ2X1,X2 est le coefficient de corr´elation entreX1etX2 au carr´e. En regardant cette expression, il est clair que la varianceσ2ˆ

β1 du param`etre estim´eβˆ1va croˆıtre avec la valeur absolue du coefficient de corr´elation entreX1 etX2. On peut aussi montrer que la variance de βˆ2 est donn´ee par

Encore une fois, sa variance augmente avec la valeur absolue du coefficient de corr´eltation entreX1 etX2.

La multicollin´earit´e imparfaite traduit le fait qu’il peut ˆetre tr`es difficile (sinon impossible), statistiquement parlant, d’isoler l’impact individuel de chacune de deux variables explicatives qui sont fortement corr´el´ees. C’est possible que chacune des deux variables soit non significative sur la base d’un test d’hypoth`ese simple (bas´e sur une statistiquet), tandis qu’un test de l’hypoth`ese nulle jointe que les deux variables sont non significatives rejette cette hypoth`ese nulle sur la base d’une statistiqueF. En interpr´etant les r´esultats d’une telle r´egression, il est important d’insister sur l’importance du bloc de deux variables pour expliquer la variable d´ependante, tout en

soulignant l’impossibilit´e d’attribuer l’importance `a une variable particuli`ere `a cause du probl`eme de multicollin´earit´e imparfaite.

10.3 Trucs pratiques

• Si vous avez une banque de donn´ees avec plusieurs variables explicatives potentielles, il pourrait ˆetre int´eressant de calculer la matrice de tous les coefficients de corr´elation entre toutes les paires de variables. Ceci peut faire apparaˆıtre des probl`emes potentiels de multicollin´earit´e.

• Lorsque vous estimez un mod`ele de r´egression multiple, il pourrait ˆetre int´eressant, si votre logiciel permet de le faire facilement, de calculer la valeur du

conditionnement de la matrice(X0X), donn´ee par le ratio de la plus grande valeur caract´eristique de la matrice sur la plus petite valeur caract´eristique. Si ce chiffre est tr`es ´elev´ee, on dit que la matrice estmal conditionn´ee, ce qui peut occasionner des erreurs num´eriques importantes. Une matrice mal conditionn´ee est presque singuli`ere.

11 Un Exemple

Je pr´esente ici un autre exemple en codeRpour illustrer sa puissance et le fait que (mˆeme en n’utilisant pas une des interfaces graphiques disponibles) il est relativement facile `a utiliser. On peut t´el´echarger une banque de donn´ees, estimer un mod`ele de r´egression multiple, et faire imprimer les r´esultats dans un fichier en six lignes de code. Notez que les commandes

coeftestetlinearHypothesisse trouvent dans les packageslmtestetcar. Il faut les charger en m´emoire et il faut aussi les installer si ce n’est pas d´ej`a fait. On peut les installer avec les commandes suivantes.

R> install.packages("car") R> install.packages("lmtest")

En Linux, il est toujours conseill´e d’installer les packages comme administrateur ou super-utilisateur :

R> sudo install.packages("car") R> sudo install.packages("lmtest")

Par la suite, on les charge en m´emoire avec les commandes suivantes.

R> library("car") R> library("lmtest")

Voci l’exemple.

Voici un exemple d’estimation d’un mod`ele de r´egression multiple avec le logicielR. Encore une fois, vous pouvez facilement jouer avec le code une fois que le logiciel est install´e.

R> data("CPS1988", package="AER")

R> CPS lm <- lm(log(wage) ∼ experience + I(experienceˆ2) + education + ethnicity, data=CPS1988)

R> summary(CPS lm)

R> outfile <- file("regsumm.out", "w")

R> capture.output(summary(CPS lm), file=outfile) R> close(outfile)

Les donn´ees sont dans une banque de donn´ees qui s’appelleCPS1988. Il s’agit d’une coupe transversale de 28 155 observations recueillies par le Bureau du Recensement aux ´Etats Unis dans le cadre du sondage Current Population Survey. Les donn´ees portent sur les

hommes ag´es de 18 `a 70 ans avec un revenu sup´erieur `a 50 $ qui ne sont ni travailleurs autonomes ni en train de travailler sans r´emun´eration. Voir la description plus d´etaill´ee dans Kleiber et Zeileis (2008, p.65).

La variable d´ependante du mod`ele est le salaire r´eel (dollars par semaine) mesur´e en logs. La variable explicativeexperienceest l’exp´erience de travail mesur´ee en ann´ees, la variable educationest le nombre d’ann´ees de formation mesur´e en ann´ees, et la variable

ethnicityest une variable dichotomiques prenant les valeurscauc(blanc) etafam (afro-am´ericain). Notez qu’il s’agit d’une variable dichotomique qui ne prend pas des valeurs

chiffr´ees (0 ou 1 par exemple) :Rva pouvoir tenir compte de ceci automatiquement.

Il faut avoir install´e le paquetageAER avec la commande suivante : install.packages("AER")

Cette commande va t´el´echarger et installer le paquetage automatiquement `a partir d’un des d´epˆots d’archivesR. (Notez que sous Linux il est pr´ef´erable d’installer le paquetage comme administrateur du syst`eme, autrement dit comme super-utilisateur).

Il est possible de g´en´erer un r´esum´e des propri´et´es des donn´ees avec les commande suivante.

R> data(¨CPS1988¨) R> summary(CPS1988)

Voir Kleiber et Zeileis (2008, p.66) pour les r´esultats de cette commande.

• La commandedata(·)charge la banque de donn´ees.

• La commandelm(·)estime le mod`ele de r´egression multiple par MCO, et la commandejour lm<-place les r´esultats dans la variablejour lm.

• La commandesummary(·)imprime les r´esultats de la r´egression `a l’´ecran.

• La commandeoutfile<-cr´ee un fichier texte o`u on peut envoyer les r´esultats.

• La commandecapture.output(·)envoie les r´esultats dans le fichier qui a ´et´e cr´e´e.

• La commandeclose(·)ferme le fichier.

La fonctionI()dit `aRd’interpr´eter l’op´erateurˆcomme un op´erateur alg´ebrique standard, puisqu’il a aussi une interpr´etation sp´eciale enR.

Les r´esultats de l’estimation sont comme suit : Call:

lm(formula = log(wage) ∼ experience + I(experienceˆ2) + education + ethnicity, data = CPS1988)

Residuals:

Min 1Q Median 3Q Max

-2.943 -0.316 0.058 0.376 4.383

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 4.321395 0.019174 225.4 <2e-16 experience 0.077473 0.000880 88.0 <2e-16 I(experienceˆ2) -0.001316 0.000019 -69.3 <2e-16 education 0.085673 0.001272 67.3 <2e-16 ethnicityafam -0.243364 0.012918 -18.8 <2e-16 Residual standard error: 0.584 on 28150 degrees of freedom Multiple R-squared: 0.335, Adjusted R-squared: 0.335

F-statistic: 3.54e+03 on 4 and 28150 DF, p-value: <2e-16

Vous devriez ˆetre en mesure de comprendre tous les ´el´ements de l’output, `a part la

signification du coefficientethnicityafam. Ce coefficient est cr´e´e automatiquement par R, qui a choisi de traiter la cat´egoriecauccomme la cat´egorie de r´ef´erence et de cr´eer une variable dichotomique pour la cat´egorieafam. La section de ces notes sur la multicollin´earit´e parfaite nous a appris que nous ne pouvons pas inclure une constante, une variable

dichotomique pour la cat´egoriecauc,etune variable dichotomique pour la cat´egorieafam.

Comme dans le cas du mod`ele de r´egression simple, le code ci-dessus estime le mod`ele par MCO utilisant les options par d´efaut. La fonctionlmutilise par d´efaut une hypoth`ese

d’homosc´edasticit´e. Donc, les ´ecarts types des deux coefficientsne sont pasdes ´ecarts types robustes. Afin d’obtenir des ´ecarts types robustes `a la pr´esence de l’h´et´erosc´edasticit´e, il faut utiliser la commande suivante :

R> coeftest(CPS lm, vcov=vcovHC)

Les r´esultats de cette commande sont comme suit : t test of coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 4.3214e+00 2.0614e-02 209.630 <2e-16 experience 7.7473e-02 1.0188e-03 76.046 <2e-16 I(experienceˆ2) -1.3161e-03 2.3486e-05 -56.035 <2e-16

Comme dans l’exemple pr´esent´e dans le chapitre pr´ec´edent, ce mod`ele est un exemple d’un mod`ele o`u il n’y a pas une grande diff´erence entre les ´ecarts types robustes et non robustes.

Puisque l’ordinateur est capable de calculer les ´ecarts types en une fraction de seconde, il coˆute presque rien de les calculer des deux fac¸ons afin de v´erifier si les r´esultats sont semblables ou non.

Nous pouvons aussi effectuer des tests de restrictions sur le mod`ele estim´e. Nous pouvons sp´ecifier la matriceRet le vecteurrcomme dans les notes de cours. La forme g´en´erale d’un test d’hypoth`eses lin´eaires dansRest

linearHypothesis(unrestricted,bigr,littler)

Ici,unrestricted est le nom du mod`ele lin´eaire estim´e,bigr est la matriceR, etlittler est le vecteurrdes notes. Afin d’utiliser la matrice de variance-covariance robuste, il faut sp´ecifier la commande de la mani`ere suivante :

linearHypothesis(unrestricted,bigr,littler,white.adjust=HC)

Voici un exemple de test dans le contexte du mod`ele estim´e dans cet encadr´e. si on voulait, par exemple, tester la significativit´e de l’exp´erience, il faut test la significativit´e dedeux coefficients, le terme lin´eaire et le terme au carrr´e. L’hypoth`ese nulle jointe serait β12 = 0. Sous forme matricielle, on aurait

D’abord, il faut d´efinir les matricesRetrdans le langageR.

R> bigr <- rbind(c(0,1,0,0,0),c(0,0,1,0,0)) R> littler <- rbind(0,0)

Pour plus de pr´ecisions, on peut invoquer la commandehelp(rbind). Maintenant, on peut invoquer la commandelinearHypothesistelle que sp´ecifi´ee ci-dessus.

12 Un Autre Exemple

Je pr´esente ici un autre exemple d´etaill´e, bas´e sur la derni`ere question du dernier tp du trimestre d’hiver 2012. Le codeRest comment´e et donc les commandes devraient ˆetre compr´ehensible au lecteur.

D’abord, voici la question du tp.

Pr´eambule

L’exercice est bas´e sur l’article de Mankiw, Romer et Weil (1992). Soit la fonction de production agr´eg´ee donn´ee par

Yt =Ktα(AtLt)(1−α)

o`uYtest le PIB r´eel,Ktle stock de capital,Atle niveau du progr`es technique, etLtl’emploi total. On peut transformer cette ´equation de la mani`ere suivante :

Yt Lt

=At Kt

AtLt α

Supposons que le progr`es technique croˆıt `en moyenne `a un rythme constant et ´egal `a travers les pays diff´erents :

Ai,t =Ai,0egt

o`ug est le taux de croissance du progr`es technique,Ai,0 le niveau initial du progr`es technique pour le paysi, etAi,tle niveau du progr`es technique au paysien p´eriodet. Le mod`ele de

Solow pr´editqu’`a long termele ratio du capital par travailleur effectif est donn´e par Kt

AtLt

≡kt =k = s n+g+δ

o`unest le taux de croissance de la population active etδest le taux de d´epr´eciation du

capital. Supposons un niveauinitialdu progr`es technique qui peut d´ependre du pays (dotation initiale en ressources naturelles, etc., tel que

ln (Ai,0) =a+εi.

Donc, nous avons qu’`a long terme Yi,t

Li,t

=Ai,tkiαi

⇒ln Yi,t

Li,t

=a+gt+αsi−α(ni+g+δ) +εi

o`u nous supposonsg etδconstants `a travers les pays diff´erents. Si on supposet = 0pour simplifier nous pouvons ´ecrire

ln Yi

Li

=a+αsi−α(ni+g+δ) +εi. (3)

Si on ajoute le capital humain au mod`ele, la fonction de production devient

Yt =KtαHtβ(AtLt)(1−α−β),

o`uHtest le capital humain. On peut montrer (voir l’article pour les d´etails) que l’´equivalent de (3) devient

ln Yi

Li

=a+ α

1−α−βsi+ β

1−α−βshi − α+β

1−α−β(ni+g+δ) +εi. (4) La variableshi est le taux d’investissement dans le capital humain.

Donn´ees

T´el´echargez le fichier de donn´ees (en formatSTATA) :

http://www.er.uqam.ca/nobel/r10735/4272/GrowthDJ.dta

Vous devriez ˆetre capables de les importer facilement avecGRETL. Si vous utilisezR, la base de donn´ees se retrouve dans lalibrary AER. Les donn´ees sont pour un ´echantillon de 121 pays et sont :

• oil : pays o`u l’industrie p´etroli`ere est l’industrie dominante (yes) ou non

• inter : pays avec une population au moins ´egale `a un million en 1960 et avec des donn´ees relativement fiables selon Heston et Summers (1987) (yes) ou non

• oecd : pays membre de l’OCD ´E (yes) ou non

• gdp60 : niveau r´eel du PIB par habitant en 1960

• gdp85 : niveau r´eel du PIB par habitant en 1985

• gdpgrowth : taux de croissance moyen du PIB r´eel par habitant entre 1960 et 1985

• popgrowth : taux de croissance moyen de la population entre 1960 et 1985

• invest : valeur moyenne du ratio investissement sur PIB entre 1960 et 1985

• school : ratio moyen des inscriptions `a l’´ecole secondaire sur la population en ˆage de travailler.

• literacy60 : taux d’alphab´etisation en 1960

Les donn´ees correspondent `a l’Annexe de l’article de Mankiw, Romer et Weil (1992). Pour

l’identit´e des pays, il faut r´ef´erer `a cette annexe.

Exercice

1. Estimez un mod`ele de r´egression multiple o`ugdp85est la variable d´ependante et les variables explicatives sont une constante,investpour mesurersi et

(popgrowth+0.05) pour mesurer(ni+g+δ)(nous supposons

qu’approximativementg+δ= 0.05). Ce mod`ele ´equivaut au mod`ele de Solow sans capital humain. Estimez en calculant des ´ecarts types non robustesetrobustes.

Commentez ce que vous trouvez. Pour les sous-questions qui suivent, vous pouvez vous limiter `a des estimations et des tests qui utilisent la matrice de

variance-covariance robuste.

2. Le mod`ele de Solow pr´edit que les coefficients sur le taux d’´epargnesi et le taux de croissance de la population(ni+ 0.05)devraient ˆetre de signe oppos´e mais ´egaux en valeur absolue. Testez cette hypoth`ese. Le mod`ele pr´edit aussi que ces deux

coefficients devraient ˆetre ´egaux en valeur absolue `a la part du capital dans le revenu national (α), soit environ 1/3. Testez cette hypoth`ese jointe.

3. Enlevez de l’´echantillon les pays o`u l’industrie p´etroli`ere est l’industrie dominante.

Refaites les estimations et tests des 2 premi`eres sous-parties.

4. Enlevez maintenant les pays o`u l’industrie p´etroli`ere est dominante et les pays qui ont une population inf´erieure `a un million en 1960 ou qui ont des donn´ees relativement peu fiables. Refaites les estimations et tests des 2 premi`eres sous-parties. Gardez cet

´echantillon restreint pour le reste des sous-parties. En principe vous devriez avoir 75 observations.

5. Maintenant, supposons que les pays membres de l’OCDE ont un comportement diff´erent des autres pays. Soitoecdla variable qui prend une valeur unitaire si le pays est membre de l’OCDE et z´ero autrement. Incluez comme variables explicatives des

variables d’interaction entreoecdet les autres variables explicatives `a part la constante.

6. Testez significitivit´e (individuelle et jointe) de ces termes d’interaction.

7. Ajoutez la variableschoolau mod`ele comme proxy poursh, avec un terme

d’interaction pour les pays de l’OCDE. Le mod`ele maintenant ´equivaut au mod`ele de Solow avec l’ajout du capital humain, avec un terme d’interaction pour les pays de l’OCDE.

8. Testez la significativit´e des deux variables additionelles (schoolet le terme d’interaction entreschoolet le fait d’ˆetre membre de l’OCDE).

9. Le mod`ele augment´e pr´edit que coefficient de la variable associ´e au taux d’´epargnes devrait maintenant ˆetre sup´erieur `a la part du capital. Testez cette hypoth`ese en appliquant un test avec hypoth`ese alternative unilat´erale au coefficient associ´e `a schoolseulement.

10. Le mod`ele augment´e pr´edit que la somme des coefficients surschooletinvest devrait ˆetre ´egale `a moins le coefficient sur (popgrowth+0.05). Testez cette hypoth`ese, pour les pays non membres de l’OCDE seulement.

11. Ajoutez leniveaudu PIB par habitant en 1960 au mod`ele mesur´e pargdp60, avec un terme d’interaction entregdp60et le fait d’ˆetre membre de l’OCDE. La

significatitivit´e du coefficient associ´e `a cette variable nous permet de tester l’hypoth`ese deconvergence. Testez la significativit´e de la variablegdp60. Testez maintenant la significativit´e jointe de cette variable et du coefficient associ´e au terme d’interaction.

12. Revenez au mod`ele sans le niveau du PIB par habitant en 1960. Construisez un graphique avec les r´esidus au carr´e sur l’axe vertical et la variable d´ependante sur l’axe horizontal. Est-ce que vous rep´erez des valeurs aberrantes (outliers) ? Qu’est-ce qui arrive si vous refaites l’analyse en enlevant les observations associ´ees aux valeurs aberrantes des r´esidus au carr´e ?

13. Commentez la validit´e de vos tests d’hypoth`ese. Est-ce qu’il y a assez d’observations pour supposer la normalit´e approximative des statistiques calcul´ees ? Par contre, bas´e sur une analyse des r´esidus, est-ce que les erreurs du mod`ele semblent ˆetre normales et homosc´edastiques, ce qui permettrait d’utiliser de tests exacts en ´echantillon fini ? Justifiez.

R´ef´erences

Mankiw, N. Gregory, David Romer et Philippe Weil (1992), “A Contribution to the Empirics of Economic Growth.”Quarterly Journal of Economics107, 407–437

Heston, Alan et Robert Summers (1987), “A New Set of International Comparisons of Real Product and Price Levels : Estimates for 130 Countries 1950–85.”Review of Income and Wealth34, 1–26

Maintenant, voici le code enRpour estimer le mod`ele et r´epondre aux questions du tp. Les mˆemes remarques s’appliquent que pour l’exemple pr´ec´edent. Les commandescoeftestet linearHypothesisd´ependent delibrarysqui doivent ˆetre install´ees et charg´ees en m´emoire.

#

# Charger en m´emoire la biblioth`eque AER.

#

library("AER")

#

# Charger en m´emoire les biblioth`eques n´ecessaires

# pour effectuer les tests d’hypoth`eses multiples.

# La biblioth`eque AER requiert les autres

# biblioth`eques, alors ces commandes ne sont pas

# strictement n´ecessaires, mais pourraient l’ˆetre

# pour d’autres applications.

#

library("car")

library("sandwich") library("lmtest")

#

# Charger en m´emoire les donn´ees de la banque

# GrowthDJ.

#

data("GrowthDJ",package="AER")

#

# Imprimer un r´esum´e des donn´ees dans GrowthDJ.

#

attributes(GrowthDJ)

#

# Imprimer des statistique descriptives concernant

# les variables dans GrowthDJ.

#

summary(GrowthDJ)

#

# Estimer le premier mod`ele.

#

growth_mod<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=GrowthDJ)

#

# Imprimer les r´esultats sous l’homosc´edasticit´e.

#

summary(growth_mod)

#

# Imprimer les r´esultats sous l’h´et´erosc´edasticit´e

# pour comparaison.

#

coeftest(growth_mod,vcov=vcovHC)

#

# Tester l’hypoth`ese que les 2 coefficients sont

# ´egaux mais de signe oppos´e.

#

linearHypothesis(growth_mod,c(0,1,-1),0,white.adjust=FALSE)

#

# Mˆeme test, h´et´erosc´edasticit´e.

#

linearHypothesis(growth_mod,c(0,1,-1),0,white.adjust=TRUE)

#

# Enlever les observations de pays qui d´ependent du

# p´etrole.

#

Growth2<−subset(GrowthDJ,GrowthDJ$oil=="no")

#

# R´eestimer le mod`ele avec l’´echantillon restreint.

#

growth_mod2<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=Growth2)

#

# Imprimer les r´esultats d’estimation sous

# l’homosc´edasticit´e.

#

summary(growth_mod2)

#

# Imprimer les r´esultats d’estimation avec

# ´ecarts types robustes.

#

coeftest(growth_mod2,vcov=vcovHC)

#

# Tester l’hypoth`ese que les 2 coefficients sont

# ´egaux mais de signe oppos´e.

#

linearHypothesis(growth_mod2,c(0,1,-1),0,white.adjust=FALSE)

#

# Mˆeme test, matrice variance-covariance robuste.

#

linearHypothesis(growth_mod2,c(0,1,-1),0,white.adjust=TRUE)

#

# Enlever les observations de pays trop petits

# et/ou avec donn´ees non fiables.

#

Growth3<−subset(GrowthDJ,GrowthDJ$oil=="no")

Growth3<−subset(Growth3,Growth3$inter=="yes")

#

# Estimer le nouveau mod`ele.

#

growth_mod3<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=Growth3)

#

# Imprimer les r´esultats sous l’homosc´edasticit´e.

#

summary(growth_mod3)

#

# Imprimer les r´esultats sous l’h´et´erosc´edasticit´e

# pour comparaison.

#

coeftest(growth_mod3,vcov=vcovHC)

#

# Estimer le mod`ele avec termes d’interaction pour

# les pays de l’OCDE.

#

growth_mod4<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05) +

log(invest):oecd + I(popgrowth+0.05):oecd, data=Growth3)

#

# Imprimer les r´esultats sous l’homosc´edasticit´e.

#

summary(growth_mod4)

#

# Imprimer les r´esultats sous l’h´et´erosc´edasticit´e

# pour comparaison.

#

coeftest(growth_mod4,vcov=vcovHC)

#

# Tester la significativit´e jointe des 2 termes

# d’interaction.

#

bigr<−rbind(c(0,0,0,1,0),c(0,0,0,0,1)) litr<−rbind(0,0)

linearHypothesis(growth_mod4,bigr,litr,white.adjust=FALSE)

#

# Mˆeme test avec matrice variance-covariance

# robuste.

#

linearHypothesis(growth_mod4,bigr,litr,white.adjust=HC)

#

# Estimer le mod`ele en ajoutant school.

#

growth_mod5<−lm(log(gdp85) log(invest) + I(popgrowth+0.05) + school

+ log(invest):oecd + I(popgrowth+0.05):oecd + school:oecd, data=Growth3)

#

# Tester la restriction sur les 3 coefficients

#

bigr<−c(0,1,1,-1,0,0,0) litr<−0

linearHypothesis(growth_mod5,bigr,litr,white.adjust=FALSE)

#

#Mˆeme test avec matrice variance-covariance

# robuste.

#

linearHypothesis(growth_mod5,bigr,litr,white.adjust=TRUE)

#

# Estimer le mod`ele avec gdp60.

#

growth_mod6<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05) + school + log(gdp60) + log(invest):oecd +

I(popgrowth+0.05):oecd

+ school:oecd + log(gdp60):oecd, data=Growth3)

#

# Tester la significativit´e de la convergence.

#

bigr<−rbind(c(0,0,0,0,1,0,0,0,0),c(0,0,0,0,0,0,0,0,1)) litr<−rbind(0,0)

linearHypothesis(growth_mod6,bigr,litr,white.adjust-FALSE) linearHypothesis(growth_mod6,bigr,litr,white.adjust=TRUE)

L’output de ces commandes se trouve ci-dessous. J’ai converti les tableauxRen format LATEX `a l’aide du packagetexreg. Pour l’instant, j’ai inclus seulement les r´esultats d’estimation des mod`eles diff´erents sous l’hypoth`ese d’homosc´edasticit´e.

Model 1

(Intercept) 3.95∗∗∗

(0.54) log(invest) 1.51∗∗∗

(0.16) I(popgrowth + 0.05) -0.01

(0.08)

R2 0.47

Adj. R2 0.46

Num. obs. 107

***p <0.01,**p <0.05,*p < 0.1

Model 2

(Intercept) 4.69∗∗∗

(0.49) log(invest) 1.44∗∗∗

(0.14) I(popgrowth + 0.05) -0.27∗∗∗

(0.08)

R2 0.59

Adj. R2 0.59

Num. obs. 98

***p <0.01,**p <0.05,*p < 0.1

Model 3

(Intercept) 5.20∗∗∗

(0.58) log(invest) 1.33∗∗∗

(0.17) I(popgrowth + 0.05) -0.28∗∗∗

(0.08)

R2 0.59

Adj. R2 0.58

Num. obs. 75

***p <0.01,**p <0.05,*p < 0.1

Model 4

(Intercept) 5.08∗∗∗

(0.55)

log(invest) 1.03∗∗∗

(0.18)

I(popgrowth + 0.05) 0.03

(0.13) log(invest) :oecdyes 0.34∗∗

(0.14) I(popgrowth + 0.05) :oecdyes -0.11

(0.24)

R2 0.66

Adj. R2 0.64

Num. obs. 75

***p <0.01,**p <0.05,*p < 0.1

Model 5

(Intercept) 5.56∗∗∗

(0.47)

log(invest) 0.55∗∗∗

(0.17)

I(popgrowth + 0.05) 0.06

(0.10)

school 0.14∗∗∗

(0.03) log(invest) :oecdyes 0.42∗∗

(0.19) I(popgrowth + 0.05) :oecdyes -0.21

(0.20)

school :oecdyes -0.05

(0.06)

R2 0.77

Adj. R2 0.75

Num. obs. 75

***p <0.01,**p <0.05,*p < 0.1

Model 6

(Intercept) 1.51∗∗∗

(0.54)

log(invest) 0.48∗∗∗

(0.12)

I(popgrowth + 0.05) 0.05

(0.07)

school 0.05∗∗∗

(0.02)

log(gdp60) 0.63∗∗∗

(0.07) log(invest) :oecdyes 0.08

(0.29) I(popgrowth + 0.05) :oecdyes -0.17

(0.13)

school :oecdyes -0.04

(0.04)

log(gdp60) :oecdyes 0.07

(0.12)

R2 0.90

Adj. R2 0.89

Num. obs. 75

***p <0.01,**p <0.05,*p < 0.1

13 Concepts `a retenir

• La sp´ecification matricielle du mod`ele de r´egression multiple.

• Les hypoth`eses de base du mod`ele de r´egression multiple.

• Etre capable de suivre et comprendre le calcul de l’estimateur MCO en notationˆ matricielle.

• Etre capable de suivre et comprendre le calcul de l’estimateur MCO en notation nonˆ matricielle.

• Etre capable de suivre les preuves des propri´et´es alg´ebriques de l’estimateur MCO et deˆ

• Etre capable de suivre les preuves des propri´et´es alg´ebriques de l’estimateur MCO et deˆ

Documents relatifs