Trucs pratiques - D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Uni

oùρ²_X₁_,X₂ est le coefficient de corrélation entreX₁etX₂ au carré. En regardant cette expression, il est clair que la varianceσ²_ˆ

β1 du paramètre estiméβˆ1va croˆıtre avec la valeur absolue du coefficient de corrélation entreX1 etX2. On peut aussi montrer que la variance de βˆ₂ est donnée par

Encore une fois, sa variance augmente avec la valeur absolue du coefficient de corr´eltation entreX₁ etX₂.

La multicollinéarité imparfaite traduit le fait qu’il peut être très difficile (sinon impossible), statistiquement parlant, d’isoler l’impact individuel de chacune de deux variables explicatives qui sont fortement corrélées. C’est possible que chacune des deux variables soit non significative sur la base d’un test d’hypothèse simple (basé sur une statistiquet), tandis qu’un test de l’hypothèse nulle jointe que les deux variables sont non significatives rejette cette hypothèse nulle sur la base d’une statistiqueF. En interprétant les résultats d’une telle régression, il est important d’insister sur l’importance du bloc de deux variables pour expliquer la variable dépendante, tout en

soulignant l’impossibilité d’attribuer l’importance à une variable particulière à cause du problème de multicollinéarité imparfaite.

10.3 Trucs pratiques

• Si vous avez une banque de données avec plusieurs variables explicatives potentielles, il pourrait être intéressant de calculer la matrice de tous les coefficients de corrélation entre toutes les paires de variables. Ceci peut faire apparaˆıtre des problèmes potentiels de multicollinéarité.

• Lorsque vous estimez un modèle de régression multiple, il pourrait être intéressant, si votre logiciel permet de le faire facilement, de calculer la valeur du

conditionnement de la matrice(X⁰X), donnée par le ratio de la plus grande valeur caractéristique de la matrice sur la plus petite valeur caractéristique. Si ce chiffre est très élevée, on dit que la matrice estmal conditionnée, ce qui peut occasionner des erreurs numériques importantes. Une matrice mal conditionnée est presque singulière.

11 Un Exemple

Je présente ici un autre exemple en codeRpour illustrer sa puissance et le fait que (même en n’utilisant pas une des interfaces graphiques disponibles) il est relativement facile à utiliser. On peut télécharger une banque de données, estimer un modèle de régression multiple, et faire imprimer les résultats dans un fichier en six lignes de code. Notez que les commandes

coeftestetlinearHypothesisse trouvent dans les packageslmtestetcar. Il faut les charger en mémoire et il faut aussi les installer si ce n’est pas déjà fait. On peut les installer avec les commandes suivantes.

R> install.packages("car") R> install.packages("lmtest")

En Linux, il est toujours conseill´e d’installer les packages comme administrateur ou super-utilisateur :

R> sudo install.packages("car") R> sudo install.packages("lmtest")

Par la suite, on les charge en m´emoire avec les commandes suivantes.

R> library("car") R> library("lmtest")

Voci l’exemple.

Voici un exemple d’estimation d’un modèle de régression multiple avec le logicielR. Encore une fois, vous pouvez facilement jouer avec le code une fois que le logiciel est installé.

R> data("CPS1988", package="AER")

R> CPS lm <- lm(log(wage) ∼ experience + I(experienceˆ2) + education + ethnicity, data=CPS1988)

R> summary(CPS lm)

R> outfile <- file("regsumm.out", "w")

R> capture.output(summary(CPS lm), file=outfile) R> close(outfile)

Les données sont dans une banque de données qui s’appelleCPS1988. Il s’agit d’une coupe transversale de 28 155 observations recueillies par le Bureau du Recensement aux États Unis dans le cadre du sondage Current Population Survey. Les données portent sur les

hommes agés de 18 à 70 ans avec un revenu supérieur à 50 $ qui ne sont ni travailleurs autonomes ni en train de travailler sans rémunération. Voir la description plus détaillée dans Kleiber et Zeileis (2008, p.65).

La variable dépendante du modèle est le salaire réel (dollars par semaine) mesuré en logs. La variable explicativeexperienceest l’expérience de travail mesurée en années, la variable educationest le nombre d’années de formation mesuré en années, et la variable

ethnicityest une variable dichotomiques prenant les valeurscauc(blanc) etafam (afro-am´ericain). Notez qu’il s’agit d’une variable dichotomique qui ne prend pas des valeurs

chiffr´ees (0 ou 1 par exemple) :Rva pouvoir tenir compte de ceci automatiquement.

Il faut avoir install´e le paquetageAER avec la commande suivante : install.packages("AER")

Cette commande va télécharger et installer le paquetage automatiquement à partir d’un des dépôts d’archivesR. (Notez que sous Linux il est préférable d’installer le paquetage comme administrateur du système, autrement dit comme super-utilisateur).

Il est possible de générer un résumé des propriétés des données avec les commande suivante.

R> data(¨CPS1988¨) R> summary(CPS1988)

Voir Kleiber et Zeileis (2008, p.66) pour les r´esultats de cette commande.

• La commandedata(·)charge la banque de donn´ees.

• La commandelm(·)estime le modèle de régression multiple par MCO, et la commandejour lm<-place les résultats dans la variablejour lm.

• La commandesummary(·)imprime les résultats de la régression à l’écran.

• La commandeoutfile<-crée un fichier texte où on peut envoyer les résultats.

• La commandecapture.output(·)envoie les résultats dans le fichier qui a été créé.

• La commandeclose(·)ferme le fichier.

La fonctionI()dit àRd’interpréter l’opérateurˆcomme un opérateur algébrique standard, puisqu’il a aussi une interprétation spéciale enR.

Les r´esultats de l’estimation sont comme suit : Call:

lm(formula = log(wage) ∼ experience + I(experienceˆ2) + education + ethnicity, data = CPS1988)

Residuals:

Min 1Q Median 3Q Max

-2.943 -0.316 0.058 0.376 4.383

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 4.321395 0.019174 225.4 <2e-16 experience 0.077473 0.000880 88.0 <2e-16 I(experienceˆ2) -0.001316 0.000019 -69.3 <2e-16 education 0.085673 0.001272 67.3 <2e-16 ethnicityafam -0.243364 0.012918 -18.8 <2e-16 Residual standard error: 0.584 on 28150 degrees of freedom Multiple R-squared: 0.335, Adjusted R-squared: 0.335

F-statistic: 3.54e+03 on 4 and 28150 DF, p-value: <2e-16

Vous devriez être en mesure de comprendre tous les éléments de l’output, à part la

signification du coefficientethnicityafam. Ce coefficient est créé automatiquement par R, qui a choisi de traiter la catégoriecauccomme la catégorie de référence et de créer une variable dichotomique pour la catégorieafam. La section de ces notes sur la multicollinéarité parfaite nous a appris que nous ne pouvons pas inclure une constante, une variable

dichotomique pour la cat´egoriecauc,etune variable dichotomique pour la cat´egorieafam.

Comme dans le cas du modèle de régression simple, le code ci-dessus estime le modèle par MCO utilisant les options par défaut. La fonctionlmutilise par défaut une hypothèse

d’homoscédasticité. Donc, les écarts types des deux coefficientsne sont pasdes écarts types robustes. Afin d’obtenir des écarts types robustes à la présence de l’hétéroscédasticité, il faut utiliser la commande suivante :

R> coeftest(CPS lm, vcov=vcovHC)

Les r´esultats de cette commande sont comme suit : t test of coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 4.3214e+00 2.0614e-02 209.630 <2e-16 experience 7.7473e-02 1.0188e-03 76.046 <2e-16 I(experienceˆ2) -1.3161e-03 2.3486e-05 -56.035 <2e-16

Comme dans l’exemple présenté dans le chapitre précédent, ce modèle est un exemple d’un modèle où il n’y a pas une grande différence entre les écarts types robustes et non robustes.

Puisque l’ordinateur est capable de calculer les écarts types en une fraction de seconde, il coûte presque rien de les calculer des deux façons afin de vérifier si les résultats sont semblables ou non.

Nous pouvons aussi effectuer des tests de restrictions sur le modèle estimé. Nous pouvons spécifier la matriceRet le vecteurrcomme dans les notes de cours. La forme générale d’un test d’hypothèses linéaires dansRest

linearHypothesis(unrestricted,bigr,littler)

Ici,unrestricted est le nom du modèle linéaire estimé,bigr est la matriceR, etlittler est le vecteurrdes notes. Afin d’utiliser la matrice de variance-covariance robuste, il faut spécifier la commande de la manière suivante :

linearHypothesis(unrestricted,bigr,littler,white.adjust=HC)

Voici un exemple de test dans le contexte du modèle estimé dans cet encadré. si on voulait, par exemple, tester la significativité de l’expérience, il faut test la significativité dedeux coefficients, le terme linéaire et le terme au carrré. L’hypothèse nulle jointe serait β₁ =β₂ = 0. Sous forme matricielle, on aurait

D’abord, il faut d´efinir les matricesRetrdans le langageR.

R> bigr <- rbind(c(0,1,0,0,0),c(0,0,1,0,0)) R> littler <- rbind(0,0)

Pour plus de précisions, on peut invoquer la commandehelp(rbind). Maintenant, on peut invoquer la commandelinearHypothesistelle que spécifiée ci-dessus.

12 Un Autre Exemple

Je présente ici un autre exemple détaillé, basé sur la dernière question du dernier tp du trimestre d’hiver 2012. Le codeRest commenté et donc les commandes devraient être compréhensible au lecteur.

D’abord, voici la question du tp.

Pr´eambule

L’exercice est basé sur l’article de Mankiw, Romer et Weil (1992). Soit la fonction de production agrégée donnée par

Y_t =K_t^α(A_tL_t)^(1−α)

oùY_test le PIB réel,K_tle stock de capital,A_tle niveau du progrès technique, etL_tl’emploi total. On peut transformer cette équation de la manière suivante :

Y_t L_t

=A_t K_t

A_tL_t α

Supposons que le progrès technique croˆıt èn moyenne à un rythme constant et égal à travers les pays différents :

A_i,t =A_i,0e^gt

oùg est le taux de croissance du progrès technique,A_i,0 le niveau initial du progrès technique pour le paysi, etA_i,tle niveau du progrès technique au paysien périodet. Le modèle de

Solow préditqu’à long termele ratio du capital par travailleur effectif est donné par K_t

A_tL_t

≡k_t =k^∗ = s n+g+δ

oùnest le taux de croissance de la population active etδest le taux de dépréciation du

capital. Supposons un niveauinitialdu progr`es technique qui peut d´ependre du pays (dotation initiale en ressources naturelles, etc., tel que

ln (A_i,0) =a+ε_i.

Donc, nous avons qu’`a long terme Y_i,t

L_i,t

=A_i,tk_i^∗^α+ε_i

⇒ln Y_i,t

L_i,t

=a+gt+αs_i−α(n_i+g+δ) +ε_i

où nous supposonsg etδconstants à travers les pays différents. Si on supposet = 0pour simplifier nous pouvons écrire

ln Y_i

L_i

=a+αs_i−α(n_i+g+δ) +ε_i. (3)

Si on ajoute le capital humain au mod`ele, la fonction de production devient

Y_t =K_t^αH_t^β(A_tL_t)^{(1−α−β)},

oùH_test le capital humain. On peut montrer (voir l’article pour les détails) que l’équivalent de (3) devient

ln Y_i

=a+ α

1−α−βs_i+ β

1−α−βs^h_i − α+β

1−α−β(n_i+g+δ) +ε_i. (4) La variables^h_i est le taux d’investissement dans le capital humain.

Donn´ees

Téléchargez le fichier de données (en formatSTATA) :

http://www.er.uqam.ca/nobel/r10735/4272/GrowthDJ.dta

Vous devriez être capables de les importer facilement avecGRETL. Si vous utilisezR, la base de données se retrouve dans lalibrary AER. Les données sont pour un échantillon de 121 pays et sont :

• oil : pays où l’industrie pétrolière est l’industrie dominante (yes) ou non

• inter : pays avec une population au moins égale à un million en 1960 et avec des données relativement fiables selon Heston et Summers (1987) (yes) ou non

• oecd : pays membre de l’OCD ´E (yes) ou non

• gdp60 : niveau r´eel du PIB par habitant en 1960

• gdp85 : niveau r´eel du PIB par habitant en 1985

• gdpgrowth : taux de croissance moyen du PIB r´eel par habitant entre 1960 et 1985

• popgrowth : taux de croissance moyen de la population entre 1960 et 1985

• invest : valeur moyenne du ratio investissement sur PIB entre 1960 et 1985

• school : ratio moyen des inscriptions à l’école secondaire sur la population en âge de travailler.

• literacy60 : taux d’alphab´etisation en 1960

Les donn´ees correspondent `a l’Annexe de l’article de Mankiw, Romer et Weil (1992). Pour

l’identité des pays, il faut référer à cette annexe.

Exercice

1. Estimez un modèle de régression multiple oùgdp85est la variable dépendante et les variables explicatives sont une constante,investpour mesurers_i et

(popgrowth+0.05) pour mesurer(n_i+g+δ)(nous supposons

qu’approximativementg+δ= 0.05). Ce modèle équivaut au modèle de Solow sans capital humain. Estimez en calculant des écarts types non robustesetrobustes.

Commentez ce que vous trouvez. Pour les sous-questions qui suivent, vous pouvez vous limiter `a des estimations et des tests qui utilisent la matrice de

variance-covariance robuste.

2. Le modèle de Solow prédit que les coefficients sur le taux d’épargnes_i et le taux de croissance de la population(n_i+ 0.05)devraient être de signe opposé mais égaux en valeur absolue. Testez cette hypothèse. Le modèle prédit aussi que ces deux

coefficients devraient être égaux en valeur absolue à la part du capital dans le revenu national (α), soit environ 1/3. Testez cette hypothèse jointe.

3. Enlevez de l’échantillon les pays où l’industrie pétrolière est l’industrie dominante.

Refaites les estimations et tests des 2 premi`eres sous-parties.

4. Enlevez maintenant les pays où l’industrie pétrolière est dominante et les pays qui ont une population inférieure à un million en 1960 ou qui ont des données relativement peu fiables. Refaites les estimations et tests des 2 premières sous-parties. Gardez cet

´echantillon restreint pour le reste des sous-parties. En principe vous devriez avoir 75 observations.

5. Maintenant, supposons que les pays membres de l’OCDE ont un comportement diff´erent des autres pays. Soitoecdla variable qui prend une valeur unitaire si le pays est membre de l’OCDE et z´ero autrement. Incluez comme variables explicatives des

variables d’interaction entreoecdet les autres variables explicatives `a part la constante.

6. Testez significitivit´e (individuelle et jointe) de ces termes d’interaction.

7. Ajoutez la variableschoolau mod`ele comme proxy pours^h, avec un terme

d’interaction pour les pays de l’OCDE. Le modèle maintenant équivaut au modèle de Solow avec l’ajout du capital humain, avec un terme d’interaction pour les pays de l’OCDE.

8. Testez la significativit´e des deux variables additionelles (schoolet le terme d’interaction entreschoolet le fait d’ˆetre membre de l’OCDE).

9. Le modèle augmenté prédit que coefficient de la variable associé au taux d’épargnes devrait maintenant être supérieur à la part du capital. Testez cette hypothèse en appliquant un test avec hypothèse alternative unilatérale au coefficient associé à schoolseulement.

10. Le modèle augmenté prédit que la somme des coefficients surschooletinvest devrait être égale à moins le coefficient sur (popgrowth+0.05). Testez cette hypothèse, pour les pays non membres de l’OCDE seulement.

11. Ajoutez leniveaudu PIB par habitant en 1960 au modèle mesuré pargdp60, avec un terme d’interaction entregdp60et le fait d’être membre de l’OCDE. La

significatitivité du coefficient associé à cette variable nous permet de tester l’hypothèse deconvergence. Testez la significativité de la variablegdp60. Testez maintenant la significativité jointe de cette variable et du coefficient associé au terme d’interaction.

12. Revenez au modèle sans le niveau du PIB par habitant en 1960. Construisez un graphique avec les résidus au carré sur l’axe vertical et la variable dépendante sur l’axe horizontal. Est-ce que vous repérez des valeurs aberrantes (outliers) ? Qu’est-ce qui arrive si vous refaites l’analyse en enlevant les observations associées aux valeurs aberrantes des résidus au carré ?

13. Commentez la validité de vos tests d’hypothèse. Est-ce qu’il y a assez d’observations pour supposer la normalité approximative des statistiques calculées ? Par contre, basé sur une analyse des résidus, est-ce que les erreurs du modèle semblent être normales et homoscédastiques, ce qui permettrait d’utiliser de tests exacts en échantillon fini ? Justifiez.

R´ef´erences

Mankiw, N. Gregory, David Romer et Philippe Weil (1992), “A Contribution to the Empirics of Economic Growth.”Quarterly Journal of Economics107, 407–437

Heston, Alan et Robert Summers (1987), “A New Set of International Comparisons of Real Product and Price Levels : Estimates for 130 Countries 1950–85.”Review of Income and Wealth34, 1–26

Maintenant, voici le code enRpour estimer le modèle et répondre aux questions du tp. Les mêmes remarques s’appliquent que pour l’exemple précédent. Les commandescoeftestet linearHypothesisdépendent delibrarysqui doivent être installées et chargées en mémoire.

# Charger en m´emoire la biblioth`eque AER.

library("AER")

# Charger en mémoire les bibliothèques nécessaires

# pour effectuer les tests d’hypoth`eses multiples.

# La biblioth`eque AER requiert les autres

# biblioth`eques, alors ces commandes ne sont pas

# strictement n´ecessaires, mais pourraient l’ˆetre

# pour d’autres applications.

library("car")

library("sandwich") library("lmtest")

# Charger en m´emoire les donn´ees de la banque

# GrowthDJ.

data("GrowthDJ",package="AER")

# Imprimer un résumé des données dans GrowthDJ.

attributes(GrowthDJ)

# Imprimer des statistique descriptives concernant

# les variables dans GrowthDJ.

summary(GrowthDJ)

# Estimer le premier mod`ele.

growth_mod<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=GrowthDJ)

# Imprimer les résultats sous l’homoscédasticité.

summary(growth_mod)

# Imprimer les résultats sous l’hétéroscédasticité

# pour comparaison.

coeftest(growth_mod,vcov=vcovHC)

# Tester l’hypoth`ese que les 2 coefficients sont

# ´egaux mais de signe oppos´e.

linearHypothesis(growth_mod,c(0,1,-1),0,white.adjust=FALSE)

# Même test, hétéroscédasticité.

linearHypothesis(growth_mod,c(0,1,-1),0,white.adjust=TRUE)

# Enlever les observations de pays qui d´ependent du

# p´etrole.

Growth2<−subset(GrowthDJ,GrowthDJ$oil=="no")

# Réestimer le modèle avec l’échantillon restreint.

growth_mod2<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=Growth2)

# Imprimer les r´esultats d’estimation sous

# l’homosc´edasticit´e.

summary(growth_mod2)

# Imprimer les r´esultats d’estimation avec

# ´ecarts types robustes.

coeftest(growth_mod2,vcov=vcovHC)

# Tester l’hypoth`ese que les 2 coefficients sont

# ´egaux mais de signe oppos´e.

linearHypothesis(growth_mod2,c(0,1,-1),0,white.adjust=FALSE)

# Mˆeme test, matrice variance-covariance robuste.

linearHypothesis(growth_mod2,c(0,1,-1),0,white.adjust=TRUE)

# Enlever les observations de pays trop petits

# et/ou avec donn´ees non fiables.

Growth3<−subset(GrowthDJ,GrowthDJ$oil=="no")

Growth3<−subset(Growth3,Growth3$inter=="yes")

# Estimer le nouveau mod`ele.

growth_mod3<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05), data=Growth3)

# Imprimer les résultats sous l’homoscédasticité.

summary(growth_mod3)

# Imprimer les résultats sous l’hétéroscédasticité

# pour comparaison.

coeftest(growth_mod3,vcov=vcovHC)

# Estimer le mod`ele avec termes d’interaction pour

# les pays de l’OCDE.

growth_mod4<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05) +

log(invest):oecd + I(popgrowth+0.05):oecd, data=Growth3)

# Imprimer les résultats sous l’homoscédasticité.

summary(growth_mod4)

# Imprimer les résultats sous l’hétéroscédasticité

# pour comparaison.

coeftest(growth_mod4,vcov=vcovHC)

# Tester la significativit´e jointe des 2 termes

# d’interaction.

bigr<−rbind(c(0,0,0,1,0),c(0,0,0,0,1)) litr<−rbind(0,0)

linearHypothesis(growth_mod4,bigr,litr,white.adjust=FALSE)

# Mˆeme test avec matrice variance-covariance

# robuste.

linearHypothesis(growth_mod4,bigr,litr,white.adjust=HC)

# Estimer le mod`ele en ajoutant school.

growth_mod5<−lm(log(gdp85) log(invest) + I(popgrowth+0.05) + school

+ log(invest):oecd + I(popgrowth+0.05):oecd + school:oecd, data=Growth3)

# Tester la restriction sur les 3 coefficients

bigr<−c(0,1,1,-1,0,0,0) litr<−0

linearHypothesis(growth_mod5,bigr,litr,white.adjust=FALSE)

#Mˆeme test avec matrice variance-covariance

# robuste.

linearHypothesis(growth_mod5,bigr,litr,white.adjust=TRUE)

# Estimer le mod`ele avec gdp60.

growth_mod6<−lm(log(gdp85)∼log(invest) + I(popgrowth+0.05) + school + log(gdp60) + log(invest):oecd +

I(popgrowth+0.05):oecd

+ school:oecd + log(gdp60):oecd, data=Growth3)

# Tester la significativit´e de la convergence.

bigr<−rbind(c(0,0,0,0,1,0,0,0,0),c(0,0,0,0,0,0,0,0,1)) litr<−rbind(0,0)

linearHypothesis(growth_mod6,bigr,litr,white.adjust-FALSE) linearHypothesis(growth_mod6,bigr,litr,white.adjust=TRUE)

L’output de ces commandes se trouve ci-dessous. J’ai converti les tableauxRen format LÂTEX à l’aide du packagetexreg. Pour l’instant, j’ai inclus seulement les résultats d’estimation des modèles différents sous l’hypothèse d’homoscédasticité.

Model 1

(Intercept) 3.95^∗∗∗

(0.54) log(invest) 1.51^∗∗∗

(0.16) I(popgrowth + 0.05) -0.01

(0.08)

R² 0.47

Adj. R² 0.46

Num. obs. 107

***p <0.01,^**p <0.05,^*p < 0.1

Model 2

(Intercept) 4.69^∗∗∗

(0.49) log(invest) 1.44^∗∗∗

(0.14) I(popgrowth + 0.05) -0.27^∗∗∗

(0.08)

R² 0.59

Adj. R² 0.59

Num. obs. 98

***p <0.01,^**p <0.05,^*p < 0.1

Model 3

(Intercept) 5.20^∗∗∗

(0.58) log(invest) 1.33^∗∗∗

(0.17) I(popgrowth + 0.05) -0.28^∗∗∗

(0.08)

R² 0.59

Adj. R² 0.58

Num. obs. 75

***p <0.01,^**p <0.05,^*p < 0.1

Model 4

(Intercept) 5.08^∗∗∗

(0.55)

log(invest) 1.03^∗∗∗

(0.18)

I(popgrowth + 0.05) 0.03

(0.13) log(invest) :oecdyes 0.34^∗∗

(0.14) I(popgrowth + 0.05) :oecdyes -0.11

(0.24)

R² 0.66

Adj. R² 0.64

Num. obs. 75

***p <0.01,^**p <0.05,^*p < 0.1

Model 5

(Intercept) 5.56^∗∗∗

(0.47)

log(invest) 0.55^∗∗∗

(0.17)

I(popgrowth + 0.05) 0.06

(0.10)

school 0.14^∗∗∗

(0.03) log(invest) :oecdyes 0.42^∗∗

(0.19) I(popgrowth + 0.05) :oecdyes -0.21

(0.20)

school :oecdyes -0.05

(0.06)

R² 0.77

Adj. R² 0.75

Num. obs. 75

***p <0.01,^**p <0.05,^*p < 0.1

Model 6

(Intercept) 1.51^∗∗∗

(0.54)

log(invest) 0.48^∗∗∗

(0.12)

I(popgrowth + 0.05) 0.05

(0.07)

school 0.05^∗∗∗

(0.02)

log(gdp60) 0.63^∗∗∗

(0.07) log(invest) :oecdyes 0.08

(0.29) I(popgrowth + 0.05) :oecdyes -0.17

(0.13)

school :oecdyes -0.04

(0.04)

log(gdp60) :oecdyes 0.07

(0.12)

R² 0.90

Adj. R² 0.89

Num. obs. 75

***p <0.01,^**p <0.05,^*p < 0.1

13 Concepts `a retenir

• La spécification matricielle du modèle de régression multiple.

• Les hypothèses de base du modèle de régression multiple.

• Etre capable de suivre et comprendre le calcul de l’estimateur MCO en notationˆ matricielle.

• Etre capable de suivre et comprendre le calcul de l’estimateur MCO en notation nonˆ matricielle.

• Etre capable de suivre les preuves des propriétés algébriques de l’estimateur MCO et deˆ

Dans le document Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal (Page 96-121)