Introduction
Modèle de régression simple
Part I
Introduction
Dé…nition de l’économétrie
L’économétrie est un ensemble de méthodes statistiques développées a…n d’étudier des questions économiques: tester des modèles, faire des prédictions.
Exemple 1. Tester la théorie du capital humain de J. Mincer.
Exemple 2. Mesurer les e¤ets du salaire minimum sur le taux de chômage.
Une particularité de l’économétrie est l’utilisation de données qui ne sont pas expéri- mentales. Les données proviennent essentiellement d’enquêtes ou de comptabilités.
Structure des données
Exemple 1. Données transversales (cross-sectional data) in WAGE1.xls obsno wage educ exper tenure female married
1 3.10 11 2 0 1 0
2 3.24 12 22 2 1 1
... ... ... ... ... ...
526 3.50 14 5 4 1 0
Exemple 2. Séries temporelles (time series data).
obsno year avgmin avgcov unemp gnp
1 1950 0.20 20.1 15.4 878.7
2 1951 0.21 20.7 16.0 925.0
... ... ... ... ... ...
38 1987 3.35 58.2 16.8 4496.7
Etapes d’une analyses empirique
Exemple. Le modèle théorique est:
wage = f(educ, exper, tenure);
où les dérivées de la fonction f( ) sont toutes positives = prédiction théorique (in:
Mincer, Jacob (1958). "Investment in Human Capital and Personal Income Distrib- ution". Journal of Political Economy. 66 (4): 281–302).
Par exemple, le modèle économétrique est:
wagei = 0 + 1educi + 2experi + 3tenurei + ui;
avec 0, 1 > 0, 2 > 0, 3 > 0 sont des paramètres, et ui est un terme d’erreur avec une certaine distribution.
Le modèle économétrique doit spéci…er une forme fonctionnelle (qui impose des con- traintes sur le modèle théorique), ajouter un terme d’erreur et dé…nir exactement les variables.
Part II
Modèle de régression simple
Modèle de régression simple
Comment mesurer l’e¤et d’une variable x sur une variable y?
Le modèle de régression (linéaire) simple est dé…ni par:
y = 0 + 1x + u
où 0 est la constante, 1 est la pente et u le terme d’erreur et
y =
8>
>>
<
>>
>:
variable dépendante variable expliquée variable prédite régressant
, x =
8>
>>
<
>>
>:
variable indépendante variable explicative variable prédictrice régresseur
:
La pente 1 mesure l’e¤et de x sur y. Pourquoi parle-t-on de "régression"?
Rappel: Un modèle est une "vue de l’esprit" représentant un phénomène.
Modèle de régression simple
Exemple. La relation entre le salaire et l’éducation (en années) s’écrit:
wagei = 0 + 1educi + ui
Ce modèle est linéaire car l’e¤et de la variable x (educ) sur la variable y (wage) est linéaire:
y = 1 x si u = 0.
La linéarité est une restriction importante, pas nécessairement réaliste.
Que réprésente le terme d’erreur? L’ensemble des variables explicatives omises. Par exemple, l’expérience, l’ancienneté, ou l’habileté.
Modèle de régression simple
Nuage de points. Légende: ordonnées: salaire, abscises: éducation
Dérivation des estimateurs des MCO
Question: Comment obtenir des estimateurs de 0 et de 1? Un estimateur est une valeur (obtenue par une suite d’opérations appliquées à un échantillon) qui permet d’évaluer un paramètre inconnu relatif à une loi de probabilité.
! Obtenir les estimateurs de 0 et de 1 est équivalent à faire passer une droite au sein du nuage de points.
! La méthode des moindres carrés ordinaires (MCO) consiste à minimiser la somme des carrés des résidus.
Soit un échantillon f(xi; yi) : i = 1; :::; Ng de N observations.
Pour des valeurs quelconques b0 et b1 des paramètres 0 et 1; et pour l’observation i, le résidu est dé…ni par:
e
ui = yi b0 b1xi:
Dérivation des estimateurs des MCO
Droite de régression et résidus
Dérivation des estimateurs des MCO
La somme des carrés des résidus est dé…nie par
Q(b0; b1) = (y1 b0 b1x1)2 + + (yN b0 b1xN)2
= XN
i=1(yi b0 b1xi
| {z })
résidu
2:
Concept à maîtriser: l’opérateur de somme P.
Le problème de minimisation de la somme des carrés des résidus est:
minfb
0;b1g Q(b0; b1):
Pour obtenir le minimum, on dérive la fonction et on égalise les dérivées à zéro.
Question: Pourquoi minimiser la somme des carrés des résidus et non, par exemple, la somme des valeurs absolues des résidus?
Dérivation des estimateurs des MCO
Les conditions de premier ordre de la minimisation de
XN
i=1(yi b0 b1xi)2 sont:
@Q
@b0(b0; b1) = 1 2
XN i=1
(yi b0 b1xi) = 0; (CPO1)
@Q
@b1(b0; b1) = 1 2
XN i=1
xi(yi b0 b1xi) = 0; (CPO2)
où ubi = yi b0 b1xi est le résidu des MCO.
Ces équations constituent un système de 2 équations à 2 inconnues.
Dérivation des estimateurs des MCO
Dé…nissons les moyennes empiriques de x et de y de la manière suivante:
x = 1 N
XN
i=1xi; y = 1 N
XN
i=1yi
Supposons que:
XN
i=1(xi x)2 6= 0:
Que signi…e cette hypothèse?
Dans ce cas, le système d’équations peut être résolu et les estimateurs des MCO sont:
b1 =
PN
i=1(xi x)(yi y)
PN
i=1(xi x)2 et b0 = y b1x
Dérivation des estimateurs des MCO
Notons que
b1 =
PN
i=1(xi x)(yi y)
PN
i=1(xi x)2 =
PN
i=1(xi x)yi
PN
i=1(xi x)2 =
PN
i=1(yi y)xi
PN
i=1(xi x)2
La droite de régression de la population est:
y = 0 + 1x:
La droite de régression de l’échantillon des MCO est:
^
y = b0 + b1x:
La valeur prédite des MCO de la variable y pour x = xi est:
^
yi b0 + b1xi: Le résidu des MCO est
b
ui yi b0 b1xi = yi y^i:
Exemple numérique
Soit les données.
i y x y y x x (y y)2 (x x)2 (y y)(x x)
1 10 3 0 2 0 4 0
2 8 7 2 2 4 4 4
3 12 5 2 0 4 0 0
P 30 15 0 0 8 8 4
Donc:
b1 =
PN
i=1(xi x)(yi y)
PN
i=1(xi x)2 = 1 2
b0 = y b1x = 10 + 1
25 = 12;5
Exemples
Exemple 1. Soit la base de données WAGE1.xls sur 526 employés des Etats-Unis en 1976. L’équation suivante est estimée:
[
wage = 0;90 + 0;54 educ,
Comment interpréter ces estimations? La constante est négative. Pourquoi?
Pour obtenir ces résultats, la formule Excel est:
=DROITEREG(A1:A526;B1:B526;VRAI;VRAI)
Exemples
Nuage de points et droite de régression. Légende: abscises = salaire, ordonnées = éducation.
Exemples
Exemples
Exemple 2. En transformant la variable dépendante en logarithmes, log(wage) = 0;\ 584 + 0;083 educ.
où le salaire d’un individu dont le niveau d’éducation est de 0 années est en moyenne de 1;793 exp(0;584) dollars.
Comment interpréter ces estimations? Si l’éducation augmente d’une année, le salaire augmente de 8,3%.
Pour obtenir ces résultats, la formule Excel est:
=DROITEREG(V1:V526;C1:C526;VRAI;VRAI)
Exemples
Nuage de points avec droite de régression. Légende: abscises = éducation, ordonnées = logarithme du salaire.
Propriétés algébriques des MCO
Propriété 1. La somme des résidus est nulle:
XN
i=1ubi = 0 En e¤et,
CPO1 : 1 2
XN
i=1(yi b0 b1xi) = 0 ! XNi=1 ubi = 0
Propriété 2. La somme du produit des résidus et des variables explicatives est nulle:
XN
i=1xiubi = 0 En e¤et,
CPO2 : 1 2
XN
i=1 xi(yi b0 b1xi) = 0 ! XNi=1 xiubi = 0
Propriétés algébriques des MCO
Propriété 3. La régression passe par le point moyen de l’échantillon:
y = b0 + b1x:
En e¤et,
CPO1 : 1
2
XN
i=1(yi b0 b1xi) = 0
! XNi=1 yi XN
i=1 b0 XN
i=1 b1xi = 0
! 1 N
XN
i=1 yi 1 N
XN
i=1 b0 1 N
XN
i=1 b1xi = 0
Propriétés algébriques des MCO
Quelques dé…nitions:
SCT = XN
i=1(yi y)2; SCE = XN
i=1(^yi y)2; SCR = XN
i=1 ub2i:
Propriété 4. La somme des carrés totaux est égale à la somme de somme des carrés expliqués et de la somme des carrés résiduels:
SCT = SCE + SCR.
D’où:
R2 = SCE
SCT = 1 SCR
SCT 2 [0;1]
où le R-carré, appelé également coe¢ cient de détermination, mesure l’ajustement de la droite au nuage de points.
Propriétés algébriques des MCO
Propriété 5. Le R-carré (ou coe¢ cient de détermination) est égal au carré du coe¢ cient de corrélation entre la variable explicative et la variable expliquée:
R2 = SCE
SCT = 1 SCR
SCT = (PNi=1(xi x)(yi y))2
PN
i=1(xi x)2 PNi=1(yi y)2: Rappel: Wooldridge (2013), Appendix C4, p. 768.
Exemple numérique
Soit les estimations obtenues précédemment:
y = 12;5 1 2x
Donc:
i y x y^i ubi xiubi (y y)2 (^y y)2 ub2i
1 10 3 11 1 3 0 1 1
2 8 7 9 1 7 4 1 1
3 12 5 10 2 10 4 0 4
P 30 15 30 0 0 8 2 6
et
R2 = 2
8 = 1 6
8 = 0:25:
Exemples
Exemple 1. Soit la base de données WAGE1.xls sur les employés des Etats-Unis en 1976, les résultats d’estimations sont les suivants:
[
wage = 0;90 + 0;54 educ, R2 = 0;165
et
log(wage) = 0;\ 584 + 0;083 educ, R2 = 0;186:
Exemples
Exemple 2. Soit la base de données CEOSAL1.xls contenant un échantillon de 209 observations sur le salaire des P.D.-G. Le modèle suivant est estimé:
salary[ = 963;191 + 18;501 roe;
R2 = 0;013
où reo est le rendement de l’action en points (:::; 2; 1;0;+1;+2; :::) et salary le salaire annuel des P.D.-G. en milliers de dollars.
Comment interpréter les résultats?
Propriétés algébriques des MCO
Si la variable explicative est multipliée par une constante alors l’estimateur du paramètre de la variable est divisé par cette même constante.
Si la variable expliquée est multipliée par une constante alors l’estimateur du paramètre de la constante et de la pente est multiplié par cette même constante.
Exemple
Soit la droite de régression estimée préalablement:
salary[ = 963;191 + 18;501 roe.
où roe est le rendement de l’action en points et salary est exprimé en milliers de dollars.
Si la variable explicative est exprimée en décimales (:::; 0:02; 0:01;0;+0:01;
+0:02; :::), alors:
salary[ = 963;191 + 1850;1 roe_dec.
Si la variable expliquée est exprimée en dollars, alors:
salary_dollars\ = 963191 + 18501 roe.
Pour préparer le cours suivant
Wooldridge, Je¤rey M., Introductory Econometrics: A Modern Approach, 5th Edition. South-Western College Pub (2013).
– Sections 2.1–2.2 (compléments), – Sections 1.4, 3.2
– Appendix A1. Basic mathematical tools, pp. 703-705.
– Appendix B1-B4. Fundamentals of probability, pp. 722-745.
Dubuc, Patrick. Utilisation de DROITEREG,
https://www.youtube.com/watch?v=T8CY5ETApgY
Exercices 1