TD 3
Exercice 1 :
1- Propriétés des estimateurs des MCO :
a- Les estimateurs des MCO des coe¢ cients du modèle linéaire sont sans biais.
b- Ces estimateurs sont linéaires par rapport aux variables dépendantes (générale- ment notées yi)
c- Ils sont de variance minimale dans l’ensemble des estimateurs linéaires sans biais.
2- Modèle linéaire simple : yt =axt+b+"t ; t = 1;2; :::; T L’estimateur des MCO du paramètrea est :
^ a =
XT t=1
xtyt T xy
XT t=1
x2t T x2
(1)
oùx (resp. y) est la moyenne empirique des xt (resp. yt) : x= 1
T XT
t=1
xt et yt = 1 T
XT t=1
xt
PosonsSxy = XT
t=1
xtyt T xy etSxx = XT
t=1
x2t T x2. On a alors, d’après ce qui précède:
^ a= Sxy
Sxx
Notons cov(x; y) la covariance empirique entre (x1; x2;:::; xT) et (y1; y2; :::; yT); et V(x)la varianceempirique de(x1; x2;:::; xT). On a :
cov(x; y) = 1 T
XT t=1
xtyt xy= 1 TSxy
V(x) = 1 T
XT t=1
x2t x2 = 1 TSxx
ce qui nous fournit une seconde expression poura^ :
^
a= cov(x; y)
V(x) (2)
L’estimateur des MCO deb est :
^b =y ^ax (3)
Les variances des estimateurs^a et^b sont données par : V(^a) =
2
XT t=1
(xt x)2
=
2
XT t=1
x2t T x2
(4)
V(^b) =
2
T
XT t=1
x2t
XT t=1
(xt x)2
=
2
T
XT t=1
x2t
XT t=1
x2t T x2
(5)
où 2 =V("t):
Modèle linéaire multiple :
Posons Y = 0 BB BB
@ y1 y2 : : yT
1 CC CC A X =
0 BB BB
@
x11 x21 : : xp1
x12 :
: :
: :
x1T : : : xpT 1 CC CC A a =
0 BB BB
@ a1 a2 : : ap
1 CC CC
Aet "= 0 BB BB
@
"1
"2 : :
"T 1 CC CC A
Le modèle linéaire multiple peut s’écrire sous la forme : yt=
Xp j=1
ajxjt+"t ; t= 1;2; :::; T
ou sous la forme matricielle suivante :
Y =Xa+"
L’estimateur des MCO du paramètre multi-dimensionnela est :
^
a= (X0X) 1X0Y (6)
et sa variance est :
V(^a) = 2(X0X) 1 (7)
où 2 =V("t):
3- Dans le modèle linéaire, les variables dépendantesyt sont des variables aléatoires (elles sont généralement obtenues par échantillonnage aléatoire dans une population).
Les estimateurs des MCO sont des fonctions de ces variables, et par conséquent sont également des variables aléatoires. L’une des conséquences de ce caractère aléatoire est qu’il va falloir s’intéresser aux lois de ces estimateurs ou du moins à leur espérance et à
leur variance. A titre d’exemple, dans le modèle linéaire simple, sous l’hypothèse sup- plémentaire de normalité des résidus"t, l’estimateur des MCO ^a suit la loi N(a; V(^a)) où l’expression deV(^a)est donnée par (4):Toujours sous l’hypothèse de normalité des résidus dans le modèle linéaire simple, l’estimateur des MCO de la variance 2 des résidus (dont on rappelle l’expression : ^2 = T12
XT t=1
^
"2t avec ^"t = yt ^axt+ ^b) suit, à une constante multiplicative près que nous précisons c–après, une loi du 2(T 2) :
(T 2) ^2
2 2(T 2)
Dans le cadre du modèle linéaire multiple détaillé ci-dessus, l’estimateur ^a suit la loi normale multidimensionnelleNp(a; V(^a))où l’expression deV(^a)est donnée par (7), et l’estimateur de la variance 2 dont l’expression est^2 = T1p
XT t=1
^
"2t où^"t=yt Xp
j=1
^ ajxjt, suit, à une constante multiplicative près, une loi du 2(T p) :
(T p) ^2
2 2(T p)
Exercice 3(Compléments : résolution des deux équations normales et démonstra- tion de la formule des estimateurs MCO) :
On considère le modèle linéaire suivant :
Ct =a1Yt+a2+"t
Dire que la fonction estiméeC = ^a1Y + ^a2 passe par le point moyen de l’échantillon Y ; C revient à dire que:
C = ^a1Y + ^a2
La procédure d’estimation par les moindres carrés linéaires consiste à minimiser par rapport au couple(a1; a2)la somme des résidus au carré:
XT t=1
"2t = XT
t=1
(Ct a1Yt a2)2
Le couple d’estimateurs des MCO (^a1;^a2) est donc solution des deux conditions du premier ordre suivantes (qu’on appelle équations normales) :
@
@a1 XT
t=1
(Ct a1Yt a2)2
!
= 0 (8)
@
@a2 XT
t=1
(Ct a1Yt a2)2
!
= 0 (9)
On a : @a@
1 (Ct a1Yt a2)2 = 2Yt(Ct a1Yt a2)donc
@
@a1 XT
t=1
(Ct a1Yt a2)2
!
= 2 XT
t=1
YtCt a1Yt2 a2Yt
et @a@
2 (Ct a1Yt a2)2 = 2 (Ct a1Yt a2) donc
@
@a2 XT
t=1
(Ct a1Yt a2)2
!
= 2 XT
t=1
(Ct a1Yt a2)
Dire que(^a1;^a2)est solution du système des deux équations normales (8) et (9) équivaut donc à dire que
XT t=1
YtCt a^1Yt2 ^a2Yt = 0 (10) XT
t=1
(Ct ^a1Yt ^a2) = 0 (11)
L’équation (11) est équivalente à : PT t=1
Ct = ^a1 PT t=1
Yt+Ta^2. En divisant par T les deux membres de cette équation, on trouve le résultat demandé, à savoir :
C = ^a1Y + ^a2 (12)
qui peut également s’écrire :
^
a2 =C ^a1Y (13)
Quant à l’équation (10), on commence par la réécrire sous la forme:
XT t=1
YtCt ^a1 XT
t=1
Yt2 ^a2 XT
t=1
Yt= 0
puis on remplace^a2 par son expression en fonction de^a1; à savoirC ^a1Y; on obtient alors :
XT t=1
YtCt ^a1 XT
t=1
Yt2 C ^a1Y XT
t=1
Yt = 0
soit XT
t=1
YtCt C XT
t=1
Yt ^a1 XT
t=1
Yt2+ ^a1Y XT
t=1
Yt= 0
En tenant compte du fait que PT t=1
Yt =T Y , on obtient : XT
t=1
YtCt T CY a^1 XT
t=1
Yt2 T Y2
!
= 0
ce qui donne l’expression (bien connue) de l’estimateur des MCO de a1 :
^ a1 =
PT t=1
YtCt T CY
PT t=1
Yt2 T Y2
(14)
La relation (13) permet alors de calculera^2 une foisa^1 calculé.
Remarque : la notation générale la plus utilisée pour le modèle linéaire simple est la suivante :
yi =axi+b+"i i= 1; :::; n
Dans le cas du modèle étudié Ct = a1Yt+a2 +"t où t = 1; :::; T, les indices t jouent le rôle des indices i, T celui de n, les Yt celui des xi, les Ct celui des yi; a1 celui de a et a2 celui de b: On véri…e immédiatement que les formules (13) et (14) correspondent bien aux expressions générales des estimateurs des MCO.
On nous demande également de montrer que la moyenne de la consommation estimée c’est-à-dire ^a1Y + ^a2 est égale à la moyenne empirique C or c’est justement un des résultats démontrés précédemment (Cf égalité ((12)).
Exercice 4 :
1) Cf. tableau distribué. Notons que la période 4 manque. On dispose donc de T = 11 périodes.
2) L’estimateur des MCO du paramètre a est donné par :
^ a =
XT t=1
xtyt T xy
XT t=1
x2t T x2
Or XT
t=1
xtyt= 12;9913; T = 11; x= 0;1759; y= 6;8052 et XT
t=1
x2t = 0;4329 donc
^
a= 12;9913 11 0;1759 6;8052
0;4329 11 0;17592 ' 1;903
L’estimateur des MCO deb s’obtient à partir de celui de a de la façon suivante :
^b =y ^ax donc
^b = 6;8052 + 1;903 0;1759 = 7;140
Il n’est pas demandé de calculer des estimateurs des variances de^aet^b. Néanmoins sans ces estimations nous n’avons aucune idée de la précision de ces estimateurs et en partic- ulier nous ne pouvons pas statuer sur le caractère signi…catif ou pas des valeurs trouvées.
Rappelons que V(^a) = T 2 X
t=1
x2t T x2
et V(^b) = T2 XT
t=1
x2t
XT t=1
x2t T x2
:Or 2 est un paramètre in- connu du modèle qu’on peut estimer par
^2 = 1
T 2
XT t=1
^"2t = 1
T 2
XT t=1
yt ^axt ^b
2
Par conséquent on peut estimer V(^a) par
V^(^a) = ^2 XT
t=1
x2t T x2
On trouve ^2 = 0;00407; ce qui implique que V^(^a) = 0;044 (l’écart-type estimé est donc
qV^(^a)'0;21).
On construit de façon similaire un estimateur V^(^b) de V(^b) en remplaçant 2 par
^2 dans l’expression de V(^b) et on calcule la valeur prise par V^(^b) en utilisant le fait que ^2 = 0;00407 (on ne fait pas ce calcul car seul le paramètre a nous intéresse dans la suite).
Interprétation du paramètre a : yt = axt +b +"t est un modèle économétrique
"dérivé" du modèle théorique y = ax+b c’est-à-dire lnq = alnp+b: Il s’ensuit que
@lnq
@lnp = a or @@lnlnpq = @q@ppq n’est autre que l’élasticité de la demande par rapport au prix. Par conséquent a peut être interprété comme l’élasticité de la demande par rapport au prix et donc ^a est une estimation de cette élasticité.
3) Les propriétaires cherchent à maximiser leur chi¤re d’a¤aires pq (ce qui revient à maximiser le pro…t lorsque les coûts marginaux sont nuls). On a : @(pq)@p =q+p@q@p = q(1 + @q@ppq) or d’après la question précédentea = @@lnlnpq = @p@qpq donc @(pq)@p =q(1 +a):
A ce stade, on peut procéder de deux façons di¤érentes :
La première (peu rigoureuse, mais ne nécessitant pas l’utilisation de tests statis- tiques) consiste à dire qu’on a une estimation du paramètre a; à savoir ^a ' 1;903 et
donc une estimation de @(pq)@p = q(1 +a) à savoir 0:903q: L’estimation de @(pq)@p étant négative, on peut raisonnablement penser que le chi¤re d’a¤aires pq est une fonction décroissante du prix p (du moins dans la plage des prix considérée): Par conséquent, les propriétaires ont intérêt à diminuer le prix pour augmenter leur chi¤re d’a¤aires.
La seconde (beaucoup plus rigoureuse mais nécessitant le recours à la théorie des tests qui n’a pas encoré été vue en cours) consiste à tester l’hypothèsea < 1(contre l’hypothèsea 1):Un test au seuil de5% conduit à accepter cette hypothèse (véri…ez- le dès que la question des tests sera traitée en cours). On peut donc raisonnablement a¢ rmer que @(pq)@p = q(1 +a) < 0 ce qui implique que le chi¤re d’a¤aires pq est une fonction décroissante du prixp :Par conséquent, les propriétaires ont intérêt à diminuer le prix pour augmenter leur chi¤re d’a¤aires.
Texte :
1) Considérons une spéci…cation en double-log du type :
logQm =b0+b1logPm+b2logE+b3logS+e (15) où Qm est la quantité consommée de marijuana, Pm est le prix de la marijuana, E représente les dépenses mensuelles moyennes (cette variable sert ici comme mesure approximative du revenu), S représente une mesure de la dispersion des dépenses, et e est le terme d’erreur. Dans ce cas, les élasticités de la consommation par rapport au revenu et au prix se lisent directement sur l’équation de régression. En e¤et, il est aisé de voir que @@loglogQPm
m = b1 et @@loglogQEm = b2: Par conséquent b1 est l’élasticité-prix de la consommation de marijuana et b2 est l’élasticité-revenu de la consommation de marijuana.
2) La di¤érence essentielle entre des estimations sur données d’enquête (données récoltées en demandant à des individus quelles quantités ils consommeraient si le prix de la marijuana prenait certaines valeurs, ce qui permet de déterminer leur fonction de demande hypothétique) et des données de marché (données sur les prix de marché et les quantités e¤ectivement consommées) provient du fait que le comportement des individus lorsqu’on leur demande ce qu’ils feraient dans une situation hypothétique n’est pas nécessairement le même que leur comportement si la situation en question venait à se présenter réellement.
3) Les résultats de l’estimation des élasticités de la consommation par rapport au revenu et au prix peuvent être sous-estimés ou surestimés pour plusieurs raisons.
D’abord, il se peut qu’il y ait des erreurs de mesure, notamment sur la variableE qui est une mesure indirecte du revenu. Ensuite, il se peut qu’il y ait des variables omises dans la régression. Ceci ne pose pas de problème en soi puisque le terme d’erreure est censé capturer, entre autres, ces variables. Le problème vient du fait que ces variables omises peuvent être corrélées avec les variables explicativesPm; E etS;et peuvent ainsi induire une corrélation entre le terme d’erreur e et les variables explicatives (dans ce
cas, les estimateurs MCO de la régression (15) ne seraient plus sans biais) Considérons par exemple la probabilité d’incarcération suite à la consommation de marijuana. Si pour des raisons exogènes, cette probabilité venait à baisser, la demande pourrait aug- menter entraînant ainsi une augmentation du prix. La probabilité d’incarcération est donc une variable omise probablement corrélée à la variable explcativePm(autre exem- ple de variable omise : le prix d’autres drogues concurrentes qui pourraient représenter des substituts à la marijuana). En…n, les résultats peuvent être également biaisés à cause du caractère statique du modèle qui ne prend pas en compte les dépendances dy- namiques dans le comportement de consommation de marijuana, notamment les e¤ets d’habitude et d’addiction.