T L’estimateur des MCO du paramètrea est

(1)

TD 3

Exercice 1 :

1- Propriétés des estimateurs des MCO :

a- Les estimateurs des MCO des coe¢ cients du modèle linéaire sont sans biais.

b- Ces estimateurs sont linéaires par rapport aux variables dépendantes (générale- ment notées y_i)

c- Ils sont de variance minimale dans l’ensemble des estimateurs linéaires sans biais.

2- Modèle linéaire simple : y_t =ax_t+b+"_t ; t = 1;2; :::; T L’estimateur des MCO du paramètrea est :

^ a =

XT t=1

x_ty_t T xy

XT t=1

x²_t T x²

(1)

oùx (resp. y) est la moyenne empirique des x_t (resp. y_t) : x= 1

T XT

t=1

x_t et y_t = 1 T

XT t=1

x_t

PosonsS_xy = XT

t=1

x_ty_t T xy etS_xx = XT

t=1

x²_t T x². On a alors, d’après ce qui précède:

^ a= S_xy

S_xx

Notons cov(x; y) la covariance empirique entre (x₁; x_2;:::; x_T) et (y₁; y₂; :::; y_T); et V(x)la varianceempirique de(x₁; x_2;:::; x_T). On a :

cov(x; y) = 1 T

XT t=1

xtyt xy= 1 TSxy

V(x) = 1 T

XT t=1

x²_t x² = 1 TS_xx

ce qui nous fournit une seconde expression poura^ :

^

a= cov(x; y)

V(x) (2)

(2)

L’estimateur des MCO deb est :

^b =y ^ax (3)

Les variances des estimateurs^a et^b sont données par : V(^a) =

2

XT t=1

(xt x)²

=

2

XT t=1

x²_t T x²

(4)

V(^b) =

2

T

XT t=1

x²_t

XT t=1

(x_t x)²

=

2

T

XT t=1

x²_t

XT t=1

x²_t T x²

(5)

où ² =V("_t):

Modèle linéaire multiple :

Posons Y = 0 BB BB

@ y₁ y₂ : : y_T

1 CC CC A X =

0 BB BB

@

x₁₁ x₂₁ : : x_p1

x₁₂ :

: :

x_1T : : : x_pT 1 CC CC A a =

0 BB BB

@ a₁ a₂ : : a_p

1 CC CC

Aet "= 0 BB BB

@

"₁

"₂ : :

"_T 1 CC CC A

Le modèle linéaire multiple peut s’écrire sous la forme : y_t=

Xp j=1

a_jx_jt+"_t ; t= 1;2; :::; T

ou sous la forme matricielle suivante :

Y =Xa+"

L’estimateur des MCO du paramètre multi-dimensionnela est :

^

a= (X⁰X) ¹X⁰Y (6)

et sa variance est :

V(^a) = ²(X⁰X) ¹ (7)

où ² =V("_t):

3- Dans le modèle linéaire, les variables dépendantesy_t sont des variables aléatoires (elles sont généralement obtenues par échantillonnage aléatoire dans une population).

Les estimateurs des MCO sont des fonctions de ces variables, et par conséquent sont également des variables aléatoires. L’une des conséquences de ce caractère aléatoire est qu’il va falloir s’intéresser aux lois de ces estimateurs ou du moins à leur espérance et à

(3)

leur variance. A titre d’exemple, dans le modèle linéaire simple, sous l’hypothèse sup- plémentaire de normalité des résidus"t, l’estimateur des MCO â suit la loi N(a; V(â)) où l’expression deV(â)est donnée par (4):Toujours sous l’hypothèse de normalité des résidus dans le modèle linéaire simple, l’estimateur des MCO de la variance ² des résidus (dont on rappelle l’expression : ^² = _T¹₂

XT t=1

^

"²_t avec ^"_t = y_t ^ax_t+ ^b) suit, à une constante multiplicative près que nous précisons c–après, une loi du ₂(T 2) :

(T 2) ^²

2 2(T 2)

Dans le cadre du modèle linéaire multiple détaillé ci-dessus, l’estimateur â suit la loi normale multidimensionnelleN_p(a; V(â))où l’expression deV(â)est donnée par (7), et l’estimateur de la variance ² dont l’expression est^² = _T¹_p

XT t=1

^

"²_t où^"_t=y_t Xp

j=1

^ a_jx_jt, suit, à une constante multiplicative près, une loi du ₂(T p) :

(T p) ^²

2 2(T p)

Exercice 3(Compléments : résolution des deux équations normales et démonstra- tion de la formule des estimateurs MCO) :

On considère le modèle linéaire suivant :

C_t =a₁Y_t+a₂+"_t

Dire que la fonction estiméeC = ^a1Y + ^a2 passe par le point moyen de l’échantillon Y ; C revient à dire que:

C = ^a₁Y + ^a₂

La procédure d’estimation par les moindres carrés linéaires consiste à minimiser par rapport au couple(a₁; a₂)la somme des résidus au carré:

XT t=1

"²_t = XT

t=1

(C_t a₁Y_t a₂)²

Le couple d’estimateurs des MCO (^a1;^a2) est donc solution des deux conditions du premier ordre suivantes (qu’on appelle équations normales) :

@

@a₁ XT

t=1

(Ct a1Yt a2)²

!

= 0 (8)

(4)

@

@a₂ XT

t=1

!

= 0 (9)

On a : _@a^@

1 (C_t a₁Y_t a₂)² = 2Y_t(C_t a₁Y_t a₂)donc

@

@a₁ XT

t=1

!

= 2 XT

t=1

Y_tC_t a₁Y_t² a₂Y_t

et _@a^@

2 (C_t a₁Y_t a₂)² = 2 (C_t a₁Y_t a₂) donc

@

@a₂ XT

t=1

!

= 2 XT

t=1

(C_t a₁Y_t a₂)

Dire que(^a₁;^a₂)est solution du système des deux équations normales (8) et (9) équivaut donc à dire que

XT t=1

Y_tC_t a^₁Y_t² ^a₂Y_t = 0 (10) XT

t=1

(C_t ^a₁Y_t ^a₂) = 0 (11)

L’équation (11) est équivalente à : PT t=1

C_t = ^a₁ PT t=1

Y_t+Ta^₂. En divisant par T les deux membres de cette équation, on trouve le résultat demandé, à savoir :

C = ^a₁Y + ^a₂ (12)

qui peut également s’écrire :

^

a₂ =C ^a₁Y (13)

Quant à l’équation (10), on commence par la réécrire sous la forme:

XT t=1

Y_tC_t ^a₁ XT

t=1

Y_t² ^a₂ XT

t=1

Y_t= 0

puis on remplaceâ₂ par son expression en fonction deâ₁; à savoirC â₁Y; on obtient alors :

XT t=1

Y_tC_t ^a₁ XT

t=1

Y_t² C ^a₁Y XT

t=1

Y_t = 0

soit XT

t=1

Y_tC_t C XT

t=1

Y_t ^a₁ XT

t=1

Y_t²+ ^a₁Y XT

t=1

Y_t= 0

(5)

En tenant compte du fait que PT t=1

Y_t =T Y , on obtient : XT

t=1

Y_tC_t T CY a^₁ XT

t=1

Y_t² T Y²

!

= 0

ce qui donne l’expression (bien connue) de l’estimateur des MCO de a₁ :

^ a₁ =

PT t=1

Y_tC_t T CY

PT t=1

Y_t² T Y²

(14)

La relation (13) permet alors de calculera^₂ une foisa^₁ calculé.

Remarque : la notation générale la plus utilisée pour le modèle linéaire simple est la suivante :

y_i =ax_i+b+"_i i= 1; :::; n

Dans le cas du modèle étudié C_t = a₁Y_t+a₂ +"_t où t = 1; :::; T, les indices t jouent le rôle des indices i, T celui de n, les Y_t celui des x_i, les C_t celui des y_i; a₁ celui de a et a₂ celui de b: On véri…e immédiatement que les formules (13) et (14) correspondent bien aux expressions générales des estimateurs des MCO.

On nous demande également de montrer que la moyenne de la consommation estimée c’est-à-dire ^a₁Y + ^a₂ est égale à la moyenne empirique C or c’est justement un des résultats démontrés précédemment (Cf égalité ((12)).

Exercice 4 :

1) Cf. tableau distribué. Notons que la période 4 manque. On dispose donc de T = 11 périodes.

2) L’estimateur des MCO du paramètre a est donné par :

^ a =

XT t=1

x_ty_t T xy

XT t=1

x²_t T x²

Or XT

t=1

x_ty_t= 12;9913; T = 11; x= 0;1759; y= 6;8052 et XT

t=1

x²_t = 0;4329 donc

^

a= 12;9913 11 0;1759 6;8052

0;4329 11 0;1759² ' 1;903

(6)

L’estimateur des MCO deb s’obtient à partir de celui de a de la façon suivante :

^b =y ^ax donc

^b = 6;8052 + 1;903 0;1759 = 7;140

Il n’est pas demandé de calculer des estimateurs des variances de^aet^b. Néanmoins sans ces estimations nous n’avons aucune idée de la précision de ces estimateurs et en partic- ulier nous ne pouvons pas statuer sur le caractère signi…catif ou pas des valeurs trouvées.

Rappelons que V(^a) = _T ² X

t=1

x²_t T x²

et V(^b) = _T² XT

t=1

x²_t

XT t=1

x²_t T x²

:Or ² est un paramètre in- connu du modèle qu’on peut estimer par

^² = 1

T 2

XT t=1

^"²_t = 1

T 2

XT t=1

y_t ^ax_t ^b

2

Par conséquent on peut estimer V(^a) par

V^(^a) = ^² XT

t=1

x²_t T x²

On trouve ^² = 0;00407; ce qui implique que V^(^a) = 0;044 (l’écart-type estimé est donc

qV^(^a)'0;21).

On construit de façon similaire un estimateur V^(^b) de V(^b) en remplaçant ² par

^² dans l’expression de V(^b) et on calcule la valeur prise par V^(^b) en utilisant le fait que ^² = 0;00407 (on ne fait pas ce calcul car seul le paramètre a nous intéresse dans la suite).

Interprétation du paramètre a : y_t = ax_t +b +"_t est un modèle économétrique

"dérivé" du modèle théorique y = ax+b c’est-à-dire lnq = alnp+b: Il s’ensuit que

@lnq

@lnp = a or ^@_@^ln_lnp^q = ^@q_@p^p_q n’est autre que l’élasticité de la demande par rapport au prix. Par conséquent a peut être interprété comme l’élasticité de la demande par rapport au prix et donc ^a est une estimation de cette élasticité.

3) Les propriétaires cherchent à maximiser leur chi¤re d’a¤aires pq (ce qui revient à maximiser le pro…t lorsque les coûts marginaux sont nuls). On a : ^@(pq)_@p =q+p^@q_@p = q(1 + ^@q_@p^p_q) or d’après la question précédentea = ^@_@^ln_lnp^q = _@p^@q^p_q donc ^@(pq)_@p =q(1 +a):

A ce stade, on peut procéder de deux façons di¤érentes :

La première (peu rigoureuse, mais ne nécessitant pas l’utilisation de tests statis- tiques) consiste à dire qu’on a une estimation du paramètre a; à savoir ^a ' 1;903 et

(7)

donc une estimation de ^@(pq)_@p = q(1 +a) à savoir 0:903q: L’estimation de ^@(pq)_@p étant négative, on peut raisonnablement penser que le chi¤re d’a¤aires pq est une fonction décroissante du prix p (du moins dans la plage des prix considérée): Par conséquent, les propriétaires ont intérêt à diminuer le prix pour augmenter leur chi¤re d’a¤aires.

La seconde (beaucoup plus rigoureuse mais nécessitant le recours à la théorie des tests qui n’a pas encoré été vue en cours) consiste à tester l’hypothèsea < 1(contre l’hypothèsea 1):Un test au seuil de5% conduit à accepter cette hypothèse (véri…ez- le dès que la question des tests sera traitée en cours). On peut donc raisonnablement a¢ rmer que ^@(pq)_@p = q(1 +a) < 0 ce qui implique que le chi¤re d’a¤aires pq est une fonction décroissante du prixp :Par conséquent, les propriétaires ont intérêt à diminuer le prix pour augmenter leur chi¤re d’a¤aires.

Texte :

1) Considérons une spéci…cation en double-log du type :

logQ_m =b₀+b₁logP_m+b₂logE+b₃logS+e (15) où Q_m est la quantité consommée de marijuana, P_m est le prix de la marijuana, E représente les dépenses mensuelles moyennes (cette variable sert ici comme mesure approximative du revenu), S représente une mesure de la dispersion des dépenses, et e est le terme d’erreur. Dans ce cas, les élasticités de la consommation par rapport au revenu et au prix se lisent directement sur l’équation de régression. En e¤et, il est aisé de voir que ^@_@^log_log^Q_P^m

m = b₁ et ^@_@^log_log^Q_E^m = b₂: Par conséquent b₁ est l’élasticité-prix de la consommation de marijuana et b₂ est l’élasticité-revenu de la consommation de marijuana.

2) La di¤érence essentielle entre des estimations sur données d’enquête (données récoltées en demandant à des individus quelles quantités ils consommeraient si le prix de la marijuana prenait certaines valeurs, ce qui permet de déterminer leur fonction de demande hypothétique) et des données de marché (données sur les prix de marché et les quantités e¤ectivement consommées) provient du fait que le comportement des individus lorsqu’on leur demande ce qu’ils feraient dans une situation hypothétique n’est pas nécessairement le même que leur comportement si la situation en question venait à se présenter réellement.

3) Les résultats de l’estimation des élasticités de la consommation par rapport au revenu et au prix peuvent être sous-estimés ou surestimés pour plusieurs raisons.

D’abord, il se peut qu’il y ait des erreurs de mesure, notamment sur la variableE qui est une mesure indirecte du revenu. Ensuite, il se peut qu’il y ait des variables omises dans la régression. Ceci ne pose pas de problème en soi puisque le terme d’erreure est censé capturer, entre autres, ces variables. Le problème vient du fait que ces variables omises peuvent être corrélées avec les variables explicativesP_m; E etS;et peuvent ainsi induire une corrélation entre le terme d’erreur e et les variables explicatives (dans ce

(8)

cas, les estimateurs MCO de la régression (15) ne seraient plus sans biais) Considérons par exemple la probabilité d’incarcération suite à la consommation de marijuana. Si pour des raisons exogènes, cette probabilité venait à baisser, la demande pourrait augmenter entraînant ainsi une augmentation du prix. La probabilité d’incarcération est donc une variable omise probablement corrélée à la variable explcativePm(autre exemple de variable omise : le prix d’autres drogues concurrentes qui pourraient représenter des substituts à la marijuana). En…n, les résultats peuvent être également biaisés à cause du caractère statique du modèle qui ne prend pas en compte les dépendances dy- namiques dans le comportement de consommation de marijuana, notamment les e¤ets d’habitude et d’addiction.