Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

(1)

ECO 4272: Introduction à l’ ´ Econométrie Examen Final: Réponses

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec à Montréal

c 2008, Steve Ambler Hiver 2008

1 Estimateur MCO

1. Le probl`eme de minimisation peut s’´ecrire : minβ

n

X

i=1

(Y_i−β₀−β₁X_1i−β₂X_2i−. . .−β_kX_ki)², oùβest le vecteur de coefficients qui est à estimer. Il y a(k+ 1) conditions du premier ordre. Il ne fallait pas les écrire.

2. Pour pouvoir calculer numériquement une solution au problème, les erreurs peuvent essentiellement être quelconques. Tout ce qui est

n´ecessaire est une matriceX⁰Xqui est de plein rang (et donc inversible), ce qui implique plus d’observations que de variables explicatives

(n >(k+ 1)) et une absence de multicollinéarité parfaite. L’existence d’une telle solution n’est absolument pas une garantie que l’estimateur MCO a les propriétés désirables qui tiennent sous les hypothèses du modèle de régression linéaire, qui pourraient ne pas être vérifiées dans le contexte d’un modèle estimé donné.

3. La CPO par rapport `aβ0 donne :

−2

n

X

i=1

Yi −βˆ0−βˆ1X1i−βˆ2X2i−. . .−βˆkXki

= 0

(2)

→nβˆ₀ =

n

X

i=1

Y_i−

n

X

i=1

βˆ₁X_1i−. . .−

n

X

i=1

βˆ_kX_ki

→βˆ₀ = 1 n

n

X

i=1

Y_i−βˆ₁1 n

n

X

i=1

X_1i−. . .−βˆ_k1 n

n

X

i=1

X_ki

≡Y¯ −βˆ₁X¯₁−. . .−βˆ_kX¯_k, ce qui fut `a d´emontrer.

2 Modèle de régression linéaire

– Les propriétés souhaitables sont 1) l’absence de biais, 2) la convergence et 3) l’efficience. Notez bien que je vous aidonnéla réponse à cette partie dans l’énoncé de la première question, où je mentionne ces trois propriétés explicitement. Vous n’aviez qu’à les recopier.

– Pour obtenir un estimateur non biais´e, on a besoin essentiellement de

l’hypothèse selon laquelle la moyenne conditionnelle des erreurs est nulle, une des hypothèses de base du modèle de régression multiple.

– Pour obtenir la convergence, on a besoin de l’hypothèse qui nous donne un estimateur non biaisé (voir le point précédent), plus l’hypothèse que nos observations sont i.i.d. et que leurs variances soient finies afin de pouvoir invoquer la loi des grands nombres et démonter la convergence en probabilité de l’estimateur.

– On a besoin de l’hypothèse d’erreurs homoscédastiques pour montrer l’efficience par le biais du théorème Gauss-Markov.

3 Tests d’hypoth`ese (50 points)

1. Dans l’équation (2), l’ordonnée à l’origine pour les femmes est(γ₀+γ₃), la sensibilité du revenu à l’éducation chez les femmes est donnée par (γ₁+γ₄), et la sensibilité du revenu par rapport à l’expérience chez les femmes est donnée par(γ₂ +γ₅).

2. L’écart type de l’ordonnée à l’origine pour les femmes est l’écart type de (γ₀+γ₃). Nous pouvons facilement calculer la variance de(γ₀+γ₃)qui est, évidemment, le carré de l’écart type. Tel qu’indiqué dans l’énoncé de la question, il s’agit d’une application directe des règles de l’encadré 2.3

(3)

du manuel ou de la dernière page de mes notes de cours sur la théorie des probabilités. Nous avons :

Var(ˆγ₀+ ˆγ₃) = Var(ˆγ₀) +Var(ˆγ₃) + 2Cov(ˆγ₀ , ˆγ₃). Un logiciel de régression commeSTATAva calculer la matrice de variance-covariance, que nous avons appeléΣˆβˆ. Si les variables sont ordonnées comme dans l’équation (2), nous avons :

Var(ˆγ0) = ( ˆΣβˆ)11, Var(ˆγ₃) = ( ˆΣβˆ)₄₄, et

Cov(ˆγ₀,γˆ₃) = ( ˆΣ_β_ˆ)₁₄,

où les indices inférieurs en dehors des parenthèses font référence aux

éléments appropriés de la matrice variance-covariance. Les formules pour les autres variances (de(ˆγ₁+ ˆγ₄)et de(ˆγ₂+ ˆγ₅)) sont identiques à part les changements appropriés des indices inférieurs.

3. On a trois hypothèses jointes. Dans le cas de l’équation (1), les trois hypothèses sontα₀ =β₀,α₁ =β₁ etα₂ =β₂. Dans le cas de l’équation (2), les trois hypothèses sontγ₃ = 0,γ₄ = 0etγ₅ = 0. Sous forme matricielle pour les deux cas, on a :







1 0 0 −1 0 0 0 1 0 0 −1 0 0 0 1 0 0 −1













α₀ α₁ α₂ β₀ β₁ β₂







=







0 0 0







et







0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1













γ0

γ₁ γ₂ γ3

γ₄ γ₅







=







0 0 0





.

Tel qu’indiqué dans l’énoncé de la question, même si vous n’avez pas bien

écrit l’hypothèse nulle jointe à tester, je vous donne des points pour la

(4)

cohérence entre la façon non matricielle et la façon matricielle de l’écrire.

Les contraintes dans les deux cas sont de la formeRβ =r.

4. La statistique `a calculer est :

F ≡Rβˆ−r⁰^hRΣˆβˆR⁰ⁱ⁻¹Rβˆ−r/q.

Il faut tout simplement brancher la bonne version deR, deβ, deˆ ret deΣˆβˆ

dans la formule.

5. Il faut que les erreurs soient homosc´edastiques.

6. La statistique est :

F ≡Rβˆ−r⁰^hRΣ˜_β_ˆR⁰ⁱ⁻¹Rβˆ−r/q.

La seule différence, tel que j’ai écrit dans l’énoncé de la question, est l’estimateur de la matrice variance-covariance, qui est la forme plus simple qui tient seulement sous l’hypothèse que les erreurs sont

homosc´edastiques.

7. Je vous donne dans l’énoncé de la question queSSR₃+SSR₄ =SSR₁, où le dernier terme est la somme des résidus carrés de l’estimation de l’équation (1). J’ai accepté en réponse à cette partie l’utilisation soit de SSR₁ ou deSSR₃+SSR₄. La version contrainte du modèle est

évidemment l’équation (5), puisqu’elle est estimée avec l’échantillon complet des données (observations sur les femmes et sur les hommes) et il n’y a qu’une seule ordonnée à l’origine, un seul coefficient de pente par rapport à l’éducation, et un seul coefficient de pente sur l’éxpérience.

Donc, les ordonnées à l’origine et les coefficients de pente sont identiques pour les hommes et pour les femmes, ce qui est justement l’hypothèse nulle que nous voulons tester. Appliquant la formule standard, on a :

F = (SSR₅−SSR₁)/q SSR₁/(n−kunrestricted−1).

Evidemment, il est possible de remplacer´ SSR₁par(SSR₃+SSR₄).

8. C’était à vous de choisir l’équation (1) ou l’équation (2). Dans le premier cas, on pourrait estimer cette équation :

Y_i =α₀F_i+β₀H_i+α₁EDU_i+α₂EXP_i+U_i. Dans le cas de l’´equation (2), on pourrait estimer :

Yi =γ0+γ1EDUi+γ2EXPi+γ3Fi+Ui. Les noms attribu´es aux coefficients n’ont pas d’importance.

(5)

4 Modèles de régression non linéaires (20 points)

(a) Il faut calculer le niveau deY_i avant et apr`es le changement, et soustraire les deux. On a :

Y2i =β0+β19 +β29²+β39³+β4X2i+Ui

et

Y_1i =β₀+β₁8 +β₂8²+β₃8³+β₄X_2i+U_i,

où j’utilise l’indice inférieur«2» sur la variable dépendante pour indiquer la situation après le changement et, évidemment, l’indice inférieur«1» pour indiquer la situation avant le changement.

Soustrayant, on obtient :

∆Y_i =β₁+β₂17 +β₃217.

(Là, je vous ai obligé à faire quelques multiplications simples sans calculatrice !) Donc, le changement prédit est donné par :

∆Yd_i = ˆβ₁+ 17 ˆβ₂+ 217 ˆβ₃.

(b) Pour calculer l’écart type du changement prédit moyennant l’estimation d’une version transformée du modèle, écrivons :

Y_i =β₀+ (β₁+ 17β₂+ 217β₃)X_1i +β2

X1i2−17X1i

+β3

X1i3−217X1i

+Ui.

Evidemment, en ajoutant et soustrayant les mêmes termes, on ne´ modifie pas la valeur de l’expression du côté droit de l’égalité. On peut réécrire cette équation comme :

Y_i =β₀+γX_1i+β₂Z_1i+β₃Z_2i+U_i,

où les définitions des nouvelles variables sont évidentes. Si on estime cette équation transformée par MCO, l’écart type du coefficientγ nous donne l’écart type voulu.

(6)

(c) Le calcul de l’écart type du changement prédit peut aussi passer par le calcul de la variance de cette combinaison linéaire des coefficients estimés. Encore une fois, une application directe de l’encadré 2.3.

Nous avons :

Var(∆Y_i) = Varβˆ₁+ 17 ˆβ₂ + 217 ˆβ₃

=Var^h 0 1 17 217 0 ⁱβˆ

=E

h

0 1 17 217 0 ⁱβˆ−β βˆ−β⁰^h 0 1 17 217 0 ⁱ⁰

=^h 0 1 17 217 0 ⁱE

βˆ−β βˆ−β⁰

h

0 1 17 217 0 ⁱ⁰

=^h 0 1 17 217 0 ⁱΣˆβˆ

h 0 1 17 217 0 ⁱ⁰.

Donc, si notre logiciel de régression nous donne la matrice variance-covariance des coefficients estimés nous pouvons tout simplement effectuer cette multiplicaton matricielle simple, soit par ordinateur si notre logiciel effectue les multiplications matricielles soit à la mitaine.

Vous pouvez vérifier facilement (ce n’était pas nécessaire de le faire pour l’examen) que cette expression matricielle nous donne

automatiquement l’expression suivante : Varβˆ1+ 17 ˆβ2+ 217 ˆβ3

=

Varβˆ₁+ 17²×Varβˆ₂+ 217²×Varβˆ₃ +2×17×Covβˆ1 , βˆ2

+2×217×Covβˆ₁ , βˆ₃ +2×17×217×Covβˆ₂ , βˆ₃.

Ceci est la même chose que ce que nous donnerait une application directe des règles de calcul de l’encadré 2.3 pour calculer

Varβˆ1+ 16 ˆβ2+ 217 ˆβ3

. Ce n’était pas nécessaire d’écrire la réponse de ces deux façons. J’ai accepté l’une ou l’autre des façons d’écrire la réponse comme un réponse correcte.

document cr´e´e le : 27/04/2008