• Aucun résultat trouvé

ECO 4272 : Introduction `a l’ ´ Econom´etrie Introduction au cours

N/A
N/A
Protected

Academic year: 2022

Partager "ECO 4272 : Introduction `a l’ ´ Econom´etrie Introduction au cours"

Copied!
11
0
0

Texte intégral

(1)

ECO 4272 : Introduction `a l’ ´ Econom´etrie Introduction au cours

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec `a Montr´eal

c 2018 : Steve Ambler Hiver 2018

Ces notes sont en cours de d´eveloppement. J’ai besoin de vos commentaires et de vos suggestions pour les am´eliorer. Vous pouvez me faire part de vos commentaires en personne ou en envoyant un message `a ambler.steven@uqam.ca.

(2)

Table des mati`eres

1 Objectifs du cours 3

2 Qu’est-ce que l’´econom´etrie ? 3

3 Les manuels classiques 5

4 La philosophie du manuel de Stock et Watson 7

4.1 Stock et Watson n’est pas un manuel parfait . . . 8

5 Manuels alternatifs 9

6 L’utilisation du logicielR 9

(3)

1 Objectifs du cours

• Donner une d´efinition, ou plutˆot quelques d´efinitions alternatives, de l’´econom´etrie.

• Justifier le choix de l’approche utilis´ee dans le cours.

• Justifier l’utilisation du logicielRpour les travaux empiriques.

2 Qu’est-ce que l’´econom´etrie ?

Voici quelques d´efinitions possibles tir´ees deWikip´edia.1

1. L’´etude des relations quantitatives de la vie ´economique faisant appel `a l’analyse statistique et `a la formulation math´ematique.

2. L’´econom´etrie exprime quantitativement les corr´elations pouvant exister entre des ph´enom`enes ´economiques dont la th´eorie affirme l’existence. La th´eorie ´economique fournit des id´ees sur les processus qui d´eterminent les grandeurs ´economiques, l’´econom´etrie apporte une v´erification empirique et ´etablit quantitativement les corr´elations qui apparaissent valides.

3. L’objectif de l’´econom´etrie est de confronter un mod`ele ´economique `a un ensemble de donn´ees (donn´ees longitudinales, s´eries temporelles, donn´ees en coupe transversale, etc.) et ainsi d’en v´erifier la validit´e.

4. L’´econom´etrie est une branche de l’´economie qui traite de l’estimation pratique des relations ´economiques.

Toutes ces d´efinitions font ressortir l’id´ee derelationsentre ph´enom`enes ´economiques. Nous allons finir par ´etudier des mod`eles qui peuvent ˆetre exprim´es de la fac¸on suivante :

Yi01X1i2X2i+. . .+βkXki+ui. (1)

1. VoirEconometrics dans la version anglaise etEconom´etrie´ dans la version franc¸aise.

(4)

Ici,Yi est l’i`eme observation portant sur une variable dited´ependante´economique que nous voulons expliquer ou pr´edire. L’indice inf´erieurifait r´ef´erence `a l’unit´e d’observation. Nous avons une th´eorie ´economique qui nous dit que les variablesXji j = 1,2,3. . . k(dites

explicativesou encoreind´ependantes2) aident `a expliquer ou `a pr´edire la variable d´ependante.

Nous voulons, `a l’aide de donn´ees, estimer les valeurs desβl et tester des hypoth`eses statistiques concernant ces param`etres. Les d´etails ne sont pas importants pour le moment. Nous y

reviendrons. C’est lemod`ele de r´egression lin´eaire multipleanalys´e dans tous les manuels d’´econom´etrie de base.3Le termeuiest un al´eas qui refl`ete le fait que la relation entre les variables n’est pas une relation exacte. Il capte les autres facteurs pouvant influencer la valeur de Yi `a part lesX1. . . Xket dont on ne tient pas compte explicitement.

Notre but principal sera d’estimer les valeurs desβiafin de faire des pr´evisions et de tester des hypoth`eses.

L’´econom´etrie est aussi l’application de la th´eorie des probabilit´es et de la statistique `a l’´etude de relations entre variables ´economiques diff´erentes. Finalement, il y a l’id´ee que la majeure partie du temps, les donn´ees utilis´ees pour faire des analyses ´econom´etriques ne proviennent pas d’exp´eriences contrˆol´ees en laboratoire mais plutˆot sont des donn´eesnon exp´erimentalesqui nous proviennent de la vie de tous les jours d’individus, de firmes, ou d’´economies enti`eres.

Les m´ethodologies que nous allons ´etudier peuvent ˆetre appliqu´ees aux donn´ees exp´erimentales, mais souvent avec ces donn´ees la conception de l’exp´erience permet d’isoler l’impact d’une seule variable explicative sur la variable d´ependante. Les m´ethodes ´econom´etriques se pr´eoccupent souvent de cas o`u il faut essayer de s´eparer statistiquement l’impact de plusieurs facteurs diff´erents qui agissent simultan´ement, puisque l’hypoth`ese detoutes choses ´etant ´egales par ailleurs ne tient pas.

2. Notez que l’adjectifind´ependant n’est pas utilis´e ici au sens statistique du terme.

3. Nous y reviendrons dans la cinqui`eme section du cours, apr`es un rappel de la th´eorie des probabilit´es et de la statistique, et une ´etude du mod`ele de r´egression lin´eaire simple, o`u il n’y a qu’une seule variable explicative.

(5)

3 Les manuels classiques

Je veux consacrer un peu de temps `a justifier l’approche de base du cours, qui est bas´ee sur ce qu’on retrouve dans le manuel de Stock et Watson (2011). Ce manuel comporte quelques

diff´erences importantes par rapport aux manuels d’´econom´etrie classiques. Les auteurs ´elaborent sur leur approche m´ethodologique dans la pr´eface du livre, dont je conseille fortement la lecture.

Afin de d´eriver les propri´et´es des estimateurs, et afin de pouvoir tester des hypoth`eses concernant les valeurs de nos estim´es, il faut faire des hypoth`esesstatistiquesconcernant les variables explicatives et le terme d’erreur de l’´equation (1). (Presque) tous les manuels avant celui de Stock et Watson (je vais les appeler les manuelsclassiques) font les hypoth`eses suivantes dans le cadre du mod`ele de base :4

1. Les termes d’erreuruiont une variance constante. Autrement dit,

Var(ui) = Var(u).

2. Les termes d’erreuruiproviennent d’une distributionnormale. Autrement dit,

ui ∼N µ , σ2 ,

o`u E(u) = µest l’esp´erance deuet Var(u) = σ2 est la variance deu.5

3. Les valeurs des variables explicatives sont fixes ou non stochastiques. On peut les traiter comme des constantes pour les fins de l’inf´erence statistique.

Ce ne sont pas les seules hypoth`eses, mais ces trois hypoth`eses font partie des hypoth`eses statistiques du mod`ele de r´egression lin´eaire tel que pr´esent´e dans les manuels classiques.6

4. Nous allons revenir `a ces hypoth`eses plus tard dans le cours. Il n’est pas n´ecessaire de les retenir ou de les comprendre pour l’instant.

5. Nous allons revenir sur ces concepts dans le chapitre suivant.

6. Il est vrai que les manuels classiques analysent ce qui arrive si une ou plusieurs de ces hypoth`eses ne tiennent pas, mais ils supposent que les hypoth`eses tiennent lorsque le mod`ele de r´egession est pr´esent´e pour la premi`ere fois.

(6)

Le probl`eme avec ces hypoth`eses estqu’elles ne tiennent `a toutes fin pratiques jamaisdans les donn´ees que nous avons `a notre disposition.

1. Typiquement, les erreurs ne proviennent pas d’une distribution normale. De toute fac¸on, en ´econom´etrie nous travaillons avec des donn´ees non exp´erimentales, qui proviennent de la vraie vie et non d’exp´eriences en laboratoire. Nous n’observons que l’´echantillon de donn´ees que nous avons. Typiquement, nous n’observons pas la population enti`ere d’o`u proviennent les donn´ees. La normalit´e des erreurs est plus l’exception que la r`egle. Il y a des tests formels de l’hypoth`ese que les erreurs suivent une distribution normale, mais on ne peut jamais en avoir la certitude.

2. Les erreurs n’ont pas une variance constante. On constate que leur variance est souvent reli´ee syst´ematiquement aux valeurs r´ealis´ees des variables explicatives (lesXjidans le mod`ele (1) ci-dessus). Ceci est le ph´enom`ene del’h´et´erosc´edasticit´epour utiliser le terme technique.7

3. Tel qu’indiqu´e au premier point, les donn´ees typiquement nous sont fournies par la vraie vie. Il n’y a aucune raison de supposer que, si on avait un ´echantillon de donn´ees diff´erent, les valeurs r´ealis´ees des variables explicatives seraient identiques. Autrement dit, les variables explicativesXjitout comme l’erreuruiet la variable d´ependanteYi, sont stochastiquesoual´eatoires.

Cela veut dire que, dans les manuels classiques, on d´erive les propri´et´es statistique des estimateurs et des tests d’hypoth`ese sous ces hypoth`eses fortement irr´ealistes. Par la suite, on regarde ce qui arrive si on laisse tomber (ou, autrement dit, si on relˆache) ces hypoth`eses. Cela revient `a oublier ou `a ´ecarter les formules qu’on a pass´e beaucoup de temps `a d´eriver pour les remplacer par d’autres formules.

7. Voir l’articleHeteroscedasticity surWikipedia.

(7)

4 La philosophie du manuel de Stock et Watson

Le manuel se diff´erencie de tous les autres manuels d’introduction en ´econom´etrie `a trois niveaux.

1. On met l’accent sur les propri´et´es des estimateurs et sur l’inf´erenceen grand ´echantillon.

La plupart du temps, lorsqu’on fait du travail appliqu´e, on ne sait pas de quelles

distributions nos donn´ees proviennent. Par contre, sous certaines hypoth`eses, moins fortes que celles utilis´ees dans les autres manuels, nous pouvons utiliser une version du

th´eor`eme de la limite centralepour montrer que nos statistiques calcul´ees sont

distribu´eesapproximativementselon une loi normale, si la taille de notre ´echantillon de donn´ees est suffisamment grande. Le th´eor`eme de la limite centrale nous dit que la moyenned’un nombre suffisamment ´elev´e devariables al´eatoiresqui sont ind´ependamment distribu´eeset qui ont une moyenne et unevariancefinies est approximativement distribu´ee selon uneloi normale.8

2. On admet d`es le d´epart que les erreurs n’ont pas une variance constante (on admet la possibilit´e de l’h´et´erosc´edasticit´e). Les propri´et´es statistiques des estimateurs et des tests sont d´eriv´ees en cons´equence.

3. On suppose d`es le d´epart que les variables explicatives, tout comme le terme d’erreur et la variable d´ependante, sont stochastiques ou al´eatoires. Encore une fois, les propri´et´es statistiques des estimateurs et des tests d’hypoth`ese sont d´eriv´ees en cons´equence.

Le grand avantage, c’est qu’il ne faut pas apprendre des r´esultats et des formules qui ne tiennent que pour des cas sp´eciaux qui ne refl`etent pas bien la r´ealit´e des donn´ees ´economiques utilis´ees par les praticiens, des formules qu’il faut par la suite oublier pour les remplacer par des formules plus r´ealistes.9

Le d´esavantage principal est que les formules plus g´en´erales sont un plus ardues `a d´eriver. Les auteurs du manuel pensent, comme moi, que l’effort additionnel qu’il faut investir vaut le coup. Je

8. Ne vous inqu´etez pas. Nous allons revoir des d´efinitions de tous les concepts mentionn´es en caract`eres gras.

9. La philosophie du manuel est bien expliqu´e dans l’article de Stock (2010). Voir le chapitre de r´ef´erences pour la r´ef´erence exacte.

(8)

ne suis pas le seul `a penser comme c¸a. Le manuel de Stock et Watson est le manuel d’´econom´etrie le plus vendu sur le march´e nord-am´ericain.

Je crois que les avantages l’emportent sur les d´esavantages. Donc, j’utilise l’approche de Stock et Watson dans mes notes de cours.

4.1 Stock et Watson n’est pas un manuel parfait

J’esp`ere que je vous ai convaincus que le manuel de Stock et Watson a certains avantages (ou plutˆot des avantages certains). Par contre, il n’est pas parfait. De mon point de vue, son

inconv´enient principal est de pr´esenter le mod`ele de r´egression multiple sans recourir `a la notation matricielle.10Vous avez tous suivi un cours sur l’alg`ebre lin´eaire (c’est un pr´erequis du cours !).

Donc, vous connaissez d´ej`a les ´el´ements de base en termes de notation et d’alg`ebre matriciel. Une fois cette notation assimil´ee, je suis convaincu qu’il estbeaucoupplus facile d’analyser les propri´et´es du mod`ele de r´egression multiple en notation matricielle qu’avec des sommations.

J’esp`ere qu’`a la fin du trimestre, vous serez ´egalement convaincus que c’est le cas.11

Pour cette raison, j’incorpore quelques ´el´ements des derniers chapitres du manuel dans mes notes de cours sur la r´egression multiple. Une cons´equence de ceci est que ceux qui d´ecident de suivre le cours ECO5272 auront d´ej`a vu le mod`ele de r´egression multiple suivant une approche

matricielle, ce qui facilitera l’utilisation d’une approche matricielle pour les sujets couverts dans ce cours (donn´ees longitudinales, variables d´ependantes dichotomiques, l’utilisation de variables instrumentales, les donn´ees quasi exp´erimentales, les s´eries chronologiques, etc.).

En d´epit de l’insistance sur une variance des erreurs qui n’est pas constante dans les donn´ees, on ne pr´esente pas de tests statistiques formels dans le manuel de Stock et Watson pourd´etecterla pr´esence de variances qui ne sont pas constantes. Stock et Watson se limitent `a pr´esenter une m´ethodologie pour faire des inf´erences statistiques correctes qui sont robustes `a la pr´esence ou

10. Vers la fin du livre (version anglaise seulement) on reprend le mod`ele de r´egression multiple en notation matri-

(9)

non d’erreurs qui n’ont pas une variance constante. J’ajoute une section aux notes sur le mod`ele de r´egression multiple qui porte sur des tests formels pour d´etecter des variances non

constantes.12

5 Manuels alternatifs

Si vous comptez suivre le cours ECO5272, et encore plus si vous comptez poursuivre vos ´etudes aux cycles sup´erieurs, je conseille fortement l’achat du livre de Kennedy (2003). Voir les

remarques dans le chapitre de r´ef´erences.

6 L’utilisation du logiciel R

En mˆeme temps que je vous enseigne la th´eorie de l’´econom´etrie, je vais essayer de vous initier au logicielR. Il s’agit d’un logiciel puissant pour la statistique et pour l’´econom´etrie. Un de ses avantages est d’ˆetre gratuit et libre (open source en anglais). Il est facile de le t´el´echarger et de l’installer sur n’importe quel ordinateur personnel, en versionsWindows,Mac, etLinux. Pour les avantages du logiciel (et quelques d´esavantages aussi), voir la critique de Racine et Hyndman (2002) ou l’article plus r´ecent de Zeileis et Koenker (2008). Parmi les avantages :

1. Tel qu’indiqu´e, il est gratuit, libre et ouvert (open source, ce qui veut direfree as in free beer etfree as in free speech).

2. Les ´etudiants peuvent facilement travailler chez eux, sans se rendre dans un laboratoire sur le campus (etsans piraterdes logiciels).

3. Le logiciel est disponible pour plus de plates-formes que n’importe quel autre logiciel

´econom´etrique (Windows,Mac,Linux,BSD,Unix, etc.).

4. Il est tr`es flexible.

12. C’est la mˆeme chose en ce qui concerne la normalit´e. Il y a des tests formels de l’hypoth`ese nulle que les erreurs sont g´en´er´ees par une loi normale, mais Stock et Watson se limitent `a pr´esenter une m´ethodologie qui donne des inf´erences correctes si les erreurs sont normales ou non.

(10)

5. Il est relativement rapide.

6. Il a des capacit´es assez pouss´ees pour cr´eer des graphiques.

C’est le logiciel pr´edominant chez les statisticiens,13et son utilisation est de plus en plus r´epandue chez les ´economistes. Il y a de plus en plus de routines sp´ecialis´ees pour des sujets particuliers en ´econom´etrie, qui sont disponibles sur le site principal du logiciel.

ApprendreRpeut vous servir pour le reste de vos carri`eres.

Ceci dit, je crois que certains d’entre vous sont d´ej`a familiers avec d’autres logiciels, dont des logiciels commerciaux commeSTATA.14 Si vous connaissez un autre logiciel vous pouvez

l’utiliser pour les travaux pratiques du cours, mais on ne fournira pas de support technique.15Une exception `a cette r`egle est le logicielGRETL, un autre logiciel gratuit et ouvert, pour lequel je peux offrir des conseils techniques.

Il est vrai que la version ´etudiante deSTATAest relativement peu dispendieuse, et donc les

´etudiants peuvent l’acheter sans trop d´epenser et sans devoir pirater des logiciels. Par contre, si vous investissez beaucoup de temps pour apprendre ce logiciel, vous allez ˆetre confront´es apr`es vos carri`eres universitaires avec des prix assez sal´es pour acheter vos licences.

R´ef´erences

Deux articles duNew York Timessur le logicielR:

Vance, Ashlee (2009), “Data Analysts Captivated byR’s Power.”New York Times7 janvier

http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html

Vance, Ashlee (2009), “R You Ready forR?”New York Times8 janvier

http://bits.blogs.nytimes.com/2009/01/08/r-you-ready-for-r/

13. `A ce sujet, voir les articles publi´es dans leNew York TimessurR: le lien est `a la fin de ce chapitre.

14. STATAa ses propres avantages. Pour ceux qui font du travail utilisant des grosses banques de donn´ees micro-

´econom´etriques, il a des fonctions tr`es puissantes pour la s´election automatique de sous-´echantillons suivant certains crit`eres. Par contre, les capacit´es du logicielRpour la s´election automatique de sous-´echantillons s’am´eliorent rapide-

(11)

Un autre article r´ecent surR:

Machlis, Sharon (2013), “Beginner’s guide to R : Introduction.”Computerworld6 juin

http://www.computerworld.com/article/2497143/business-intelligence/

business-intelligence-beginner-s-guide-to-r-introduction.html

Pour les autres r´ef´erences, voir ce lien :

http://www.steveambler.uqam.ca/4272/chapitres/referenc.pdf

Derni`ere modification :05/01/2018

Références

Documents relatifs

I D´ efinissons ˆ β (i ) comme le vecteur de param` etres estim´ es apr` es avoir laiss´ e tomber l’observation i de l’´ echantillon, et ˆ Y (i) le vecteur de valeurs pr´

Savoir comment tester une hypoth`ese simple concernant un moment (esp´erance, variance, etc.) d’une variable al´eatoire, avec hypoth`ese alternative unilat´erale ou

• Savoir que le test F effectu´e le plus souvent dans le contexte du mod`ele de r´egression multiple, c’est le test de l’hypoth`ese jointe nulle que tous les coefficients sauf

I Th´ eor` eme de la limite centrale : la moyenne d’un nombre suffisamment ´ elev´ e de variables al´ eatoires qui sont ind´ ependamment distribu´ ees et qui ont une moyenne et

I But : pr´ esenter quelques strat´ egies g´ en´ erales pour sp´ ecifier et estimer des mod` eles ´ econom´ etriques non lin´ eaires.. I Mod` eles non lin´ eaires dans les

• Attention aux autres manuels. La plupart des manuels classiques d´eveloppent le mod`ele de r´egression simple et le mod`ele de r´egression multiple sous les hypoth`eses suivantes:

Regarder les hypoth` eses statistiques du mod` ele et analyser leurs cons´ equences (absence de biais, convergence, efficience).. Distinguer entre les cas d’erreurs h´ et´

I La multicollin´ earit´ e imparfaite n’est typiquement pas un signe d’une erreur logique dans le choix des variables explicatives du mod` ele, mais est due aux donn´ ees utilis´