• Aucun résultat trouvé

Guide d’économétrie appliquée pour Stata

N/A
N/A
Protected

Academic year: 2022

Partager "Guide d’économétrie appliquée pour Stata"

Copied!
51
0
0

Texte intégral

(1)

Guide d’´econom´etrie appliqu´ee pour Stata

Simon Leblond

1

Universit´ e de Montr´ eal simon.leblond@umontreal.ca

26 d´ ecembre 2003

(2)

Table des Mati` eres

1 Introduction `a Stata 6

2 Commandes g´en´erales importantes 7

2.1 Importation des donn´ees . . . 7

2.2 Manipulation des donn´ees . . . 8

2.2.1 Op´erateurs math´ematiques . . . 8

2.2.2 Op´erateurs logiques et de comparaison . . . 9

2.2.3 Manipulations des matrices . . . 9

2.3 Autres transformations des variables . . . 11

2.4 Divers . . . 11

2.5 Exemples et r´esultats pour le Chapitre 2 . . . 12

3 Visualisation des donn´ees 13 3.1 Impression/Exportation des donn´ees . . . 13

3.1.1 Impression `a l’´ecran . . . 13

3.1.2 Exportation . . . 13

3.1.3 Impression . . . 13

3.2 Exemples et r´esultats pour le Chapitre 3 . . . 14

4 Graphiques 15 4.1 Exemples et r´esultats pour le Chapitre 4 . . . 16

5 R´egressions Simples 17 5.1 Tests d’h´et´erosc´edasticit´e . . . 18

5.2 Test de Changement structurel (Test de Chow) . . . 19

6 Variables instrumentales et Doubles Moindres Carr´es 21 6.1 Estimateur Variables Instrumentales . . . 21

6.2 DMCO . . . 22

6.3 Tests d’endog´en´eit´e . . . 23 7 Estimateur du Maximum de Vraissemblance (EMV) 24

(3)

8 Moindres Carr´es G´en´eralis´es 26

9 Variables d´ependantes qualitatives 27

9.1 Probit/Logit . . . 27

9.2 Probit/Logit ordonn´e . . . 28

9.3 Tobit . . . 28

9.4 Biais de s´election: Heckit . . . 28

10 Mod`eles de dur´ee 29 11 S´eries Chronologiques 30 11.1 Op´eration sur les variables dans le cadre de s´eries chronologiques . . . 30

11.2 Op´erateurs de s´eries temporelles . . . 30

11.3 Tests d’autocorr´elation . . . 31

11.4 M´ethode de Box-Jenkins . . . 32

11.4.1 Stationnarit´e des donn´ees . . . 32

11.4.2 Mod´elisation des cycles: Mod`eles AR, MA, ARMA, ARIMA . . . 33

11.4.3 S´election de Mod`ele . . . 34

12 Donn´ees longitudinales (Panel) 36 12.1 Effets Fixes et Effets Al´eatoires . . . 36

12.1.1 Variables binaires . . . 36

12.1.2 Fonctions pour donn´ees longitudinales . . . 37

13 Interaction avec les tableurs et les traitements de texte 39 13.1 Remarques . . . 39

13.2 Tableur . . . 39

13.3 Traitement de texte . . . 40

14 O`u trouver ses donn´ees et comment les extraires 41 14.1 Liens utiles . . . 41

14.1.1 `A l’Universit´e . . . 41

14.1.2 `A l’Ext´erieur . . . 41

(4)

A.4 Alphabet Grec . . . 50

(5)

Introduction

Ce manuel ne vient pas se substituer `a vos notes de cours, mais plutˆot les compl´eter en vous donnant un guide pour l’utilisation de Stata. `A ce titre, bien que vous trouverez quelques fois des explications plus importantes sur la nature d’un probl`eme ´econom´etrique, la majorit´e du temps on supposera que vous poss´edez d´ej`a les connaissances li´ees `a la section consult´ee.

Chaque section pr´esente rapidement le but de l’op´eration qui y est trait´e. Les commandes appropri´ees sont ensuite pr´esent´ees, d’abord individuellement, puis dans le cadre d’exemples concrets. Il existe deux versions de ce guide, celle-ci pour Stata et une autre pour Matlab.

Notez que ce manuel couvre la version 7 de Stata, la version 8 sera int´egr´ee peu `a peu pendant l’ann´ee qui vient. Comme il s’agit d’un manuel encore en d´eveloppement, des changements lui seront constamment apport´es en cours de session et la version distribu´ee sera toujours la plus r´ecente. Tout commentaire, suggestion ou correction sera bienvenu et appr´eci´e.

Prenez note que ce texte d´ecrit seulement certaines fonctions ainsi que leurs options les plus souvent utilis´ees pour le genre de recherches effectu´ees au bac et `a la maˆıtrise en

´

economie, il n’est donc pas du tout exhaustif. Un conseil: apprenez `a utiliser l’aide de Stata.

Il s’agit l`a d’un outil fort utile pour d´ecouvrir de nouvelles fonctions ou pour connaˆıtre l’ensemble des options disponibles pour les fonctions d´ecrites dans ce guide.

Les fonctions sont pr´esent´ees dans le format suivant:

1. Le nom de la fonction et, entre paranth`eses, le nom abrg´eg´e de la fonction;

2. Sa description;

3. Le format d’entr´ee;

(6)

• Le texte en italique d´esigne les variables et autres chaˆınes de caract`eres qui doivent ˆetre remplac´ees.

• Le texte ensans serif d´esigne le texte tel qu’il serait entr´e `a l’ordinateur.

Les chapitres 1 `a 4 font le tour des commandes de base, ainsi que leur format de saisie. `A la suite de ces chapitres vous devriez ˆetre en mesure d’importer, de manipuler, puis d’exporter vos donn´ees et de tracer des graphiques.

Les chapitres 5 `a 12 abordent quant `a eux chacun un sujet sp´ecifique de l’´econom´etrie. Ils prennent donc une approche quelque peu diff´erente puisqu’ils introduisent peu de nouvelles fonctions, se concentrant plutˆot sur la d´emarche `a adopter pour effectuer l’op´eration en question.

Finalement, les deux derniers chapitres (13 et 14) sortent quelque peu du cadre de ce guide en abordant respectivement la manipulation des donn´ees par Word et Excel et la recherche de donn´ees. Ces chapitres ont pour but de vous aider dans le cadre plus g´en´eral de la production d’un travail de recherche.

(7)

Chapitre 1

Introduction ` a Stata

Ce guide s’appuie sur la construction d’un do-file (.do), plutˆot que sur l’entr´ee directe de commandes. Les avantages du do-file sont nombreux. Entre autres, il vous d’entrer les commandes `a nouveau si le travail s’´etend sur plusieurs s´eances, il permet de garder une trace du travail effectuer et il permet de garder une vue d’ensemble des ´etapes du programme.

Pour cr´eer un do-file, il faut entrer dans le do-file editor. Vous pouvez ´egalement construire un fichier texte (.txt) avec un traitement de texte quelconque auquel vous donnerez une extension ‘.do’. Notez que vous n’ˆetes pas du tout oblig´es d’avoir recours `a un do-file, vous pouvez entrez directement dans la boˆıte de commande toutes les fonctions mentionn´ees dans ce guide.

La version 8 de Stata permet d’utiliser les fonctions en les s´electionnant directement des menus. Ce guide n’abordera pas du tout cette approche et ce concentrera sur l’utilisation

“manuelle” (entr´ee directe) des fonctions.

(8)

Chapitre 2

Commandes g´ en´ erales importantes

2.1 Importation des donn´ ees

Note importante sur l’importation de donn´ees:

Lorsque vous faites le transfert des donn´ees, vous devez vous assurer que le format de celles-ci est compatible avec Stata. Outre les s´eparateurs de donn´ees qui doivent correspondre `a la commande choisie, il faut aussi s’assurer que le s´eparateur de d´ecimales soit un point (.) et que les milliers ne soient pas s´epar´es par un espace. Consultez la section 13 pour plus de d´etails `a ce sujet.

insheet

Rapide et efficace, insheetpermet d’importer les donn´ees d’un fichier texte poss´edant une observation par ligne et dont les donn´ees sont s´epar´ees par des tabulations ou desvir- gules.

si le nom des donn´ees sont sur la premi`ere ligne:

insheet using nomdef ichier1

si le fichier ne contient pas le nom des donn´ees:

insheet [nom des variables]2 using nom de f ichier

options3: clear, sp´ecifie que les donn´ees en m´emoires peuvent ˆetre remplac´ees par les nou- velles donn´ees import´ees.

1A moins de pr´` ecisions contraires,nomdef ichierindique le nom complet, donc avec le chemin d’acc`es et l’extension (a:\test.txtpar exemple).

2La nomenclature de l’aide de Stata est conserv´ee tout au long de ce guide, ainsi les arguments entre “[

]” d´esignent des arguments facultatifs.

3Les options dans stata sont s´epar´es du reste de la commande par une virgule. Par exemple, dans le cas pr´esent: insheet using”c:\ test.txt”, clear

(9)

infile (inf)4

Permet plus de flexibilit´e queinsheeten permettant que les observations soient sur plusieurs lignes ou que les donn´ees soient s´epar´ees par des espaces.

une observation par ligne: infile nom des variables using nom de f ichier observations sur plusieurs lignes:

infile nom des variables [ skip(#) nom des variables] using ‘‘nom de f ichier’’;

o`u# d´esigne le nombre de ligne `a sauter pour continuer la lecture de l’observation.

options: clear, voirinsheet

ex: observation sur la premi`ere, la deuxi`eme et la quatri`eme ligne. . . infile var1 var2 skip var3 var4 skip(1) var5 var6 using “a:\test.raw”

2.2 Manipulation des donn´ ees

Stata

generate (g)

Probablement la commande la plus utile (et utilis´ee) dans Stata, elle permet de cr´eer des nouvelles variables.

generate nouvelle variable = expression

ex: g x2 = x^2 replace

Mˆeme id´ee que generate, mais pour une variable existante.

replacevariable existante =expression

ex: replace x2 = x/2

(10)

2.2.2 Op´ erateurs logiques et de comparaison

ET: &

OU: |

Non (¬): ~

Egal:´ ==

Diff´erent: ~=

Plus grand: >

Plus petit: <

Plus grand ou ´egal: >=

Plus petit ou ´egal: <=

2.2.3 Manipulations des matrices

matrix (mat)

L’´equivalent de generate pour les matrices, permet de cr´eer des nouvelles matrices ou de modifier des matrices existantes.

matrix nom de la matrice = expression

ex:

Cr´eation d’une matrice: mat A = B*C

Modification d’une matrice existante: mat A = A*2

Construction d’une matrice: mat D = (1,0,0\0,1,0); o`u les virgules s´eparent les colonnes et les \ s´eparent les rang´ees (matrice 2×3).

Extraction d’une sous-matrice: mat A = B(1..4,2...); se lit rang´ees 1 `a 4, colonne 2 `a N.

Remplacement d’un ´el´ement: mat A(1,1) = 3; remplace l’´el´ement a11 par 3.

mkmat

Permet de transformer des variables existantes en vecteurs du mˆeme nom ou en une nouvelle matrice.

Transformation en vecteurs: mkmat nom(s) de variable(s)

Transformation en matrice: mkmat nom(s) de variable(s), matrix [(nom de la nouvelle matrice)]

ex: mkmat x1 x2 x3 x4, mat(X) svmat

Inverse de mkmat, transforme les colonnes d’une matrice en vecteurs.

svmat matrice, [names(nom col1, nom col2, . . .)];names peut aussi s’´ecrire n

(11)

ex: svmat X, n(x1,x2,x3,x4) matrix get

Sert `a obtenir une copie d’une matrice syst`eme5 Quelques matrices syst`emes:

• b: coefficients apr`es une estimation

• VCE: matrice de variance-covariance apr`es une estimation matrix variable = get(matrice syst`eme)

ex: matrix beta = get( b) Fonctions matricielles det(A): d´eterminant deA

rowsof(A): nombre de rang´ees de A colsof(A): nombre de colonnes de A el(A,i,j): ´el´ement aij de A

I(n): matrice identit´en×n

inv(A): inverse de la matrice carr´eeA

diag(V): matrice diagonale n×n, avec pour diagonale les ´el´ements de V, o`u V est un vecteurn×1 ou 1×n

vecdiag(A): extrait la diagonale d’une matrice carr´eeA sous forme de vecteur

Op´erateurs matriciel

Soit AetB, deux matrices carr´ees d´efinies positives n×n etC, une matrice d´efinie positive t×n:

Transpos´ee: A0 (n×n) Somme: A + B (n×n) Diff´erence: A - B (n×n)

(12)

2.3 Autres transformations des variables

log(x): logarithme naturel dex, ´equivalent `aln(x) exp(x): exponentiel de x, i.e. ex

mod(x,y): partie enti`ere dex par rapport `a y, par exemple: mod(5,26) = 5 abs(x): valeur absolue de x

sqrt(x): racine carr´ee de x, ´equivalent `a x^1/2

max(x1, ..., xn): renvoie l’argument poss´edant la valeur la plus ´elev´ee min(x1, ..., xn): renvoie l’argument poss´edant la valeur la moins ´elev´ee sum(x): somme de tous les ´el´ements de x

uniform(): donne une valeur al´eatoire entre 0 et 1 (ditribution uniforme sur [0,1))

2.4 Divers

Commentaires

Il est possible d’ins´erer des commentaires dans son programme en prenant soin de d´ebuter la ligne de commentaire par le symbole ‘*’.

ex: * Ceci est un commentaire.

more

Avez-vous d´ej`a rencontr´e le message --more-- qui fait une pause dans l’affichage de vos donn´ees? Si ¸ca vous ´enerve, vous pouvez enlever ce message en sp´ecifiant set more offau d´ebut de votre programme.

set matsize(set mat)

La taille maximale des matrices est fix´ee par d´efaut `a 40×40 dans Stata. Pour utiliser des matrices plus grandes vous devez utiliser la fonction set matsize.

set matsize #; o`u # est un nombre entre 10 et 800 qui indique la taille maximale des matrices.

if

La majorit´e des fonctions peuvent ˆetre suivies de la commande if qui permet de sp´ecifier une condition pour que l’expression soit execut´ee. if est plac´e apr`es la fonction, mais avant les options

Cette option ne sera pas mentionn´ee pour chaque fonction puisqu’elle est pr´esente tr`es sou- vent.

commande if expression

ex: replacex=y if x < y

(13)

in

La majorit´e des fonctions peuvent ˆetre suivies de la commande in qui permet de sp´ecifier l’´etendue des donn´ees affect´ees par la fonction. in est plac´e apr`es la fonction, mais avant les options.

Cette option ne sera pas mentionn´ee pour chaque fonction puisqu’elle est pr´esente tr`es sou- vent.

commande in ´etendue; o`u ´etendue peut prendre la forme # ou #/#, et # peut-ˆetre un nombre positif,l(derni`ere observation),f(premi`ere observation) ou un nombre n´egatif (dis- tance par rapport `a la derni`ere observation).

ex:

regress y x1 x2 in f /60; ´equivalent `a regress y x1 x2 in 1/60: les 60 premi`eres observations.

list y in -10/l: les 10 derni`eres observations.

2.5 Exemples et r´ esultats pour le Chapitre 2

Lecture des donn´ees `a partir du fichier Donnees.dat et manipulation des variables dans le but de faire une r´egression. Le fichierDonnees.dat contient 5 variables, comptant chacune 100 observations.

set more off

infile px qt var3 var4 var5 ”c:\mes documents\Donnees.dat”, clear

* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit

* ˆetre inclu dans l’ensemble [0,25;0,5] et la 5e variable doit ˆetre ´egale

* `a 1 pour que la variable binaire ´egale 1.

g bin = (0.25 = var3/var4 = 0.5 var5==1)

* Cr´eation d’une variable indice.

g no = n

(14)

Chapitre 3

Visualisation des donn´ ees

3.1 Impression/Exportation des donn´ ees

3.1.1 Impression ` a l’´ ecran

list

Affiche `a l’´ecran la valeur des variables sp´ecif´ees.

list [nom(s) de variable(s)]; si aucun nom de variable est sp´ecifi´e, Stata affiche toutes les variables.

ex:

list y in -10/l: affiche les 10 derni`eres observations de y.

3.1.2 Exportation

log using

Permet de sauvegarder une copie de sa session dans le fichier sp´ecifi´e. Doit ˆetre suivi de log off `a la fin du programme.

log using nom de f ichier programme

log off

Options: replace, indique `a Stata de remplacer le fichier existant.

3.1.3 Impression

La fa¸con la plus pratique d’imprimer ses r´esultats est d’utiliser la fonctionlog, puis de traiter le fichier “.log” avec son traitement de texte pr´ef´er´e.

(15)

3.2 Exemples et r´ esultats pour le Chapitre 3

Reprenons l’exemple du chapitre 1, en incluant cette fois les fonctions du chapitre 2.

log using ”c:\mes documents\ExChap2.log”, replace set more off

infile px qt var3 var4 var5 ”c:documents.dat”, clear

* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit

* ˆetre inclu dans l’ensemble [0,25;0,5] et la 5e variable doit ˆetre ´egale

* `a 1 pour que la variable binaire ´egale 1.

g bin = (0.25 = var3/var4 = 0.5 & var5 ==1) list px qt bin

* Cr´eation d’une variable indice.

g no = n log close

(16)

Chapitre 4 Graphiques

graph (gr)

Trace des graphiques.

graph nom des variables, [type de graphique, autres options]

O`utype de graphique peut prendre les valeurs suivantes:

• histogram (h): histogramme

• twoway (t): nuage de points `a deux axes; valeur par d´efaut si plusieurs variables sont affich´es. La premi`ere variable sp´ecifi´ee est toujours la variable d´ependante.

• bar(b): graphique `a barres

• pie(p): graphique en pointe de tartes

Voici certaines des options suppl´ementaires les plus utiles:

• xlog, ylog: sp´ecifie que l’axe des x ou des y respectivement doit ˆetre en ´echelle logarithmique.

• xline, yline: sp´ecifie qu’une grille en x ou en y respectivement devrait ˆetre affich´ee.

• connect(option) (c(option)): sp´ecifie si les points devraient ˆetre connect´es/. option peut prendre les valeurs suivantes:

– .: non-connect´es; valeur par d´efaut – l: lignes droites entre les points

– s: traces des lignes courbes entre les points

• symbol(option) (s(options)): sp´ecifie le symbole que doivent prendre les points.

option peut prendre les valeurs suivantes:

– O: grand cercles; valeur par d´efaut

(17)

– o: petits cercles – .: points

– i: invisibles

• saving(nomdef ichier), [replace]: sauvegarde le graphique dans le fichier sp´ecifi´e, si aucune extension n’est sp´ecifi´ee, Stata ajoute par d´efaut “.gph”.

replaceindique que le fichier existant peut ˆetre remplac´e.

4.1 Exemples et r´ esultats pour le Chapitre 4

log using ”e:\ExChap3.log”, replace set more off

* Fixer le nombre d’observations `a 100.

set obs 100

* cr´eation d’un indice de temps commen¸cant `a 4.

g t = n+3

* cr´eation du log de cet indice.

g lnt = log(t)

graph lnt t, saving(”e:1”, replace) graph lnt t, yline saving(”e:2”, replace) graph lnt t, yline c(s) saving(”e:3”, replace) graph lnt t, yline s(.) saving(”e:4”, replace)

graph lcrd t, xlog yline c(s) s(i) saving(”e:5”, replace) log off

(18)

Chapitre 5

R´ egressions Simples

Dans ce chapitre nous consid´ererons le mod`ele suivant:

y = β01x12x2+· · ·+βkxk+u y = Xβ+u

regress(reg)

Incontournable si on d´esire faire des r´egressions par MCO. Effectue la r´egression de la variable d´ependante sur la ou les variables ind´ependantes sp´ecifi´ees.

regressvariable d´ependante [variables ind´ependantes]

Options:

• level(#) (l(#)): permet de sp´ecifier le niveau de confiance pour les intervalles et le p-value (# doit ˆetre un entier); silevel()n’est pas sp´ecifi´e, # prend la valeur 95, i.e.

le niveau de confiance est fix´e `a 95%.

• robust (r): calcule des variances robustes par la m´ethode de Eicker-White.

ex: reg y x1 x2 x3 if x1==1, r predict

Permet de calculer les valeurs pr´edites, les r´esidus, etc. pour toutes les observations.

predictnom de nouvelle variable; sans aucune option calcule les valeurs pr´edites (ˆy).

Options:

• xb: calcule X0β, la valeur lin´eaire pr´edite

• residuals (r): calcule les r´esidus

• stdp: calcule les ´ecarts-types des valeurs pr´edites

(19)

ex: calcule les ˆy hors-´echantillon reg y x1 x2 x3 in 1/100

predict y hat if ~e(sample)

test (t)

testpermet d’effectuer des tests d’hypoth`eses apr`es une estimation. Il prend principalement deux formes:

test [expression1 = expression2]: test que l’expression1 n’est pas statistiquement diff´erente de l’expression2

test liste de coef f icients: test que les coefficients ne sont pas conjointements statistique- ment diff´erents de z´ero.

ex:

reg y x1 x2 x3 test x1 = x2 test x2 x3

5.1 Tests d’h´ et´ erosc´ edasticit´ e

La pr´esence d’h´et´erosc´edasticit´e ne vient pas biaiser vos r´esultats, elle biaise plutˆot les ´ecarts- types obtenus par MCO. Il existe plusieurs m´ethodes similaires de tester pour la pr´esence d’h´et´erosc´edasticit´e. La plus simple est le test de Breusch-Pagen:

1. r´ecup´erer les r´esidus de la r´egression qu’on d´esire tester;

2. g´en´erer le carr´e des r´esidus;

3. r´egresser la carr´e des r´esidus sur les variables d´ependantes de la r´egression originale;

4. tester si les coefficients sont conjointement significatifs (test F ou test LM).

(20)

de White. Afin de limiter le nombre de r´egresseurs, on peut utiliser un test de White l´eg`erement modifi´e:

u201yˆ+β22+e

On proc`ede pour le reste exactement de la mˆeme fa¸con que pour le test de Breusch-Pagan.

Que faire lorsque vous trouvez la pr´esence d’h´et´erosc´edasticit´e? Deux options s’offrent `a vous:

• Calculer des variances robustes par la m´ethode de White1

• Estimer le mod`ele par MCG, i.e. mod´eliser la forme d’h´et´erosc´edasticit´e (voir le chapitre 8).

5.2 Test de Changement structurel (Test de Chow)

Consid´erez le mod`ele suivant:

y =β01x12x2+u

Le test de Chow sert `a v´erifier s’il existe une diff´erence dans l’influence d’une variable d´ependante entre deux groupes de donn´ees, i.e. si le coefficient est statistiquement diff´erent.

Les deux groupes de donn´ees pourraient ˆetre deux s´eries d’observations ou deux p´eriodes de temps par exemple.

La fa¸con “classique” d’effectuer le test de Chow est d’effectuer la r´egression du mod`ele pour les deux groupes de fa¸con ind´ependante et pour les deux groupes ensemble:

ˆ

y1 = β1011x1112x12

ˆ

y2 = β2021x2122x22 ˆ

y = β01x12x2

puis de tester si les coefficient sont statistiquement diff´erents par un test F: F = (SSRˆ y −SSRˆ y1 −SSRˆ y2)/q

(SSRˆ y1 −SSRˆ y2)/n1 +n2−2k)

Rappel: q est le nombre de contraintes et k le nombre de coefficients, ici q=k= 3

Une autre fa¸con plus rapide d’effectuer ce test est de construire une variable binaire ´egale `a

1Il peut-ˆetre bien tentant de proc´eder syst´ematiquement avec les variances robustes Eicker-White pour

´

eviter de faire le test d’h´et´erosc´edasticit´e, mais cette fa¸con de faire r´eduit la pr´ecision de vos r´esultats (i.e.

gonfle les ´ecarts-types et r´eduit la puissance des tests) lorsque les donn´ees sont homosc´edastiques.

(21)

un pour les observations du deuxi`eme groupe et de faire une seule r´egression sur les variables originales et sur les termes d’interaction avec la variable binaire2:

Soit δ la variable binaire:

ˆ

y =β01x12x23δ+β4x1δ+β5x2δ

On d´esire maintenant tester si β0 = (β03), si β1 = (β14) et siβ2 = (β25). Ce qui revient `a tester si β3, β4 et β5 sont conjointement diff´erent de 0. Ceci peut ˆetre facilement effectu´e par un test de F.

ex:

g g2 = (groupe == 2) g g2x1 = g2*x1

g g2x2 = g2*x2

reg y x1 x2 g2 g2x1 g2x2 test g2 g2x1 g2x2

(22)

Chapitre 6

Variables instrumentales et Doubles Moindres Carr´ es

Lorsqu’une variable “ind´ependante” est corr´el´ee avec le terme d’erreur, les hypoth`eses clas- siques du mod`ele lin´eaire sont viol´ees et on se retrouve face `a un probl`eme d’endog´en´eit´e.

Dans ces cas, on peut faire appel `a l’estimateur de variables instrumentales (VI) ou aux doubles moindres carr´es ordinaires (DMCO).

6.1 Estimateur Variables Instrumentales

Soit Z, une matrice de VI et X, la matrice originale. L’estimateur VI est donn´e par:

βˆ(V I) = (Z0X)−1Z0y et l’estimateur VI de la covariance par:

ˆ

σ2(Z0X)−1(Z0Z)(X0Z)−1 o`u

ˆ σ2 = 1

T(y−Xβˆ(IV))0(y−Xβˆ(IV)).

ou, lorsque J > K (J ´etant le nombre de VI et K le nombre de variables ind´ependantes), par:

βˆ(IV) = [X0Z(Z0Z)−1Z0X]−1X0Z(Z0Z)−1Z0y.

ˆ

σ2[X0Z(Z0Z)−1Z0X]−1.

ivreg

ivreg permet de faire directement une r´egression par DMCO.

(23)

ivreg variable dependante variables independantes (variable dependante=variable(s) intrumentale(s)), options

o`u options peut prendre les mˆemes valeurs que pour regress, ainsi que first qui affiche les r´esultats de la premi`ere r´egression.

ex:

ivreg y1 z1 z2 (y2=x1), r first predictpeut ˆetre utilis´e apr`es ivreg

6.2 DMCO

Le principe des doubles moindres carr´es ordinaires est d’utiliser une estimation de la variable endog`ene qui ne soit pas corr´el´ee avec le terme d’erreur pour effectuer la r´egression.

Soit le mod`ele suivant:

y101x12x23y2+u et soit z une VI dey2.

Comme leur nom l’indique, les DMCO se font en deux ´etapes.

1. Estimation de la variable endog`ene:

R´egression dey2 sur toutes les variables ind´ependantes (x1 etx2 ici) et la/les VI poury2 (z ici).

On r´ecup`ere ˆy2, l’estimation lin´eaire dey2. 2. R´egression du mod`ele avec ˆy2:

R´egression de y1 sur une constante, x1, x2 et ˆy2.

(24)

6.3 Tests d’endog´ en´ eit´ e

Letest de Hausmanpermet de v´erifier s’il existe bel et bien une diff´erence entre l’estimateur VI et l’estimateur MCO, v´erifiant ainsi s’il y a bel et bien endog´en´eit´e des variables (si les deux estimateurs sont consistants, ils seront asymptotiquement ´egaux). Sous H0, la statis- tique de Hausman est:

H = [ ˆβ(V I)−b]0[ˆσ2[(X0Z(Z0Z)−1Z0X]−1−σˆ2(X0X)−1]−1[ ˆβ(V I)−b]∼χ2(J)

hausman

Effectue le test de sp´ecification d’Hausman.

Estimation du mod`ele moins efficient, mais convergent (VI ici) hausman, save

Estimation du mod`ele efficient, mais peut-ˆetre pas convergent (MCO ici) hausman

Options: constant (c), indique que la constante doit ˆetre inclue dans la comparaison des deux mod`eles.

ex:

ivreg y1 z1 z2 (y2=x1) hausman, save

reg y1 z1 z2 y2 hausman, c

(25)

Chapitre 7

Estimateur du Maximum de Vraissemblance (EMV)

La fonction de vraisemblance est la probabilit´e jointe des observations ´etant donn´e les param`etres d’int´erˆets, i.e.:

L(θ|y) =f(y1, . . . , yn|θ) =

n

Y

i=1

f(yi|θ)

L’estimateur du maximum de vraisemblance (EMV) a pour but de choisir le vecteur de param`etres θ qui maximise la fonction de vraisemblance, i.e. pour lequel les donn´ees observ´ees sont les plus probables. Pour simplifier les choses, la fonction de log-vraisemblance, L(θ|y), est g´en´eralement utilis´ee1.

Prenons l’exemple d’un ´echantillon normalement distribu´e, de moyenne 0 et de variance σ2: f(y|X, β, σ2) =

T

Y

t=1

(2πσ2)−1/2exp[(yt−x0tβ)2]

= (2πσ2)−T /2exp

−(y−Xβ)0(y−Xβ) 2σ2

.

(26)

δlnL

δσ2 =− T

2 + (y−Xβ)0(y−Xβ) 2σ4

Ce qui nous permet de trouver

βˆ= (X0X)X0y σˆ2 = (y−Xβ)0(y−Xβ)

T = ˆe0eˆ T

ml

Permet de faire une estimation par maximum de vraisemblance pour une ´equation donn´ee.

Cette fonction ´etant fort complexe et tr`es peu utilis´ee dans le cadre des probl`emes abord´es dans ce guide, il est laiss´e `a la discr´etion du lecteur le soin de consulter l’aide de Stata `a son sujet.

Stata estime automatiquement par maximum de vraisemblance les r´egressions qui doivent ˆ

etre trait´ees par EMV. Les mod`eles `a variable d´ependante qualitative, les mod`eles de dur´ee et les ARIMA sont des exemples de tels cas.

(27)

Chapitre 8

Moindres Carr´ es G´ en´ eralis´ es

La m´ethode des moindres carr´es g´en´eralis´es (MCG) cherche `a mod´eliser la fonction de la variance. Nous obtenons alors l’estimateur MCG

βˆM CG = (X0V−1X)−1X0V−1y ou encore

βˆM CG = (X0W−1X)−1W0V−1y et sa variance est

var[ ˆβ] =σ2(X0V−1X)−1. o`uV et W sont ´egaux `a

W =σ2

x1 0 · · · 0 0 x2 · · · 0 ... ... . .. ...

0 0 · · · xn

≡σ2V

vwls

permet de faire une r´egression lin´eaire pond´er´ee par la variance.

vwls variable dependante variables independantes [poids], options

(28)

Chapitre 9

Variables d´ ependantes qualitatives

9.1 Probit/Logit

Un probit et un logit s’appuient en fait sur le mˆeme principe, ils ne diff`erent que dans la forme de la fonction de r´epartition qu’ils utilisent pour calculer l’effet sur la probabilit´e d’une variation de la variable latente. En effet, lorsque la variable d´ependante ne prend que des valeurs qualitatives (oui ou non par exemple), l’effet d’une variable ind´ependante sur la probabilit´e de dire oui doit ˆetre “traduit” par une fonction de r´epartition. Cette derni`ere nous donne la probabilit´e associ´ee `a une valeur donn´ee de la valeur latente exprim´ee par la combinaison lin´eaire des variables ind´ependantes.

probit (prob)

Estime un mod`ele probit.

probit variable d´ependante variable ind´ependante

Options: probit poss`ede en grande partie les mˆemes options que regress.

Note: Ici predict donne par d´efaut la probabilit´e. Pour avoir l’estimation lin´eaire, il faut pr´eciserxt dans les options de predict.

logit

Permet d’estimer un mod`ele logit.

logit variable d´ependante variable ind´ependante

Options: logit poss`ede en grande partie les mˆemes options que regress.

(29)

9.2 Probit/Logit ordonn´ e 9.3 Tobit

Un tobit est essentiellement un mod`ele dont les donn´ees sont censur´ees. Comme le probit, le tobit suit une loi normale.

tobit

Permet d’estimer un mod`ele tobit.

logit variable d´ependante variable ind´ependante

Options: ll(#),ul(#): indiquent respectivement que les donn´ees sont tronqu´ees `a gauche ou `a droite. Une ou les deux de ces options doivent ˆetre sp´ecifi´ees. # indique le point de troncation. Si # n’est pas pr´ecis´e, Stata suppose qu’il s’agit respectivement de la valeur minimum et de la valeur maximum.

Les autres options de tobit sont en grande partie commune avec regress.

ex:

tobit y x1 x2 x3 x4, ll(0)

9.4 Biais de s´ election: Heckit

(30)

Chapitre 10

Mod` eles de dur´ ee

(31)

Chapitre 11

S´ eries Chronologiques

11.1 Op´ eration sur les variables dans le cadre de s´ eries chronologiques

tsset

Lorsqu’on travaille avec des s´eries chronologiques dans Stata, il est n´ecessaire de l’en informer par la commande tsset.

tsset variable de temps ex:

generate t = n tsset = t

11.2 Op´ erateurs de s´ eries temporelles

Voici comment reproduire l’´equivalent des op´erateurs Avance et Retard dans Stata pour travailler sur les s´eries chronologiques.

l

(32)

regress y l.y l2.y

f

L’op´erateur f est l’op´erateur Avance de stata. Il peut ˆetre utilis´e avec toutes les fonctions qui acceptent les s´eries temporelles une fois que la d´eclaration de s´eries temporelles `a ´et´e faite.

f#.variable

o`u variable est la variable sur laquelle l’op´erateur doit agir et # est le nombre d’avance `a appliquer. Si # est omis, une seule avance est appliqu´ee (´equivalent `af1.variable).

tsset t

* une autre formulation pour un mod`ele AR2 regress f.y y l.y

11.3 Tests d’autocorr´ elation

Inutile de mentionner que l’autocorr´elation est un probl`eme qui n’est pertinent que dans le cas des s´eries temporelles. . .

Le test ρ est le test le plus simple `a effectuer pour tester la pr´esence d’autocorr´elation:

1. r´ecup´erer les r´esidus de la r´egression qu’on d´esire tester;

2. r´egresser ˆut sur ˆut−1 `a ˆut−n etX

3. Tester la signification conjointe des coefficients de cette r´egression par un test F.

Choisissons n ´egal `a 3.

reg y x1 x2 predict u, r reg u l.u l2.u l3.u

Il suffit alors de regarder la statistique F donn´ee par Stata.

Le test de Durbin-Watson est aussi utilis´e pour tester la pr´esence d’autocorr´elation, mais comme il est moins pr´ecis et ne consid`ere qu’une seule p´eriode, nous ne le couvrirons pas ici.

(33)

11.4 M´ ethode de Box-Jenkins

Ce qu’il est important de comprendre, `a mon avis, dans la m´ethode de Box-Jenkins, c’est que l’objectif de toutes les op´erations que nous effectuons est de se retrouver avec un r´esidu qui est un bruit-blanc. Le but ultime ´etant de mod´eliser la s´erie afin de faire des pr´edictions, nous pouvons seulement ˆetre certain d’avoir tout extrait lorsqu’il nous reste seulement un bruit-blanc: un processus qui est par d´efinission impossible `a pr´edire.

11.4.1 Stationnarit´ e des donn´ ees

La premi`ere ´etape de la m´ethode de Box-Jenkins consiste `a effectuer les transformations n´ecessaires afin de s’assurer que notre s´erie est stationnaire, si elle ne l’est pas, il nous sera impossible de travailler dessus.

Premi`ere question `a se poser: doit-on travailler en log ou pas? Si la variable croˆıt `a un taux constant, elle sera lin´eaire en log. De plus, les propri´et´es du logarithme font en sorte qu’il “´ecrase” une variance croissante. Outre la transformation logarithmique, il existe trois cas possibles de non-stationnarit´e qui impliqueront des changements dans la s´erie (ou sa mod´elisation):

• Changement structurel

• Tendance d´eterministe

• Racine unitaire Changement structurel

Les changement structurels peuvent ˆetre d´etect´es `a l’aide du Test de Chow (voir section 5.2).

Malheureusement, rien ne peut g´en´eralement ˆetre fait pour stationnariser une s´erie dans le cas d’un changement structurel.

Tendance d´eterministe

Afin de r´egler le probl`eme de la pr´esence d’une tendance temporelle, il suffit de la mod´eliser.

(34)

Racines Unitaires

On fait face `a un probl`eme de racine unitaire lorsqueρ= 1 dans le mod`ele suivant:

yt=α+ρyt−1+et

Afin de r´egler le probl`eme de racine unitaire, il faut diff´erencier la s´erie, i.e. travailler sur

∆yt =yt−yt−1 plutˆot que yt. Le mod`ele devient donc:

∆yt=α+θyt−1+t

La diff´erenciation d’une s´erie est effectu´ee automatiquement dans Stata lors de l’utilisation de la fonction arima.

Tester pour la pr´esence d’une racine unitaire se fait par un test t o`u H0 est θ = 0.

Malheureusement, sous l’hypoth`ese nulle, la statistique t ne suit pas la loi asymptotique habituelle. Il faut plutˆot utiliser la loi de Dickey-Fuller. S’il y a corr´elation des termes d’erreur, il faut plutˆot utiliser une loi de Dickey-Fuller augment´ee.

dfuller

Effectue un test de Dickey-Fuller augment´e sur la variable sp´ecifi´ee.

dfuller nom de variable, options Options:

• lags(#): sp´ecifie le nombre de retards `a utiliser pour le calcul de la variance estim´ee Newey-West.

• trend: incluera une variable de tendance dans la r´egression.

pperron

Poss`ede exactement la mˆeme structure et les mˆemes options que dfuller, mais effectue un test de Phillips-Perron plutˆot qu’un test de Dickey-Fuller augment´e.

11.4.2 Mod´ elisation des cycles: Mod` eles AR, MA, ARMA, ARIMA

arima

Permet d’estimer un mod`ele AR, MA, ARMA ou ARIMA par maximum de vraisemblance.

arima variable d´ependante variable ind´ependante, arima(p,d,q)

o`up est le nombre de AR, d le nombre de diff´erenciation et q le nombre de MA.

Il n’est pas n´ecessaire de pr´eciser de variables ind´ependates.

(35)

ex: AR(1)

arima t, arima(1,0,0) ex: MA(1)

arima t, arima(0,0,1) ex: ARIMA(1,1,2) arima t, arima(1,1,2)

Pour choisir p et q, il est bon de regarder l’autocorr´elogramme partiel (nombre de AR) et l’autocorr´elogramme (nombre de MA) de la variable qui nous int´eresse.

corrgram

Construit une table des autocorr´elations et des autocorr´elations partielles. Permet de tracer l’autocorr´elogramme et l’autocorr´elogramme partiel.

corrgram nom de variable, option

Options: lags(#): sp´ecifie le nombre de retards `a calculer.

corrgran peut ˆetre suivi de deux autres fonctions:

ac

Produit un autocorr´elogramme.

ac nom de variable, options Options:

• lags(#): sp´ecifie le nombre de retards `a calculer.

• level(#): sp´ecifie le niveau de confiance `a utiliser dans le calcul des bandes de confiances.

• Toutes les options standards d’un graphique sont ´egalement admissible.

pac

(36)

R-carr´e ajust´e

Le R-carr´e ajust´e ( ¯R2) est donn´e par la formule suivante:

2 = 1− n−1

n−K(1−R2) Akaike information criterion (AIC)

Voici la formule habituelle du crit`ere d’Akaike:

AIC(K) =log(e0e

n ) + 2K n

Bayesian information criterion (BIC)

Voici la formule habituelle du crit`ere de Schwartz ou Bayesien:

BIC(K) =log(e0e

n ) + Klogn n Ces crit`eres doivent ˆetre construits manuellement.

(37)

Chapitre 12

Donn´ ees longitudinales (Panel)

Il existe bon nombre de m´ethodes pour traiter les donn´ees en Panel et la litt´erature sur le sujet est tr`es exhaustive, nous ne traiterons donc dans ce chapitre que des m´ethodes de base.

12.1 Effets Fixes et Effets Al´ eatoires

Lorsqu’on a des donn´ees longitudinales, on voudra souvent isoler l’effet associ´e `a chaque ann´ee, `a chaque individu ou aux deux. Il existe deux fa¸cons de mod´eliser ces effets, soit comme des effets fixes, soit comme deseffets al´eatoires.

Effets fixes (αi, µt):

yitit+Xitβ+eit Effets al´eatoires (αi, µt):

yit = Xitβ+eit eit = αitit

Les effets fixes ont l’avantage de permettre une corr´elation avec les variables explicatives,

(38)

pr´ef´erable dans certains cas de ne pas inclure de constante pour comparer tous les groupes entre eux. Dans le dernier exemple, on pourrait ainsi laisser tomber la constante et inclure cinq variables binaires pour les groupes et trois variables binaires pour les ann´es.

Ajout manuellement de variables binaires pour chaque groupe et chaque ann´ee.

ex: R´egression sur cinq ´echantillons tir´es de 1980,81,82 et 83.

* cr´eation des variables binaires a81 = (annee == 1981) a82 = (annee == 1982) a83 = (annee == 1983) g2 = (groupe == 2) g3 = (groupe == 3) g4 = (groupe == 4) g5 = (groupe == 5)

* r´egression

regress y x1 x2 a81 a82 a83 g2 g3 g4 g5

12.1.2 Fonctions pour donn´ ees longitudinales

Il est aussi possible d’indiquer `a Stata que l’on travaille avec des donn´ees en Panel afin d’automatiser le processus de calcul des effets fixes ou al´eatoires:

tsset

Cette fonction d´ej`a vue dans le chapitre 11 permet ´egalement de d´eclarer nos donn´ees comme un panel de s´eries temporelles. Il suffit pour ¸ca d’ajouter la variable de panel (de groupe) avant la variable de temps.

tsset variable de panel variable de temps

ex:

g t = n tsset groupe t

Une fois tsset d´eclar´e pour des donn´ees panel, il est possible de travailler avec la famille de fonctions xt de Stata. Il existe une telle fonction pour chacun des types de r´egression:

xtreg, xtlogit, xprobit, xttobit, xtgls, etc. Nous ne couvrirons ici que sommaire- mentxtreg et nous vous r´ef´erons `a l’aide de Stata pour plus de d´etails sur cette famille de fonctions.

xtreg

(39)

Permet de faire des r´egressions sur des donn´ees en Panel.

Effet fixe: xtreg variable d´ependante variable ind´ependante, fe

Effet al´eatoire estim´e par MCG: xtreg variable d´ependante variable ind´ependante, re Effet al´eatoire estim´e par EMV: xtreg variable d´ependante variable ind´ependante, mle

ex:

tsset groupe annee xtreg y x1 x2, fe

(40)

Chapitre 13

Interaction avec les tableurs et les traitements de texte

13.1 Remarques

Quelques remarques importantes lorsque vous travaillez avec des donn´ees num´eriques:

• Pour ˆetre utilisables, les donn´ees num´eriques doivent ˆetre s´epar´ees par variable et par observation, chaque valeur ´etant s´epar´ee de la suivante par un ‘s´eparateur’.

• G´en´eralement, il est plus facile de travailler si les variables constituent les colonnes et les observations les rang´ees.

• Comme les logiciels sont (tous?) am´ericains, le s´eparateur de d´ecimales doit ˆetre un point (‘.’) et non pas une virgule (‘,’). Si ce n’est pas le cas, ceci peut facilement ˆetre chang´e par la commande replace du menuEdit de Excel.

• Assurez-vous que le s´eparateur de valeurs est compatible avec la m´ethode utilis´ee pour importer les donn´ees dans le logiciel ´econom´etrique.

• Assurez-vous ´egalement que si vous avez du texte dans vos observations, cela est permis par votre m´ethode d’importation.

• Evitez les lignes de commentaire ou de texte avant vos donn´´ ees ou le nom de vos variables. Bien qu’il soit possible de contourner cette difficult´e, ¸ca ´evite souvent des probl`emes.

13.2 Tableur

Cette section est surtout orient´ee vers Excel puisque c’est le tableur le plus utilis´e sur le march´e.

(41)

• Exportation des donn´ees: Dans le menu Fichier, Sauvegarder sous, s´electionnez un format text avec s´eparateur: soit des tabulations (.txt ou .tab), soit des virgules (.txt ou .csv).

• Importation de donn´ees: En ouvrant un fichier ASCII (sans formatage), l’assistant importation-donn´ees de Excel devrait s’ouvir automatiquement. Vous devrez alors seulement s´electionner le type de s´eparateur (´etape 2) et le type de donn´ees (´etape 3:

optionnel) pour pouvoir acc´eder `a votre fichier.

13.3 Traitement de texte

Cette section est surtout orient´ee vers Word puisque c’est le traitement de texte le plus utilis´e sur le march´e.

• Cr´eation de Tableau: Le copier-coller est la solution de choix ici. L’id´eal est de passer par Excel apr`es avoir importer le fichier de donn´ees (s´electionnez les cases d´esir´ees, copier, coller...). Sinon, vous pouvez ´egalement copier directement les r´esultats `a partir du gestionnaire de donn´ees.

• Insertion de Graphique: Menu insertion, objet, du fichier.... Trouvez l’image qui vous sert de graphique et appuyez sur OK.

• Transcription de r´esultats: Malheureusement, il n’existe pas de moyen rapide de tran- scrire vos r´esultats s’ils ne peuvent pas ˆetre mis en tableau. Copier-coller ou la transcription manuelle demeurent les seuls moyens d’effectuer ce travail... faites des tableaux!

(42)

Chapitre 14

O` u trouver ses donn´ ees et comment les extraires

14.1 Liens utiles

14.1.1 A l’Universit´ ` e

Votre premier arrˆet pour trouver des donn´ees se doit d’ˆetre sur le site web de la bib- lioth`eque des sciences humaines au:

http://www.bib.umontreal.ca/SB/num/

Cette page vous donne acc`es aux plus importantes sources officielles de donn´ees num´eriques, notamment, Statistiques Canada (E-STAT et CHASS), l’institut de la statistique du Qu´ebec et l’OCDE. La majorit´e de ces donn´ees sont des s´eries chronologiques ou des donn´ees en panel.

Pour obtenir des donn´ees d’enquˆetse, il faut se tourner vers Sherlock (aussi accessible par cette page) ou vers des organismes priv´es. Certaines donn´ees d’enquˆetes sont

´egalement accessible par l’institut de la statistique du Qu´ebec.

14.1.2 A l’Ext´ ` erieur

Google www.google.ca

Moteur de recherche tr`es puissant qui devrait vous aider pour toutes vos requˆetes.

Gouvernement du Qu´ebec www.gouv.qc.ca

Plusieurs minist`eres ont des donn´ees t´el´chargeables qui sont accessibles par leur site web.

(43)

Gouvernement du Canada www.gc.ca

Plusieurs minist`eres ont des donn´ees t´el´chargeables qui sont accessibles par leur site web.

Eurostat http://europa.eu.int/comm/eurostat/

Plusieurs indicateurs ´economiques et sociaux de l’Union Europ´eenne.

US Census Bureau http://www.census.gov/

Donn´ees des recensement am´ericains.

Agences Nationales de Statistiques http://www.census.gov/main/www/stat int.html Liens vers toutes les agences nationales de statistiques.

Fedstat http://www.fedstats.gov/

Liens vers la majorit´e des organismes f´ed´eraux am´ericains produisant des donn´ees qui son accessibles.

Donn´ees Spatiales http://data.geocomm.com/catalog/

Plusieurs liens vers des donn´ees cod´ees g´eographiquement.

DataLinks http://www.econ-datalinks.org/

Une foule de liens vers des donn´ees ´economiques et financi`eres.

Cette liste est tr`es tr`es loin d’ˆetre exhaustive, donc n’h´esitez pas `a pousser vos recherches sur internet plus loin. Si vous trouver des liens int´eressant, envoyez-les moi et je me ferrai un plaisir de les ajouter aux versions futures de ce guide.

Un conseil: Les sites gouvernementaux et minist´eriels au niveau national et sous- national sont souvent des mines d’or de donn´ees!

14.2 Acc` es au Donn´ ees

Cette section d´ecrit seulement comment acc´eder et t´el´echarger les donn´ees de quelques sources particuli`erement importantes.

(44)

CHASS Acc`es `a envrions 600 000 s´eries de plus qu’avec E-Stat, mais environnement de navigation moins convivial.

Nous d´ecrirons seulement l’usage de E-Stat ici.

1. Trouvez le tableau qui vous int´eresse en effectuant une recherche par sujet ou par mot-cl´e.

2. Une fois dans le tableau de votre choix, vous aurez g´en´eralement `a s´electionner des s´eries sp´ecifiques en choisissant parmis une liste d´eroulante et ce, pour plusieurs cat´egories (ex: g´eographie, fr´equence, sexe, dates, etc.).

Choisissez les s´eries d´esir´es (tenez la touche ctrl enfonc´ee pour s´electionner plusieurs items dans une mˆeme liste) et appuyez sur s´erie chronologiques.

3. Choisissez votre format de sortie parmis les choix offerts (suggestion: CSV ou PRN, p´eriodes = lignes).

4. Appuyez sur extraire et sauvegarder le fichier qui apparaitra sous le nom d´esir´e.

14.2.2 OCDE

http://www.sourceoecd.org/ (doit ˆetre acc´ed´e par l’UdeM)

G´en´eralement, les donn´ees les plus int´eressantes se trouvent dansstatistiques de l’OCDE / Perspectives ´Economiques.

1. Une fois dans Perspectives ´Economiques, appuyez sur Bases de donn´ees statis- tiquespuis, `a la page suivante, surtableaux, puis sur donn´ees et, enfin, sur acc`es aux donn´ees.

2. Vous devrez ensuite s´electionner dans l’ordre vos Pays, vos Variables et votre P´eriode de couverture.

3. La derni`ere ´etape consiste `a sauvegarder vos donn´ees dans le format d´esir´e.

14.2.3 Sherlock

1. Une fois votre enquˆete s´electionn´ee, cliquez dessus.

2. Choisissez le format d’extraction. `A moins que vous connaissiez SAS ou SPSS, il vous est sugg´er´e de choisir Extraction par variables et un fichier .tab.

3. Vous devrez ensuite s´electionner les variables d´esir´ees en cochant les cases corre- spondantes.

(45)

4. Finalement, vous devez choisir les valeurs des variables que vous d´esir´ees.

5. Pour extraire les donn´ees, entrez votre adresse courriel et appuyez sur Extraire.

Les donn´ees vous seront envoy´ees en diff´er´e `a l’adresse sp´ecifi´ee.

(46)
(47)

Annexe A

Tableaux R´ ecapitulatifs

A.1 Fonctions de Stata

Fonction Abr´eviation Description Forme Importation de Donn´ees

infile inf Importe les donn´ees d’un fichier.

infile nom des variables using nomdef ichier insheet Importe les donn´ees d’un

fichier (s´eparateurs: tabula- tions ou virgules).

insheet using nom de f ichier

Transformation de Variables

generate g Cr´ee une nouvelle variable. generate

nouvelle variable = expression

replace Remplace une variable exis- tante.

replacevariable existante

=expression

abs Valeur absolue. abs(x)

exp Exponentiel. exp(x)

log Logarithme naturel. log(x)

(48)

Fonctions Matricielles

matrix mat Cr´ee ou modifie une ma- trice.

matrix nom de la matrice

= expression matrix get Permet d’obtenir copie

d’une matrice syst`eme.

matrix variable = get(matrice syst`eme) mkmat Transforme des variables en

vecteurs/matrice.

mkmat

nom(s) de variable(s), matrix

[(nomdelanouvellematrice)]

svmat Transforme les colonnes

d’une matrice en variables.

svmat matrice,

[names(nom col1, nom col2, . . .)]

colsof nombre de colonnes d’une

matrice.

colsof(A) det D´eterminant d’une matrice. det(A)

diag Matrice diagonale n × n,

avec pour diagonale les

´

el´ements de V.

diag(V)

el El´´ ement aij d’une matrice. el(A,i,j)

I Matrice identit´en×n. I(n):

inv Inverse d’une matrice

carr´ee.

inv(A)

rowsof Nombre de rang´ees d’une

matrice.

rowsof(A) vecdiag Extrait la diagonale d’une

matrice carr´ee sous forme de vecteur.

vecdiag(A)

Fonctions Diverses

graph gr Trace un graphique. graph nomdesvariables, [typedegraphique, autresoptions]

list Affiche `a l’´ecran les vari- ables sp´ecifi´ees.

list

[nom(s) de variable(s)]

log Enregistre la session. log using nom de f ichier

more Active ou d´esactive

l’affichage de --more--.

more on/off set matsize set mat Fixe la taille maximale des

matrices.

set matsize #

(49)

Fonctions Diverses (suite)

uniform Donne une valeur al´eatoire entre 0 et 1 (ditribution uni- forme sur [0,1)).

uniform()

tsset D´eclaration de s´eries tem- porelles/Donn´ees pannel.

tsset variable de temps

l Op´erateur retard. l#.variable

f Op´erateur avance. f#.variable

Fonctions ´Econom´etriques

regress reg Effectue une r´egression lin´eaire par MCO.

regressvardep[vars inds]

predict Calcule les valeurs pr´edites, les r´esidus, etc.

predict nouvelle variable, options

test t Effectue des tests

d’hypoth`ese.

test [expression1 = expression2]

ivreg Effectue une r´egression par DMCO.

ivreg var dep vars inds (var dep=V I), options

hausman Effectue le test de

sp´ecification d’Hausman.

hausman/ hausman, save vwls Effectue une r´egression

pond´er´ee par la variance (FGLS).

vwls vardep vars inds [poids], options

probit prob Estime un mod`ele probit. probit var dep vars inds logit Estime un mod`ele logit. logit var dep vars inds tobit Estime un mod`ele tobit. tobit var dep vars inds,

[ll(#)] [ul(#)]

dfuller Effectue le test de Dickey- Fuller augment´e.

dfuller nom de variable, options

pperron Effectue le test de Phillips- Perron.

pperron nom de variable, options

corrgram Produit une table des au- corrgram

(50)

A.2 Op´ erateurs

Description Forme

Op´erateurs Math´ematiques

Addition +

Soustraction -

Multiplication *

Division /

Puissance ^

Op´erateurs Logiques

ET &

OU |

Non (¬) ~

Op´erateurs de Comparaison

Egal´ ==

Diff´erent ~=

Plus grand >

Plus petit <

Plus grand ou ´egal >=

Plus petit ou ´egal <=

A.3 Symboles Math´ ematiques

Symbole Description Symbole Description Symbole Description

P somme ! factoriel ⊥ perpendiculaire

Q produit |x| valeur absolue k parall`ele

R int´egrale kxk norme de x bcp plus petit

∂ d´eriv´ee partielle ≺ pr´ec`ede, pr´ef´er´e bcp plus grand

6= diff´erent ∅ ensemble vide ∀ pour tout

≡ ´equivalent ⊂ sous-ensemble

de (inclus dans)

∃ il existe

≈ approximative- ment ´egal `a

∈ ´el´ement de ¬ non (n´egation)

∼= congruent, iso- morphique

T intersection ⇒ implique

∝ proportionel S

union ⇔ ´equivalent

∼ similaires (g´eom´etrie), asymptotiquement, suit (une loi)

(51)

A.4 Alphabet Grec

minuscule majuscule nom minuscule majuscule nom

α alpha ν nu

β beta ξ Ξ xi

γ Γ gamma o o

δ ∆ delta π, $ Π pi

, ε epsilon ρ, % rho

ζ zeta σ, ς Σ sigma

η eta τ tau

θ, ϑ Θ theta υ Υ upsilon

ι iota φ, ϕ Φ phi

κ kappa χ chi

λ Λ lambda ψ Ψ psi

µ mu ω Ω omega

Références

Documents relatifs

On consid` ere ε une variable al´ eatoire mod´ elisant un bruit d’observation, suppos´ ee ind´ ependante de X et d’esp´

Pour des queions, demande de pr´ecisions ou explications, n’h´esitez pas `a m’envoyer un mail `a igor.kortchemski@ens.fr , ou bien `a venir me voir au bureau

Soit U une variable al´eatoire positive de fonction de r´epartition F, ind´ependante de F ∞.. Justifier que Q est une mesure

Soient X et Y deux variables al´ eatoires r´ eelles d´ efinies sur un mˆ eme espace de probabilit´ e (Ω, A, P) et telles que (X, Y ) est un vecteur gaussien.. D’apr` es un

La fonction residuals fournit diff´ erents types de r´ esidus ` a partir d’un mod` ele ajust´ e avec la fonction glm du package stats. On peut effectuer la normal- isation en r´

mais il faut prendre garde au fait qu’un mauvais choix des n j peut augmenter la variance.. Cependant, notons que le choix n j = np j diminue toujours la variance mˆ eme s’il n’est

Dans l’´enonc´e qui suit, on a choisi pour fixer les id´ees de s’int´eresser au cas de trois paquets de variables. Il va de soi que le r´esultat reste vrai pour quatre, cinq,.

A partir d’une variable de loi uniforme on construit une suite de Ber- ` noulli 1 2 ind´ ependantes, on en d´ eduite une suite de variables ind´ ependantes pour n’importe quelle