Guide d’économétrie appliquée pour Stata

(1)

Guide d’économétrie appliquée pour Stata

Simon Leblond

¹

Universit´ e de Montr´ eal simon.leblond@umontreal.ca

26 d´ ecembre 2003

(2)

Table des Mati` eres

1 Introduction `a Stata 6

2 Commandes g´en´erales importantes 7

2.1 Importation des donn´ees . . . 7

2.2 Manipulation des donn´ees . . . 8

2.2.1 Op´erateurs math´ematiques . . . 8

2.2.2 Op´erateurs logiques et de comparaison . . . 9

2.2.3 Manipulations des matrices . . . 9

2.3 Autres transformations des variables . . . 11

2.4 Divers . . . 11

2.5 Exemples et r´esultats pour le Chapitre 2 . . . 12

3 Visualisation des donn´ees 13 3.1 Impression/Exportation des donn´ees . . . 13

3.1.1 Impression `a l’´ecran . . . 13

3.1.2 Exportation . . . 13

3.1.3 Impression . . . 13

3.2 Exemples et r´esultats pour le Chapitre 3 . . . 14

4 Graphiques 15 4.1 Exemples et r´esultats pour le Chapitre 4 . . . 16

5 Régressions Simples 17 5.1 Tests d’hétéroscédasticité . . . 18

5.2 Test de Changement structurel (Test de Chow) . . . 19

6 Variables instrumentales et Doubles Moindres Carr´es 21 6.1 Estimateur Variables Instrumentales . . . 21

6.2 DMCO . . . 22

6.3 Tests d’endogénéité . . . 23 7 Estimateur du Maximum de Vraissemblance (EMV) 24

(3)

8 Moindres Carrés Généralisés 26

9 Variables d´ependantes qualitatives 27

9.1 Probit/Logit . . . 27

9.2 Probit/Logit ordonn´e . . . 28

9.3 Tobit . . . 28

9.4 Biais de s´election: Heckit . . . 28

10 Modèles de durée 29 11 Séries Chronologiques 30 11.1 Opération sur les variables dans le cadre de séries chronologiques . . . 30

11.2 Op´erateurs de s´eries temporelles . . . 30

11.3 Tests d’autocorr´elation . . . 31

11.4 M´ethode de Box-Jenkins . . . 32

11.4.1 Stationnarit´e des donn´ees . . . 32

11.4.2 Mod´elisation des cycles: Mod`eles AR, MA, ARMA, ARIMA . . . 33

11.4.3 S´election de Mod`ele . . . 34

12 Donn´ees longitudinales (Panel) 36 12.1 Effets Fixes et Effets Al´eatoires . . . 36

12.1.1 Variables binaires . . . 36

12.1.2 Fonctions pour donn´ees longitudinales . . . 37

13 Interaction avec les tableurs et les traitements de texte 39 13.1 Remarques . . . 39

13.2 Tableur . . . 39

13.3 Traitement de texte . . . 40

14 O`u trouver ses donn´ees et comment les extraires 41 14.1 Liens utiles . . . 41

14.1.1 `A l’Universit´e . . . 41

14.1.2 `A l’Ext´erieur . . . 41

(4)

A.4 Alphabet Grec . . . 50

(5)

Introduction

Ce manuel ne vient pas se substituer à vos notes de cours, mais plutôt les compléter en vous donnant un guide pour l’utilisation de Stata. À ce titre, bien que vous trouverez quelques fois des explications plus importantes sur la nature d’un problème économétrique, la majorité du temps on supposera que vous possédez déjà les connaissances liées à la section consultée.

Chaque section présente rapidement le but de l’opération qui y est traité. Les commandes appropriées sont ensuite présentées, d’abord individuellement, puis dans le cadre d’exemples concrets. Il existe deux versions de ce guide, celle-ci pour Stata et une autre pour Matlab.

Notez que ce manuel couvre la version 7 de Stata, la version 8 sera intégrée peu à peu pendant l’année qui vient. Comme il s’agit d’un manuel encore en développement, des changements lui seront constamment apportés en cours de session et la version distribuée sera toujours la plus récente. Tout commentaire, suggestion ou correction sera bienvenu et apprécié.

Prenez note que ce texte décrit seulement certaines fonctions ainsi que leurs options les plus souvent utilisées pour le genre de recherches effectuées au bac et à la maˆıtrise en

´

economie, il n’est donc pas du tout exhaustif. Un conseil: apprenez `a utiliser l’aide de Stata.

Il s’agit là d’un outil fort utile pour découvrir de nouvelles fonctions ou pour connaˆıtre l’ensemble des options disponibles pour les fonctions décrites dans ce guide.

Les fonctions sont pr´esent´ees dans le format suivant:

1. Le nom de la fonction et, entre paranthèses, le nom abrgégé de la fonction;

2. Sa description;

3. Le format d’entr´ee;

(6)

• Le texte en italique désigne les variables et autres chaˆınes de caractères qui doivent être remplacées.

• Le texte ensans serif désigne le texte tel qu’il serait entré à l’ordinateur.

Les chapitres 1 à 4 font le tour des commandes de base, ainsi que leur format de saisie. À la suite de ces chapitres vous devriez être en mesure d’importer, de manipuler, puis d’exporter vos données et de tracer des graphiques.

Les chapitres 5 à 12 abordent quant à eux chacun un sujet spécifique de l’économétrie. Ils prennent donc une approche quelque peu différente puisqu’ils introduisent peu de nouvelles fonctions, se concentrant plutôt sur la démarche à adopter pour effectuer l’opération en question.

Finalement, les deux derniers chapitres (13 et 14) sortent quelque peu du cadre de ce guide en abordant respectivement la manipulation des données par Word et Excel et la recherche de données. Ces chapitres ont pour but de vous aider dans le cadre plus général de la production d’un travail de recherche.

(7)

Chapitre 1

Introduction ` a Stata

Ce guide s’appuie sur la construction d’un do-file (.do), plutôt que sur l’entrée directe de commandes. Les avantages du do-file sont nombreux. Entre autres, il vous d’entrer les commandes à nouveau si le travail s’étend sur plusieurs séances, il permet de garder une trace du travail effectuer et il permet de garder une vue d’ensemble des étapes du programme.

Pour créer un do-file, il faut entrer dans le do-file editor. Vous pouvez également construire un fichier texte (.txt) avec un traitement de texte quelconque auquel vous donnerez une extension ‘.do’. Notez que vous n’êtes pas du tout obligés d’avoir recours à un do-file, vous pouvez entrez directement dans la boˆıte de commande toutes les fonctions mentionnées dans ce guide.

La version 8 de Stata permet d’utiliser les fonctions en les s´electionnant directement des menus. Ce guide n’abordera pas du tout cette approche et ce concentrera sur l’utilisation

“manuelle” (entr´ee directe) des fonctions.

(8)

Chapitre 2

Commandes g´ en´ erales importantes

2.1 Importation des donn´ ees

Note importante sur l’importation de donn´ees:

Lorsque vous faites le transfert des données, vous devez vous assurer que le format de celles-ci est compatible avec Stata. Outre les séparateurs de données qui doivent correspondre à la commande choisie, il faut aussi s’assurer que le séparateur de décimales soit un point (.) et que les milliers ne soient pas séparés par un espace. Consultez la section 13 pour plus de détails à ce sujet.

insheet

Rapide et efficace, insheetpermet d’importer les données d’un fichier texte possédant une observation par ligne et dont les données sont séparées par des tabulations ou desvir- gules.

si le nom des donn´ees sont sur la premi`ere ligne:

insheet using nomdef ichier¹

si le fichier ne contient pas le nom des donn´ees:

insheet [nom des variables]² using nom de f ichier

options³: clear, spécifie que les données en mémoires peuvent être remplacées par les nouvelles données importées.

1A moins de pr´` ecisions contraires,nomdef ichierindique le nom complet, donc avec le chemin d’acc`es et l’extension (a:\test.txtpar exemple).

2La nomenclature de l’aide de Stata est conserv´ee tout au long de ce guide, ainsi les arguments entre “[

]” d´esignent des arguments facultatifs.

3Les options dans stata sont séparés du reste de la commande par une virgule. Par exemple, dans le cas présent: insheet using”c:\ test.txt”, clear

(9)

infile (inf)⁴

Permet plus de flexibilité queinsheeten permettant que les observations soient sur plusieurs lignes ou que les données soient séparées par des espaces.

une observation par ligne: infile nom des variables using nom de f ichier observations sur plusieurs lignes:

infile nom des variables [ skip(#) nom des variables] using ‘‘nom de f ichier’’;

où# désigne le nombre de ligne à sauter pour continuer la lecture de l’observation.

options: clear, voirinsheet

ex: observation sur la première, la deuxième et la quatrième ligne. . . infile var1 var2 skip var3 var4 skip(1) var5 var6 using “a:\test.raw”

2.2 Manipulation des donn´ ees

Stata

generate (g)

Probablement la commande la plus utile (et utilis´ee) dans Stata, elle permet de cr´eer des nouvelles variables.

generate nouvelle variable = expression

ex: g x2 = x^2 replace

Mˆeme id´ee que generate, mais pour une variable existante.

replacevariable existante =expression

ex: replace x2 = x/2

(10)

2.2.2 Op´ erateurs logiques et de comparaison

ET: &

OU: |

Non (¬): ~

Egal:´ ==

Diff´erent: ~=

Plus grand: >

Plus petit: <

Plus grand ou ´egal: >=

Plus petit ou ´egal: <=

2.2.3 Manipulations des matrices

matrix (mat)

L’´equivalent de generate pour les matrices, permet de cr´eer des nouvelles matrices ou de modifier des matrices existantes.

matrix nom de la matrice = expression

ex:

Cr´eation d’une matrice: mat A = B*C

Modification d’une matrice existante: mat A = A*2

Construction d’une matrice: mat D = (1,0,0\0,1,0); où les virgules séparent les colonnes et les \ séparent les rangées (matrice 2×3).

Extraction d’une sous-matrice: mat A = B(1..4,2...); se lit rangées 1 à 4, colonne 2 à N.

Remplacement d’un élément: mat A(1,1) = 3; remplace l’élément a₁₁ par 3.

mkmat

Permet de transformer des variables existantes en vecteurs du mˆeme nom ou en une nouvelle matrice.

Transformation en vecteurs: mkmat nom(s) de variable(s)

Transformation en matrice: mkmat nom(s) de variable(s), matrix [(nom de la nouvelle matrice)]

ex: mkmat x1 x2 x3 x4, mat(X) svmat

Inverse de mkmat, transforme les colonnes d’une matrice en vecteurs.

svmat matrice, [names(nom col1, nom col2, . . .)];names peut aussi s’´ecrire n

(11)

ex: svmat X, n(x1,x2,x3,x4) matrix get

Sert à obtenir une copie d’une matrice système⁵ Quelques matrices systèmes:

• b: coefficients apr`es une estimation

• VCE: matrice de variance-covariance apr`es une estimation matrix variable = get(matrice syst`eme)

ex: matrix beta = get( b) Fonctions matricielles det(A): d´eterminant deA

rowsof(A): nombre de rangées de A colsof(A): nombre de colonnes de A el(A,i,j): élément a_ij de A

I(n): matrice identit´en×n

inv(A): inverse de la matrice carr´eeA

diag(V): matrice diagonale n×n, avec pour diagonale les éléments de V, où V est un vecteurn×1 ou 1×n

vecdiag(A): extrait la diagonale d’une matrice carr´eeA sous forme de vecteur

Op´erateurs matriciel

Soit AetB, deux matrices carrées définies positives n×n etC, une matrice définie positive t×n:

Transpos´ee: A⁰ (n×n) Somme: A + B (n×n) Diff´erence: A - B (n×n)

(12)

2.3 Autres transformations des variables

log(x): logarithme naturel dex, ´equivalent `aln(x) exp(x): exponentiel de x, i.e. e^x

mod(x,y): partie enti`ere dex par rapport `a y, par exemple: mod(5,26) = 5 abs(x): valeur absolue de x

sqrt(x): racine carrée de x, équivalent à x^1/2

max(x1, ..., xn): renvoie l’argument possédant la valeur la plus élevée min(x₁, ..., x_n): renvoie l’argument possédant la valeur la moins élevée sum(x): somme de tous les éléments de x

uniform(): donne une valeur al´eatoire entre 0 et 1 (ditribution uniforme sur [0,1))

2.4 Divers

Commentaires

Il est possible d’ins´erer des commentaires dans son programme en prenant soin de d´ebuter la ligne de commentaire par le symbole ‘*’.

ex: * Ceci est un commentaire.

more

Avez-vous déjà rencontré le message --more-- qui fait une pause dans l’affichage de vos données? Si ¸ca vous énerve, vous pouvez enlever ce message en spécifiant set more offau début de votre programme.

set matsize(set mat)

La taille maximale des matrices est fixée par défaut à 40×40 dans Stata. Pour utiliser des matrices plus grandes vous devez utiliser la fonction set matsize.

set matsize #; o`u # est un nombre entre 10 et 800 qui indique la taille maximale des matrices.

if

La majorité des fonctions peuvent être suivies de la commande if qui permet de spécifier une condition pour que l’expression soit executée. if est placé après la fonction, mais avant les options

Cette option ne sera pas mentionnée pour chaque fonction puisqu’elle est présente très souvent.

commande if expression

ex: replacex=y if x < y

(13)

in

La majorité des fonctions peuvent être suivies de la commande in qui permet de spécifier l’étendue des données affectées par la fonction. in est placé après la fonction, mais avant les options.

Cette option ne sera pas mentionnée pour chaque fonction puisqu’elle est présente très souvent.

commande in étendue; où étendue peut prendre la forme # ou #/#, et # peut-être un nombre positif,l(dernière observation),f(première observation) ou un nombre négatif (dis- tance par rapport à la dernière observation).

ex:

regress y x1 x2 in f /60; équivalent à regress y x1 x2 in 1/60: les 60 premières observations.

list y in -10/l: les 10 derni`eres observations.

2.5 Exemples et r´ esultats pour le Chapitre 2

Lecture des données à partir du fichier Donnees.dat et manipulation des variables dans le but de faire une régression. Le fichierDonnees.dat contient 5 variables, comptant chacune 100 observations.

set more off

infile px qt var3 var4 var5 ”c:\mes documents\Donnees.dat”, clear

* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit

* être inclu dans l’ensemble [0,25;0,5] et la 5e variable doit être égale

* `a 1 pour que la variable binaire ´egale 1.

g bin = (0.25 = var3/var4 = 0.5 var5==1)

* Cr´eation d’une variable indice.

g no = n

(14)

Chapitre 3

Visualisation des donn´ ees

3.1 Impression/Exportation des donn´ ees

3.1.1 Impression ` a l’´ ecran

list

Affiche à l’écran la valeur des variables spécifées.

list [nom(s) de variable(s)]; si aucun nom de variable est sp´ecifi´e, Stata affiche toutes les variables.

ex:

list y in -10/l: affiche les 10 derni`eres observations de y.

3.1.2 Exportation

log using

Permet de sauvegarder une copie de sa session dans le fichier spécifié. Doit être suivi de log off à la fin du programme.

log using nom de f ichier programme

log off

Options: replace, indique `a Stata de remplacer le fichier existant.

3.1.3 Impression

La fa¸con la plus pratique d’imprimer ses résultats est d’utiliser la fonctionlog, puis de traiter le fichier “.log” avec son traitement de texte préféré.

(15)

3.2 Exemples et r´ esultats pour le Chapitre 3

Reprenons l’exemple du chapitre 1, en incluant cette fois les fonctions du chapitre 2.

log using ”c:\mes documents\ExChap2.log”, replace set more off

infile px qt var3 var4 var5 ”c:documents.dat”, clear

* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit

* être inclu dans l’ensemble [0,25;0,5] et la 5e variable doit être égale

* `a 1 pour que la variable binaire ´egale 1.

g bin = (0.25 = var3/var4 = 0.5 & var5 ==1) list px qt bin

* Cr´eation d’une variable indice.

g no = n log close

(16)

Chapitre 4 Graphiques

graph (gr)

Trace des graphiques.

graph nom des variables, [type de graphique, autres options]

O`utype de graphique peut prendre les valeurs suivantes:

• histogram (h): histogramme

• twoway (t): nuage de points à deux axes; valeur par défaut si plusieurs variables sont affichés. La première variable spécifiée est toujours la variable dépendante.

• bar(b): graphique `a barres

• pie(p): graphique en pointe de tartes

Voici certaines des options suppl´ementaires les plus utiles:

• xlog, ylog: spécifie que l’axe des x ou des y respectivement doit être en échelle logarithmique.

• xline, yline: spécifie qu’une grille en x ou en y respectivement devrait être affichée.

• connect(option) (c(option)): spécifie si les points devraient être connectés/. option peut prendre les valeurs suivantes:

– .: non-connect´es; valeur par d´efaut – l: lignes droites entre les points

– s: traces des lignes courbes entre les points

• symbol(option) (s(options)): sp´ecifie le symbole que doivent prendre les points.

option peut prendre les valeurs suivantes:

– O: grand cercles; valeur par d´efaut

(17)

– o: petits cercles – .: points

– i: invisibles

• saving(nomdef ichier), [replace]: sauvegarde le graphique dans le fichier spécifié, si aucune extension n’est spécifiée, Stata ajoute par défaut “.gph”.

replaceindique que le fichier existant peut ˆetre remplac´e.

4.1 Exemples et r´ esultats pour le Chapitre 4

log using ”e:\ExChap3.log”, replace set more off

* Fixer le nombre d’observations `a 100.

set obs 100

* cr´eation d’un indice de temps commen¸cant `a 4.

g t = n+3

* cr´eation du log de cet indice.

g lnt = log(t)

graph lnt t, saving(”e:1”, replace) graph lnt t, yline saving(”e:2”, replace) graph lnt t, yline c(s) saving(”e:3”, replace) graph lnt t, yline s(.) saving(”e:4”, replace)

graph lcrd t, xlog yline c(s) s(i) saving(”e:5”, replace) log off

(18)

Chapitre 5

R´ egressions Simples

Dans ce chapitre nous consid´ererons le mod`ele suivant:

y = β₀+β₁x₁+β₂x₂+· · ·+β_kx_k+u y = Xβ+u

regress(reg)

Incontournable si on désire faire des régressions par MCO. Effectue la régression de la variable dépendante sur la ou les variables indépendantes spécifiées.

regressvariable d´ependante [variables ind´ependantes]

Options:

• level(#) (l(#)): permet de spécifier le niveau de confiance pour les intervalles et le p-value (# doit être un entier); silevel()n’est pas spécifié, # prend la valeur 95, i.e.

le niveau de confiance est fix´e `a 95%.

• robust (r): calcule des variances robustes par la m´ethode de Eicker-White.

ex: reg y x1 x2 x3 if x1==1, r predict

Permet de calculer les valeurs pr´edites, les r´esidus, etc. pour toutes les observations.

predictnom de nouvelle variable; sans aucune option calcule les valeurs pr´edites (ˆy).

Options:

• xb: calcule X⁰β, la valeur lin´eaire pr´edite

• residuals (r): calcule les r´esidus

• stdp: calcule les ´ecarts-types des valeurs pr´edites

(19)

ex: calcule les ˆy hors-´echantillon reg y x1 x2 x3 in 1/100

predict y hat if ~e(sample)

test (t)

testpermet d’effectuer des tests d’hypoth`eses apr`es une estimation. Il prend principalement deux formes:

test [expression1 = expression2]: test que l’expression1 n’est pas statistiquement diff´erente de l’expression2

test liste de coef f icients: test que les coefficients ne sont pas conjointements statistiquement diff´erents de z´ero.

ex:

reg y x1 x2 x3 test x1 = x2 test x2 x3

5.1 Tests d’h´ et´ erosc´ edasticit´ e

La présence d’hétéroscédasticité ne vient pas biaiser vos résultats, elle biaise plutôt les écarts- types obtenus par MCO. Il existe plusieurs méthodes similaires de tester pour la présence d’hétéroscédasticité. La plus simple est le test de Breusch-Pagen:

1. récupérer les résidus de la régression qu’on désire tester;

2. générer le carré des résidus;

3. régresser la carré des résidus sur les variables dépendantes de la régression originale;

4. tester si les coefficients sont conjointement significatifs (test F ou test LM).

(20)

de White. Afin de limiter le nombre de régresseurs, on peut utiliser un test de White légèrement modifié:

u² =β₀+β₁yˆ+β₂yˆ²+e

On proc`ede pour le reste exactement de la mˆeme fa¸con que pour le test de Breusch-Pagan.

Que faire lorsque vous trouvez la présence d’hétéroscédasticité? Deux options s’offrent à vous:

• Calculer des variances robustes par la m´ethode de White¹

• Estimer le modèle par MCG, i.e. modéliser la forme d’hétéroscédasticité (voir le chapitre 8).

5.2 Test de Changement structurel (Test de Chow)

Consid´erez le mod`ele suivant:

y =β₀+β₁x₁+β₂x₂+u

Le test de Chow sert à vérifier s’il existe une différence dans l’influence d’une variable dépendante entre deux groupes de données, i.e. si le coefficient est statistiquement différent.

Les deux groupes de données pourraient être deux séries d’observations ou deux périodes de temps par exemple.

La fa¸con “classique” d’effectuer le test de Chow est d’effectuer la régression du modèle pour les deux groupes de fa¸con indépendante et pour les deux groupes ensemble:

ˆ

y1 = β10+β11x11+β12x12

ˆ

y₂ = β₂₀+β₂₁x₂₁+β₂₂x₂₂ ˆ

y = β₀+β₁x₁+β₂x₂

puis de tester si les coefficient sont statistiquement diff´erents par un test F: F = (SSRˆ _y −SSRˆ _y₁ −SSRˆ _y₂)/q

(SSRˆ _y₁ −SSRˆ _y₂)/n₁ +n₂−2k)

Rappel: q est le nombre de contraintes et k le nombre de coefficients, ici q=k= 3

Une autre fa¸con plus rapide d’effectuer ce test est de construire une variable binaire ´egale `a

1Il peut-être bien tentant de procéder systématiquement avec les variances robustes Eicker-White pour

´

eviter de faire le test d’hétéroscédasticité, mais cette fa¸con de faire réduit la précision de vos résultats (i.e.

gonfle les écarts-types et réduit la puissance des tests) lorsque les données sont homoscédastiques.

(21)

un pour les observations du deuxi`eme groupe et de faire une seule r´egression sur les variables originales et sur les termes d’interaction avec la variable binaire²:

Soit δ la variable binaire:

ˆ

y =β₀+β₁x₁+β₂x₂+β₃δ+β₄x₁δ+β₅x₂δ

On désire maintenant tester si β0 = (β0+β3), si β1 = (β1+β4) et siβ2 = (β2+β5). Ce qui revient à tester si β₃, β₄ et β₅ sont conjointement différent de 0. Ceci peut être facilement effectué par un test de F.

ex:

g g2 = (groupe == 2) g g2x1 = g2*x1

g g2x2 = g2*x2

reg y x1 x2 g2 g2x1 g2x2 test g2 g2x1 g2x2

(22)

Chapitre 6

Variables instrumentales et Doubles Moindres Carr´ es

Lorsqu’une variable “indépendante” est corrélée avec le terme d’erreur, les hypothèses clas- siques du modèle linéaire sont violées et on se retrouve face à un problème d’endogénéité.

Dans ces cas, on peut faire appel `a l’estimateur de variables instrumentales (VI) ou aux doubles moindres carr´es ordinaires (DMCO).

6.1 Estimateur Variables Instrumentales

Soit Z, une matrice de VI et X, la matrice originale. L’estimateur VI est donn´e par:

βˆ_{(V I)} = (Z⁰X)⁻¹Z⁰y et l’estimateur VI de la covariance par:

ˆ

σ²(Z⁰X)⁻¹(Z⁰Z)(X⁰Z)⁻¹ o`u

ˆ σ² = 1

T(y−Xβˆ_(IV₎)⁰(y−Xβˆ_(IV₎).

ou, lorsque J > K (J ´etant le nombre de VI et K le nombre de variables ind´ependantes), par:

βˆ_(IV₎ = [X⁰Z(Z⁰Z)⁻¹Z⁰X]⁻¹X⁰Z(Z⁰Z)⁻¹Z⁰y.

ˆ

σ²[X⁰Z(Z⁰Z)⁻¹Z⁰X]⁻¹.

ivreg

ivreg permet de faire directement une r´egression par DMCO.

(23)

ivreg variable dependante variables independantes (variable dependante=variable(s) intrumentale(s)), options

où options peut prendre les mêmes valeurs que pour regress, ainsi que first qui affiche les résultats de la première régression.

ex:

ivreg y1 z1 z2 (y2=x1), r first predictpeut être utilisé après ivreg

6.2 DMCO

Le principe des doubles moindres carrés ordinaires est d’utiliser une estimation de la variable endogène qui ne soit pas corrélée avec le terme d’erreur pour effectuer la régression.

Soit le mod`ele suivant:

y₁ =β₀+β₁x₁+β₂x₂+β₃y₂+u et soit z une VI dey₂.

Comme leur nom l’indique, les DMCO se font en deux ´etapes.

1. Estimation de la variable endog`ene:

R´egression dey₂ sur toutes les variables ind´ependantes (x₁ etx₂ ici) et la/les VI poury₂ (z ici).

On récupère ˆy₂, l’estimation linéaire dey₂. 2. Régression du modèle avec ˆy₂:

R´egression de y₁ sur une constante, x₁, x₂ et ˆy₂.

(24)

6.3 Tests d’endog´ en´ eit´ e

Letest de Hausmanpermet de vérifier s’il existe bel et bien une différence entre l’estimateur VI et l’estimateur MCO, vérifiant ainsi s’il y a bel et bien endogénéité des variables (si les deux estimateurs sont consistants, ils seront asymptotiquement égaux). Sous H0, la statistique de Hausman est:

H = [ ˆβ_{(V I)}−b]⁰[ˆσ²[(X⁰Z(Z⁰Z)⁻¹Z⁰X]⁻¹−σˆ²(X⁰X)⁻¹]⁻¹[ ˆβ_{(V I)}−b]∼χ²(J)

hausman

Effectue le test de sp´ecification d’Hausman.

Estimation du mod`ele moins efficient, mais convergent (VI ici) hausman, save

Estimation du mod`ele efficient, mais peut-ˆetre pas convergent (MCO ici) hausman

Options: constant (c), indique que la constante doit ˆetre inclue dans la comparaison des deux mod`eles.

ex:

ivreg y1 z1 z2 (y2=x1) hausman, save

reg y1 z1 z2 y2 hausman, c

(25)

Chapitre 7

Estimateur du Maximum de Vraissemblance (EMV)

La fonction de vraisemblance est la probabilité jointe des observations étant donné les paramètres d’intérêts, i.e.:

L(θ|y) =f(y₁, . . . , y_n|θ) =

n

Y

i=1

f(y_i|θ)

L’estimateur du maximum de vraisemblance (EMV) a pour but de choisir le vecteur de paramètres θ qui maximise la fonction de vraisemblance, i.e. pour lequel les données observées sont les plus probables. Pour simplifier les choses, la fonction de log-vraisemblance, L(θ|y), est généralement utilisée¹.

Prenons l’exemple d’un ´echantillon normalement distribu´e, de moyenne 0 et de variance σ²: f(y|X, β, σ²) =

T

Y

t=1

(2πσ²)^−1/2exp[(y_t−x⁰_tβ)²]

= (2πσ²)^{−T /2}exp

−(y−Xβ)⁰(y−Xβ) 2σ²

.

(26)

δlnL

δσ² =− T

2σ² + (y−Xβ)⁰(y−Xβ) 2σ⁴

Ce qui nous permet de trouver

βˆ= (X⁰X)X⁰y σˆ² = (y−Xβ)⁰(y−Xβ)

T = ˆe⁰eˆ T

ml

Permet de faire une estimation par maximum de vraisemblance pour une ´equation donn´ee.

Cette fonction étant fort complexe et très peu utilisée dans le cadre des problèmes abordés dans ce guide, il est laissé à la discrétion du lecteur le soin de consulter l’aide de Stata à son sujet.

Stata estime automatiquement par maximum de vraisemblance les r´egressions qui doivent ˆ

etre traitées par EMV. Les modèles à variable dépendante qualitative, les modèles de durée et les ARIMA sont des exemples de tels cas.

(27)

Chapitre 8

Moindres Carr´ es G´ en´ eralis´ es

La méthode des moindres carrés généralisés (MCG) cherche à modéliser la fonction de la variance. Nous obtenons alors l’estimateur MCG

βˆ^{M CG} = (X⁰V⁻¹X)⁻¹X⁰V⁻¹y ou encore

βˆ^{M CG} = (X⁰W⁻¹X)⁻¹W⁰V⁻¹y et sa variance est

var[ ˆβ] =σ²(X⁰V⁻¹X)⁻¹. oùV et W sont égaux à

W =σ²







x₁ 0 · · · 0 0 x2 · · · 0 ... ... . .. ...

0 0 · · · x_n







≡σ²V

vwls

permet de faire une régression linéaire pondérée par la variance.

vwls variable dependante variables independantes [poids], options

(28)

Chapitre 9

Variables d´ ependantes qualitatives

9.1 Probit/Logit

Un probit et un logit s’appuient en fait sur le même principe, ils ne diffèrent que dans la forme de la fonction de répartition qu’ils utilisent pour calculer l’effet sur la probabilité d’une variation de la variable latente. En effet, lorsque la variable dépendante ne prend que des valeurs qualitatives (oui ou non par exemple), l’effet d’une variable indépendante sur la probabilité de dire oui doit être “traduit” par une fonction de répartition. Cette dernière nous donne la probabilité associée à une valeur donnée de la valeur latente exprimée par la combinaison linéaire des variables indépendantes.

probit (prob)

Estime un mod`ele probit.

probit variable d´ependante variable ind´ependante

Options: probit poss`ede en grande partie les mˆemes options que regress.

Note: Ici predict donne par défaut la probabilité. Pour avoir l’estimation linéaire, il faut préciserxt dans les options de predict.

logit

Permet d’estimer un mod`ele logit.

logit variable d´ependante variable ind´ependante

Options: logit poss`ede en grande partie les mˆemes options que regress.

(29)

9.2 Probit/Logit ordonn´ e 9.3 Tobit

Un tobit est essentiellement un modèle dont les données sont censurées. Comme le probit, le tobit suit une loi normale.

tobit

Permet d’estimer un mod`ele tobit.

logit variable d´ependante variable ind´ependante

Options: ll(#),ul(#): indiquent respectivement que les données sont tronquées à gauche ou à droite. Une ou les deux de ces options doivent être spécifiées. # indique le point de troncation. Si # n’est pas précisé, Stata suppose qu’il s’agit respectivement de la valeur minimum et de la valeur maximum.

Les autres options de tobit sont en grande partie commune avec regress.

ex:

tobit y x1 x2 x3 x4, ll(0)

9.4 Biais de s´ election: Heckit

(30)

Chapitre 10

Mod` eles de dur´ ee

(31)

Chapitre 11

S´ eries Chronologiques

11.1 Op´ eration sur les variables dans le cadre de s´ eries chronologiques

tsset

Lorsqu’on travaille avec des s´eries chronologiques dans Stata, il est n´ecessaire de l’en informer par la commande tsset.

tsset variable de temps ex:

generate t = n tsset = t

11.2 Op´ erateurs de s´ eries temporelles

Voici comment reproduire l’équivalent des opérateurs Avance et Retard dans Stata pour travailler sur les séries chronologiques.

l

(32)

regress y l.y l2.y

f

L’opérateur f est l’opérateur Avance de stata. Il peut être utilisé avec toutes les fonctions qui acceptent les séries temporelles une fois que la déclaration de séries temporelles à été faite.

f#.variable

où variable est la variable sur laquelle l’opérateur doit agir et # est le nombre d’avance à appliquer. Si # est omis, une seule avance est appliquée (équivalent àf1.variable).

tsset t

* une autre formulation pour un mod`ele AR2 regress f.y y l.y

11.3 Tests d’autocorr´ elation

Inutile de mentionner que l’autocorrélation est un problème qui n’est pertinent que dans le cas des séries temporelles. . .

Le test ρ est le test le plus simple à effectuer pour tester la présence d’autocorrélation:

1. récupérer les résidus de la régression qu’on désire tester;

2. régresser û_t sur ût−1 à ût−n etX

3. Tester la signification conjointe des coefficients de cette r´egression par un test F.

Choisissons n ´egal `a 3.

reg y x1 x2 predict u, r reg u l.u l2.u l3.u

Il suffit alors de regarder la statistique F donn´ee par Stata.

Le test de Durbin-Watson est aussi utilisé pour tester la présence d’autocorrélation, mais comme il est moins précis et ne considère qu’une seule période, nous ne le couvrirons pas ici.

(33)

11.4 M´ ethode de Box-Jenkins

Ce qu’il est important de comprendre, à mon avis, dans la méthode de Box-Jenkins, c’est que l’objectif de toutes les opérations que nous effectuons est de se retrouver avec un résidu qui est un bruit-blanc. Le but ultime étant de modéliser la série afin de faire des prédictions, nous pouvons seulement être certain d’avoir tout extrait lorsqu’il nous reste seulement un bruit-blanc: un processus qui est par définission impossible à prédire.

11.4.1 Stationnarit´ e des donn´ ees

La première étape de la méthode de Box-Jenkins consiste à effectuer les transformations nécessaires afin de s’assurer que notre série est stationnaire, si elle ne l’est pas, il nous sera impossible de travailler dessus.

Première question à se poser: doit-on travailler en log ou pas? Si la variable croˆıt à un taux constant, elle sera linéaire en log. De plus, les propriétés du logarithme font en sorte qu’il “écrase” une variance croissante. Outre la transformation logarithmique, il existe trois cas possibles de non-stationnarité qui impliqueront des changements dans la série (ou sa modélisation):

• Changement structurel

• Tendance d´eterministe

• Racine unitaire Changement structurel

Les changement structurels peuvent être détectés à l’aide du Test de Chow (voir section 5.2).

Malheureusement, rien ne peut généralement être fait pour stationnariser une série dans le cas d’un changement structurel.

Tendance d´eterministe

Afin de régler le problème de la présence d’une tendance temporelle, il suffit de la modéliser.

(34)

Racines Unitaires

On fait face à un problème de racine unitaire lorsqueρ= 1 dans le modèle suivant:

y_t=α+ρy_t−1+e_t

Afin de régler le problème de racine unitaire, il faut différencier la série, i.e. travailler sur

∆y_t =y_t−y_t−1 plutˆot que y_t. Le mod`ele devient donc:

∆y_t=α+θyt−1+_t

La différenciation d’une série est effectuée automatiquement dans Stata lors de l’utilisation de la fonction arima.

Tester pour la pr´esence d’une racine unitaire se fait par un test t o`u H₀ est θ = 0.

Malheureusement, sous l’hypothèse nulle, la statistique t ne suit pas la loi asymptotique habituelle. Il faut plutôt utiliser la loi de Dickey-Fuller. S’il y a corrélation des termes d’erreur, il faut plutôt utiliser une loi de Dickey-Fuller augmentée.

dfuller

Effectue un test de Dickey-Fuller augmenté sur la variable spécifiée.

dfuller nom de variable, options Options:

• lags(#): spécifie le nombre de retards à utiliser pour le calcul de la variance estimée Newey-West.

• trend: incluera une variable de tendance dans la r´egression.

pperron

Possède exactement la même structure et les mêmes options que dfuller, mais effectue un test de Phillips-Perron plutôt qu’un test de Dickey-Fuller augmenté.

11.4.2 Mod´ elisation des cycles: Mod` eles AR, MA, ARMA, ARIMA

arima

Permet d’estimer un mod`ele AR, MA, ARMA ou ARIMA par maximum de vraisemblance.

arima variable d´ependante variable ind´ependante, arima(p,d,q)

o`up est le nombre de AR, d le nombre de diff´erenciation et q le nombre de MA.

Il n’est pas nécessaire de préciser de variables indépendates.

(35)

ex: AR(1)

arima t, arima(1,0,0) ex: MA(1)

arima t, arima(0,0,1) ex: ARIMA(1,1,2) arima t, arima(1,1,2)

Pour choisir p et q, il est bon de regarder l’autocorrélogramme partiel (nombre de AR) et l’autocorrélogramme (nombre de MA) de la variable qui nous intéresse.

corrgram

Construit une table des autocorrélations et des autocorrélations partielles. Permet de tracer l’autocorrélogramme et l’autocorrélogramme partiel.

corrgram nom de variable, option

Options: lags(#): sp´ecifie le nombre de retards `a calculer.

corrgran peut ˆetre suivi de deux autres fonctions:

ac

Produit un autocorr´elogramme.

ac nom de variable, options Options:

• lags(#): sp´ecifie le nombre de retards `a calculer.

• level(#): sp´ecifie le niveau de confiance `a utiliser dans le calcul des bandes de confiances.

• Toutes les options standards d’un graphique sont ´egalement admissible.

pac

(36)

R-carr´e ajust´e

Le R-carré ajusté ( ¯R²) est donné par la formule suivante:

R¯² = 1− n−1

n−K(1−R²) Akaike information criterion (AIC)

Voici la formule habituelle du crit`ere d’Akaike:

AIC(K) =log(e⁰e

n ) + 2K n

Bayesian information criterion (BIC)

Voici la formule habituelle du crit`ere de Schwartz ou Bayesien:

BIC(K) =log(e⁰e

n ) + Klogn n Ces crit`eres doivent ˆetre construits manuellement.

(37)

Chapitre 12

Donn´ ees longitudinales (Panel)

Il existe bon nombre de méthodes pour traiter les données en Panel et la littérature sur le sujet est très exhaustive, nous ne traiterons donc dans ce chapitre que des méthodes de base.

12.1 Effets Fixes et Effets Al´ eatoires

Lorsqu’on a des données longitudinales, on voudra souvent isoler l’effet associé à chaque année, à chaque individu ou aux deux. Il existe deux fa¸cons de modéliser ces effets, soit comme des effets fixes, soit comme deseffets aléatoires.

Effets fixes (α_i, µ_t):

y_it =α_i+µ_t+X_itβ+e_it Effets al´eatoires (α_i, µ_t):

y_it = X_itβ+e_it e_it = α_i+µ_t+ε_it

Les effets fixes ont l’avantage de permettre une corr´elation avec les variables explicatives,

(38)

préférable dans certains cas de ne pas inclure de constante pour comparer tous les groupes entre eux. Dans le dernier exemple, on pourrait ainsi laisser tomber la constante et inclure cinq variables binaires pour les groupes et trois variables binaires pour les annés.

Ajout manuellement de variables binaires pour chaque groupe et chaque ann´ee.

ex: Régression sur cinq échantillons tirés de 1980,81,82 et 83.

* cr´eation des variables binaires a81 = (annee == 1981) a82 = (annee == 1982) a83 = (annee == 1983) g2 = (groupe == 2) g3 = (groupe == 3) g4 = (groupe == 4) g5 = (groupe == 5)

* r´egression

regress y x1 x2 a81 a82 a83 g2 g3 g4 g5

12.1.2 Fonctions pour donn´ ees longitudinales

Il est aussi possible d’indiquer à Stata que l’on travaille avec des données en Panel afin d’automatiser le processus de calcul des effets fixes ou aléatoires:

tsset

Cette fonction déjà vue dans le chapitre 11 permet également de déclarer nos données comme un panel de séries temporelles. Il suffit pour ¸ca d’ajouter la variable de panel (de groupe) avant la variable de temps.

tsset variable de panel variable de temps

ex:

g t = n tsset groupe t

Une fois tsset déclaré pour des données panel, il est possible de travailler avec la famille de fonctions xt de Stata. Il existe une telle fonction pour chacun des types de régression:

xtreg, xtlogit, xprobit, xttobit, xtgls, etc. Nous ne couvrirons ici que sommaire- mentxtreg et nous vous référons à l’aide de Stata pour plus de détails sur cette famille de fonctions.

xtreg

(39)

Permet de faire des r´egressions sur des donn´ees en Panel.

Effet fixe: xtreg variable d´ependante variable ind´ependante, fe

Effet aléatoire estimé par MCG: xtreg variable dépendante variable indépendante, re Effet aléatoire estimé par EMV: xtreg variable dépendante variable indépendante, mle

ex:

tsset groupe annee xtreg y x1 x2, fe

(40)

Chapitre 13

Interaction avec les tableurs et les traitements de texte

13.1 Remarques

Quelques remarques importantes lorsque vous travaillez avec des donn´ees num´eriques:

• Pour être utilisables, les données numériques doivent être séparées par variable et par observation, chaque valeur étant séparée de la suivante par un ‘séparateur’.

• Généralement, il est plus facile de travailler si les variables constituent les colonnes et les observations les rangées.

• Comme les logiciels sont (tous?) américains, le séparateur de décimales doit être un point (‘.’) et non pas une virgule (‘,’). Si ce n’est pas le cas, ceci peut facilement être changé par la commande replace du menuEdit de Excel.

• Assurez-vous que le séparateur de valeurs est compatible avec la méthode utilisée pour importer les données dans le logiciel économétrique.

• Assurez-vous ´egalement que si vous avez du texte dans vos observations, cela est permis par votre m´ethode d’importation.

• Evitez les lignes de commentaire ou de texte avant vos donn´´ ees ou le nom de vos variables. Bien qu’il soit possible de contourner cette difficulté, ¸ca évite souvent des problèmes.

13.2 Tableur

Cette section est surtout orientée vers Excel puisque c’est le tableur le plus utilisé sur le marché.

(41)

• Exportation des données: Dans le menu Fichier, Sauvegarder sous, sélectionnez un format text avec séparateur: soit des tabulations (.txt ou .tab), soit des virgules (.txt ou .csv).

• Importation de données: En ouvrant un fichier ASCII (sans formatage), l’assistant importation-données de Excel devrait s’ouvir automatiquement. Vous devrez alors seulement sélectionner le type de séparateur (étape 2) et le type de données (étape 3:

optionnel) pour pouvoir acc´eder `a votre fichier.

13.3 Traitement de texte

Cette section est surtout orientée vers Word puisque c’est le traitement de texte le plus utilisé sur le marché.

• Création de Tableau: Le copier-coller est la solution de choix ici. L’idéal est de passer par Excel après avoir importer le fichier de données (sélectionnez les cases désirées, copier, coller...). Sinon, vous pouvez également copier directement les résultats à partir du gestionnaire de données.

• Insertion de Graphique: Menu insertion, objet, du fichier.... Trouvez l’image qui vous sert de graphique et appuyez sur OK.

• Transcription de résultats: Malheureusement, il n’existe pas de moyen rapide de tran- scrire vos résultats s’ils ne peuvent pas être mis en tableau. Copier-coller ou la transcription manuelle demeurent les seuls moyens d’effectuer ce travail... faites des tableaux!

(42)

Chapitre 14

O` u trouver ses donn´ ees et comment les extraires

14.1 Liens utiles

14.1.1 A l’Universit´ ` e

Votre premier arrêt pour trouver des données se doit d’être sur le site web de la bib- liothèque des sciences humaines au:

http://www.bib.umontreal.ca/SB/num/

Cette page vous donne accès aux plus importantes sources officielles de données numériques, notamment, Statistiques Canada (E-STAT et CHASS), l’institut de la statistique du Québec et l’OCDE. La majorité de ces données sont des séries chronologiques ou des données en panel.

Pour obtenir des données d’enquêtse, il faut se tourner vers Sherlock (aussi accessible par cette page) ou vers des organismes privés. Certaines données d’enquêtes sont

´egalement accessible par l’institut de la statistique du Qu´ebec.

14.1.2 A l’Ext´ ` erieur

Google www.google.ca

Moteur de recherche tr`es puissant qui devrait vous aider pour toutes vos requˆetes.

Gouvernement du Qu´ebec www.gouv.qc.ca

Plusieurs ministères ont des données télćhargeables qui sont accessibles par leur site web.

(43)

Gouvernement du Canada www.gc.ca

Plusieurs ministères ont des données télćhargeables qui sont accessibles par leur site web.

Eurostat http://europa.eu.int/comm/eurostat/

Plusieurs indicateurs ´economiques et sociaux de l’Union Europ´eenne.

US Census Bureau http://www.census.gov/

Donn´ees des recensement am´ericains.

Agences Nationales de Statistiques http://www.census.gov/main/www/stat int.html Liens vers toutes les agences nationales de statistiques.

Fedstat http://www.fedstats.gov/

Liens vers la majorité des organismes fédéraux américains produisant des données qui son accessibles.

Donn´ees Spatiales http://data.geocomm.com/catalog/

Plusieurs liens vers des données codées géographiquement.

DataLinks http://www.econ-datalinks.org/

Une foule de liens vers des données économiques et financières.

Cette liste est très très loin d’être exhaustive, donc n’hésitez pas à pousser vos recherches sur internet plus loin. Si vous trouver des liens intéressant, envoyez-les moi et je me ferrai un plaisir de les ajouter aux versions futures de ce guide.

Un conseil: Les sites gouvernementaux et minist´eriels au niveau national et sous- national sont souvent des mines d’or de donn´ees!

14.2 Acc` es au Donn´ ees

Cette section décrit seulement comment accéder et télécharger les données de quelques sources particulièrement importantes.

(44)

CHASS Accès à envrions 600 000 séries de plus qu’avec E-Stat, mais environnement de navigation moins convivial.

Nous d´ecrirons seulement l’usage de E-Stat ici.

1. Trouvez le tableau qui vous int´eresse en effectuant une recherche par sujet ou par mot-cl´e.

2. Une fois dans le tableau de votre choix, vous aurez généralement à sélectionner des séries spécifiques en choisissant parmis une liste déroulante et ce, pour plusieurs catégories (ex: géographie, fréquence, sexe, dates, etc.).

Choisissez les séries désirés (tenez la touche ctrl enfoncée pour sélectionner plusieurs items dans une même liste) et appuyez sur série chronologiques.

3. Choisissez votre format de sortie parmis les choix offerts (suggestion: CSV ou PRN, p´eriodes = lignes).

4. Appuyez sur extraire et sauvegarder le fichier qui apparaitra sous le nom d´esir´e.

14.2.2 OCDE

http://www.sourceoecd.org/ (doit être accédé par l’UdeM)

Généralement, les données les plus intéressantes se trouvent dansstatistiques de l’OCDE / Perspectives Économiques.

1. Une fois dans Perspectives Économiques, appuyez sur Bases de données statis- tiquespuis, à la page suivante, surtableaux, puis sur données et, enfin, sur accès aux données.

2. Vous devrez ensuite s´electionner dans l’ordre vos Pays, vos Variables et votre P´eriode de couverture.

3. La dernière étape consiste à sauvegarder vos données dans le format désiré.

14.2.3 Sherlock

1. Une fois votre enquête sélectionnée, cliquez dessus.

2. Choisissez le format d’extraction. À moins que vous connaissiez SAS ou SPSS, il vous est suggéré de choisir Extraction par variables et un fichier .tab.

3. Vous devrez ensuite sélectionner les variables désirées en cochant les cases corre- spondantes.

(45)

4. Finalement, vous devez choisir les valeurs des variables que vous d´esir´ees.

5. Pour extraire les donn´ees, entrez votre adresse courriel et appuyez sur Extraire.

Les données vous seront envoyées en différé à l’adresse spécifiée.

(46)

(47)

Annexe A

Tableaux R´ ecapitulatifs

A.1 Fonctions de Stata

Fonction Abr´eviation Description Forme Importation de Donn´ees

infile inf Importe les donn´ees d’un fichier.

infile nom des variables using nomdef ichier insheet Importe les donn´ees d’un

fichier (s´eparateurs: tabulations ou virgules).

insheet using nom de f ichier

Transformation de Variables

generate g Cr´ee une nouvelle variable. generate

nouvelle variable = expression

replace Remplace une variable existante.

replacevariable existante

=expression

abs Valeur absolue. abs(x)

exp Exponentiel. exp(x)

log Logarithme naturel. log(x)

(48)

Fonctions Matricielles

matrix mat Cr´ee ou modifie une matrice.

matrix nom de la matrice

= expression matrix get Permet d’obtenir copie

d’une matrice syst`eme.

matrix variable = get(matrice syst`eme) mkmat Transforme des variables en

vecteurs/matrice.

mkmat

nom(s) de variable(s), matrix

[(nomdelanouvellematrice)]

svmat Transforme les colonnes

d’une matrice en variables.

svmat matrice,

[names(nom col1, nom col2, . . .)]

colsof nombre de colonnes d’une

matrice.

colsof(A) det D´eterminant d’une matrice. det(A)

diag Matrice diagonale n × n,

avec pour diagonale les

´

el´ements de V.

diag(V)

el El´´ ement a_ij d’une matrice. el(A,i,j)

I Matrice identit´en×n. I(n):

inv Inverse d’une matrice

carr´ee.

inv(A)

rowsof Nombre de rang´ees d’une

matrice.

rowsof(A) vecdiag Extrait la diagonale d’une

matrice carr´ee sous forme de vecteur.

vecdiag(A)

Fonctions Diverses

graph gr Trace un graphique. graph nomdesvariables, [typedegraphique, autresoptions]

list Affiche à l’écran les variables spécifiées.

list

[nom(s) de variable(s)]

log Enregistre la session. log using nom de f ichier

more Active ou d´esactive

l’affichage de --more--.

more on/off set matsize set mat Fixe la taille maximale des

matrices.

set matsize #

(49)

Fonctions Diverses (suite)

uniform Donne une valeur al´eatoire entre 0 et 1 (ditribution uniforme sur [0,1)).

uniform()

tsset Déclaration de séries temporelles/Données pannel.

tsset variable de temps

l Op´erateur retard. l#.variable

f Op´erateur avance. f#.variable

Fonctions ´Econom´etriques

regress reg Effectue une r´egression lin´eaire par MCO.

regressvar_dep[vars inds]

predict Calcule les valeurs pr´edites, les r´esidus, etc.

predict nouvelle variable, options

test t Effectue des tests

d’hypoth`ese.

test [expression1 = expression2]

ivreg Effectue une r´egression par DMCO.

ivreg var dep vars inds (var dep=V I), options

hausman Effectue le test de

sp´ecification d’Hausman.

hausman/ hausman, save vwls Effectue une r´egression

pond´er´ee par la variance (FGLS).

vwls var_dep vars inds [poids], options

probit prob Estime un modèle probit. probit var dep vars inds logit Estime un modèle logit. logit var dep vars inds tobit Estime un modèle tobit. tobit var dep vars inds,

[ll(#)] [ul(#)]

dfuller Effectue le test de Dickey- Fuller augment´e.

dfuller nom de variable, options

pperron Effectue le test de Phillips- Perron.

pperron nom de variable, options

corrgram Produit une table des au- corrgram

(50)

A.2 Op´ erateurs

Description Forme

Op´erateurs Math´ematiques

Addition +

Soustraction -

Multiplication *

Division /

Puissance ^

Op´erateurs Logiques

ET &

OU |

Non (¬) ~

Op´erateurs de Comparaison

Egal´ ==

Diff´erent ~=

Plus grand >

Plus petit <

Plus grand ou ´egal >=

Plus petit ou ´egal <=

A.3 Symboles Math´ ematiques

Symbole Description Symbole Description Symbole Description

P somme ! factoriel ⊥ perpendiculaire

Q produit |x| valeur absolue k parall`ele

R int´egrale kxk norme de x bcp plus petit

∂ dérivée partielle ≺ précède, préféré bcp plus grand

6= diff´erent ∅ ensemble vide ∀ pour tout

≡ ´equivalent ⊂ sous-ensemble

de (inclus dans)

∃ il existe

≈ approximative- ment ´egal `a

∈ élément de ¬ non (négation)

∼= congruent, iso- morphique

T intersection ⇒ implique

∝ proportionel S

union ⇔ ´equivalent

∼ similaires (g´eom´etrie), asymptotiquement, suit (une loi)

(51)

A.4 Alphabet Grec

minuscule majuscule nom minuscule majuscule nom

α alpha ν nu

β beta ξ Ξ xi

γ Γ gamma o o

δ ∆ delta π, $ Π pi

, ε epsilon ρ, % rho

ζ zeta σ, ς Σ sigma

η eta τ tau

θ, ϑ Θ theta υ Υ upsilon

ι iota φ, ϕ Φ phi

κ kappa χ chi

λ Λ lambda ψ Ψ psi

µ mu ω Ω omega