ECO 4272: Introduction `a l’´econom´etrie Exercice 1
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2018, Steve Ambler Hiver 2018
Veuillez ´ecrire lisiblement. Veuillez bien agraferles feuilles de votre tp en- semble avant de le remettre. Date de remise du tp : avant la fin du labo le 19 f´evrier. Je vais afficher les solutions tout de suite apr`es la date de remise. Pour cette raison, les copies remises en retard ne seront pas accept´ees. Vous ˆetes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les coll`egues est sans doute la meilleure fac¸on d’apprendre. Par contre, le nombre maximal de membres par groupe ne peut d´epasser 4 personnes. Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la premi`ere page.
En r´epondant `a toutes les questions du tp, expliquez ce que vous faites et montrezvotre travail. En fait, il est mieux de laisser les r´eponses non simplifi´ees pour m’aider `a suivre votre raisonnement.
1 Covariances (15 points)
Montrezdirectement `a partir de la d´efinition de covarianceque Cov(X , Y) = E(XY)−E(X)E(Y)
pour des variables al´eatoires quelconquesX etY. Vous pouvez supposer que les variables sont des variables al´eatoires discr`etes.
2 Distributions de probabilit´e jointes (15 points)
Voici un tableau de probabilit´es de r´ealisations jointes pour deux variables al´eatoiresX etY. Les r´ealisations possibles pour X sont le long de la premi`ere rang´ee. Les r´ealisation possible pourY sont le long de la premi`ere colonne.
X
Y 4.0 5.0 6.0 9.0 12.0 1.0 0.10 0.05 0.10 0.01 0.02 2.0 0.02 — 0.03 0.02 0.03 3.0 0.02 0.15 0.10 0.15 0.05 R´epondez aux questions suivantes.
1. Trouvez la valeur qui manque du tableau.
2. Calculez les probabilit´es marginales pour toutes les valeurs possibles de X.
3. Calculez les probabilit´es marginales pour toutes les r´ealisations deY. 4. Calculez l’esp´erance conditionnelle deY ´etant donn´e chaque valeur pos-
sible pourX.
5. Calculez l’esp´erance non conditionnelle deX.
6. Calculez l’esp´erance non conditionnelle deY.
7. Calculez l’esp´erance conditionnelle deX siY = 2.0.
8. Calculez l’esp´erance conditionnelle deX siY = 3.0.
9. Calculez l’esp´erance conditionnelle deY siX = 9.0.
10. Est-ce que les deux variables al´eatoires sont ind´ependantes ? Expliquez votre r´eponse.
3 Efficience (30 points)
Vous avez deux ´echantillons de donn´ees provenant de deux populations. Vous savez que les deux populations partagent la mˆeme moyenne ou esp´erance (incon- nue)µ. Le premier ´echantillon amobservations qui sont ind´ependates et qui ont chacune unye variance (connue) deσY21. Le deuxi`eme ´echantillon anobservations qui ont chacune une variance (connue)σ2Y
2. R´epondez aux questions suivantes.
1. Vous d´ecidez d’estimer µ en combinant les deux ´echantillons ensemble pour calculer
ˆ µ= 1
x
m
X
i=1
Y1i+ 1 y
n
X
i=1
Y2i.
Quelles sont les valeurs de xet de y qui donne un estimateur non biais´e deµ? (Attention — vous allez trouver une relation entrexetyet non des valeurs uniques pour chacune des deux).
2. ´Etant donn´ee cette relation entre xety, trouvez la variance de votre esti- mateur non biais´e.
3. Si les observations des deux ´echantillons sont g´en´er´ees par des variables al´eatoires normales, comment est-ce que votre estimateur est distribu´e ? 4. ´Ecrivez le probl`eme que vous pourriez ´ecrire pour trouver l’estimateur le
plus efficient deµavec les donn´ees que vous avez.
5. Trouvez la solution `a ce probl`eme. Interpr´etez ce que vous trouvez.
6. Trouvez l’estimateur deµqui est l’estimateur MCO.
7. Comparez les estimateurs des deux sous-questions pr´ec´edentes.
8. Est-ce que l’estimateur MCO est l’estimateur BLUE (estimateur lin´eaire non biais´e `a variance minimale) dans ce cas ? Expliquez.
4 Th´eor`eme limite centrale (40 points)
Je vous demande d’analyser graphiquement le comportement de la moyenne
´echantillonnale de variables al´eatoires suivant une loi beta. Il n’est pas tr`es impor- tant de connaˆıtre tous les d´etails concernant cette distribution. Regardez
https://en.wikipedia.org/wiki/Beta_distribution.
La distribution a deux param`etres de forme, α etβ. La fonction de densit´e est donn´ee par
f(X :α, β) = Xα−1(1−X)β−1 B(α, β)
o`u B(α, β) est une normalisation qui donne une densit´e dont l’int´egrale est
´egale `a 1.
Le support de la distribution est l’intervalle[0,1]. Pourα, β <1, ceci pose des probl`emes lorsque X = 0ou X = 1, et donc on peut exclure ces deux points.
La moyenne de la distribution est donn´ee par
E(X) = α
α+β.
La variance est donn´ee par
Var(X) = αβ
(α+β)2(α+β+ 1).
La distribution a plusieurs applications, notamment en ´econom´etrie baye- sianne et la mod´elisation du comportement al´eatoire de proportions et de pour- centages.
Je vous conseille de lire le code pour la loi uniforme qui commence `a la page 50 du chapitre 2 des notes de cours sur la th´eorie des probabilit´es. C’est un exer- cice tr`es semblable `a ce que je vous demande de faire.
La distribution est accessible dans la version de base deR.
1. Produisez un graphique de la densit´e pourα= 0.5etβ = 0.5.
2. Faites la mˆeme chose pourα = 2 etβ = 5. Comparez avec ce que vous avez trouv´e dans la premi`ere sous-question.
3. Avecα= 0.5etβ = 0.5, g´en´erez 10 000 moyennes ´echantillonnales pour des ´echantillons de taillen, oun = 1, n= 10, n= 50, n = 500, n= 1000.
Utilisez la commanderbeta(n,0.5,0.5).
4. Dans chaque cas, construisez les moyennes ´echantillonnalesnormalis´ees, en soustrayant la moyenne th´eorique (voir ci-dessus) et en divisant par la racine carr´ee de la variance th´eorique de la moyenne ´echantillonale (voir ci-dessus).
5. Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur den) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero et une variance pr`es de un. Les moyennes
´echantillonnales avant normalisation devraient avoir une moyenne et une variance pr`es des valeurs th´eoriques donn´ees dans l’encadr´e ci-dessus.
6. Ayant construit les moyennes ´echantillonnales normalis´ees, produisez un histogramme des 10 000 valeurs, pour chaque valeur den(1, 10, 50, 500, 1000). Produisez un graphique diff´erent pour chaque valeur de n. Sur le mˆeme graphique, avec la commande dnorm, tracez un graphique de la fonction de densit´e de la loi normale centr´ee r´eduite. Voir le lien suivant pour des indices.
http://www.statmethods.net/graphs/density.html Cette page contient aussi des renseignement sur comment produire des histogrammes. C¸ a pourrait servir pour les autres sous-questions de cettte question.
7. Commentez ce que vous trouvez.
8. Mˆeme si nous l’avons pas vu en classe, pour chaque valeur de n appli- quez le test de normalit´e Jarque-Bera aux 10 000 valeurs que vous avez g´en´er´ees. La commande est jarque.bera.test(x) o`ux est le vec- teur d’observations. La commande fait partie de la librarytseries. Si ce n’est pas encore install´e, il faut l’installer et ensuite la charger en m´emoire.
9. Trouvez lap-value du test pour chacune des valeurs den.
corrig´ele 02/02/2018