ECO 4272: Introduction `a l’´econom´etrie Exercice 1
Steve Ambler
D´epartement des sciences ´economiques Ecole des sciences de la gestion ´ Universit´e du Qu´ebec Montr´eal
c 2014, Steve Ambler Automne 2014
Veuillez ´ecrire lisiblement. Veuillez bien agraferles feuilles de votre tp en- semble avant de le remettre. Date de remise du tp : avant la fin du labo le 29 septembre. Je vais afficher les solutions tout de suite apr`es la date de remise. Pour cette raison, les copies remises en retard ne seront pas accept´ees. Vous ˆetes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les coll`egues est sans doute la meilleure fac¸on d’apprendre. Par contre, le nombre maximal de membres par groupe ne peut d´epasser 4 personnes. Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la premi`ere page.
En r´epondant `a toutes les questions du tp, expliquez ce que vous faites et montrezvotre travail.
1 Distributions de probabilit´e jointes (20 points)
Soit deux variables al´eatoiresX et Y.X peut prendre les valeurs{1,2,3,4}
etY peut prendre les valeurs{5,6,7}. Les probabilit´es jointes sont comme suit.
Pr(X = 1, Y = 5): 0.10 Pr(X = 1, Y = 6): 0.20 Pr(X = 1, Y = 7): 0.05 Pr(X = 2, Y = 5): 0.05 Pr(X = 2, Y = 6): 0.05 Pr(X = 2, Y = 7): 0.05 Pr(X = 3, Y = 5): 0.05 Pr(X = 3, Y = 6): 0.05 Pr(X = 3, Y = 7): 0.05 Pr(X = 4, Y = 5): --- Pr(X = 4, Y = 6): 0.10 Pr(X = 4, Y = 7): 0.05 R´epondez aux questions suivantes.
1. Trouvez la valeur qui manque.
2. Construisez un tableau (avec quatre colonnes pour les valeurs possibles de X et trois rang´ees pour les valeurs possibles de Y) qui donne ces proba- bilit´es jointes, et indiquez sur le mˆeme tableau les probabilit´esmarginales pour chaque variable al´eatoire individuelle.
3. Calculez l’esp´erance conditionnelle de X ´etant donn´e chaque valeur pos- sible pourY.
4. Calculez l’esp´erance conditionnelle de Y ´etant donn´e chaque valeur pos- sible pourX.
5. Calculez l’esp´erance non conditionnelle deX.
6. Calculez l’esp´erance non conditionnelle deY.
7. Est-ce que les deux variables al´eatoires sont ind´ependantes ? Expliquez votre r´eponse.
2 Efficience (40 points)
Vous avez deux ´echantillons de donn´ees pour estimer l’esp´erance (moyenne) µ. Appelons les observations du premier ´echantillon Xi et les observations du deuxi`eme ´echantillonYiVous savez que
E(Xi) = E(Yi) =µ
mais que
Var(Xi) =σX2 et
Var(Yi) =σY2
o`u les deux variances ne sont pas forc´ement ´egales. Il y amobservations dans le premier ´echantillon etnobservations dans le deuxi`eme.
1. Montrez que la moyenne ´echantillonnale des deux ´echantillons pond´er´ee par le nombre relatif d’observations est un estimateur non biais´e pour µ.
L’estimateur est donn´e par
¯
µ≡ m m+n
X¯ + n m+n
Y .¯
2. Puisqu’on donne la mˆeme pond´eration `a chaque observation individuelle, on pourrait appeler l’estimateurµ¯l’estimateur MCO deµ. Montrez en fait que c’est la solution au probl`eme de minimisation suivant :
minµ¯ m
X
i=1
(Xi−µ)¯ 2+
n
X
i=1
(Yi−µ)¯ 2
!
3. Calculez la variance de l’estimateur, donn´ee par Var(¯µ).
4. Maintenant, consid´erez un autre estimateurµ˜d´efini par
˜
µ≡aX¯ + (1−a) ¯Y ,
la moyenne pond´er´ee des moyennes ´echantillonnales deX et deY, o`u0≤ a≤1est une constante arbitraire. Montrez queµ˜est toujours un estimateur non biais´e.
5. Calculez la variance deµ.˜
6. Trouvez la solution au probl`eme de minimisation suivante : mina Var(˜µ).
Notez qu’il faudra remplacerµ˜par sa d´efinition pour trouver la solution.
7. Expliquez de quoi d´epend le poidsadans la solution au probl`eme de mini- misation.
8. On pourrait appeler cet estimateur l’estimateur MCP pour moindres carr´es pond´er´es. Trouvez une condition pour queµ¯= ˜µ.
3 Th´eor`eme limite centrale (40 points)
Je vous demande d’analyser graphiquement le comportement de la moyenne
´echantillonnale de variables al´eatoiresγ(gamma). Il n’est pas important de connaˆıtre tous les d´etails concernant la distributionγ, mais pour ceux qui s’y int´eressent . . .
La distribution est utilis´ee pour mod´eliser les temps d’attente entre
´ev´enements.
Pour une variable X ∼ Gamma(k, θ), la fonction de densit´e est donn´ee par
f(x;k, θ) = x(k−1)e(−x/θ) Γ(k)θk
pourkle nombre d’´ev´enements etθle nombre moyen d’´ev´enements par unit´e de temps et o`uΓ(k)≡(k−1)!, o`u!est la notation pour la factorielle (il faut donc queksoit un nombre entier). La densit´e est d´efinie pourx≥0.
Le param`etrek est appel´e le param`etre de forme (shape en anglais).
Le param`etreθest appel´e le param`etre d’´echelle (scale en anglais).
La fonction de distribution cumul´ee est donn´ee par
F (x;k, θ) = Z x
0
f(u;k, θ)du= γ k,xθ Γ(k) , o`u la fonctionγ k,xθ
est lafonction gamma inf´erieure incompl`ete (voir Wikip´edia pour une explication).
La moyenne de la distribution est donn´ee par E(X) = kθ.
La variance de la distribution est donn´ee par Var(X) =kθ2.
La distribution est asym´etrique. L’asym´etrie est donn´ee par2/√
k. Donc, l’asym´etrie diminue avecket la distribution commence `a ressembler `a une loi normale pourk >10.
Je vous conseille de lire le code pour la loi uniforme qui commence `a la page
50 du chapitre 2 des notes de cours sur la th´eorie des probabilit´es. C’est un exer- cice tr`es semblable `a ce que je vous demande de faire.
1. Produisez un graphique de la densit´e pour k = 1, θ = 2.0et (sur le mˆeme graphique) pourk= 3, θ= 2.0.
2. Avec k = 2, θ = 2, g´en´erez 10 000 moyennes ´echantillonnales pour des
´echantillons de taille n, ou n = 1,2,10,50,100. Utilisez la commande rgamma(n,2,scale= 2).
3. Dans chaque cas, construisez les moyennes ´echantillonnales normalis´ees, en soustrayant la moyenne th´eorique (voir ci-dessus) et en divisant par la racine carr´ee de la variance th´eorique de la moyenne ´echantillonale (voir ci-dessus).
4. Ayant construit les moyennes ´echantillonnales normalis´ees, v´erifiez que (pour chaque valeur de n) les 10 000 observations que vous avez g´en´er´ees ont une moyenne pr`es de z´ero et une variance pr`es de un.
5. Ayant construit les moyennes ´echantillonnales normalis´ees, produisez un histogramme des 10 000 valeurs, pour chaque valeur den(1, 2, 10, 50, 100).
Sur le mˆeme graphique, avec la commandednorm, tracez un graphique de la fonction de densit´e de la loi normale centr´ee r´eduite. Voir le lien suivant pour des indices.
http://www.statmethods.net/graphs/density.html 6. Commentez ce que vous trouvez.
7. Mˆeme si nous l’avons pas vu en classe, pour chaque valeur denappliquez le test de normalit´e Jarque-Bera aux 10 000 valeurs que vous avez g´en´er´ees.
La commande estjarque.bera.test(x) o`uxest le vecteur d’obser- vations. La commande fait partie de la library tseries. Si ce n’est pas encore install´e, il faut l’installer et ensuite la charger en m´emoire.
8. Trouvez lap-value du test pour chacune des valeurs den.
cr´e´e le 13/09/2013