Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

(1)

ECO 4272: Introduction à l’économétrie Exercice 1

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion ´ Université du Québec Montréal

c 2014, Steve Ambler Automne 2014

Veuillez écrire lisiblement. Veuillez bien agraferles feuilles de votre tp en- semble avant de le remettre. Date de remise du tp : avant la fin du labo le 29 septembre. Je vais afficher les solutions tout de suite après la date de remise. Pour cette raison, les copies remises en retard ne seront pas acceptées. Vous êtes libres de travailler seul(e)s ou en groupe. J’encourage la collaboration – discuter avec les collègues est sans doute la meilleure façon d’apprendre. Par contre, le nombre maximal de membres par groupe ne peut dépasser 4 personnes. Veuillez remettre seulement une copie en notant clairement les noms et les codes permanents de tous les membres du groupe sur la première page.

En r´epondant `a toutes les questions du tp, expliquez ce que vous faites et montrezvotre travail.

1 Distributions de probabilit´e jointes (20 points)

Soit deux variables al´eatoiresX et Y.X peut prendre les valeurs{1,2,3,4}

etY peut prendre les valeurs{5,6,7}. Les probabilit´es jointes sont comme suit.

(2)

Pr(X = 1, Y = 5): 0.10 Pr(X = 1, Y = 6): 0.20 Pr(X = 1, Y = 7): 0.05 Pr(X = 2, Y = 5): 0.05 Pr(X = 2, Y = 6): 0.05 Pr(X = 2, Y = 7): 0.05 Pr(X = 3, Y = 5): 0.05 Pr(X = 3, Y = 6): 0.05 Pr(X = 3, Y = 7): 0.05 Pr(X = 4, Y = 5): --- Pr(X = 4, Y = 6): 0.10 Pr(X = 4, Y = 7): 0.05 R´epondez aux questions suivantes.

1. Trouvez la valeur qui manque.

2. Construisez un tableau (avec quatre colonnes pour les valeurs possibles de X et trois rangées pour les valeurs possibles de Y) qui donne ces proba- bilités jointes, et indiquez sur le même tableau les probabilitésmarginales pour chaque variable aléatoire individuelle.

3. Calculez l’espérance conditionnelle de X étant donné chaque valeur pos- sible pourY.

4. Calculez l’espérance conditionnelle de Y étant donné chaque valeur pos- sible pourX.

5. Calculez l’esp´erance non conditionnelle deX.

6. Calculez l’esp´erance non conditionnelle deY.

7. Est-ce que les deux variables aléatoires sont indépendantes ? Expliquez votre réponse.

2 Efficience (40 points)

Vous avez deux échantillons de données pour estimer l’espérance (moyenne) µ. Appelons les observations du premier échantillon X_i et les observations du deuxième échantillonY_iVous savez que

E(X_i) = E(Y_i) =µ

(3)

mais que

Var(X_i) =σ_X² et

Var(Y_i) =σ_Y²

où les deux variances ne sont pas forcément égales. Il y amobservations dans le premier échantillon etnobservations dans le deuxième.

1. Montrez que la moyenne échantillonnale des deux échantillons pondérée par le nombre relatif d’observations est un estimateur non biaisé pour µ.

L’estimateur est donn´e par

¯

µ≡ m m+n

X¯ + n m+n

Y .¯

2. Puisqu’on donne la même pondération à chaque observation individuelle, on pourrait appeler l’estimateurµ¯l’estimateur MCO deµ. Montrez en fait que c’est la solution au problème de minimisation suivant :

minµ¯ m

X

i=1

(X_i−µ)¯ ²+

n

X

i=1

(Y_i−µ)¯ ²

!

3. Calculez la variance de l’estimateur, donn´ee par Var(¯µ).

4. Maintenant, consid´erez un autre estimateurµ˜d´efini par

˜

µ≡aX¯ + (1−a) ¯Y ,

la moyenne pondérée des moyennes échantillonnales deX et deY, où0≤ a≤1est une constante arbitraire. Montrez queµ˜est toujours un estimateur non biaisé.

5. Calculez la variance deµ.˜

6. Trouvez la solution au probl`eme de minimisation suivante : mina Var(˜µ).

Notez qu’il faudra remplacerµ˜par sa d´efinition pour trouver la solution.

7. Expliquez de quoi d´epend le poidsadans la solution au probl`eme de minimisation.

8. On pourrait appeler cet estimateur l’estimateur MCP pour moindres carrés pondérés. Trouvez une condition pour queµ¯= ˜µ.

(4)

3 Th´eor`eme limite centrale (40 points)

Je vous demande d’analyser graphiquement le comportement de la moyenne

échantillonnale de variables aléatoiresγ(gamma). Il n’est pas important de connaˆıtre tous les détails concernant la distributionγ, mais pour ceux qui s’y intéressent . . .

La distribution est utilis´ee pour mod´eliser les temps d’attente entre

´ev´enements.

Pour une variable X ∼ Gamma(k, θ), la fonction de densit´e est donn´ee par

f(x;k, θ) = x^(k−1)e^(−x/θ) Γ(k)θ^k

pourkle nombre d’événements etθle nombre moyen d’événements par unité de temps et oùΓ(k)≡(k−1)!, où!est la notation pour la factorielle (il faut donc queksoit un nombre entier). La densité est définie pourx≥0.

Le paramètrek est appelé le paramètre de forme (shape en anglais).

Le paramètreθest appelé le paramètre d’échelle (scale en anglais).

La fonction de distribution cumul´ee est donn´ee par

F (x;k, θ) = Z x

0

f(u;k, θ)du= γ k,^x_θ Γ(k) , o`u la fonctionγ k,^x_θ

est lafonction gamma inférieure incomplète (voir Wikipédia pour une explication).

La moyenne de la distribution est donn´ee par E(X) = kθ.

La variance de la distribution est donn´ee par Var(X) =kθ².

La distribution est asymétrique. L’asymétrie est donnée par2/√

k. Donc, l’asymétrie diminue avecket la distribution commence à ressembler à une loi normale pourk >10.

Je vous conseille de lire le code pour la loi uniforme qui commence `a la page

(5)

50 du chapitre 2 des notes de cours sur la théorie des probabilités. C’est un exercice très semblable à ce que je vous demande de faire.

1. Produisez un graphique de la densit´e pour k = 1, θ = 2.0et (sur le mˆeme graphique) pourk= 3, θ= 2.0.

2. Avec k = 2, θ = 2, générez 10 000 moyennes échantillonnales pour des

´echantillons de taille n, ou n = 1,2,10,50,100. Utilisez la commande rgamma(n,2,scale= 2).

3. Dans chaque cas, construisez les moyennes échantillonnales normalisées, en soustrayant la moyenne théorique (voir ci-dessus) et en divisant par la racine carrée de la variance théorique de la moyenne échantillonale (voir ci-dessus).

4. Ayant construit les moyennes échantillonnales normalisées, vérifiez que (pour chaque valeur de n) les 10 000 observations que vous avez générées ont une moyenne près de zéro et une variance près de un.

5. Ayant construit les moyennes ´echantillonnales normalis´ees, produisez un histogramme des 10 000 valeurs, pour chaque valeur den(1, 2, 10, 50, 100).

Sur le même graphique, avec la commandednorm, tracez un graphique de la fonction de densité de la loi normale centrée réduite. Voir le lien suivant pour des indices.

http://www.statmethods.net/graphs/density.html 6. Commentez ce que vous trouvez.

7. Même si nous l’avons pas vu en classe, pour chaque valeur denappliquez le test de normalité Jarque-Bera aux 10 000 valeurs que vous avez générées.

La commande estjarque.bera.test(x) oùxest le vecteur d’observations. La commande fait partie de la library tseries. Si ce n’est pas encore installé, il faut l’installer et ensuite la charger en mémoire.

8. Trouvez lap-value du test pour chacune des valeurs den.

cr´e´e le 13/09/2013