Examen de statistique

(1)

Sorbonne Université Année 2020/2021

L3 Deuxième semestre

Examen de statistique

Attention ! Le barème n’est donné qu’à titre indicatif. Il est susceptible d’être modifié.

Attention ! Une attention particulière sera portée à la rédaction des tests de conformité d’une moyenne et d’une variance, et des tests d’égalité de moyennes et de variances.

Exercice 1 : question de cours (3 pts).

1. (1 pt) Rappeler les définitions de la convergence en probabilité et de la convergence en moyenne quadratique.

2. (2 pts) Montrer que la convergence en moyenne quadratique implique la convergence en probabilité.

Exercice 2 : estimation (11 pts). SoitYune variable aléatoire suivant une loiΓ(2, 1), i.e de densité définie pour touty∈_Rpar

f_Y(y) =ye⁻^y1y≥0.

Soitθ >0, on considère la variable aléatoireX=Y+θ, i.e la densité deXest définie pour tout x∈_Rpar

f_X(x) = (x−θ)e⁻⁽^x⁻^θ⁾1x≥θ

Dans tout ce qui suit, on considère des variables aléatoires i.i.dX₁, . . . ,Xnde même loi queX.

1. (2 pts)Montrer queE[X] =2+θetV[X] =2.

2. (1 pts)A l’aide de la méthode des moments, en déduire un estimateur deθ. Est-il consistant ?

3. (2 pts)Montrer que l’estimateur des moments est asymtotiquement normal.

4. (2 pts)Soitα∈(0, 1), en déduire un intervalle de confiance asymptotique deθau niveau 1−α.

5. (2 pts)Calculer la fonction de répartition deY. En déduire que la fonction de répartition de Xest définie pour toutx∈_Rpar

F_X(x) =1−(x−θ+1)e^θ⁻^x 1x≥θ

6. (2 pts)On s’intéresse maintenant à l’estimateurX₍₁₎ =min_i=1,...,nX_i. Déduire de la question précédente que

√n

X₍₁₎−θ

_L

−−−−→

n→+_∞ R(1)

(2)

oùR(1)est la loi de Rayleigh de paramètre 1, i.e de densité définie pour toutx≥0 par fR(x) =xe⁻^x²².

Exercice 3 : tests (6 pts).On s’intéresse ici au niveau de satisfaction en entreprise de personnes issues de l’université, en fonction de leur sexe. Pour ce faire, on calcule pour chaque individu un score de satisfaction. On trouvera dans le tableau ci-dessous les scores obtenus.

Femmes Hommes

(x_j,1)₁_≤_j_≤₁₀ (x_j,2)₁_≤_j_≤₁₀ 8.26 8.41 9.13 9.57 9.42 9.13 9.28 8.84 9.28 10.00 8.84 8.55 7.97 6.52 7.39 10.00 9.57 8.99 9.13 8.70

n₁=10 n₂=10

Tab. 1:Scores de satisfaction en entreprise des hommes et des femmes.

On noterax_1,1,x_2,1, . . . ,x_10,1les scores obtenus pour les femmes etx_1,2,x_2,2, . . . ,x_10,2ceux des hommes. On supposera que les donnéesx_1,1,x_2,1, . . . ,x_10,1sont des réalisations indépendantes d’une variable aléatoire d’espéranceµ₁et de varianceσ₁²et quex_1,2,x_2,2, . . . ,x_10,2sont des réalisations indépendantes d’une variable aléatoire d’espéranceµ₂et de varianceσ₂².

1. (0.5 pts) Commenter le graphique suivant :

Femmes Hommes

6.57.07.58.08.59.09.510.0

Fig. 1:Boxplots des scores de satisfaction des femmes et des hommes

2. (1 pt) On effectue le test de Shapiro-Wilk sur chacune des séries de scores et on obtient les p-values respectives 0,67 et 0,32. Que pouvez-vous en conclure ?

(3)

3. (2 pts) Tester aux risques 5% l’hypothèse selon laquelle le score moyen des femmes et des hommes est le même. On précisera les hypothèses testées, la statistique de test et sa loi sousH₀, la zone de rejet et on conclura. Pour vous aider, le résultat donné par la fonction t.testdu logiciel R :

Two Sample t-test

data: Femmes and Hommes

t = -2.6994, df = 18, p-value = 0.01467

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

-1.5755663 -0.1964337 sample estimates:

mean of x mean of y 8.406 9.292

4. (2.5 pts)La mise en oeuvre, avec le logiciel R et la fonctionvar.test, du test de comparaison de variances de Fisher conduit au résultat suivant :

F test to compare two variances

data: Femmes and Hommes

F = 4.4514, num df = 9, denom df = 9, p-value = 0.03653

alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:

1.105659 17.921215 sample estimates:

ratio of variances 4.451376

Tester siσ₁²est égale àσ₂²au risque de 5%. Commenter le résultat obtenu.