Sorbonne Université Année 2020/2021
L3 Deuxième semestre
Examen de statistique
Attention ! Le barème n’est donné qu’à titre indicatif. Il est susceptible d’être modifié.
Attention ! Une attention particulière sera portée à la rédaction des tests de conformité d’une moyenne et d’une variance, et des tests d’égalité de moyennes et de variances.
Exercice 1 : question de cours (3 pts).
1. (1 pt) Rappeler les définitions de la convergence en probabilité et de la convergence en moyenne quadratique.
2. (2 pts) Montrer que la convergence en moyenne quadratique implique la convergence en probabilité.
Exercice 2 : estimation (11 pts). SoitYune variable aléatoire suivant une loiΓ(2, 1), i.e de densité définie pour touty∈Rpar
fY(y) =ye−y1y≥0.
Soitθ >0, on considère la variable aléatoireX=Y+θ, i.e la densité deXest définie pour tout x∈Rpar
fX(x) = (x−θ)e−(x−θ)1x≥θ
Dans tout ce qui suit, on considère des variables aléatoires i.i.dX1, . . . ,Xnde même loi queX.
1. (2 pts)Montrer queE[X] =2+θetV[X] =2.
2. (1 pts)A l’aide de la méthode des moments, en déduire un estimateur deθ. Est-il consistant ?
3. (2 pts)Montrer que l’estimateur des moments est asymtotiquement normal.
4. (2 pts)Soitα∈(0, 1), en déduire un intervalle de confiance asymptotique deθau niveau 1−α.
5. (2 pts)Calculer la fonction de répartition deY. En déduire que la fonction de répartition de Xest définie pour toutx∈Rpar
FX(x) =1−(x−θ+1)eθ−x 1x≥θ
6. (2 pts)On s’intéresse maintenant à l’estimateurX(1) =mini=1,...,nXi. Déduire de la question précédente que
√n
X(1)−θ
L
−−−−→
n→+∞ R(1)
oùR(1)est la loi de Rayleigh de paramètre 1, i.e de densité définie pour toutx≥0 par fR(x) =xe−x22.
Exercice 3 : tests (6 pts).On s’intéresse ici au niveau de satisfaction en entreprise de personnes issues de l’université, en fonction de leur sexe. Pour ce faire, on calcule pour chaque individu un score de satisfaction. On trouvera dans le tableau ci-dessous les scores obtenus.
Femmes Hommes
(xj,1)1≤j≤10 (xj,2)1≤j≤10 8.26 8.41 9.13 9.57 9.42 9.13 9.28 8.84 9.28 10.00 8.84 8.55 7.97 6.52 7.39 10.00 9.57 8.99 9.13 8.70
n1=10 n2=10
Tab. 1:Scores de satisfaction en entreprise des hommes et des femmes.
On noterax1,1,x2,1, . . . ,x10,1les scores obtenus pour les femmes etx1,2,x2,2, . . . ,x10,2ceux des hommes. On supposera que les donnéesx1,1,x2,1, . . . ,x10,1sont des réalisations indépendantes d’une variable aléatoire d’espéranceµ1et de varianceσ12et quex1,2,x2,2, . . . ,x10,2sont des réalisations indépendantes d’une variable aléatoire d’espéranceµ2et de varianceσ22.
1. (0.5 pts) Commenter le graphique suivant :
Femmes Hommes
6.57.07.58.08.59.09.510.0
Fig. 1:Boxplots des scores de satisfaction des femmes et des hommes
2. (1 pt) On effectue le test de Shapiro-Wilk sur chacune des séries de scores et on obtient les p-values respectives 0,67 et 0,32. Que pouvez-vous en conclure ?
3. (2 pts) Tester aux risques 5% l’hypothèse selon laquelle le score moyen des femmes et des hommes est le même. On précisera les hypothèses testées, la statistique de test et sa loi sousH0, la zone de rejet et on conclura. Pour vous aider, le résultat donné par la fonction t.testdu logiciel R :
Two Sample t-test
data: Femmes and Hommes
t = -2.6994, df = 18, p-value = 0.01467
alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:
-1.5755663 -0.1964337 sample estimates:
mean of x mean of y 8.406 9.292
4. (2.5 pts)La mise en oeuvre, avec le logiciel R et la fonctionvar.test, du test de comparaison de variances de Fisher conduit au résultat suivant :
F test to compare two variances
data: Femmes and Hommes
F = 4.4514, num df = 9, denom df = 9, p-value = 0.03653
alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:
1.105659 17.921215 sample estimates:
ratio of variances 4.451376
Tester siσ12est égale àσ22au risque de 5%. Commenter le résultat obtenu.