M1 Oc´ eanographie 1 eme ` ann´ ee Mise ` a niveau - Probabilit´ es & Statistiques Examen de premi` ere session - dur´ ee 2h
Sans document - Avec calculatrice Exercice n ° 1.
Soit X une variable al´ eatoire r´ eelle de loi uniforme telle que f X (x) =
( 1
θ si 0 ≤ x ≤ θ
0 sinon,
o` u θ > 0 est un param` etre inconnu. Pour la suite, on suppose que l’on dispose d’un ´ echantillon i.i.d. de taille n not´ e {X 1 , · · · , X n } de mˆ eme loi que X. L’objectif de l’exercice est de construire un estimateur de θ.
1. Tracer la densit´ e de X et donner sa fonction de r´ epartition F X (x). Donner graphiquement E (X).
2. Soit
Z n = max {X 1 , · · · , X n }
un estimateur de θ. En partant de F Zn(z) = P (Z n ≤ z) et sachant que si Z n est inf´ erieur ` a une valeur z, alors les variables X i le sont ´ egalement (Z n est un maximum), montrer que sa densit´ e est donn´ ee par
f Zn(z) =
( n zn−1θ
n si 0 ≤ z ≤ θ 0 sinon.
3. Calculer E (Z n ) et V (Z n ). Etudier le biais et la variance de cet estimateur. Etes-vous satisfait?
Exercice n ° 2.
Vous ˆ etes sur la paillasse et vous utilisez un instrument de mesure qui vous permet de doser les nitrates dans un
´ echantillon d’eau de pluie. Vous pensez que l’ozone troposph´ erique, en quantit´ e importante dans l’air de Marseille, se dilue dans l’eau quand il pleut. Soit X la concentration en nitrates (µg/l), vous faites n = 6 mesures dans des conditions similaires et vous obtenez
102.94 103.75 103.89 96.17 102.94 112.08.
1. Vous vous penchez ` a l’arri` ere de votre appareil et vous lisez que la variance des mesures est de σ 0 2 = 25.
Montrez qu’il n’y a pas de raison de remettre en doute la calibration de la machine. Que repr´ esente la figure 1.?
2. Donner un intervalle de confiance ` a 95% de la variance de l’appareil.
3. On dira que l’eau est pollu´ ee si la concentration moyenne en nitrates est sup´ erieure ` a µ = µ 0 = 100 µg/l.
Construire un test pour votre ´ echantillon : (a) lorsque σ 2 = σ 2 0
(b) lorsque vous estimez σ 2 avec vos mesures.
4. Expliquer les diff´ erences de vos r´ esultats en appuyant votre argumentaire sur la figure 2.
On donne χ 2 5;0.025 = 0.83, χ 2 5;0.05 = 1.145, χ 2 5;0.95 = 11.07, χ 2 5;0.975 = 12.83, t 5;0.05 = −2.01, t 5;0.01 = −3.36,
z 0.05 = −1.64, z 0.01 = −2.32.
0 5 10 15 20 0.00
0.05 0.10 0.15
z χ52
●
χ5;α2 2
●
χ5;1−α2 2
Figure 1:
−6 −4 −2 0 2 4 6
0.00.10.20.30.4
x
Figure 2:
Correction exercice n ° 1.
1. Le trac´ e de la densit´ e de X est celui de la loi uniforme entre 0 et θ. Il s’agit d’un segment horizontal entre 0 et θ, de hauteur 1 θ . La fonction de r´ epartition de X est donn´ ee par
F X (x) =
0 si x < 0
1
θ x si 0 ≤ x < θ 1 sinon.
Elle est obtenu par simple primitive de la densit´ e. Graphiquement, E (X) correspond au centre de gravit´ e de la densit´ e soit E (X) = θ 2 .
2. On a
P (Z n ≤ z) = P (X 1 ≤ z ∩ · · · ∩ X n ≤ z) =
n
Y
i=1
P (X i ≤ z) du fait de l’ind´ ependance des X i . On en d´ eduit que :
P (Z n ≤ z) =
n
Y
i=1
F X (z) = F X n (z) du fait que les X i ont la mˆ eme loi que X. Finalement :
F Zn(z) =
0 si z < 0
1
θ
nz n si 0 ≤ z < θ
1 sinon.
On en d´ eduit la densit´ e f Zn(z) = dF dxZn (x) :
(x) :
f Zn(z) =
0 si z < 0
n
θ
nz n−1 si 0 ≤ z < θ
0 sinon.
3. Calcul de l’esp´ erance et de la variance de Z n : E (Z n ) =
ˆ
R
zf Zn(z) dz
= n θ n
ˆ θ
0
z × z n−1 dz
= n θ n
1 n + 1 z n+1
θ 0
= n
n + 1 θ.
L’estimateur Z n est asymptotiquement sans biais. Le calcul de la variance est le suivant : V (Z n ) = E Z n 2
− E 2 (Z n )
= n θ n
ˆ θ
0
z 2 × z n−1 dz − n
n + 1 θ 2
= n θ n
1 n + 2 z n+2
θ 0
− n
n + 1 θ 2
= n
n + 2 θ 2 − n 2 (n + 1) 2 θ 2
= n
(n + 2) (n + 1) 2 θ 2 .
On voit facilement que
n→+∞ lim V (Z n ) = 0
car le d´ enominateur est un polynˆ ome en n de degr´ e plus grand que le num´ erateur. L’estimateur Z n est asymptotiquement sans biais et convergent. On est satisfait.
Correction exercice n ° 2.
1. On suppose que X N µ, σ 2
, les param` etres de la gaussienne ´ etant inconnus. On suppose l’´ echantillon {X 1 , · · · , X 6 } i.i.d et de mˆ eme loi m` ere que X. On utilise les estimateurs classiques : pour estimer la moyenne populationnelle µ, on utilise la moyenne empirique X = n 1 P n
i=1 X i et pour estimer la variance σ 2 , l’estimateur sans biais S 2 n−1 = n−1 1 P
i X i − X 2
, avec n = 6. On sait que la variable Z = (n − 1) S n−1 2
σ 2 χ 2 n−1 .
On veut tester l’hypoth` ese H 0 : σ 2 = σ 0 2 contre l’alternative H 1 : σ 2 6= σ 0 2 avec σ 0 2 = 25 µg/l. Sous H 0 , la variable
Z = 5 × S 5 2
σ 0 2 χ 2 5 ,
c’est ce que repr´ esente la figure 1. Sous H 1 , la variable S 5 2 et donc Z prendront des valeurs plus petites ou plus grandes puisque la machine serait mal calibr´ ee. On est amen´ e ` a construire un test bilat´ eral avec zone de rejet ` a gauche et ` a droite, mat´ erialis´ ees sur la figure 1. par les zones en griset. Fixons le niveau du test ` a α = 0.05. Les bornes de rejet du test sont donn´ ees par le quantile d’ordre α/2 du χ 2 5 , c’est ` a dire χ 2 5;0.025 = 0.83 et par le quantile d’ordre 1 − α/2 soit χ 2 5;0.975 = 12.83. La zone de non-rejet de H 0 est donc donn´ ee par
RH 0 = [0.83; 12.83].
On a observ´ e les valeurs x obs = 103.63 µg/l, s 2 obs = 128 5 mg 2 /l 2 et on en d´ eduit χ 2 obs = 128 25 = 5.12. On constate que χ 2 obs ∈ RH 0 : l’hypoth` ese H 0 n’est pas rejet´ ee. Avec une probabilit´ e de 0.95, il n’y a pas de raison de consid´ erer que la machine est mal calibr´ ee.
2. On sait que Z χ 2 5 . On peut calculer la probabilit´ e que Z soit comprise entre deux quantiles d’ordre fix´ e : P
χ 2 5;α/2 ≤ Z ≤ χ 2 5;1−α/2
= 1 − α.
Si on fixe le risque α = 0.05, on obtient χ 2 5;0.025 = 0.83 et χ 2 5;0.975 = 12.83. L’IC 0.95 est donc le suivant 0.83 ≤ 5S 5 2
σ 2 ≤ 12.83 5S 5 2
12.83 ≤ σ 2 ≤ 5S 5 2 0.83 .
Les bornes de cet intervalle sont al´ eatoires et d´ ependent de la valeur prise par S 5 2 . On a observ´ e s 2 obs = 128 5 et donc
9.98 = 128
12.83 ≤ σ 2 ≤ 128
0.83 = 154.22.
Il y a donc 95 % de chance d’avoir un ´ ecart-type de la population compris entre ces deux valeurs. Ces r´ esultats sont compatibles avec ceux de la question 1.
3. On veut ici tester une hypoth` ese sur la moyenne de la population dans deux cas.
(a) Consid´ erons le premier cas : celui o` u la variance de la population est connue et telle que σ 0 2 = 25.
On souhaite tester l’hypoth` ese H 0 : µ = µ 0 contre l’alternative H 1 : µ > µ 0 . Si l’on suppose que les X i sont gaussiennes d’esp´ erance µ et de variance σ 0 2 , alors la moyenne X N µ, σ 2 0 /n
et sa version centr´ ee-r´ eduite :
Z = X − µ
σ
0√
n
. N (0, 1) .
Sous H 0 , X N µ = µ 0 , σ 0 2 /n
. Sous H 1 , l’eau est plus pollu´ ee, les valeurs de X seront plus ´ elev´ ees que sous H 0 , celles de Z ´ egalement. Il s’agit donc d’effectuer un test gaussien unilat´ eral avec zone de rejet ` a droite. Fixons α = 0.05. La zone de rejet de H 0 est donn´ ee par RH 0 = ]z 1−α ; +∞[ o` u z 1−α = z 0.95 = −z 0.05 = 1.64 par sym´ etrie de la gaussienne. On a observ´ e
z obs = x − µ 0
σ
0√
n
= 103.63 − 100
√