Licence SVT 2 eme ` ann´ ee Probabilit´ es & Statistiques
T. D. n V I . Suite tests d’hypoth` ese
Exercice n ° 1.
Une nouvelle technique de dosage de sels nutritifs vient d’ˆ etre mise au point. Sept dosages, effectu´ es ` a l’aide de cette nouvelle technique, ` a partir d’´ echantillons d’eau de mer de la mˆ eme station, donnent les r´ esultats suivants :
1.17, 1.16, 1.16, 1.19, 1.19, 1.21, 1.18 mg/l.
1. La technique utilis´ ee jusque l` a ´ etait caract´ eris´ ee par un ´ ecart-type de 0.05 mg/l. Peut-on dire que la nouvelle technique est plus pr´ ecise que l’ancienne?
2. D´ eterminer un intervalle de confiance de la moyenne µ.
Exercice n°2.
On consid` ere deux variables al´ eatoires r´ eelles R et S de densit´ es de probabilit´ e donn´ ees par : f R (r) = ae −ar , r > 0, 0 sinon,
et
f S (s) = be −bs , s > 0, 0 sinon.
On veut construire des test concernants les param` etres a > 0 et b > 0 de ces deux distributions en construisant des variables al´ eatoires de densit´ e connue.
1. Montrer que la variable al´ eatoire T = 2aR suit une loi du χ 2 2 . En d´ eduire esp´ erance et variance de R.
2. Soit un ´ echantillon {R 1 , . . . , R n } i.i.d. de R. Soit la variable Z n = 2a (R 1 + . . . + R n ). Donner sa loi.
3. Soit un autre ´ echantillon i.i.d. {S 1 , . . . , S p } de S. Soit la variable U (n, p) = pa(R nb(S1+...+R
n)
1
+...+S
p) . Donner la loi de U (n, p).
4. Premier test. Soit n = 12. On a observ´ e :
0.1, 1.197, 0.152, 0.182, 0.418, 0.192, 0.029, 0.885, 0.161, 0.633, 0.278, 0.008.
Construire un test d’hypoth` ese H 0 : a = 3 contre H 1 : a > 3. Donner le r´ esultat du test.
5. Second test. Soit p = 10. On a observ´ e :
0.361, 0.085, 0.293, 0.08, 0.077, 0.02, 0.036, 0.095, 0.197, 0.206.
Construire un test d’hypoth` ese H 0 : a = b contre H 1 : a 6= b. Donner le r´ esultat du test.
6. Estimation. En cas de rejet de l’hypoth` ese a = b, d´ eterminer un intervalle de confiance de b et donner une
estimation de b.
0 5 10 15 20 0.00
0.02 0.04 0.06 0.08 0.10 0.12 0.14
z χ
62RH
0RH
0P ( Z ≤ z
6;α) = α
●
z
6;α●
E ( Z ) = 6
Figure 1: Distribution du χ 2 6 et zone de rejet pour α = 0.05 Corrections
Correction Exercice n°1.
Q1- Dans cet exercice, il n’y a aucune indication sur la connaissance de param` etres populationnels. Nous travaillerons avec la r´ ealisation d’un ´ echantillon de n = 7 variables al´ eatoires {X 1, , · · · , X n } que nous supposerons i.i.d. et de mˆ eme loi m` ere d’une variable X N µ, σ 2
. Nous allons donc commencer par estimer l’esp´ erance et la variance de la population grˆ ace aux estimateurs empiriques
X = 1 n
n
X
i=1
X i ,
S n−1 2 = 1 n − 1
n
X
i=1
X i − X 2
.
Les valeurs r´ ealis´ ees de ces estimateurs nous donne x obs = 1.18 et 6 × s 2 6 = 0.002. Posons σ 0 2 = 0.05 2 . On va maintenant construire un test pour confronter l’hypoth` ese nulle H 0 : σ 2 = σ 2 0 contre l’alternative H 1 : σ 2 < σ 2 0 (l’´ enonc´ e nous dit “plus pr´ ecis”). Sous H 0 , la variable
Z = (n − 1) S n−1 2
σ 0 2 = 6S 6 2 σ 2 0 χ 2 6
suit une loi du Chi2 ` a 6 degr´ es de libert´ e. Sous H 1 , le protocole ´ etant plus pr´ ecis, les valeurs de l’´ echantillon devraient ˆ etre peu dispers´ ees : Z aura tendance ` a prendre des valeurs plus petites que sous H 0 . Nous avons donc affaire ` a un test unilat´ eral avec zone de rejet ` a gauche (Fig. 1).
Fixons α = 0.05, le risque de rejeter ` a tort l’hypoth` ese nulle, risque que l’on fixe petit. La valeur z n−1;α = z 6;0.05 = 1.635 repr´ esente le quantile d’ordre α de la loi du χ 2 6 . La zone rouge de la figure 1 repr´ esente la zone de rejet de H 0
RH 0 = [0; 1.635[
L’´ echantillon nous donne s 2 6 = 0.002 6 soit une valeur
z obs = 0.002 0.0025 = 0.8
sous H 0 . On observe que z obs < 1.635 et donc z obs ∈ RH 0 . On en d´ eduit donc, qu’avec une probabilit´ e de
0.95, le nouveau protocole exp´ erimental est plus pr´ ecis que celui d’avant. On peut ´ egalement calculer la valeur
α obs = P (Z ≤ z obs ) = 0.008, (appel´ ee p-value) , tr` es faible dans ce cas.
Q2- L’intervalle de confiance de l’esp´ erance est la fois d´ ependant de l’estimation de la moyenne de la population mais ´ egalement de celui de l’´ ecart-type en utilisant un ´ echantillon de faible effectif. On cumule donc deux sources de variabilit´ e li´ ees aux estimations des deux param` etres populationnels. On va s’int´ eresser ` a la variable
T = X − µ q S2n−1
n
= X − µ q Sn2
n−1
= X − µ q S26
7
T 6
qui suit une loi de Student ` a 6 degr´ es de libert´ e.
On connait l’IC 1−α lorsque la moyenne et la variance populationnelle sont inconnus
IC 1−α =
X − s
S n−1 2
n t n−1;1−α/2 ; X − s
S 2 n−1
n t n−1;α/2
.
Avec α = 0.05, la valeur observ´ ee de X et les quantiles de la loi de Student ` a n − 1 = 6 degr´ es de libert´ e, on obtient
IC 0.95 =
"
1.18 −
r 0.002
6 × 7 × 2.447; 1.18 +
r 0.002
6 × 7 × 2.447
#
= [1.163; 1.197] .
Avec une probabilit´ e de 0.95, sachant l’´ ecart-type de la population inconnu et estim´ e avec un ´ echantillon de petite taille, la moyenne de la population se situe dans l’intervalle [1.163 1.197].
Correction Exercice n ° 2.
Q1-Soit X une variable al´ eatoire suivant une loi du χ 2 k ` a k degr´ es de libert´ e. Sa densit´ e est donn´ ee par f X (x) = 1
2
k2Γ k 2 x
k2−1 exp
− x 2
, x ≥ 0, o` u
Γ (z) = ˆ +∞
0
t z−1 exp (−t) dt
s’appelle la fonction Gamma. Soit T = 2aR une variable al´ eatoire. Pour trouver sa densit´ e, on va d’abord chercher l’expression de sa fonction de r´ epartition (FR)
F T (t) = P (T ≤ t)
= P (2aR ≤ t)
= P(R ≤ t 2a )
= F R
t 2a
.
La FR de T est donc reli´ ee ` a celle de R. La densit´ e de T est donn´ ee par la d´ eriv´ ee de sa FR f T (t) = d F T
d t (t) .
Or, R est une variable al´ eatoire qui suit une loi exponentielle de param` etre a (on notera R E (a)), on connait (ou on calcule ais´ ement) sa FR que l’on peut ´ evaluer en 2a t avec
F R t
2a
= 1 − exp
−a × t 2a
, t ≥ 0.
La d´ eriv´ ee de cette fonction nous donne la densit´ e de T f T (t) = 1
2 exp
− t 2
, t ≥ 0.
On reconnait ici une loi exponentielle de param` etre 1 2 donc T E 1 2
. Or, une variable X qui suit une loi du χ 2 2
`
a pour densit´ e
f X (x) = 1 2Γ (1) exp
− x 2
, x ≥ 0.
On peut montrer facilement que Γ (1) = 1 avec Γ (1) =
ˆ +∞
0
e −t dt =
−e −t +∞
0 = 1,
et on en d´ eduit que la densit´ e d’une loi du χ 2 2 est la mˆ eme que celle d’une loi E 1 2 donc T = 2aR χ 2 2 = E
1 2
. L’esp´ erance et la variance d’une loi χ 2 n sont donn´ ees par
E (T ) = n V (T ) = 2n.
Dans notre cas, n = 2, donc
E (T ) = 2 V (T ) = 4.
On peut alors calculer l’esp´ erance et la variance de R grˆ ace au fait que E (T ) = E (2aR) = 2 V (T ) = V (2aR) = 4.
Les propri´ et´ es de lin´ earit´ e de l’esp´ erance, les propri´ et´ es de la variance nous am` ene ` a 2aE (R) = 2
4a 2 V (R) = 4, on en d´ eduit ainsi que
E (R) = 1 a , V (R) = 1
a 2 ,
r´ esultats bien connus d’une variable qui suit une loi exponentielle de param` etre a.
Q2- Nous consid´ erons maintenant la variable Z n = 2a (R 1 + . . . + R n ). On sait que les variables R i sont ind´ ependantes. On peut r´ e´ ecrire Z n = T 1 + · · · + T n , somme de n variables al´ eatoires ind´ ependantes de mˆ eme loi que la variable T . Or on sait qu’une variable al´ eatoire, somme de deux lois du χ 2 ind´ ependantes, suit ´ egalement une loi du χ 2 telle que
χ 2 n + χ 2 p χ 2 n+p .
La variable Z est une somme de n variables du χ 2 2 . On en d´ eduit donc que Z n χ 2 2n .
Q3- On consid` ere maintenant la variable
U (n, p) = pa (R 1 + . . . + R n )
nb (S 1 + . . . + S p ) .
0 10 20 30 40 50 60 0.00
0.01 0.02 0.03 0.04 0.05 0.06
z
12χ
242RH
0RH
0P ( Z
12≤ z
24;α) = α
●
z
24;α●
E ( Z
12) = 24
Figure 2: Distribution d’un χ 2 24 et test unilat´ eral.
On d´ eduit des premi` eres questions que
Y = 2bS χ 2 2 et que la variable W p = 2b (S 1 + . . . + S p ) est telle que
W p χ 2 2p .
La variable U (n, p) correspond donc ` a un rapport de deux variables al´ eatoires qui suivent une loi du χ 2 : U (n, p) = 2p × 2a (R 1 + . . . + R n )
2n × 2b (S 1 + . . . + S p ) = 2pZ n
2nW p
.
La densit´ e d’une telle variable al´ eatoire est connue sous le nom de loi de Fisher-Snedecor de param` etres (2n, 2p) et on note
U (n, p) F (2n, 2p) .
Q4- On a observ´ e n = 12 valeurs de l’´ echantillon {R 1 , . . . , R n }. On souhaite savoir si cet ´ echantillon provient d’une loi exponentielle de param` etre a 0 = 3. Pour cela, on construit un test statistique pour confronter l’hypoth` ese nulle H 0 : a = a 0 ` a l’alternative H 1 : a > a 0 . On s’int´ eresse naturellement ` a la statistique de test Z 12 = 2a 0 (R 1 + . . . + R 12 ). Sous H 0 , Z 12 χ 2 24 . Sous H 1 , l’´ echantillon ne provient pas d’une loi exponentielle de param` etre a = a 0 mais de param` etre, disons, a = a 1 . La variable Z 12 ne suit plus la mˆ eme distribution mais on peut ´ ecrire
Z 12 = a 0
a 1
× 2a 1 (R 1 + . . . + R 12 ) = a 0
a 1
Z 12 0
o` u Z 12 0 χ 2 24 d’apr` es les r´ esultats pr´ ec´ edents. On voit que si a 1 augmente, Z 12 prendra probablement des valeurs inf´ erieures ` a celles obtenues sous H 0 . Le test est donc unilat´ eral avec zone de rejet ` a gauche (Fig. 2).
Fixons α = 0.05, le risque de rejeter ` a tort l’hypoth` ese nulle, risque que l’on fixe petit. La zone de rejet de H 0 est alors ´ egale ` a :
RH 0 = [0; 13.85[
o` u la valeur z 2n;α = z 24;0.05 = 13.85 repr´ esente le quantile d’ordre α de la loi du χ 2 24 . Cette valeur correspond ` a une probabilit´ e de 0.95 de trouver une valeur de Z dans la zone de non-rejet de H 0 si l’´ echantillon provient d’une population sous H 0 : a = a 0
P (Z 12 ≥ z 24;α ) = P Z 12 ∈ RH 0 /H 0
= 1 − α.
L’´ echantillon nous donne r 1 + . . . + r 12 = 4.235 soit une valeur z obs = 2 × 3 × 4.235 = 25.41, sous H 0 . On observe
que z obs ∈ RH 0 . On peut ´ egalement calculer la valeur α obs = P (Z 12 ≤ z obs ) = 0.616, ce qui est ´ elev´ e. On en
0 1 2 3 4 0.0
0.2 0.4 0.6 0.8 1.0
u
(
12, 10)
F
(
24, 20)
RH0
RH0 RH0
P
(
U≤uα2(
12, 10))
=α2P
(
U(
12, 10)
≥u1−α2(
12, 10))
= α2●
uα2
(
12, 10)
●
u1−α2