Exercices Probabilit´ es & Statistiques
T. D. n V II. R´ evision tests d’hypoth` ese
Exercice n ° 1.
Une technique de dosage de sels nutritifs permet de fabriquer des ´ echantillons calibr´ es d’eau de mer avec un
´ ecart-type de 8 mg/l . Un nouveau proc´ ed´ e de fabrication sera adopt´ e s’il assure une r´ eduction substantielle de la variabilit´ e. Dix mesures sont r´ ealis´ ees sur des ´ echantillons fabriqu´ es avec la nouvelle m´ ethode :
725, 722, 727, 718, 723, , 731 , 719, 724, 726, 725 mg/l.
1. Peut-on adopter la nouvelle technique?
2. D´ eterminer un intervalle de confiance de la variance.
Exercice n°2.
On a doser des m´ etaux lourds sur des ´ echantillons de poissons. On souhaite ici comparer deux ´ echantillons de taille variable et provenant de deux sites A et B. Les r´ esultats (µg/g) sont les suivants :
n x obs s 2 obs A 11 3.92 0.3443 B 9 4.18 0.4760
1. Peut-on affirmer qu’il y a une diff´ erence entre les variances des deux sites?.
2. Peut-on conclure ` a une diff´ erence de contamination entre les sites?
3. Donner une estimation par intervalle de confiance de la moyenne pour chaque site.
1
Corrections
Les valeurs num´ eriques des quantiles sont d´ etermin´ ees ` a l’aide du logiciel R en utilisant les fonctions :
qt(p,df ): renvoie le quantile d’ordre p d’une loi de Student avec df degr´ es de libert´ e
qf(p,df 1,df 2): renvoie le quantile d’ordre p d’une loi de Fisher avec (df1, df2) degr´ es de libert´ e
qchisq(p,df ): renvoie le quantile d’ordre p d’une loi du χ 2 avec df degr´ es de libert´ e
qnorm(p,mu,sigma): renvoie le quantile d’ordre p d’une loi N de moyenne mu et d’´ ecart-type sigma
Correction Exercice n°1.
Q1- Soit X la variable repr´ esentant les mesures (mg/l). On supposera que X N µ, σ 2
, les param` etres de la gaussienne ´ etant inconnus. On suppose l’´ echantillon {X 1 , · · · , X 10 } i.i.d et de mˆ eme loi m` ere que X. On utilise les estimateurs classiques : pour estimer la moyenne populationnelle µ, on utilise la moyenne empirique X = n 1 P n
i=1 X i et pour estimer la variance σ 2 , l’estimateur sans biais S n−1 2 = n−1 1 P
i X i − X 2
, avec n = 10.
On sait que la variable
Z = (n − 1) S n−1 2
σ 2 χ 2 n−1 .
On veut tester l’hypoth` ese H 0 : σ 2 = σ 2 0 contre l’alternative H 1 : σ 2 < σ 0 2 avec σ 2 0 = 8 2 mg/l. Sous H 0 , la variable
Z = 9S 9 2
σ 2 0 χ 2 9 .
Sous H 1 , la variable S 9 2 et donc Z prendront des valeurs plus petites puisque les valeurs des X i seront moins dispers´ ees (exp´ erience plus pr´ ecise). On est amen´ e ` a construire un test unilat´ eral avec zone de rejet ` a gauche.
Fixons le niveau du test ` a α = 0.05. La borne de rejet du test est donn´ ee par le quantile d’ordre α du χ 2 9 , c’est ` a dire z 9;0.05 = 3.325. La zone de rejet de H 0 est donc donn´ ee par
RH 0 = [0; 3.325[.
On a observ´ e les valeurs x obs = 724 mg/l, s 2 obs = 130 9 mg 2 /l 2 et on en d´ eduit z obs = 130 82 = 2.03. On constate que z obs ∈ RH 0 : l’hypoth` ese H 0 est rejet´ ee. Avec une probabilit´ e de 0.95, la nouvelle m´ ethode est donc meilleure que l’ancienne.
Q2- On sait que Z χ 2 9 . On peut calculer la probabilit´ e que Z soit comprise entre deux quantiles d’ordre fix´ e :
P z 9;α/2 ≤ Z ≤ z 9;1−α/2
= 1 − α.
Si on fixe le risque α = 0.05, on obtient z 9;0.025 = 2.70 et z 9;0.975 = 19.02. L’IC 0.95 est donc le suivant 2.70 ≤ 9S 9 2
σ 2 ≤ 19.02 9S 9 2
19.02 ≤ σ 2 ≤ 9S 9 2 2.70 .
Les bornes de cet intervalle sont al´ eatoires et d´ ependent de la valeur prise par S 9 2 . On a observ´ e s 2 obs = 130 9 et donc 6.83 = 130
19.02 ≤ σ 2 ≤ 130
2.70 = 48.14.
Il y a donc 95 % de chance d’avoir un ´ ecart-type compris entre ces deux valeurs.
Correction Exercice n ° 2.
Q1- On admet que les dosages sur chaque site sont les r´ ealisations d’une gaussienne N µ A , σ A 2
pour le site A et N µ B , σ B 2
pour le site B. On va tester l’hypoth` ese H 0 : σ 2 A = σ B 2 contre l’alternative H 1 : σ 2 A 6= σ 2 B . Il
2
s’agit donc ici d’un test bilat´ eral. Pour cela, on consid` ere les estimateurs sans biais S A 2 = n 1
A
−1
P
i X i − X A 2
et S B 2 = n 1
B
−1
P
j X j − X B
2
. La statistique de test sera une variable qui suit une loi de Fisher-Snedecor de param` etres (n A − 1, n B − 1) soit
Z = σ 2 B S 2 A
σ B 2 S B 2 F (n B − 1, n A − 1) . Sous H 0 , Z = S SA22
B
suit ´ egalement une loi F (n B − 1, n A − 1) car σ A 2 = σ 2 B . Sous H 1 , ce rapport prendra des valeurs plus grandes ou plus petites que sous H 0 . le test est bilat´ eral : la zone de rejet de H 0 se situe donc ` a droite et ` a gauche. Pour un niveau de test α, elle est de la forme
RH 0 = [0; f α/2 (n B − 1, n A − 1) [∪]f 1−α/2 (n B − 1, n A − 1) ; +∞[
o` u les valeurs seuils f α/2 (n B − 1, n A − 1) et f 1−α/2 (n B − 1, n A − 1) sont les quantiles d’ordre α/2 et 1 − α/2 de la distribution F (n B − 1, n A − 1). Dans notre cas, α = 0.05, f 0.025 (8, 10) = 0.233 et f 0.975 (8, 10) = 3.855. La zone de rejet de H 0 devient
RH 0 = [0; 0.233[∪]3.855; +∞[.
On a observ´ e
z obs = s 2 A
s 2 B = 0.3443
0.4760 = 1.38,
en supposant que les variances observ´ ees sont calcul´ ees dans leur version sans biais. On constate que z obs ∈ RH 0 , l’hypoth` ese nulle n’est pas rejet´ ee. L’hypoth` ese d’´ egalit´ e des variances est acceptable. Pour information, la valeur seuil observ´ ee est telle que
P (Z ≤ z obs ) = 0.38.
Q2- On vient de montrer que l’hypoth` ese σ A 2 = σ 2 B ´ etait acceptable. Dans ces conditions, un estimateur sans biais de la variance commune entre les deux s´ eries peut s’exprimer sous la forme
S 2 = (n A − 1) S A 2 + (n B − 1) S B 2 n A + n B − 2 . Dans ce cas, la variable
Z = X A − X B − (µ A − µ B ) r
S 2
1 n
A+ n 1
B
T n+p−2 .
On veut ici tester l’hypoth` ese H 0 : µ A = µ B contre l’alternative H 0 : µ A 6= µ B . C’est un test bilat´ eral. Sous H 0 , la variable Z suivra donc une loi de Student T n+p−2 . Sous H 1 ,celle-ci aura tendance ` a prendre des valeurs soient plus petites soient plus grande que sous H 0 . La zone de non-rejet de H 0 sera donc de la forme
RH 0 =
t nA+n
B−2;α/2 ; t n
A+n
B−2;1−α/2
o` u les seuils sont les quantiles d’ordre indiqu´ e pour un niveau de test α fix´ e. Dans notre cas, α = 0.05, et t 18;0.025 = −2.1, t 18;0.025 = 2.1, la loi ´ etant sym´ etrique, la zone de non-rejet devient
RH 0 = [−2.1; 2.1] . On a mesur´ e
s 2 obs = 10 × 0.3443 + 8 × 0.4760
18 = 0.403,
on en d´ eduit que sous H 0
z obs = x A − x B r
s 2 obs
1 n
A+ n 1
B