• Aucun résultat trouvé

T. D. n V I . Suite tests d’hypoth` ese

N/A
N/A
Protected

Academic year: 2022

Partager "T. D. n V I . Suite tests d’hypoth` ese"

Copied!
7
0
0

Texte intégral

(1)

Licence SVT 2 eme ` ann´ ee Probabilit´ es & Statistiques

T. D. n V I . Suite tests d’hypoth` ese

Exercice n ° 1.

Une nouvelle technique de dosage de sels nutritifs vient d’ˆ etre mise au point. Sept dosages, effectu´ es ` a l’aide de cette nouvelle technique, ` a partir d’´ echantillons d’eau de mer de la mˆ eme station, donnent les r´ esultats suivants :

1.17, 1.16, 1.16, 1.19, 1.19, 1.21, 1.18 mg/l.

1. La technique utilis´ ee jusque l` a ´ etait caract´ eris´ ee par un ´ ecart-type de 0.05 mg/l. Peut-on dire que la nouvelle technique est plus pr´ ecise que l’ancienne?

2. D´ eterminer un intervalle de confiance de la moyenne µ.

Exercice n°2.

On consid` ere deux variables al´ eatoires r´ eelles R et S de densit´ es de probabilit´ e donn´ ees par : f R (r) = ae −ar , r > 0, 0 sinon,

et

f S (s) = be −bs , s > 0, 0 sinon.

On veut construire des test concernants les param` etres a > 0 et b > 0 de ces deux distributions en construisant des variables al´ eatoires de densit´ e connue.

1. Montrer que la variable al´ eatoire T = 2aR suit une loi du χ 2 2 . En d´ eduire esp´ erance et variance de R.

2. Soit un ´ echantillon {R 1 , . . . , R n } i.i.d. de R. Soit la variable Z n = 2a (R 1 + . . . + R n ). Donner sa loi.

3. Soit un autre ´ echantillon i.i.d. {S 1 , . . . , S p } de S. Soit la variable U (n, p) = pa(R nb(S

1

+...+R

n

)

1

+...+S

p

) . Donner la loi de U (n, p).

4. Premier test. Soit n = 12. On a observ´ e :

0.1, 1.197, 0.152, 0.182, 0.418, 0.192, 0.029, 0.885, 0.161, 0.633, 0.278, 0.008.

Construire un test d’hypoth` ese H 0 : a = 3 contre H 1 : a > 3. Donner le r´ esultat du test.

5. Second test. Soit p = 10. On a observ´ e :

0.361, 0.085, 0.293, 0.08, 0.077, 0.02, 0.036, 0.095, 0.197, 0.206.

Construire un test d’hypoth` ese H 0 : a = b contre H 1 : a 6= b. Donner le r´ esultat du test.

6. Estimation. En cas de rejet de l’hypoth` ese a = b, d´ eterminer un intervalle de confiance de b et donner une

estimation de b.

(2)

0 5 10 15 20 0.00

0.02 0.04 0.06 0.08 0.10 0.12 0.14

z χ

62

RH

0

RH

0

P ( Z ≤ z

6;α

) = α

z

6;α

E ( Z ) = 6

Figure 1: Distribution du χ 2 6 et zone de rejet pour α = 0.05 Corrections

Correction Exercice n°1.

Q1- Dans cet exercice, il n’y a aucune indication sur la connaissance de param` etres populationnels. Nous travaillerons avec la r´ ealisation d’un ´ echantillon de n = 7 variables al´ eatoires {X 1, , · · · , X n } que nous supposerons i.i.d. et de mˆ eme loi m` ere d’une variable X N µ, σ 2

. Nous allons donc commencer par estimer l’esp´ erance et la variance de la population grˆ ace aux estimateurs empiriques

X = 1 n

n

X

i=1

X i ,

S n−1 2 = 1 n − 1

n

X

i=1

X i − X 2

.

Les valeurs r´ ealis´ ees de ces estimateurs nous donne x obs = 1.18 et 6 × s 2 6 = 0.002. Posons σ 0 2 = 0.05 2 . On va maintenant construire un test pour confronter l’hypoth` ese nulle H 0 : σ 2 = σ 2 0 contre l’alternative H 1 : σ 2 < σ 2 0 (l’´ enonc´ e nous dit “plus pr´ ecis”). Sous H 0 , la variable

Z = (n − 1) S n−1 2

σ 0 2 = 6S 6 2 σ 2 0 χ 2 6

suit une loi du Chi2 ` a 6 degr´ es de libert´ e. Sous H 1 , le protocole ´ etant plus pr´ ecis, les valeurs de l’´ echantillon devraient ˆ etre peu dispers´ ees : Z aura tendance ` a prendre des valeurs plus petites que sous H 0 . Nous avons donc affaire ` a un test unilat´ eral avec zone de rejet ` a gauche (Fig. 1).

Fixons α = 0.05, le risque de rejeter ` a tort l’hypoth` ese nulle, risque que l’on fixe petit. La valeur z n−1;α = z 6;0.05 = 1.635 repr´ esente le quantile d’ordre α de la loi du χ 2 6 . La zone rouge de la figure 1 repr´ esente la zone de rejet de H 0

RH 0 = [0; 1.635[

L’´ echantillon nous donne s 2 6 = 0.002 6 soit une valeur

z obs = 0.002 0.0025 = 0.8

sous H 0 . On observe que z obs < 1.635 et donc z obs ∈ RH 0 . On en d´ eduit donc, qu’avec une probabilit´ e de

0.95, le nouveau protocole exp´ erimental est plus pr´ ecis que celui d’avant. On peut ´ egalement calculer la valeur

α obs = P (Z ≤ z obs ) = 0.008, (appel´ ee p-value) , tr` es faible dans ce cas.

(3)

Q2- L’intervalle de confiance de l’esp´ erance est la fois d´ ependant de l’estimation de la moyenne de la population mais ´ egalement de celui de l’´ ecart-type en utilisant un ´ echantillon de faible effectif. On cumule donc deux sources de variabilit´ e li´ ees aux estimations des deux param` etres populationnels. On va s’int´ eresser ` a la variable

T = X − µ q S

2n−1

n

= X − µ q S

n2

n−1

= X − µ q S

26

7

T 6

qui suit une loi de Student ` a 6 degr´ es de libert´ e.

On connait l’IC 1−α lorsque la moyenne et la variance populationnelle sont inconnus

IC 1−α =

X − s

S n−1 2

n t n−1;1−α/2 ; X − s

S 2 n−1

n t n−1;α/2

 .

Avec α = 0.05, la valeur observ´ ee de X et les quantiles de la loi de Student ` a n − 1 = 6 degr´ es de libert´ e, on obtient

IC 0.95 =

"

1.18 −

r 0.002

6 × 7 × 2.447; 1.18 +

r 0.002

6 × 7 × 2.447

#

= [1.163; 1.197] .

Avec une probabilit´ e de 0.95, sachant l’´ ecart-type de la population inconnu et estim´ e avec un ´ echantillon de petite taille, la moyenne de la population se situe dans l’intervalle [1.163 1.197].

Correction Exercice n ° 2.

Q1-Soit X une variable al´ eatoire suivant une loi du χ 2 k ` a k degr´ es de libert´ e. Sa densit´ e est donn´ ee par f X (x) = 1

2

k2

Γ k 2 x

k2

−1 exp

− x 2

, x ≥ 0, o` u

Γ (z) = ˆ +∞

0

t z−1 exp (−t) dt

s’appelle la fonction Gamma. Soit T = 2aR une variable al´ eatoire. Pour trouver sa densit´ e, on va d’abord chercher l’expression de sa fonction de r´ epartition (FR)

F T (t) = P (T ≤ t)

= P (2aR ≤ t)

= P(R ≤ t 2a )

= F R

t 2a

.

La FR de T est donc reli´ ee ` a celle de R. La densit´ e de T est donn´ ee par la d´ eriv´ ee de sa FR f T (t) = d F T

d t (t) .

Or, R est une variable al´ eatoire qui suit une loi exponentielle de param` etre a (on notera R E (a)), on connait (ou on calcule ais´ ement) sa FR que l’on peut ´ evaluer en 2a t avec

F R t

2a

= 1 − exp

−a × t 2a

, t ≥ 0.

La d´ eriv´ ee de cette fonction nous donne la densit´ e de T f T (t) = 1

2 exp

− t 2

, t ≥ 0.

(4)

On reconnait ici une loi exponentielle de param` etre 1 2 donc T E 1 2

. Or, une variable X qui suit une loi du χ 2 2

`

a pour densit´ e

f X (x) = 1 2Γ (1) exp

− x 2

, x ≥ 0.

On peut montrer facilement que Γ (1) = 1 avec Γ (1) =

ˆ +∞

0

e −t dt =

−e −t +∞

0 = 1,

et on en d´ eduit que la densit´ e d’une loi du χ 2 2 est la mˆ eme que celle d’une loi E 1 2 donc T = 2aR χ 2 2 = E

1 2

. L’esp´ erance et la variance d’une loi χ 2 n sont donn´ ees par

E (T ) = n V (T ) = 2n.

Dans notre cas, n = 2, donc

E (T ) = 2 V (T ) = 4.

On peut alors calculer l’esp´ erance et la variance de R grˆ ace au fait que E (T ) = E (2aR) = 2 V (T ) = V (2aR) = 4.

Les propri´ et´ es de lin´ earit´ e de l’esp´ erance, les propri´ et´ es de la variance nous am` ene ` a 2aE (R) = 2

4a 2 V (R) = 4, on en d´ eduit ainsi que

E (R) = 1 a , V (R) = 1

a 2 ,

r´ esultats bien connus d’une variable qui suit une loi exponentielle de param` etre a.

Q2- Nous consid´ erons maintenant la variable Z n = 2a (R 1 + . . . + R n ). On sait que les variables R i sont ind´ ependantes. On peut r´ e´ ecrire Z n = T 1 + · · · + T n , somme de n variables al´ eatoires ind´ ependantes de mˆ eme loi que la variable T . Or on sait qu’une variable al´ eatoire, somme de deux lois du χ 2 ind´ ependantes, suit ´ egalement une loi du χ 2 telle que

χ 2 n + χ 2 p χ 2 n+p .

La variable Z est une somme de n variables du χ 2 2 . On en d´ eduit donc que Z n χ 2 2n .

Q3- On consid` ere maintenant la variable

U (n, p) = pa (R 1 + . . . + R n )

nb (S 1 + . . . + S p ) .

(5)

0 10 20 30 40 50 60 0.00

0.01 0.02 0.03 0.04 0.05 0.06

z

12

χ

242

RH

0

RH

0

P ( Z

12

≤ z

24;α

) = α

z

24;α

E ( Z

12

) = 24

Figure 2: Distribution d’un χ 2 24 et test unilat´ eral.

On d´ eduit des premi` eres questions que

Y = 2bS χ 2 2 et que la variable W p = 2b (S 1 + . . . + S p ) est telle que

W p χ 2 2p .

La variable U (n, p) correspond donc ` a un rapport de deux variables al´ eatoires qui suivent une loi du χ 2 : U (n, p) = 2p × 2a (R 1 + . . . + R n )

2n × 2b (S 1 + . . . + S p ) = 2pZ n

2nW p

.

La densit´ e d’une telle variable al´ eatoire est connue sous le nom de loi de Fisher-Snedecor de param` etres (2n, 2p) et on note

U (n, p) F (2n, 2p) .

Q4- On a observ´ e n = 12 valeurs de l’´ echantillon {R 1 , . . . , R n }. On souhaite savoir si cet ´ echantillon provient d’une loi exponentielle de param` etre a 0 = 3. Pour cela, on construit un test statistique pour confronter l’hypoth` ese nulle H 0 : a = a 0 ` a l’alternative H 1 : a > a 0 . On s’int´ eresse naturellement ` a la statistique de test Z 12 = 2a 0 (R 1 + . . . + R 12 ). Sous H 0 , Z 12 χ 2 24 . Sous H 1 , l’´ echantillon ne provient pas d’une loi exponentielle de param` etre a = a 0 mais de param` etre, disons, a = a 1 . La variable Z 12 ne suit plus la mˆ eme distribution mais on peut ´ ecrire

Z 12 = a 0

a 1

× 2a 1 (R 1 + . . . + R 12 ) = a 0

a 1

Z 12 0

o` u Z 12 0 χ 2 24 d’apr` es les r´ esultats pr´ ec´ edents. On voit que si a 1 augmente, Z 12 prendra probablement des valeurs inf´ erieures ` a celles obtenues sous H 0 . Le test est donc unilat´ eral avec zone de rejet ` a gauche (Fig. 2).

Fixons α = 0.05, le risque de rejeter ` a tort l’hypoth` ese nulle, risque que l’on fixe petit. La zone de rejet de H 0 est alors ´ egale ` a :

RH 0 = [0; 13.85[

o` u la valeur z 2n;α = z 24;0.05 = 13.85 repr´ esente le quantile d’ordre α de la loi du χ 2 24 . Cette valeur correspond ` a une probabilit´ e de 0.95 de trouver une valeur de Z dans la zone de non-rejet de H 0 si l’´ echantillon provient d’une population sous H 0 : a = a 0

P (Z 12 ≥ z 24;α ) = P Z 12 ∈ RH 0 /H 0

= 1 − α.

L’´ echantillon nous donne r 1 + . . . + r 12 = 4.235 soit une valeur z obs = 2 × 3 × 4.235 = 25.41, sous H 0 . On observe

que z obs ∈ RH 0 . On peut ´ egalement calculer la valeur α obs = P (Z 12 ≤ z obs ) = 0.616, ce qui est ´ elev´ e. On en

(6)

0 1 2 3 4 0.0

0.2 0.4 0.6 0.8 1.0

u

(

12, 10

)

F

(

24, 20

)

RH0

RH0 RH0

P

(

U≤uα2

(

12, 10

))

=α2

P

(

U

(

12, 10

)

≥u1−α2

(

12, 10

))

= α2

uα2

(

12, 10

)

u1−α2

(

12, 10

)

Figure 3: Distribution de Fisher F (24, 10) et test bilat´ eral.

d´ eduit donc, qu’avec une probabilit´ e de 0.95, l’´ echantillon provient de n = 12 r´ ealisations ind´ ependantes d’une loi E (a = 3).

Q5- On dispose maintenant d’un ´ echantillon {R 1 , R 2 , ..., R 12 } de taille n = 12 et d’un ´ echantillon {S 1 , S 2 , · · · , S 10 } de taille p = 10, ind´ ependant du pr´ ec´ edent. On veut tester H 0 : a = b contre H 1 : a 6= b. Pour cela, on choisit la variable

U(12, 10) = 10a(R 1 + R 2 + ··· + R 12 ) 12b(S 1 + S 2 + ··· + S 10 ) . que l’on sait suivre une loi de Fisher F (24, 20).

Sous H 0 : 1 = a b , la variable

U 0 (12, 10) = 10(R 1 + R 2 + ··· + R 12 )

12(S 1 + S 2 + ··· + S 10 ) F (24, 20) . Sous H 1 : a 6= b, on peut ´ ecrire

U 0 (12, 10) = b10a(R 1 + R 2 + ··· + R 12 ) a12b(S 1 + S 2 + ··· + S 10 ) = b

a U (12, 10) .

Cette expression nous permet de voir que si a > b, les valeur de U 0 (12, 10) vont avoir tendance ` a baisser par rapport ` a H 0 : la zone de rejet sera ` a gauche. Dans le cas a < b, la zone de rejet de H 0 sera ` a droite. Nous avons affaire ` a un test bilat´ eral (Fig. 3).

Fixons α = 0.05, le risque de rejeter ` a tort l’hypoth` ese nulle, risque que l’on fixe petit. La zone de non-rejet de H 0 est alors ´ egale ` a :

RH 0 = [0.43; 2.407]

o` u la valeur u α/2 (12, 10) = f 0.025 (24, 20) = 0.43 repr´ esente le quantile d’ordre α/2 de la loi de Fisher F (24, 20)et u 1−α/2 (12, 10) = f 0.975 (24, 20) = 2.407 repr´ esente le quantile d’ordre 1 − α/2. L’´ echantillon nous donne

u obs = 10 × 4.235

12 × 1.45 ' 2.434,

on voit imm´ ediatement que u obs ∈ RH 0 . On en d´ eduit donc, qu’avec une probabilit´ e de 0.95, que les deux

´ echantillons ne proviennent pas de la mˆ eme loi exponentielle. Cependant, la valeur seuil

α obs = P (U (12, 10) ≥ u obs ) = 0.0236

(7)

est tr` es proche de 0.025 car u obs est proche du seuil f 0.975 (24, 20) = 2.407. Si le test est significatif, une petite modification de l’´ echantillon m` enerait probablement ` a des r´ esultats diff´ erents.

Q6- Pour construire un intervalle de confiance de b, nous allons consid´ erer la variable al´ eatoire W 20 = 2b(S 1 + S 2 + · · · + S 10 ) = 20bS

qui suit une loi du χ 2 20 , o` u S est la moyenne empirique des S i . On peut alors calculer la probabilit´ e suivante P w 20;α/2 ≤ W 20 ≤ w 20;1−α/2

= 1 − α P

w 20;α/2

20S ≤ b ≤ w 20;1−α/2 20S

= 1 − α.

On a observ´ e s obs = 0.145 et pour un coefficient de s´ ecurit´ e de 0.95, on a w 20;0,025 = 9.59 et w 20;0,975 = 34.17.

D’o` u, l’intervalle de confiance

3.307 ≤ b ≤ 11.78.

On sait que E (S) = 1 b . Un bon estimateur de l’esp´ erance de S est donn´ e par S. C’est un estimateur sans biais E S

= E (S)

et consistant : la limite lorsque p → +∞ de V S

= 1 p V (S) est nulle. On peut donc en d´ eduire une estimation b obs de b avec

b obs = 1

s obs = 1

0.145 = 6.89.

Références

Documents relatifs

Equivalence et pr´ epond´ erance.

Dans un polynˆ ome de Taylor (´ ecrit dans le bon sens !), chaque terme (non nul) est pr´ epond´ erant devant

Equivalence et pr´ epond´ erance.

G´ erer les conflits entre dominants:. Ici x est un r´ eel tendant vers

G´ erer les conflits entre dominants:. Ici x est un r´ eel tendant vers

c’est appliquer la tactique R´ e´ ecrire de fa¸con intelligente jusqu’` a obtenir une forme que tout le monde est d’accord pour trouver optimale. On peut donner un sens pr´ ecis `

Le condensateur peut donc être assimilé à un interrupteur ouvert.. La bobine impose la continuité de l’intensité

Figure 4 – Impulsion apr`es 1 cellule RC. 2.2 Situation apr` es la deuxi`