On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit les masses :

(1)

ENFA - Bulletin du GRES n°9 – février 2000 page 5 Contact : Conf PY-MATH@educagri.fr

EXERCICE CORRIGE

Une laiterie produit des camemberts commercialisés sous la marque « Le moine gourmand ».

La masse X, exprimée en g, d’un camembert tiré au hasard dans la production, est distribuée selon une loi normale.

On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit les masses :

250 254 254 253 256 250 257 251 253 255 250 255 252 261

252 251 255

1- a) En utilisant une calculatrice donner la moyenne et la variance de cet échantillon.

b) Donner une estimation ponctuelle de la variance σ² de la production.

2- Déterminer une estimation par intervalle de confiance à 95% de la masse moyenne μ de la production.

3- Le responsable de fabrication des camemberts « Le moine gourmand » souhaite savoir quelle taille minimale donner à un échantillon aléatoire simple pour obtenir un intervalle de confiance pour μ, au niveau 95 %, d’amplitude inférieure à 1.

a) On indique au responsable que l’on ne peut pas répondre à sa question sans un renseignement supplémentaire sur la variance de la production.

Pourquoi la connaissance de cette variance est-elle nécessaire pour répondre à cette question ?

b) Le responsable précise alors que σ ² = 6,25. Calculer la taille minimale que doit avoir un échantillon pour que l’intervalle de confiance à 95 % pour μ ait une amplitude inférieure à 1.

4- Le responsable de fabrication estime que plus de 15 % des camemberts de la production ont une masse supérieure à 257 g. On tire un échantillon aléatoire simple de 200 camemberts. On constate que 40 d’entre eux pèsent plus de 257 g.

Au vu de cet échantillon, peut-on conclure, au seuil de signification 5 %, que le responsable de fabrication a raison ?

_________________________

Eléments de correction :

1. a) x = 253,5 g s² = 8,01 b) σ ˆ ² = s ²

n n

− 1

σ 2

ˆ = 8,51

2. La population est normale, sa variance est inconnue, on utilise une loi de Student. La variable aléatoire T, définie par

− 1 μ

= − n

S ) X

T ( où X est la moyenne de l’échantillon

aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl n = 17,

4 S T X − μ

= , T est distribuée selon la loi de Student à 16 ddl.

Si t = t

_{0,975 ; 16}

alors P(-t < T < t) = 0,95. On lit dans la table : t

0,975 ; 16

= 2,12.

On obtient l’intervalle de confiance aléatoire au niveau 95% :

(2)

ENFA - Bulletin du GRES n°9 – février 2000 page 6 Contact : Conf PY-MATH@educagri.fr

⎥⎦ ⎤

⎢⎣ ⎡ − × + ×

12 4 4 2

12 2 S

, X S ; , X

x = 253,5 g et s = 2,8 g sont les valeurs observées de X et S sur l’échantillon prélevé d’où une estimation de μ par intervalle de confiance au niveau 95 %

⎥⎦ ⎤

⎢⎣ ⎡ − × + ×

4 8 12 2 2 5 4 253

8 12 2 2 5

253 ,

, , , ;

,

[252,0 ; 255,0] est un intervalle de confiance de μ au niveau 95 %

3. a) Si X est de loi normale la variable T, définie par

− 1 μ

= − n

S

T X où X est la

moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl.

Ce qui fait l’intérêt de la variable de Student T, c’est qu’elle ne dépend pas de l’écart type σ de la variable mère X. On utilise ce résultat chaque fois σ est inconnu.

Si X est distribuée selon une loi normale, de moyenne μ et d’écart type σ inconnus, l’intervalle de confiance aléatoire de la moyenne μ au niveau 95% est :

⎥⎦ ⎤

⎢⎣ ⎡

+ −

− ₋ − ₋

1 1 ⁰ ⁹⁷⁵ ¹

1 975

0 n

t S X n ;

t S

X _, _; _n _, _; _n

Cet intervalle a pour amplitude

2 ₀ ₉₇₅ ₁ 1

× ₋ − n t _, _; _n S .

Le problème posé par le responsable de fabrication correspond à la résolution de l’inéquation

1 1 2 ₀ ₉₇₅ ₁ ≤

× ₋ − n

t _, _; _n S .

Or S, n − 1 et t ₀ _, ₉₇₅ _; _n ₋ ₁ dépendent de n. En l’absence de données supplémentaires on ne peut pas résoudre cette inéquation.

b) X est de loi normale et on connaît maintenant sa variance σ ². Sous ces conditions X est distribuée selon la loi N( μ ,

n

σ ), et U, définie par

n U X

σ μ

= − , selon la loi normale

N(0 ; 1). L’intervalle de confiance aléatoire de la moyenne μ au niveau 95%

est :

⎥⎦ ⎤

⎢⎣ ⎡ − σ + σ

u n X n ; u

X ₀ _, ₉₇₅ ₀ _, ₉₇₅ . Cet intervalle a pour amplitude

u _, σ n

× ₀ ₉₇₅

2 . Pour obtenir un intervalle d’amplitude inférieure ou égale à 1, il suffit de choisir n tel que 2 × ₀ ₉₇₅ σ ≤ 1

u _, n soit

2 2 975

2 × 0 × σ

≥ ( u )

n _,

Application numérique : n ≥ ( 2 × 1 , 96 ) ² × 6 , 25

(3)

ENFA - Bulletin du GRES n°9 – février 2000 page 7 Contact : Conf PY-MATH@educagri.fr

04 96, n ≥

Un échantillon doit comporter au minimum 97 camemberts pour que l’intervalle de confiance à 95% correspondant ait une amplitude inférieure à 1 .

4. Hypothèses :

⎩ ⎨

⎧

>

=

énoncé l'

par fournie e

alternativ hypothèse

H

15 0 avec

H

0 1

0 0

0

p p :

, p p

p

: soit

⎩ ⎨

⎧

>

= 15 0 H

15 0 H

1 0

, p :

Seuil de signification : α = 5%

Conditions d’application : grand échantillon n = 200 np

₀

≥ 5 et n(1-p

0

) ≥ 5

Variable de décision : On utilise pour ce test la statistique F qui prend pour valeur la proportion des camemberts de l’échantillon pesant plus de 257 g.

Sous l’hypothèse H

_o

, nF est distribuée selon la loi binomiale B ( n ; p ₀ ) . E(nF) = np

0

; V(nF) = np

0

(1-p

0

) d’où E(F) = p

0

; V(nF) =

n ) p ( p ₀ 1 − ₀

Les conditions d’application rendent légitime l’approximation de B ( n ; p ₀ ) par la loi normale N(np

0

, np ₀ ( 1 − p ₀ ) ).

Sous l’hypothèse H

o

, F est approximativement distribuée selon la loi normale

⎟ ⎟

⎠

⎞

⎜ ⎜

⎝

⎛ −

n p p p

N ( 1 )

,

⁰ ⁰

0

On prend pour variable de décision U, définie par

n ) p ( p

p U F

0 0

0

1−

= −

soit ici

200 85 0 15 0

15 0

, ,

, U F

×

= −

Sous l’hypothèse H

_o

, U est approximativement distribuée selon la loi normale N(0 ; 1).

Règle de décision :

La valeur critique u

c

de la variable U dépend

de l’hypothèse alternative H

₁

. Le test est unilatéral à droite, u

_c

est définie par P(U ≤ u

c

)

= 0,95

On lit dans la table de la fonction de répartition de la loi normale centrée réduite u

_c

= u

_0,95

= 1,64.

Règle de décision :soit u

obs

la valeur de la variable U observée sur l’échantillon,

si u

_obs

> u

_c

on rejette l’hypothèse nulle, si u

_obs

< u

c

on ne rejette pas l’hypothèse nulle Calcul de la valeur observée : f

_obs

=

200 40 soit f

_obs

= 0,2

u c = u 0,95

0,05 0,95

non rejet de H 0 rejet de H 0

0

(4)

ENFA - Bulletin du GRES n°9 – février 2000 page 8 Contact : Conf PY-MATH@educagri.fr

200 85 0 15 0

15 0

, ,

, u _obs f ^obs

×

= − d’où

200 85 0 15 0

15 0 20 0

, ,

, u _obs ,

×

= − soit u

obs

= 1,98

Décision et conclusion :

Au seuil de signification 5% et au vu de l’échantillon on rejette l’hypothèse nulle H

₀

. Plus de 15% des camemberts de la production ont une masse supérieure à 257g. Le responsable de production n’a pas tort.

≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈

On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit les masses :

ENFA - Bulletin du GRES n°9 – février 2000 page 5 Contact : Conf PY-MATH@educagri.fr

EXERCICE CORRIGE

Une laiterie produit des camemberts commercialisés sous la marque « Le moine gourmand ».

La masse X, exprimée en g, d’un camembert tiré au hasard dans la production, est distribuée selon une loi normale.