• Aucun résultat trouvé

1. Donner les intervalles de confiance ` a 90%, 95% et 99% de la moyenne. Que remarque-t-on?

N/A
N/A
Protected

Academic year: 2022

Partager "1. Donner les intervalles de confiance ` a 90%, 95% et 99% de la moyenne. Que remarque-t-on?"

Copied!
4
0
0

Texte intégral

(1)

Master 1 Probabilit´ es & Statistiques

T. D. n II. Intervalles de confiance

Exercice n ° 1.

Le g´ erant d’une pisciculture souhaite connaˆıtre la taille moyenne de la population de poissons d’´ elevage dans ses bassins. Avec un ´ echantillon de n = 64 individus, il obtient une taille moyenne de 32 cm. D’autres ´ etudes sur des piscicultures similaires donnent un ´ ecart-type de 12 cm.

1. Donner les intervalles de confiance ` a 90%, 95% et 99% de la moyenne. Que remarque-t-on?

Exercice n ° 2. Cas d’une proportion

Soit X une variable al´ eatoire de Bernoulli telle que P (X = 1) = p et P (X = 0) = 1 − p o` u 0 < p < 1.

1. Tracer la distribution de X, calculer E (X) et V (X).

2. Soit (X

1

, · · · , X

n

) un ´ echantillon th´ eorique de taille n de la variable X. Soit ˆ P

n

=

X1+...+Xn n

un estimateur de p. D´ eterminer E

P ˆ

n

et V

P ˆ

n

. Qu’en d´ eduire?

3. Dans un ´ echantillon de n = 100 poissons de la pisciculture pr´ ec´ edente on a d´ etecter 46 individus porteurs d’un parasite. Donner les IC

90

, IC

95

et IC

99

de la proportion d’individus parasit´ es dans la population.

Exercice n ° 3. Cas de petits ´ echantillons

Une machine remplit des sacs automatiquement. On mesure 5 sacs et on obtient : 2.8 kg ,3 kg ,2.7 kg ,3.3 kg ,3.1 kg.

1. Donner l’IC

95

du poids moyen des sacs.

(2)

Corrections Correction exercice n ° 1.

Ici, l’´ ecart type de la population est donn´ e : σ = 12 cm. Soit T , la variable taille. Pour ´ evaluer l’intervalle de confiance de l’esp´ erance µ de la population, nous allons supposer que T N µ, σ

2

. Soit T =

1n

P

n

i=1

T

i

, l’estimateur de cette moyenne. Le Th´ eor` eme Central Limite stipule que si l’on dispose de n variables al´ eatoires i.i.d. {X

1

, · · · , X

n

} de mˆ eme loi m` ere qu’une variable X N µ, σ

2

, alors la variable S

n

= P

n

k=1

X

k

est telle que S

n

N nµ, nσ

2

. Dans notre cas, la variable al´ eatoire T suit donc une loi normale de mˆ eme esp´ erance que la variable T et de variance d´ ependante de la taille n de l’´ echantillon :

T N

µ, σ

2

n

.

Nous savons que la variable centr´ ee-r´ eduite Z suit une loi normale de moyenne nulle et de variance unit´ e : Z = T − µ

√σ n

N (0, 1) . Soit

P z

α/2

≤ Z ≤ z

1−α/2

= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle

z

α/2

; z

1−α/2

, sym´ etrique autour de 0, o` u z

α/2

et z

1−α/2

sont les quantiles d’ordre α/2 et 1 − α/2 de la gaussienne centr´ ee-r´ eduite. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :

P

T − σ

√ n z

1−α/2

≤ µ ≤ T − σ

√ n z

α/2

= 1 − α.

Cette relation permet de borner la valeur de µ entre deux valeurs m

l

= T −

σ

n

z

1−α/2

et m

r

= T −

σ

n

z

1−α/2

, qui formeront les bornes de l’intervalle de confiance IC

1−α

= [m

l

; m

r

]. Ces bornes qui d´ ependent de la variable al´ eatoire T sont donc al´ eatoires et leur valeur variera en fonction de la r´ ealisation de l’´ echantillon. En fait, l’´ enonc´ e nous indique que t

obs

= 32 cm. Si l’on choisit α = 0.05, alors z

0.025

= −1.96 et z

0.975

= 1.96 (par sym´ etrie de la gaussienne) et la probabilit´ e pour que µ appartienne ` a l’intervalle h

32 −

12

64

× 1.96; 32 +

12

64

× 1.96 i

= [29.06; 34.94] est de 0.95. Nous venons de construire l’IC

0.95

. Si l’on fait varier la valeur de α alors les quantiles d’ordre α/2 et 1 − α/2 varieront ´ egalement. Pour α = 0.1 alors z

0.05

= −1.64, z

0.95

= 1.64 et l’intervalle de confiance devient

IC

0.9

=

32 − 12

64 × 1.64; 32 + 12

64 × 1.64

= [29.54; 34.46] . Pour α = 0.01 alors z

0.005

= −2.57, z

0.995

= 2.57 et l’intervalle de confiance devient

IC

0.99

=

32 − 12

64 × 2.57; 32 + 12

64 × 2.57

= [28.14; 35.85] .

Si l’on note LIC

1−α

la longueur de l’IC

1−α

, on se rend compte que LIC

0.99

> LIC

0.95

> LIC

0.90

: l’intervalle de confiance est d’autant plus grand que le risque α diminue.

Correction exercice n ° 2.

On montre facilement que

E (X) = X

x∈N

xP (X = x) = 0 × P (X = 0) + 1 × P (X = 1) = p.

De mˆ eme,

V (X) = E X

2

− E

2

(X) = p − p

2

= p × (1 − p) .

Le trac´ e de cette loi discr` ete est laiss´ e ` a votre discr´ etion.

(3)

Soit l’estimateur de la quantit´ e p donn´ e par

P ˆ

n

= X

1

+ · · · + X

n

n .

Son esp´ erance et sa variance se calcule grˆ ace au fait que l’on suppose que l’´ echantillon est i.i.d et tel que X

i

B (p).

On a donc

E P ˆ

n

= 1 n

n

X

k=1

E (X

i

) = p,

V P ˆ

n

= 1 n

2

n

X

k=1

V (X

i

) = p (1 − p) n .

On en d´ eduit que ˆ P

n

est un estimateur sans biais et convergent. Le th´ eor` eme de Moivre-Laplace stipule que, pour n assez grand, si une variable X

n

B (n, p) (E (X

n

) = np, V (X

n

) = np (1 − p)) alors la variable

Z

n

= X

n

− np

p np (1 − p) N (0, 1) .

Ici, si on suppose que l’´ echantillon est de grande taille (en pratique n ≥ 30) alors l’estimateur est une variable al´ eatoire gaussienne telle que

P ˆ

n

N

p, p (1 − p) n

.

Ici n = 100, nous sommes dans un cas d’application du r´ esultat pr´ ec´ edent. Consid´ erons la variable centr´ ee-r´ eduite Z = P ˆ

n

− p

q

p(1−p) n

N (0, 1) .

Soit

P z

α/2

≤ Z ≤ z

1−α/2

= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle

z

α/2

; z

1−α/2

, sym´ etrique autour de 0, o` u z

α/2

et z

1−α/2

sont les quantiles d’ordre α/2 et 1 − α/2 de la gaussienne centr´ ee-r´ eduite. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :

P P ˆ

n

r p (1 − p)

n z

1−α/2

≤ p ≤ P ˆ

n

r p (1 − p) n z

α/2

!

= 1 − α.

Cette relation permet de borner la valeur de p entre deux valeurs p

l

= ˆ P

n

r p (1 − p) n z

1−α/2

et

p

r

= ˆ P

n

r p (1 − p) n z

α/2

,

qui formeront les bornes de l’intervalle de confiance IC

1−α

= [p

l

; p

r

]. Le probl` eme est que les bornes de cet intervalle d´ ependent du param` etre p que l’on cherche ` a borner. On va en fait substituer la valeur de p et celle de ˆ P

n

dans les bornes en utilisant la valeur p

obs

=

10046

obtenue avec l’´ echantillon. On peut montrer qu’asymptotiquement cette approximation est admissible. On obtient ainsi les trois intervalles :

 

 

 

 

 

 

IC

0.90

=

p

obs

q

pobs(1−pobs)

n

z

0.95

; p

obs

q

pobs(1−pobs) n

z

0.05

= [0.378; 0.541]

IC

0.95

=

p

obs

q

pobs(1−pobs)

n

z

0.975

; p

obs

q

pobs(1−pobs) n

z

0.025

= [0.362; 0.557]

IC

0.99

=

p

obs

q

pobs(1−pobs)

n

z

0.995

; p

obs

q

pobs(1−pobs) n

z

0.005

= [0.332; 0.588]

.

(4)

De la mˆ eme mani` ere que dans l’exercice pr´ ec´ edent, plus α augmente, plus l’intervalle de confiance diminue.

Correction exercice n ° 3.

On a ici un ´ echantillon de taille n = 5 et aucun renseignement sur les param` etres populationnels. Nous allons supposer que la variable X: poids des sacs (kg) est une variable al´ eatoire gaussienne telle que

X N µ, σ

2

.

Les param` etres µ et σ sont inconnus ici. On doit les estimer avec un ´ echantillon {X

1

, · · · , X

n

} de variables suppos´ ees i.i.d de mˆ eme loi m` ere que X. Soit

X = 1 n

n

X

i=1

X

i

,

S = 1 n − 1

n

X

i=1

X

i

− X

2

,

les estimateurs de µ et σ

2

respectivement. Soit la variable al´ eatoire T = Y

q

U n

o` u Y N (0, 1) est gaussienne centr´ ee-r´ eduite et U χ

2n

suit une loi du Chi2 ` a n degr´ es de libert´ e, Y et U ind´ ependante. On sait que T suit une loi de Student ` a n degr´ es de libert´ e

T T

n

.

Or on sait d’autre part que la variable

n−1σ2

S

n−12

=

σn2

S

n2

est distribu´ ee selon une loi du χ

2n−1

` a n − 1 degr´ es de libert´ e. Donc si l’on consid` ere la variable

Z = X − µ q

S2n−1 n

=

X−µ σ/√

n

q

(n−1)Sn−12 σ2

×

n−11

elle correspond bien au rapport d’une gaussienne centr´ ee r´ eduite sur la racine carr´ ee d’une variable qui suit une loi χ

2n−1

divis´ ee par son nombre de d´ egr´ es de libert´ e n − 1. On en d´ eduit que :

Z T

n−1

. Soit

P t

n−1;α/2

≤ Z ≤ t

n−1;1−α/2

= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle

t

n−1;α/2

; t

n−1;1−α/2

, sym´ etrique autour de 0, o` u t

n−1;α/2

et t

n−1;1−α/2

sont les quantiles d’ordre α/2 et 1 − α/2 de la loi de Student ` a n − 1 degr´ es de libert´ e. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :

P

X − S

n−1

√ n t

n−1;1−α/2

≤ µ ≤ X − S

n−1

√ n t

n−1;α/2

= 1 − α.

Cette relation permet de borner la valeur de µ entre deux valeurs m

l

= X −

Sn−1n

t

n−1;1−α/2

et m

r

= X −

S√n−1

n

t

n−1;1−α/2

, qui formeront les bornes de l’intervalle de confiance IC

1−α

= [m

l

; m

r

]. Ces bornes qui d´ ependent de la variable al´ eatoire X sont donc al´ eatoires et leur valeur variera en fonction de la r´ ealisation de l’´ echantillon.

On calcule x

obs

= 2.98 kg et 4 × s

2obs

= 0.228. Si l’on choisit α = 0.05, alors t

4;0.025

= −2.78 et t

4;0.975

= 2.78 (par sym´ etrie de la loi de Student) et la probabilit´ e pour que µ appartienne ` a l’intervalle

"

2.98 −

r 0.228

4 × 5 × 2.78; 2.98 +

r 0.228 4 × 5 × 2.78

#

= [2.683; 3.276]

est de 0.95. Nous venons de construire l’IC

0.95

pour de petits ´ echantillons, quand la moyenne et la variance de la

population sont inconnues et doivent ˆ etre estim´ ees.

Références

Documents relatifs

Sources S ´ esamath Classe de premi` ere Calculer l’esp´ erance d’une variable al´

Montrez que X suit une loi g´ eom´ etrique et pr´ ecisez de quel param` etre.. D´ eduisez-en la fonction de r´ epartition de la variable al´

On consid` ere un syst` eme form´ e de deux composants ´ electroniques mont´ es en s´ erie, de probabilit´ es respectives p et p 0 de tomber en panne chaque ann´ ee, ind´

On consid` ere ε une variable al´ eatoire mod´ elisant un bruit d’observation, suppos´ ee ind´ ependante de X et d’esp´

Il est fr´ equent que le nombre de r´ eservations pour un vol soit sup´ erieur au nombre de passagers se pr´ esentant effectivement ` a l’embarquement.. Pour profiter de ce ph´

Soit U une variable al´eatoire positive de fonction de r´epartition F, ind´ependante de F ∞.. Justifier que Q est une mesure

L’entreprise CMC fabrique des ´ ecrans vid´ eo pour micro-ordinateur. Une ´ etude statistique a permis d’´ etablir que la demande, au Japon, pour son mod` ele ZW ´ etait

Soit X la variable al´ eatoire donnant le nombre d’essais n´ ecessaires pour ouvrir les deux armoires A et B.. Quelles sont les valeurs que peut