Master 1 Probabilit´ es & Statistiques
T. D. n II. Intervalles de confiance
Exercice n ° 1.
Le g´ erant d’une pisciculture souhaite connaˆıtre la taille moyenne de la population de poissons d’´ elevage dans ses bassins. Avec un ´ echantillon de n = 64 individus, il obtient une taille moyenne de 32 cm. D’autres ´ etudes sur des piscicultures similaires donnent un ´ ecart-type de 12 cm.
1. Donner les intervalles de confiance ` a 90%, 95% et 99% de la moyenne. Que remarque-t-on?
Exercice n ° 2. Cas d’une proportion
Soit X une variable al´ eatoire de Bernoulli telle que P (X = 1) = p et P (X = 0) = 1 − p o` u 0 < p < 1.
1. Tracer la distribution de X, calculer E (X) et V (X).
2. Soit (X
1, · · · , X
n) un ´ echantillon th´ eorique de taille n de la variable X. Soit ˆ P
n=
X1+...+Xn nun estimateur de p. D´ eterminer E
P ˆ
net V
P ˆ
n. Qu’en d´ eduire?
3. Dans un ´ echantillon de n = 100 poissons de la pisciculture pr´ ec´ edente on a d´ etecter 46 individus porteurs d’un parasite. Donner les IC
90, IC
95et IC
99de la proportion d’individus parasit´ es dans la population.
Exercice n ° 3. Cas de petits ´ echantillons
Une machine remplit des sacs automatiquement. On mesure 5 sacs et on obtient : 2.8 kg ,3 kg ,2.7 kg ,3.3 kg ,3.1 kg.
1. Donner l’IC
95du poids moyen des sacs.
Corrections Correction exercice n ° 1.
Ici, l’´ ecart type de la population est donn´ e : σ = 12 cm. Soit T , la variable taille. Pour ´ evaluer l’intervalle de confiance de l’esp´ erance µ de la population, nous allons supposer que T N µ, σ
2. Soit T =
1nP
ni=1
T
i, l’estimateur de cette moyenne. Le Th´ eor` eme Central Limite stipule que si l’on dispose de n variables al´ eatoires i.i.d. {X
1, · · · , X
n} de mˆ eme loi m` ere qu’une variable X N µ, σ
2, alors la variable S
n= P
nk=1
X
kest telle que S
nN nµ, nσ
2. Dans notre cas, la variable al´ eatoire T suit donc une loi normale de mˆ eme esp´ erance que la variable T et de variance d´ ependante de la taille n de l’´ echantillon :
T N
µ, σ
2n
.
Nous savons que la variable centr´ ee-r´ eduite Z suit une loi normale de moyenne nulle et de variance unit´ e : Z = T − µ
√σ n
N (0, 1) . Soit
P z
α/2≤ Z ≤ z
1−α/2= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle
z
α/2; z
1−α/2, sym´ etrique autour de 0, o` u z
α/2et z
1−α/2sont les quantiles d’ordre α/2 et 1 − α/2 de la gaussienne centr´ ee-r´ eduite. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :
P
T − σ
√ n z
1−α/2≤ µ ≤ T − σ
√ n z
α/2= 1 − α.
Cette relation permet de borner la valeur de µ entre deux valeurs m
l= T −
√σn
z
1−α/2et m
r= T −
√σn
z
1−α/2, qui formeront les bornes de l’intervalle de confiance IC
1−α= [m
l; m
r]. Ces bornes qui d´ ependent de la variable al´ eatoire T sont donc al´ eatoires et leur valeur variera en fonction de la r´ ealisation de l’´ echantillon. En fait, l’´ enonc´ e nous indique que t
obs= 32 cm. Si l’on choisit α = 0.05, alors z
0.025= −1.96 et z
0.975= 1.96 (par sym´ etrie de la gaussienne) et la probabilit´ e pour que µ appartienne ` a l’intervalle h
32 −
√1264
× 1.96; 32 +
√1264
× 1.96 i
= [29.06; 34.94] est de 0.95. Nous venons de construire l’IC
0.95. Si l’on fait varier la valeur de α alors les quantiles d’ordre α/2 et 1 − α/2 varieront ´ egalement. Pour α = 0.1 alors z
0.05= −1.64, z
0.95= 1.64 et l’intervalle de confiance devient
IC
0.9=
32 − 12
√
64 × 1.64; 32 + 12
√
64 × 1.64
= [29.54; 34.46] . Pour α = 0.01 alors z
0.005= −2.57, z
0.995= 2.57 et l’intervalle de confiance devient
IC
0.99=
32 − 12
√
64 × 2.57; 32 + 12
√
64 × 2.57
= [28.14; 35.85] .
Si l’on note LIC
1−αla longueur de l’IC
1−α, on se rend compte que LIC
0.99> LIC
0.95> LIC
0.90: l’intervalle de confiance est d’autant plus grand que le risque α diminue.
Correction exercice n ° 2.
On montre facilement que
E (X) = X
x∈N
xP (X = x) = 0 × P (X = 0) + 1 × P (X = 1) = p.
De mˆ eme,
V (X) = E X
2− E
2(X) = p − p
2= p × (1 − p) .
Le trac´ e de cette loi discr` ete est laiss´ e ` a votre discr´ etion.
Soit l’estimateur de la quantit´ e p donn´ e par
P ˆ
n= X
1+ · · · + X
nn .
Son esp´ erance et sa variance se calcule grˆ ace au fait que l’on suppose que l’´ echantillon est i.i.d et tel que X
iB (p).
On a donc
E P ˆ
n= 1 n
n
X
k=1
E (X
i) = p,
V P ˆ
n= 1 n
2n
X
k=1
V (X
i) = p (1 − p) n .
On en d´ eduit que ˆ P
nest un estimateur sans biais et convergent. Le th´ eor` eme de Moivre-Laplace stipule que, pour n assez grand, si une variable X
nB (n, p) (E (X
n) = np, V (X
n) = np (1 − p)) alors la variable
Z
n= X
n− np
p np (1 − p) N (0, 1) .
Ici, si on suppose que l’´ echantillon est de grande taille (en pratique n ≥ 30) alors l’estimateur est une variable al´ eatoire gaussienne telle que
P ˆ
nN
p, p (1 − p) n
.
Ici n = 100, nous sommes dans un cas d’application du r´ esultat pr´ ec´ edent. Consid´ erons la variable centr´ ee-r´ eduite Z = P ˆ
n− p
q
p(1−p) nN (0, 1) .
Soit
P z
α/2≤ Z ≤ z
1−α/2= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle
z
α/2; z
1−α/2, sym´ etrique autour de 0, o` u z
α/2et z
1−α/2sont les quantiles d’ordre α/2 et 1 − α/2 de la gaussienne centr´ ee-r´ eduite. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :
P P ˆ
n−
r p (1 − p)
n z
1−α/2≤ p ≤ P ˆ
n−
r p (1 − p) n z
α/2!
= 1 − α.
Cette relation permet de borner la valeur de p entre deux valeurs p
l= ˆ P
n−
r p (1 − p) n z
1−α/2et
p
r= ˆ P
n−
r p (1 − p) n z
α/2,
qui formeront les bornes de l’intervalle de confiance IC
1−α= [p
l; p
r]. Le probl` eme est que les bornes de cet intervalle d´ ependent du param` etre p que l’on cherche ` a borner. On va en fait substituer la valeur de p et celle de ˆ P
ndans les bornes en utilisant la valeur p
obs=
10046obtenue avec l’´ echantillon. On peut montrer qu’asymptotiquement cette approximation est admissible. On obtient ainsi les trois intervalles :
IC
0.90=
p
obs−
q
pobs(1−pobs)n
z
0.95; p
obs−
q
pobs(1−pobs) nz
0.05= [0.378; 0.541]
IC
0.95=
p
obs−
q
pobs(1−pobs)n
z
0.975; p
obs−
q
pobs(1−pobs) nz
0.025= [0.362; 0.557]
IC
0.99=
p
obs−
q
pobs(1−pobs)n
z
0.995; p
obs−
q
pobs(1−pobs) nz
0.005= [0.332; 0.588]
.
De la mˆ eme mani` ere que dans l’exercice pr´ ec´ edent, plus α augmente, plus l’intervalle de confiance diminue.
Correction exercice n ° 3.
On a ici un ´ echantillon de taille n = 5 et aucun renseignement sur les param` etres populationnels. Nous allons supposer que la variable X: poids des sacs (kg) est une variable al´ eatoire gaussienne telle que
X N µ, σ
2.
Les param` etres µ et σ sont inconnus ici. On doit les estimer avec un ´ echantillon {X
1, · · · , X
n} de variables suppos´ ees i.i.d de mˆ eme loi m` ere que X. Soit
X = 1 n
n
X
i=1
X
i,
S = 1 n − 1
n
X
i=1
X
i− X
2,
les estimateurs de µ et σ
2respectivement. Soit la variable al´ eatoire T = Y
q
U no` u Y N (0, 1) est gaussienne centr´ ee-r´ eduite et U χ
2nsuit une loi du Chi2 ` a n degr´ es de libert´ e, Y et U ind´ ependante. On sait que T suit une loi de Student ` a n degr´ es de libert´ e
T T
n.
Or on sait d’autre part que la variable
n−1σ2S
n−12=
σn2S
n2est distribu´ ee selon une loi du χ
2n−1` a n − 1 degr´ es de libert´ e. Donc si l’on consid` ere la variable
Z = X − µ q
S2n−1 n=
X−µ σ/√
n
q
(n−1)Sn−12 σ2×
n−11elle correspond bien au rapport d’une gaussienne centr´ ee r´ eduite sur la racine carr´ ee d’une variable qui suit une loi χ
2n−1divis´ ee par son nombre de d´ egr´ es de libert´ e n − 1. On en d´ eduit que :
Z T
n−1. Soit
P t
n−1;α/2≤ Z ≤ t
n−1;1−α/2= 1 − α, la probabilit´ e que la variable Z soit comprise dans l’intervalle
t
n−1;α/2; t
n−1;1−α/2, sym´ etrique autour de 0, o` u t
n−1;α/2et t
n−1;1−α/2sont les quantiles d’ordre α/2 et 1 − α/2 de la loi de Student ` a n − 1 degr´ es de libert´ e. Cette probabilit´ e d´ epend du risque α de ne pas appartenir ` a cet intervalle, risque choisi arbitrairement petit. On d´ eduit de l’´ egalit´ e pr´ ec´ edente que :
P
X − S
n−1√ n t
n−1;1−α/2≤ µ ≤ X − S
n−1√ n t
n−1;α/2= 1 − α.
Cette relation permet de borner la valeur de µ entre deux valeurs m
l= X −
S√n−1nt
n−1;1−α/2et m
r= X −
S√n−1
n