ABAQUES ET INTERVALLES DE CONFIANCE
Note au lecteur : Cet article est avant tout destiné aux enseignants et dépasse le cadre de leurs interventions dans les classes de BTSA.
L'objectif de cet article est de présenter un abaque utilisable dans le cadre de l'estimation par intervalle de confiance à 0,95 de la proportion π d'individus d'une population donnée possédant un caractère A donné.
Nous présentons tout d'abord un abaque servant à déterminer graphiquement une estimation par intervalle de confiance d'une moyenne.
I - Construction d'un abaque pour la détermination d'une estimation par intervalle de confiance de la moyenne d'une population "normale" de variance connue
Considérons un caractère continu défini sur une population de très grande taille et distribué selon une loi normale de moyenne μ et de variance σ
2.
Supposons σ 2 connue et μ inconnue.
Il s'agit, à partir d'un échantillon aléatoire simple de taille n issu de cette population, de déterminer graphiquement un intervalle susceptible de contenir la moyenne μ de la population.
1. Variable aléatoire d'échantillonnage
Notons X la variable aléatoire "valeur du caractère pour un élément de la population". La loi de probabilité de X est, par hypothèse, la loi normale N(μ,σ) donc la loi de probabilité de la variable aléatoire X , qui à chaque échantillon de taille n issu de cette population associe la moyenne x de cet échantillon, est la loi normale N(μ, σ
n ). La loi de probabilité de la variable aléatoire U X
n
= − μ
σ est donc la loi normale N(0;1).
X est appelée variable aléatoire d'échantillonnage des moyennes.
2. Construction d'un abaque pour le niveau de confiance 0,95
On a : Pr ob ( − 1 96 , < < U 1 96 , ) = 0 95 , . Cette relation équivaut à
Pr ob ( , , ) ,
n X
μ − 1 96 σ < < + μ 1 96 σ n = 0 95 .
La valeur de μ est inconnue a priori.
Pour chaque valeur de l'entier n, on peut définir sur IR respectivement les fonctions affines G
1;net G
2;npar les expressions suivantes :
G n x x
n et G n x x
1 ; ( ) = − 1 96 , σ 2 ; ( ) = + 1 96 , σ n
Les représentations graphiques respectives des fonctions G
1;net G
2;ndans un repère orthogonal sont deux droites (D
1;n) et (D
2;n) parallèles à la droite d’équation y = x.
Les droites (D
1;n) et (D
2;n) qui correspondent à quelques valeurs de n et à σ = 5 sont présentées ci-dessous (figure 1) dans un même repère.
-3 -2 -1 0 1 2 3 4 5 6 7
0 1 2 3 4
(D
2;12) (D
2;25) (D
2;50) (D
2;100) y = x (D
1;100) (D
1;50) (D
1;25) (D
1;12)
figure 1 (abaque)
x
G i;n (x)
3. Détermination graphique d'une estimation par intervalle de confiance de la moyenne μ Soit μ
0un réel. Sous l'hypothèse "μ = μ
0" nous avons :
Pr ob ( , , ) ,
n X
μ σ n
μ σ
0 − 1 96 < < 0 + 1 96 = 0 95
On prélève dans la population un échantillon aléatoire simple de taille n. La moyenne x de cet échantillon est une estimation ponctuelle de μ.
Si cette moyenne x appartient à l'intervalle μ σ
μ σ
0 − 1 96 0 + 1 96
⎤
⎦⎥
⎡
, ; , ⎣⎢
n n alors on
accepte l'hypothèse "μ = μ
0". Cet intervalle est appelé intervalle d'acceptation de cette hypothèse.
Les fonctions G
1;net G
2;nsont bijectives, notons respectivement G 1 − ; n 1 et G 2 − ; n 1 leurs fonctions réciproques.
μ σ μ σ
0 − 1 96 , < < 0 + 1 96 , n x
n équivaut à x
n x
− 1 96 , σ < μ
0< + 1 96 , σ n L'intervalle x
n x
− + n
⎤
⎦⎥
⎡ 1 96 , σ ; 1 96 , σ ⎣⎢
est une estimation de μ par intervalle de confiance à 0,95.
Pour déterminer graphiquement cet intervalle, on représente sur l'abaque précédent (figure 2) les images respectives de x par les fonctions G 1 − ; n 1 et G 2 − ; n 1 .
Par exemple,
On prélève un échantillon aléatoire simple de taille n = 25 dans une population sur laquelle on étudie un caractère distribué normalement dont la variance σ
2est égale à 25.
La moyenne x de cet échantillon est égale à 2,4.
≈≈≈≈≈≈≈≈
On obtient graphiquement (figure 1) les bornes 1 et 3,6 de l'intervalle associé à l'échantillon prélevé.
L’intervalle ]1 ; 3,6[ est donc une estimation de la moyenne de la population par intervalle de confiance à 0,95.
Nota Bene :
Que signifie l’expression « ]a ; b[ est une estimation par intervalle de confiance à 0,95 de la moyenne μ d’une population de variance connue» ?
≈≈≈≈≈≈≈≈
Pour chaque échantillon aléatoire simple de taille n, prélevé dans la population, on détermine
⎤ σ σ ⎡
Imaginons que l’on prélève dans la population tous les échantillons aléatoires simples de taille n.
Considérons l’ensemble I des intervalles ainsi déterminés.
La relation Pr ob ( , , ) ,
n X
μ σ n
μ σ
− 1 96 < < + 1 96 = 0 95 équivaut à
Pr ob X ( , , ) ,
n X
− 1 96 σ < < μ + 1 96 σ n = 0 95
Cette dernière égalité signifie que, dans l’ensemble I , 95% des intervalles sont susceptibles de contenir la moyenne μ.
Par conséquent, l’expression « ]a ; b[ est une estimation par intervalle de confiance à 0,95 de la moyenne μ d’une population de variance connue » signifie que ]a ; b[ est un intervalle de la forme x
n x
− + n
⎤
⎦⎥
⎡ 1 96 , σ ; 1 96 , σ ⎣⎢
où x est une valeur de la variable aléatoire X , 95% des intervalles de cette forme étant susceptibles de contenir la moyenne μ.
II - Construction d'un abaque pour la détermination d'une estimation d'une proportion par intervalle de confiance à 0,95
Considérons une population de très grande taille dont la proportion π des individus possédant un caractère A donné est inconnue.
Il s'agit, à partir d'un échantillon aléatoire simple de taille n issu de cette population, de déterminer graphiquement un intervalle susceptible de contenir la proportion π.
1. Variable aléatoire d'échantillonnage
Notons X la variable aléatoire qui à chaque échantillon de taille n issu de cette population associe le nombre d'individus possédant le caractère A. La loi de probabilité de X est la loi binomiale B(n, π).
Notons P la variable aléatoire qui, à chaque échantillon de taille n issu de cette population, associe la proportion d'individus possédant le caractère A.
Nous avons X = nP et donc la loi de probabilité de la variable aléatoire nP est la loi binomiale B(n, π).
Par suite, la loi de probabilité de P est définie par :
Pour tout entier k de 0 à n, Pr ob P ( k ) Pr ( ) ( )
n ob X k C n k k n k
= = = = π 1 − π − .
L’espérance mathématique et la variance de P sont respectivement : E(P) = π et σ ( ) ( )
P n
2 = π 1 − π
2. Construction d'un abaque pour le niveau de confiance 0,95
2.1 Cas des grands échantillons :
D’après le théorème central-limit, pour n suffisamment grand, la loi de probabilité de la variable aléatoire U P
n
= −
− π
π ( 1 π ) peut être approchée par la loi normale centrée réduite N(0;1).
On a Pr ob ( − 1 96 , < < U 1 96 , ) = 0 95 , . Cette relation équivaut à
Pr , ( )
, ( )
,
ob n P
π π π n
π π π
− −
< < + −
⎛
⎝ ⎜ ⎞
⎠ ⎟ = 1 96 1
1 96 1
0 95 . La valeur de π est inconnue.
Pour chaque valeur de l'entier n, on peut définir sur IR respectivement les fonctions G
1;net G
2;npar les expressions suivantes :
G n x x x x
n et G n x x x x
1 1 96 1 n
2 1 96 1
; ( ) , ( )
; ( ) , ( )
= − −
= + −
Pour x = π, G n 1 1 96 1 n et G n n
2 1 96 1
; ( ) , ( )
; ( ) , ( )
π π π π
π π π π
= − −
= + −
Les représentations graphiques respectives des fonctions G
1;net G
2;ndans un repère orthonormal sont deux arcs (E
1;n) et (E
2;n) d'une même ellipse qui passe par les points (0 ; 0) et (1 ; 1) (figure 2).
En effet, ( Gi n x ; ( ) x ) ( , ) x ( n x ) pour i
− = × − ;
2 1 96 2 1 =
1 2 ou encore
[ ]
x 2 1 3 8416 n x Gi n x n Gi n x 2 pour i
2 3 8416
0 1 2
⎡ +
⎣⎢
⎤
⎦⎥ − ⎡ +
⎣⎢
⎤
⎦⎥ + = =
,
; ( ) ,
; ( ) ;
On ne s'intéresse ici qu'aux parties des arcs (E
1;n) et (E
2;n) contenues dans un carré de côté 1 car 0 ≤ ≤ π 1 et 0 ≤ ≤ P 1 .
2.2 Cas des petits échantillons :
A chaque valeur de l'entier n, correspondent deux entiers naturels k
1;net k
2;ntels que : k
1;nest le plus grand entier tel que n k
k
k n k
C
k
n=
∑ − − ≤
0
1
1 0 025
;