• Aucun résultat trouvé

I - Construction d'un abaque pour la détermination d'une estimation par intervalle de confiance de la moyenne d'une population "normale" de variance connue

N/A
N/A
Protected

Academic year: 2022

Partager "I - Construction d'un abaque pour la détermination d'une estimation par intervalle de confiance de la moyenne d'une population "normale" de variance connue "

Copied!
7
0
0

Texte intégral

(1)

ABAQUES ET INTERVALLES DE CONFIANCE

Note au lecteur : Cet article est avant tout destiné aux enseignants et dépasse le cadre de leurs interventions dans les classes de BTSA.

L'objectif de cet article est de présenter un abaque utilisable dans le cadre de l'estimation par intervalle de confiance à 0,95 de la proportion π d'individus d'une population donnée possédant un caractère A donné.

Nous présentons tout d'abord un abaque servant à déterminer graphiquement une estimation par intervalle de confiance d'une moyenne.

I - Construction d'un abaque pour la détermination d'une estimation par intervalle de confiance de la moyenne d'une population "normale" de variance connue

Considérons un caractère continu défini sur une population de très grande taille et distribué selon une loi normale de moyenne μ et de variance σ

2

.

Supposons σ 2 connue et μ inconnue.

Il s'agit, à partir d'un échantillon aléatoire simple de taille n issu de cette population, de déterminer graphiquement un intervalle susceptible de contenir la moyenne μ de la population.

1. Variable aléatoire d'échantillonnage

Notons X la variable aléatoire "valeur du caractère pour un élément de la population". La loi de probabilité de X est, par hypothèse, la loi normale N(μ,σ) donc la loi de probabilité de la variable aléatoire X , qui à chaque échantillon de taille n issu de cette population associe la moyenne x de cet échantillon, est la loi normale N(μ, σ

n ). La loi de probabilité de la variable aléatoire U X

n

= − μ

σ est donc la loi normale N(0;1).

X est appelée variable aléatoire d'échantillonnage des moyennes.

2. Construction d'un abaque pour le niveau de confiance 0,95

On a : Pr ob ( − 1 96 , < < U 1 96 , ) = 0 95 , . Cette relation équivaut à

Pr ob ( , , ) ,

n X

μ − 1 96 σ < < + μ 1 96 σ n = 0 95 .

(2)

La valeur de μ est inconnue a priori.

Pour chaque valeur de l'entier n, on peut définir sur IR respectivement les fonctions affines G

1;n

et G

2;n

par les expressions suivantes :

G n x x

n et G n x x

1 ; ( ) = − 1 96 , σ 2 ; ( ) = + 1 96 , σ n

Les représentations graphiques respectives des fonctions G

1;n

et G

2;n

dans un repère orthogonal sont deux droites (D

1;n

) et (D

2;n

) parallèles à la droite d’équation y = x.

Les droites (D

1;n

) et (D

2;n

) qui correspondent à quelques valeurs de n et à σ = 5 sont présentées ci-dessous (figure 1) dans un même repère.

-3 -2 -1 0 1 2 3 4 5 6 7

0 1 2 3 4

(D

2;12

) (D

2;25

) (D

2;50

) (D

2;100

) y = x (D

1;100

) (D

1;50

) (D

1;25

) (D

1;12

)

figure 1 (abaque)

x

G i;n (x)

(3)

3. Détermination graphique d'une estimation par intervalle de confiance de la moyenne μ Soit μ

0

un réel. Sous l'hypothèse "μ = μ

0

" nous avons :

Pr ob ( , , ) ,

n X

μ σ n

μ σ

0 − 1 96 < < 0 + 1 96 = 0 95

On prélève dans la population un échantillon aléatoire simple de taille n. La moyenne x de cet échantillon est une estimation ponctuelle de μ.

Si cette moyenne x appartient à l'intervalle μ σ

μ σ

0 − 1 96 0 + 1 96

⎦⎥

, ; , ⎣⎢

n n alors on

accepte l'hypothèse "μ = μ

0

". Cet intervalle est appelé intervalle d'acceptation de cette hypothèse.

Les fonctions G

1;n

et G

2;n

sont bijectives, notons respectivement G 1 ; n 1 et G 2 ; n 1 leurs fonctions réciproques.

μ σ μ σ

0 − 1 96 , < < 0 + 1 96 , n x

n équivaut à x

n x

− 1 96 , σ < μ

0

< + 1 96 , σ n L'intervalle x

n x

− + n

⎦⎥

⎡ 1 96 , σ ; 1 96 , σ ⎣⎢

est une estimation de μ par intervalle de confiance à 0,95.

Pour déterminer graphiquement cet intervalle, on représente sur l'abaque précédent (figure 2) les images respectives de x par les fonctions G 1 ; n 1 et G 2 ; n 1 .

Par exemple,

On prélève un échantillon aléatoire simple de taille n = 25 dans une population sur laquelle on étudie un caractère distribué normalement dont la variance σ

2

est égale à 25.

La moyenne x de cet échantillon est égale à 2,4.

≈≈≈≈≈≈≈≈

On obtient graphiquement (figure 1) les bornes 1 et 3,6 de l'intervalle associé à l'échantillon prélevé.

L’intervalle ]1 ; 3,6[ est donc une estimation de la moyenne de la population par intervalle de confiance à 0,95.

Nota Bene :

Que signifie l’expression « ]a ; b[ est une estimation par intervalle de confiance à 0,95 de la moyenne μ d’une population de variance connue» ?

≈≈≈≈≈≈≈≈

Pour chaque échantillon aléatoire simple de taille n, prélevé dans la population, on détermine

⎤ σ σ ⎡

(4)

Imaginons que l’on prélève dans la population tous les échantillons aléatoires simples de taille n.

Considérons l’ensemble I des intervalles ainsi déterminés.

La relation Pr ob ( , , ) ,

n X

μ σ n

μ σ

− 1 96 < < + 1 96 = 0 95 équivaut à

Pr ob X ( , , ) ,

n X

− 1 96 σ < < μ + 1 96 σ n = 0 95

Cette dernière égalité signifie que, dans l’ensemble I , 95% des intervalles sont susceptibles de contenir la moyenne μ.

Par conséquent, l’expression « ]a ; b[ est une estimation par intervalle de confiance à 0,95 de la moyenne μ d’une population de variance connue » signifie que ]a ; b[ est un intervalle de la forme x

n x

− + n

⎦⎥

⎡ 1 96 , σ ; 1 96 , σ ⎣⎢

où x est une valeur de la variable aléatoire X , 95% des intervalles de cette forme étant susceptibles de contenir la moyenne μ.

II - Construction d'un abaque pour la détermination d'une estimation d'une proportion par intervalle de confiance à 0,95

Considérons une population de très grande taille dont la proportion π des individus possédant un caractère A donné est inconnue.

Il s'agit, à partir d'un échantillon aléatoire simple de taille n issu de cette population, de déterminer graphiquement un intervalle susceptible de contenir la proportion π.

1. Variable aléatoire d'échantillonnage

Notons X la variable aléatoire qui à chaque échantillon de taille n issu de cette population associe le nombre d'individus possédant le caractère A. La loi de probabilité de X est la loi binomiale B(n, π).

Notons P la variable aléatoire qui, à chaque échantillon de taille n issu de cette population, associe la proportion d'individus possédant le caractère A.

Nous avons X = nP et donc la loi de probabilité de la variable aléatoire nP est la loi binomiale B(n, π).

Par suite, la loi de probabilité de P est définie par :

Pour tout entier k de 0 à n, Pr ob P ( k ) Pr ( ) ( )

n ob X k C n k k n k

= = = = π 1 − π .

L’espérance mathématique et la variance de P sont respectivement : E(P) = π et σ ( ) ( )

P n

2 = π 1 − π

2. Construction d'un abaque pour le niveau de confiance 0,95

2.1 Cas des grands échantillons :

(5)

D’après le théorème central-limit, pour n suffisamment grand, la loi de probabilité de la variable aléatoire U P

n

= −

− π

π ( 1 π ) peut être approchée par la loi normale centrée réduite N(0;1).

On a Pr ob ( − 1 96 , < < U 1 96 , ) = 0 95 , . Cette relation équivaut à

Pr , ( )

, ( )

,

ob n P

π π π n

π π π

− −

< < + −

⎝ ⎜ ⎞

⎠ ⎟ = 1 96 1

1 96 1

0 95 . La valeur de π est inconnue.

Pour chaque valeur de l'entier n, on peut définir sur IR respectivement les fonctions G

1;n

et G

2;n

par les expressions suivantes :

G n x x x x

n et G n x x x x

1 1 96 1 n

2 1 96 1

; ( ) , ( )

; ( ) , ( )

= − −

= + −

Pour x = π, G n 1 1 96 1 n et G n n

2 1 96 1

; ( ) , ( )

; ( ) , ( )

π π π π

π π π π

= − −

= + −

Les représentations graphiques respectives des fonctions G

1;n

et G

2;n

dans un repère orthonormal sont deux arcs (E

1;n

) et (E

2;n

) d'une même ellipse qui passe par les points (0 ; 0) et (1 ; 1) (figure 2).

En effet, ( Gi n x ; ( ) x ) ( , ) x ( n x ) pour i

− = × − ;

2 1 96 2 1 =

1 2 ou encore

[ ]

x 2 1 3 8416 n x Gi n x n Gi n x 2 pour i

2 3 8416

0 1 2

⎡ +

⎣⎢

⎦⎥ − ⎡ +

⎣⎢

⎦⎥ + = =

,

; ( ) ,

; ( ) ;

On ne s'intéresse ici qu'aux parties des arcs (E

1;n

) et (E

2;n

) contenues dans un carré de côté 1 car 0 ≤ ≤ π 1 et 0 ≤ ≤ P 1 .

2.2 Cas des petits échantillons :

A chaque valeur de l'entier n, correspondent deux entiers naturels k

1;n

et k

2;n

tels que : k

1;n

est le plus grand entier tel que n k

k

k n k

C

k

n

=

∑ − −

0

1

1 0 025

;

( ) ,

π π

k

2;n

est le plus petit entier tel que n k k

n k n k

C

k n

=

∑ − − ≤

2

1 0 025

;

( ) ,

π π

La loi binomiale étant une loi discrète, les relations précédentes sont des inégalités.

D’où, Pr ob [ k 1 ; n < nP < k 2 ; n ] 0 95 , soit, Pr ob k n 1 ; n < < P k n 2 ; n 0 95 ,

⎣ ⎢ ⎤

⎦ ⎥ ≥ .

(6)

Pour chaque valeur de l'entier n on peut définir sur IR respectivement les fonctions G

1;n

et G

2;n

par les expressions suivantes :

G x

n et G x

n n n

n n

k k

1 1

2 2

; ;

; ;

( ) = ( ) =

Les valeurs numériques de k 1 ; n k 2 ; n n et

n figurent dans les tables de Fisher et Yates (Statistical tables for biological, agricultural and medical research).

Pour n fixé, l’ensemble des points ( ; x ; ) ( ; ; ) n et x

n

n n

k 1 k 2

est représenté par deux arcs de courbe (figure 2).

La figure 2 ci-dessous regroupe sur un même graphique pour n ≤ 100 les arcs de courbe obtenus à partir de la loi binomiale et pour n > 100 les arcs d’ellipses obtenus à partir de l’approximation par la loi normale N(0;1).

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

0 0,2 0,4 0,6 0,8 1

Proportion dans la population

Proportion dans l'échantillon

figure 2

(7)

3. Détermination graphique d'une estimation par intervalle de confiance de la proportion π Soit π

0

un réel. Sous l'hypothèse "π = π

0

" nous avons :

Pr , ( )

, ( )

,

ob n P

π π π n

π π π

0 0 0

0 0 0

1 96 1

1 96 1

− − 0 95

< < + −

⎝ ⎜ ⎞

⎠ ⎟ =

On prélève dans la population un échantillon aléatoire simple de taille n. La proportion p des individus de cet échantillon qui possèdent le caractère A est une estimation ponctuelle de π.

Si p appartient à l'intervalle π π π

π π π

0 0 0

0 0 0

1 96 1

1 96 1

− −

+ −

⎦ ⎥ ⎡

⎣ ⎢

, ( )

; , ( )

n n alors on

accepte l'hypothèse "π = π

0

". Cet intervalle est appelé intervalle d'acceptation de cette hypothèse.

Dans le cas des grands échantillons, les fonctions G

1;n

et G

2;n

sont bijectives. Notons respectivement G 1 ; n 1 et G 2 ; n 1 leurs fonctions réciproques.

Les relations suivantes sont équivalentes :

π π π

π π π

0 0 0

0 0 0

1 96 1

1 96 1

− −

< < + −

, ( )

, ( )

n p

n G 2 ; 1 n ( ) p < π 0 < G 1 ; 1 n ( ) p

L'intervalle ] G 2 ; n 1 ( ) ; p G 1 ; n 1 ( )[ p est une estimation de π par intervalle de confiance à 0,95.

Pour déterminer graphiquement cet intervalle, on représente sur l'abaque précédent (figure 2) les images respectives de p par les fonctions G 1 ; n 1 et G 2 ; n 1 .

Dans le cas des petits échantillons, on adopte la même démarche graphique.

Par exemple,

On prélève un échantillon aléatoire simple de taille n = 100 dans une population dont la proportion π d'individus possédant un caractère A donné est inconnue a priori.

La proportion p d'individus de l'échantillon possédant le caractère A est égale à 0,30.

≈≈≈≈≈≈≈≈

On obtient graphiquement les bornes 0,22 et 0,40 de l'intervalle associé à l'échantillon prélevé.

]0,22 ; 0,40[ est donc une estimation par intervalle de confiance à 0,95 de la proportion π

d'individus de la population possédant le caractère A.

Références

Documents relatifs

Le

Soit une population P d’effectif N caractérisé par les statistiques m , σ ,p ou f une moyenne ,une variance et une proportion de valeur inconnu .soit X une variable aléatoire de

Exercice 4 : La combustion complète de 0.35 g d’un composé A de formule brute C x H y a donné 0,45 g d’eau. Déduire celui du carbone.. 2/ a- Sachant que la masse molaire de A est

En supposant que les différents échantillons sont équiprobables, donner la distribution de l’estimateur de la moyenne de la population et calculer l’espérance

La liste complète de tous les distributeurs liégeois compte 5400 magasins (des grandes surfaces au &#34;night-shop&#34;). Pour réaliser ce sondage, un échantillon de 135 magasins est

Les nombres sur l’axe des abscisses représentent les numéros des simulations et les nombres sur l’axe des ordonnées représentent les fréquences (simulées) d’animaux

En ce qui concerne d’autre part les estimations de la moyenne et de la variance d’une population normale, les solutions classiques concernent toujours la moyenne

Supposer que c’est un échantillon simple et utiliser les caractéristiques suivantes pour construire un intervalle de confiance à 95% de l’écart type pour les