Fluctuation d’échantillonnage
I- Vocabulaire et propriété admise en Seconde
1) Rappel
Dans une population deN individus, présentant un caractère donné dans une proportion connuep, on appelle échantillon de taillenun ensemble denindividus choisis au hasard dans cette population.
On admet, après expérimentation sur des exemples, que, pour p P r0,2; 0,8s et n ě 25 , environ 95% des échantillons de taillenprésentent une fréquence du caractère dans l’intervalle
”
p´?1n;p` ?1n ı
. Cet intervalle est appelé intervalle de fluctuation des fréquences au seuil de 95% .
2) Exemple
Dans la population d’une communauté de communes, le dernier recensement a montré que 30% des 250 000 habitants ne partent pas en vacances au cours d’une année.
1) Pour des échantillons de taille 50, quel est l’intervalle de fluctuation au seuil de 95% ? 2) Pour des échantillons de taille 100, quel est l’intervalle de fluctuation au seuil de 95% ? 3) Pour des échantillons de taille 1000, quel est l’intervalle de fluctuation au seuil de 95% ?
On interroge 50 habitants de cette commune, et on note pour chacun s’il est parti au moins une fois en vacances au cours de l’année écoulée. On obtient dans cet échantillon une fréquence de non partants de 40% .
4) Cet échantillon semble-t-il représentatif de la population globale ?
5) Et si l’on trouve cette fréquence après avoir interrogé au hasard un échantillon de taille 1000 ?
II- Utilisation d’une loi binomiale
1) Exemple à l’aide d’un logiciel a) Échantillons de taille 50
On noteX la variable aléatoire qui à 50 habitants choisis au hasard dans cette population associe le nombre d’habitants partis au moins une fois en vacance au cours de l’année. Puisque 50 est très inférieur à 250 000, on considère que le fait d’interroger 50 personnes différentes revient au même que de choisir 50 personnes au hasard l’une après l’autre avec remise, car enlever 50 à 250 000 ne change pas beaucoup la population globale.
C’est pourquoi la variable aléatoireXsuit une loi binomiale de paramètres (50 ; 0,3).
Dans quel intervalle de valeurs de X doit-on se situer pour trouver au moins 95% des résultats possibles ? Dans le but d’ignorer 5 % des valeurs les moins fréquentes, on convient d’isoler les 2,5 % les plus faibles, en les cumulant à partir deX“0et les 2,5 % les plus fortes, en les cumulant en décroissant à partir deX“50. Pour cela, on utilise les probabilités « cumulées ».
Les extraits de tableau de la figure1page suivante montrent que :
• A partir dek“9,PpXďkqdépasse 0,025.
• A partir dek“22,PpX ďkqdépasse 0,975.
Donc pourXP r9; 22s, on cumule au moins 95 % des échantillons possibles.
Pp9ďXď22q “ppX ď22q ´PpXď8q «0,98772´0,01825«0,96947.
Pour au moins 95 % des échantillons de taille 50, le nombre de personnes ne partant pas en vacances est entre 9 et 22, donc la fréquence de non partants appartient à l’intervalle“9
50;2250‰
“ r0,18; 0,44s.
Utiliser de même les extraits de tableaux de la figure2page suivante pour déterminer l’intervalle de fluctuation au seuil de 95 % pour des échantillons de taille 100, puis de taille 1000.
Lycée Gustave Eiffel 1èreS1 - M. Herbaut 1/4
Figure1 – Extraits de tableau de la loi binomialeBp50; 0,3q
k P(X=k) P(X<=k) n= 50
0 0,000000018 0,0000000180 p= 0,3
1 3,8538537E-007 0,0000004034 2 4,0465463E-006 0,0000044499 3 2,7747746E-005 0,0000321977 4 0,0001397297 0,0001719274 5 0,0005509343 0,0007228617 6 0,0017708604 0,0024937221 7 0,004770481 0,0072642031 8 0,0109891437 0,0182533468 9 0,021978287 0,0402316341 10 0,0386189907 0,0788506248 11 0,06018544 0,1390360648 12 0,08382972 0,2228657849 13 0,1050174515 0,3278832364 14 0,1189483379 0,4468315743 15 0,1223468618 0,5691784361 16 0,114700183 0,6838786191 17 0,0983144425 0,7821930616 18 0,077247062 0,8594401236 19 0,0557572778 0,9151974014 20 0,0370387631 0,9522361646 21 0,0226767938 0,9749129583 22 0,012810916 0,9877238743 23 0,0066839561 0,9944078304 24 0,0032226217 0,9976304522 25 0,0014363685 0,9990668207 26 0,0005919101 0,9996587308 27 0,0002254896 0,9998842204 28 7,9381531E-005 0,9999636019 29 2,5808774E-005 0,9999894107 30 7,7426321E-006 0,9999971533 31 2,1408199E-006 0,9999992941
01 23
45 67
89 1011
1213 1415
1617 1819
2021 2223
2425 2627
2829 3031
3233 3435
3637 3839
4041 4243
4445 4647
4849 50 0
0,02 0,04 0,06 0,08 0,1 0,12 0,14
Figure2 – Extraits de tableaux de la loi binomialeBp100; 0,3qetBp1000; 0,3q
n= 1000 n= 1000
k P(X=k) P(X<=k) k P(X=k) P(X<=k)
……… ……… ……… ……… ……… ………
16 0,0005638655 0,0009688650 263 0,0010122622 0,0054581863
17 0,0011940681 0,0021629332 264 0,0012110994 0,0066692857
18 0,0023597061 0,0045226392 265 0,0014415673 0,0081108530
19 0,0043645691 0,0088872083 266 0,0017071192 0,0098179722
20 0,0075756449 0,0164628532 267 0,0020112769 0,0118292491
21 0,0123683999 0,0288312531 268 0,0023575682 0,0141868173
22 0,0190344855 0,0478657386 269 0,0027494528 0,0169362701
23 0,0276650287 0,0755307673 270 0,0031902381 0,0201265082
24 0,0380394144 0,1135701817 271 0,0036829844 0,0238094927
25 0,0495599228 0,1631301045 272 0,0042304028 0,0280398955
26 0,0612691353 0,2243992397 ……… ……… ………
27 0,0719669208 0,2963661606 322 0,0086582420 0,9390072565
28 0,0804120187 0,3767781792 323 0,0077889714 0,9467962279
……… ……… ……… 324 0,0069750445 0,9537712724
37 0,0268344565 0,9469544142 325 0,0062177539 0,9599890263
38 0,0190665875 0,9660210017 326 0,0055175073 0,9655065336
39 0,0129904223 0,9790114240 327 0,0048739187 0,9703804523
40 0,0084901688 0,9875015928 328 0,0042859067 0,9746663590
41 0,0053248446 0,9928264374 329 0,0037517967 0,9784181557
42 0,0032057738 0,9960322112 330 0,0032694229 0,9816875786
43 0,0018531715 0,9978853827 331 0,0028362279 0,9845238064
……… ……… ……… ……… ……… ………
Lycée Gustave Eiffel 1èreS1 - M. Herbaut 2/4
b) Échantillons de taille 100
A partir dek“21on aPpXďkq ą0,025et à partir dek“39on aPpXďkq ą0,975.
Pp21ďXď39q “PpX ď39q ´PpXď20q «0,979´0,016«0,963.
Pour 96,3 % des échantillons de taille 100, le nombreXde non partants est entre 21 et 39, donc la fréquence de non partants est entre 0,21 et 0,39.
L’intervalle de fluctuation des fréquences au seuil de 95 % estr0,21; 0,39s c) Échantillons de taille 1000
A partir dek“272on aPpX ďkq ą0,25et à partir dek“329on aPpXďkq ą0,975.
Pp272ďXď329q “PpXď329q ´PpX ď271q «0,978´0,024«0,954.
Pour 95,4% des échantillons de taille 1000, le nombreXde non partants est entre 272 et 329, donc la fréquence de non partants est entre 0,272 et 0,329.
L’intervalle de fluctuation des fréquences au seuil de 95 % estr0,272; 0,329s.
2) Définition
L’ intervalle de fluctuation au seuil de 95% d’une fréquence, sur un échantillon aléatoire de taillen, selon la loi binomiale de paramètresnetpest“a
n;nb‰ avec :
• a: le plus petit entier tel quePpXďaq ą0,025.
• b: le plus petit entier tel quePpXďbq ě0,975.
Définition
3) Méthode
Pour déterminer un intervalle de fluctuation des fréquences au seuil de 95 % dans le cas d’une loi binomiale de paramètrespn;pq:
1) Dresser le tableau des probabilités cumuléesPpXďkq.
2) Chercher le premier entierktel quePpX ďkqdépasse 0,025. On le noteadans la suite.
3) Chercher le premier entierktel quePpX ďkqatteint ou dépasse 0,975. On le notebdans la suite.
4) L’intervalle“a
n;nb‰
est un intervalle de fluctuation des fréquences au seuil de 95 %.
III- Utilisation d’un algorithme
1) Langage formalisé
Algorithme :Intervalle de fluctuation selon la loi binomialeBpn;pq Variables : N, P, A, B
Entrées : N, P Traitement
AÐ0
tant quePpXďAq ď0,25faire AÐA`1
fin B ÐA
tant quePpXďBq ă0,975faire B ÐB`1
fin
AÐA˜N BÐB˜N Fin
Sorties : Afficher « L’intervalle de fluctuation est »rA;Bs
Lycée Gustave Eiffel 1èreS1 - M. Herbaut 3/4
2) Programmation
TI-82 Stats.fr :Disp "TAILLE ECHANT"
:Input "N",N
:Disp "PROP POPULATION"
:Input "P",P :0ÑA
:While binomFRép(N,P,A)ď0.025 :A+1ÑA
:End :AÑB
:While binomFRép(N,P,B) < 0.975 :B+1ÑB
:End
:Disp "Intervalle [A,B]"
:Disp "A=",A˜N :Disp "B=",B˜N
Casio Graph 35+
"TAILLE ECHANT" : ?ÑNê
"PROP POPULATION" : ?ÑPê 0ÑAê
While BinomialCD(A,N,P)ď0.025ê A+1ÑAê
WhileEndê AÑBê
While BinomialCD(B,N,P) < 0.975ê B+1ÑBê
WhileEndê
"Intervalle [A,B]"ê
"A="ê A˜N ê
"B="ê B˜N
IV- Comparaison des deux méthodes
Intervalle de fluctuation au seuil de 95 % Taillende l’échantillon Avec loi binomiale Avec approximation Ecarts
50 [0,18 ; 0,42] [0,159 ; 0,441] environ 0,021 de chaque côté
100 [0,21 ; 0,39] [0,2 ; 0,4] environ 0,01 de chaque côté
1000 [0,272 ; 0,329] [0,268 ; 0,332] environ 0,004 de chaque côté Lorsque la taille de l’échantillon augmente, l’intervalle de fluctuation obtenu par approximation devient de plus en plus proche de celui obtenu avec la loi binomiale, donc est plus fiable.
Lycée Gustave Eiffel 1èreS1 - M. Herbaut 4/4