R EVUE DE STATISTIQUE APPLIQUÉE
A. V ESSEREAU
Quelques remarques sur les plans d’échantillonnage
Revue de statistique appliquée, tome 16, n
o1 (1968), p. 5-35
<
http://www.numdam.org/item?id=RSA_1968__16_1_5_0>
© Société française de statistique, 1968, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
QUELQUES REMARQUES
SUR LES PLANS D’ÉCHANTILLONNAGE
A. VESSEREAU
L’étude
théorique
desplans d’échantillonnage simple
par attributspeut
être considérée comme achevéelorsqu’on
a écrit :- les relations
qui
lient lesparamètres
duplan :
effectif de l’échan- tillon(n)
et critèred’acceptation (A)
aux conditions que l’on s’estfixées,
risque
du fournisseur( a)
associé à uneproportion
pld’individus
défec-tueux, et
risque
du client(03B2)
associé à uneproportion p2.
Fig.
1-
l’équation
de la courbe d’efficacité :Dans la
pratique,
bien des difficultés seprésentent
et bien des er-reurs
peuvent
être commises si l’onapplique
unplan (choisi
sanspré- caution)
dans un recueil de tablesd’échantillonnage -
les MIL STD 105 D parexemple.
1/
Leséquations (1)
et(2),
déduites de la loibinomiale, supposent
que l’échantillon estprélevé
defaçon
nonexhaustive,
cequi
n’estprati- quement jamais
réalisé.Jusqu’à quel degré
d’exhaustivité -qui peut
être mesuré par lerapport N
de l’effectif d’échantillon à l’effectif delot,
ou"taux
deprélèvement" - peuvent-elles
être considérés commepratique-
ment valables ?
2/
n et A devant être des nombresentiers,
leséquations (1)
nepeuvent
pas être exactement satisfaites pour toutes valeurs des conditions(pi , a) (p2,03B2).
D’autrepart,
si aet P peuvent
àpriori
être arbitraire- mentchoisis,
il sembleraitqu’il
nepuisse
pas en être de même pourpl
etp2 : lorsque
l’effectif de lot est N =50,
comment pi 1 et p 2pourraient-
ils
prendre
des valeurs autres que 0%,
2%,
4%,
... ?3/ Compte
tenu du fait que dans lespetits lots,
laproportion
dedéfectueux p ne
parait susceptible
deprendre
que des valeurs disconti- nues, n’est-t-il pasabusif,
dans ce cas, deparler
de"courbe"
d’effi- cacité ?Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
6
Cependant
des tablesd’échantillonnage d’emploi
très courant - lesMIL STD 105 D
[1 ] paraissent ignorer
toutes ces difficultés - Les courbes d’efficacité desplans qu’elles
contiennent sont toutes déduites de la loibinomiale,
ou de sonapproximation
par la loi de Poissonlorsque
celle-ci estvalable, quel
que soit lerapport
entre l’effectif de l’échantillon et l’effectif de lot(qui
varie de N = 2 à N >500000).
Aucune restriction n’est faite sur les valeurs de p"possibles" compte-tenu
de l’effectif delot ;
enparticulier,
leNQA (niveau
dequalité acceptable) qui
corres-pond
à peuprès
à laproportion p, de
la théorieclassique,
est souventune
proportion "non possible"
pour un lotparticulier.
Des remarquesanalogues peuvent
être faites à propos du contrôle par mesures, et notam- ment des tables MIL STD 414[2].
Nous discuterons ces différents
points
à propos del’échantillonnage simple
par attributs. Une distinction essentielle devra être faite entre le contrôle d’unlot
isolé et le contrôle d’une série de lotsprovenant
d’unemême
fabrication.
Mais une
première
observation d’ordregénéral
ne serapeut-être
pas inutile. Le contrôle de
réception
n’a pas pour but d’estimer la pro-portion
p de défectueux dans le ou les lotscontrôlés,
mais de conduire pourchaque lot,
à une décisiond’acceptation
ou derejet.
Sans doute les résultats du contrôlepermettent généralement
d’estimer p, mais cela né- cessiteparfois
certainesprécautions : ainsi,
dansl’échantillonnage
doubleou
multiple,
seuls les résultats obtenus sur le 1 er échantillon donnent uneestimation sans biais de p - dans
l’échantillonnage progressif
on nepeut
estimer p sans biais.
1 - CONTROLE PAR ATTRIBUTS DE LOTS ISOLES
Nous ferons ici encore deux remarques
préliminaires.
La
première
concerne le choix desproportions
p, 1 et p2.Lorsqu’on procède
au contrôle d’un lotisolé,
on nepossède généralement
pas d’in- formation apriori précise
sur la"qualité probable"
du lot. Sans douteest-on à peu
près
sûr que laproportion
p de défectueux n’est pas"très élevée",
mais cette formulation esttrop
vague pourguider
dans le choix des valeurspl
i etp2 qui,
avec lesrisques
associés a etP,
servent àdéterminer le
plan
decontrôle ; pi
etP2
résulteront d’un accord entre fournisseur etclient,
sans que ce dernier sache si le fournisseurpeut
tenir ces conditions.
La deuxième
porte
sur lasignification
desrisques
aet P qui, ré- pétons le, représentent,
pour a associé àpl,
uneprobabilité (faible)
derejeter
un lotacceptable,
etpour P
associé àp2
uneprobabilité (faible) d’accepter
un lot que l’on auraitpréféré rejeter.
Chacun a unenotion, plus
ou moinsclaire,
de cequ’il
faut entendre par une"faible proba- bilité".
Mais - tout au moins dans lesproblèmes qui
nousoccupent
ici -des valeurs
numériques
de a et03B2, (par exemple 0,01, 0, 05, 0, 10... ) n’acquièrent
un sens concret que si on leur donne lasignification
de"fré- quences"
dans un processusrépétitif. Or,
dans le casoù
nous nouspla-
çons, contrôle d’un lot
unique,
la décision seraégalement unique :
ac-ceptation
ourejet.
On doit doncimaginer
un processusrépétitif potentiel
défini de la
façon
suivante :Si le lot
présenté
contient uneproportion pl
d’individusdéfectueux,
et si on lui
applique
ungrand
nombre defois,
defaçon indépendante,
leplan
decontrôle, chaque
contrôle donnant lieu à l’une des décisions"ac-
Revue de Statistique Appliquée, 1968 - vol. XVI - N" 1
7
ceptation"
ou"rejet",
laproportion
des décisions"rejet"
sera voisinede a. D’où l’on
déduit,
par uneopération
intellectuellequi,
à notreavis ,
n’estplus
du domaine desmathématiques ("les
événements de très faibleprobabilité
ne seproduisent pas"
disait EmileBorel)
que, dans le con-trôle
unique auquel
le lot estsoumis,
il sera"très probablement accepté" .
La même remarque vaut naturellement pour le
couple
de valeurs(p , j3 ).
Dans tout
ce §
nous nousimposerons
la conditionpratique
de"non- exhaustivité" généralement admise N . 0..
10.Ainsi,
pour un lot d’effectifN
= 50,
nous admettrons que l’effectif de l’échantillon ne doit pasdépasser 5 ;
pour N =1 000,
cet effectif devra être au maximum de 100. Dans le§2,
nous discuterons cette condition et montrerons
qu’elle peut,
sans gravedanger,
être sensiblementélargie.
Nous examinerons successivement les différents moyens
qui
per- mettent de déterminer leplan répondant "au mieux"
aux conditions fixées .1. 1 - Tables de la loi binomiale
Les tables les
plus
courantes de la loi binomiale sont :- les Tables du National Bureau of Standards
[3] ]
- les Tables de H. G.
Romig [4]
Les Tables du National Bureau of Standards donnent les valeurs de la fonction de distribution de la loi binomiale sous la forme
pour n =
2(1)...
49p =
0,01 (0,01).... 0,50 r = 1(1)...
nDans le contrôle par
attributs,
on refuse le lot si le nombre de dé- fectueux trouvés dans l’échantillondépasse
le critèred’acceptation A.
Ona donc la
correspondance :
Etant donné les
proportions pl
1 etp 2 (compatibles
avec l’effectif dulot)
et lesrisques
associés a et03B2,
on cherchera dans les tables lecouple
de valeurs(n, r)
tel que :et l’on
prendra
A = r - 1.Les tables de H. G.
Romig
donnent les valeurs de la fonction de distribution de la loi binomiale sous la forme :Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
8 pour
n=50(5)....
100p=
0,01 (0,01).... 0,50 x=0(l)....(n-l)
Le critère
d’acceptation
A = x s’obtient ici en cherchant dans la table lecouple (n, x)
tel queMalgré
leur différence deprésentation, qui
est assezgênante,
lesTables du National Bureau of Standards et celles de
Romig
secomplètent.
Elles fournissent les solutions existantes pour tout effectif d’échantillon de 1 à 49
(N. B. S. )
et pour des effectifs d’échantillon échelonnés de 5 en 5depuis
50jusqu’à
100(Romig).
Pour un effectif d’échantillon n, lesplans
sont valables pour un effectif de lot N 10n
(condition pratique
de nonexhaustivité).
Une fois lesparamètres
deplan (n,A) déterminés,
les tables fournissent despoints
de la courbe d’efficacité.Mais pour des lots de faible
effectif,
les solutionscorrespondant
aux valeurs
"les plus
voisines de aet ?", peuvent
en fait donner des valeurs fortéloignées
pour l’un ou l’autrerisque,
ou même les deux.Il est en
particulier parfaitement
vain derechercher,
pour depetits lots ,
un
plan comportant
desrisques
très faibles pour des valeurs depl
etP2
très voisines.Il faudra donc le
plus
souvent reconsidérer les données dedépart
(Pl" ex L (p2,03B2)
et chercher uncompromis
admissible en se montrant moinsexigeant.
Ou bien - si cela estpossible - procéder
à un contrôleà 100
%.
Nous illustrerons ce
qui précède
par deuxexemples.
1 er
Exemple -
On pose la condition stricte p=
2%
associée à unrisque
a voisin de
0, 05 ; plus précisément
ons’impose 0, 03
ex0,07.
Lesplans
satisfaisant à ces conditions sontindiqués
dans le tableau 1 avec la valeur durisque P
pourp2 - 10 %.
L’effectif de l’échantillon est un mul-tiple
de 5 àpartir
de n = 50.Pour n limité à 100
(condition imposée
par les tables de la loi bi-nomiale)
on trouve au total 31plans.
Si l’on pose la conditionplus
stricte0,
04 a0, 06,
il n’en reste que17, et,
avec0,
045 03B10,
055 il n’en reste que neuf.Mais la constatation la
plus
intéressante est la suivante :Pour des lots d’effectif inférieur ou
égal
à200,
lerisque (asso-
cié à
P2
= 10%)
nepeut
pas être abaissé au dessous de0, 40.
Il s’abaisse à0, 22
pour des lots d’effectif au moinségal
à400 ;
il faut un effectifde lot au moins
égal
à 650 pourqu’il
nedépasse
pas0, 10.
2 e
Exemple -
On pose la condition strictepl
= 4%,
et pour a les mêmeslimites, 0,03
a0,07.
Le tableau 2 donne lesplans correspondants ,
avec la valeur
de (3
pourp2
= 16%.
Sans
qu’il
soit besoind’insister,
on constatequ’on
est"plus
àl’aise"
pour le choix d’un
plan,
parcequ’on
s’est montré moinsexigeant
sur ladistance
séparant
lesproportions p
1 etP2.
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
9 Tableau 1
p1 = 2 % 0,03 03B1 0,07
(1)
Effectifs d’échantillonmultiples
de 5 àpartir
de n = 50.(2) D’après
lacondition N 0,
10. Cette conditionpeut
êtreassouplie
sanserreur grave, au moins
jusqu’à n N 0,
15.(cf § 2)
On trouvera en Annexe
2,
une collection deplans
pour les conditions suivantes :Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
10 Tableau 2
p1 = 4 % 0,03 03B1 0,07
(1)
Effectifs d’échantillonmultiples
de 5 àpartir
de n = 50.(2) D’après
lacondition N 0,
10. Cette conditionpeut
êtreassouplie
sanserreur grave, au moins
jusqu’à n N 0, 15. (cf. §2).
1. 2 - Tables de la loi de Pois son
On admet
généralement
que la loi binomiale deparamètres (n , p)
est
assimilable,
avec une très faible erreur, à la loi de Poisson de pa- ramètre m = np si n50,
p0,10.
On pourra donc utiliser les tablesRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
11
de cette
loi,
à condition que l’effectif du lot soit au moinségal
à500,
et que la
proportion p2
nedépasse
pas 10%.
Les tables les
plus
courantes de la loi de Poisson sont :- les Tables de
E. C.
Molina[5]
- les Tables du
"Defense Systems Department,
General Elec-Company" [6].
Les Tables de Molina donnent les valeurs de la fonction de distri- bution de la loi de Poisson sous la forme :
Lorsqu’on
lesutilise,
on recherche lescouples
de valeurs(a1, c) ,
(a c)
tels quea2 a2 # P2
et que lesprobabilités correspondantes
lues dansla table soient
respectivement
voisines de a et 1 -p.
L’effectif de l’échan- tillon est n =a2 = a1,
et le critèred’acceptation
A = c - 1.P2 Pl
Les tables de la General Electric donnent les valeurs de la fonc- tion de distribution de la loi de Poisson sous deux formes :
Leur mode
d’emploi
est le même que celui des tables de Molina si on utilise la fonctionD(x).
Si l’on choisit la fonctionC(x),
les valeursde cette
fonction,
pour une même valeur x, et pourul
etu2
tels queu2 u1 # p2 p1
doivent êtrerespectivement
voisines de 1 - a etP.
Le critèred’acceptation
est A = x.Quelles
que soient les tablesutilisées,
on doit vérifier que la valeurn vérifie la
condition n N 0, 10.
Les tables
permettent
aussi d’obtenir despoints
de la courbe d’effi- cacité : on doit se limiter aux valeurs de p0, 10.
3 e Exemple -
On fixep =
2%
avec oc voisin de0,
05P2
= 10%
’ ,P
"0, 10
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
12 Les tables de Molina montrent que :
On a :
d’où
Il faut que l’effectif du lot soit au moins
égal
à 650Le Tableau 1 ci-dessus montre que, pour le
plan (n
=65,
A =3),
les
risques
exacts(loi binomiale)
sont :4 e Exemple -
Soit un lot d’effectif N = 300. On fixep =
4%,
et oc voisinde
0, 05.
L’effectif de l’échantillon doit être au maximum
égal
à 30. Les va-leurs de u 1
(tables
de la GeneralElectric)
sont :soit :
On trouve dans la table que la
plus
faible valeur durisque P
asso-cié à
P2
=0, 16 (16 %) correspond
auplan :
Le tableau 2 ci-dessus montre que, pour le
plan (n = 30,
A =3)
lesrisque
exacts(loi binomiale)
sont :L’approximation
par la loi de Poisson est moins bonne que dans lecas
précédent (surtout
pour lerisque 03B2)
parce que l’effectif de l’échantillon est inférieur à50,
et p2 estsupérieur
à0, 10.
1. 3 -
Abaques
de R.C avé
L’emploi
des tables de la loi binomiale ou de la loi de Poisson estassez
compliqué.
Maislorsque l’approximation
par la loi de Poisson estvalable,
on obtient trèsfacilement, grâce
auxabaques
de R.Cavé [7]
les
plans correspondant
aux valeurspi
etP2
choisies et :Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
13 5 e
Exemple -
On fixePour
p2 =
5 et les valeurs de aet 03B2 choisies,
on lit sur le 1 erPl
abaque
A =3, puis
sur le 2 eabaque :
ml = npl - 1,
36 m2 =np2 = 6,
50 Onprend :
(le
lot doit avoir un effectifN 650)
L’abaque permet
aussi de trouver lespoints
de la courbe d’effica- cité pour lesprobabilités d’acceptation :
(à
condition que les valeurscorrespondantes
de pjustifient l’appro-
ximation de
Poisson)
4. 4 - Tables de la variable F
Soit une variable binomiale X de
paramètres (n, p)
et :Soit d’autre
part
la variable F àYI
=2(A
+1), 03B32 = 2(n - A) degrés
de
liberté,
et le fractile 1 - P défini par :On a l’identité :
Les
paramètres (n, A)
duplan (p1, 03B1), (p2, P)
sont donc tels que :Les tables de F ne donnant les valeurs de cette variable que pour
P 0,
50on utilisera l’identité :
Revue de Statistique ApplIquée. 1968 - vol. XVI - N’ 1
14 D’où les relations :
qui permettent théoriquement
de trouver leplan (n, A) correspondant
à desconditions
(pl 03B1), (p2,03B2)
données.En fait leur
emploi
dans ce sens est peupratique.
Maislorsqu’un plan (n,A)
estdonné,
ellespermettent
d’obtenir assez facilement un ordre degrandeur
desrisques
ocet (3
attachés à desproportions p
1 etp2.
Les Tables de Hald
[8]
donnent les fractiles de F pour différentes combinaisons dedegrés
de liberté.6 e
Exemple -
Soit leplan
n = 70 A = 5(N 700)
Pour p =
0,
04(4 % ),
on a :On trouve, par
interpolation
linéaire 1 - a# 0,935 03B1 # 0, 065
Pour
p 2 = 0,
16(16 %) :
On trouve
1 - 03B2 # 0,
97503B2 # 0, 025
Les valeurs exactes des
risques (loi binomiale,
cf Tableau2)
sont:1. 5 - Tables MIL STD 105 D
(1)
Ces tables ont été conçues pour le contrôle d’une succession de lots
provenant
d’une même fabrication(cf §
3 -ci-après).
Les courbesd’efficacité
qu’elles
contiennent ont été établies dansl’hypothèse
de la loibinomiale
(non exhaustivité)
ou de sonapproximation
par la loi de Poisson.Leur
emploi
pour le contrôle d’un lot isoléexige
certainesprécautions.
Revue de Statistique Appliquée, 1968 - vol. XVI - N 1
15
On ne doit pas utiliser la
"Table 1" qui
donne la"lettre-code
d’ef- fectifd’échantillon"
en fonction de l’effectif N du lot et du"niveau
decontrôle".
On ytrouverait,
parexemple,
pour des lots d’effectifcompris
entre 16 et
25,
leplan
C où l’effectif d’échantillon est de 5. Pour un lotisolé,
onaurait N » 0, 10.
On ne doit pas non
plus
se baser sur la valeur duNQA (niveau
dequalité acceptable) qui correspond
à laproportion pl,
avec unrisque qui,
selon lesplans, peut
varier de0,01
à0, 12 :
on trouverait parexemple,
pour des lots d’effectif
compris
entre 2 et8,
unplan
pourlequel
leNQA
est de
0,065 (6,5 %
dedéfectueux),
cequi
est àproprement parler
absurde !Il faut
procéder
de lafaçon
suivante :a)
calculer l’effectif maximum n del’échantillon, compte-tenu
del’effectif N du lot et de la
condition N 0,
10.b)
consulter lesgraphiques
X = courbes d’efficacité de tous lesplans
du MIL STD 105
D,
ou les tableaux Xqui
donnent despoints particuliers
de ces courbes. Les tableaux X ont deux
entrées, qui correspondent
au"contrôle normal"
et au"contrôle renforcé" ;
onpeut
utiliser l’une oul’autre,
la distinction nes’appliquant
pas au cas d’un lot isolé. On choi- sira leplan (n, A) qui,
pour les valeurspl
1 etp2 données,
ou des va-leurs
voisines, comporte
desrisques
voisins des valeursa, p,
choisies(naturellement,
comme on l’aindiqué
en 1 -1,
dans le cas depetits
lotson pourra ne trouver aucun
plan répondant
à cesconditions).
Les tables donnent aussi les
plans
double etmultiple
de même effi-cacité : la
condition n N 0, 10 s’applique
alors à l’échantillon total sus-ceptible
d’êtreprélevé.
7 e
Exemple -
N = 800Pl =
2%
a =0, 05 p2 =
10% P
=0, 10
On doit avoir n 80Les
plans
pourlesquels
les conditions fixées sontapproximative-
ment réalisées sont les suivants :
"H-NQA 1, 5 (contrôle normal)",
ou"H-NQA = 2, 5 (contrôle renforcé
n = 50 A =
2 ;
a =0, 08
pourp1 = 2 %, 03B2 = 0,11
pourp2 =10 %
"J-NQA =1,5 (contrôle normal)"
ou"J-NQA = 2, 5 (contrôle renforcé)"
n = 80 A =
3 ;
ex =0,
08 pourp = 2 %, j3 = 0, 04
pourp 2
= 10%
Le
plan
n =65,
A =3, qui correspond
presque exactement aux con- ditions fixées(cf
Tableau1 ;
a =0,041, P = 0, 10)
nefigure
pas dans les MIL STD. Il n’existe pas de"lettre-code
d’effectifd’échantillon"
pourlaquelle
n = 65.Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
16
2 - CONDITION DE NON-EXHAUSTIVITE ET APPROXIMATION DE POIS- SON
En toute
rigueur,
dans le cas d’un lotisolé,
leplan
d’échantillon- nage devrait être établi àpartir
de la loihypergéométrique (tirages exhaustifs). L’approximation
par la loi binomiale est considérée commebonne
si n N 0, 10 ; qu’arrive-t-il lorsque
le taux deprélèvement
dé-passe 10
% ?
D’autre
part,
que doit-on entendre exactement par"erreur négli- geable" lorsqu’on
utilisel’approximation
de Poissonquand-
celle-ci estconsidérée comme valable ?
Nous devons à
l’obligeance
de M.Rouzet, Ingénieur
à laCompagnie
des
Compteurs,
communication deplans d’échantillonnage
calculés à par- tir de la loihypergéométrique,
dans les conditions suivantes :Risques théoriques a = p
=0,
05Risques
réels0, 022
a0,075 0, 045 03B2 0, 055
Les
risques
réels ne sont connus que par leur"fourchette".
Celle-ci est très étroite pour lerisque (3
associé àP2 ;
c’estpourquoi
c’est sur-tout sur ce
risque
que nous avonsporté
notre attention dans l’étudecritique ci-après.
Les
"plans hypergéométriques" correspondent
à des taux depré-
lèvement n N qui
vont de moins de 5%
àplus
de 75%.
On a parexemple ,
pour le même
risque 0, 05 ( a
tombant dans la fourchetteindiquée
ci-dessus) :
Soit,
pour une valeur donnée deP2’
unplan particulier (n, A)
pourlequel
le taux deprélèvement
estn N.
Si l’onapplique
à ceplan
la loi bi- nomiale ou la loi dePoisson,
on trouverapour j3
une valeurplus
ou moinsdifférente de
0, 05,
soit(loi binomiale)
(loi
dePoisson)
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
17
Les valeurs de
?"
ont été recherchées pour tous lesplans (au
to-tal 396
plans)
dans les tables de la loi de Poisson : la condition p0, 10
était satisfaite pourtous,
la condition n 50 pour laquasi-totalité (pour
10
plans seulement,
n estcompris
entre 41 et49).
Les valeurs de
03B2’
ont été calculées directementchaque
fois que les calculs étaient raisonnablementpossibles (plans
pourlesquels
A =0, 1, 2, 3) -
soit 113plans.
On obtient
ainsi, chaque plan
étant caractérisé par une valeur de p ,une valeur de
p2,
et une valeur den N :
On constate que
(3’
etj3" dépendent
très fortementde n N
et relati-vement peu de
p 1 et p2 (dans
la limite des valeurs dep1et p2 utilisées).
Il
para1t
donclégitime
decalculer,
pourchaque
valeurde n N
, lamoyenne des
03B2’
et la moyenne des03B2"
pour toutes les valeurs associées dep
etp.
On aboutit ainsi à des"relations moyennes" :
(loi binomiale)
(loi
dePoisson)
alors
que (loi hypergéométrique)
estindépendant de N
et voisin de0,05 (0,045 03B2 0,055)
Ces relations sont
représentées graphiquement
sur lafigure ci-après qui permet
les constatations suivantes :1/ j3’ p" - L’approximation
de Poisson(dans
les conditions où elle est considérée commevalable)
surestime lerisque 03B2,
de0,
05 à 1%,
par
rapport
aurisque
calculé dansl’hypothèse
binomiale.2/ Pour N 0, 10, e’ (loi binomiale)
tombe dans la fourchette durisque P
calculéd’après
la loihypergéométrique.
3/
PourN - 0, 15, p’ est
de l’ordre de0, 065,
et pourN - 0,20
del’ordre de
0, 07.
La différence entre ces valeurs et la valeurexacte,
voisine de0, 05
donne l’ordre degrandeur
de la surestimation durisque quand
on le calcule par la loi binomiale et que le taux deprélèvement
est de 15 ou de 20
%.
En
définitive, l’application
de la loi binomiale au dela de la limite0, 10
etl’approximation
de Poissonjouent
dans le même sens, ensurestimant le
risque,
telqu’il
résulte del’application
de la loihyper- géométrique.
Ellesjouent
toutes les deux dans le sens de la"sécurité" , puisque
lerisque
réel est inférieur aurisque
calculé.Par
exemple,
si l’on admet unrisque (3 = 0, 05,
etsi,
pour avoirun
plan
aussi sélectif quepossible,
onprélève
un échantillon d’effectifRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
18 Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
19
n =
0,
15N,
on pourra déterminer le critèred’acceptation
en échantillon - nage non-exhaustif(loi
binomiale ouapproximation
dePoisson)
àpartir
d’un
risque 0, 065.
Si le taux deprélèvement
est de 20% (n N = 0, 20 )
on pourra, dans les mêmes
conditions, partir de 0,
07.Une étude semblable
conduit,
pour lerisque
a, à des conclusionsanalogues -
mais avec moins deprécision,
parce que lerisque
exact pour leprélèvement
exhaustif n’est connuqu’à
l’intérieur d’une four- chette assezlarge (0, 022
à0, 075).
Ces conclusions sont valables pour des valeurs de pl allant de 1 à 5
%,
des valeurs de p2 allant de 2 à 10%,
et desrisques
aet p
voisinsde
0,05.
Ce sont des conditions assez courantes dans lapratique,
etil est
permis
de penser que les mêmes conclusionss’appliquent,
en gros, à des conditions un peu différentes. On doit surtout retenir de cequi précède qu’il n’y
a pas d’inconvénient grave àassouplir
la conditionclassique n N 0, 10,
et à traiter comme non-exhaustifs desprélèvements
exhaustifs pour
lesquels
le taux deprélèvement
atteint 15 et même 20%.
D’ailleurs,
il n’estgénéralement
paspossible,
que l’on fasse les calculsen
"exhaustifs", "non-exhaustifs",
ouapproximation
dePoisson,
d’obte- nir exactement lesrisques
que l’on a choisis.Enfin,
pour un lotisolé ,
la notion même derisque,
ou de"probabilité d’erreur", présente
un ca-ractère relativement conventionnel.
3 - CONTROLE PAR ATTRIBUTS D’UNE SERIE DE LOTS
Lorsqu’on procède
au contrôle d’une sérieimportante
de lots prove- nant de la mêmefabrication,
la situation est toute différente.Tout
d’abord,
on a,d’après
les résultats des livraisonsprécédentes,
une information sur la
qualité généralement fournie,
cequi
aide à fixer les valeurs dep et p2 (ou,
si l’onapplique
les MIL STD 105D,
le ni-veau de
qualité acceptable NQA,
et éventuellement laqualité
limiteLQ).
D’autre
part,
lesrisques prennent
lasignification
concrète de"fré-
quences If
; les lots de laqualité pi
serontacceptés
dans laproportion
1 - ex, ceux de la
qualité p2
dans laproportion (3.
Pour toute autre qua-lité,
la courbe d’efficacité donne laproportion
des lotsqui
serontacceptés.
Mais la différence essentielle réside dans le
principe
même du con- trôlequi
ne consiste pas àjuger chaque
lotisolément,
mais la fabrica- tion à travers les lots livrés. Cequi
entraîne lesconséquences
suivantes1/
Lesproportions
telles quepl
etP2 (ou NQA
etLQ) s’appliquent
à la fabrication et non à un lot
particulier :
ellespeuvent
donc avoir des valeursquelconques.
Si le contrôle s’effectue sur des lots d’effectif N =8 ,
il n’est pas absurde deprendre
pi =6, 5 % :
cetteproportion
nes’applique
pas à N =
8,
mais à l’effectiftotal, supposé important,
de la fabrication.2/ Accepter
ourejeter
unlot,
c’estaccepter
ourejeter
la fabricationjugée
à travers lelot,
etappliquer
cette décision au lot. Pour voir s’il estlégitime d’appliquer
la loi binomiale aucontrôle,
il faut comparer l’effectif n del’échantillon,
non pas à l’effectif N deslots,
mais à l’ef-fectif
beaucoup plus important (d’ailleurs généralement inconnu)
de lafabrication d’où sont issus les lots. Il est en effet
rigoureusement équi- valent(cf.
Annexe1) :
:Revue de Statistique Appliquée, 1968 - vol. XVI - N 1
20
- de
prélever
directement un échantillon d’effectif n dans lafabrication,
- d’effectuer un
premier prélèvement
d’effectif N(lot)
dans lafabrication, puis
un deuxièmeprélèvement
d’effectif n(échantillon)
dans le
lot,
sansqu’il
soit nécessaire de supposer que cesprélèvements
sont
"non-exhaustifs"
parrapport
à lapopulation
d’où ils sont issus.Il suffit donc pour que la loi binomiale
(ou l’approximation
de Pois-son) puisse
êtrelégitimement appliquée
que la"condition pratique
de non-exhaustivité"
soit vérifiée entre l’effectif de l’échantillon et l’effectif de la fabrication - cequi
serapratiquement toujours
le cas.Dans ces
conditions,
si la fabrication est dequalité
p pi(ou
pNQA)
elle seraacceptée
avec uneprobabilité
1 - a, cequi
veutdire
qu’au
maximum uneproportion
a des lots serarejetée ;
de mêmesi p p2
(ou p >. LQ)
uneproportion maximale P
des lots seraacceptée .
3/ Compte
tenu de cequi précède,
on voit que le nombre deplans disponibles
estplus important
que dans le cas des lotsisolés, puisque
l’effectif de l’échantillon
peut (théoriquement
tout aumoins)
allerjusqu’à
N - 1. En
particulier,
lesplans
donnés en Annexe 2 deviennent valablesquel
que soit l’effectif de lot. D’un autre côté les MIL STD 105 D donnentune sélection de
plans applicables
sans restriction au contrôle d’une sé- rie delots,
larègle
de rattachement de l’effectif d’échantillon à l’effec- tif de lotn’ayant
aucun caractèreobligatoire.
On fait
parfois,
à cequi
vient d’êtredit, l’objection
suivante : Il est bien vraiqu’il
estéquivalent
deprélever directement,
defaçon qui peut
être considérée comme non-exhaustive un échantillon d’effectif ndans une fabrication d’effectif
M,
ou deprocéder
par l’intermédiaire d’un lot d’effectifN,
la condition de non-exhaustivitén’ayant
pas besoin d’êtresatisfaite,
entre N et M d’unepart,entre
n et N d’autrepart.
Mais au fur et à mesure que les contrôles se
poursuivent,
le"grand lot"
constitué par la fabrications’épuise ;
pour le dernier lot parexemple,
leprélèvement
de n s’effectuera au sein de N individus defaçon
exhaustivesi n N
>0, 10.
C’est cequi
seproduit lorsqu’un
four-nisseur, après
avoir reçu une commandeglobale
de Mobjets
à livrer aucours d’une certaine
période,
constitue un stock de ces Mobjets
àpartir
d’une fabrication exécutée une fois pour
toutes, puis
les livre à la demande par lots de N.Le
problème
ainsiposé peut
s’énoncer de lafaçon
laplus générale
suivante :
L’ensemble des lots est
"totalement exhaustif"
parrapport
à la fa- brication.Chaque
lot est exhaustif parrapport
à lafabrication,
ou cequ’il
en resteaprès
contrôle des lotsprécédents. Chaque
échantillon est exhaustif parrapport
aulot,
mais non parrapport
à l’effectif initial M de la fabrication. Cette dernièrecondition, qui justifie
pour les pre- miers lotsl’emploi
de la loibinomiale,
est-elle encore valable au furet à mesure que la fabrication
s’épuise ?
La
réponse
est oui. En effet :Soit À le nombre de lots d’effectif
N ;
M = B N1/
La suite des B lotsprésentés
en recette constitue unepartition particulière
des Mobjets
en groupes de N(il
y am! (N!) 03BB partitions
dis-Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
21
tinctes,
et03BB! (M)! (N’)03BB si,
danschaque partition,
ondistingue
les lots sui-vant un ordre
chronologique.
2/
Pour unepartition donnée,
la loi deprobabilité
àpriori
dunombre de défectueux dans chacun des lots constituant cette
partition
est lamême,
c’est la loi :(D =
nombre de défectueux dans lafabrication)
et la loi deprobabilité
àpriori
du nombre de défectueux dans un échantillon de nprélèvé
danschacun de ces lots est
également
la même. C’est la loi(cf.
Annexe1).
3/
Le fait que l’on examine les lots les unsaprès
les autres nemodifie en rien cette
propriété
si l’on ne tient pascompte,
lors du con- trôle d’unlot,
des résultats obtenus sur les lotsprécédents.
Il en résulteque le raisonnement fait pour un lot
particulier s’applique
à tous les lots .Lorsqu’on prélève
un échantillon d’effectif n dans l’unquelconque
d’entreeux, tout se passe comme si on avait
prélevé
cet échantillon dans la totalité de la fabrication. La loi du nombre de défectueux dans cet échan- tillon est la loi binomiale(n, p
=7).
4/
Il est bien vrai que la loi du nombre de défectueux dans l’échan- tillon du(r
+1)ième
lot n’ estplus
la même si l’on tientcompte
des résul- tats obtenus dans les r lotsprécédents :
si parexemple
tous ces lots ont étérejetés,
il est bienprobable qu’il
le sera aussi. Plusprécisément,
siles
échantillons issus des rpremiers
lots ont contenukl, k2, k3 ... kr défectueux,
l’estimation de laproportion
de défectueux dans la fabrication est :et suivant la
place
de l’estimationPr
parrapport
auxproportions
fixéesp
etP2’
le(r
+1)ième
lot auraplus
ou moins de chances d’êtreaccepté
ou
rejeté.
Mais cela ne modifie en rien la validité duplan
decontrôle,
dont le but n’est pas d’estimer p mais de conduire pour
chaque
lot àune décision
d’acceptation
ou derejet (cf.
la remarque faite au début de cetarticle,
immédiatement avantle §1).
Si laproportion
de défectueux dans la fabrication est exactementégale
àpi,
il est trèsimprobable
quepar
soit très différent de pl. Si cela seproduit
à un certain moment enraison des
"hasards d’échantillonnage",
il n’en est pas moins vrai que,lorsque
tous les lots auront étécontrôlés,
uneproportion
de ces lotsvoisine de (X aura été
rejetée (la proportion
exacte suppose un trèsgrand
nombre de
lots) ; d’ailleurs,
en fin decontrôle,
si le nombre À. de lots estgrand,
on aura forcément03BB # Pl.
Ce
qui précède
nesignifie
pas que la connaissance du nombre de défectueux dans les échantillonsprécédemment
contrôlés(ou
le nombre de lotsacceptés
ourejetés)
est sans intérêtpratique.
On sait que, dans les MIL STD 105D,
cesrenseignements
sont utilisés pour passer éven- tuellement en"contrôle renforcé"
ou en"contrôle réduit".
S’ilspermettent
Revue de Statistique Appliquée, 1968 - vol. XVI - N 1
22
de penser que la fabrication est très
bonne,
on relâche la sévérité du contrôle defaçon
à avoir desopérations plus économiques (contrôle
ré-duit) ;
s’ils conduisent à penser que la fabrication n’est pas cequ’on
enattendait,
on accroît la sévérité(contrôle renforcé),
afin d’être mieuxprotégé
contre lerisque d’accepter
une fabrication médiocre(diminution
de
LQ
pour un mêmerisque 03B2).
Mais ceci constitue un tout autre pro- blème.Peut-être les
explications qui précèdent apparaitront-elles plus
évidentes à la lumière d’un
exemple simple.
On considère un
jeu
de 52 cartessymbolisant
lafabrication,
danslequel
les 4 asjouent
le rôle depièces défectueuses ;
leurproportion
est
p = 1 (on
supposera aussi par la suite que le nombre d’aspeut
êtrequelconque).
1/
Unjoueur
Areçoit
13 cartes(lot),
dont il retourne 5(échantil- lon).
Il est"gagnant" si,
sur les 5 cartes, une auplus
est un as. On a :1 re question :
Est-iléquivalent
pour lejoueur
de recevoir 13 cartes et d’en retourner5,
ou de tirer au hasard 5 cartes dans lejeu complet ?
La
réponse
est évidemment Oui.2 e question : Quelle
est laprobabilité
pour lejoueur
degagner ?
La loi binomiale étantapplicable
à un"taux
deprélèvement" 5
laréponse
est :P =
0, 949
Si l’on
applique
la loihypergéométrique (tirages exhaustifs)
on trouve la valeur très voisine2/
On distribue lejeu
de 52 cartes entre 4joueurs A, B, C, D,
la
règle
dujeu
étant la même que pourA.
3 e question :
Les 4joueurs
ont-ils la mêmeprobabilité
degagner ?
Laréponse
est évidemment Oui.4 e question :
Les 3premiers joueurs A, B, C,
retournent leurs 5 cartes l’unaprès l’autre,
sans annoncer leur résultat. Lejoueur D, qui
re-tourne ses cartes en
dernier,
a-t-iltoujours
la mêmeprobabilité
degagner ?
Laréponse
est évidemment Oui.Les
réponses
à ces 4questions
sont lesmêmes, quel
que soit le nombre d’as dans lejeu ;
seule la valeurnumérique
pour la 2 equestion
est
modifiée,
s’iln’y
a pas 4 as dans lejeu,
c’est-à-dire sip 4
Si le nombre d’as dans le
jeu
estinconnu,
laprobabilité
de gagner,P ,
devient une fonction de p(qui peut prendre
les valeurs0, 1 52, 2 52,... 1 )
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 1
23
5 e
question :
Les troispremiers joueurs
annoncent leur résultat sous la forme"gain",
ou"non gain".
Cette information modifie-t-elle laproba-
bilité de gagner pour lejoueur
D ?La
réponse
est évidemment Oui si D saitqu’il
y avait 4 as dans lejeu.
Parexemple
si A a annoncé"non gain",
B"gain"
et C"non gain" ,
le
joueur
D est certain de gagner. Mais si D ne sait pas combien il y avait d’as dans lejeu,
l’information recueillie est depiètre
valeur.6 e question :
Les 3premiers joueurs
annoncent le nombre d’asqu’ils
ont obtenu. Cette information modifie t-elle la
probabilité
de gagner pour lejoueur
D ?Evidemment
Oui,
mais defaçon différente,
suivantqu’il
sait ou nesait pas
qu’il
y avait 4 as dans lejeu.
S’il le
sait,
et si parexemple
A et B ont annoncé"un as",
C"0 as",
il reste 2 as dans les 13 cartes quereçoit
D. En en retournant5,
laprobabilité qu’il
obtienne 0 ou 1 as(gain)
doit être calculée par la loihypergéométrique :
S’il ne le sait pas, il a la
possibilité
d’estimer le nombre d’as dans lejeu.
Parexemple,
siA, B,
C ont annoncérespectivement 3, 5
et 4as, cette estimation est
52 3 13 (3
+ 5+ 4)
= 16(il
fautprendre
le nombreentier le
plus
voisin si le calcul donne un nombrefractionnaire).
L’esti-mation du nombre d’as dans les 13 cartes reçues par D est : 16 -
(3 + 5 + 4)
= RA
partir
de cetteestimation,
laprobabilité
de gagner pour D est :7 e
question :
Pour un nombre d’as fixé dans lejeu (0, 1,2, ... la
pro- babilité que les 4joueurs
serépartissent
suivant :4
gagnants
0perdant
3 "
1 if2 "
2
"1 "
3
0 " 4 ir
dépend-elle
de l’ordre suivantlequel
lesjoueurs
retournent leurs cartes et du résultatqu’ils
annoncent ?La
réponse
est évidemment Non.(certaines
desprobabilités
ci-dessus
peuvent
êtrenulles ;
parexemple
avec 4 as, on nepeut pas
avoir 0gagnant
ni 1gagnant).
Dans
l’exemple
simuléqui
vient d’êtredécrit,
le nombre de lots(4)
estpetit,
de sorte que la"probabilité
degagner"
nepeut
pas être traduite par unefréquence.
Pour retrouver une situation industrielleRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 1