R EVUE DE STATISTIQUE APPLIQUÉE
W. E DWARDS D EMING
Sur les échantillonnages de matériaux
Revue de statistique appliquée, tome 5, n
o1 (1957), p. 23-41
<http://www.numdam.org/item?id=RSA_1957__5_1_23_0>
© Société française de statistique, 1957, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
SUR LES ÉCHANTILLONNAGES
DE MATÉRIAUX (I)
par
W.
Edwards
DEMINGLes méthodes
employées
dans le contrôlestatistique
desfabrications
(contrôle en cours defabrication,
contrôle deréception...)
ne constituentqu’un
cas
particulier
des méthodesgénérales d’enquêtes
par sondages d’uneportée
tièsgénérale.
Ces méthodes sont largementemployées
dans de nombreux domaines(enquêtes
de marché,enquêtes socio-économiques)
soit parce que le recensementexhaustif
estpratiquement impossible
(parexemple lorsqu’il
nécessite le travaild’enquêteurs
à domicile), soit pour des raisons deplus grande rapidité
et de moindre coût.W.-E. DEMING a
dirigé
la sectionSondages
au «National Bureauof
Stan-dards » de Washington,
depuis plusieurs
années, il s’estspécialement
intéresséaux
problèmes
industriels tant aux Etats-Unis que dans divers pays étrangers(Japon,
Inde...).Dans le’
présent
article, l’auteur étudiequelques problèmes d’application
des méthodes
statistiques
auxsondages pratiqués
sur des matériaux ou de.,qensembles
complexes.PORTÉE
ET BUT DE CET ARTICLEUn
problème
trèsimportant
pour l’industrie et le commerce est de mesurer(avec précision,
célérité et à peu defrais)
lesquantités
etqualités d’objets
ou dematériaux, -matières premières
ouproduits
manufacturés. Des millions de dollarschangent
de mainschaque jour,
comme parexemple
lescargaisons qui passent
des mains du vendeur à celles del’acheteur,
ou d’un service à l’autre à l’intérieur de la même usine , ou encorelorsqu’on
établit desstatistiques
etqu’on perçoit
des droits de douane à propos de marchandisesimportées .
Le but dupré-
sent article est
d’indiquer quelques-uns des
moyens parlesquels
la théorie statis-tique
ordinairepeut
trouver às’appliquer
utilement auxéchantillonnages pratiqués
sur des matériaux.
On devrait insister sur une distinction à faire entre les
problèmes
desondage
rencontrés :
a)
dans le contrôle dequalité; b)
dans lessondages
en vued’accepter
une marchandise à la livraison et
c)
dans leséchantillonnages
de matériaux envi-sagés
ici. Dans lesproblèmes
detype a)
etb)
on atoujours supposé, je
crois,qu’un
échantillon de n articles manufacturés est cequ’on appelle
un échantillon tiré au hasard d’un lot ou de laproduction
d’une demi-heure, et que les théories dusondage
au hasards’appliquent.
Ici, au contraire,(problèmes
detype c),
laquestion
dont ons’occupe
est de trouver comment tirer un échantillon auhasard,
et comment le tirer de manière
économique,
defaçon
àpouvoir établir,
avec undegré
deprécisiondonné, quelquequalité (poids, cendres contenues,
étatphysique
moyen)
d’un lot d’articlesmanufacturés,
et ceci au coût leplus
baspossible .
Onpeut appeler
leproblème (c)
leproblème
dusondage économique
d’un lot de ma-tériaux.
On
peut pratiquer
deplusieurs
manières lesondage, l’échantillonnage,
pourmesurer
quelque qualité
moyenne d’un lotd’objets.
(1)
Traduction par M. Thionet d’un article publié dans la Revue de l’Institut International deStatistique - Vol. 18 - n° 1 - 2 - 1950.
I. - Le
poids
et laqualité
d’unecargaison d’objets empaquetés (qui
n’ont pas été mesurés avantemballage)
peuvent être déterminés enpesant
et mettant àl’épreuve
un échantillon depaquets.
Parexemple,
unecargaison comprend
descentaines de colis de
laine, tabac,
sucre et autresproduits.
Parquel procédé
desondage
obtenir letonnage
de lacargaison
à moins de1/2%
et ceci au moindrecoût ? °
II. - Déterminer à nouveau la
qualité
moyenne d’un lotd’objets empaquetés qui
ont étédéjà pesés
ouessayés,
un à un, à unequelconque époque
antérieure.Parfois un lot aura été stocké
quelques
mois ouquelques
années. On connaissait laqualité
dechaque
article ou dechaque paquet
àl’époque
de la mise enstock,
mais la
qualité
a puchanger
dansl’intervalle;
ou une nouvelle détermination du calibrepeut
être nécessaire pour une raisonquelconque.
Quelle est àprésent
laqualité
moyenne de tout le stock? Parexemple
celui-cicomprend
des centaines deballes,
sacs et autres colis de laine, tabac, sucre et autresproduits, qu’on
apesés
un à un dansquelque port étranger;
et lepoids
a étémarqué
sur le colisen livres
anglaises
ouespagnoles, kilogrammes,
etc ..., ou toute autre unité.Par
quelle
méthoded’échantillonnage
obtenir lepoids (ou quelqu’autre qualité
importante)
de lacargaison
à moins de1/2% près
et ceci au moindre coût?III. - Déterminer
(par exemple)
lepouvoir calorifique
moyen ou lescendres,
pour un
produit
seprésentant
sous forme d’un tas de charbon ou d’un camion de charbon?,
IV. - Déterminer l’état
physique moyen
des diversescatégories
d’élémentsd’un réseau
téléphonique, télégraphique,
de chemin defer,
de distribution du gazou de l’électricité.
Ce
problème
estimportant
pour connaitre l’état actuel de l’ensemble du sys- tème et pour estimer la nature etl’importance
de l’entretien et desréparations
àfaire, qui
seront nécessaires d’ici 5 ou 10 ans.De tels
renseignements permettent
à une société de mettre de côté les sommesconvenables pour
fairedesréparations
et, avecun programme àlongue échéance,
deprofiter
desavantages
offerts par les cours del’acier,
du cuivre, du bois decharpente
et desproduits
finis à certainesépoques,
et aussi pour établir les besoins en main-d’oeuvrequisontnécessaires.
Il y a là unproblème
desondage :
comment les échantillons
peuvent-ils
êtreprélevés
pour évaluer l’étatphysique
de l’ensemble des biens ou d’une
catégorie
d’entre eux, - parexemple
à1 % près ? MANIÈRE GÉNÉRALE
D’ABORDER UNPROBLÈME
DE SONDAGEOn fera d’abord
quelques
remarques sur la manièregénérale
d’aborder unproblème
desondage.
L’une des
premières questions
àrégler
est le choix de l’unité desondage.
Sil’on doit estimer la
qualité
d’unecargaison
entière ou d’unlot,
on les suppose divisibles enparties
distinctesidentifiables, appelées
unités desondage. Chaque partie
du lot doit se trouver dans l’une et une seulement des unités desondage.
Quand le
produit
seprésente
en colis oupaquets,
lepaquet
estparfois (mais
pastoujours)
une unité naturelle etéconomique.
C’est seulement le cas s’il estpossible (et
s’iln’estpas tropcoûteux) dedésignern’importe quel paquet
déterminé(en
vuede l’inclure dans
l’échantillon)
et de l’extraire de lacargaison (pour
le peser oul’essayer), quel
que soit lepaquet désigné.
Si l’on doit tirer les unités de
sondage
avecd’égales probabilités,
on devrales définir de manière
qu’elles
soient(par
leurpoids
et autresqualités)
aussisemblables que cela est raisonnablement
possible.
On nes’occupera
pas ici desondage
avecprobabilités inégales.
Outre le
problème
de définir des unités desondage acceptables,
on aégale-
ment
besoinderenseignements
surl’ordredegrandeur
et lastabilitédes variances entre unités desondage.
On aégalement
besoinderenseignements
sur le coûtdesdiverses
opérations
que nécessite lapesée
oul’essai,
non seulementquand
onapplique
la routinehabituelle,
mais encore dans les conditions mêmes d’uneopé-
ration de
sondage. Ainsi,
l’une despremières étapes, quand
on commence à éta- blir unplan
desondage,
est de commencer par réunir desrenseignements
surles variances et les coûts.
L’ÉCHANTILLONNAGE
DE PRODUITSEMPAQUETÉS - PROBLÈME
1D’excellentes recherches de début sur les Problèmes I et II ont été faites par
(1) Williams,
1 Tanner et les autres chercheurs du Bureau of Customs(=
Directiondes
Douanes);
et il sera intéressant de réunir ici leurs résultats(2). La
laine enballes,
1 le sucre brut en sacs, le tabac, le"burlap"
et lesplumes
en balles sontimportés
aux Etats-Unis en énormescargaisons.
La détermination dupoids
et dela
qualité
moyenne d’unecargaison
est nécessaire pour l’acheteur et le vendeur, pour lesstatistiques d’importation
etd’exportation
et pourl’échantillonnage
desdroits de douane. Il
estnécessairepour
l’administration des Douanes deprocéder
aux évaluations du
poids
et delaqualité
pour établir les droitsdedouane,
1 par des méthodes quele gouvernement
et l’industriereconnaissent êtreefficaces, loyales, précises
etéconomiques .
Tels sont
précisément
lesobjectifs qu’on
vise à atteindre avec les nouvelles méthodes desondage.
Échantillonnage
à undegré,
suite duproblème
1Dans
l’échantillonnage
àundegré,
on choisitun échantillon de m unités; et onéprouve
chacune des unités de l’échantillon entotalité,
1 c’est-à-dire sanssondage
à l’intérieur de celle-ci. On va poser
quelques-unes
des loisgénérales
relativesaux variances
correspondant
aux échantillons au hasarddans le cas d’un échantil- lon à undegré.
Soit M unités de
sondage (colis,
1articles, balles)numérotés
1 à M, dont cha-cun peut être retrouvé et identifié de manière
univoque.
On supposeraqu’on
doittirer un échantillon au hasard de m unités
primaires .
Une manière commode deprocéder
enpratique
à cetirage
au hasard estd’employer
une table denombres aléatoires. Si on a(par exemple)
M = 1.267 et que m doive êtreégal
à50,
on litsimplement (à partir
du haut ou dubas)
une colonne de nombres aléatoires à 4chiffres,
en écartant0000,
ainsi que tous les nombressupérieurs
à1.267,
maisen conservant les 50
premiers
nombres distinctscompris
entre 0.001 et 1.267(inclus).
Avant d’étudier la variance
d’échantillonnage
de l’estimation dupoids
totaldes M
colis,
il y a lieud’adopter
certainssymboles.
Poursimplifier
cetexposé,
on supposera
qu’on
doit mesurer lepoids
et onparlera
d’un colis pour dire :"une unité desondage" .
Poids des M colis du lot :
Poids des m colis de l’échantillon : Poids moyen des M colis du lot
Poids moyen des m colis de l’échantillon ’ Variance des colis du lot
Variance des colis de l’échantillon Poids total du lot
Poids total du lot estimé à l’aide de l’échantillon
Coefficient de variation,
ouerreur-type
relative, de l’estimation M x ou de x lui-même( 1)
John F. WILLIAMS & Louis TANNER: "Statistical Methods in the weighting of imported merchandise". Congrès de l’A.S. Ass. Cleveland, Dec. 1948.(2)
Un autre article sur l’échantillonnage de matériaux a été publié par Louis TANNER et W. Edwards DEMING "Some Problems in the sampling of bulk materials(Proceedings
of theAmerican Society for testing Materials, Vol. 49,
1949).
Si les unités de l’échantillon sont tirées au hasard, l’estimation Mx ou X est alors une variable aléatoire et son coefficient de variation
(ou
erreur relativetype)
sera donné par la formule :Cette formule est fondamentale et est établie dans les manuels élémentaires relatifs aux
Sondages .
Elle est valable pourn’importe quelle
distribution de Mpoids
dont la variance est (7~.Il est clair que la
précision s’accroit, -
c’est-à-dire queCy
ou Cxdécroit,
- si l’effectif m de l’échantillon
augmente.
On peut obtenir laprécision
que l’onveut en choisissant un effectif convenable pour l’échantillon. Ainsi, si on désire avoir une
erreur-type
de 1%
pour x ou X, et si M =1 .267, u
= 300kilogrammes
et
o*/ u.
=5 % ,
J la formule(1)
donneCette
équation
en mpeut
se résoudre sansdifficulté et le résultat est m = 25.Ainsi,
siCx
ouC~ doit
êtreégalà 1 %, ilsuffiradepeser
unéchantillon
au hasardde 25 colis.
Si l’ondé sire avoir une
erreur-typeplus petite,
parexemple (l/2%),l’effectif
que l’échantillon doit atteindre passera à 93.
En
pratique,
si l’on doitdésigner
un échantillon de colis pour les peser,pendant
que l’oncharge ou
que l’ondécharge lacargaison,
on a l’habitude de peser 1 colis sur n. Dans leproblème
que l’on vient de résoudre(M
=1.267,
m =25)
on
pèserait
1 colis sur 50, àpartir
d’un colis dont le rang soit un nombre aléatoirecompris
entre 1 et 50. Un échantilloncomposé
à l’aide d’un colissur n est
appelé
un choixsystématique.
La varianced’échantillonnage
d’un teléchantillon sera d’habitude
légèrement
inférieure à la variance d’un échantillon au hasard donnée par la formule( 1) .
En revanche, dans certaines circonstances, la varianced’échantillonnage correspondanta
untirage systématique
pourra êtreplus
élevée que la variance d’un échantillon au hasard. Il
n’y
a encore rien de mieux àfaire que
deprocéder
à certainesexpériences
sur les matériaux dont on doitpré-
lever un échantillon.
Le coût
(et
la réduction defrais)
quel’onpeut espérer
del’emploi
dusondage peuvent
d’habitude se calculerapproximativement,
àl’avance,
sur la base d’éva-luations
grossières
de la variance cr 2. et du coût de manutentiondesmatériaux à sonder, évaluationsfondées, bien
entendu, surl’expérience passée.
Les sommeséconomisées
dépendront
de la facilitéplus
ou moinsgrande
aveclaquelle
lescolis pourront être
désignés
comme faisantpartie
del’échantillon, puis pesés
etenfin
réintégrés dans
le lot.Lorsque
les colis constituant le lot sontdéjà empilés
dans un
magasin,
il peut être très coûteux d’extraire unpaquet
déterminé situé à l’intérieur du tas ou au-dessous. Bienplus,
aucun paquet déterminé nepeut
êtredésigné
sil’onnepeutnuméroter
les M colis de 1 à M, d’unefaçon
ou d’une autre, et aussi si l’on ne connait pasl’emplacement
den’importe quel
colisdéterminé,
de
façon qu’on puisse
le retrouver. D’habitude le coût del’opération
estbeaucoup plus
faible et les économies sontbeaucoup plus grandes
si les colis sontpesés quand
on lescharge
ouqu’on
lesdécharge .
Les économies en
puissance
que l’on peut faire en introduisant la méthode dessondages
sont souventélevées,
bienqu’en pratique
il soit souvent nécessairede faire preuve
d’ingéniosité pour organiser
le travailde manière à réaliser effec- tivement des économies. Enpratique,
les économiespossibles atteignent
souvent70%
du coût quereprésenterait
lapesée
des M colis; etparfois
les économiessont
beaucoup plus importantes.
Un
exemple
desondage
à 1 seuldegré
seprésente
dans le cas de l’évaluation du tonnage du sucre raffinéimporté
aux Etats-Unis(1).
Cette denrée arrive parlots
importants,
comprenant souventjusqu’à
43.000 sacs de modèle standard pesant chacun environ 100 livres . Lespesées
ont lieu d’habitude sur desprélè- ( 1)
Le reste de ce paragraphe est reproduit presque mot à mot à l’article de TANNER &DEMING déjà cité.
vements de 8 sacs au
magasin, après
que les sacsendommagés (environ 1,4%
dutotal)
aient étéséparés
en vue d’un traitementspécial.
Une étude despesées
antérieures à montré que le coefficient de variation
(j / p.
despesées
desprélève-
ments
(de
8 sacschacun)
des sacs intacts de sucre raffiné est stable et seulementen moyenne de
0,1 % .
A l’aide de la formule( 1),
onpeut
montrer que lapesée
d’un seul
prélèvement
donnerait uneestimation(X)du poids de
lacargaison totale,
avec un coefficient de variation
égal
à celui-ci. Lapesée
de 9prélèvements
don-nerait une estimation
(X)
dont la limite de 3erreurs-types est 0,1 %,
c’est-à-dire telle que l’erreur desondage
nedépasserait
que très rarement0,1 % .
En
pratique
onpourrait
peser un échantillonde 25prélèvements;
le coût d’unetelle
pesée
étantnégligeable
à côté du coût del’opération qui
consisterait à peser toute lacargaison.
En outre, 25prélèvements
suffisent à donner une bonne esti- mation de 7 . Il estpréférable
de faire trèsrégulièrement
des estimations de cr , afin de connaitre constamment son ordre degrandeur
et ses variations .Échantillonnage
à deuxdegrés,
suite duproblème
1Au lieu d’un
sondage
à 1 seuldegré,
il estparfois plus économique
de pren- dre l’échantillon en2degrés
ou même en 3, - enparticulier
si les colis sontdéjà empilés
dans unmagasin
de telle manière que l’extraction d’un colis déterminé soit difficile. Avec 2degrés
desondage,
ondistingue
des unitésprimaires
et desunités secondaires. Les unités
primaires pourraient
être des couches depaquets
ou des fractions de ces couches. Dans le cas d’un
sondage
de laine en balles(voir plus loin)
en vue d’estimer le contenu d’un lot de balle s une fois la lainelavée,
les unitésprimaires
seront les balles de laine, et les unités secondaires seront des" cores"
(touffes
delaine) coupées dans
les balles. Les unitésprimaires
devraient avoir, autant quepossible,
même taille et mêmequalité;
et il devrait en être demême des unités secondaires. La raison de ce fait peut se voir à l’aide de la formule
(3).
Si les unitésprimaires
sont trèsinégales, Ce
seragrand;
et si lesunités secondaires sont très
inégales, CW2
seragrand.
Si l’une de cesquantités
est
grande,
celaaugmentera
l’effectif que l’échantillon doit avoir pourqu’on
attei-gne à une
précision
donnée .On supposera que les unités
primaires
ont pu êtrecomptées
et identifiées de 1 à M inclusivement. On supposera, en outre, que les unités secondaires(peut
être constituées par des
colis)
peuvent êtrecomptées
et identifiées de 1 àNi,
à l’intérieur de l’unitéprimaire
n°i de l’échantillon. Leproblème
desondage qui
se pose est de trouver combien il faudrait tirer d’unités
primaires,
et combiend’unités secondaires devraient être tirées de
chaque
unitéprimaire
de l’échan-tillon, puis
êtrepesées (ou
mises àl’épreuve
d’unefaçon quelconque),
defaçon
à satisfaire aux conditions
imposées
concernant laprécision,
et ceci au coût leplus
faiblepossible .
On supposera que les unités
primaires
et secondaires sont tirées au hasard etqu’on peut employer
une table de nombres aléatoires pourdésigner
les échan-tillons,
bien que(comme
pour unsondage
à un seuldegré)
un mode dedésignation systématiquede l’échantillonpuisseêtreutiliséaulieud’unedésignation
au hasard.Pour un
sondage
à 2degrés,
il seranécessaire d’adopter quelques
notationsnouvelles. On supposera ici que Ni = N2 = ... =
N,
à la fois poursimplifier
etparce que c’est souvent la à peu
près
la situation réelle( 1) .
NOTATIONS
k 1 =
dépense
pourpréparer
une unitéprimaire
desondage;
k2 =
dépense pour prendre une
unité secondaire à l’intérieur d’une unitéprimaire;
M = nombre d’unités
primaires
dans le lot;m = nombre d’unités
primaires
dans l’échantillon;( 1)
Si les nombres N1. N~, ... ne sontpas tous égaux (mêmeapproximativement) laformule
(3) sera plus compliquée; et le lecteur pourra consulter un traité relatif aux Sondages s’il désireune théorie plus complète.
N = nombre d’unités secondaires dans
chaque
unitéprimaire;
il = nombre d’unités secondaires à
tirerdechaqueunité primaire
del’échantillon;
Ub 2
= variance entre les M unitésprimaires
du lot;(1)
Cb =
coefficient de variation entre les M unitésprimaires;
QW
= variance moyenne entre les unités secondaires à l’intérieur des unitéspri-
maires du lot;
Cw= aw/&u =
coefficient moyen de variation entre les unitéssecondaires;
x =
poids
moyen des m nportions
soumises àl’essai;
et estimation dupoids
moyen du lot entier;
X = M
N
x = estimation dupoids
du lot entier .Le coefficient de variation
Cx
de l’estimation dupoids
total du lot et le coef-ficient de variation
Cx
dupoids
moyen(ou
d’un autrecaractère)
par unité secon-daire, dépendent
de M, m,Cb
etCw,
par la relation :Pour
obtenir (1 X,
il suff it demultiplier CX
par MNu. ;
et pouravoir T’X
ilsuffit de
multiplier Cx
par u, . . La formule(3)
donne à la foisCX
etCx
sous uneforme dont il est facile de se souvenir .
On
peut représenter approximativement
le coût total d’unsondage
sur m nunités par la
quantité :
K
= m Ki +mnk2 (4)
Pour un
système quelconque
de coûts et devariances(k1 k2 Q b ~W )
le meil-leur
plan
desondage
etceluiqui permet
d’obtenir une valeur donnée du coefficient de variationCX
ouCi
tout en rendant minimum le coût K.Ou encore c’ e st celui
qui
f ournitle plu s g rande quantité
d’ inf ormationpossible
pour une
dépensedonnéeK.
Ilestpossiblede
montrer que ces conditions sont très sensiblementremplies
si(6.7) 2.3).
et
On doit résoudre en
n l’équation(5)
pour savoir combien d’unités secondaires doivent être tirées dechaqueunité primaire;
et ensuite ondoit résoudrel’équation (6)
en m pour savoir combien d’unitésprimaires
devraient être extraites du lot.Il est intéressant de noter que la valeur
optimum
de n(nombre
d’unités secondai-res par unité
primaire)
nedépend
ni de m nide
laprécision
désiréeCx
ouCx.
Manifestement les solutions obtenues pour n et m nécessitent la connaissance des variances
7 ~ et (j; et
des coûtsk1
etk2.
Dansl’équation (6), Cx
est le coef-ficient de variation
qu’on
désire obtenirpour x
ou pour X, cepeut être,
par exem-ple, 1/2%.
Il est toutefoisimportant
de remarquer :(a)
que n est déterminé si lesquotients O’~/0’b
etk1/k2
sont seuls connus; et(b) qu’iln’estpasnéces-
saire de connaitre ces
quotients
avec unegrande précision,
enparticulier
en cequi
concernek1/k2’ qui figure
sous unsymbole
de racine carrée.( 1)
Pour des définitions plus détaillées et plus générales de ces variances et pour établir la formule(3),
le lecteur pourra consulter un traité sur les Sondages.(2)
La formule(5)
semble avoir été publiée simultanément par L.H.C. TIPPETT dans"Methods of Statistics
(WILLIAMS
& NORGATE1931),
p. 177 et par Walter A. SHEWHART "The Economic Control of Quality of Manufactures Product"(Van
Nortrand,1931),
p. 389.(3)
Sio-2
n’est pas petit à côté deN7 ~,
la formule(5)
peut être remplacée parDe
simples
valeursapprochées
de cesquotients
permettront dedistinguer
facilement unplan
desondage
très coûteux et unplan
dont le coût K est voisin, à5% près,
du coûtcorrespondant
àl’optimum (ce
dernierpouvant
seulement être obtenu à l’aide de valeurstrès précises
des variances etdescoûts). L’importance
des économies
qui peuvent
être faites avec desrenseignements
trèsimprécis
estvraiment
remarquable.
Un
exemple peut
être utile ici(1).
La laine brute seprésente
dans le com-merce en lots de tailles
diverses,
en moyenne d’environ 100 balles maispouvant
atteindre 2.000balles.Le p oids d’ une balle varie
entre 200 livres et 1.200livres,
mais est sensiblement uniforme pour des balles de même
origine.
La laine ren-ferme des
graisses
et autresimpuretés,
dont laproportion peut
varierjusqu’à 30%
à la fois entre balles d’un même lot et entreportions
d’une même balle.On a reconnu,
depuis longtemps, qu’on
avait besoin d’une méthode valable pour déterminer lepourcentage
de laine lavée(que l’onpourra obtenir, sans
avoirà
opérer
sur tout le lot ou sur une fraction élevée de ce lot. Leprincipal
obstaclequi s’opposait
à une telle méthode était encore récemment le faitqu’on
nepeut
se fier au seultype
depetit
échantillonqu’on pouvait prélever (d’habitude quelques poignées
de laineprélevées
suivantl’opinion
d’unexpert,
dansquelques
ballesqu’on espérait représentatives).
Cette difficultéparticulière
a été éliminée parl’usage
d’un instrument desondage pratique qui pénètre
à l’intérieur de la balle delaine, jusqu’à n’importe quel
endroitdésigné auhasard,
etqui peut
en ramenerune touffe relativement
petite
de laine. Il estimportant
decalculer,
à l’aide deséquations
donnéesplus haut,
combien de telles touffes devraient êtreprélevées
par
balle,
et de combiende balles,
pour estimer aveclaplus
faibledépense, quel-
le
proportion
de laine lavée existe dans le lot.Dans le
sondage
sur lalaine,
l’unitéprimaire
est la balle; l’unité secondaire est la touffe.Pour n’importe quelle valeur possible
de n(telle
que n =1,
ou 2, ou4,
etc...)
lavaleurcorrespondantedem estdonnéepar (6).
Uncouple
de valeurs(n
etm)
ainsi déterminées constituent cequ’on appelle
unplan
desondage opti-
mum, un
plan
telqu’on
obtiendra la valeur voulue du coefficient de variationCx
avec la moindre
dépense .
On
peut imaginer
diversplans
desondage,
donnant tous la mêmeprécision,
mais de coûts divers suivant
les hypothèses
faites. Naturellementleplanquicoûte
le moins cher est le meilleur.
On a
procédé
à des recherchessystématiques
sur lavaleur de Qw et Orb et surla stabilité de ces valeurs pour de nombreux lots, rencontrés dans le commerce, de laines de
types
et numérosdivers, provenant d’origines
différentesréparties
sur tout le
globe.
Comme onpouvait s’y attendre, iln’existe pas
uncouple unique
de valeurs
qui
convienne pour tous lestypesde
laine.Cependant
on a trouvé que, si l’on regroupe les laines enunnombre relativement restreintdegrands
groupes suivantl’origine,
letype
de laine et letype
deballes,
les variances étaient sen- siblement stables etpouvaient
fournir des estimations utiles pour faire desplans
de
sondage.
Le tableau 1 montrequelques
valeurstypiques
de variances.En
portant
ces estimations de QW et tr b dansl’équation(6),
onpeut préparer
des
plans
desondage qui,
pourchaque catégoriede laine,
donneront le nombre mde balles
qu’il
faut extraire de lots d’effectif M suivant le nombre variable(n)
detouffes à tirer par
balle,
pour un niveau deprécision
donné. Les 4plans
de son-dage
donnés à titred’exemple
au tableau II donneront la mêmeprécision
maisleurs coûts seront différents.
(1)
Le reste dece §
est reproduitpresque textuellementde l’article de TANNER & DEMINGdéjà cité.
TABLEAU II
Tabl eau montrant le nombre de balles de laine à
prélever
d’un lot ou o-w = 0’b =2 , 5 % ,
pour avoir uneerreur-type
de0, 5 % .
Pour obtenir une touffe de laine, il y a deux
opérations :
d’abord mettre laballe en
position
desondage; puis
la percer. Chacune de cesopérations
a son coûtpropre
(1),
à savoirk1
etk~;
et leurquotient peut
varier énormément suivant les conditions existantes. Si lesondage
a lieulorsque
les balles individuelles sontposées
oudéplacées
en vue de leurstockage,
iln’y
apratiquement
aucun coûtsupplémentaire
pour mettre la balle enposition
desondage;
etk1/k2 peut,
parexemple,
êtreégal
à 1. D’un autrecôté,
si les balles sontdéjà empilées
dans unmagasin
et si l’on doit lesdéranger
et les remuer pour tirer un échantillon deballes,
lequotient kl/k2peut
facilement êtresupérieur
à 25.L’intérêt de cette théorie
apparait quand
on examine cequi
se passe en pra-tique.
Il existe unorganisme spécialisé
dans les essais etauquel
on faitréguliè-
rement
appel
pour sonder des lots de laine du pays stockés enmagasin.
Pourcette laine
awl cr- b
est d’environ 2, 25; et, dans les conditions dusondage, k1/k1
est
approximativement égal
à 20. Par suite, leplan
desondage
le meilleur con-siste à
prendre
10 touffes par balle(n
=10)
etàdéterminer le nombre de balles à sonder au moyen del’équation (6).
Un autre
organisme
fait unsondage
dans les lainesimportées
pourfabriquer
des
tapis, lorsqu’elles
sonttransportées
par camion à la filature. Dans ce cas,k~/k2 est
voisin de 1 eto’~/o’b
estégalement
en moyenne de l’ordre de 1, desorte que le
plan
desondage
utilisé consiste àprélever
1 touffe par balle sondée(n
=1).
Ces deuxplans
desondage
diffèrent de manière considérable quant à laprécision;
néanmoins chacun est leplan
le moins coûteuxpossible
dans les condi-tions différentes
auxquelles
les deuxorganismes
ont à faire face.L’ÉCHANTILLONNAGE
DE PRODUITSLIVRÉS
ENBALLES, PAQUETS,
etc...PROBLÈME
IlDans la
présent problème,
on considère unpoids
ou tout autre caractère Yqui
à été déterminé aupréalable
pour chacune des unités i=l,2, ...,M.Supposons qu’un
échantillon de nipaquets ait
été tiré au hasard du lot etqu’on
ait déterminé à nouveau
Xi
pour chacun des paquets de l’échantillon.Posons :
( 1)
Si chaque unité secondaire est soumise séparément à l’épreuve, k2 devrait comprendrele coût de l’épreuve par unité. Pour la laine,
’,
les touffes sont mélangées et on n’effectue qu’une épreuve sur l’échantillon; de sorte que le coût de l’épreuve est indépendant de n et m et n’est pas compris dans k2.Une fois déterminée une valeur de f en
pesant
m balles échantillons dulot,
on
l’emploie
comme facteur de conversion pour calculer une estimation X’ d’unpoids
total du lot en convertissant Y,quand
on passe des ancienspoids
aux nou-veaux par la relation
X’ = f Y
(9)
Le coefficient de variation de f pour des
tirages répétés
d’échantillons seradonné
approximativement
par :où
Comme Y est constant dans
(9),
il en résulte que :Dans la formule
(10), ( 1)
lef acteur 1 ~ Xi f Yi)2
est une estimation du m-1 1 Xcoefficient de
variationduquotient
X~Y multiplié
parM/(M-1).
Il est clair que, si la corrélation entre Xi etYi
estgrande
les coefficients de variationCX
etCf
seront
petits
et laprécision
des estimations X et f sera élevée avec depetits
échantillons .Du fait que la fraction f de la formule
(7)
estemployée
dans(9)
comme "fac-teur de
calibrage" ,
ceprocédé qui
fait usage desrenseignements déjà
contenusdans
Yi ,
estappelé parfois
un"procédé
decalibrage" .
.Un
exemple
del’emploi
de ceprocédé
est fourni par lapesée
du tabac d’im-portation,
dont onimporte
auxEtats-Unis 100 millions delivres poids.
Cet article arrive en lots deplusieurs
centaines ou milliers de balles de taillesdiverses,
dont lepoids
varie suivantl’origine,
de 10 à 300 livres chacun.Les
poids
individuels des balles ont été d’habitude déterminésquelque temps
avant
qu’elles
soientchargées
sur le navire, dansquelques ports étrangers.
Cependant
lepoids
total d’un lot ainsidéterminénepeut
êtreaccepté
comme based’établissement des droitsdedouane,
nid’habitudepour
les transactions commer-ciales. Par
conséquent
on considèrequ’une
secondepesée
est nécessaire. Mais il est seulement nécessaire de peser à nouveauquelques
balles.Auparavant
on avait l’habitude à la Douane de peserchaque
balleprise
indi- viduellement - méthode lente et coûteuse . En cherchant une méthode desondage
on trouva que le coefficient de variation des
poids
des balles est de l’ordre de3,5%
et varie de1, 5 %
à9 , 4 % .
Par suite, le s méthodes desondage
du ProblèmeI ne sont
plus
satisfaisantes parcequ’elles nécessiteraient,
pour atteindre à uneprécision
raisonnable, un échantillon tellementgrand qu’aucune
économie réelle n’en résulterait enpratique.
Cependant,
pourpouvoir employer
la "méthode ducalibrage",
il n’est pas tellement nécessaire quelespoids Yi
soient trèsvoisins les uns des autres, mais bienplutôt
lesquotients X; / Y; .
Si Yidésigne
lepoids
d’une balle, mesurée avantqu’on l’embarque
et si Xidésigne
le résultat de la secondepesée
de cette mêmeballe
lorsqu’on
ladébarque,
on a constaté que lequotient xii Yi
était très sensi- blement le même pour toutes les balles. Ainsi les formules(7)
à(12)
peuvent( 1)
La démonstration de la formule (10) est donnée dans l’ouvrage de F. YATES"SamplingMethods for Census and Surveys (Chas. Griffin & C’ ° 1949). Elle est donnée aussi avec les mêmes
notations que dans le présent article, dans l’ouvrage de DEMING "Some theory of Sampling"’John WILEY, 1950) Ch. 5.