R EVUE DE STATISTIQUE APPLIQUÉE
J. B AYART
Trois abaques originaux évitant les calculs dans les estimations sur échantillon
Revue de statistique appliquée, tome 8, n
o2 (1960), p. 77-86
<
http://www.numdam.org/item?id=RSA_1960__8_2_77_0>
© Société française de statistique, 1960, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
TROIS ABAQUES ORIGINAUX ÉVITANT LES CALCULS DANS LES ESTIMATIONS SUR ÉCHANTILLON
par
J. BAYART Statisticien-Conseil
INTRODUCTION -
Les
ABAQUES
ou,NOMOGRAMMES constituent un outil commode pour les personnesqui,
dans leurspécialité,
sontappelées
à fairefréquemment
lesmêmes
calculs,
basés sur une même relationalgébrique.
Ils
jouent
le même rôle que les tables de calculs tout faits - souvent en- combrantes etlongues
à consulter - ets’adaptent
à des formules extrêmementvariées,
desplus simples
auxplus complexes.
Leur consultation est immédiateet,
s’ils ont été bienconstruits,
laprécision qu’ils
donnentcorrespond
au pro- blèmeposé.
Les
abaques présentés
dans ce document matérialisent tous une relationalgébrique
entre trois variables(ce qui
est le cas leplus simple
et ... leplus fréquent).
Ils sont dutype "à points alignés",
cequi signifie
que pour les utiliser il suffit de réaliser unsimple alignement
à l’aide d’unerègle plate.
Chaque
variable étant"cotée"
sur une échellegraduée
d’unefaçon
ap-propriée (centimétrique, logarithmique,
fonctionnelle detypes divers),
ces aba-ques sont constitués de trois échelles
rectilignes.
Dans certains cas, il fautfaire
appel
à des échellescurvilignes.
Les
abaques
à trois échellesrectilignes peuvent
avoir troisdispositions :
-
abaque
à échelles en N-
abaque
à échelles concourantes-
abaque
à échellesparallèles
On verra dans les pages
qui
suivent desexemples
de ces troisdispositions.
L’étude et la mise au
point
desabaques
constituent laNOMOGRAPHIE ,
branche des
Mathématiques Appliquées qui peut
rendre degrands
services auxIngénieurs
etTechniciens(l).
I -
ABAQUE
POUR LA DETERMINATION DE LA MARGE D’ERREUR A PREVOIR DANS L’ESTIMATIOND’UNE
MOYENNE -1/
Enoncé duproblème.
Je viens de recevoir un lot
important
de bobines dont lepoids
moyen an- noncé par le fournisseur est de 250 grammes.Je sais par des
réceptions
contrôlées antérieurement que lespoids
de ce genre de bobines sont distribués sensiblement suivant la loi de Gauss(courbe
encloche.
(Cette exigence peut
êtreignorée
si l’on faitplus
de 30mesures).
J’ai
également
vérifié antérieurement que le coefficient de variation despoids
de ce genre de bobines est assez stable et de l’ordre de4%(2).
Je
pèse 5 bobines prises au hasard et j’obtiens
lepoids
moyen de 240 gram-mes :
dois-je suspecter
le fournisseur de livrer des bobinestrop légères ? -
La conclusion serait-elle
changée si j’avais pesé
20 bobines pour obtenir encore 240grammes ?
2/
Modeopératoire.
a) Aligner (avec
unerègle plate)
lepoint 4%
de l’échelle"COEF-
FICIENT DE
VARIATION"
avec lepoint
5 de l’échelle"NOMBRE
DEMESURES" :
on lit sur l’échelle
"MARGE D’ERREUR" : 5, 5%.
b)
Onpeut
déclarerqu’IL
Y A 95 CHANCES SUR 100QUE
LA VRAIEMOYENNE DE L’ENSEMBLE DU LOT RECU EST COMPRISE ENTRE : 250 grammes +
5, 5% =
250 +13, 75 = 263, 75
grammes et250 grammes -
5, 5% =
250 -13, 75 = 236,
25 grammesComme la moyenne constatée
(sur
5mesures)
est entre ceslimites,
iln’y
a pas lieu de
suspecter
le lot reçu.Mais si l’on a obtenu 240 grammes
après
20pesées, l’abaque
montre quela marge d’erreur n’est
plus,
dans ce cas, que de2%,
d’où les nouvelles limites : 250 grammes+2% =
250 + 5 = 255 grammeset
250 grammes -
2% =
250 - 5 = 245 grammesCette
fois,
la moyenne constatée n’étantplus
dans leslimites,
on est endroit de
suspecter le trop de légèreté des
bobines reçues. Si l’on réclameauprès
du
fournisseur,
on court lerisque
de réclamer à tort de 5 chances sur100,
cequi
est unrisque
assez faible pour êtrenégligé
engénéral.
3/
Variante duproblème précédent.
Je désire déterminer à
3% près (marge d’erreur)
la résistance d’un cer-tain
type
de fil dont le coefficient de variation(en résistance)
est de l’ordre de(1)
Ouvrages
recommandés :"Abaques
etNomogrammes"
par A. Giet - Dunod"Aide-mémoire de Géométrie
Appliquée"
par R. Beurrier - Dunod.(2)
Il faut - pour bien faire - avoir calculé le coefficient de variation sur trois livraisons (ouséries
d’essais)
antérieures, avec chaque fois une cinquantaine de mesures.ESTIMATION D’UNE MOYENNE
10% :
combiendois-je
faire de mesures sur destronçons
de filpris
au hasard ?En
alignant 3% (MARGE D’ERREUR)
avec10% (COEFFICIENT
DEVAR.)
l’échelle centrale de
l’abaque
donne : NOMBRE DE MESURES : 45.II -
ABAQUES
POUR LA DETERMINATION D’UN SONDAGE A DEUX DEGRES1/
Enoncé duproblème.
Supposons
que l’on veuille déterminer leprix
moyen de vente au détail du litre de vin rouge ordinaire sur l’ensemble des 63 villes deplus
de 50 000 habi- tants(L = 63).
On sait par des
enquêtes
antérieures que le coefficient de variation desprix
des denrées alimentaires entre ces villes(unités primaires)
est de5%
etque le coefficient de variation des
prix
entre les détaillants(unités secondaires)
d’une
quelconque
de ces villes est de3%.
On demande dans combien de villes et chez combien de détaillants il y a lieu
d’enquêter
pour obtenir leprix
moyen enquestion
à1% près (marge
d’er-reur) et
avec un niveau de certitude de 95 chances sur 100 ?2/
Modeopératoire.
a) Aligner
sur lapremière planche
L = 63villes,
avecCVl = 5%
(coefficient de
variation des unitésprimaires) :
on obtient sur l’échelle centrale du faisceau :Nombre minimum d’unités
primaires (villes)
à sonder :kmin =
38Ce
premier
résultatsignifie
que si l’on a l’intention d’allerenquêter
chezTOUS LES DETAILLANTS
(unités secondaires)
des villes tirées ausort,
IL SUFFIRAd’enquêter
dans 38 villes(unités primaires).
Cette solution est certainement onéreuse car il n’est vraisemblablement pas nécessaire de voir tous les détaillants d’une même ville. On
peut assouplir
cette
première
solution en faisant intervenir maintenant le coefficient de varia- tion intérieur aux ville sCV2 .
b)
Calculer lerapport CV2 / CVl
en divisant le coefficient de variationprimaire (villes)
par le coefficient de variation secondaire(détaillants
d’unemême
ville).
On obtient ici :CV2 / CVl = 3% : 5%
=0, 6
c) Aligner
sur la deuxièmeplanche
lerapport
ci-dessus(0, 6)
lu surl’échelle de droite avec les diverses valeurs notées n sur
l’échelle de gauche
etlire sur l’échelle centrale le
multiplicateur k/kmin.
On obtient par
exemple :
Ce
qui
montre quesi,
au lieu de voir tous les détaillants des 38 villes(minimum
devilles)
on ne visite que 10 détaillants parville,
il faudra visiter 40villes,
soit un total de 400 détaillants.Si l’on visite 2 détaillants par
ville,
il faudra aller dans 44 villes et cela fera 88 détaillants à visiter.En
définitive,
onoptera
pour la combinaison laplus économique, compte
tenu des distances entre
villes,
dutemps passé,
etc.Autre
exemple - Réception
de balles de coton ou de laine.Un filateur
reçoit périodiquement
des livraisons de balles de coton parexemple.
Ilsait d’ aprè s
ses contrôlesantérieurs, ou d’après des
normes établiesà l’échelon
professionnel
ounational,
que pour tel paysd’origine
les coefficients de variation moyens entre les balles(unités primaires), CV!’
et entreprises
d’unemême balle
(unités secondaires), CV2,
ont certaines valeurs en cequi
concerne uncertain caractère
auquel
il s’intéresse(finesse, résistance,
teneur engras, ...)(1).
Il désire savoir combien il doit sonder de balles et à raison de combien de
prises
parballe,
pour déterminer à 1% près
et avec un niveau de certitude de 95 chances sur100,
la valeur moyenne du caractèreauquel
il s’intéresse.Données pour
l’exemple:
L = 190 ballesCV1 = 3% (entre
lesballes)
CV2 - 3% (à
l’intérieur desballe s)
a)
Lapremière planche
donne àpartir
des deuxpremiers
rensei-gnements
ci-dessus :k -
30 ballesEn
analysant intégralement
le contenu des balles tirées auhasard,
il suf-firait de contrôler 30 balles.
b)
Lerapport CV2 /CVl - 3% : 3%
= 1.c)
La deuxièmeplanche
fournit pour lerapport ci-dessus,
associétour à tour avec n =
1, 2, 4,
10 les diverses valeurs dumultiplicateur k/kmiF)ci-
après,
àpartir desquelles
on déduit le nombre réel de balles àsonder,
ainsique le nombre total de
prises
àprélever :
Ces diverses combinaisons conduisent au même
résultat,
pour autant que leshypothèses
énoncées audépart
soient exactes.Le service de
réception
pourraopter
parexemple
entre l’ouverture de 60 balles avec 1prise
parballe,
ou l’ouverture de 33 balles avec 10prises
par balle.(1)
Pour les balles de laine, voir par exemple les normes américaines A.S.T.M.CI)
w
W z
0
W
U
W
SONDAGE A DEUX DEGRES
2 ème Planche
Il est clair que sur le
plan
de l’économie il y a matière à réflexion : dif- ficultés dedéplacer
des balles peu accessibles si l’on sondebeaucoup
deballes;
temps
à passer pourl’analyse
d’ungrand
nombre total deprises;
éventuellement coût de la matièredétruite;
etc.N. B. -
Rappelons
que les balles à sonder ainsi que lesprises
à l’intérieur des balles doivent être choisies"au hasard"
cequi
ne veut dire ni au"petit
bonheur"
ni"de
lafaçon qui
nousdérange
lemoins".
III -
ABAQUE
POUR L’EXAMEN DES RESULTATS OBTENUS DANS UN"SONDAGE D’OPINION" -
1/
Enoncé duproblème.
On
interroge
par l’intermédiaired’enquêteurs
ou parcorrespondance
un nombre total de N personnes, sur leurspréférences
à propos de diversproduits (pâtes
dentifrices de diverses marques, candidats à desélections,
horairesdivers
proposés
pour un courspost-scolaire, ... ).
Ledépouillement
donne untableau du
type
suivant :nl personnes
préfèrent
le genre An 2-
personnespréfèrent
le genre Bn3
personnespréfèrent
legenre
Cn4 personnes voudraient un genre non
proposé
n, 5 personnes n’ont pas
d’opinion
ou n’ont pasrépondu.
Total : N personnes ont été
interrogées.
On se propose par
exemple,
ensupposant
que nl estplus grand
quen2,
de décider si la différence(nl - n2)
estsignificative
d’unepréférence
réelle pour le genreA,
ou si cette différence estpurement fortuite,
c’est-à-dire nonprobante .
2/
Modeopératoire
etexemple.
L’abaque permet
derépondre
à laquestion posée
avec un niveau de certi- tude de 95 chances sur 100. Il fait intervenir le nombre total N de personnesinterrogées
et le total desréponses
utiles pour lacomparaison effectuée,
c’est-à-dire
(nl
+n2),
s’ils’agit
de comparer lespréférences
pour A et pour B.En
alignant
la valeur de N -(lue
sur l’échelle dedroite) -
avec la valeurde
(nl
+n2) - (lue
sur l’échelle degauche)
-, on obtient sur l’échelle centrale la valeur minima que doit atteindre la différence(ni - n2)
pour que lapréférence
pour A soit
significative.
Exemple -
On ainterrogé
parcorrespondance
200 femmes destanding
aisé surleurs
préférences
pour la couleur desdraps.
On a obtenu les résultats : nl = 30préfèrent
lesdraps
rosesn2 = 20
préfèrent
lesdraps
bleusn3 =
100préfèrent
lesdraps
blancsn4 =
50 n’ont pasd’opinion (ou :
pasrépondu)
ler test : Entre les
draps
roses etbleus,
lapréférence
pour lesdraps
roses est-elle
significative ?
N =
200,
nl + n 2 =50, l’abaque
donne diff. min. : 14Comme
ici,
nl - n 2 = 10(inférieur
à14),
lapréférence
pour lesdraps
roses
plutôt
que bleus n’est passignificative.
Z iL
z
«
NOMBRE DE REPONSES UTILES (n1+n2)
2ème test :
Ayant
réuni lesdraps
roses et bleus on obtient le nouveau score :nl = 100
préfèrent
lesdraps
blancs n2 - 50préfèrent
lesdraps
de couleursn3 =
50 n’ont pasd’opinion (ou :
pasrépondu)
Cette fois : N =
200,
ni + n2 = 150:l’abaque
donne diff. min. : 24.Comme
ici,
nl - n2 = 50(supérieur
à24),
lapréférence
pour lesdraps
blancs est
significative,
même contre les deux couleurs réunies.3/ Remarque.
Si le nombre total de personnes
interrogées
resteconstant,
parexemple
N =
200,
la différence minimasignificative -
donnée parl’abaque -
pour que lapréférence
pour A soitprobante,
varie avec le nombre deréponses
utiles n1 + n2(réponses
pour A et pour Bréunies).
Onpeut
voir aisément en faisantpivoter
une
règle
autour dupoint
N = 200 que sin1 + n2 = 10
20 30 50 100 150 200il faut diff. min. = 7 9 11 14 20 24 28
Il est clair que si peu de personnes
répondent "utilement" (entre
A etB),
on obtiendra
plus
difficilement une conclusionsignificative,
d’où la nécessitéd’interroger
un échantillon suffisammentimportant
de personnes.4/ Exemple
à traiter.3 505 interviews au
sujet
de marques de dentifricesemployés
ont donnéles résultats :
emploient
la marque A 803 personnesB 612
C 496
D 269
E 116
F 57
G 33
H 26
1 13
J 10
autres marques 147
n’emploient
pas de dentifrice 923Examiner s’il existe dans la