R EVUE DE STATISTIQUE APPLIQUÉE
B. C YFFERS A. V ESSERAU
Mesure et contrôle de la dispersion à partir de groupes de deux
Revue de statistique appliquée, tome 3, n
o4 (1955), p. 45-59
<
http://www.numdam.org/item?id=RSA_1955__3_4_45_0>
© Société française de statistique, 1955, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
MESURE ET CONTROLE DE LA DISPERSION A PARTIR DE GROUPES DE DEUX
par
B.
CYFFERS
etA. VESSERAU Ingénieurs
des Manufactures de l’EtatLe contrôle de la
dispersion
est assez généralement effectué à partir d l’intervalle de variation des échantillons prélevés ; ce procède, moins efficace au celui basé sur le calcul del’écart-tyve, ayant
l’avantaqe de réduire, de’ manièrimportante,
les calculs à exécuter.Dans le cas où
l’appareil
de mesure permet lacomparaison
nualitative immE diate des mesures d’un échantillon de deux, sans qu’il soit nécessaire d’observe individuellement celles-ci, MM.Cyffers
et Vessereau envisagent une méthodsupprimant
tout calcul, méthode basée sur les comparaisons d’une série d’écha tillons de deux.Un
exemple
d’application industrielle (fabrication des ninas) i est donné va les auteurs, avant une étudethéorique
de la méthode.La
dispersion
d’unpetit
groupe de mesures : x1 , X2 ...xi
...XK
est habituellement caractérisée par l’un ou l’autre des deux indices suivants :
l’écart-type empirique :
x
désignant
la moyennearithmétique
des mesures,- l’intervalle de variation
(ou "étendue" ,
ou"range") :
w=x M -x m
x
etxm désignant
laplus grande
et laplus petite
des K mesures.La variance
empirique (S1 =
carré del’écart-type)
est une estimation absolu- ment correcte de la variance a-2 de lapopulation
totale dont le groupe de mesures estsupposé
constituer un échantillon.Lorsqu’on dispose
deplusieurs
groupes de mêmetaille,
ou échantillonsindépendants,
conduisant aux estimationsla meilleure estimation de
cr 2 est:
x. désignant
la moyennearithmétique
de l’échantillon(i)
et l’onprend
pour esti-mation
de 0" :Lorsque
lapopulation
totale des xi estnormale,
la loi de distribution de l’in- tervalle de variation w(pour
des échantillons deK)
est telle que la valeur moyen-ne
(espérance mathématique)
de w estproportionnelle à 03C3 ,
le coefficient de pro-portionnalité
nedépendant
que de K :Si l’on a calculé l’intervalle de variation sur n échantillons de K :
de moyenne
arithmétique :
on
peut prendre
pour estimation de o- :Cette estimation est
plus
facile à calculer que l’estimation03C3(s2),
mais elleest moins efficace : elle
perd
unepartie
de l’ "information"apportée
par l’ensem- ble des nK mesures.Lorsque chaque
échantillon est constitué de deux mesures seulement :x
i1 etxi2 ,
on voit immédiatement quel’écart-type empirique
et l’intervalle de variation sontproportionnels
l’un à l’autre.D’autre
part (voir Chapitre
II - Théorie de laMéthode)
la relation entre (j etla valeur moyenne de w devient :
de sorte que, dans ce cas, on
peut
estimer Qpar :
Naturellement cette estimation n’est
précise
que si le w moyen est calculé àpartir
d’un assezgrand
nombre d’échantillons de 2.Dans ce
qui suit,
l’indice 2 attaché ausymbole
w(w2) indique qu’il s’agit
del’intervalle de variation d’un échantillon de 2 mesures
(différence arithmétique
des
mesures).
En
plus
de lasimplicité
decalcul,
l’estimation de (j" àpartir
de w2apporte
une autre
simplification importante lorsqu’on peut
facilementdéterminer,
sansavoir à les mesurer,
laquelle
des 2quantités
x2et x
1 est laplus grande.
C’estle cas que nous étudierons
spécialement
où cesquantités
sont despoids.
En
effet, plaçant
les deuxobjets
sur les deuxplateaux
d’une balance suffi- sammentsensible,
on détermine immédiatementlequel
est leplus
lourd(nous
ledésignerons
parL)
etlequel
est leplus léger (~).
L est ensuiteplacé
dans uneboite dite "des lourds" et t dans une boite "des
légers". Ayant
ainsi classé et ré-parti
un certain nombre n decouples d’objets,
il suffit de déterminer(par
uneseule ou au
plus
deuxpesées)
la différence depoids
D entre la boite des lourds et celle deslégers .
On a l’estimation de a par :03C3(w2) = 0.8862 D n
Il convient de remarquer que les erreurs
qui peuvent
être faites dans le clas- sement desobjets
ont pour effet d’accroître defaçon systématique
la valeur du coef- ficient deproportionnalité
entrect
etD .
Il y a là une difficultéqui peut
être réduite si l’onconnaît,
defaçon approchée, l’imprécision
du classement; cettequestion
sera traitée en détail auChapitre
II.Ce
préambule
est suffisant pour aborder(Chapitre I) l’exposé
d’uneapplica-
tion
industrielle,
la théorieplus complète
de laméthode,
de sesavantages
et deses
inconvénients,
étantrenvoyée
à la fin de cet article(chapitre II).
1. - APPLICATION
AUCONTROLE DE LA DISPERSION DES MACHINES
ACIGARILLOS
Après
avoirévoqué rapidement
l’intérêt queprésente
le contrôle despoids
dans les fabrications de la
Régie Française
desTabacs,
nous insisterons sur lecas
particulier
de la confection descigarillos
Ninas : nous exposerons ensuitel’organisation pratique
des Contrôles et examinerons les résultats obtenus du doublepoint
devue "stàtistique"
et "industriel" .Intérêt
du contrôledu poids
dans lafabrication des tabacs
On
peut
diviser lesproductions
de laRégie Française
en deuxgrandes
caté-gories :
- les
produits
vendus aupoids :
scaferlati pourpipe,
tabacs àpriser
et à mâcher- pour
lesquels
il convient de ne léser ni le consommateur en lui offrant des pa-quets trop légers,
ni leMonopole
en mettant en vente desproduits trop
lourds .- les
produits
vendus à l’unité -cigares, cigarillos, cigarettes -
dont leremplis-
sage et le
tirage
doivent être corrects .Le
poids
desproduits apparait
donc comme un facteurimportant
dequalité qui
revêt deplus
un intérêt financierconsidérable,
par suite duprix
élevé de la matièrepremière
traitée .Cas
de laconfection
descigarillos NINAS
Nous ne nous occuperons, dans ce
qui
suit, que du contrôle dupoids des ciga-
rillos Ninas dans la
principale
Manufacturefabriquant
ceproduit.
L’atelier de confectioncomprend
une soixantaine de machines,produisant
chacune environ 1 .000 Ninas par heure de travaileffectif,
soit au total 60%
environ des Ninas vendus en France.Il nous
parait indiqué
de donnerquelques précisions
sur la confection descigarillos .
Uncigarillo
est formé de deux constituants; le tabacd’intérieur,
et lacape. Le tabac pour intérieur est introduit dans le distributeur de la machine et celle-ci
grâce
à unsystème mécanique
assezcompliqué,
fournitautomatiquement
la dose d’intérieur pour
chaque cigarillo.
Le travail de l’ouvrièrechargée
de laconduite de la machine consiste à tendre des feuilles de tabac sur un
gabarit
dedécoupe
de la cape. Celle-ci estdécoupée, transportée automatiquement
sur untapis
deroulage
et l’intérieur est alors enroulé dans la cape par undispositif analogue
àcelui,
bien connu, de certaines boites à tabacpermettant
de rouler lescigarettes
parsimple
fermeture du couvercle .Le
dosage
desquantités
d’intérieur estvolumétrique.
Il estpossible
de ré-gler
le volume et par suite lepoids
moyen. D’autrepart,
la machinepossède
undispositif
derégulation automatique
dupoids
des doses . Cedispositif
trèsingé-
nieux et certainement
indispensable
au bon fonctionnement de lamachine, présen-
te
cependant
l’inconvénient d’inciter à croirequ’il n’y
a às’occuper
que dupoids
moyen et nullement de ladispersion puisque
la machine secorrige
elle-même.Or,
si l’onprocède
à lapesée
individuelle de 1.000 Ninasconsécutives, (en
gros la
production
d’uneheure),
ons’aperçoit
que lespoids
sont distribués selonune loi
normale,
avec unedispersion qui peut
varier considérablement d’une ma-chine à l’autre. En
première analyse,
onpeut
admettre que cettedispersion
estdue
uniquement
au tabacd’intérieur, puisque
la cape n’intervient que pour 15 à 20%
dupoids
total ducigarillo,
et que sonpoids
est assezrégulier,
sa surfaceétant sensiblement constante.
Ainsi,
pour unpoids
moyen de l’ordre de1, 6 g,
on constate desécarts-types
de l’ordre de
0,06
g pour les meilleuresmachines,
etpouvant
atteindrejusqu’à 0,12
ou0,14
g pour les machines lesplus dispersées.
D’autre
part,
pour une mêmemachine,
ladispersion
n’est pas une caracté-ristique
stable. Si l’onn’y prend garde,
elle va s’accroissant avec letemps,
par suite de l’usure ou dudéréglage
de certainespièces.
Il convient, pour
chaque machine,
de connaitre sadispersion
et de cherchersans cesse à la
diminuer,
- parce que la
dispersion
enpoids
est liée directement à larégularité
de compa- cité et detirage
descigarillos,
- parce que la
dispersion
enpoids s’accompagne
d’unedispersion
des diamètresqui peut
occasionner des difficultés lors dupaquetage mécanique
desNinas,
-
enfin,
parcequ’on
ne saurait effectuer un contrôle efficace dupoids
moyen sans connaitre ladispersion.
C’est
pourquoi
il estindispensable d’obtenir,
pour chacune desmachines,
des informations sur leurdispersion qui
soient suffisammentrapprochées
dans letemps .
Organisation pratique
ducontrôle
de ladispersion
Avant de mesurer la
dispersion
d’unemachine,
il convient de définir le nom-bre de
cigarillos
surlesquels portera
la mesure, et leur mode deprélèvement.
En
effet,
si l’ondésigne
par O"n la valeur del’écart-type
mesurée sur nciga-
rillos
consécutifs,
on constate que cr’ n croit avec n : ceciprovient
de ce que lepoids
moyen fluctue dans letemps.
De la mêmemanière,
l’écarttype
me suré surn
cigarillos
non consécutifs sera d’autantplus grand
que les ncigarillos
aurontété
prélevés
dans unepopulation
couvrant uneplus grande période
deproduction.
Nous avons
toujours opéré
sur 1000cigarillos
consécutifs. Le nombre 1 .000a été choisi parce
qu’il correspond
à peuprès
à unepériode
de la fluctuation dupoids
moyen,qui
estgrossièrement
sinusoïdale.Première méthode -
Pesée individuelle de 1000Ninas
Nous avons tout d’abord établi un contrôle de la
dispersion
basé sur la déter-mination de
l’écart-type empirique
despoids
individuels . Lapesée
descigarillos
est effectuée sur un peson à lecture directe dont le cadran est divisé en 51
plages (-25, -24,
1,0,
+1,+2,
+ ...+25) d’amplitude Icg.
Le zéro estrégla-
ble.
Les
opérations
à effectuer sont les suivantes :- dénombrement des 1. 000
cigarillos
-
pesée globale
pour détermination dupoids
moyen-
réglage
du 0 du peson aupoids
moyen-
pesée
individuelle des Ninas etenregistrement
des mesures sous forme d’histo-gramme
- calcul de
l’écart-type.
Ces
opérations
demandent au total environ 4 heures. Une vérificatrice nepeut donc,
par cetteméthode,
contrôler que deux machines parjour
ouvrable .Par
conséquent,
en affectant une vérificatrice en permanence à cecontrôle,
on ne
dispose
d’une mesure par machinequ’environ
toutes les 6 semaines .Après quelques
mois de fonctionnement de cecontrôle,
on s’est aperçu :- que la distribution des
poids
étaittoujours
sensiblement normale,- que
l’écart-type
variait d’une machine a.l’autre,
- que
l’écart-type,
pour une même machine, avait tendance à croitre avec letemps .
Ainsi est apparue la nécessité d’établir un nouveau contrôle donnant une in- formation
plus rapide .
Deuxième méthode basée sur l’intervalle de
variation w2
a)
Modeopératoire :
La vérificatrice
dispose
d’un trébuchet choisi aussi sensible quepossible,
etsur le socle
duquel
a été installé unpetit compteur .
Elleplace
devant elle unéchantillon d’environ t . 000
cigarillos.
Elle
prélève
simultanément deuxunités,
une danschaque main,
et lesdépose
sur les
plateaux
dutrébuchet.
Tandis que de la main droite elleappuie
sur unbouton pour libérer le
fléau,
elleappuie
de la maingauche
sur la touche du comp- teur. Ellerepère
ainsi lecigarillo
leplus
lourd et lecigarillo
leplus léger,
etenregistre automatiquement
le nombre decouples comparés .
Lecigarillo
leplus
lourd est ensuite
transporté
de la main droite dans une "boite des lourds" et leplus léger,
de la maingauche,
dans une "boite deslégers" .
Si, parexemple,
on adispo-
sé la "boite des lourds" à droite du trébuchet et l’autre boite à
gauche,
lesgestes
s’effectuent selonlarègle
suivante etdevien-nent
rapidement
un réflexe :- Si
l’aiguille
sedirige
versla
gauche : transporter
les Ninassans croiser les mains.
- Si
l’aiguille
sedirige
versla droite : enlever les Ninas des
plateaux
en croisant les mains ettransporter
dans les boites en décroisant.Les deux boites ont été
préalablement
tarées et ont le mêmepoids.
On
poursuit l’expérience jusqu’à
ce que lecompteur indique
500. On pose en- suite les deux boites sur lesplateaux
d’une balance decomparaison
à lecture di- recte, et on obtientainsi,
parsimple
lecture, la différence depoids
totale entreles 500 "lourds" et les 500
"légers"
dechaque couple.
Onpeut
endéduire
facile-ment l’intervalle de variation moyen
(en multipliant
par2/1 .000)
etégalement,
sion le
désire, l’écart -type
enmultipliant
par le facteur deproportionnalité
0.8862 .Pratiquement,
nous avons retenu comme indice dedispersion
la différence totale depoids,
luedirectement, qui
estproportionnelle
àl’écart-type.
b) Avantages.
Les
opérations
sontgrandement simplifiées
parrapport
à la 1ère Méthode :-
suppression
du dénombrement des 1.000 Ninas,-
suppression
de leurpesée globale,
-
suppression
duréglage
du peson. Il faut bien entendu s’assurer que le trébuchetindique
0lorsque
lesplateaux
sontvides,
mais iln’y
aplus
lieu deprocéder
àun
réglage systématique
pourchaque échantillon,
-
remplacement
des 1.000pesées individuelles, qui exigent
d’attendrel’équilibre
du peson, et
l’enregistrement
des résultats par 500comparaisons, qui suppri-
ment ces deux
exigences .
-
Enfin, suppression
de tout calcul.Le
temps
nécessaire à une mesure est à peuprès
1heure,
et une même vé- rificatricepeut
contrôler environ 8 machines parjour .
La
rapidité
d’exécution compense donclargement
laperte
d’information ré- sultant de l’utilisation de cetteméthode, puisque (voir Chapitre II)
cetteperte
d’information n’estqu’à peine supérieure
à 50% .
Cependant
la méthodeprésente
l’inconvénient mentionné au début de cet arti-cle,
à savoirqu’il
n’existequ’un
seulrisque d’erreur,
celui de classer un "lourd"en
"léger"
etvice-versa,
soit par manque de sensibilité de la balance, soit parerreur de
manipulation;
laconséquence
en est une sous-estimationsystématique
de l’intervalle de variation ou de
l’écart-type . c)
Précision :Malgré
l’instauration du contrôle par la secondeméthode,
nous avonspour-
suivi le contrôle basé sur la lère Méthode et sur
chaque
échantillon de 1.000ciga-
rillos soumis à la
pesée
individuelle fut effectuée ensuite une mesure de l’inter- valle de variation.Nous
disposons
ainsi deplusieurs
mesures dew2
sur des échantillons dontl’écart-type 03C3
est connu.Trois vérificatrices
effectuant,
à tour derôle,
le contrôle par la secondeméthode,
nous avonsenregistré
sous forme degraphiques,
les résultats relatifsà chacune d’elles en
portant
en abscisses les valeurs observéesde 03C3,
et en ordon-nées,
celles dew2
moyen(a-
etw2
enmilligrammes).
Sur
chaque graphique,
nous avons deplus
tracé deux droites :- la droite
théorique : W2 = 1 0.8862 03C3 =
1.1284 03C3- la droite des moindres carrés calculés à
partir
des résultats observés . Leséquations
de ces droites sont les suivantes :Vérificatrice TG
"
AT
" MT
Pour
chaque graphique,
on remarque :- que le nuage de
points
est trèsaplati
sur la droite des moindrescarrés,
- que les
points
sont enmajorité
situés au-dessous de la droitethéorique,
cequi correspond
aurisque
d’erreursignalé plus
haut dans la détermination dew2 ,
- que les deux droites ne sont pas
exagérément
écartées l’une del’autre,
- enfin que le facteur
personnel
de la vérificatrice semble intervenir assez peu.En
définitive,
l’examen desgraphiques
montre que la valeur observée dew2 apporte
une information suffisante sur la valeur réelle de o* .Nous donnons page 50 , à titre
d’exemple,
legraphique
relatif à la vérifica-trice MT.
(fig. 1)
Résultats
obtenus sur leplan industriel
Sur le
plan industriel,
ces contrôles ont entraîné une amélioration de la dis-persion
despoids
descigarillos .
Nous donnons commeexemple
lareproduction
de la fiche de la machine N° 12 relative à une
période
de 8 mois environ :chaque
trait horizontal a une
longueur proportionnelle
au w2 observé . On constate une tendancerégulière
à la diminution de ladispersion
dans letemps . (fig. 2)
Fig.2
Cependant, malgré
l’établissementde
ces fiches surlesquelles
sontenregis-
trés les résultats des contrôles par la 2èmeMéthode,
nous n’avonsjamais
aban-donné totalement la lère Méthode. Le contrôle par l’intervalle de variation est un
excellent moyen de
dépistage
des machines à mettre en observation ou en révision mais ses résultats sont peuéloquents
pour lepersonnel chargé
de l’entretien des machines . Celui-ci accorde engénéral
peu de valeur à la différence moyenne depoids
entre deuxcigarillos prélevés
auhasard,
etobjecte fréquemment
que l’on aurait pu trouver un tout autre résultat si lescouples
à comparer avaient été constitués différemment.Par contre, la
présentation
del’histogramme
donné par la lère Méthode estfrappante,
et il n’estjamais
venu à l’idée de personne de nous direqu’un
autre échantillon de 1.000 Ninas aurait pu donner un autre résultat.C’est
pourquoi, lorsque
par l’intervalle de variation, nous constatonsqu’une
machine a une
grande dispersion,
nousprocédons
de suite à lapesée
individuelle de 1.000 autrescigarillos.
Nous avons ainsi confirmation dufait,
et nouspossé-
dons
l’histogramme grâce auquel
l’action sur lepersonnel
d’entretien est facili- tée. Une nouvelle mesure del’écart-type,
par la lèreMéthode,
est effectuéeaprès révision,
et le mécanicien estplus
sensible à laprésentation
des deux his-togrammes
"avant" et"après" qu’à
tous les indices chiffrés dedispersion qu’on peut
lui donner.En
définitive,
la méthode de contrôle de ladispersion
basée sur l’intervalle de variation W2 ’malgré
laperte
d’informationqu’elle entraîne,
constitue pourl’Ingénieur, grâce
à sarapidité,
un moyen efficace de surveillance d’un nombreassez considérable de machines.
Cependant,
la mesure directe del’écart-type
parpesée
individuelle conservedes
avantages,
non seulement sur leplan statistique,
maiségalement
sur leplan psychologique .
Il. -
THÉORIE
DE LAMÉTHODE
loi de w2 . - x1 et x, étant deux nombres
pris
au hasard(dans
l’ordre 1,2)
dansune même distribution normale
d’écart-type 03C3 ,
la loi de z =(x1 - x2 )
est une loinormale de moyenne nulle et
d’écart-type 03C32 :
La loi de
Fig.
3Elle est
représentée
par la moitié droite de la courbe normale de moyenne nulle etd’écart-type 03C3 y2dont
on a doublé les ordonnées.(f ig . 3)
L’espérance mathématique
deW2
est :d’où l’on tire :
relation utilisée pour l’estimation de o- à
partir
de la moyennearithmétique
deplusieurs
valeursindépendantes
de w2 .On calcule sans difficulté les
premiers
moments centrés de la loi de w 2 On trouve :(Loi
deLoi de la
moyenne arithmétique
de nvaleur w2 indépendantes (loi
deW2)
L’expression
de la loi dew2
n’est passimple,
mais onpeut
calculer facile-ment ses
premiers
moments .Tout
d’abord,
on a évidemment :Pour calculer les moments
centrés,
on passe par l’intermédiaire des cumu-lants de la loi de w2, dont les
expressions
sont :Le cumulant d’ordre r de la loi de
w2
s’obtient en divisant par n r-1 le cumulant d’ordre r de la loi de w2 . Les cumulants dew2
sont donc :Les cumulants
K2 et K3
se confondent avec les moments centrés d’ordre 2 et 3.On obtient le moment d’ordre 4 par la relation :
On trouve ainsi, pour moments de la loi de
w2
Les coefficients de Pearson ont ainsi pour valeur :
Lorsque
naugmente,
ces coefficients tendentrespectivement
vers 0 et3, qui
sont les valeurs de
(31
et03B22 dans
une loi normale PourOn a ainsi
l’exemple
de la convergence vers la loi normale de la moyennearithmétique
de variables aléatoires(w2 )
à distribution individuellecomplètement dissymétrique. L’approximation
à laloi
normale estdéjà
trèsacceptable
pourn = 30
(03B21 = 0.033, p,
=3.029).
Précision
del’écart-type estimé
àpartir
dew2
On estime
l’écart-type 03C3
par :On
vient de voir que la variance dew2
est :la variance de l’estimation
03C3(w2) est
donc :n
désignant
le nombre decouples d’observations,
le nombre d’observations utili- sées est en fait 2 n.Lorsqu’on
estimel’écart-type
par la racine carrée de l’écartquadratique
moyen d’un échantillonunique
de(2n)
mesures :la variance de cette estimation
(n
étant suffisammentgrand)
estLe
rapport
des deux variances est :La
perte d’information,
parl’emploi
dew2 , dépasse
50%,
mais ellepeut
setrouver
compensée
par uneplus grande facilité,
ourapidité
desopérations .
D’autre
part 03C3(s2)
et03C3(w2)
nereprésentent
la même chose que si l’on a rassemblé 2nobjets,
que l’on a calculé leurécart-type empirique 03C3(s2)
et que d’autrepart
on a calculé03C3(w2)
en constituant ncouples
dedeux,
par une suite deprélèvements
aléatoires et exhaustifs dans l’ensemble des 2nobjets .
Si03C3(s2)
aété calculé à
partir
de 2nobjets
consécutifs dans laproduction
d’une machine, etque
03C3(w2)
résulte den couples espacés
dans letemps,
ces deux indicespourront
différer :03C3(w2)
seragénéralement plus
faible que03C3(s2)
à cause des liaisonsqui
existent
fréquemment
entre lescaractéristiques d’objets
consécutifs.Conséquences
d’erreursdans
leclassement des deux objets
Comme il a été dit au
début,
on considère le cas où les deuxobjets
ducouple
ne sont pas
mesurés,
mais seulementcomparés :
celui dont lacaractéristique
estla
plus grande (le plus
lourd s’ils’agit
depoids)
estplacé
d’uncôté,
celui dont lacaractéristique
est laplus petite (le plus léger)
d’un autre côté . Ce n’estqu’après
avoir classé les n
couples qu’on
détermine la différence moyenne entre l’ensem- ble desplus grands (lourds)
et l’ensemble desplus petits (légers).
Dans cette suite
d’opérations,
des erreurs de classementpeuvent
seprodui-
re : elles sont même inévitables
lorsqu’on
compare despoids
au moyen d’une ba- lance insuffisamment sensible : deuxobjets
depoids
très voisins auront à peuprès
une chance sur deux d’être incorrectementclassés,
leplus léger
étantdirigé
vers la "boite des
lourds",
leplus
lourd vers la "boite deslégers" .
On va examiner
quelles
sont lesconséquences
de ces erreurs de classement.Pour
cela,
nous admettrons que toutcouple
pourlequel
la différence des me- sures est inférieure à unnombre"a"est
classé strictement auhasard; lorsque
cettedifférence est
supérieure
à a, lecouple
est correctement classé.Soit y la mesure
jugée
laplus grande
dans lecouple,
z la mesure
jugée
laplus petite
La différence x = y - z varie de - a à + oc suivant la loi suivante :
- a x a . - La loi de x est une
portion
de loi normale de moyenne nulle etd’écart-type 03C32.
a x + oc. - La loi de x est une
portion
de la loi de w2 On a donc :pour - a x + a
pour a x + oc
1)
Valeur moyenne de x On a :d’où en
posant
l’approximation
étant valable si lerapport À.
est assezpetit.
Ainsi,
enprenant
pour estimation de 03C3 :03C3 = 03C0 2x
on obtient une valeur
systématiquement trop
faible(estimation biaisée).
Si l’on connaît a et une valeur
approchée
de Ci, onpeut
calculer une valeurapprochée
de 03BB et faire la correction nécessaire.Par
exemple :
si a =
0 ,
la formule d’estimation correcte est :2)
Variance de x et de X :Le moment d’ordre 2 par
rapport
àl’origine est :
et le moment centré
(variance) :
La variance de la
moyenne x
de n valeursindépendantes
x est :a) Si, ignorant X ,
onprend
pour estimation de cr :la variance de cette
quantité
est :L’estimation est biaisée et moins
précise
quelorsqu’il n’y
a pas d’erreurs de classement. La nouvelle"perte
d’information" parrapport
à ce cas(X
=o)
est :soit
approximativement,
siPar
exemple ,
pour :, cette
perte
d’information est den
b) Si,
connaissant une valeurapprochée
deX ,
onprend
pour estimation de cr :la variance de cette
quantité
est :L’estimation est alors à
peine biaisée,
maistoujours
moinsprécise
que s’iln’y
apas d’erreurs de classement. La
"perte
d’information" parrapport
à ce cas est :soit
approximativement,
siX =--
estpetit :
Par
exemple,
pour a =
0 ,
cetteperte
d’information est deAvantages
etinconvénients
de laméthode
Nous les décrirons dans le cas où la
caractéristique
mesurée est unpoids.
Les inconvénients sont les suivants :
- une
perte d’information,
parrapport
à l’estimation de a utilisant l’écart qua-dratique
moyen des mesures,qui dépasse
50%
dans le cas leplus
favorable.- une estimation biaisée
(dans
un sensconnu) lorsqu’il
y a des erreurs de classe- ment, cequi oblige :
- soit à
opérer
avec unappareil
depesée
trèssensible, (mais
pas nécessaire- mentparfaitement juste)
- soit à effectuer une correction
qui exige
que l’on connaisse, au moins defaçon approchée,
la sensibilité del’appareil
et l’ordre degrandeur
del’écart-type
recherché.
Les
avantages
sont :- la
grande rapidité
desopérations :
on compare deuxpoids
sans avoir à les me-surer,
- la
suppression
des erreurs delecture,
- la
suppression
presque totale descalculs,
- la
possibilité d’imaginer
unappareil
effectuant le classement defaçon
automa-tique.
On a vu au
paragraphe
I, que lesavantages peuvent l’emporter
nettement surles
inconvénients,
enparticulier
dans des contrôles industrielsqui
doivent être confiés à unpersonnel
peuqualifié,
et où l’on ne recherche pas une trèsgrande précision
de l’indice dedispersion.
VÉRIFICATIONS EXPÉRIMENTALES
Avant
d’appliquer
industriellement laméthode,
nous avonsprocédé
"in vitro"à une série de vérifications
expérimentales
dont les résultats vont être donnés . Toutes les vérifications ontporté
sur ladispersion
enpoids
de lots deciga-
rettes
prélevées
à la sortie d’une machine. La distribution despoids
decigarettes
obéit presquetoujours
à une loinormale,
ou très voisine de la normale .Le
poids
moyen d’unecigarette
est d’environ 1 gr 2.L’écart-type, exprimé
en
milligrammes, varie,
suivant lemodèle,
l’ancienneté et l’état de lamachine,
de 50 à 100 et mêmeplus .
Les lots étudiés -
provenant
deplusieurs
Manufactures et dans chacune d’elles deplusieurs
machines - sont de 1000cigarettes.
a) Estimation
de cr’ àpartir
dew2,
sans erreur declassement
Les
cigarettes,
numérotées de 1 à1000,
ont étépesées
individuellement avec unegrande précision,
et l’on a calculél’écart-quadratique
moyen.On a ensuite associé les numéros deux par
deux,
strictement au hasard. On acalculé les 500 différences de
poids
w2 descigarettes
ainsiassociées, puis
leurmoyenne
w2
On en a déduitl’estimation 8- (W1)
par la relation :03C3(w2)
=0, 8862 w2
Les résultats obtenus
figurent
dans le tableauci-après (on
avait choisi volon- tairement des lotsd’écarts-types
trèsdifférents).
La concordance des deux estimations
peut
être considérée comme satisfai- sante. Lesplus
gros écarts sont presquetoujours
dans le sens03C3(w2) 03C3(s2) ,
et sur l’ensemble
03C3(w2)
estlégèrement
inférieur à03C3(s2).
Ces écarts sont dansle sens
qu’expliquent
delégères
erreurs de classement.b) Influence
des erreurs de classementSur 3 lots de 1.000
cigarettes,
on aprocédé
à la vérification suivante :1)
On déterminel’écart-type 03C3(s2) (désigné
ci-dessouspar 03C3).
2)
Commeindiqué
ci-dessus(numérotage
descigarettes
de 1 à1000,
consti- tution au hasard de 500couples) -
on détermine lepoids
total desplus
lourdes dechaque couple,
et lepoids
total desplus légères,
d’où par différence et division par 500 l’intervalle de variation moyenw2 ;
on en déduit lerapport (03C3 w2)
observé(la
valeurthéorique
est0,8862).
3)
Onrepère
tous lescouples
dont la différence w2 est inférieure ouégale
àa = 5 mg. Pour chacun de
ceux-ci,
ondirige, d’après
le résultat d’uneépreuve
de
"pile
ouface",
lacigarette
laplus lourde,
soit vers le groupe descigarettes
"les
plus
lourdes" soit vers le groupe descigarettes
"lesplus légères"
et inver-sement.
Ainsi,
lepoids
total descigarettes
considérées "comme lesplus
lourdesdans
chaque couple"
est normalementdiminué;
lepoids
total descigarettes
"con- sidérées comme lesplus légères"
est normalementaugmenté.
On calcule ensuitela nouvelle valeur de
w1 qui
est normalementplus
élevée que laprécédente
- et on la compare à la valeur
théorique
dont on a établiprécédemment qu’elle
est :
0,8862 e avec 03BB = 5 03C3.
4)
On recommence la mêmeopération
avec des "erreurs de classement" ca-ractérisées par des valeurs de a :
a = 10 a = 15 a = 20 a = 25
et l’on compare
chaque
fois le coefficient observéW2 - qui
normalement aug- mente deplus
enplus -
et le coefficientthéorique
calculé avec la valeur convena-ble
de X .
Le résultat de ces
opérations figure
dans les troistableaux ci-après.
On yconstate
qu’il
y a une concordance satisfaisante entre coefficients observés et coefficientsthéoriques.
ler LOT
1.000
cigarettes -
500couples - 03C3 =
70,212ème LOT
1.000
cigarettes -
500couples -
cr = 80.233ème LOT
1.000