R EVUE DE STATISTIQUE APPLIQUÉE
J ACQUES F LESSELLES
Étude analytique de la dispersion des poids de 3.590 cigarettes consécutives
Revue de statistique appliquée, tome 19, n
o4 (1971), p. 85-97
<
http://www.numdam.org/item?id=RSA_1971__19_4_85_0>
© Société française de statistique, 1971, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
ÉTUDE ANALYTIQUE DE LA DISPERSION DES POIDS DE 3.590 CIGARETTES CONSÉCUTIVES
Jacques FLESSELLES Ingénieur des Manufactures
del’Etat
OBJET DE L’ETUDE
On s’est
proposé
de mesurer lespoids
individuels de 3590cigarettes
à filtreproduites
consécutivement par une machine et de déterminersysté- matiquement
les nombreuxparamètres
dedispersion
caractérisant ce lot.On s’est ainsi
particulièrement
intéressé aux coefficients de corréla- tion entre lespoids
descigarettes
de rangdonné,
coefficientsqui
sontspé- cifiques
de ladépendance cinématique
entre lescigarettes
des divers rangs[1].
On a
également
déterminé les diverses variances despoids collectifs , lesquelles
sont liées aux coefficients de corrélationprécédents.
Le calcul des
caractéristiques correspondantes
met en évidence unaccord
expérimental parfait
entre les formulesthéoriques
et les résultats observés.La
population
de 3 590cigarettes
a été retenue parcequ’elle permettait
d’accéderaisément, moyennant
certainesprécautions,
aupoids
individuel dechaque cigarette
enrespectant
son rang deproduction.
CARACTERISTIQUES
GENERALES DES CIGARETTES ETUDIEESCigarettes
à filtre delongueur
totale 70 mm(59
mm + 11mm) ;
dia- mètre 8, 7 mm ;mélange
noir ; scaferlatibattu ; produités
à 2 000cigarettes
par minute sur machine à ruban
perforé
avecaspiration
etécrêtage.
ETUDE DE LA DISPERSION DES TRONCONS DE CIGARETTES
(SANS FILTRE)
Tous les calculs
qui
suivent ont été conduits(et vérifiés)
sur ordina-teur à l’aide du fichier des
poids
reclassé dans l’ordre naturel deproduction
des
tronçons.
Analyse générale
de ladispersion
(Sur
3 500cigarettes prises
en 35 groupes de 100cigarettes
consécu-tives).
Moyenne générale
despoids p ...
879,5 mgEcart-type général °0
...27,7 482
mgEcart-type
des moyennes de 100c~oo... 12,0 831
mgVariance des
Ecart-type
des moyennes de 100°100.
0 ...12, 0 831
poids collectifs
- Variance intra-
Moyenne
desécarts-types
de 100cyloo
... °24, 6 580
mggroupe de 100
Ecarts-types
desécarts-types précédents ao 3,9926
mg Vérification :(analyse
de lavariance) ~~ - 769,96
a 100+ 2 2 100 + cCr 2 ... 769,96
Cf.[2] J
- La remarque la
plus
intéressante que l’onpeut
tirer de ces résultatsest
l’importance
relative de ladispersion
instantanée 0"100 dans ladisper-
sion
générale
dontl’écart-type représente
88%
del’écart-type général.
Ce
phénomène
est d’ailleurs communément admis. Il n’est pas inutile toutefois de lerappeler (1) .
Pour raisonner en
variance,
cequi
estplus
exact, nous avons déter- miné lesparts
relatives de ladispersion. (Cf.
schémaci-dessous).
Figure 2 - Décomposition de la dispersion
- Une deuxième remarque est que la
dispersion
instantanée est remar-quablement
stable : seulement 2%
de la variance totale sont à attribuer à la fluctuation de celle-ci.Coefficient ’~"
A titre de
complément,
nous donnonsci-dessous,
sous forme de dia- gramme la suite des 35 coefficientsK40 correspondants,
enrappelant
que le---
(1) Cette observation mérite
particulièrement
considération lorsqu’on envisage une régu- lation automatique des poids ; pour des questions de temps de réponse mécanique (100 cigarettes correspondent à 3 secondes) une action de correction efficace à l’in- térieur des groupes de 100 reste encore problématique. De ce fait, unerégulation
des poids ne peut maîtriser qu’environ 20 % de la fluctuation totale.
coefficient K est défini comme le
pourcentage
decigarettes comprises
entre Pm f i mg, pm étant lepoids
moyen du groupe considéré.Ici,
l’intervalle de classement i a été choisiégal
à 40 mg pour conserver une sensibilité maximale[ 2] [3].
On remarque la
dissymétrie
del’histogramme
des coefficients K.On remarquera
également
que l’un d’entre eux est anormalement basK4o -
62.Coefficient K
Figure 3 - Variation au cours du temps du coefficient K4,,, - ·
Il a été facile de
repérer
laplace
descigarettes correspondantes
dansla série et d’examiner le
graphique
de la succession despoids
individuels :l’explication apparait clairement ;
unchangement
depoids
moyen accidentel est intervenu au milieu du groupe de 100cigarettes
considéré.Variances et
écarts-types
despoids
collectifsOn a ensuite calculé la variance et
l’écart-type
despoids
moyens de Kcigarettes
consécutives pour de nombreuses valeurs de K données dans letableau
ci-après.
Ces variances ont été calculées par
balayage complet
de lasérie,
c’est- à-dire de lafaçon
suivante :Si l’on considère la suite des
poids
individuels :on a
pris
encompte
les 3 591- K groupespossibles
de Kcigarettes
consécu-tive s (1 ) .
---
(1) Il va sans dire que seul un ordinateur permettait ce calcul substantiel.
Figure 4 - Evolution des poids individuels du n° 2 001 à 2 100 expliquant la valeur basse
du coefficient
K40
d’ordre 21.Ainsi,
parexemple,
pour lepoids
moyen de 3cigarettes consécutives, l’analyse porte
sur :soit : 3 591 - 3 = 3 588 valeurs.
Ce mode de calcul
présente l’avantage
d’être assis surl’échantillonnage
maximal
compatible
avec lesdonnées,
et par ailleurs depermettre
un bou-clage
des calculs par la recherche des fonctionsd’autocorrélation,
ce que nous verrons par la suite.Les résultats obtenus sont
récapitulés
dans le tableau suivant :(voir
pagesuivante).
On retrouve
naturellement,
pourK = 1,
la valeur del’écart-type
in-dividuel
déjà
calculé auparagraphe "Analyse
de ladispersion".
L’écart de 0,1 mgs’explique simplement
parlégère
différence d’assiette entre les deux estimations(3 590 cigarettes
et 3 500cigarettes).
La
quatrième
colonnequi
donnel’écart-type "théorique" auquel
il fau-drait s’attendre en l’absence de toute
autocorrélation,
montre combien l’effet de"parenté"
estsensible,
c’est-à-dire met en évidence une autocorrélation despoids
que nous allonsprécisément
étudier.Etude des autocorrélations entre
poids
des rangs successifsDire
qu’il
y a autocorrélation entre lespoids
decigarettes séparées
par K rangs, veut dire que leur covariance n’est pas
nulle,
ou encore que cespoids
ne sont pasindépendants
au sensstatistique
de ce terme.Pour
parler
en termesplus
communs, l’existence d’une autocorrélation entre lespoids
detronçons plus
ou moins "voisins" résulte d’une liaison oud’une certaine
parenté
entre ceux-ci. Cephénomène
est d’ailleurs très intui- tivement convenablelorsqu’on
remonte auphénomène
deproduction lui-même,
c’est-à-dire la formation du boudin au niveau du distributeur de la machine :on
conçoit
ainsi quesi,
parexemple,
unecigarette
se trouve au dessus dupoids
moyen, cellequi
la suit a, toutes choseségales
par ailleurs"plus
dechances" de se trouver elle aussi au-dessus du
poids
moyen, les "chances"diminuant au fur et à mesure que l’on
s’éloigne
de lapremière cigarette prise
comme référence.Les notions
qui précèdent
se rattachent à la théoriegénérale
des fonc-tions aléatoires sur
laquelle
notre propos n’est pas de nousétendre,
cequi
sortirait très nettement du cadre de cetexposé.
Nous ferons toutefois l’ob- servation suivante : une classe de fonctions aléatoiresparticulièrement
im-portante
est celle dite des fonctions aléatoires stationnaires du second ordre danslaquelle
se range, au moins enpremière approximation,
ungrand
nom-bre de
phénomènes physiques.
Sans entrer dans le détail del’aspect
théori-que et
rigoureux
de laquestion,
disons que ces fonctions sont caractérisées par une autocorrélation stationnaire ouplus précisément
par le fait que le coefficient d’autocorrélationqui
lie deuxcaractéristiques
xi et X1tk de la sé- rie considérée nedépend
que de l’intervalle des rangs, K.Les calculs que nous avons effectués comme
précisé ci-dessous,
sont fondés surl’hypothèse
de la stationnarité. On verra par les vérifications ré- sultant de cettehypothèse quant
aux relations existant entre les coefficients d’autocorrélation et lesécarts-types
despoids
moyenscollectifs,
que cettehypothèse
s’avèreparfaitement justifiée.
* *
*
Nous avons ainsi
appelé
coefficient d’autocorrélation de rangK,
l’ex-pression
définie par :le calcul étant étendu à tous les
couples
distants de K rangs, Xireprésen-
tant le
poids
individuel de lacigarette
de rang i.Cette
expression
s’écrit encore :en notant var x la variance des
poids individuels, puisque :
sur l’ensemble de la
population.
Le calcul lui-même ne
présente
aucunedifficulté,
si ce n’est salongueur puisqu’à chaque
coefficient pcorrespondent
3 590 K termes ; là encore l’or- dinateur rend un serviceappréciable.
Coefficients de corrélation brute
Les résultats du calcul sont les suivants :
(voir
pagesuivante).
Commentaires
Si l’on trace le
graphique Pk =
r(K),
onpeut
faire les observations sui- vantes.- La valeur
de Pk
décro3t d’une valeursignificative positive jusqu’à
unevaleur nulle au fur et à mesure
que K croqt,
comme il fallaits’y
attendre .Au-delà de
K = 70,
ce coefficient nepeut plus
être considéré commesignificativement positif.
On doit donc considérer que la"parenté"
entre ci-garettes
n’est sensible quejusqu’à
70 rangsd’écart,
cequi représente
à peuprès,
2,1 secondes.- D’autre
part,
lespectre
dePk
brutprésente
unsystème
de "dents de scie"parfaitement régulier qui
nous abeaucoup intrigués jusqu’à
ce que nous en trouvionsl’explication.
On remarque, en
effet,
des inversionsrégulières
depériode
"2" dans la décroissance dep.,
telles queP2p > P2p-l.
Autocorrélations
entre rangsIl y avait donc là un
phénomène périodique
visiblement lié à laparité
des
cigarettes,
que nous avons cherché à élucider.Un test
simple
nous apermis
d’endégager
la cause.Nous avons
calculé,
sur l’ensemble de lapopulation,
lepoids
moyen descigarettes
de rangimpair (cigarettes
circulant sur la file degauche)
etle
poids
moyen descigarettes
de rangpair (cigarettes
circulant sur la filede droite et ensuite
retournées).
Les résultats sont les suivants :
Poids moyen des 1795
cigarettes "impaires"..
881 mg (7 = 27, 5 mg Poids moyen des 1795cigarettes "paires"....
875 mg cr = 27, 3 mgRang de l’écart
Figure 5 - Spectre d’autocorrélation brute de 3640 cigarettes consécutives (long.
59 mm) (observer le phénomène périodique en "dents de scie".
Si l’on calcule la variable t
(de Student-Fisher)
relative à l’écart cons-taté :
dans
laquelle (52 est
la variance commune, ni = n2 - n.On obtient :
La variable t suit une loi à 2 x 1795 - 2 =3588
d.d.l.,
c’est-à-direpratiquement
une loi normale. La valeur t = 10, 2correspond
à uneproba-
bilité extrêmement faible au cas où les deux moyennes
proviennent
d’unemême
population.
- En
conséquence,
l’écart- de 9 mg entre lespoids
moyens des deuxsous-populations
est hautementsignificatif(l).
---
(1) L’efficacité de ce test est en même temps une bonne présomption qu’il n’y a pas
eu d’erreur de reclassement des cigarettes dans leur ordre naturel.
Cet écart
peut
vraisemblablements’expliquer
par les considérations suivantes liées au fonctionnement même du matériel deproduction :
Les
cigarettes
de rangpair
sontcelles,
nous l’avonsdit, qui
circulentsur la file de droite de l’assembleuse. Ceci étant :
a)
Elles sont d’abordplus
brutalement freinées sur le barillet derécep-
tion
puisque
leur course estplus
courte(décélération plus forte).
b)
Elles subissentl’opération
de retournementqui
les ébranlequelque
peu.
Ces deux actions combinées entraînent une
perte
par les boutssupplé-
mentaires de 9 mg par
cigarette
en moyenne.Calcul des autocorrélations
corrigées
Nous avons alors
repris
le calcul des autocorrélations en "créditant"chaque cigarette
de rangpair
de 9 mgsupplémentaires, correspondant
à laperte
moyennespécifique
de cescigarettes
dansl’opération d’assemblage.
Les nouveaux coefficients d’autocorrélation sont ceux
qui figurent
à laquatrième
colonne du tableauprécédent.
Lacinquième
colonne donne l’inter- valle de confiance à 95%.
On
observera,
d’unepart,
que toute interversionsystématique
a main-tenant
disparu,
la décroissanceétant,
aux fluctuations aléatoiresprès,
ré-gulière quand
l’ordre Kcro3t ;
d’autrepart,
que les coefficients sontlégè-
rement
majorés
en moyenne, cequi s’explique aisément,
lephénomène
pa- rasite mis en évidence ci-dessus abaissantsystématiquement
la corrélation des rangs d’écartimpair
par suite de lasuperposition
d’une autocorrélationpartielle négative.
Observations sur le
spectre corrigé
Les
points
suivantsparaissent
àsouligner :
- Les autocorrélations entre
cigarettes
sont trèssignificatives
entreles rangs 1 à 10, tout en décroissant
rapidement.
- Elles restent encore
significatives jusque
vers les rangs 60-70. Au-delà,
la"parenté"
entrecigarettes
est difficilement mise en évidence : elle esttrès
faible en tout état de cause.- Nous avons
porté
sur le mêmeschéma,
la fonction de corrélation des rangs obtenue(il
y adix ans)
lors d’un essai effectué sur un matériel deconception analogue
tournant à 1400tours/minute,
maisportant
sur unepopulation
de 40000cigarettes (les
coefficients d’autocorrélation n’avaient pas été déterminés avec la mêmeprécision d’échantillonnage).
- Il est
remarquable
de constater la similitude des deux courbes ob- tenues lors de ces deuxexpériences parfaitement indépendantes.
L’écart que l’on constate entre les valeurs des autocorrélations pour un même rang(plus
élevées pour le
premier essai) peut,
à notreavis, s’expliquer
par les deux raisons suivantes :a)
Lestronçons
dupremier
essai étaient de 70 mm, pour 59 mm lors du deuxième essai(phénomène qui
diminue lapart
due à l’instantané aléatoire dans lepoids
dutronçon).
--+ Rang d’écart entre cigarettes
Figure 6 - Spectre d’autocorrélation corrigé de 3640 cigarettes consécutives (long.
59 mm).
b)
L’assiette de lapopulation
étant notablementplus
élevée dans le casdu
premier
essai, il est natureld’obtenir,
toutes choseségales
parailleurs ,
un effet de
"parenté" plus significatif.
Relation entre la variance des
poids
collectif s et les coefficients d’autocorré- lation des rangsPar un calcul
théorique
que nous nedévelopperons
pas ici pour ne pas alourdirl’exposé,
onpeut
montrer que la variance dupoids
moyen Xk de kcigarettes consécutives,
est liée à la variance dupoids
individuel x par la formulesuivante(1) :
(1) Le développement complet du calcul correspondant est publié dans l’article précé- dent.
formule dans
laquelle ~
est une fonction linéaire des k -1premiers
coeffi-cients de corrélation entre rangs telle que :
La formule
(F) précédente
met bien en évidence lapart jouée
par lesparentés
entrecigarettes
dans la modification de la variance despoids
moyens collectifs parrapport
à la valeurqu’elle
aurait en l’absence de toute autocor- rélation de rangs.Dans ce cas en effet :
ce
qui
entraîne :formule
classique qui
donne la variance de la moyenne de Kcaractéristiques indépendantes
en fonction de leur variance individuelle. Dans le cas où tous lesPi
sont > 0(cas
descigarettes consécutives),
R K
est une forme strictementpositive
et parconséquent :
C’est bien ce que l’on observe en
pratique.
Vérification
expérimentale
Si nous
désignons
par FR(K)
la fonction 1 + 2RK
et par RACF(K)
lafonction
VFR~K),
nous avons pour tout K :Les valeurs des fonctions FR
(K)
et RAC F(K)
ont été calculées(1)
pour K = 2 à 20 àpartir
des coefficients d’autocorrélationPl ,
...,pis
déterminésau
paragraphe
"Etude des autocorrélations entrepoids
des rangs successifs : Coefficients de corrélation brute".On a ensuite
comparé
les valeurs"théoriques"
des variances et des cr despoids
moyens collectifs calculés par la formuleprécédente
avec les va-leurs obtenues au
paragraphe
"Variances etécarts-types
despoids
collectifs".Ces
comparaisons
sont données dans le tableau page suivante.---
(1) Le calcul de la suite des valeurs FR (K) se prête particulièrement bien à un trai-
tement sur ordinateur, car il est justiciable d’un algorithme simple.
- Il y a donc concordance
parfaite (à quelques
décimalesprès)
entrela variance calculée directement à
partir
despoids
moyens collectifs et la variance déterminée àpartir
de la variance individuelle à l’aide des coef- ficients d’autocorrélation enappliquant
la formule(F) précédente.
Ce tableau illustre bien l’incidence
importante
des autocorrélations entrepoids
decigarettes
voisines sur la non-décroissance de la variance dupoids
moyen collectif au
rythme auquel
onpourrait
s’attendre s’il y avaitparfaite indépendante
entre lescigarettes (comparer
les colonnes 2 et 6 ou5).
CONCLUSIONS
L’emploi
des méthodesd’analyse statistique
sur despopulations
de ci-garettes consécutives,
rendu maintenantpossible grâce
auxperformances
decalcul que l’on
peut
obtenir desordinateurs,
apermis
depréciser
de ma-nière
quantitative
lesphénomènes
suivantsdéjà
tenus pouracquis
sur leplan qualitatif.
La
dépendance "cinématique"
entrecigarettes voisines joue
un rôle fon- damental pourl’appréciation
descaractéristiques
dedispersijon.
On a ainsipu mettre en évidence la liaison
qui
existe entre la variance dupoids
moyen de ncigarettes
consécutives et les n-1 coefficients d’autocorrélation corres-pondants.
Il est en outre confirmé que ladispersion "instantanée",
c’est-à-dire celle
qui
résulte des variations deremplissage
dans des intervalles detemps
inférieurs à 2secondes,
constitue lapart principale
de ladispersion
d’ensemble.Parallèlement,
certaines observationscomplémentaires
ont pu être dé- duites des résultatsobtenus,
comme parexemple
l’influence de la machine assembleuse sur laségrégation
descigarettes
en deuxsous-populations
depoids
moyens différents par suite d’uneperte
par les bouts sélective.Enfin, l’analyse statistique
apermis
d’étudier lecomportement
de lamachine a assembler
quant
à ladispersion
dupoids
destronçons
de filtresprovenant
d’une double coupe suivie d’une recoupe.Au
total,
bien que l’étudeprécédente
neporte
que sur 3 600cigarettes
consécutives et ce, pour des
questions
essentiellement d’ordrepratique,
laméthodologie adoptée
devraitpouvoir
être utilisée avecprofit
sur des sériesplus importantes :
enparticulier,
si la fiabilité et letemps
deréponse
desjauges
àrayons ~
et des organes traducteursqui
lesaccompagnent
continuent à s’améliorer comme au cours de la dernièredécennie,
on devraitpouvoir envisager
la construction de chaînes de mesurecapables
de déterminer encontinu avec
précision
lespoids
successifs detronçons
de diverseslongueurs
et d’effectuer une conversion
analogique numérique
aussitôt transcrite sur unsupport
propre à être traité directement sur ordinateur(bande perforée,
oubande
magnétique).
Si une telle réalisation n’a rien
d’utopique
et est mêmeproposée
sousdiverses variantes par certains
constructeurs,
il semble encore difficile depouvoir obtenir,
sous formenumérique,
la série des valeurs individuelles despoids
detronçons
avec laprécision qu’apporte
une vraiepesée :
l’étudeque nous venons de
présenter
montre l’intérêtqu’offre l’analyse statistique
détaillée de telles séries.BIBLIOGRAPHIE
[1]
REY P. - "Cours de fabrication des tabacs". Tome II,chap.
BIX,
p. 20, Ed. 1952