R EVUE DE STATISTIQUE APPLIQUÉE
R. D UVAL
Étude graphique d’une distribution lognormale
Revue de statistique appliquée, tome 7, n
o1 (1959), p. 107-115
<
http://www.numdam.org/item?id=RSA_1959__7_1_107_0>
© Société française de statistique, 1959, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
ÉTUDE GRAPHIQUE
D’UNE DISTRIBUTION LOGNORMALE
R. DUVAL
Ancien Élève de l’École Polytechnique Ingénieur Civil des Mines
Ancien Directeur
àla Société M. M. de Penarroya
La note .ci-dessous se propose de
faire
cona!tre quelques constructions~éo~nétriques
qui paraissent intéressantes pourfaciliter
l’étude des distri- bytions obéissant à une loi lognormale ou pouvants’y
rattacher.Ces renseignements ont été extraits d’un article de N.F. Witz paru dans
"Ber~bau-Archiv" fascicule
2 - 1957. Les notationsadoptées
dans cet article ont étémodifiées
pour lesadapter
aux usa~esfrançais
et lesjustifications
des constructions,
qui
n’étaient pasexposées
dans le dit article, ont été reconstituées.Ainsi
qu’on
le verra, il Zs’agit
deprocédés ~raph i ques
permettant dedéterminer rapidement
les abscisses de la moyennearithmétique
et du moded’une distribution de valeurs
lognormales
etd’ajuster
par undécata~e
d’o- rigine certaines distributions qui ne paraissent pasto6normales
à une loi lognormale.Toutes ces constructions se
font
sur te tracé6raphique
de la somme cuncut ée desfréquences, anamorphosé
sur un réseau de coordonnées dit normal o-t o~ari th~mique (loêiîormal),
ou~ausso-Zo~arithmiqr~e
ou encore Êaltonien-Z o~ari thmique,
car laterminoto~ie
n’en est pas très bienfixée.
RESEAU DE COORDONNEES
NORMALO-LOGARITI-IMIQUE
C’est le réseau
qui
sert àanamorphoser
en droite deHenry
une courbe cumulée desfréquences
d’une loilognormale.
Il est nécessaire pour la
compréhension
desprocédés exposés
ci-dessousd’avoir bien
présente
àl’esprit
la manière dont ce réseau est construit.Nous croyons donc utile de la
rappeler
ci-dessous.L’origine
des ordonnées se trouve sur l’horizontale cotée 500/lo
du réseau.L’échelle des ordonnées est une échelle
métrique
desparamètres
t del’expres-
sion
c’est-à-dire que les ordonnées
sontproportionnelles
à t mais elles sont chiffrées pour une série de valeurs rondes des Tr(t) correspondant
aux t. On obtient doncune
graduation irrégulière,
ils’agit
d’une échelle dite fonctionnelle.Ce
t, qui
est la variable réduite de la loinormale,
se mesure en écarts-types,
unécart-type
réduitcorrespond
comme on le sait à la valeur0, 3413
de 1T
(t). Les probabilités
au lieu d’être chiffrées àpartir
del’origine
sont chif-frées en valeurs de
0,
50 - Tr(t)
au-dessous del’origine,
cotée elle-même0,
50ou 50
%,
et en valeurs de0,
50 + n(t)
au-dessus del’origine,
de manière à avoirune
graduation
croissante de - oo à +00.Un
écart-type
est doncreprésenté
sur l’axe des ordonnées par unsegment
s’étendant du
point
coté0,
50 -0,
3413 =0,
1587 ou15,
87~o
aupoint
coté0, 50
ou50
~o,
ou bien par unsegment
s’étendant dupoint
coté0,
50 ou 500/o jusqu’au point
coté0,
50 +0,
3413 =0,
8413 ou84,
13°~o.
Chacun de cessegments,
mesuréen mm par
exemple,
constitue donc lemodule ul
de l’échelle des ordonnéesqu’il
est nécessaire de connaître pour certaines constructions que nous verrons
plus
loin. On se contente leplus
souvent d’ailleurs despoints portant
les cotes 160/10
et 84
%,
la différence avec les valeurs exactes étantinappréciable graphique- ment,
à l’échelle habituelle desfigures.
L’échelle des abscisses est une échelle
métrique
des valeurs desloga-
rithmes ordinaires d’une suite de nombres continue. Les divisions sont chiffrées
généralement
pour uneprogression arithmétique
de cesnombres,
les divisions sont donc encoreirrégulières,
c’est encore une échelle fonctionnelle. Cette échellen’est pas portée
sur l’horizontale cotée 50~o qui
passe parl’origine,
carelle y
génerait
les constructions et ne serait que malvisible,
mais elle est trans-portée
par translationparallèlement
à l’axe des ordonnées vers le bas de la feuille. Sonorigine qui
est sur l’axe des ordonnées est cotée 1puisque log
1 = 0 .Les
longueurs
dessegments
mesurées sur cet axe des abscisses àpartir
del’origine
sontproportionnelles
aux valeurs deslogarithmes
ordinaires.On trace cette division
généralement
au moyen d’une table deslogarithmes ordinaires,
mais pour l’étude de la loilognormale
il est commode de la consi- dérer comme faite enlogarithmes népériens.
Etant donné que leslogarithmes népériens
sont dans unrapport
constant avec leslogarithmes
ordinaires corres-pondants,
ils’agit simplement
d’une modification de module d’échelle que nous allonsindiquer.
Quand on considère
l’échelle des abscisses commereprésentant
desloga-
rithmes
ordinaires,
lemodule, p 21 de
l’échelle est lalongueur
mesurée en mmdu
segment
s’étendantdepuis l’origine,
cotée1,
aupoint
coté10,
carlog
10 = 1 .Lorsqu’on
désire que cette même échellereprésente
deslogarithmes
né-périens
etqu’on
considèreun point
coté x de l’échelle lalongueur
dusegment
s’é-tendant
depuis l’origine jusqu’à
cepoint
coté x estégale
àlog
x.u2’ , puisque P21
est le module de l’échelle deslogarithmes
ordinaires.Mais si l’onveut que ce même
segment
mesuré en mmreprésente
unloga-
rithme
népérien,
salongueur
doitreprésenter Lx ;
enappelant P 2
lemodule ,
encore
inconnu,
de l’échelle deslogarithmes népériens,
elle doit donc êtreégale
en mm à Lx . ~2 . Cette
longueur
étantégale aussi,
àlog
xu2
on doit donc avoir :0, 43429 = log
e étant lerapport
constant2013s2013.
Lx Cetteexpression permet
donc de déterminer immédiatement lemodule 112
de l’échelle considérée comme re-présentant
deslogarithmes népériens lorsqu’on
connait1l2’
, le module de l’échel- le considérée commereprésentant
deslogarithmes ordinaires.
Cet
exposé
étantterminé,
onpeut
passer àl’explication
des constructionsgéométriques
dont il a étéparlé
audébut.
DETERMINATION DE LA MOYENNE
ARITHMETIQUE
ET DE L’ABSCISSE DU MODE D’UNE DISTRIBUTION LOGNORMALE SUR LA DROITE DE HENRY REPRESENTANT LA DISTRIBUTION DESFREQUENCES
CUMULEES DES LO- GARITHMESLes formules donnant cette moyenne et cet abscisse du mode sont comme on le sait
(1) :
et
Dans ces formules
m = moyenne
arithmétique,
de la distribution des x ; y = médiane et moyennegéométrique
des x ;a
= écart-type
de la distribution deslogarithmes népériens
desx (c’ e st
donc un
logarithme népérien).
L
Y = moyenne arithmétique
et médiane de la distribution deslogarithmes népériens
des x ;s = abscisses du mode de la distribution des x.
A -
Moyenne arithmétique
mConsidérons, figure 1,
la droite deHenry
tracée sur le réseau normalo-logarithmique, représentant
la distribution desfréquences
cumulées desloga-
rithmes
népériens
des x.Traçons par le s graduations
de l’axe des ordonnées 160/o,
50%et
84%des
horizontalescoupant respectivement
la droite deHenry
auxpoints A,
D et B etprojetons orthogonalement
cespoints
sur l’axe des abscisses enrespective-
ment a, d et b.
Figure
1(1)
Annales des Mines - Déc. 1955 - p. 18.Nous remarquerons que les
segments
ad = dbreprésentent
à l’échelle del’axe des abscisses la valeur
de , l’écart-type logarithmique.
Il y a en effet 5070 -
1670
= 8470 -
5070
= 34~o
de toutes les valeurs de Lxqui
sontcomprises
entre les valeurs de Lx
correspondant
auxpoints
a et d ou d etb,
c’est la pro-portion qui correspond
à la définition del’écart-type
d’une loi normale.On peut donc
admettre quead =
dbreprésente cr
à l’échelle des abscisses.Quant
à l’abscisse deD,
soit wd =oD,
ellereprésente
à cette même échelle L y , moyennearithmétique
des Lx.Supposons
leproblème
résolu et admettonsqu’on
connaisse la valeur de la moyenne, m ;enportant
à l’échelle des abscisses unsegment représentant Lm,
ce
segment ~ m
a son extrémité mqui
serappelle
verticalement en M sur la droite deHenry.
Si donc on connaitM,
on en déduit inversement lepoint
m doncLm et par suite la moyenne
arithmétique.
Comme le
segment
wdreprésente
LY et que wmreprésente
Lm on doit0-2 -
avoir
2 représenté
par lesegment
dmpuisque
a2
Lm - L Y -
2 d’après l’équation (1)
Considérons maintenant les 2
triangles rectangles
semblables DMm’ etDBb’,
on a évidemment :En
appelant
1-11 le module de l’échelle des ordonnées et 1-12 le module de l’échelle desabscisses,
comme on constate que :---- 0-2
Dm’ = dm doit
représenter 2 à
l’échelle desabscisses,
ffiT’M"
représente
à l’échelle des ordonnées une certaine valeurnumérique
y , Db’ = dbreprésente ~
à l’échelle desabscisses,
b’B
représente
ainsiqu’on
l’a vu le module 1-11 desordonnées, l’égalité (3)
entre
segments
ci-dessus s’écrit donc :On aboutit donc à la relation
purement numérique
qui représente
en coordonnées y et cr une droitepassant
parl’origine
et de coef-ficient
angulaire égal
à1/2.
On peut
tracer cette droite sur les axes du réseau àpartir
del’origine 0 ,
il suffit pour cela de déterminerl’angle
effectif Mqu’elle
doit faire avec la droite horizontale cotée 50%, compte
tenu des modules différents IIIet 112
des échelles des deux axes.Un point
courant de cette droite aura pour coordonnéesrespectives, expri-
mées en mm, des
segments
y ul et o- u2 et l’on aura :Cette
expression
doit se réduire àl’équation (4) ci-dessus,
parconséquent
ondoit avoir :
ce
qui permet
de tracer immédiatement la droite OX de lafigure 1, qui
ne dé-pend
que de iciet il,
, etqui
est donc valable pour toutes les contructions faitessur ce
réseau.
Lorsque
cette droite esttracée,
la détermination de M donc de m est im-médiate.
Il suffit deporter
sur l’horizontale cotée 50%un segment
OE = db = o- u2puis
par son extrémité E de tracer une verticalequi
coupe la droite OX en unpoint
N. On aura ainsi :I-l 0-
EN 1-l2
.201320132013-= "2 I-ll =
y ulreprésentant
y à l’échelle des ordonnées2 u2 2
Ce
point
N étant connu, on mène par lui une horizontalequi
coupe la droite deHenry
enM,
d’où l’on déduit immédiatement saprojection
verticale m sur l’axedes abscisses.
On a alors la valeur de la moyenne
arithmétique
en lisant cette valeur surla
graduation
de l’échelle horizontale du réseau. Il faut souventinterpoler
entreles
graduations
tracées. Cetteinterpolation
se fait en mesurant en mm la lon- gueur dusegment
w m et en la divisant par la valeur du moduleg2l
de l’échelle(longueur en mm
dusegment compris
entrel’origine
et la division 10 ainsiqu’il
a été dit
plus haut).
Lequotient
donne la valeur dulogarithme
ordinaire de la moyenne, donc la moyenne elle-même enrepassant
au nombre dulogarithme .
B - Abscisse du mode
Ainsi que
l’indique l’équation (2)
vueplus
haut on a :Reprenons (figure 2)
le tracé de la droite deHenry
sur le réseau normalo-logarithmique.
/Figure
2Le
segment
odreprésente toujours
à l’échelle des abscissesL Y ,
1portons
sur l’axe des
abscisses,
dans le sensdécroissant,
unsegment
dsreprésentant
à l’échelle de cet axe la valeur 0-2, on voit que :
par
conséquent
en vertu de la relation(2),
ws doitreprésenter
à l’échelle de l’axe des abscisses la valeur de Ls =L y -cr2S2.
On voit sur lafigure
que lestriangles
Da’A etDs’ S
étant semblables on a :D’après
le même raisonnement que celui fait pour la détermination de la moyennearithmétique
cetteexpression peut
s’écrire :D’où
expression représentant
encore en coordonnéesy’
et ~ une droitepassant
parl’origine
de coefficientangulaire
1.Le même raisonnement que celui fait pour la droite OX montre que l’an-
gle M ’
1 que doit faire la droite OY enquestion
avec l’horizontale cotée 5011/ro
du réseau est donné par :On
peut
donc tracer immédiatement une fois pour toutes cette droite OYsur le
graphique
et en déduire lepoint
S par une construction similaire à celledéjà
vue pour la détermination de la moyennearithmétique.
Une fois lepoint
sconnu on en déduit l’abscisse du mode de la même
façon
que la moyenne arithmé-tique.
DECALAGE DE LA DISTRIBUTION LOGNORMALE
Ilest bien rare
lorsqu’on
areporté
la courbe cumulée desfréquences
surun réseau
normalo-logarithmique
que l’on trouve unalignement rigoureusement
en
ligne droite,
ilfaut,
mêmelorsqu’on
a affaire à une distributionlognormale , procéder
à unecompensation.
Si cettecompensation
n’est visiblement pas pos-sible,
on estobligé
deprocéder
à unecompensation qui peut
donner une courbe convexe du côté des abscisses croissantes ou inversement. Dans lepremier
cason
peut
essayer enaugmentant
toutes les valeurs observées d’unequantité
cons-tante K
(c’est-à-dire,
enfait,
en décalantl’origine
de K vers lagauche)
d’arri-ver à obtenir une courbe cumulée des
fréquences
se rectifiant sur le réseaunormalo-logarithmique.
Dans le second cas onpeut
faire le même essai maisen retranchant une constante K de toutes les valeurs observées.
Lorsqu’on opère
par tatonnements cette recherche
peut
être trèslongue
et on n’ajamais
unepreuve que le
problème
cherché estimpossible.
L’auteur de l’article
signalé
audébut,
M.Witz,
aindiqué
une méthoderapide permettant
de déterminer cette valeur K et de constaterlorsqu’elle
nedonne pas la rectification
escomptée
que leproblème
n’a pas desolution,
c’est-à-dire que la distribution étudiée n’est pas
susceptible
de se transformer en dis- tributionlognormale
par la transformationenvisagée.
Examinons le cas de la constante K
additive ;
afin d’éviter les confusions dans cequi
suit il sera convenu que les notationsindiquant
des nombres serontsoulignées,
cellesindiquant
des vecteurs serontsurlignée s,
leslettres indiquant simplement
despoints
de lafigure
resteront tellesquelles.
Figure
3Supposons
leproblème
résolu(figure 3)
et admettons que la courbe cumu- lée observée soit la courbe I et que l’addition de la constante K aux valeurs ob- servées la transforme en la droite II.Les
points
D etD’,
intersections de I et II avec l’horizontale cotée 50C}o, se projettent aux points
d et d’ de l’axe des abscissesqui correspondent
respec- tivement auxgraduations d
et~ de l’échelle.
D’après
lafaçon
dont les deux courbes se déduisent l’une de l’autre on doit avoir :Le
segment
w d’représente
à l’échelle des abscisses lelogarithme népé-
rien de la médiane de la distribution transformée
qui est dl,
c’ e st donc à l’échelle des abscissesLd’, quant
ausegment w d,
ilreprésente
à l’échelle des abscis-ses Ld.
On a donc Ld’ = L
(d
+K)
Considérons deux
points
A et B de la courbe Iplacés respectivement
àégale
distance de la droite 50%
mais depart
et d’autre. Ces deuxpoints
corres-pondent
aux deuxpoints
A’ et B’ de la droite II.Projetons
cespoints
verticale-ment sur l’axe des abscisses en a et
b,
ils seplacent
sur lesgraduations
a et b.Posons :
De même
projetons
A’ et B’ verticalement sur l’axe des abscisses en a’ etb’,
1 cesprojections
seplacent
auxgraduations a’
etb’ respectivement.
D’après
la manière dont la droite II a été construite àpartir
deI,
on doitavoir :
Le
segment
coalreprésente La,
lesegmentù)bl représente Lb’ ,
nous avonsdéjà
vu que ~d’représente
LdBComme les deux
segments
a’d’ et d’b’ sontégaux
parconstruction, puis-
que la courbe II est une
droite,
on doit donc avoird’après
cequ’on
a vu ci-dessus :ou
d’après (2)
c’est-à-dire en
remplaçant d
par sa valeur tirée de(1)
ou
ou
Les
valeurs a et p
se déduisent des lectures faites sur la courbeI,
l’ex-pression (3)
donne donc la valeur de ~’ àpartir
de la courbe II.Comme d est connu
d’après
la courbeI, l’expression (1)
fournit la valeur K de laconstante,
dèsqu’on
connaît dl.Cette valeur K étant
déterminée,
on déduit lespositions
despoints
A’ etB’ à
partir
de celle despoints
A et Bpuisque
L
(a
+K) =
L(a’ )
estreprésenté par wal
etL
(b + K) =
L(b’)
estreprésenté
parMb’~
d’où lespoints
A’ et B’.On
peut
doncplacer
sur legraphique
les troispoints
A’D’B’.Si ces trois
points
sont enligne droite,
on obtient la droite IIqui repré-
sente la somme cumulée des
fréquences
de la transformée sur le réseau normalo-logarithmique.
La détermination de la moyennearithmétique
et du mode de la distribution transformée par les méthodesindiquées plus
hautpermet
de repas-ser facilement à la moyenne
arithmétique
et au mode de la distributionorigi-
nelle dont la densité de
probabilité
est alors de la forme :Si ces trois points
ne sont pas enligne
droite c’est que la distribution ori-ginelle
n’est pas de la formeindiquée par
la densité deprobabilité
ci-dessus.Cependant
onpeut
étudier si elle n’en diffère pas detrop,
de lafaçon
suivante :En effet dans tout ce
qui
a été ditci-dessus,
la distanceséparant
lespoints
A et B de la courbe I de la droite cotée 50
%
n’ont pas étéspécifiées,
il suffitqu’elles
soientégales.
Toutcouple
depoints
A et B satisfaisant à cette condition fournit donc unjeu
despoints A’D’ B’.
Enprenant
une série decouples
depoints
A et B sur I on obtiendra autant de
triplets A’D’B’.
Enreportant
cestriplets
A’ D’ B’ sur le
graphique,
onpeut
examiner si le nuage ainsi formé n’est paslarge
et
paraît pouvoir
être à peuprès compensé
par une droite. Cette droite pour- rait alors être considérée commereprésentant approximativement
une transfor-mée de la courbe
II,
cequi permettrait
une déterminationapprochée
des para- mètres de ladistribution.
Le cas où la constante K est soustractive se traite exactement de la même
façon
et par les mêmes relations(2).
CONCLUSIONS
Ces constructions
paraissent
intéressantes car ellespermettent d’essayer
sur des distributions observées