R EVUE DE STATISTIQUE APPLIQUÉE
B. R OY
Somme d’un nombre aléatoire de termes aléatoires.
Application aux problèmes de stockage
Revue de statistique appliquée, tome 8, n
o1 (1960), p. 51-60
<
http://www.numdam.org/item?id=RSA_1960__8_1_51_0>
© Société française de statistique, 1960, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
SOMME D’UN NOMBRE ALÉATOIRE DE TERMES ALÉATOIRES
APPLICATION AUX PROBLÈMES DE STOCKAGE
B. ROY
Attaché
àla direction Scientifique
de la Sociétéd’Économie
et
de Mathématique Appliquées
En matière
économique
ouindustrielle,
les fluxqui
se rencontrent natu-rellement,
neprésentent
que très rarement un écoulement continu. Ilsapparais-
sent au contraire
généralement
comme fractionnés en un nombre aléatoire de lots élémentairesayant
eux-mêmes une taillealéatoire,
si bien que laquantité
de flux écoulé durant une
période
se trouve être une variable aléatoire de la forme :où N
représente
le nombre de lots écoulés durant lapériode,
et oùles X; repré-
sentent la taille de ces lots. C’est
l’étude,
sous certaineshypothèses,
de l’ad-dition
qu’implique
de tellesvariables,
dont il va êtrequestion
ici.Dans tout ce
qui suit,
leshypothèses
suivantes serontimplicitement
sup-posées
vérifiées :1/
N est une variable aléatoireindépendante
de la suite desXi.
2/
LesXi
sont des variables aléatoiresindépendantes,
et de mêmeloi,
et les notations définies ci-dessous seront sans cesse conservées : loi de
probabilité
totale de ZH(z) =
Pr[Z z]
loi de
probabilité
totale de XF(x) =
Pr[X x]
loi de
probabilité
élémentaire de N Pn = Pr[N = n]
On
peut
donner unsupport
concret à ces notionsgénérales
en se référantau cas
particulier
d’un stock dont les sorties sont motivées par des commandes.Dans ce cas en
effet,
laquantité
deproduits
écoulés durant un mois par exem-ple
est bien une variable dutype
Z satisfaisant engénéral
auxhypothèses préci- sées,
et danslaquelle
N et Xsymbolisent respectivement
les variables aléatoires que sont les nombres mensuels de commandes et la taille de ces commandes.L’examen des bons de commandes fournit directement des échantillons des varia- bles N et X à
partir desquels
il estpossible
de se faire une idée des loisF(x)
etp.
Ainsi,
les variables aléatoires detype
Z se rencontrent-ellesfréquem-
ment dans les
problèmes
concrets de RechercheOpérationnelle.
Si l’on sait faire l’addition d’un nombre aléatoire de termes aléatoiresindépendants
et de mêmeloi,
on pourra déduire la loi H des loiscomposantes
F et p; si l’on ne sait pas faire une telleaddition,
on se verra contraintd’ajuster
directement la loi H surun échantillon de la variable Z.
Or,
des raisons d’ordre à la foisstatistique
etstructurel
permettent
de penserqu’en général,
il estpréférable
de passer par l’intermédiaire des loiscomposantes.
Plaçons-nous
tout d’abord d’unpoint
de vue strictementstatistique,
etsupposons que les
renseignements
dont ondispose
couvrent qpériodes.
Il enrésulte trois sortes d’échantillons :
Le premier de
tailleÀ relatif
à la variable X( À désignant
la valeur moyen-ne de N sur une
période).
Le second de ta ille q relatif à la variable N.
Le troisième de taille q relatif à la variable Z.
Le
premier
de ces échantillons est engénéral
très suffisant pour obtenirune estimation satisfaisante de la loi
F(x).
Il en est de même du second pourl’ajustement
de la loi p~. Eneffet,
bienqu’il
soit de taille notablementplus
pe-tite,
il serapporte
à une variable discrète pourlaquelle
il estfréquemment
pos- sible de déterminer apriori
untype
de loi tel que, loi binomiale ou loi de Pois-son. Les choses sont très différentes pour le
troisième,
car il serapporte
àune variable
continue,
engénéral
trèsdispersée
et à coup sûr(nous
aurons l’oc-casion de le
voir) beaucoup plus dispersée
que les variables X ou Nprises
sé-parément. Ainsi,
la méthode(que
l’onpeut qualifier
deglobale) qui
consiste à déterminer directementH(z)
àpartir
de ce dernieréchantillon,
s’avèrera sou-vent
beaucoup
moinsprécise
que celle(que
l’onpeut qualifier d’analytique) qui
repose sur une détermination
préalable
des loiscomposantes.
C’est bien natu-rel, puisque
le troisième échantillon ne contientqu’une partie
seulement de l’in- formation contenue dans les deuxpremiers.
La méthode
analytique
d’autrepart permettra
dans de nombreuxproblèmes
de fonder la loi H sur certaines
grandeurs ayant
un sens concret trèsprécis.
L’introduction de ces
grandeurs
commeparamètres
dans H pourra rendre pos- sible unréajustement périodique
facile de cette loi ou uneadaptation
convenableà certaines instabilités telles que
trend,
fluctuationssaisonnières,
variationd’une clientèle ou
d’un parc d’appareils.
Il est bien clair que la méthodeglobale,
en
mélangeant tout,
nepeut prétendre
à de telsavantages,
et cela d’autantplus
que le fractionnement
risque
de rendre l’échantillon numéro 3 inutilisable.Cette
souplesse
et cette sécurité de la méthodeanalytique
constituent lepoint
de vue structurel
auquel
il a été fait allusionprécédemment.
Comme il se trou-ve lié à
chaque
casparticulier
il est difficile de ledévelopper davantage.
Il seraillustré par
l’exemple
concretprésenté
à la fin de l’article.L’importance
du rôlejoué,
dans lesproblèmes concrets,
par l’addition d’un nombre aléatoire de termes aléatoiresindépendants
et de mêmeloi,
étantainsi mise en
évidence,
abordons maintenantl’aspect théorique
desproblèmes
soulevés par de telles additions.
Supposons
donc les loisF(x)
et Pndonnées,
etexaminons ce que l’on
peut
dire de la loiH(z).
En
premier lieu,
il estpossible d’exprimer
H à l’aide d’undéveloppement
en série faisant intervenir les lois F et p. Pour cela introduisons la suite en d’é- vènements exclusifs : en
ayant
lieulorsque
N = n, il vient :Posons :
cette fonction se déduit aisément de la fonction
F(x)
par convolution(puisqu’elle
n’est autre que la loi de la somme de n variables aléatoires
indépendantes
detype X).
Il vient alors :avec la convention suivante :
F~(z)=Y(z)
fonction de Heaviside.Cette formule
permet théoriquement
de calculerH(z)
pour une valeur don- née de z.En fait,
le calcul est assezpénible car
on estobligé
deprendre
un trèsgrand
nombre de termes dans ledéveloppement (1),
et de conserver pour cha-cun d’eux un très
grand
nombre de décimales(chaque
terme étant trèspetit)
sil’on veut obtenir une
précision
suffisante pourH(z).
,Il est par contre
quasi impossible
de résoudrel’équation : H(z) =
1 - Eéquation
trèsimportante
dans lesproblèmes
destockage
enparticulier.
Ainsicette formule est d’un intérêt très restreint.
On
peut
ensuite déduire la fonctioncaractéristique C1>z (t)
des fonctions ca-ractéristiques
des variables X et N.En
effet,
1>x{t) désignant
la fonctioncaractéristique
de la variable X.Si l’on
désigne
parG(u)
la fonctiongénératrice
de la variable Nil vient :Cette seconde formule est
beaucoup plus importante
que laprécédente
par-ce
qu’ elle permet
de déduire les moments de la variable Z de ceux des variables X et N.Il est facile d’établir les formules suivantes relatives à la moyenne et à la variance :
E(Z) = E(N) E(X)
V(Z) = E(N) V(X)
+V(N) E2(X) (3)
La seconde formule
(3)
lie la variance de Z aux variances de X et N. Elle estparticulièrement importante lorsqu’on
est en droit de penser que la variable Z suit une loi de Gauss. Ellepermet
en effet dans ce cas d’estimer les para- mètres de cette loi àpartir
des échantillons 1 et 2. Ceprocédé
semble trèsnettement
préférable
à celuiqui
consiste à estimer cesparamètres
àpartir
dutroisième échantillon.
On
peut également
calculer les moments d’ordresupérieur, lesquels
peu- vent être utiles pourajuster
la loi H à des loisplus compliquées
que celle deGauss,
telles que loi de Pierson ou loi de Gram-Charlier.Laissons maintenant le cas
général,
et intéressons-nous à celuiplus
par-ticulier,
mais trèsimportant,
où N suit une loi de Poisson.Il vient alors :
La fonction
génératrice
de la loi de Poisson a pourexpression :
et la formule
(2)
s’écrit dans ce casparticulier :
D’où l’on déduit :
y étant la seconde fonction
caractéristique
de la variable Z.Si l’on
développe
maintenant en série lafonction p :
Il vient :
D’où l’on déduit :
formule liant le cumulant d’ordre q de la variable Z au moment de même ordre de la variable X.
Cette
formule permet
d’écrire ledéveloppement
en série deGram-Charlier
de la fonctionH(z)
sous une formeparticulièrement simple.
Avant de lefaire,
disonsquelques
mots de ces séries.Elles font intervenir la suite
orthogonale
que constituentles polynômes
d’Hermite. Ceux-ci sont définis à
partir
des dérivées successives de la densité de Gauss :Il en résulte que le
développement
en série de Gram-Charlier de la densité deprobabilité h(z) peut s’écrire,
en ne faisant intervenir que ces dérivées :(1) On remarquera que la loi H(z) est indéfiniment divisible.
les
c~
étant des coefficients liés au moment d’ordre inférieur ouégal à
r de lavariable
Z,
par une formule assezcompliquée
que l’on n’utilisera pas.Les
premiers
coefficients de cedéveloppement prennent
une formeplus simple lorsque
l’on introduit la variable centrée réduite :La série de Gram-Charlier
prend
alors la forme :h(z)dz = [y(t) - c~3)(t)
+C4 y(4) (t) -
... +(- 1 ) r C r y ( r ) ( t)
+...]
dtqui
ne contient pas de termes eny’, y".
Les coefficients cr
s’expriment
assezsimplement
en fonction des cumu-lants de la variable Z d’ordre inférieur ou
égal
à r :La formule se
complique quelque
peu àpartir
de l’ordre 6.Intégrons
maintenant cedéveloppement
de manière à obtenir une expres- sion de la loi deprobabilité
totaleH(z).
Il vient :Fermons ici la
parenthèse
ouverte sur les séries de Gram-Charlier.La formule
(4) permet
d’écrire ledéveloppement
deH(z)
avec autant determes que l’on
voudra,
en ne faisant intervenir que les moments de la distri- bution de X et leparamètre
À de la loi de Poisson. Une telle série n’aura d’in- térêtpratique
que si elle converge suffisamment vite.Or,
les séries de Gram- Charlier sontparticulièrement
connues pourl’irrégularité
de leur convergence . On sait néanmoins que dans l’addition d’unpetit
nombre de variables aléatoires satisfaisant à certaines conditions trèsgénérales,
lespremiers
termes du dé-veloppement
de Gram-Charlier fournissent uneapproximation
très satisfaisante de la loi de la somme. Orici,
la variable Zapparaît
dans une certaine mesurecomme la somme de À variables
Y,
où Y est une variable obtenue enajoutant
unnombre aléatoire
poissonnien
de moyenne1,
de variable X.On est donc en droit de penser
que les premiers
termes dudéveloppement
constitueront une
approximation
très souventacceptable
de la loiH, plutôt
que d’entrer dans des considérationsthéoriques compliquées
relatives àcette con-
vergence, nous avons
préféré
exécuterquelques
calculsnumériques.
Lesprin- cipaux
résultats obtenus sontprésentés
dans le tableau ci-contre. Il à été cal- culé pour différentstypes
de lois F et différentes valeurs det,
la valeur exacte : f(à
l’aide de la formule1 ),
SOMME DE TERMES ALEATOIRES X EN NOMBRE ALEATOIRE DE POISSON
(A = 4)
et la valeur
approchée
obtenue en n’utilisant que lesdeux premiers
termes de la série de Gram-Charlier(ordre 3,
ordre4),
ainsi que la valeur obtenue en limi- tant cette série à son termeprincipal (loi
deGauss).
Le
paramètre
À a été choisiégal
à 4 :plus petit,
il aurait été vraimenttrop petit, plus grand,
il aurait rendutrop pénible l’application
de la formule( 1 ), laquelle
doitdéjà
être écrite avec 17 termes dans le cas retenu. Cette for- mule limitaitégalement
le choix de la fonction F.On
peut
constater sur le tableau quel’approximation
de Gram-Charlier limitée à ses deuxpremiers termes,
est engénéral
très suffisante pour les ap-plications concrètes,
et cela m ême dans les trèspetites probabilités (t = 3).
Parcontre, l’approximation gaussienne
s’avère engénéral
très mauvaise.Ainsi,
il serafréquemment possible
d’écrire :où
(1) La série de Gram-Charlier a été limitée à ses 2
premiers
termes; les valeurs entre pa- renthèses correspondent à un terme de plus.Cette
expression permet
de calculer facilementH(z) lorsqu’on
se donne zcar les fonctions
1T, y"
ety"’
sont tabulées.Le calcul inverse
qui
consiste à résoudrel’équation :
est un peu moins immédiat. On
peut
le faire parapproximations
successives.On
peut
aussi remarquer que :est une formule linéaire en u et v pour t et e fixés.
Il est donc très facile de tracer
l’abaque
donnant la valeur de t en fonction de u et v pour e donné. La résolutiongraphique
del’équation
considérée est alors immédiate. On pourra constater surl’abaque ci-joint
lagrande précision
de cetteméthode
graphique.
Afin d’illustrer ces
formules, présentons
pour terminer leproblème
con-cret
qui
fut àl’origine
de cette étude.L’objet de ce problème
était l’élaboration d’unerègle d’approvisionnement
pour les tubes de
casing. (Ce sont
des tubes destinés à la recherchepétrolière).
L’élaboration d’une telle
règle
nécessitait un examenpréalable
des lois de la consommation de ces tubes. Ilimporte
tout d’abord depréciser
que ceux-ci se dis-tinguent par leur
diamètre et parl’épaisseur
et laqualité
de l’acierqui
les com-pose. La donnée d’un
diamètre,
d’uneépaisseur
et d’unequalité
détermine ceque l’on
appelle
unespécification.
Les tubes de même diamètre sont assemblés en colonnescomprenant
engénéralplusieurs spécifications.
Ces colonnes consti- tuent l’unité élémentaire de consommation. Elles sont descendues en terre par desappareils
que l’onsépare
en troiscatégories : appareils lourds,
moyens etlégers, qui
pour nous serontrepérés
par les indicesA, B,
C.On ne s’intéressera désormais
qu’à
une seulespécification,
d’ailleursquelconque,
pourlaquelle
on définira les variables aléatoires suivantes :Z = consommation mensuelle;
ZA, ZB, Ze =
consommation mensuelle desappareils lourds,
moyens etlégers;
x lex B X = longueurs
de laspécification considérée,
entrant dans les co-lonnes descendues par les
appareils lourds,
moyens etlégers NA, NB, Ne =
nombres mensuels de colonnes descendues par lesappareils
lourds,
moyens etlégers.
Il est bien clair que l’on a :
ZA =
somme deNA
variables aléatoiresXA; ZB
= somme deNB
variables aléatoi-res
X B; Ze =
somme deNe
variables aléatoiresXc.
L’indépendance
des différentes variables X entrant dans chacune de ces sommes était très certainement bien réalisée.L’indépendance
entre les varia- bles X etN,
moinsévidente,
a pu être testée avec succès.Des raisons
théoriques permettaient
de supposer que les variables N sui- vaient des lois de Poisson dont leparamètre
étaitproportionnel
au nombred’ap- pareils lourds,
moyens etlégers (a, b, c)
existant en parc, durant le mois considéré. Soit :(7~A,
"B,7~~
étant descaractéristiques
dechaque type d’appareil).
Ces
hypothèses
ont pu être vérifiées.La formule
(5)
donnait donc uneexpression simple
des cumulants des va-riables
ZA, ZB, Zc.
Les cumulants de Z se déduisent de ces derniers par unesimple
addition(les
variablesZA, ZB, Zc
étantindépendantes).
D’où:formule donnant les cumulants de Z en fonction de l’état de parc a,
b,
c des pa- ramètres À et des moments m des variables X.Les moments m étaient en fait les seules
caractéristiques
des loisFa
1FB, Fe
des variablesXA, XB, Xe qu’il
était matériellementpossible
d’obtenir.En
effet,
ces variables étaient liées à une autre variablealéatoire; longueur
des colonnes
(dont
la loi deprobabilité
étaitconnue)
par un mécanismeproba-
biliste fort
compliqué.
Dans ces
conditions,
il était difficile d’obtenir unajustement analytique
de cette loi. Par
contre,
il étaitpossible
de simuler l’ensemble du mécanismesur ordinateurs et d’obtenir ainsi de très bons échantillons des variables X à
partir desquels
onpouvait
estimer les moments m.La formule
(8) jointe
aux formules(5)
et(6)
fournissait donc uneapproxi-
mationde la loi de
probabilité
de la consommation mensuelle dechaque spécifi- cation,
en fonction de l’état du parcqui
restaitparamétrique,
cequi
était in-dispensable.
La maniabilité del’expression
obtenue futgrandement
accrue par laquasi
insensibilité des coefficients u et v aux variations de parc. Ainsi la so- lution del’équation :
était-elle
indépendante
desparamètres
a,b,
c, cequi simplifiait
considérable- ment le calcul des stocks de sécurité.Une des difficultés du
problème
que nous avions à traiter résidait dans l’instabilité du processus de consommation. Il était doncindispensable
de fonderla loi de consommation
H(z)
sur desgrandeurs
que l’onpourrait
estimerrégu-
lièrement de manière à surveiller la validité de H. La formule obtenue
répond précisément
à cesexigences :
le calculpériodique
des À étant une chosefacile,
celui des moments m
pouvant
êtrerépété
sanstrop
de difficultéschaque
foisqu’une
modification dans ladécomposition
des colonnes estsignalée.
Aucunajus-
tement
analytique
direct des lois H n’aurait puprésenter
lasouplesse
de la mé-thode de
Monte-Carlo,
pour la détermination des moments m.L’examen