R EVUE DE STATISTIQUE APPLIQUÉE
G. M ORLAT
Les lois de probabilités de Halphen
Revue de statistique appliquée, tome 4, n
o3 (1956), p. 21-46
<http://www.numdam.org/item?id=RSA_1956__4_3_21_0>
© Société française de statistique, 1956, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
LES LOIS DE PROBABILITÉS DE HALPHEN
par
G. MORLAT Électricité
de FranceService des
Études
et RecherchesHydrauliques
En donnant la parole à M. MORLAT, M. le Président BA TICLE, s’adressant surtout (IlI.r mem6res de la Société de Statistique, rend un hommage ému à la
mémoire d’Etienne Halplten.
« Le déi)eloppenient nlènle de la conférence de M. MORLAT, dit M. BATICLE,
uou.s niontrer(t l’importance des fralJaux qu’il a faits dans le domaine qui nous
occupe. Mais je puis dire que la uie d’Etienne Halphen, trop courte, hélas, a été e,rempl«ire fi tous
points
de "lie: nupoint
de igue moral, uu point de iiiieci"ique
et n7 point de nue !n~/~’~zc/. ~
INTRODUCTION
Parmi les richesses que nous
devons,
enhydrologie statistique
àl’esprit exceptionnel
que fut EtienneHALPHEN, figure
un travail delongue
haleine, en-trepris
il y aquinze
ans : la recherche detypes
de lois deprobabilité,
àlaquelle
leur auteur
portait
une affection touteparticulière.
Il n’est pas douteux que les lois
auxquelles
HALPHEN s’est arrêtépourront
rendre lesplus grands
services dans bien d’autres domaines quel’hydrologie;
c’est surtout pour la
représentation
dephénomènes
naturels comme lespluies
etles débits que ces lois comblent une lacune. Mais, comme le constatait HALPHEN
on peut
légitimement
s’étonner que personne,après
KarlPEARSON,
n’ait cru bon d’étudier dans le mêmeesprit
de nouvelles formes de lois deprobabilité.
Mais il faut que ces lois soient connues, et bien que nous ne
puissions
direque leur étude est
aujourd’hui
bienachevée,
nous en savons assez pour en recom- manderl’emploi,
et surtout nousdisposons
despremières
tablesnumériques,
assez étendues pour les besoins les
plus
courants.L’exposé qui
va suivrecomprendra quatre parties,
consacrées successive- ment :- à un
rappel
succinctduproblème
del’ajustement
de lois deprobabilité
auxséries d’observations
hydrométriques,
et des formes des lois lesplus
couram -ment utilisées dans ce domaine.
- à un
exposé historique,
montrant comment etpourquoi
Etienne HALPHENfut amené à l’étude des lois des
types
A et B.- à une revue
rapide
dequelques
unes despropriétés mathématiques
et sta-tistiques
de ceslois,
-
enfin,
àquelques éléments,
encoresporadiques,
permettant la confronta- tion entre les lois de HALPHEN et les donnéesempiriques.
1. LE
PROBLÈME
DEL’AJUSTEMENT
DES LOIS DEPROBABILITÉ
DES
DÉBITS
1. 1. - Nous abordons dans cet
exposé
un très vieuxproblème. (le
sens desmots est
toujours
relatif etlorsqu’un
statisticienparle
d’un "vieuxproblème"
ilconvient de ne pas oublier que les méthodes de la
statistique mathématique
sontnées avec le
siècle).
Quoi
qu’il
en soit, unesprit
non avertipourrait
penser àpriori
que les lois deprobabilité qui
conviennent le mieux enhydrologie statistique
sont connuesdepuis longtemps.Or,
il n’en est rien. Pourl’hydrologue
lapauvreté
de l’arsenaldes lois
qu’il peut ajuster
aux sériesd’observations,
n’ad’égale
que lapauvreté
de ces séries d’observations elles-mêmes. On
pourrait
penser que ces deux pau- vretés sont harmonieusementaccouplées,
et que l’information contenue dans nosséries
statistiques
rendparfaitement
vain tout effort pour créer des lois de pro- babilitéplus perfectionnées. J’espère
montrer dans un instant que nos sériesstatistiques
méritentcependant
un peud’égards
etjustifient
les travauxd’Etienne HALPHEN.
Avant de me livrer à une revue
rapide
des formes de lois lesplus
utiliséesavant HALPHEN - c’est-à-dire sans doute
jusqu’à
cejour - je
crois utile de rap-peler
comment il fautcomprendre
leproblème
del’ajustement
d’une loide proba-
bilité.Un tel
ajustement prend
tout son intérêt et permet desprévisions
efficacess’il
s’applique
à un échantillon d’observationsqui
peuvent raisonnablement être considérées comme desépreuves
d’une certaine loi deprobabilité -
leplus
sou-vent
indépendantes
les unes des autres,quoique
ce dernierpoint
ne soit pas absolument essentiel en théorie - ou si l’onpréfère,
comme destirages
succes-sifs dans une urne de
composition
donnée. On est dans ces conditionslorsqu’on envisage,
parexemple,
la série des modules observé s au cours desannées pour
la
Dordogne
à BORT. On l’est encore si l’onenvisage
la série des débits obser- vés à cette même station le 15 mars dechaque
année. On ne l’estplus
sil’onprend
tous les débitsjournaliers
en vrac, soit pour uneannée,
soit pour une suite d’années.Pourtant
l’ajustement
d’une courbeanalytique
à l’ensemble desfréquences,
du débit pour tous les
jours
de l’année est uneopération
effectuée souvent, et avecraison par les
Ingénieurs ;
cetteopération
leurpermet
de calculer commodémentl’énergie productible
en année moyenne par une usinequi
serait établie au fil de l’eau, sur la rivièreétudiée,
avec un débit d’armement donné. Mais la courbe ainsiajustée
nepeut
pas êtreregardée
comme une loi deprobabilité.
Il n’est pas défendu de lui attribuer une forme
analytique
choisieparmi
lestypes qui
s’avèrentadéquats
comme lois deprobabilité. Ainsi,
la fonction :représente
convenablement bien des courbes de débits classés de nos rivières . Ainsiutilisée,
elle nepermet
pas de claculer correctement laprobabilité
que le-23-
débit de la
Dordogne
à BORTdépasse
100m3/ sec
le 15janvier
de l’année pro-chaine,
parexemple, puisqu’elle
estajustée
aumélange
dequantités qui
ne sontmanifestement pas tirées de la même urne.
Les errements habituels sont
légitimes,
si on s’abstient de tirer des conclu- sions en termes deprobabilité.
Le
problème auquel
nous nous intéressons ici estl’ajustement
de lois de pro- babilité à des séries d’observationsstatistiquement homogènes.
1.2.
L’emploi
de la loi normaleLa loi normale ou loi de LAPLACE GAUSS est bien
connue, j’en
dirai peu de choses.Je
rappellerai qu’on
ne doit enhydrologie,
ni larejeter,
ni la considérer àpriori
comme bonne. La confrontation avec lesfréquences
des observations endécide,
et il existe pour cela destechniques probabilistes précises (test d’ajuste-
ment de
PEARSON,
parexemple).
En
fait, l’expérience
montre quel’adéquation
de la loi normale pour les dé- bits est d’autant meilleurequ’on
étudie le débit moyenpris
sur une durée assezlongue (le
module parexemple)
d’autant meilleure que l’aire du bassin versant estimportante (à régime climatique donné)
d’autant meilleurequ’on
a affaire àdes bassins d’altitude
plus
élevée(régularisation nivo-glaciaire).
Pour
témoigner
de cetteadéquation, je signalerai l’emploi
à peuprès
exclu-sif de la loi normale dans les travaux de
prévision
desapports
d’été aux réser-voirs
alpins
etpyrénéens.
Le succès de cesprévisions,
dontparlera
M. FERRYest un test
tangible
de cetteadéquation.
Par contre, pour des débits de
périodes plus
courtes, de bassinsplus petits,
àrégime
exclusivementpluvial
parexemple, l’inadéquation
de la loi normale devientflagrante.
Il faut chercher d’autres formes de lois. Et il estpeut
être bon de redire ici, au passage, que l’embarras donttémoignent
encore certainsauteurs en de telles circonstances est tout à fait dénué de fondement ; nous voyons
encore dans des mémoires récents des raisonnements de ce genre : si la loi nor- male ne
représente
pas bien certaines sériesstatistiques,
c’est que celles-cine sont pas dues entièrement auhasard, puisque
la loi normale est la loi du hasard par excellence. Un tel raisonnement est tout à fait insensé. Le faitqu’une grandeur
ne soit pas
gaussienne
n’a rien à voir avec l’intervention de facteurssystémati-
ques. La loi normale n’est pas la loi du hasard par excellence.
Elle constitue seulement la forme limite de la distribution d’une somme d’un
grand
nombre dequantités
aléatoires vérifiant certaines conditionsprécises.
Maissi ces variables se
multiplient
au lieu des’ajouter,
la loi derépartition
du pro- duit tend vers une loigausso-logarithmique.
Cettepropriété
a étéexploitée
efficacement par M. GIBRAT
(loi
de l’effetproportionnel).
D’une
façon plus générale,
on peuttoujours
concevoir, pourreprésenter schématiquement
unphénomène
naturel destirages
dans une urne decomposition
arbitraire. Le hasard intervient de la mêmefaçon,
que cettecomposition
soit ounon voisine des
fréquences
fournies par la loi normale.Pour
ajuster
convenablement une loi deprobabilité
à des observations(X1 x2... ) qui
s’écartent manifestement d’unerépartition
normale, onpeut toujours
chercher une transformation des variables
qui
ramène à une distribution normale.C’est une méthode universelle, on peut seulement lui
reprocher trop
desouplesse
si l’on n’a pas fixé d’avance une classe de transformations à
appliquer
aux varia-bles x ;.
Une transformation utilisée
parfois
avec succès consiste à choisir y = x*".En
particulier
dansbeaucoup
d’étudespluviométriques,
les transformationsyx ou yx
donnent toute satisfaction.Une autre transformation y = a
log (x-xo)
+b,
mérite des commentairesplus
détaillés.1.3. La loi de GALTON-GIBRAT
La transformation
envisagée
en dernier lieu conduit à la même loi(à
un chan-gement
d’origine près) qui a
étésignalée
comme la limite d’unproduit
de variables aléatoiresindépendantes (dont
les distributions individuelles vérifientquelques
conditions
supplémentaires).
Cette loi a été
prônée
enparticulier
par M. GIBRATqui
a montré les servicesqu’elle pouvait
rendre enhydrologie,
enéconométrie,
etc... Si on a souventobjecté
que le processusmultiplicatif, qui
enfournirait unejustificationthéorique
trouve dans le domaine
hydrologique
uneinterprétation physique
un peu arbitraire il reste quel’adéquation empiriquement
constatée pourbeaucoup
de sérieshydro- métriques, justifie
assez sonemploi :
Si on
adopte
la transformationindiquée
ci-dessous :y = a log (x - xo) + b,
et si l’on suppose que y suit une loi normale
réduite,
ondispose
alors d’une fa-mille de lois à 3
paramètres.
Cela peutparaitre beaucoup.
Si pourtant Etienne HALPHEN a recherché d’autres formes de lois, c’est essentiellement pour 2 raisons : tout d’abord, larapidité
de la décroissance de la densité deprobabilité
de la loi de GALTON-GIBRAT, pour les très
grandes
valeurs de lavariable,
s’avèreparfois
en désaccord avec les constatationsempiriques,
et il peutparai-
tre souhaitable de
disposer
de familles de courbes ayant une décroissance tantôtexponentielle,
tantôtalgébrique.
De
plus,
des difficultés sérieusesapparaissent
pour l’estimation de l’un desparamètres,
à savoir xo. Il esttoujours
très difficiled’assigner
une borne infé-rieure non nulle au débit d’une
rivière,
etparmi
lesobjectifs
d’Etienne HALPHENfigurait
celui-ci : avoir un comportement, auvoisinage
del’origine,
des courbesde
densité, qui permette
d’attribuer uneprobabilité pratiquement négligeable (mais
pasrigoureusement nulle)
à un intervalle considéré comme hautement im-probable.
Si l’onadopte
àpriori
xo = o, cette condition est satisfaite pour des valeurs convenablement choisies desparamètres,
mais ces derniers ne sontplus qu’au
nombre de deux, et nous verronsplus
loin que c’est insuffisant.(Voir
gra-phique 1)
page suivante.Ces raisons,
parmi d’autres,
incitaient à la recherche de nouveauxtypes
de lois. Cela nesignifie
nullement que nousméconnaissions
les services que peut rendre la loi de GALTON-GIBRAT enhydrologie,
etnous
l’utilisonsfréquemment
en raison de son extrême
commodité,
surlaquelle
nous ne nous étendronspoint.
1.4. Les lois de PEARSON
Avant de renoncer à trouver son affaire dans les formules courantes,
l’hy-
drologue
devait encore examiner les lois de PEARSON. Si l’on retient la difficulté voirel’impossibilité, d’as signer
à un débit une borne inférieure non nulle, et de même une bornesupérieure
finie, on est conduit àenvisager parmi
les lois de PEARSON lestypes
3 et 5 dont les densités sontrespectivement :
Ces lois sont aussi
d’emploi
commode(Tables
de la fonction Gamma incom-plète)
et elles ont étélargement
utilisées enhydrologie, spécialement
letype
3,auquel,
parexemple, l’ouvrage
américain de E.E. FOSTER "Rainfall and Runoff"réserve
un sortprivilégié.
Nous verrons que les lois de HALPHEN en constituent une extension assez
naturelle.
Fig. 1.- Courbes de densité de quelques lois de Fig. 2.- Courbes de densité de quelques lois du GALTON, de moyenne égale à l’unité, type 3 de PEARSON de moyenne égale à l’unité.
On notera que le coefficient de variation dé- termine complètement la forme de la distribution.
1.5. L’insuffisance des lois citées
plus
hautParmi les lois de
probabilité
utilisées enhydrologie,
nous nous sommesbornés à citer les
plus précieuses
et lesplus
couramment utilisées pourl’ajus-
tement à des séries d’observations non sélectionnées. Le cas d’observations sélectionnées
(débits
decrue)
a donné l’occasion auxhydrologues
de mettre enavant un
grand
nombre de théories et de formules.Si l’on se demande
pourquoi
Etienne HALPHEN avaitjugé
nécessaire de chercher autrechose,
onpeut répondre simplement
que sonexpérience
person- nelle l’avait convaincuqu’aucune
des formes de lois que nous avonsindiquées
n’était
globalement adéquate
à l’ensemble des séries d’observationshydromé- triques
concernant les cours d’eaufrançais (et
pour toutepériode, jour,
mois ,année,
etc...susceptible
de fairel’objet
d’une étudeprobabiliste).
Bien
sûr,
onpeut
dire que même si l’un de cestypes
de loispouvait
être re-gardé
commeconvenable,
il faudrait admettre que les écartsd’échantillonnage
créeraient de
temps
à autre une apparenteinadéquation.
Sansdoute,
EtienneHALPHENavait-il jugé
que de tellesinadéquations
sonttrop fréquentes pour qu’on
puisse
ainsi les attribuer à des écarts accidentels.Un
teststatistique précisant
ce
jugement
ne serait pas facile à mettre en oeuvre en raison des liaisons statis-tiques,
au demeurant fortcomplexes,
entre les débits observés sur nos diverses rivières.Mais on
peut justifier
autrement cette insatisfaction. Toutes les lois quenous avons vues sont des lois à 2
paramètres,
du moins sous la forme où ellessont utilisées en
hydrologie.
Deux
paramètres,
cela fait unparamètre d’échelle,
unparamètre
de dis-persion,
et il ne resteplus
rien pour caractériser la forme de ladistribution,
àdispersion
relative constante. Si l’onpréfère,
pour chacun de cestypes
de loisla valeur moyenne et la
dispersion imposent
toute la forme de la courbe. Or, onpeut
penser àpriori
que des débits - mensuels parexemple -
peuvent avoir sur deux cours d’eau même moyennes, mêmedispersion -
et parexemple
accuserdesdegrés
différents dedissymétrie,
s’ils’agit
de cours d’eau àrégime
climati-ques ou saisonniers différents.
(Voir graphique 4).
Fig. 3..- Courbes de densité de quelques lois du Fig. 4.- Lois de GALTON et des types 3 et 5 de type 5 de PEARSON, de moyenne égale à l’unité. PEARSON, de coefficient de variation égal à 0,5.
Nous verrons
plus
loinqu’on
peut effectivement mettre cephénomène
enévidence.
Il est
permis
de voir là la raisonprofonde qui
poussa Etienne HALPHEN àimaginer,
à son corps défendantpourrait-on
dire, un ensemble de lois deproba-
bilité à 3paramètres ;
à son corps défendant parcequ’il
étaitparfaitement
conscient de la
pauvreté
de nos observationshydrométriques,
etqu’il pensait
souhaitable de se borner à estimer deux
paramètres.
2. LES LOIS DE
PROBABILITÉ
DE HALPHEN . NOTEHISTORIQUE
2.1.- Avec les lois de
probabilité qu’il
aintroduites,
HALPHEN propose austatisticien un outil dont la richesse
égale
celle des lois de PEARSON.On sait que ce dernier avait été conduit à ses lois de
probabilité
en cherchantles solutions d’une
équation
différentielle :qu’il assignait
à la densité deprobabilité.
HALPHEN avait choisi ses
types
de lois deprobabilité
en fonction de consi- dérationsplus empiriques,
et l’onpeut
admirerqu’il
ait ainsi fixé une théorieaussi harmonieuse et aussi
riche,
dupoint
de vuemathématique.
Pour tenter de faire
partager à
nos auditeurs un peu de la"joie
de compren- dre" comment parétapes
HALPHENprocéda
à cette construction, nous en don-nerons un bref
exposé historique.
2.2. La loi
harmonique (1941)
Au
départ,
HALPHEN recherchait une loi deprobabilité
àdeux paramètres
destinée àla
représentation
des débits mensuels de nos stationshydrométriques ;
il s’était
assigné
comme conditionsprimordiales,
d’obtenir une décroissanceexponentielle
pour lesgrands
débits(condition inspirée
parl’expérience)
et aussipour les
petits débits,
afin d’éviter le choix d’uneorigine
nonnulle,
dont nousavons
signalé
les difficultés. Parailleurs,
il avaitjugé
commode dedisposer
dela
symétrie logarithmique
pour la densité deprobabilité (Entendez
par là la pro-priété
suivantlaquelle
avec une unitéconvenable,
la densité deprobabilité
est lamême pour x et pour x
1
.La forme de la densité
de probabilité
laplus simple répondant
à ces diversesconditions s’écrit :
et c’est cette loi que HALPHEN avait
appelé
"loiharmonique".
La constante
Ko (a)
est une fonction bien connue, la fonction de BESSEL- BASSET d’ordre zéro.Si l’on fait
l’hypothèse qu’une
série d’observationsprovient
d’une telle loi, la meilleurefaçon
d’estimer lesparamètres
consiste dansl’utilisation
des mo-ments
d’ordres
1 et -1, c’est-à-dire des moyennesarithmétique
etharmonique
des
observations,
soient m eth,
onpeut
alors caractériser une loi donnéeparles paramètres :
on montre sans
peine que ~
est la médiane de ladistribution ; >,
est unparamètre
de
dispersion
relative, fonction croissante du coefficient de variation cv=-~L.
m
Enfait, l’emploi
de la loiharmonique
est surtout rendu extrêmement commo-de par
l’emploi
del’abaque,
construit par HALPHEN,qui
condense sous un volu-me extrêmement
réduit,
et avec uneprécision
très suffisante pour laplupart
desapplications,
la tabulation de toutes les loisharmoniques. (Voir graphique 5).
Cette loi a rendu des services
appréciables,
enparticulier
pour l’évaluation desprobabilités
attachées aux valeurs mensuelles des indicesd’hydraulicité
destrois
grandes régions hydroélectriques (modèle hydraulique) : Alpes, Pyrénées.
Fig. 5.- Mode d’emploi de l’abaque de la loi harmonique. Toute droite passant par le centre du
graphique définit une loi particulière du type harmonique, qui peut être repérée par la valeur de l’un des paramètres a, X , c.v. ou c.s. figurant sur les 4 échelles encadrant l’abaque.
Massif Central. Elle a été
utilisée,
par Etienne HALPHEN et sescollaborateurs,
dans un assez
grand
nombre de travauxparticuliers d’hydrologie statistique.
Il
ne semble pas
que sonemploi
se soitbeaucoup
étendu en dehors de ce cer-cle restreint, sans doute en raison des circonstances
qui règnaient
àl’époque
destravaux d’HALPHEN sur ce
sujet (1940-1944)
etqui
favorisaient assez peu les efforts de diffusionEnsuite,
un usage étendu de cette loi avait révélé la nécessité degénéralisa-
tion dont nous allons
parler.
2.3. Les lois
harmoniques généralisées
ou lois dutype
A(1946)
Parce que la loi
harmonique
ne contient que deuxparamètres,
sadispersion
relative
impose
entièrement la forme de la courbe dedensité,
comme nous l’avons vupour les lois antérieurement utilisées(GALTON-GIBRAT
et PEARSON notam-ment).
Pour
obtenir uneplus grande s9tmleJ;~e~
HALPHEN~éneralisa~donc
cette loide la
façon
laplus simple qui
sepuisse concevoir,
en introduisant les fonctions de densité définies par :Les constantes
d’intégration
sont encore des fonctions de BESSEL(d’ordre Y
cette
fois)
et sont donc abondamment tabulées. Lesquantités permettant
en théo-rie le meilleur
ajustement
desparamètres
sont les moyennesarithmétique, géométrique
etharmonique.
La décroissance de ladensité,
tant àl’origine qu’à
l’infini, est encore
exponentielle.
On constate que des formes limites, pour des valeurs
particulières
des pa-ramètres,
sont les lois des types 3 et 5 dePEARSON,
entrelesquelles
le type A de HALPHEN donne une entretoise fort bienvenue.(Dans
les lois dePEARSON,
le
type
VI aucomportement asymptotique algébrique,
ne fournit pas de solution concernant des variablesprenant
toute valeurpositive).
Ne
pouvant aborder,
àl’époque,
la tabulation de ces fonctions derépartition
faute de moyens de calculs
(c’est
à cetteépoque
quej’ai
commencé à travailleravec Etienne
HALPHEN)
nous avons pucependant
étudierl’adéquation
des lois dutype
A à d’assez nombreuses séries de débits mensuels de nos stationshydromé- triques (nous parlerons plus
loin des méthodesutilisées).
Une constatation s’est
imposée
assez vite : les lois du type A se montraientadéquates
dansbeaucoup
de cas, mais un nombre nonnégligeable
de sériesd’observations nécessitaient des formes
nouvelles, qui "prolongeraient"
les loisA en
représentant
enparticulier,
auvoisinage
del’origine,
descomportements asymptotiques
différents.2.4. Les lois du
type
B(1948)
C’est ainsi
qu’HALPHEN
introduisit des lois deprobabilité
nouvelles, dont la forme définitive fut fixéeaprès
un certain nombre de tâtonnements et d’ essaisplus
ou moins fructueux. Il fut uneépoque
où le nombre detypes analytiques
ima-ginés
et étudiés successivement par HALPHEN entamait sérieusement notrealphabet.
C’est donc par des essais très
empiriques qu’HALPHEN
arrêta finalementson choix sur les lois
qui s’appellent
maintenant lois dutype
B et dont nous mon-trerons
plus
loinqu’elles complètent parfaitement
letype
A pour former avec luiune construction d’une très
grande
harmonie.Leur forme
analytique
est celle-ci :La variété des formes de ces lois est très
grande, puisqu’on
trouveparmi
elles, selon les valeurs attribuées auxparamètres
oc etb,
des lois unimodalesdont le
comportement
àl’origine prend
une formealgébrique quelconque,
des loisen J et même des lois dites "en
S",
cequi
constituepeut-être
une forme un peu nouvelle enstatistique
mais ne semble pas, àposteriori, superflu
pour larepré-
sentationde certaines séries
hydrologiques
oumétéorologiques. (Voir graphique 6)
Fig. 6. - Quelques lois de HALPHEN de coefficient de variation
égal
à Os 5 aPour un coefficient de variation fixé, les lois de HALPHEN présentent une grande diversité de
formes.
On a tracé ici les fonctions de distribution correspondant à diverses valeurs du paramètre
Ào= 20132013~-(voir
plusloin).
Les courbes 1, 2 et 3 sont des lois du type B, de ~o
égaux
à 0, 5, 0, 3 et 0, 26. La courbe 4 est une- loi harmonique, de
Ào égal à
0,215. Enfin, las courbe 5 est une loi
B I,
de Xo égal à 0,13.Les
intégrales complètes
sur la demi-droitepositive
de la forme :ont paru assez
longtemps
constituer des fonctions nouvelles. C’est assez tardi- vement - vers 1952 - que nous sûmes avoir affaire à des fonctions connues sousle nom de fonctions de HERMITE. Il faut se
réjouir
de cetteignorance.
Lesfonctions de HERMITE ne semblent pas avoir été
l’objet
d’autant detravaux,
tant
théoriques
quenumériques,
que les fonctions de BESSEL. EtHALPHEN, qui
les
ignorait,
eut ainsi l’occasion de pousser leur étude assez loin ; montrant sousun
jour
très nouveauquelques chapitres importants
del’analyse mathématique
classique.
Il a nommé fonctions factorielles les
intégrales
de la forme ci-dessus etmontré comment elles peuvent définir une classe
comprenant
ungrand
nombredes fonctions les
plus
connues del’analyse ;
il a mis ainsi dans une foule de pro-priétés
connues un ordre absolumentoriginal.
Il a même
découvert,
par cette voie,quelques
relations nouvelles etfrap- pantes -
comme la fameuse identité :dont j’ai déjà
ditquelques
mots ici même.La
plupart
de ces résultats se trouvent dans un mémoire récemmentpublié (1).
Les fonctions factorielles les
plus
nécessairesayant
été tabuléesgrâce
à lacollaboration du Laboratoire de Calcul de l’Institut Henri
Poincaré,
il futpossible d’entreprendre
entre 1952 et 1955, la tabulation des lois deprobabilité
A et B dePHEN.
2.5. La tabulation des loi de
probabilité
A et B(1952-1955)
Enfait,
cette tabulationreprésente
un très gros travail de calculnumérique, puisqu’il s’agit
decalculer,
pour une gamme étendue de valeurs desparamètres
et les limites
supérieures d’intégration,
desintégrales
définies dutype :
pour les fonctions de
répartition
dutype
A, etpour les fonctions de
répartition
dutype
B.Il fallait pour
entreprendre
ces calculs des moyens assezpuissants
et ce n’est que dans les toutes récentes années que nouspouvions
songer à les entre-prendre
en France.Ces calculs ont été effectués par le Service de Calcul
Scientifique
d’I.B.M.FRANCE à l’aide de machines
électroniques
modernes et nous remercierons, au passage, lesIngénieurs
de ce service pour leur collaboration à ces travaux.Nous donnerons un peu
plus
loinquelques exemples
des tablesnumériques
etdes
abaques qui
ont été construits pourl’emploi pratique
de ces fonctions de pro-babilité,
etqui
serontintégralement publiés
dans unproche
avenir.(Voir
tableau7)
2.6. Les lois du
type 8-1 (1956)
Nous montrerons
plus
loin comment les lois A et B de HALPHENpouvaient
satisfaire à presque tous nos besoins. Il subsistait
cependant
une lacune,qui
vient d’être entièrement comblée par l’introduction d’un
prolongement
nouveauque nous nommons les lois
B-1 (ou
Binverse).
C’est mon Collaborateur etami,
M. LARCHERqui
a eu l’idée trèssimple
de considérer les lois définies par la densité : -.(1) "Les fonctions factorielles" par Etienne HALPHEN - Publications de l’Institut de Statistique de l’Université de Paris ; Vol. IV : fasc. 1.1955.
Nous verrons dans un instant comment ces nouvelles lois
complètent
harmo- nieusement les lois A et B et achèvent la constructionmagistrale entreprise
par HALPHENdepuis quinze
ans.3.
QUELQUES PROPRETÉS
DES LOIS DE HALPHEN3.1.-
L’exposé historique qui précède
a montré comment nous sommes main- tenant enpossession
des 3types
de lois dont nousrappelons
les formesanalyti-
ques.
(fonction
de densité deprobabilité,
J définissant des variables aléatoires pouvantprendre
toute valeurpositive)
enindiquant
les limitationsimposées
auxdivers
paramètres :
Lois du
type
A.pour
u> o,
a > o, Yquelconque.
Lois du
type
B.pour V>o, b
quelconque,
00 oLois du
type B-1
pour v~:>o, b
quelconque,
0Rappelons
que les fonctionsKy (a)
sont les fonctions de BESSEL-BASSET et les fonctionsef oc (b)
sont les fonctions factorielles de HALPHEN(ou
fonctions deHERMITE).
On remarquera que le fait
qu’une
variable aléatoire U suive une loiB-1
estéquivalent
au fait que son inverse V=T7
suive une loiB,
cequi explique
la déno-mination
B-1.
Quant au
type A,
1 la transformation Vif
le conserve enchangeant simple-
ment le
signe
duparamètre
’Y3.2. Les moments des lois de HALPHEN
La considération du
comportement asymptotique
des densités deprobabilité permet
de constater que les lois dutype
A ont des moments de tousordres, néga-
tifs ou
positifs.
Le moment d’ordrek,
pour k entier non nul,s’exprime
par :i - _
Le moment d’ordre zéro dont nous verrons
plus
loinl’importance
est obtenuen dérivant
logarithmiquement
la fonction de BESSEL par rapport à l’indice Y.Rappelons
que pour une loi de densité f(x) quelconque,
la moyennegéométri-
que est définie par :
On trouve ici
pour les
lois dutype
A :Ce sont des fonctions
qu’il
a fallu tabuler pour l’étude des lois de HALPHEN.Si on passe aux lois du type B, on constate que ces lois
possèdent
un momentd’ordre k à condition que
k> -
2ot. Ellespossèdent toujours
enparticulier
tousleurs moments d’ordres
positifs
donnés par :et la moyenne
géométrique
est donnée par :A
l’inverse,
les lois dutype B-1 possèdent
un moment d’ordre k à condition que k 2ce. La .considération de la variable inverse en donne immédiatement la formule .3.3. L’estimation des
paramètres
des lois A et BLes
paramètres adoptés
dans les formules donnéesplus
haut sont lesplus
commodes pour le calcul des constantes et des moments.Pour l’estimation des
paramètres,
unchangement
de notation facilepermet
d’écrire :- -
pour la densité des lois du type A.
pour la densité des lois du type B,
enf in pour la densité des lois
du type B-1.
Sous cette forme, il
apparait
clairementqu’un
résumé exhaustif des obser- vations, pour l’estimation des 3paramètres,
est fourni pourchaque type
par un ensemble de trois moyennesqui
sontrespectivement
pour letype
A:pour le
type
B:pour le
type B- 1 :
On peut
représenter
ces résultats trèssynoptiquement
par le tableau ci- dessous :3.4.
Représentation graphique
des diverstypes
de lois de HALPHENEn éliminant un
paramètre d’échelle,
choisi defaçon quelconque,
onpeut représenter
les diverses lois de HALPHEN par lespoints
d’unplan,
dont les co- ordonnées sont des fonctions choisies de 3 moments. Ils’agit
d’uneopération analogue
à lareprésentation classique
des lois de PEARSON par lesquantités f31 et (coefficients
dedissymétrie
etd’aplatissement
selonl’interprétation pe a r s onr_i énne ~ .
Un assez
grand
nombre de variantes ont été étudiées pour une tellerepré-
sentation. Nous en retiendrons ici seulement deux, intéressantes à des titres différents.
Une
première représentation
consiste à choisir comme coordonnées lesquantités :
qui
sont nécessairementpositives.
Cettereprésentation,
définie par des para- mètres choisissymétriquement
dans l’ensemble descinq
moyennes citéesplus
haut, metparfaitement
en évidence lasymétrie
entre les lois A suivant lesigne
de l’indice Y d’une
part
et d’autrepart
entre les lois B etB-1. (Voir graphique 8)
Avec ces
coordonnées,
toutes les lois A sontreprésentées
dans uneportion
du
premier quadrant.
Par contre, seules sontreprésentées
les lois B,qui
ont une1
moyenne
harmonique
finie, c’est-à-dire pourlesquelles oc) 1.
La même condi- 2tionvautpour
assurer l’existence de la moyennearithmétique
des loisB-1. (Voir
graphique 8).
Une seconde
représentation présente
un certain nombred’avantages ;
elleest obtenue ave~ les
paramètres :
On a ainsi des
quantités d’usage
assez familier. Par ailleurs avec ces coor-données les
inégalités classiques
sur les moments des divers ordresimposent :
Tableau 7
EXEMPLE DE TABLES
NUMÉRIQUES
DES LOIS A et BNous
disposons
de tablesdétaillées,
de cetype,
pour une soixantaine de lois de chacun destypes
A et B.Par suite des moyens de calculs mis en oeuvre, la
précision
sur la valeurde z
correspondant
auneprobabilité donnée,
dans la zônemédiane,
est de l’ordrede :
1
%
pour les lois du type Aet 1 %o pour les lois du
type
BLOI DU TYPE A LOI DU TYPE B
Fig. 9 Lois Halphen
ce
qui
entraine que toute loi deprobabilité
estreprésentable
à distancefinie, exception
faite des directions des axes de coordonnées eux-mêmes.Enfin, les coordonnées
qui précèdent permettent
dereprésenter
toutes leslois A et B, ainsi que les lois
B-1
pourlesquelles
0~>" 1.(Voir graphique 9)
Notons que si la variable X suit une loi
B-1 ,
la variable Y= X
suit une loi B.Toutes les lois
B-t
peuvent d’ailleurs être obtenues ainsi.Quant
aux loisB -1 qui
sont directement
représentées
surl’abaque
enÀo,
cv, ellescorrespondent,
danscette transformation, aux lois B situées à l’intérieur du domaine limité par la courbe oc = 1 et par la courbe
représentative
des lois P 3.Par ailleurs, si l’on veut
ajuster
d’unefaçon
uniforme les diverstypes
delois de HALPHEN, les
quantités Xo
et cv constituent :- pour les lois B, le meilleur
ajustement théorique.
- pour les lois
A,
unprocédé d’ajustement qui
est certainement d’une effi- cacitéhonorable,
à raison de l’existence de tous les moments(la
médiocrité d’un moded’ajustement
par les moments étant liée engénéral
à ladivergence
de cer-tains moments
théoriques).
-
enfin,
les loisB-
1 seprêtent
à unajustement
parÀo
et cv sur l’inverse de la variable(et
sans doute serait-ilavantageuxd’utiliser
le mêmeprocédé
pour les lois A d’indicenégatif).
Enbref,
lesquantités Ào et
cvjouent
pour les lois de HALPHEN un rôle assezsemblable à celui
des (31
etP2
pour les lois de PEARSON.3.5. Notion de classe
complète
de lois deprobabilité
Si l’on convient dans un certain domaine d’études
statistiques, d’ajuster
surtoute série d’observations une loi de
probabilité
à kparamètres,
à l’aide de kmoments
déterminés,
J il est hautement souhaitable dedisposer
d’une classe delois de
probabilité
tellequ’à
tout ensemble de valeurspossibles
pour les k mo- ments choisiscorresponde toujours
un et un seulsystème
de valeursde paramètres
de la loi de
probabilité
assurant aux momentsthéoriques
des valeurségales
auxmoments
empiriques.
Nous dirons alors que nousdisposons
d’une classecomplète
de lois de
probabilité
à kparamètres.
Si l’on recherche des lois à deux
paramètres,
il semble bien que toutes les formes de loisd’usage
courant constituent des classescomplètes
pour les momentshabituellement utilisés
(moyenne
et écartquadratique
moyen parexemple).
Pour des familles de lois à trois
paramètres,
il semblebeaucoup plus
diffi-cile d’obtenir des classes
complètes ; cependant,
les lois de PEARSON constituentune classe
complète
pour lesparamètres (3i et P2.
De
même,
les lois de HALPHEN forment une classecomplète depuis
que M.LARCHER a eu l’idée
d’y
fairefigurer
les loisB-1
et c’est unepropriété
dontl’intérêt n’a
guère
besoin d’êtresouligné.
4. CONFRONTATION AVEC LES OBSERVATIONS
HYDROMÉTRIQUES.
4.1. Débits moyens mensuels
Les séries de débits moyens mensuels - ou relatifs à des
périodes
dequelques
mois - constituent le
premier
domained’application
étudié des lois deprobabilité
de HALPHEN. L’examen
systématique
desajustements
sur les débits des 12 moisde
l’année,
pour laplupart
des stations de l’AnnuaireHydrologique
dela France,
avait été effectué à l’occasion de la