R EVUE DE STATISTIQUE APPLIQUÉE
P. G UILLOT
Une extension des lois A de Halphen comprenant comme cas limite la loi de Galton-Gibrat
Revue de statistique appliquée, tome 12, n
o1 (1964), p. 63-73
< http://www.numdam.org/item?id=RSA_1964__12_1_63_0 >
© Société française de statistique, 1964, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » ( http://www.
sfds.asso.fr/publicat/rsa.htm ) implique l’accord avec les conditions générales d’uti- lisation ( http://www.numdam.org/conditions ). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
Numérisation de documents anciens mathématiques
UNE EXTENSION DES LOIS A DE HALPHEN COMPRENANT COMME CAS LIMITE LA LOI DE GALTON-GIBRAT
P. GUILLOT
Chef du Service Hydrométéorologique E.D.F., Grenoble
La transformation
logarithmique s’impose quand
on examine les dis-tributions des débits
journaliers
des coursd’eau ;
eneffet,
alors que la distribution des valeurs naturelles de cesdébits,
même pour des cours d’eauimportants,
esttoujours
trèsdissymétrique (forte
densité en des-sous de la
médiane,
faible densité etgrande dispersion au-dessus),
cellede leurs
logarithmes
est habituellementbeaucoup plus proche
de la sy-métrie.
Admettre que les
logarithmes
suivent une loi normale est alors unehypothèse commode,
d’autantplus
tentante queM.
GIBRAT en aproposé
une
justification théorique
par la"loi
de l’effetproportionnel",
selon la-quelle
les effets des évènements aléatoires sur le débit seraient propor- tionnels au débitlui-même.
Ceci n’est évidemmentqu’un
schéma - disonssimplement qu’il
est exact que leseffets
croissent avec le débit - mais il faut reconnaître que, pourbeaucoup d’applications simples,
la trans-formation
logarithmique
suffit etqu’il
est commode d’examiner les dis- tributions des débitsjournaliers
sur un fondgradué gausso-logarithmi-
que, sans croire pour autant à la validité
complète
de la loilog-normale.
En
effet,
si on examine deplus près
les distributionsexpérimen- tales,
ons’aperçoit :
1/
que lasymétrie
deslogarithmes
n’est pastoujours admissible.
Or,
il n’existe aucunmoyen
satisfaisant de rendre la loilog-normale
dis-symétrique ;
ledéplacement
del’origine
enprenant
nonplus log
q maislog (q - qo) est inacceptable,
car d’unepart
iln’y
a aucune raison d’ad- mettre que le débit d’un cours d’eaupossède
une limite inférieure autre que0,
d’autrepart, l’ajustement opéré
par cetexpédient
n’est réellementpas satisfaisant : il le
serait,
à larigueur,
pour une variable aléatoireavec faible coefficient de variation
qui
neprendrait jamais
de valeursvoisines de
qu
ou de0,
mais ce n’est pas le cas des débitsjournaliers
ni même des débits mensuels sur bien des cours
d’eau.
2/
Même dans les cas où lasymétrie
deslogarithmes
est admis-sible,
ilapparaît,
àl’expérience
de nombreux cours d’eau(zone
méditer-ranéenne
exclue)
que la densité de la loilog-normale
ne décroît pas as-sez
vite,
aussi bien dans les valeurs fortes que dans les valeurs fai-bles.
Ceci
rejoint
le fait que la loi de l’effetproportionnel,
même seu-lement la loi de l’effet
croissant, première approximation
admissible dans les valeurscourantes,
a des limitations évidentes dans les valeurs ex-trêmes :
sinon,
un cours d’eau tari ne devraitplus jamais couler,
aussi fortqu’il pleuve ; sinon, une
averse tombant enpériode
de hautes eaux pour- raitengendrer
un volume d’écoulementplus important
que le volumepré- cipité.
Telles sont donc
quelques
unes des raisonsqui
ont conduit leshy- drologues
àchercher "autre chose".
M.
HALPHENprésentait
en 1941 une loisymétrique
enlogarithme qu’il appelait "loi harmonique" :
Pour rendre la
symétrie logarithmique plus
évidente etl’expression plus maniable,
nous posonsKo (u)
est une fonction de BESSEL modifiée d’ordre0,
définie par :On trouve dans les divers
ouvrages
sur lesfonctions de BESSEL,
notam-ment celui de
M. PETIAU,
la tablenumérique
deK~ (u)
et sesdévelop- pements
limités :Il
paramètre
d’échelle est la médiane de ladistribution ;
a est le
paramètre
de formequi
détermine ladispersion :
nous donnonssur le
graphique
1ci-joint
la valeur duparamètre
a en fonction du rap-port
desdéciles.
L’extension de la loi
harmonique :
est
appelée
famille des lois A deHALPHEN. Ces
lois ont été étudiées et tabulées à ELECTRICITE DEFRANCE
parM.
HALPHEN et ses collabo- rateurs. Lesigne de y
donne le sens de ladissymétrie logarithmique.
Ici 4
n’est pas lamédiane,
lerapport
de la médianeà p.
variant aveca et
y.
Là encore,
l’expression
estplus
maniable si on effectue la trans- formationlogarithmique.
Paramètre
oc do laloi harmonique
Fig. 1
Ky ( 2 a )
est la fonction deBESSEL-HANKEL
d’ ordreY :
:en
fonction
durapport
desdéciles 2013L
q1
Fig. 2
Nous avons ébauché le
graphique, figure
2ci-joint, qui permet
le choix desparamètres
de formea, y
àpartir
des fonctions des décilesq , q q .
Lerapport
de la médianeq à
u. se trouve dans lestables.
q~ q5
5
ql q2
5Le
graphique
n’est pascomplet :
pourrépondre
aux besoins de l’u-tilisateur,
il devraitcomporter,
dans 4 ou 5régions,
dessurcharges
fi-gurant
les limites de confiance de la distributiond’échantillonnage
desfonctions
quantiliques -S&-,-Sb2013~2-:
: Ces distributionspourraient
être éta-q
q5
tablies
empiriquement
àpartir
d’échantillons de 25 nombres auhasard.
Ce
graphique
a été construit àpartir
des seules tables encore dis-ponibles
des lois deHALPHEN,
tables sommaires calculées il y a une dizaine d’années par le Service des Etudes et Recherches : les intersec- tions des courbes a = Cte ety =
Ctequi figurent
sur cegraphique
cor-respondent
aux loistabulées.
A
partir
delà,
onpeut songer
à une autre extension de la loi A deHALPHEN :
ce
qui
revientsimplement
à élever x à lapuissance 1 v.
Cette extensionv
comprend
enparticulier
la loilog-normale qu’on
obtientpour 1 -
v0 .
Pour montrer que la forme limite est bien la loi
log-normale,
ilsuffit
d’observer
quelorsque
vcroît, Ch z peut-être
confondu avecz2
v1 +
2 2
sur un intervalle centré deplus
enplus grand. Naturellement,
pour que lalargeur
de la distribution restefinie,
on est conduit à faire croître simultanément a ;plus précisément,
lecoefficient a 2
vdu terme
en2 i v
Z2
tendant vers une limite2(j2 1~ 2 v oc
tend vers 0’. On vérifie dans cesconditions,
enremplaçant
l’infinimentpetit Ko (2 ex)
par sapartie prin- cipale,
quel’expression
inverse de la densité au centre 2 B)Ko (2 oc ) e2 a
tend bien vers a
V21t.
Ce
qu’il
estplus
intéressant de remarquer, d’unpoint
de vueprati-
que, est
qu’il
n’est pas nécessaire deprendre
un v trèsgrand
pour que ila loi
A~"
soitpratiquement
confondue avec la loilog-normale,
dans lesvaleurs
centrales,
disons dans l’intervalle centré 5 à 95%.
La
figure
3permet
de comparer les densités deprobabilité
obtenueen faisant varier v tout en maintenant le
rapport
des décilesq, égal qi
à25
(cette amplitude
de variation est couramment observée en matière de débitsjournaliers) :
on voit que la loiAi ( v - 2)
est trèsproche
de laloi
log-normale Ao 0
tandis queA 1 0
etA2 0 sont
sensiblementplus plates.
Laposition
relative des courbes de densitéA. il
reste la mêmequand
on faitComparaison
deslois ayant
lel’’’Cppor’t
Fig. 3
varier la
largeur
de ladistribution -3L;
dans les valeurscentrales,
lesA~ ~
sonttoujours plus plates
quela log-normale A~
de même"largeur" ,
la
platitude
s’accentuant avec~.
Ainsi
les 3paramètres
deforme
ont chacun un rôleprincipal :
aagit principalement
sur ladispersion, y
sur ladissymétrie logarithmi-
que,
-t
surl’aplatissement.
Un
paramètre
de tailleIl,
et 3paramètres
de formea, ~ et v ,
soit en tout 4
paramètres,
c’est évidemmenttrop
pour deséchantillons
hydrologiques
dequelques
dizaines d’observations : unparamètre
de tailleet 2
paramètres
deforme
constituent bien le maximumqu’on puisse
rai-sonnablement
envisager,
et encore ....S’il faut donc nous
résigner
à fixer v, rien ne nousoblige
à leprendre égal
à1 ;
le schéma ci-dessousrésume
lesconséquences
duchoix de v sur la densité des valeurs
éloignées
de la zone centrale :Fig. 4
Nous avons
déjà signalé
ailleurs que, en matière de débitsjour- naliers,
les valeurs extrêmes observées sur de nombreux cours d’eau(zone
méditerranéenneexclue)
se situentgénéralement
au-dessus de la droite deGUMBEL (v = 1),
mais en-dessous del’hypothèse log-normale (que M. GIBRAT qualifie
deprudente).
C’est
pourquoi
nous sommes tentésd’opter
pour v = 2qui
nousdonne :
- dans les valeurs
courantes,
une formepratiquement identique
à la
log-normale quand
il y asymétrie logarithmique,
- la
possibilité
d’introduire unedissymétrie logarithmique,
- un
comportement
raisonnable dans les valeursextrêmes.
Il nous reste à souhaiter que la nouvelle tabulation des lois de
HALPHEN,
dont l’exécution par une calculatriceélectronique
est à l’é-tude,
aboutisse à un outilcomplet
et commode pourl’utilisateur.
REFERENCES BIBLIOGRAPHIQUES
R.
GIBRAT -Aménagement hydroélectrique
des coursd’eau : statistique mathématique
etprobabilités -
Revue Générale del’Hydraulique - Septembre
Octobre 1936R.
GIBRAT - Débit maximum de crue et calcul desprobabilités - C.
rendus du
quatrième Congrès
des GrandsBarrages -
NEW DELHI1951 - pp. 644-660
Et.
HALPHEN - Sur un nouveautype
de courbe defréquence - Compte
rendu de l’Académie des
Sciences -
10 Novembre 1941G.
MORLAT - Les lois deprobabilité
de HALPHEN - Revue de Statis-tique Appliquée (Institut
deStatistique
del’Université
dePARIS)
1956 - n° 3
G.
PETIAU -La théorie des fonctions
deBESSEL : C.N.R.S. -
Institut Henri Poincaré - PARIS 1955P.
GUILLOT - Laprobabilité
du débit maximum annuel et ses relationsavec la loi de distribution des débits
journaliers - Congrès A.I.R.H.
LONDRES -
Septembre
1963DISCUSSION
M. le Président remercie M. GUILLOT d’avoir clairement
posé,
à nouveau, leproblème
del’adéquation
des lois de distributionclassiques
etperfectionné
cellesqui
avaient étéproposées
par M.HALPHEN ;
ce dernier fut l’un des collabora- teurs de la SociétéHydrotechnique
de France et l’animateur d’une brillanteéquipe
dejeunes
statisticiens intéressés àl’hydrologie.
La tabulation des fonctions
d’Halphen
a été commencée, il y aquelques
an- nées, par la Direction des Etudes et Recherches de l’E.D.F. ; elle vient d’êtrereprise
en utilisant les facilitésqu’offrent
les ordinateursélectroniques.
Ayant
trouvé très intéressante la remarque faite par M. GUILLOT à savoir que pour laplupart
des rivièresfrançaises qu’il
avait étudiées les deux ou troispoints
lesplus
hauts de la courbe des crues annuelles classées se situaient sys-tématiquement
au-dessus de la droited’ajustement
de Gumbel et au-dessous de celle deFrechet,
M. NORMANDsuggère
que ce critèreempirique
soitplus
dé-veloppé.
La S. H. F.pourrait
centraliser lesajustements
de crues annuelles clas- séesopérés
par les divers groupes d’étude(E.D.F.,
O.R.S.T.O.M., Ponts etChaussées,
GénieRural,
Sociétés de RecherchesHydrauliques... )
et animer untravail de
synthèse qui permettrait
dedéfinir,
en fonction des caractères clima-tiques
etmorphologiques
des diversesrégions,
les loisstatistiques
les mieuxadaptées
en moyenne.M. le Président dit que la vérification de
l’adéquation
des loisstatistiques classiques
àchaque
casparticulier,
esttoujours
assezdélicate,
du fait que l’onne
possède généralement
que des données d’observationportant
sur une faible durée(50
à 100ans)
alors que l’on recherche parextrapolation
des valeurs correspon- dant à destemps
de récurrence de 1 000 à 10 000 ans.M. RODIER
indique qu’il
est assezfréquent
que la loilog-normale qui,
par ailleurs rend degrands
services auxhydrologues, s’ajuste
assez bien avec la dis-tribution
expérimentale
des débits observésjusqu’au
dernier décile et un peu au- delà mais ne convienneplus
du tout pour lesfréquences
nettementplus faibles,
Cecin’empêche
pas du tout 6 sur 10 deshydrologues (soyons optimistes) d’ajus-
ter une relation de Galton sur les 20 ou 30
points expérimentaux
et de l’extra-poler
hardiment vers la crue millénaire. M. GUILLOT a eu ungrand
mérite de rechercher une série de relationss’ajustant
mieux avant lepremier
décile et au- delà du dernier. Biensûr,
on nedispose
que de 40points
engénéral
pour voir si celas’ajuste
mieux mais le fait de trouver ce résultat pour unevingtaine
destations est
déjà
convaincant.Quant
à la recherche d’une valeur v constante, M. RODIERprécise
cequi
suit : la loi de Gumbel donne en France des valeurstrop
faibles. Nous avonstrouvé ailleurs des
régimes
pourlesquels
elle donnait des valeurstrop
fortes . Parailleurs,
comme M.GUILLOT,
M. RODIER a étudié d’autresrégimes
pourlesquels,
même la loi de Galton donnait des résultatstrop
faibles. Il estpossi-
ble que pour lamajeure
partie de la France il soitjudicieux
deprendre v (nu) =
2 mais pour d’autres pays il faudrait admettre une valeur de v(nu)
différente.M. SNEYERS demande :
1/
si les loisprésentées peuvent
attribuer uneprobabilité
non nulle à une valeur de"x"
nulle.2/
s’il estpossible d’ajuster
de telles courbes à l’aide de la méthode de vraisemblance maximale.D’autre
part,
M. SNEYERSindique,
à propos de la remarque de M.RODIER,
quel’appréciation
de la validité del’ajustement
d’une loi donnée à un ensemble de rivièresappartenant
à un mêmerégime risque
deprésenter
des difficultés en raison du fait que lecomportement
des rivières n’est vraisemblablement pas in-dépendant.
M. GUILLOT
répond négativement
à lapremière question
de M. SNEYERScar la
probabilité
d’avoir zéro est inférieure à toutequantité,
sipetite
soit-elle, fixéed’avance ;
M. GUILLOTrépond
affirmativement à la secondequestion
et ditqu’un
des auditeurs a fait cetajustement
par la méthode du maximum de vrai- semblance.M. FERRY
indique
que, pour la statisticien pur,l’ajustement
par les dé- ciles choisi par M. GUILLOT n’estqu’une
commodité decalcul,
car les décilesse déterminent
plus rapidement
et facilement que les moments, mais aurisque
d’uneperte
d’information.Or,
onpeut
se demander si, dans la réalitéphysique,
ce n’est pas le contraire
qui
est vrai.En
effet,
le statisticien commence par admettre, comme base de laplupart
de ses raisonnements, la validité absolue d’une certaine forme
mathématique
de loi deprobabilité,
dont seule la valeurnumérique
desparamètres
serait incon-nue. Toutes les observations effectuées sont donc considérées par lui comme ti- rées d’une
population
obéissantrigoureusement
à cette loi.Si maintenant, nous examinons la réalité
concrète,
nous devons nous rap-peler
que les lois utilisées ont unejustification purement empirique.
Si même il existe certaines considérationsthéoriques,
celles-ci ne sontjamais
valables quecomme des
approximations
à l’intérieur de limites que seulel’expérience peut
déterminer.Or,
les données dont ondispose
enhydrologie permettent
engénéral
de con-trôler la validité
pratique
de tel ou teltype
de loi à l’intérieur de limites corres-pondant
à peuprès
à l’intervalleinterdécile ;
elles nepermettent
pas d’étendre cette validitéjusqu’aux
centiles et encore moins au-delà.Lorsqu’on
utilise les moments pour le calcul desparamètres d’ajustement,
on donne un
poids
considérable aux valeurs extrêmes pourlesquelles
la validité de la loi admise estprécisément
laplus
douteuse.(Ceci
estparticulièrement
vrailorsqu’on
travaille sur leslogarithmes
d’unegrandeur physique,
pour lespetites
valeurs de cettegrandeur).
Lorsqu’au
contraire on utilise desquantiles
pourl’ajustement,
ils sont rai- sonnablementadaptés
aux échantillons dont ondispose
et nerisquent
pas de faire commettre des erreursd’adéquation
à l’intérieur de l’intervalleinterquantile
uti- lisé.La
principale
difficultéd’application
de lastatistique
est de passer du do- maine idéal etthéorique
duprofesseur de statistique mathématique
au domaineréel et concret de l’art de
l’ingénieur, et
de savoir reconnaître les limites au-delà
desquelles
les méthodes de la théorierisquent
de devenirfallacieuses.
M. LARRAS demande à M. GUILLOT s’il a pu
dégager
certainesimpres-
sions sur letype
de loi leplus adéquat
pour lesrégions méditerranéennes,
de mêmequ’il
en adégagé
pour les autresrégions, (Gumbel, faible, Galton-Gibrat, fort).
M. GUILLOT
répond
que c’est assez difficile car, les stations dejaugeage
étant souvent
emportées
par les crues, sur les cours d’eau méditerranéens, ceux- ci n’ont pas de séries de mesures de débits trèslongues.
D’après
les estimationsqui
ont été faites se seraientplutôt
desfréquences
à décroissance
algébrique qui conviendraient,
genrehypothèse
Fréchet(graphique 4).
Tout ce que l’on sait, en ce
qui
concerne les crues de larégion
méditer- ranéenne, c’est que celadépasse
vraiment les ordres degrandeurs
lesplus
ahu- rissants, dans certains cas.En conclusion, M. le Président propose que l’on tente de rechercher pour rechercher pour
chaque région
ou groupe de cours d’eau,hydrologiquement
homo-gènes,
letype
de loi de distributionqui paraît
le mieuxadapté
aux données dis-ponibles.
Sous certaines réserves évidentes, l’utilisation, enquelque
sorte nor-malisée,
de cetype
de loipermettrait
d’obtenir pour tous lesproblèmes prati-
ques(dimensionnement
des évacuateurs de crue debarrage
parexemple)
des ré-sultats,
sinonplus
exacte du moinsplus
cohérents, que ceux calculés à l’initia- tive de chacun.M. SNEYERS craint que
l’emploi
d’untype
donné de loi pour décrire lescrues d’un groupe
régional
de rivières soitdangereux.
Lecomportement
de cha- que rivière est lié à celui de ses affluents et il est peuprobable
que l’influence totale des affluents soit la même pourchaque
rivière.En
réalité,
on est doncconduit,
dans ce cas, à faire desajustements
en utilisant une loi"transformée"
de la loi normale ou de la loi des valeurs extrêmesau moyen d’une transformation
hyperbolique qui a l’avantage d’être,
à lalimite,
une loi linéaire.
On
peut
démontrerthéoriquement
que, siplusieurs
lois deprobabilité
con-courent à déterminer une loi finale, cette loi finale est le
produit
des diverses lois deprobabilité
distinctes et, à l’aide de cettehypothèse,
onpeut
voirqu’on
aura un
comportement asymptotiquement
linéaire dans lespetites
valeurs et dansles
grandes
valeurs.L’hétérogénéité
de l’effet des affluents rend, de cefait, inadéquate l’adop-
tion d’une forme
unique
de loi pour un réseauhydrographique
déterminé.M. le Président croit que seule
l’expérience
dira si la réelle difficulté si-gnalée
par M. SNEYERS est dirimante enpratique.
M. Dino TONINI croit que du
point
de vuepratique,
laproposition
de M. le Président est bonne carl’ingénieur
doit faire des calculs pour certainesrégions
et utiliser des formules ou des lois
qui
ne sont pas les mêmes etqui
aboutissent à des résultatspratiques
trèsdivergents.
Les études de M. GUILLOT
présentent
un trèsgrand
intérêt aupoint
de vuescientifique.
Maisjusqu’à présent,
on n’ajamais
été dans lesapplications
au-delàde la loi Galton-Gibrat.
On
pourrait
faire descomparaisons
et arriver même à une loi trèssimple quelles
que soient lesrégions.
Ce serait unequestion
très intéressante à suivre.M. le Président observe
qu’il
restera à déterminer letype
loiqui
sera choisi comme norme dans telle ou tellerégion :
celareprésente
un gros travaild’analyse
d’une foule de données souventdisparates.
M. GUILLOT
indique qu’il
existe despapiers gausso-arithmétiques
et gaus-so-logarithmiques
parce que, il y a un siècle environ, on apris
lapeine
de ta- buler d’une manière correcte la loi de Gauss et tout le monde les utilise parcequ’il
estplus
commode deprendre
cequi
existe. Lejour
ou l’on aura fait des tables de loisd’Halphen qui
seront commodes et faciles àmanipuler,
ou mêmedes
papiers Halphéno-logarithmiques, peut-être
y aura-t-il des utilisateurs nom- breux. Ce ne seratoujours
làqu’un
schémanumérique
commode et non une loiphysique.
M. le Président remercie à nouveau M. GUILLOT pour son
remarquable exposé qui
a donné à chacun l’occasiond’approfondir
unproblème
encore loin d’ê-tre