R EVUE DE STATISTIQUE APPLIQUÉE
N EIL G OLDSTEIN
Estimations des paramètres de la loi des valeurs extrêmes et conséquences économiques
Revue de statistique appliquée, tome 14, n
o2 (1966), p. 47-54
<
http://www.numdam.org/item?id=RSA_1966__14_2_47_0>
© Société française de statistique, 1966, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
47
ESTIMATIONS DES PARAMÈTRES DE LA LOI DES VALEURS
EXTRÊMES ET CONSÉQUENCES ÉCONOMIQUES
Neil GOLDSTEIN(1)
(U.S. Public Health Service)
L’ingénieur
étudie et construit un ouvrage(barrage, pont, ... )
envue de sa durée. Pour
cela,
il doitconnaître,
ou tout au moins êtrecapable
d’estimerl’importance
desrisques
aléatoiresauxquels,
dansl’avenir,
estexposé
son ouvrage. Celasignifie qu’il
doit savoirquelle peut
êtrel’importance
d’une crue, la force d’un vent...auxquelles
sonouvrage
risque
d’être soumis. Pourcela, l’ingénieur
a à sadisposition
la théorie
statistique
des valeurs extrêmes.Afin de mettre cette théorie
statistique
enpratique,
certaines esti- mations doivent être faites : leproblème
étudié parl’ingénieur
est, dansune certaine mesure, réduit à un
problème d’estimation,
ils’agit
alorsde choisir
parmi
les estimationspossibles
desparamètres
d’une dis- tribution cellesqu’il
considérera comme les meilleures.Dans le cas où
l’ingénieur
doit tenircompte
dephénomènes
dontla
résultante,
dans le cas de destruction de son ouvrage,peut
être laperte
de vies humaines ou un coût deremplacement
très élevé(comparé
au coût
initial)
il sera certainementplus particulièrement
intéressé par lenombre, pouvant
êtreenvisagé,
des ouvrages détruits au cours d’unepériode
donnée(c’est-à-dire
lapériode d’usage prévue
dans sonprojet) .
Ceci nous conduit à définir une
procédure
d’estimation comme étant meil- leurequ’une
autre, si elle conduit à une estimationplus petite
du nombrede
dépassements
des valeurs extrêmesenvisagées
ou des ouvrages dé- truits.La distribution
généralement
utilisée pourl’analyse
du débit descrues, de la vitesse du vent, ou d’autres
phénomènes analogues,
est lapremière
distributionasymptotique
des valeurs extrêmes dont la fonction derépartition
est :où x est une variable aléatoire
pouvant
varier de - m à + m et a et usont les
paramètres
de la distributionqui
doivent être estimés.(1) Cet article écrit comme assistant au professeur E.J. Gumbel à Columbia Univer-
sity et sous les auspices de U.S. Public Health Service (Grant WP 00457-01), fait suite aux publications qui ont parues dans la Revue de Statistique Appliquée, vol. 5, n° 2, et n° 4, 1957 ; vol. 10, n° 1, 1962. Le travail présent essaye d’appliquer
la théorie statistique des valeurs extrêmes à la solution de quelques problèmes économiques qui se présentent dans les constructions hydroélectriques.
Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
Il existe actuellement deux méthodes
qui
sont lesplus
souvent uti-lisées pour l’estimation de a et u.
Le but de cette étude est de comparer ces deux méthodes afin de voir
laquelle
est la meilleure dupoint
de vue défini ci-dessus.L’une de ces deux méthodes est la méthode
classique
desmoments,
la seconde en étant une modificationproposée
parGumbel.
La compa- raison de ces deux méthodes a été souvent étudiée de diverspoints
devue
(cf.
parexemple
Lieblein[1]).
Une troisième méthode est celle du maximum de vraisemblance : bien que cette méthodeprésente
des avan-tages théoriques,
elleaugmente
notablement les difficultés de calcul. Laprévision
obtenue par cette méthode estd’ailleurs,
engénérale
très voi-sine de celle donnée par la méthode des moments.
La méthode
classique
des moments conduit aux estimations :et :
où x est la moyenne de
l’échantillon,
sl’écart-type
de l’échantillon et y =0,57722
.... est la constante d’Euler.Les estimations modifiées
[2]
sont données par :et :
avec :
et :
Des tables ont été calculées pour ces deux valeurs
[3]. Lorsque
l’effectifn de l’échantillon
augmente,
les estimations modifiées serapprochent
decelles fournies par la méthode des moments : dans un but de compa-
raison,
lasignification
des différences va être étudiée seulement pour depetits
échantillons.La formule
(1) peut
aussi être écrite sous forme nonparamétrique
sil’on fait la transformation linéaire :
La variable y est
appelée
variable réduite. Elle a lapropriété ,
comme toute variable réduite de condenser les observations. En
fait ,
dans la
plupart
des caspratiques,
y reste dans l’intervalle - 2 y 7.49
Renversant la
procédure,
si l’onpart
avec des valeurs extrêmes réduites y et si l’on fait la transformation inverse :on obtient des valeurs
"non réduites", équivalentes
aux observationsréelles.
Cette transformation inverse aura pour effet
d’augmenter
l’étendueet par
conséquent
la variance des observations.Il en résulte
qu’une
transformation de cetteespèce augmentera,
dans la
plupart
des cas, lesplus grandes
valeurscependant qu’elle
dimi-nuera les
plus petites.
De
plus,
le nombre total desdépassements
seraaugmenté, puisque
la diminution des valeurs
plus petites
seralégère comparée
au pourcen-tage correspondant d’augmentation
des valeursplus grandes.
Le
problème
est alors de trouver la transformationqui augmentera
aussi peu que
possible
le nombre total desdépassements :
ceci sera ob-tenu en
augmentant plus largement
les valeurs extrêmes.Une
prévision
des crues considérée comme fonction de la durée de retour T(prédéterminée
parl’ingénieur
dans sonprojet)
et obtenue àpartir
de la méthode des moments en utilisant leséquations (2), (3)
et(7)
est :De
même,
la méthodemodifiée,
àpartir
deséquations (4), (5)
et(7)
donnera :Ces deux
prévisions
serontégales
et les deux droitesreprésenta-
tives se
couperont
pour :Cette valeur de
yT
se trouve dans l’intervalle 0yT yn
y. Pour100 > n > 10 on aura
0, 261
yT0,287
ou, de manièreéquivalente
surl’échelle des
probabilités, 0, 463 03A6(yT) 0,472.
Il en résulte que pour les durées de retourplus grandes qu’environ 1,86,
cas lesplus
intéres-sants dans un but
d’extrapolation,
on aura2 > 1, 2 augmentant plus rapidement
que1
: la méthode modifiée conduit donc à un nombre totalplus petit
dedépassements.
Cecisignifie
que la méthode modifiée incitel’ingénieur
à construire son ouvrage pourqu’il
résiste à des cruesplus importantes
que cellescorrespondant
à l’autre méthode. D’autrepart,
on récolte
ainsi,
avec la méthodemodifiée,
la moisson d’économies finan- cièreslorsque
les coûts deréparation
et deremplacement
sontpris
en considération.En vue de démontrer ces
principes
et de rechercher les ordres degrandeur qu’ils
entraînent on a utilisé la méthode de Monte Carlo : re-cherche de la solution de
problèmes mathématiques
seposant
dans unRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
contexte aléatoire à l’aide
d’expériences
paréchantillonnage.
La méthodeconsiste à construire un modèle
stochastique
artificiel du processus ma-thématique
et àprélever
des échantillons dans cemodèle.
Il est admis comme
hypothèse
initiale que l’on doitinterpréter
desvaleurs extrêmes au hasard comme étant les
plus grandes
valeurs dontl’ingénieur peut
craindre l’effet sur son ouvrage, c’est-à-dire que si un ensemble fini de valeurs est tiré au hasard de la distribution définie par(1),
le nombre total dedépassements représente
le nombre total deponts emportés
ou debarrages
détruits au cours d’unepériode
detemps spécifiée (une interprétation analogue
a été donné par Benson[4] qui
utilisa une
population
de 1000 valeurs distribuée conformément à(1)
etappliqua
ensuite uneprocédure d’échantillonnage
pour comparer l’in- fluence de diversesprocédures.
Une série de 500 valeurs
extrèmes·[5],
dont on avaitpréalablement
vérifié
qu’elle
satisfaisait aux testsclassiques
du caractèrealéatoire,
a été utilisée comme base des valeurs extrêmesréduites,
y. Les 500 va- leurs extrêmes ont été d’abordpartagées
en 50 sous-échantillons consé- cutifs d’effectif 10 et les deuxparamètres
ont été calculés pour ces 50 sous-échantillons à l’aide des formules(2), (3), (4)
et(5) [6] (Tableau 1).
Tableau 1
Estimation des
paramètres
par les deux méthodes51
Ce tableau montre aussi la différence entre les deux méthodes d’es- timation des
paramètres
u et1/a.
Ces estimations étantasymptotique-
ment normalement
distribuées,
les estimations1/1
et1/â2 rangées
parvaleurs croissantes ont été
portées
sur ungraphique
à loi deprobabilité
normale. Les deux distributions
s’ajustent
assez convenablement à unedistribution
normale,
mais on voit que les estimations1/2
sonttoujours
au-dessus des estimations
1/1.
Deplus,
si les moyennes sontsignifi-
cativement différentes les
pentes
sont sensiblementégales.
Les
estimations
etû2 s’ajustent
aussi très bien à la distributionnormale,
mais cette fois sans différencesignificative
ni ence qui concerne
les moyennes, ni les
pentes (les graphiques
n’ont pas étédessinés).
Ainsi,
cesgraphiques
mettent en évidence le fait que la méthode modifiée donnelieu,
pour les crues, à deslignes
droites avec unepente plus grande
que celle obtenue par la méthodeclassique
des moments et conduit ainsi àune estimation plus prudente
d’une crue futureéventuelle.
Pour confirmer ce résultat on a
compté
ensuite le nombre de fois où laplus grande
valeur dechaque
sous-échantillon étaitdépassée
dans lereste de l’échantillon
(Tableau 3,
colonne2).
Prenant laplus grande
va-leur du
premier
sous-échantillon àpartir duquel
a et u étaient estimés par les deuxméthodes, l’équation (7)
a été utilisée et laplus grande
va-leur transformée
correspondante
a été calculée(Tableau 2).
Tableau 2
Les
plus grandes
valeurs et leurs transformationsRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
Tableau 3
Nombre des
dépassements,
observées etthéoriques
Méthode des Echantillon Observation
Moments Modification Moments
53
Cette
plus grande
valeur a ensuite étécomparée
avec l’échantillon restant des 490 valeurs non transformées parl’équation (7),
de manière àcompter
le nombre de fois où elle y étaitdépassée.
Cette
procédure
étantrépétée
pour chacun des 49 autres sous-échan- tillons : les résultats sont donnés dans les colonnes 3 et 4 du tableau3.
Ainsi
qu’il
étaitescompté,
la méthodemodifiée, qui augmentait
lesvaleurs les
plus grandes
d’uneplus grande quantité,
conduit à unplus petit
nombre dedépassements
que la méthode des moments,chaque dépas-
sement étant
interprété
comme un ouvrage détruit.L’espérance mathématique
du nombre dedépassements
pour la mêmeplus grande
valeur d’un sous-échantillon d’effectif nprélevé
dansun échantillon de N + n est :
Dans notre
exemple,
m =1 ,
N =490,
n = 10. Parconséquent
nous pouvons nous attendre à ce que laplus grande
valeur d’un sous-échantillon d’effectif 10 soitdépassée
en moyenne44,
5 fois dans un échantillon ulté - rieur des 490. Dans ces conditions le nombrethéorique
total dedépas -
sements est
égal
à 50 x44,
5 = 2225.La variance est donnée par :
soit :
Bien que les deux totaux sont à l’intérieur des limites
acceptables
deconfiance,
la méthode modifiée conduit à un totalplus
voisin de sonespé -
rance
mathématique
et donne un moindre nombre dedépassements
danschacun des 50 sous-échantillons. Ainsi la méthode modifiée
d’estimation,
conduisant à
l’hypothèse
d’une destruction de 2083 ouvrages au lieu de 3011(soit
298 enmoins)
au cours de 500 années est"meilleure" (au
sens défini
précédemment)
que la méthodeclassique
des moments,puis- qu’elle
réduit les coûts deréparations
etremplacements.
Revue de Statistique Appliquée 1966 - Vol. XIV - N 2
PROBABILITE NORMALE
Figure
1ESTIMATIONS DU PARAMETRE 1 /a