VI.2 Mod`eles de valeurs extrˆemes
VI.2.2 La loi des d´epassements (mod`ele POT)
L’autre mod`ele caract´eristique des extrˆemes est celui des d´epassements encore appel´ePOT pour Peaks over Threshold . Consid´erons un ensemble de variables al´eatoires ind´ependantes (Xn, n≥1) de mˆeme loi de fonction de r´epartitionF. Appelonsu un niveau seuil et ´etudions la loi des d´epassements au-del`a de ce seuil. Le th´eor`eme de Pickands stipule que lorsque u croˆıt vers l’infini, on sait caract´eriser `a la fois l’intensit´e et la fr´equence des d´epassements.
D´efinition VI.3. La fonction de r´epartition de la loi de Pareto g´en´eralis´ee de param`etre (σ >0, ξ ∈R) est, si ξ 6= 0,
1− 1 +ξy
σ −1ξ
, pour 0≤y si ξ >0 ou 0≤y≤σ/(−ξ) siξ <0, et (par continuit´e) si ξ= 0
1−exp(−y/σ) pour y >0.
Th´eor`eme VI.4(Loi des d´epassements). Soient(Xn, n≥1)une suite de variables al´eatoires iid de fonction de r´epartition F v´erifiant la loi du maximum renormalis´ee. On note xM = inf{x;F(x) = 1} ∈]− ∞,∞] le maximum du support de F. On se donne un seuil de d´epassement u qui croˆıt vers xM et tel que lim
u→x−M,n→∞
n(1−F(u)) = λ∈]0,+∞[. D´es lors, asymptotiquement quand u→x−M et n→ ∞,
- le nombre de d´epassements de l’´echantillon de taillen,K = Card{i∈ {1, . . . , n};Xi >
u}, suit une loi de Poisson de param`etre λ.
- Conditionnellement aux nombres de d´epassements, les intensit´es des d´epassements for-ment des variables al´eatoires ind´ependantes de loi de Pareto g´en´eralis´ee : pouru+y <
xM,
P(X ≤u+y|X > u)≃1−
1 +ξ y σ(u)
−1ξ
, (VI.2)
o`u ξ est l’indice de la loi limite du maximum renormalis´e.
Remarque VI.5. Pour ξ6= 0, il est possible de choisir l’´echelle σ(u)>0 telle que : σ(u) ∼
u→x−M
(ξ(u−xM) siξ <0 (etxM <+∞), ξu siξ >0 (etxM = +∞).
♦
Rappelons que la distribution de Poisson de param`etre λs’´ecrit : P(K =k) = exp (−λ)λk
k!, k∈N,
o`uλest la valeur moyenne du nombre de d´epassements du seuilu. Le paragraphe VI.6.2 sur la loi de Poisson permet de comprendre pourquoi c’est ici un cas limite de tirage binomial de param`etre 1−F(u). On utilisera ainsi ce r´esultat th´eorique comme mod`ele pour d´ecrire les temp´eratures d’une saison sup´erieures `a un seuil ou les d´ebits d’une rivi`ere d´epassant un niveau de r´ef´erence (voir l’exemple la figure VI.2). Il y a une liaison ´etroite entre la GEV du pa-ragraphe pr´ec´edent et ce mod`ele de d´epassement (POT). La loi du maximum sur une p´eriode
VI.2. MOD `ELES DE VALEURS EXTR ˆEMES 115 de temps donn´ee d’un mod`ele POT est la loi GEV. La loi conditionnelle du d´epassement d’un seuil quand on sait que l’observation issue d’un mod`ele GEV d´epasse ce seuil est la loi de Pareto g´en´eralis´ee. On peut fortement justifier les hypoth`eses du mod`ele utilis´e : pour peu que l’on travaille avec un seuil suffisamment ´elev´e et que l’hypoth`ese d’ind´ependance soit acceptable pour les crues de ce niveau, les conditions asymptotiques s’appliquent et en-traˆınent la validit´e progressive de la repr´esentation math´ematique (VI.2). D’un autre cot´e, il a ´et´e simplifi´e pour les besoins du calcul (tout en restant r´ealiste pour certains cas) en posant ξ = 0 auquel cas l’´equation (VI.2) devient par continuit´e la loi exponentielle :
P(X≤u+y|X > u)≃1−
exp− y
σ(u)
Le mod`ele POT pour lequel le nombre de d´epassements suit une loi de Poisson avec l’intensit´e du d´epassement exponentielle (ξ= 0) est encore appel´e mod`ele de renouvellement-d´epassement.
Exemple VI.6. On peut aussi v´erifier la loi des d´epassements pour les trois distributions typiques de l’exemple VI.2. En effet, la fonction de r´epartition des d´epassements s’´ecrit :
P(X≤u+y|X > u) = 1−1−F(u+y) 1−F(u) . -i) Loi limite de Weibull (ξ <0). On consid`ere le cas 1−F(x) ∼
x→x−M
(xM −x
α )−1/ξ. On prend comme ´echelle σ(u) =ξ(u−xM) et on v´erifie que
P(X−u≤σ(u)y|X−u >0) −−−−→
u→x−M 1−(1 +ξy)−1/ξ,
qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ <0.
-ii) Loi limite de Fr´echet (ξ >0). On consid`ere le cas 1−F(x) ∼
x→+∞(x
α)−1/ξ. On prend comme ´echelle σ(u) =ξu et on v´erifie que
P(X−u≤σ(u)y|X−u >0)−−−−→
u→+∞ 1−(1 +ξy)−1/ξ,
qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ >0.
-iii) Loi limite de Gumbel (ξ = 0). On consid`ere le cas 1−F(x) ∼
x→+∞e−x−µσ . On prend comme ´echelle σ(u) =σ et on v´erifie que
P(X−u≤σy|X−u >0)−−−−→u→+∞ 1−e−y,
qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ= 0.
♦
Du mod`ele GEV au mod`ele POT
Donnons une id´ee heuristique de comment passer du mod`ele GEV au mod`ele POT. Soit une suite de variables iid`a temps discret de fonction de r´epartitionF . Sous l’hypoth`eseiid,
les extrˆemes sont les observations ´el´ementaires qui d´epassent un seuil u > 0 fix´e (cf. figure VI.3). On s’int´eresse alors `a la probabilit´e qu’une variable al´eatoire ´el´ementaire quelconque d´epasse un certain niveauy >0 quand on sait qu’elle d´epasse le seuil fix´e :
P(X > y+u|X > u) = 1−F(y+u)
1−F(u) (VI.3)
Seuil u>0
Fenêtre de longueur T
Temps Y
X
Fig. VI.3 – Au d´epassement Y du seuilu >0 correspond l’intensit´eX=Y +u On sait que la distribution du maximum des observations ´el´ementaires tend asymptoti-quement vers la distribution GEV. A u fix´e, il existe donc pour un n suffisamment grand, deux constantesµn etσn,telles que la loi du maximum de nvariables al´eatoires iidde loi F r´ealise l’approximation :
P(Mn≤u) =P
Mn−µn
σn ≤ u−µn σn
≃G
u−µn σn
. CommeP(Mn≤u) =F(u)n, on en d´eduit que
−nlogF(u)≃
1 +ξ
u−µn σn
−1/ξ
Siu est suffisamment proche de xM, on utilise un d´eveloppement au premier ordre du loga-rithme autour de 0 :
−logF(u) = log(1−(1−F(u))≃1−F(u)
VI.3. INF ´ERENCE 117
Si cette relation tient pour un seuil u >0, elle tiendra aussi pour tout niveau qui le d´epasse, par exemple le niveauy+u. D`es lors, en substituant dans (VI.3) on trouve que la distribution de Pareto g´en´eralis´ee est candidate `a la loi des d´epassements quanduest suffisamment ´elev´e, puisque :
On consid`ere M, le maximum d’un grand nombre de variables al´eatoires iid. Pour un seuil u (grand), M −u, qui repr´esente les d´epassements au dessus du seuil u, se comporte asymptotiquement comme le maximum de K variables al´eatoires (Yi, i∈ {1, . . . , K}), o`u les variables al´eatoires (Yi, i≥1) sont ind´ependantes de loi de Pareto g´en´eralis´ee de param`etre (σ(u), ξ), et ind´ependantes deK de loi de Poisson de param`etre λ >0. On a donc
P(M−u≤y)≃P( max
1≤i≤KYi ≤y).
La fonction de r´epartition du maximum est obtenue en sommant la r´epartition conjointe sur toutes les valeurs possibles de K :