• Aucun résultat trouvé

La loi des d´epassements (mod`ele POT)

Dans le document ´ECOLE NATIONALE DES PONTS ET CHAUSS´EES (Page 124-127)

VI.2 Mod`eles de valeurs extrˆemes

VI.2.2 La loi des d´epassements (mod`ele POT)

L’autre mod`ele caract´eristique des extrˆemes est celui des d´epassements encore appel´ePOT pour Peaks over Threshold . Consid´erons un ensemble de variables al´eatoires ind´ependantes (Xn, n≥1) de mˆeme loi de fonction de r´epartitionF. Appelonsu un niveau seuil et ´etudions la loi des d´epassements au-del`a de ce seuil. Le th´eor`eme de Pickands stipule que lorsque u croˆıt vers l’infini, on sait caract´eriser `a la fois l’intensit´e et la fr´equence des d´epassements.

D´efinition VI.3. La fonction de r´epartition de la loi de Pareto g´en´eralis´ee de param`etre (σ >0, ξ ∈R) est, si ξ 6= 0,

1− 1 +ξy

σ 1ξ

, pour 0≤y si ξ >0 ou 0≤y≤σ/(−ξ) siξ <0, et (par continuit´e) si ξ= 0

1−exp(−y/σ) pour y >0.

Th´eor`eme VI.4(Loi des d´epassements). Soient(Xn, n≥1)une suite de variables al´eatoires iid de fonction de r´epartition F v´erifiant la loi du maximum renormalis´ee. On note xM = inf{x;F(x) = 1} ∈]− ∞,∞] le maximum du support de F. On se donne un seuil de d´epassement u qui croˆıt vers xM et tel que lim

uxM,n→∞

n(1−F(u)) = λ∈]0,+∞[. D´es lors, asymptotiquement quand u→xM et n→ ∞,

- le nombre de d´epassements de l’´echantillon de taillen,K = Card{i∈ {1, . . . , n};Xi >

u}, suit une loi de Poisson de param`etre λ.

- Conditionnellement aux nombres de d´epassements, les intensit´es des d´epassements for-ment des variables al´eatoires ind´ependantes de loi de Pareto g´en´eralis´ee : pouru+y <

xM,

P(X ≤u+y|X > u)≃1−

1 +ξ y σ(u)

1ξ

, (VI.2)

o`u ξ est l’indice de la loi limite du maximum renormalis´e.

Remarque VI.5. Pour ξ6= 0, il est possible de choisir l’´echelle σ(u)>0 telle que : σ(u) ∼

uxM

(ξ(u−xM) siξ <0 (etxM <+∞), ξu siξ >0 (etxM = +∞).

Rappelons que la distribution de Poisson de param`etre λs’´ecrit : P(K =k) = exp (−λ)λk

k!, k∈N,

o`uλest la valeur moyenne du nombre de d´epassements du seuilu. Le paragraphe VI.6.2 sur la loi de Poisson permet de comprendre pourquoi c’est ici un cas limite de tirage binomial de param`etre 1−F(u). On utilisera ainsi ce r´esultat th´eorique comme mod`ele pour d´ecrire les temp´eratures d’une saison sup´erieures `a un seuil ou les d´ebits d’une rivi`ere d´epassant un niveau de r´ef´erence (voir l’exemple la figure VI.2). Il y a une liaison ´etroite entre la GEV du pa-ragraphe pr´ec´edent et ce mod`ele de d´epassement (POT). La loi du maximum sur une p´eriode

VI.2. MOD `ELES DE VALEURS EXTR ˆEMES 115 de temps donn´ee d’un mod`ele POT est la loi GEV. La loi conditionnelle du d´epassement d’un seuil quand on sait que l’observation issue d’un mod`ele GEV d´epasse ce seuil est la loi de Pareto g´en´eralis´ee. On peut fortement justifier les hypoth`eses du mod`ele utilis´e : pour peu que l’on travaille avec un seuil suffisamment ´elev´e et que l’hypoth`ese d’ind´ependance soit acceptable pour les crues de ce niveau, les conditions asymptotiques s’appliquent et en-traˆınent la validit´e progressive de la repr´esentation math´ematique (VI.2). D’un autre cot´e, il a ´et´e simplifi´e pour les besoins du calcul (tout en restant r´ealiste pour certains cas) en posant ξ = 0 auquel cas l’´equation (VI.2) devient par continuit´e la loi exponentielle :

P(X≤u+y|X > u)≃1−

exp− y

σ(u)

Le mod`ele POT pour lequel le nombre de d´epassements suit une loi de Poisson avec l’intensit´e du d´epassement exponentielle (ξ= 0) est encore appel´e mod`ele de renouvellement-d´epassement.

Exemple VI.6. On peut aussi v´erifier la loi des d´epassements pour les trois distributions typiques de l’exemple VI.2. En effet, la fonction de r´epartition des d´epassements s’´ecrit :

P(X≤u+y|X > u) = 1−1−F(u+y) 1−F(u) . -i) Loi limite de Weibull (ξ <0). On consid`ere le cas 1−F(x) ∼

xxM

(xM −x

α )−1/ξ. On prend comme ´echelle σ(u) =ξ(u−xM) et on v´erifie que

P(X−u≤σ(u)y|X−u >0) −−−−→

u→xM 1−(1 +ξy)1/ξ,

qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ <0.

-ii) Loi limite de Fr´echet (ξ >0). On consid`ere le cas 1−F(x) ∼

x→+∞(x

α)1/ξ. On prend comme ´echelle σ(u) =ξu et on v´erifie que

P(X−u≤σ(u)y|X−u >0)−−−−→

u+ 1−(1 +ξy)1/ξ,

qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ >0.

-iii) Loi limite de Gumbel (ξ = 0). On consid`ere le cas 1−F(x) ∼

x+ex−µσ . On prend comme ´echelle σ(u) =σ et on v´erifie que

P(X−u≤σy|X−u >0)−−−−→u→+∞ 1−ey,

qui est bien la fonction de r´epartition de la loi de Pareto g´en´eralis´ee avec ξ= 0.

Du mod`ele GEV au mod`ele POT

Donnons une id´ee heuristique de comment passer du mod`ele GEV au mod`ele POT. Soit une suite de variables iid`a temps discret de fonction de r´epartitionF . Sous l’hypoth`eseiid,

les extrˆemes sont les observations ´el´ementaires qui d´epassent un seuil u > 0 fix´e (cf. figure VI.3). On s’int´eresse alors `a la probabilit´e qu’une variable al´eatoire ´el´ementaire quelconque d´epasse un certain niveauy >0 quand on sait qu’elle d´epasse le seuil fix´e :

P(X > y+u|X > u) = 1−F(y+u)

1−F(u) (VI.3)

Seuil u>0

Fenêtre de longueur T

Temps Y

X

Fig. VI.3 – Au d´epassement Y du seuilu >0 correspond l’intensit´eX=Y +u On sait que la distribution du maximum des observations ´el´ementaires tend asymptoti-quement vers la distribution GEV. A u fix´e, il existe donc pour un n suffisamment grand, deux constantesµn etσn,telles que la loi du maximum de nvariables al´eatoires iidde loi F r´ealise l’approximation :

P(Mn≤u) =P

Mn−µn

σn ≤ u−µn σn

≃G

u−µn σn

. CommeP(Mn≤u) =F(u)n, on en d´eduit que

−nlogF(u)≃

1 +ξ

u−µn σn

1/ξ

Siu est suffisamment proche de xM, on utilise un d´eveloppement au premier ordre du loga-rithme autour de 0 :

−logF(u) = log(1−(1−F(u))≃1−F(u)

VI.3. INF ´ERENCE 117

Si cette relation tient pour un seuil u >0, elle tiendra aussi pour tout niveau qui le d´epasse, par exemple le niveauy+u. D`es lors, en substituant dans (VI.3) on trouve que la distribution de Pareto g´en´eralis´ee est candidate `a la loi des d´epassements quanduest suffisamment ´elev´e, puisque :

On consid`ere M, le maximum d’un grand nombre de variables al´eatoires iid. Pour un seuil u (grand), M −u, qui repr´esente les d´epassements au dessus du seuil u, se comporte asymptotiquement comme le maximum de K variables al´eatoires (Yi, i∈ {1, . . . , K}), o`u les variables al´eatoires (Yi, i≥1) sont ind´ependantes de loi de Pareto g´en´eralis´ee de param`etre (σ(u), ξ), et ind´ependantes deK de loi de Poisson de param`etre λ >0. On a donc

P(M−u≤y)≃P( max

1≤i≤KYi ≤y).

La fonction de r´epartition du maximum est obtenue en sommant la r´epartition conjointe sur toutes les valeurs possibles de K :

Dans le document ´ECOLE NATIONALE DES PONTS ET CHAUSS´EES (Page 124-127)