La loi des dépassements (modèle POT) - Modèles de valeurs extrêmes

VI.2 Mod`eles de valeurs extrˆemes

VI.2.2 La loi des d´epassements (mod`ele POT)

L’autre modèle caractéristique des extrêmes est celui des dépassements encore appeléPOT pour Peaks over Threshold . Considérons un ensemble de variables aléatoires indépendantes (X_n, n≥1) de même loi de fonction de répartitionF. Appelonsu un niveau seuil et étudions la loi des dépassements au-delà de ce seuil. Le théorème de Pickands stipule que lorsque u croˆıt vers l’infini, on sait caractériser à la fois l’intensité et la fréquence des dépassements.

Définition VI.3. La fonction de répartition de la loi de Pareto généralisée de paramètre (σ >0, ξ ∈R) est, si ξ 6= 0,

1− 1 +ξy

σ ₋¹_ξ

, pour 0≤y si ξ >0 ou 0≤y≤σ/(−ξ) siξ <0, et (par continuit´e) si ξ= 0

1−exp(−y/σ) pour y >0.

Théorème VI.4(Loi des dépassements). Soient(X_n, n≥1)une suite de variables aléatoires iid de fonction de répartition F vérifiant la loi du maximum renormalisée. On note x_M = inf{x;F(x) = 1} ∈]− ∞,∞] le maximum du support de F. On se donne un seuil de dépassement u qui croˆıt vers x_M et tel que lim

u→x⁻_M,n→∞

n(1−F(u)) = λ∈]0,+∞[. D´es lors, asymptotiquement quand u→x⁻_M et n→ ∞,

- le nombre de d´epassements de l’´echantillon de taillen,K = Card{i∈ {1, . . . , n};Xi >

u}, suit une loi de Poisson de param`etre λ.

- Conditionnellement aux nombres de dépassements, les intensités des dépassements for-ment des variables aléatoires indépendantes de loi de Pareto généralisée : pouru+y <

x_M,

P(X ≤u+y|X > u)≃1−

1 +ξ y σ(u)

₋¹_ξ

, (VI.2)

o`u ξ est l’indice de la loi limite du maximum renormalis´e.

Remarque VI.5. Pour ξ6= 0, il est possible de choisir l’´echelle σ(u)>0 telle que : σ(u) ∼

u→x⁻_M

(ξ(u−x_M) siξ <0 (etx_M <+∞), ξu siξ >0 (etx_M = +∞).

♦

Rappelons que la distribution de Poisson de param`etre λs’´ecrit : P(K =k) = exp (−λ)λ^k

k!, k∈N,

oùλest la valeur moyenne du nombre de dépassements du seuilu. Le paragraphe VI.6.2 sur la loi de Poisson permet de comprendre pourquoi c’est ici un cas limite de tirage binomial de paramètre 1−F(u). On utilisera ainsi ce résultat théorique comme modèle pour décrire les températures d’une saison supérieures à un seuil ou les débits d’une rivière dépassant un niveau de référence (voir l’exemple la figure VI.2). Il y a une liaison étroite entre la GEV du pa-ragraphe précédent et ce modèle de dépassement (POT). La loi du maximum sur une période

VI.2. MOD ÈLES DE VALEURS EXTR ÊMES 115 de temps donnée d’un modèle POT est la loi GEV. La loi conditionnelle du dépassement d’un seuil quand on sait que l’observation issue d’un modèle GEV dépasse ce seuil est la loi de Pareto généralisée. On peut fortement justifier les hypothèses du modèle utilisé : pour peu que l’on travaille avec un seuil suffisamment élevé et que l’hypothèse d’indépendance soit acceptable pour les crues de ce niveau, les conditions asymptotiques s’appliquent et en-traˆınent la validité progressive de la représentation mathématique (VI.2). D’un autre coté, il a été simplifié pour les besoins du calcul (tout en restant réaliste pour certains cas) en posant ξ = 0 auquel cas l’équation (VI.2) devient par continuité la loi exponentielle :

P(X≤u+y|X > u)≃1−

exp− y

σ(u)

Le modèle POT pour lequel le nombre de dépassements suit une loi de Poisson avec l’intensité du dépassement exponentielle (ξ= 0) est encore appelé modèle de renouvellement-dépassement.

Exemple VI.6. On peut aussi vérifier la loi des dépassements pour les trois distributions typiques de l’exemple VI.2. En effet, la fonction de répartition des dépassements s’écrit :

P(X≤u+y|X > u) = 1−1−F(u+y) 1−F(u) . -i) Loi limite de Weibull (ξ <0). On consid`ere le cas 1−F(x) ∼

x→x⁻_M

(x_M −x

α )^−1/ξ. On prend comme ´echelle σ(u) =ξ(u−xM) et on v´erifie que

P(X−u≤σ(u)y|X−u >0) −−−−→

u→x⁻_M 1−(1 +ξy)⁻^1/ξ,

qui est bien la fonction de répartition de la loi de Pareto généralisée avec ξ <0.

-ii) Loi limite de Fr´echet (ξ >0). On consid`ere le cas 1−F(x) ∼

x→+∞(x

α)⁻^1/ξ. On prend comme ´echelle σ(u) =ξu et on v´erifie que

P(X−u≤σ(u)y|X−u >0)−−−−→

u→+∞ 1−(1 +ξy)⁻^1/ξ,

qui est bien la fonction de répartition de la loi de Pareto généralisée avec ξ >0.

-iii) Loi limite de Gumbel (ξ = 0). On consid`ere le cas 1−F(x) ∼

x→+∞e⁻^x−µ^σ . On prend comme ´echelle σ(u) =σ et on v´erifie que

P(X−u≤σy|X−u >0)−−−−→^u→+∞ 1−e⁻^y,

qui est bien la fonction de répartition de la loi de Pareto généralisée avec ξ= 0.

♦

Du mod`ele GEV au mod`ele POT

Donnons une idée heuristique de comment passer du modèle GEV au modèle POT. Soit une suite de variables iidà temps discret de fonction de répartitionF . Sous l’hypothèseiid,

les extrêmes sont les observations élémentaires qui dépassent un seuil u > 0 fixé (cf. figure VI.3). On s’intéresse alors à la probabilité qu’une variable aléatoire élémentaire quelconque dépasse un certain niveauy >0 quand on sait qu’elle dépasse le seuil fixé :

P(X > y+u|X > u) = 1−F(y+u)

1−F(u) (VI.3)

Seuil u>0

Fenêtre de longueur T

Temps Y

Fig. VI.3 – Au dépassement Y du seuilu >0 correspond l’intensitéX=Y +u On sait que la distribution du maximum des observations élémentaires tend asymptoti-quement vers la distribution GEV. A u fixé, il existe donc pour un n suffisamment grand, deux constantesµ_n etσ_n,telles que la loi du maximum de nvariables aléatoires iidde loi F réalise l’approximation :

P(M_n≤u) =P

M_n−µ_n

σ_n ≤ u−µ_n σ_n

≃G

u−µ_n σ_n

. CommeP(M_n≤u) =F(u)ⁿ, on en d´eduit que

−nlogF(u)≃

1 +ξ

u−µ_n σ_n

₋1/ξ

Siu est suffisamment proche de x_M, on utilise un d´eveloppement au premier ordre du loga-rithme autour de 0 :

−logF(u) = log(1−(1−F(u))≃1−F(u)

VI.3. INF ´ERENCE 117

Si cette relation tient pour un seuil u >0, elle tiendra aussi pour tout niveau qui le dépasse, par exemple le niveauy+u. Dès lors, en substituant dans (VI.3) on trouve que la distribution de Pareto généralisée est candidate à la loi des dépassements quanduest suffisamment élevé, puisque :

On considère M, le maximum d’un grand nombre de variables aléatoires iid. Pour un seuil u (grand), M −u, qui représente les dépassements au dessus du seuil u, se comporte asymptotiquement comme le maximum de K variables aléatoires (Y_i, i∈ {1, . . . , K}), où les variables aléatoires (Y_i, i≥1) sont indépendantes de loi de Pareto généralisée de paramètre (σ(u), ξ), et indépendantes deK de loi de Poisson de paramètre λ >0. On a donc

P(M−u≤y)≃P( max

1≤i≤KY_i ≤y).

La fonction de r´epartition du maximum est obtenue en sommant la r´epartition conjointe sur toutes les valeurs possibles de K :

Dans le document ´ECOLE NATIONALE DES PONTS ET CHAUSS´EES (Page 124-127)