ESTIMATION NON-PARAM´ ETRIQUE DES QUANTILES EXTRˆ EMES CONDITIONNELS
Th`ese pr´esent´ee par
AlexandreLEKINA
r´ealis´ee sous la direction de St´ephaneGIRARD&LaurentGARDES Soutenue publiquement le mercredi 13 octobre 2010.
1 Introduction
En l’absence de covariable En pr´esence de covariable
2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation
Hypoth`eses et r´esultats asymptotiques
Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques
Estimation des niveaux de retour de pluies dans les C´evennes
4 Conclusions et perspectives Conclusions
Plan : 2 - Introduction
1 Introduction
En l’absence de covariable En pr´esence de covariable
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
3 / 44
Paris Match(Djakarta, mars 2009) : La rupture d’un barrage dans la banlieue de la capitale indon´esienne dans la nuit de jeudi `a vendredi a entrain´e l’inondation d’un quartier r´esidentiel
Hypoth`ese
Les pr´ecipitations not´eesY1, . . . ,Yn sont des r´ealisations de variables al´eatoires ind´ependantes et de mˆeme loi.
Trouver la hauteur des digues dont la probabilit´e d’ˆetre d´epass´ee par les inondations est proche de z´ero ?
0 50 100 150 200 250 300
050100150
Loi empirique des pr´ecipitations journali`eres (mm) `a Montpellier entre 1952−2000.
5 / 44
Probl´ematique : en l’absence de covariable
Partant d’un ´echantillon d’observations ind´ependantes{Yi, i= 1, . . . ,n}.
Estimerles quantit´es extrˆemesqαn associ´ees `a une v.aY ∈Rd´efinies par P(Y >qαn) =αn,
quandαn→0lorsquen→ ∞.
Calculerla probabilit´eαn d’observer une quantit´e extrˆemeyn d´efinie par
αn
def= P(Y >yn), quandyn→ ∞lorsquen→ ∞.
Vocabulaire
Y est appel´ee la variable d’int´erˆet,
R´esultat principal de la th´eorie des valeurs extrˆemes
Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943]
Sous certaines conditions de r´egularit´e surla fonction de r´epartitionF, il existe un param`etre r´eelγet deux suites(an)n≥1>0et(bn)n≥1∈Rtels que pour touty ∈R,
n→∞lim P
max(Y1, . . . ,Yn)−bn
an
≤y
=Jγ(y), avec
Jγ(y) =
( exph
−(1 +γy)−1/γi
siγ6= 0
exp [−exp(−y)] siγ= 0 et pour touty tel que 1 +γy>0.
etJγla fonction de r´epartition de laloi des valeurs extrˆemes g´en´eralis´ee.
Vocabulaire et notation
γ est appel´e l’indice de queueou l’indice des valeurs extrˆemes.
7 / 44
3 domaines d’attraction
SiF v´erifie le Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943], alors on dit queF appartient audomaine d’attractiondeJγ.
Fr´echet(γ >0) Weibull(γ <0) Gumbel(γ= 0)
Cauchy Uniforme Normale
Pareto Beta Exponentielle
Student Weibull Log-normale
Fr´echet Gamma
Burr Weibullm
Benktander-type I et II
Plan : 2 - Introduction
1 Introduction
En l’absence de covariable En pr´esence de covariable
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
9 / 44
Exemple 1 : mod´elisation de donn´ees de fiabilit´e de r´eacteurs nucl´eaires
−200 −150 −100 −50 0
406080100120140160
La t´enacit´e de la cuve (verticalement) et la temp´erature (horizontalement).
Objectifs :
´evaluer la probabilit´e (tr`es faible) d’apparition de micro fissures dans ses cuves,
´evaluer des quantiles de la t´enacit´e en fonction de la temp´erature.
Exemple 2 : Carte des niveaux de retour des pluies dans une r´egion
650 700 750 800 850
1850190019502000
500 1000 1500 2000
Montpellier Privas Mende
Millau Le˙Puy
Nimes Valence
Ales Mt Aigoual
Mt Gerbier Mt Mezenc
Mt Lozere Serre Cx Bauzon
La r´egion des C´evennes-Vivarais et ses alentours.
Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), villes (roses), montagnes (triangles), fleuves (lignes grises) et stations d’observations (blancs).
Objectifs :
´evaluer la hauteur de pluies horaires ou journali`eres pouvant ˆetre d´epass´ee une fois toutes lesNann´ees ;
variable d’int´erˆet→hauteur de pluies, covariable ([bi, tri] dimensionnelle)→ position g´eographique.
Source: Donn´ees fournies par le Laboratoire des Transferts en Hydrologie et Environnement (LTHE) de Grenoble.
11 / 44
Probl´ematique : en pr´esence de covariable
Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}
du couple (X,Y).
Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).
Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,
quandαn→0lorsquen→ ∞.
Evaluer´ les petites probabilit´es conditionnellesd´efinies par
αn
def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.
Probl´ematique : en pr´esence de covariable
Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}
du couple (X,Y).
Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).
Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,
quandαn→0lorsquen→ ∞.
Evaluer´ les petites probabilit´es conditionnellesd´efinies par
αn
def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.
Difficult´es
P(Y >yn|X =x) : inconnue, difficile `a estimer quandyn→ ∞.
q(αn|x) est une fonction dex.
12 / 44
Plan : 3 - Estimation des courbes de niveaux extrˆemes
1 Introduction
2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation
Hypoth`eses et r´esultats asymptotiques
Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
Mod`ele d’´etude
Soit{(Xi,Yi), i= 1, . . . ,n}un ´echantillon d’observations ind´ependantes du couple (X,Y)∈Rp×R.
Estimer∀x∈Rp et∀αn→0, lescourbes de niveaux extrˆemesd´efinies comme les graphes de fonctionsx ∈Rp7→q(αn|x)∈Rv´erifiant :
F¯(q(αn|x)|x)def=P(Y >q(αn|x)|X =x) =αn.
On suppose que la loi conditionnelle deY|X =x appartient audomaine d’attraction de Fr´echet,i.e.
F¯(y|x) =y−1/γ(x)ℓ(y|x),
γ(.) une fonction inconnue et positive de la covariablexappel´ee l’indice de queue conditionnel,
ℓ(.|x) une fonction `avariations lentes(`axfix´e) `a l’infini,i.e.∀λ >0,
y→∞lim ℓ(λy|x)
ℓ(y|x) = 1.
14 / 44
M´ethode d’estimation et d´efinition des estimateurs
Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.
ˆ
qn(αn|x)def= ˆF¯n←(αn|x) = infn
t, Fˆ¯n(t|x)≤αn
o.
N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).
M´ethode d’estimation et d´efinition des estimateurs
Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.
ˆ
qn(αn|x)def= ˆF¯n←(αn|x) = infn
t, Fˆ¯n(t|x)≤αn
o.
N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).
Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi
sont distants au plus dehn>0 du pointx,
0.0 0.2 0.4 0.6 0.8 1.0
024681012
On se place au pointX=x
0.0 0.2 0.4 0.6 0.8 1.0
024681012
On fixe le param`etrehn>0
0.0 0.2 0.4 0.6 0.8 1.0
024681012
On retient les Xi,Yidans laB(x,hn) 15 / 44
M´ethode d’estimation et d´efinition des estimateurs
Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.
ˆ
qn(αn|x)def= ˆF¯n←(αn|x) = infn
t, Fˆ¯n(t|x)≤αn
o.
N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).
Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi
sont distants au plus dehn>0 du pointx,
Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,
M´ethode d’estimation et d´efinition des estimateurs
Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.
ˆ
qn(αn|x)def= ˆF¯n←(αn|x) = infn
t, Fˆ¯n(t|x)≤αn
o.
N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).
Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi
sont distants au plus dehn>0 du pointx,
Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,
Estimer ¯F(.|x) par une moyenne pond´er´ee,i.e.
ˆ¯
Fn(yn|x) =
n
X
i=1
K
x−Xi
hn
1{Yi>yn}
, n X
i=1
K
x−Xi
hn
, [Collomb, 1980]
1{.}est la fonction indicatrice.
Kest une fonction positive, born´ee, int´egrable et `a support compactS⊆Rp. hnest une suite non al´eatoire telle quehn→0 quandn→ ∞.
15 / 44
Plan : 3 - Estimation des courbes de niveaux extrˆemes
1 Introduction
2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation
Hypoth`eses et r´esultats asymptotiques
Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
Hypoth`eses de r´egularit´e
Notations: soitg la densit´e deX, on d´esigne pard(x,x′) la distance entre deux points (x,x′)∈Rp×Rp.
Conditions de Lipschitz: il existe des constantesy0>1,cγ>0,cℓ>0 et cg >0 telles que
1 γ(x)− 1
γ(x′)
≤ cγd(x,x′),
sup
y≥y0
logℓ(y|x)
logy −logℓ(y|x′) logy
≤ cℓd(x,x′), g(x)−g(x′)
≤ cgd(x,x′).
17 / 44
Normalit´e asymptotique de ¯ F (y
n|x)
Th´eor`eme Si de plus,
yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,
alors, pour toutx ∈Rp tel queg(x)>0, (
q
nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)
F¯(ajyn|x) −1
!)
{j=1,...,J}
→ NL
0RJ,kKk22
g(x)C(x)
,
o`uCj,j′(x) =a1/γ(x)j∧j′ pour (j,j′)∈ {1, . . . ,J}2.
Normalit´e asymptotique de ¯ F (y
n|x)
Th´eor`eme Si de plus,
yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,
alors, pour toutx ∈Rp tel queg(x)>0, (
q
nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)
F¯(ajyn|x) −1
!)
{j=1,...,J}
→ NL
0RJ,kKk22
g(x)C(x)
,
o`uCj,j′(x) =a1/γ(x)j∧j′ pour (j,j′)∈ {1, . . . ,J}2.
Remarques sur la variance asymptotique Inversement proportionnelle `anhpnF¯(yn|x).
Terme additionnel1/F¯(yn|x)→ ∞par rapport au casyn=y born´ee o`u [Berlinet et al., 2001, Th´eor`eme 6.3] trouvent F¯(y|x)(1−F¯(y|x))
nhpn
kKk22 g(x).
18 / 44
Interpr´etation de la condition nh
pnF ¯ (y
n|x) → ∞
CNS pour qu’il y ait presque sˆurement au moins un point dans la r´egion B(x,hn)×[yn,+∞[∈Rp+1.
Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhpn→ ∞.
Illustration g´eom´etrique denhp
nF¯(yn|x)→ ∞, avecp= 1
yn
Interpr´etation de la condition nh
p+2nF ¯
n(y
n|x) log
2(y
n) → 0
Condition pour que le carr´e du biais asymptotique, de l’ordre de (hnlogyn)2,
soit n´egligeable devant la variance asymptotique, de l’ordre de 1
nhpnF¯(yn|x).
Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhp+2n →0.
20 / 44
Hypoth`ese sur la fonction ` a variations lentes
Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]
ℓ(y|x) =c(y|x) exp Zy
1
ε(u|x) u du
, avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).
Hypoth`ese sur la fonction ` a variations lentes
Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]
ℓ(y|x) =c(y|x) exp Zy
1
ε(u|x) u du
,
avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).
Cons´equence:∀x ∈Rp, la fonction auxiliaireε(y|x) est d´efinie par
ε(y|x) =yℓ′(y|x) ℓ(y|x).
21 / 44
Normalit´e asymptotique de ˆ q
n(α
n|x)
Th´eor`eme Si de plus,
αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2(αn)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.
Alors, pour tout x∈Rp tel queg(x)>0,
pnhpnαn
qˆn(τjαn|x) q(τjαn|x) −1
{j=1,...,J}
→ NL
0RJ, γ2(x)kKk22 g(x)Σ
, o`uΣj,j′ = 1/τj∧j′ pour (j,j′)∈ {1, . . . ,J}2.
Normalit´e asymptotique de ˆ q
n(α
n|x)
Th´eor`eme Si de plus,
αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2(αn)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.
Alors, pour tout x∈Rp tel queg(x)>0,
pnhpnαn
qˆn(τjαn|x) q(τjαn|x) −1
{j=1,...,J}
→ NL
0RJ, γ2(x)kKk22 g(x)Σ
, o`uΣj,j′ = 1/τj∧j′ pour (j,j′)∈ {1, . . . ,J}2.
Remarques sur la variance asymptotique
Inversement proportionnelle `anhpnαn et proportionnelle `aγ2(x).
Terme additionnel1/αn→ ∞par rapport au casαn=α∈]0,1[ fix´e o`u [Berlinet et al., 2001, Th´eor`eme 6.4] trouvent α(1−α)nhp
n kKk22
g(x) 1 f2(q(α|x)|x).
22 / 44
Normalit´e asymptotique de ˆ q
n(α
n|x)
Th´eor`eme Si de plus,
αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2(αn)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.
Alors, pour tout x∈Rp tel queg(x)>0,
pnhpnαn
qˆn(τjαn|x) q(τjαn|x) −1
{j=1,...,J}
→ NL
0RJ, γ2(x)kKk22 g(x)Σ
, o`uΣj,j′ = 1/τj∧j′ pour (j,j′)∈ {1, . . . ,J}2.
Remarques sur l’ordre des quantiles extrˆemes
nhpα → ∞etnhp+2α log2(α )→0impliquentα >logp(n) .
Plan : 3 - Estimation des courbes de niveaux extrˆemes
1 Introduction
2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation
Hypoth`eses et r´esultats asymptotiques
Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
23 / 44
Application ` a l’estimation de l’indice de queue conditionnel
Soit(βn)n≥1une suite positive telle queβn→0.
1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.
ˆ
γPn(x) = 1 log 2log
qˆn(βn|x)−qˆn(2βn|x) ˆ
qn(2βn|x)−qˆn(4βn|x)
.
Application ` a l’estimation de l’indice de queue conditionnel
Soit(βn)n≥1une suite positive telle queβn→0.
1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.
ˆ
γPn(x) = 1 log 2log
qˆn(βn|x)−qˆn(2βn|x) ˆ
qn(2βn|x)−qˆn(4βn|x)
.
2 Estimateur `a noyau de type Hill: adaptation de l’estimateur de [Hill, 1975]
au cas conditionnel.
ˆ γnH(x) =
J
X
j=1
[log ˆqn(τjβn|x)−log ˆqn(τ1βn|x)]
, J X
j=1
log (τ1/τj),
avecJ>1 et (τj)j≥1est une suite de poids strictement positive et d´ecroissante.
24 / 44
Hypoth`eses sur la fonction ` a variations lentes
Rappel: repr´esentation de Karamata quandℓ(.|x) est normalis´ee
ℓ(y|x) =c(x) exp Z y
1
ε(u|x) u du
.
Condition du second ordre: on suppose que|ε(.|x)|est d´ecroissante `a l’infini.
La fonctionε(y|x) repr´esentele terme de biais. Il contrˆole la vitesse de convergence des estimateurs en th´eorie des valeurs extrˆemes.
Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel
Corollaire
Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2(βn)→0et
nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,
pnhpnβn
γˆnP(x)−γ(x) L
→ N
0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2
kKk22
g(x)
.
26 / 44
Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel
Corollaire
Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2(βn)→0et
nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,
pnhpnβn
γˆnP(x)−γ(x) L
→ N
0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2
kKk22
g(x)
.
Corollaire
Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2(βn)→0et
nhpnβnε2(q(τ1βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,
pnhpnβn
ˆ
γHn(x)−γ(x) L
→ N
0, γ2(x)kKk22
g(x)VJ
, o`u
Deux exemples de suites de poids
La suite de poids harmonique: siτjHa= 1/j alors
VJHa=J(J−1)(2J−1)/(6 log2(J!)) est minimum pourJoptHa= 9et V9Ha≃1.245.
0 10 20 30 40
1.21.41.61.82.02.22.4
27 / 44
Deux exemples de suites de poids
La suite de poids harmonique: siτjHa= 1/j alorsVJ est minimum pour JoptHa= 9etV9Ha≃1.245.
La suite g´eom´etrique de la balle rebondissante:τjBR=b2j o`u0<b<1. Si b= 8/9 alorsVJ est minimum pourJoptBR = 11 etVJBRopt ≃1.141.
1.61.82.02.22.4
Plan : 3 - Estimation des courbes de niveaux extrˆemes
1 Introduction
2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation
Hypoth`eses et r´esultats asymptotiques
Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives
28 / 44
Application ` a l’estimation des quantiles conditionnels tr`es extrˆemes
Estimateur `a noyau de type Weissman: adaptation de l’estimateur de [Weissman, 1978] au cas conditionnel.
ˆ
qWn (αn|x) = ˆqn(βn|x)(αn/βn)−ˆγn(x),
avec ˆ
qn(βn|x) l’estimateur `a noyau pr´ec´edent, ˆ
γn(x) est un estimateur de l’indice de queue conditionnel, (αn/βn)−ˆγn(x)permet d’extrapoler.
Normalit´e asymptotique de l’estimateur ` a noyau de Weissman
Th´eor`eme Si de plus
βn→0tqnhpnβn→ ∞etnhp+2n βnlog2(βn)→0.
αn/βn→0.
pnhnpβn(ˆγn(x)−γ(x))→ NL 0,v2(x)
avecv(x)>0.
Alors pour toutx∈Rp tel queg(x)>0, pnhpnβn
log (βn/αn)
qˆWn (αn|x) q(αn|x) −1
L
→ N
0,v2(x) .
Au del`a du Th´eor`eme
La loi limite de ˆqnW(.|x) peut d´ependre du comportement de ˆqn(.|x).
30 / 44
Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
1 Introduction
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques
Estimation des niveaux de retour de pluies dans les C´evennes
4 Conclusions et perspectives
Exp´eriences num´eriques
On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.
F¯(y|x) = 1−exp
−y−1/γ(x) , avecγ(x) = 1
2 1
10+ sin (πx) 11 10−1
2exp
−64 (x−1/2)2 .
0.0 0.2 0.4 0.6 0.8 1.0
0.10.20.30.40.5
x
γ(x)
32 / 44
Exp´eriences num´eriques
On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.
F¯(y|x) = 1−exp
−y−1/γ(x) , avecγ(x) = 1
2 1
10+ sin (πx) 11 10−1
2exp
−64 (x−1/2)2 .
But: estimer le quantile extrˆeme conditionnel
q(αn|x) = (−log(1−αn))−γ(x)d’ordreαn∈ {5 log(n)/n,1/2n}.
On utilise unnoyau bi-quadratique
K(x) =15 16
1−x22
1{|x|≤1}.
Exp´eriences num´eriques : l’estimateur ˆ q
n(α
n|x)
Choix du param`etre de lissage
Validation crois´ee:
ˆhcv= arg min
hn∈H n
X
i=1 n
X
j=1
n
1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2
, [Yao, 1999]
ˆ¯
Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(Xℓ,Yℓ),1≤ℓ≤n, ℓ6=i}.
33 / 44
Exp´eriences num´eriques : l’estimateur ˆ q
n(α
n|x)
Choix du param`etre de lissage
Validation crois´ee:
ˆhcv= arg min
hn∈H n
X
i=1 n
X
j=1
n
1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2
, [Yao, 1999]
ˆ¯
Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(Xℓ,Yℓ),1≤ℓ≤n, ℓ6=i}.
Strat´egie Oracle:
hˆoracle= arg min
hn∈HD(ˆqn(αn|.),q(αn|.)), avec
D(u,v) = ( L
X(u(tℓ)−v(tℓ))2 )1/2
.
Exp´eriences num´eriques : l’estimateur ˆ q
n(α
n|x).
Oracle : transparent – Validation crois´ee : gris
Histogramme des erreurs calcul´ees surN= 100 r´eplications.
0 2 4 6 8 10 12 14
0.00.10.20.30.4
34 / 44
Exp´eriences num´eriques : l’estimateur ˆ q
Wn(α
n|x)
Choix des param`etreshnetβn
Dans la suite de ces exp´eriences,
ˆ
qnW(αn|x) = ˆqn(βn|x) (αn/βn)−ˆγHn(x).
Approche pr´econis´ee:
(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,
(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.
βˆ1,2= arg min
βn∈]0,1]D
ˆ
qWn,1(αn|.),qˆWn,2(αn|.) ,
qˆn,1W(αn|.) construit avecτjHa= 1/jo`uJoptHa= 9.
ˆ
qn,2W(αn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.
Exp´eriences num´eriques : l’estimateur ˆ q
Wn(α
n|x)
Choix des param`etreshnetβn
Dans la suite de ces exp´eriences,
ˆ
qnW(αn|x) = ˆqn(βn|x) (αn/βn)−ˆγHn(x).
Approche pr´econis´ee:
(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,
(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.
βˆ1,2= arg min
βn∈]0,1]D
ˆ
qWn,1(αn|.),qˆWn,2(αn|.) ,
qˆn,1W(αn|.) construit avecτjHa= 1/jo`uJoptHa= 9.
ˆ
qn,2W(αn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.
Strat´egie Oracle: hˆi,oracle,βˆi,oracle
= arg min
hn∈H,βn∈]0,1]D ˆ
qWn,i(αn|.),q(αn|.) , aveci = 1,2. Dans la suitei = 1.
35 / 44
Exp´eriences num´eriques : estimation du quantile d’ordre α
n= 5 log(n)/n.
— ˆqn(αn|.): validation crois´ee— ˆqn(αn|.) : oracle— ˆqWn,1(αn|.) : oracle
Estimateurs m´edians
0123
Exp´eriences num´eriques : estimation du quantile d’ordre α
n= 1/2n.
— ˆqn,1W(αn|.): validation crois´ee + similarit´e— ˆqWn,1(αn|.): oracle
Estimateurs m´edians
0.0 0.2 0.4 0.6 0.8 1.0
−101234
37 / 44
Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
1 Introduction
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques
Estimation des niveaux de retour de pluies dans les C´evennes
4 Conclusions et perspectives
Estimation des niveaux retour de pluies (en mm) dans les C´evennes
Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.
La r´egion des C´evennes-Vivarais et ses alentours
650 700 750 800 850
1850190019502000
500 1000 1500 2000
Montpellier Privas Mende
Millau Le˙Puy
Nimes Valence
Ales Mt Aigoual
Mt Gerbier Mt Mezenc
Mt Lozere Serre Cx Bauzon
Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).
39 / 44
Estimation des niveaux retour de pluies (en mm) dans les C´evennes
Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.
La r´egion des C´evennes-Vivarais et ses alentours
190019502000
1000 1500 2000 Privas
Mende
Millau Le˙Puy
Nimes Valence
Ales Mt Aigoual
Mt Gerbier Mt Mezenc
Mt Lozere Serre Cx Bauzon
Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).
Pourquoi ?
Construire des digues d’une hauteur appropri´ee,
op´erations de nettoyage des fleuves.
Estimation des niveaux retour de pluies (en mm) dans les C´evennes
Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.
La r´egion des C´evennes-Vivarais et ses alentours
650 700 750 800 850
1850190019502000
500 1000 1500 2000
Montpellier Privas Mende
Millau Le˙Puy
Nimes Valence
Ales Mt Aigoual
Mt Gerbier Mt Mezenc
Mt Lozere Serre Cx Bauzon
Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).
Pourquoi ?
Construire des digues d’une hauteur appropri´ee,
op´erations de nettoyage des fleuves.
n= 821925 observations
Noyau uniformeK(x) =1{|x|≤1}.
39 / 44
Estimation des niveaux retour de pluies (en mm) dans les C´evennes
Niveaux de retour journalier (mm) sur 100 ans en fonction de la longitude et de la latitude
1850190019502000
100 150 200 250 300 350
Montpellier Privas Mende
Millau
Le˙Puy
Nimes Valence
Ales Mt Aigoual
Mt Gerbier Mt Mezenc
Mt Lozere Serre Cx Bauzon
Voir [Molini´e et al., 2008] pour une comparaison.
Plan : 5 - Conclusions et perspectives
1 Introduction
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives Conclusions
Perspectives
41 / 44
Conclusions
Trois contributions
Lorsque la loi conditionnelle deY en un pointx de la covariableX appartient au domaine d’attraction de Fr´echet.
(1/3) X ∈Rpal´eatoire, voir la pr´esentation.
Contribution: Kernel estimators of extreme level curves.TEST. `A paraˆıtre. En collaboration avecA. Daouia, L. Gardes et S. Girard.
(2/3) X d´eterministe et de dimension non-n´ecessairement finie.
Contribution: Functional nonparametric estimation of conditional extreme quantiles.Journal of Multivariate Analysis, 101, 419–433, 2010.
En collaboration avecLaurent Gardes et St´ephane Girard.
Lorsque la loi deY appartient au domaine d’attraction de Fr´echet.
Plan : 5 - Conclusions et perspectives
1 Introduction
2 Estimation des courbes de niveaux extrˆemes
3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles
4 Conclusions et perspectives Conclusions
Perspectives
43 / 44
Perspectives
A court terme`
1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.
2 Etendre ces r´esultats aux autres domaines d’attractions.´
3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.
4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.
Perspectives
A court terme`
1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.
2 Etendre ces r´esultats aux autres domaines d’attractions.´
3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.
4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.
A moyen terme`
1 Affiner les crit`eres de s´election des param`etresβn ethn.
A long terme`
1 Convergence en processus des estimateurs de l’indice de queue et des quantiles extrˆemes conditionnels.
44 / 44
Annexe
Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.
— ˆqn(αn|.): validation crois´ee— ˆqn(αn|.) : oracle— ˆqWn,1(αn|.) : oracle
Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D
0123
Annexe
Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.
— ˆqn(αn|.): validation crois´ee— ˆqn(αn|.) : oracle— ˆqWn,1(αn|.) : oracle
Estimateurs correspondants au 1er d´ecile de l’erreurD.
0.0 0.2 0.4 0.6 0.8 1.0
−10123
Annexe
Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.
— ˆqn,1W(αn|.): validation crois´ee + similarit´e— ˆqWn,1(αn|.): oracle
Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D.
1234
Annexe
Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.
— ˆqn,1W(αn|.): validation crois´ee + similarit´e— ˆqWn,1(αn|.): oracle
Estimateurs correspondants au 1er d´ecile de l’erreurD
0.0 0.2 0.4 0.6 0.8 1.0
−101234
Bibliographie I
Berlinet, A., Gannoun, A., and Matzner-Lober, E. (2001).
Asymptotic normality of convergent estimates of conditional quantiles.
Statistics, 18 :1400–1415.
Bingham, N. H., Goldie, C. M., and Teugels, J. L. (1987).
Regular Variation, volume 27.
Encyclopedia of Mathematics and its Applications, Cambridge University Press.
Collomb, G. (1980).
Estimation non param´etrique de probabilit´es conditionnelles.
Comptes Rendus de l’Acad´emie des Sciences, 291 :427–430.
Fisher, R. and Tippet, L. (1928).
Limiting forms of the frequency distribution of the largest or smallest member of a sample.
Proceedings of the Cambridge Philosophical Society, 24 :180–190.
Bibliographie II
Hill, B. (1975).
A simple general approach to inference about the tail of a distribution.
Annals of Statistics, 3(5) :1163–1174.
Molini´e, G., Yates, E., Ceresetti, D., Anquetin, S., Boudevillain, B., Creutin, J., and Bois, P. (2008).
Rainfall regimes in a mountainous mediterranean region : Statistical analysis at short time steps.
Article soumis.
Pickands, J. (1975).
Statistical inference using extreme order statistics.
Annals of Statistics, 3(1) :119–131.
Weissman, I. (1978).
Estimation of parameters and large quantiles based on thek-largest observations.
Journal of the American Statistical Association, 73(364) :812–815.
Bibliographie III
Yao, Q. (1999).
Conditional predictive regions for stochastic processes.
Technical report, University of Kent at Canterbury.