• Aucun résultat trouvé

ESTIMATION NON-PARAM´ETRIQUE DES QUANTILES EXTRˆEMES CONDITIONNELS

N/A
N/A
Protected

Academic year: 2022

Partager "ESTIMATION NON-PARAM´ETRIQUE DES QUANTILES EXTRˆEMES CONDITIONNELS"

Copied!
68
0
0

Texte intégral

(1)

ESTIMATION NON-PARAM´ ETRIQUE DES QUANTILES EXTRˆ EMES CONDITIONNELS

Th`ese pr´esent´ee par

AlexandreLEKINA

ealis´ee sous la direction de St´ephaneGIRARD&LaurentGARDES Soutenue publiquement le mercredi 13 octobre 2010.

(2)

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives Conclusions

(3)

Plan : 2 - Introduction

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

3 / 44

(4)

Paris Match(Djakarta, mars 2009) : La rupture d’un barrage dans la banlieue de la capitale indon´esienne dans la nuit de jeudi `a vendredi a entrain´e l’inondation d’un quartier r´esidentiel

(5)

Hypoth`ese

Les pr´ecipitations not´eesY1, . . . ,Yn sont des r´ealisations de variables al´eatoires ind´ependantes et de mˆeme loi.

Trouver la hauteur des digues dont la probabilit´e d’ˆetre d´epass´ee par les inondations est proche de z´ero ?

0 50 100 150 200 250 300

050100150

Loi empirique des pr´ecipitations journali`eres (mm) `a Montpellier entre 19522000.

5 / 44

(6)

Probl´ematique : en l’absence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{Yi, i= 1, . . . ,n}.

Estimerles quantit´es extrˆemesqαn associ´ees `a une v.aY ∈Rd´efinies par P(Y >qαn) =αn,

quandαn→0lorsquen→ ∞.

Calculerla probabilit´eαn d’observer une quantit´e extrˆemeyn d´efinie par

αn

def= P(Y >yn), quandyn→ ∞lorsquen→ ∞.

Vocabulaire

Y est appel´ee la variable d’int´erˆet,

(7)

R´esultat principal de la th´eorie des valeurs extrˆemes

Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943]

Sous certaines conditions de r´egularit´e surla fonction de r´epartitionF, il existe un param`etre r´eelγet deux suites(an)n≥1>0et(bn)n≥1∈Rtels que pour touty ∈R,

n→∞lim P

max(Y1, . . . ,Yn)−bn

an

≤y

=Jγ(y), avec

Jγ(y) =

( exph

−(1 +γy)−1/γi

siγ6= 0

exp [−exp(−y)] siγ= 0 et pour touty tel que 1 +γy>0.

etJγla fonction de r´epartition de laloi des valeurs extrˆemes g´en´eralis´ee.

Vocabulaire et notation

γ est appel´e l’indice de queueou l’indice des valeurs extrˆemes.

7 / 44

(8)

3 domaines d’attraction

SiF v´erifie le Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943], alors on dit queF appartient audomaine d’attractiondeJγ.

Fr´echet(γ >0) Weibull(γ <0) Gumbel(γ= 0)

Cauchy Uniforme Normale

Pareto Beta Exponentielle

Student Weibull Log-normale

Fr´echet Gamma

Burr Weibullm

Benktander-type I et II

(9)

Plan : 2 - Introduction

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

9 / 44

(10)

Exemple 1 : mod´elisation de donn´ees de fiabilit´e de r´eacteurs nucl´eaires

−200 −150 −100 −50 0

406080100120140160

La t´enacit´e de la cuve (verticalement) et la temp´erature (horizontalement).

Objectifs :

´evaluer la probabilit´e (tr`es faible) d’apparition de micro fissures dans ses cuves,

´evaluer des quantiles de la t´enacit´e en fonction de la temp´erature.

(11)

Exemple 2 : Carte des niveaux de retour des pluies dans une r´egion

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

La r´egion des C´evennes-Vivarais et ses alentours.

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), villes (roses), montagnes (triangles), fleuves (lignes grises) et stations d’observations (blancs).

Objectifs :

´evaluer la hauteur de pluies horaires ou journali`eres pouvant ˆetre d´epass´ee une fois toutes lesNann´ees ;

variable d’int´erˆet→hauteur de pluies, covariable ([bi, tri] dimensionnelle)→ position g´eographique.

Source: Donn´ees fournies par le Laboratoire des Transferts en Hydrologie et Environnement (LTHE) de Grenoble.

11 / 44

(12)

Probl´ematique : en pr´esence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}

du couple (X,Y).

Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).

Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,

quandαn→0lorsquen→ ∞.

Evaluer´ les petites probabilit´es conditionnellesd´efinies par

αn

def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.

(13)

Probl´ematique : en pr´esence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}

du couple (X,Y).

Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).

Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,

quandαn→0lorsquen→ ∞.

Evaluer´ les petites probabilit´es conditionnellesd´efinies par

αn

def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.

Difficult´es

P(Y >yn|X =x) : inconnue, difficile `a estimer quandyn→ ∞.

q(αn|x) est une fonction dex.

12 / 44

(14)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

(15)

Mod`ele d’´etude

Soit{(Xi,Yi), i= 1, . . . ,n}un ´echantillon d’observations ind´ependantes du couple (X,Y)∈Rp×R.

Estimer∀x∈Rp et∀αn→0, lescourbes de niveaux extrˆemesd´efinies comme les graphes de fonctionsx ∈Rp7→q(αn|x)∈Rv´erifiant :

F¯(q(αn|x)|x)def=P(Y >q(αn|x)|X =x) =αn.

On suppose que la loi conditionnelle deY|X =x appartient audomaine d’attraction de Fr´echet,i.e.

F¯(y|x) =y−1/γ(x)ℓ(y|x),

γ(.) une fonction inconnue et positive de la covariablexappel´ee l’indice de queue conditionnel,

ℓ(.|x) une fonction `avariations lentes(`axfix´e) `a l’infini,i.e.λ >0,

y→∞lim ℓ(λy|x)

ℓ(y|x) = 1.

14 / 44

(16)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

(17)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On se place au pointX=x

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On fixe le param`etrehn>0

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On retient les Xi,Yidans laB(x,hn) 15 / 44

(18)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,

(19)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,

Estimer ¯F(.|x) par une moyenne pond´er´ee,i.e.

ˆ¯

Fn(yn|x) =

n

X

i=1

K

x−Xi

hn

1{Yi>yn}

, n X

i=1

K

x−Xi

hn

, [Collomb, 1980]

1{.}est la fonction indicatrice.

Kest une fonction positive, born´ee, int´egrable et `a support compactSRp. hnest une suite non al´eatoire telle quehn0 quandn→ ∞.

15 / 44

(20)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

(21)

Hypoth`eses de r´egularit´e

Notations: soitg la densit´e deX, on d´esigne pard(x,x) la distance entre deux points (x,x)∈Rp×Rp.

Conditions de Lipschitz: il existe des constantesy0>1,cγ>0,c>0 et cg >0 telles que

1 γ(x)− 1

γ(x)

≤ cγd(x,x),

sup

y≥y0

logℓ(y|x)

logy −logℓ(y|x) logy

≤ cd(x,x), g(x)−g(x)

≤ cgd(x,x).

17 / 44

(22)

Normalit´e asymptotique de ¯ F (y

n

|x)

Th´eor`eme Si de plus,

yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,

alors, pour toutx ∈Rp tel queg(x)>0, (

q

nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)

F¯(ajyn|x) −1

!)

{j=1,...,J}

→ NL

0RJ,kKk22

g(x)C(x)

,

o`uCj,j(x) =a1/γ(x)j∧j pour (j,j)∈ {1, . . . ,J}2.

(23)

Normalit´e asymptotique de ¯ F (y

n

|x)

Th´eor`eme Si de plus,

yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,

alors, pour toutx ∈Rp tel queg(x)>0, (

q

nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)

F¯(ajyn|x) −1

!)

{j=1,...,J}

→ NL

0RJ,kKk22

g(x)C(x)

,

o`uCj,j(x) =a1/γ(x)j∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur la variance asymptotique Inversement proportionnelle `anhpnF¯(yn|x).

Terme additionnel1/F¯(yn|x)→ ∞par rapport au casyn=y born´ee o`u [Berlinet et al., 2001, Th´eor`eme 6.3] trouvent F¯(y|x)(1−F¯(y|x))

nhpn

kKk22 g(x).

18 / 44

(24)

Interpr´etation de la condition nh

pn

F ¯ (y

n

|x) → ∞

CNS pour qu’il y ait presque sˆurement au moins un point dans la r´egion B(x,hn)×[yn,+∞[∈Rp+1.

Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhpn→ ∞.

Illustration g´eom´etrique denhp

nF¯(yn|x)→ ∞, avecp= 1

yn

(25)

Interpr´etation de la condition nh

p+2n

F ¯

n

(y

n

|x) log

2

(y

n

) → 0

Condition pour que le carr´e du biais asymptotique, de l’ordre de (hnlogyn)2,

soit n´egligeable devant la variance asymptotique, de l’ordre de 1

nhpnF¯(yn|x).

Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhp+2n →0.

20 / 44

(26)

Hypoth`ese sur la fonction ` a variations lentes

Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]

ℓ(y|x) =c(y|x) exp Zy

1

ε(u|x) u du

, avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).

(27)

Hypoth`ese sur la fonction ` a variations lentes

Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]

ℓ(y|x) =c(y|x) exp Zy

1

ε(u|x) u du

,

avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).

Cons´equence:∀x ∈Rp, la fonction auxiliaireε(y|x) est d´efinie par

ε(y|x) =yℓ(y|x) ℓ(y|x).

21 / 44

(28)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

(29)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur la variance asymptotique

Inversement proportionnelle `anhpnαn et proportionnelle `aγ2(x).

Terme additionnel1/αn→ ∞par rapport au casαn=α∈]0,1[ fix´e o`u [Berlinet et al., 2001, Th´eor`eme 6.4] trouvent α(1−α)nhp

n kKk22

g(x) 1 f2(q(α|x)|x).

22 / 44

(30)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur l’ordre des quantiles extrˆemes

nhpα → ∞etnhp+2α log2(α )→0impliquentα >logp(n) .

(31)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

23 / 44

(32)

Application ` a l’estimation de l’indice de queue conditionnel

Soit(βn)n≥1une suite positive telle queβn→0.

1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.

ˆ

γPn(x) = 1 log 2log

nn|x)−qˆn(2βn|x) ˆ

qn(2βn|x)−qˆn(4βn|x)

.

(33)

Application ` a l’estimation de l’indice de queue conditionnel

Soit(βn)n≥1une suite positive telle queβn→0.

1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.

ˆ

γPn(x) = 1 log 2log

nn|x)−qˆn(2βn|x) ˆ

qn(2βn|x)−qˆn(4βn|x)

.

2 Estimateur `a noyau de type Hill: adaptation de l’estimateur de [Hill, 1975]

au cas conditionnel.

ˆ γnH(x) =

J

X

j=1

[log ˆqnjβn|x)−log ˆqn1βn|x)]

, J X

j=1

log (τ1j),

avecJ>1 et (τj)j≥1est une suite de poids strictement positive et d´ecroissante.

24 / 44

(34)

Hypoth`eses sur la fonction ` a variations lentes

Rappel: repr´esentation de Karamata quandℓ(.|x) est normalis´ee

ℓ(y|x) =c(x) exp Z y

1

ε(u|x) u du

.

Condition du second ordre: on suppose que|ε(.|x)|est d´ecroissante `a l’infini.

La fonctionε(y|x) repr´esentele terme de biais. Il contrˆole la vitesse de convergence des estimateurs en th´eorie des valeurs extrˆemes.

(35)

Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

γˆnP(x)−γ(x) L

→ N

0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2

kKk22

g(x)

.

26 / 44

(36)

Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

γˆnP(x)−γ(x) L

→ N

0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2

kKk22

g(x)

.

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(τ1βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

ˆ

γHn(x)−γ(x) L

→ N

0, γ2(x)kKk22

g(x)VJ

, o`u

(37)

Deux exemples de suites de poids

La suite de poids harmonique: siτjHa= 1/j alors

VJHa=J(J−1)(2J−1)/(6 log2(J!)) est minimum pourJoptHa= 9et V9Ha≃1.245.

0 10 20 30 40

1.21.41.61.82.02.22.4

27 / 44

(38)

Deux exemples de suites de poids

La suite de poids harmonique: siτjHa= 1/j alorsVJ est minimum pour JoptHa= 9etV9Ha≃1.245.

La suite g´eom´etrique de la balle rebondissante:τjBR=b2j o`u0<b<1. Si b= 8/9 alorsVJ est minimum pourJoptBR = 11 etVJBRopt ≃1.141.

1.61.82.02.22.4

(39)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

28 / 44

(40)

Application ` a l’estimation des quantiles conditionnels tr`es extrˆemes

Estimateur `a noyau de type Weissman: adaptation de l’estimateur de [Weissman, 1978] au cas conditionnel.

ˆ

qWnn|x) = ˆqnn|x)(αnn)−ˆγn(x),

avec ˆ

qnn|x) l’estimateur `a noyau pr´ec´edent, ˆ

γn(x) est un estimateur de l’indice de queue conditionnel, (αnn)−ˆγn(x)permet d’extrapoler.

(41)

Normalit´e asymptotique de l’estimateur ` a noyau de Weissman

Th´eor`eme Si de plus

βn→0tqnhpnβn→ ∞etnhp+2n βnlog2n)→0.

αnn→0.

pnhnpβn(ˆγn(x)−γ(x))→ NL 0,v2(x)

avecv(x)>0.

Alors pour toutx∈Rp tel queg(x)>0, pnhpnβn

log (βnn)

Wnn|x) q(αn|x) −1

L

→ N

0,v2(x) .

Au del`a du Th´eor`eme

La loi limite de ˆqnW(.|x) peut d´ependre du comportement de ˆqn(.|x).

30 / 44

(42)

Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives

(43)

Exp´eriences num´eriques

On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.

F¯(y|x) = 1−exp

−y−1/γ(x) , avecγ(x) = 1

2 1

10+ sin (πx) 11 10−1

2exp

−64 (x−1/2)2 .

0.0 0.2 0.4 0.6 0.8 1.0

0.10.20.30.40.5

x

γ(x)

32 / 44

(44)

Exp´eriences num´eriques

On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.

F¯(y|x) = 1−exp

−y−1/γ(x) , avecγ(x) = 1

2 1

10+ sin (πx) 11 10−1

2exp

−64 (x−1/2)2 .

But: estimer le quantile extrˆeme conditionnel

q(αn|x) = (−log(1−αn))−γ(x)d’ordreαn∈ {5 log(n)/n,1/2n}.

On utilise unnoyau bi-quadratique

K(x) =15 16

1−x22

1{|x|≤1}.

(45)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x)

Choix du param`etre de lissage

Validation crois´ee:

ˆhcv= arg min

hn∈H n

X

i=1 n

X

j=1

n

1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2

, [Yao, 1999]

ˆ¯

Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(X,Y),1n, ℓ6=i}.

33 / 44

(46)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x)

Choix du param`etre de lissage

Validation crois´ee:

ˆhcv= arg min

hn∈H n

X

i=1 n

X

j=1

n

1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2

, [Yao, 1999]

ˆ¯

Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(X,Y),1n, ℓ6=i}.

Strat´egie Oracle:

oracle= arg min

hn∈HD(ˆqnn|.),q(αn|.)), avec

D(u,v) = ( L

X(u(t)−v(t))2 )1/2

.

(47)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x).

Oracle : transparent – Validation crois´ee : gris

Histogramme des erreurs calcul´ees surN= 100 r´eplications.

0 2 4 6 8 10 12 14

0.00.10.20.30.4

34 / 44

(48)

Exp´eriences num´eriques : l’estimateur ˆ q

Wn

n

|x)

Choix des param`etreshnetβn

Dans la suite de ces exp´eriences,

ˆ

qnWn|x) = ˆqnn|x) (αnn)−ˆγHn(x).

Approche pr´econis´ee:

(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,

(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.

βˆ1,2= arg min

βn∈]0,1]D

ˆ

qWn,1n|.),qˆWn,2n|.) ,

qˆn,1Wn|.) construit avecτjHa= 1/jo`uJoptHa= 9.

ˆ

qn,2Wn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.

(49)

Exp´eriences num´eriques : l’estimateur ˆ q

Wn

n

|x)

Choix des param`etreshnetβn

Dans la suite de ces exp´eriences,

ˆ

qnWn|x) = ˆqnn|x) (αnn)−ˆγHn(x).

Approche pr´econis´ee:

(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,

(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.

βˆ1,2= arg min

βn∈]0,1]D

ˆ

qWn,1n|.),qˆWn,2n|.) ,

qˆn,1Wn|.) construit avecτjHa= 1/jo`uJoptHa= 9.

ˆ

qn,2Wn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.

Strat´egie Oracle: hˆi,oracle,βˆi,oracle

= arg min

hn∈H,βn∈]0,1]D ˆ

qWn,in|.),q(αn|.) , aveci = 1,2. Dans la suitei = 1.

35 / 44

(50)

Exp´eriences num´eriques : estimation du quantile d’ordre α

n

= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs m´edians

0123

(51)

Exp´eriences num´eriques : estimation du quantile d’ordre α

n

= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs m´edians

0.0 0.2 0.4 0.6 0.8 1.0

−101234

37 / 44

(52)

Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives

(53)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

39 / 44

(54)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

190019502000

1000 1500 2000 Privas

Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

Pourquoi ?

Construire des digues d’une hauteur appropri´ee,

op´erations de nettoyage des fleuves.

(55)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

Pourquoi ?

Construire des digues d’une hauteur appropri´ee,

op´erations de nettoyage des fleuves.

n= 821925 observations

Noyau uniformeK(x) =1{|x|≤1}.

39 / 44

(56)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Niveaux de retour journalier (mm) sur 100 ans en fonction de la longitude et de la latitude

1850190019502000

100 150 200 250 300 350

Montpellier Privas Mende

Millau

Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Voir [Molini´e et al., 2008] pour une comparaison.

(57)

Plan : 5 - Conclusions et perspectives

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives Conclusions

Perspectives

41 / 44

(58)

Conclusions

Trois contributions

Lorsque la loi conditionnelle deY en un pointx de la covariableX appartient au domaine d’attraction de Fr´echet.

(1/3) X ∈Rpal´eatoire, voir la pr´esentation.

Contribution: Kernel estimators of extreme level curves.TEST. `A paraˆıtre. En collaboration avecA. Daouia, L. Gardes et S. Girard.

(2/3) X d´eterministe et de dimension non-n´ecessairement finie.

Contribution: Functional nonparametric estimation of conditional extreme quantiles.Journal of Multivariate Analysis, 101, 419–433, 2010.

En collaboration avecLaurent Gardes et St´ephane Girard.

Lorsque la loi deY appartient au domaine d’attraction de Fr´echet.

(59)

Plan : 5 - Conclusions et perspectives

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives Conclusions

Perspectives

43 / 44

(60)

Perspectives

A court terme`

1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.

2 Etendre ces r´esultats aux autres domaines d’attractions.´

3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.

4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.

(61)

Perspectives

A court terme`

1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.

2 Etendre ces r´esultats aux autres domaines d’attractions.´

3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.

4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.

A moyen terme`

1 Affiner les crit`eres de s´election des param`etresβn ethn.

A long terme`

1 Convergence en processus des estimateurs de l’indice de queue et des quantiles extrˆemes conditionnels.

44 / 44

(62)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D

0123

(63)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs correspondants au 1er d´ecile de l’erreurD.

0.0 0.2 0.4 0.6 0.8 1.0

−10123

(64)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D.

1234

(65)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs correspondants au 1er d´ecile de l’erreurD

0.0 0.2 0.4 0.6 0.8 1.0

−101234

(66)

Bibliographie I

Berlinet, A., Gannoun, A., and Matzner-Lober, E. (2001).

Asymptotic normality of convergent estimates of conditional quantiles.

Statistics, 18 :1400–1415.

Bingham, N. H., Goldie, C. M., and Teugels, J. L. (1987).

Regular Variation, volume 27.

Encyclopedia of Mathematics and its Applications, Cambridge University Press.

Collomb, G. (1980).

Estimation non param´etrique de probabilit´es conditionnelles.

Comptes Rendus de l’Acad´emie des Sciences, 291 :427–430.

Fisher, R. and Tippet, L. (1928).

Limiting forms of the frequency distribution of the largest or smallest member of a sample.

Proceedings of the Cambridge Philosophical Society, 24 :180–190.

(67)

Bibliographie II

Hill, B. (1975).

A simple general approach to inference about the tail of a distribution.

Annals of Statistics, 3(5) :1163–1174.

Molini´e, G., Yates, E., Ceresetti, D., Anquetin, S., Boudevillain, B., Creutin, J., and Bois, P. (2008).

Rainfall regimes in a mountainous mediterranean region : Statistical analysis at short time steps.

Article soumis.

Pickands, J. (1975).

Statistical inference using extreme order statistics.

Annals of Statistics, 3(1) :119–131.

Weissman, I. (1978).

Estimation of parameters and large quantiles based on thek-largest observations.

Journal of the American Statistical Association, 73(364) :812–815.

(68)

Bibliographie III

Yao, Q. (1999).

Conditional predictive regions for stochastic processes.

Technical report, University of Kent at Canterbury.

Références

Documents relatifs

De tels mod` eles ` a censure ont ´ et´ e abondamment ´ etudi´ es dans la litt´ erature pour des variables al´ eatoires r´ eelles ou multi-dimensionnelles, et dans des

Pour ce faire, nous avons ´ etudi´ ee les courbes du MSE (erreur quadratique moyenne) en fonction de N ` a n fix´ e, erreur commise en estimant le quantile conditionnel ` a l’aide

Estimation de quantiles conditionnels basée sur la quantification optimale sous R Isabelle Charlier a,b,c ,Davy Paindaveine a,b and Jérôme Saracco c.. a Département de

Dans ce paragraphe nous pr´esentons deux fonctions n´ecessaires pour calculer un estimateur du quantile g´eom´etrique conditionnel.. La premi`ere fonction not´ee

abstract Cet article est une synthèse bibliographique des méthodes d’estimation de quantiles extrêmes pour les lois à queue de type Weibull. Ces lois ont une fonction de survie

Nous proposons dans le cas des distributions ` a queue lourde une m´ethode d’es- timation des quantiles extrˆemes en pr´esence d’une covariable.. La loi limite d’un tel

Des mod`eles de r´egression pour variables explicatives fonctionnelles ont ´et´e propos´es, notamment lorsque la r´eponse est un scalaire : le mod`ele lin´eaire est introduit dans

Deux probl`emes peuvent ˆetre trait´es tr`es facilement via cette nouvelle m´ethode : estimation de quantiles extrˆemes et estimation d’´ev´enements rares.. That mapping can be