• Aucun résultat trouvé

ESTIMATION NON-PARAM´ETRIQUE DES QUANTILES EXTRˆEMES CONDITIONNELS

N/A
N/A
Protected

Academic year: 2022

Partager "ESTIMATION NON-PARAM´ETRIQUE DES QUANTILES EXTRˆEMES CONDITIONNELS"

Copied!
68
0
0

Texte intégral

(1)

ESTIMATION NON-PARAM´ ETRIQUE DES QUANTILES EXTRˆ EMES CONDITIONNELS

Th`ese pr´esent´ee par

AlexandreLEKINA

ealis´ee sous la direction de St´ephaneGIRARD&LaurentGARDES Soutenue publiquement le mercredi 13 octobre 2010.

(2)

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives Conclusions

(3)

Plan : 2 - Introduction

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

3 / 44

(4)

Paris Match(Djakarta, mars 2009) : La rupture d’un barrage dans la banlieue de la capitale indon´esienne dans la nuit de jeudi `a vendredi a entrain´e l’inondation d’un quartier r´esidentiel

(5)

Hypoth`ese

Les pr´ecipitations not´eesY1, . . . ,Yn sont des r´ealisations de variables al´eatoires ind´ependantes et de mˆeme loi.

Trouver la hauteur des digues dont la probabilit´e d’ˆetre d´epass´ee par les inondations est proche de z´ero ?

0 50 100 150 200 250 300

050100150

Loi empirique des pr´ecipitations journali`eres (mm) `a Montpellier entre 19522000.

5 / 44

(6)

Probl´ematique : en l’absence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{Yi, i= 1, . . . ,n}.

Estimerles quantit´es extrˆemesqαn associ´ees `a une v.aY ∈Rd´efinies par P(Y >qαn) =αn,

quandαn→0lorsquen→ ∞.

Calculerla probabilit´eαn d’observer une quantit´e extrˆemeyn d´efinie par

αn

def= P(Y >yn), quandyn→ ∞lorsquen→ ∞.

Vocabulaire

Y est appel´ee la variable d’int´erˆet,

(7)

R´esultat principal de la th´eorie des valeurs extrˆemes

Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943]

Sous certaines conditions de r´egularit´e surla fonction de r´epartitionF, il existe un param`etre r´eelγet deux suites(an)n≥1>0et(bn)n≥1∈Rtels que pour touty ∈R,

n→∞lim P

max(Y1, . . . ,Yn)−bn

an

≤y

=Jγ(y), avec

Jγ(y) =

( exph

−(1 +γy)−1/γi

siγ6= 0

exp [−exp(−y)] siγ= 0 et pour touty tel que 1 +γy>0.

etJγla fonction de r´epartition de laloi des valeurs extrˆemes g´en´eralis´ee.

Vocabulaire et notation

γ est appel´e l’indice de queueou l’indice des valeurs extrˆemes.

7 / 44

(8)

3 domaines d’attraction

SiF v´erifie le Th´eor`eme [Fisher and Tippet, 1928,Gnedenko, 1943], alors on dit queF appartient audomaine d’attractiondeJγ.

Fr´echet(γ >0) Weibull(γ <0) Gumbel(γ= 0)

Cauchy Uniforme Normale

Pareto Beta Exponentielle

Student Weibull Log-normale

Fr´echet Gamma

Burr Weibullm

Benktander-type I et II

(9)

Plan : 2 - Introduction

1 Introduction

En l’absence de covariable En pr´esence de covariable

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

9 / 44

(10)

Exemple 1 : mod´elisation de donn´ees de fiabilit´e de r´eacteurs nucl´eaires

−200 −150 −100 −50 0

406080100120140160

La t´enacit´e de la cuve (verticalement) et la temp´erature (horizontalement).

Objectifs :

´evaluer la probabilit´e (tr`es faible) d’apparition de micro fissures dans ses cuves,

´evaluer des quantiles de la t´enacit´e en fonction de la temp´erature.

(11)

Exemple 2 : Carte des niveaux de retour des pluies dans une r´egion

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

La r´egion des C´evennes-Vivarais et ses alentours.

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), villes (roses), montagnes (triangles), fleuves (lignes grises) et stations d’observations (blancs).

Objectifs :

´evaluer la hauteur de pluies horaires ou journali`eres pouvant ˆetre d´epass´ee une fois toutes lesNann´ees ;

variable d’int´erˆet→hauteur de pluies, covariable ([bi, tri] dimensionnelle)→ position g´eographique.

Source: Donn´ees fournies par le Laboratoire des Transferts en Hydrologie et Environnement (LTHE) de Grenoble.

11 / 44

(12)

Probl´ematique : en pr´esence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}

du couple (X,Y).

Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).

Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,

quandαn→0lorsquen→ ∞.

Evaluer´ les petites probabilit´es conditionnellesd´efinies par

αn

def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.

(13)

Probl´ematique : en pr´esence de covariable

Partant d’un ´echantillon d’observations ind´ependantes{(Xi,Yi), i = 1, . . . ,n}

du couple (X,Y).

Y ∈Rest une variable d’int´erˆet associ´ee `a une covariableX (al´eatoire).

Estimer desquantiles extrˆemes conditionnelsq(αn|x) d´efinis par P(Y >q(αn|x)|X =x) =αn,

quandαn→0lorsquen→ ∞.

Evaluer´ les petites probabilit´es conditionnellesd´efinies par

αn

def=P(Y >yn|X =x), quandyn→ ∞lorsquen→ ∞.

Difficult´es

P(Y >yn|X =x) : inconnue, difficile `a estimer quandyn→ ∞.

q(αn|x) est une fonction dex.

12 / 44

(14)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

(15)

Mod`ele d’´etude

Soit{(Xi,Yi), i= 1, . . . ,n}un ´echantillon d’observations ind´ependantes du couple (X,Y)∈Rp×R.

Estimer∀x∈Rp et∀αn→0, lescourbes de niveaux extrˆemesd´efinies comme les graphes de fonctionsx ∈Rp7→q(αn|x)∈Rv´erifiant :

F¯(q(αn|x)|x)def=P(Y >q(αn|x)|X =x) =αn.

On suppose que la loi conditionnelle deY|X =x appartient audomaine d’attraction de Fr´echet,i.e.

F¯(y|x) =y−1/γ(x)ℓ(y|x),

γ(.) une fonction inconnue et positive de la covariablexappel´ee l’indice de queue conditionnel,

ℓ(.|x) une fonction `avariations lentes(`axfix´e) `a l’infini,i.e.λ >0,

y→∞lim ℓ(λy|x)

ℓ(y|x) = 1.

14 / 44

(16)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

(17)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On se place au pointX=x

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On fixe le param`etrehn>0

0.0 0.2 0.4 0.6 0.8 1.0

024681012

On retient les Xi,Yidans laB(x,hn) 15 / 44

(18)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,

(19)

M´ethode d’estimation et d´efinition des estimateurs

Estimerle quantile conditionnelen inversant un estimateur de ¯F(.|x),i.e.

ˆ

qnn|x)def= ˆF¯nn|x) = infn

t, Fˆ¯n(t|x)≤αn

o.

N´ecessite d’estimer la probabilit´eF(y¯ n|x)lorsqueyn→ ∞(qdn→ ∞).

Utiliser les v.a{(Xi,Yi), i= 1, . . . ,n}dont les points d’observationsXi

sont distants au plus dehn>0 du pointx,

Attribuer auxYi s´electionn´ees, des poids qui tiennent compte de la distance de leurXi au pointx,

Estimer ¯F(.|x) par une moyenne pond´er´ee,i.e.

ˆ¯

Fn(yn|x) =

n

X

i=1

K

x−Xi

hn

1{Yi>yn}

, n X

i=1

K

x−Xi

hn

, [Collomb, 1980]

1{.}est la fonction indicatrice.

Kest une fonction positive, born´ee, int´egrable et `a support compactSRp. hnest une suite non al´eatoire telle quehn0 quandn→ ∞.

15 / 44

(20)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

(21)

Hypoth`eses de r´egularit´e

Notations: soitg la densit´e deX, on d´esigne pard(x,x) la distance entre deux points (x,x)∈Rp×Rp.

Conditions de Lipschitz: il existe des constantesy0>1,cγ>0,c>0 et cg >0 telles que

1 γ(x)− 1

γ(x)

≤ cγd(x,x),

sup

y≥y0

logℓ(y|x)

logy −logℓ(y|x) logy

≤ cd(x,x), g(x)−g(x)

≤ cgd(x,x).

17 / 44

(22)

Normalit´e asymptotique de ¯ F (y

n

|x)

Th´eor`eme Si de plus,

yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,

alors, pour toutx ∈Rp tel queg(x)>0, (

q

nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)

F¯(ajyn|x) −1

!)

{j=1,...,J}

→ NL

0RJ,kKk22

g(x)C(x)

,

o`uCj,j(x) =a1/γ(x)j∧j pour (j,j)∈ {1, . . . ,J}2.

(23)

Normalit´e asymptotique de ¯ F (y

n

|x)

Th´eor`eme Si de plus,

yn→ ∞tqnhnpF¯(yn|x)→ ∞etnhp+2n log2(yn) ¯F(yn|x)→0qdn→ ∞, {aj,j= 1, . . . ,J}une suite strictement positive et croissante,

alors, pour toutx ∈Rp tel queg(x)>0, (

q

nhpnF¯(yn|x) ˆ¯ Fn(ajyn|x)

F¯(ajyn|x) −1

!)

{j=1,...,J}

→ NL

0RJ,kKk22

g(x)C(x)

,

o`uCj,j(x) =a1/γ(x)j∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur la variance asymptotique Inversement proportionnelle `anhpnF¯(yn|x).

Terme additionnel1/F¯(yn|x)→ ∞par rapport au casyn=y born´ee o`u [Berlinet et al., 2001, Th´eor`eme 6.3] trouvent F¯(y|x)(1−F¯(y|x))

nhpn

kKk22 g(x).

18 / 44

(24)

Interpr´etation de la condition nh

pn

F ¯ (y

n

|x) → ∞

CNS pour qu’il y ait presque sˆurement au moins un point dans la r´egion B(x,hn)×[yn,+∞[∈Rp+1.

Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhpn→ ∞.

Illustration g´eom´etrique denhp

nF¯(yn|x)→ ∞, avecp= 1

yn

(25)

Interpr´etation de la condition nh

p+2n

F ¯

n

(y

n

|x) log

2

(y

n

) → 0

Condition pour que le carr´e du biais asymptotique, de l’ordre de (hnlogyn)2,

soit n´egligeable devant la variance asymptotique, de l’ordre de 1

nhpnF¯(yn|x).

Siyn est born´e, alors on retrouve la condition de normalit´e asymptotique classique :nhp+2n →0.

20 / 44

(26)

Hypoth`ese sur la fonction ` a variations lentes

Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]

ℓ(y|x) =c(y|x) exp Zy

1

ε(u|x) u du

, avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).

(27)

Hypoth`ese sur la fonction ` a variations lentes

Repr´esentation de Karamata: toute fonction `a variations lentes peut s’´ecrire [Bingham et al., 1987, Th´eor`eme 1.3.1]

ℓ(y|x) =c(y|x) exp Zy

1

ε(u|x) u du

,

avecc(y|x)→c(x)>0etε(y|x)→0quandy → ∞ ℓ(.|x) est normalis´ee,i.e.c(y|x) =c(x).

Cons´equence:∀x ∈Rp, la fonction auxiliaireε(y|x) est d´efinie par

ε(y|x) =yℓ(y|x) ℓ(y|x).

21 / 44

(28)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

(29)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur la variance asymptotique

Inversement proportionnelle `anhpnαn et proportionnelle `aγ2(x).

Terme additionnel1/αn→ ∞par rapport au casαn=α∈]0,1[ fix´e o`u [Berlinet et al., 2001, Th´eor`eme 6.4] trouvent α(1−α)nhp

n kKk22

g(x) 1 f2(q(α|x)|x).

22 / 44

(30)

Normalit´e asymptotique de ˆ q

n

n

|x)

Th´eor`eme Si de plus,

αn→0telle quenhpnαn→ ∞ etnhp+2n αnlog2n)→0quandn→ ∞ {τj,j= 1, . . . ,J}une suite strictement positive et d´ecroissante.

Alors, pour tout x∈Rp tel queg(x)>0,

pnhpnαn

njαn|x) q(τjαn|x) −1

{j=1,...,J}

→ NL

0RJ, γ2(x)kKk22 g(x)Σ

, o`uΣj,j = 1/τj∧j pour (j,j)∈ {1, . . . ,J}2.

Remarques sur l’ordre des quantiles extrˆemes

nhpα → ∞etnhp+2α log2(α )→0impliquentα >logp(n) .

(31)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

23 / 44

(32)

Application ` a l’estimation de l’indice de queue conditionnel

Soit(βn)n≥1une suite positive telle queβn→0.

1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.

ˆ

γPn(x) = 1 log 2log

nn|x)−qˆn(2βn|x) ˆ

qn(2βn|x)−qˆn(4βn|x)

.

(33)

Application ` a l’estimation de l’indice de queue conditionnel

Soit(βn)n≥1une suite positive telle queβn→0.

1 Estimateur `a noyau de type Pickands: adaptation de l’estimateur de [Pickands, 1975] au cas conditionnel.

ˆ

γPn(x) = 1 log 2log

nn|x)−qˆn(2βn|x) ˆ

qn(2βn|x)−qˆn(4βn|x)

.

2 Estimateur `a noyau de type Hill: adaptation de l’estimateur de [Hill, 1975]

au cas conditionnel.

ˆ γnH(x) =

J

X

j=1

[log ˆqnjβn|x)−log ˆqn1βn|x)]

, J X

j=1

log (τ1j),

avecJ>1 et (τj)j≥1est une suite de poids strictement positive et d´ecroissante.

24 / 44

(34)

Hypoth`eses sur la fonction ` a variations lentes

Rappel: repr´esentation de Karamata quandℓ(.|x) est normalis´ee

ℓ(y|x) =c(x) exp Z y

1

ε(u|x) u du

.

Condition du second ordre: on suppose que|ε(.|x)|est d´ecroissante `a l’infini.

La fonctionε(y|x) repr´esentele terme de biais. Il contrˆole la vitesse de convergence des estimateurs en th´eorie des valeurs extrˆemes.

(35)

Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

γˆnP(x)−γ(x) L

→ N

0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2

kKk22

g(x)

.

26 / 44

(36)

Normalit´e asymptotique des estimateurs de l’indice de queue conditionnel

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(2βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

γˆnP(x)−γ(x) L

→ N

0, γ2(x)(22γ(x)+1+ 1) 4(log 2)2(2γ(x)−1)2

kKk22

g(x)

.

Corollaire

Si de plus βn→0tqnhpnβn→ ∞,nhp+2n βnlog2n)→0et

nhpnβnε2(q(τ1βn|x)|x)→0qdn→ ∞, alors pour toutx ∈Rptqg(x)>0,

pnhpnβn

ˆ

γHn(x)−γ(x) L

→ N

0, γ2(x)kKk22

g(x)VJ

, o`u

(37)

Deux exemples de suites de poids

La suite de poids harmonique: siτjHa= 1/j alors

VJHa=J(J−1)(2J−1)/(6 log2(J!)) est minimum pourJoptHa= 9et V9Ha≃1.245.

0 10 20 30 40

1.21.41.61.82.02.22.4

27 / 44

(38)

Deux exemples de suites de poids

La suite de poids harmonique: siτjHa= 1/j alorsVJ est minimum pour JoptHa= 9etV9Ha≃1.245.

La suite g´eom´etrique de la balle rebondissante:τjBR=b2j o`u0<b<1. Si b= 8/9 alorsVJ est minimum pourJoptBR = 11 etVJBRopt ≃1.141.

1.61.82.02.22.4

(39)

Plan : 3 - Estimation des courbes de niveaux extrˆemes

1 Introduction

2 Estimation des courbes de niveaux extrˆemes Mod`ele et m´ethode d’estimation

Hypoth`eses et r´esultats asymptotiques

Application `a l’estimation de l’indice de queue conditionnel Application `a l’estimation des quantiles conditionnels tr`es extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives

28 / 44

(40)

Application ` a l’estimation des quantiles conditionnels tr`es extrˆemes

Estimateur `a noyau de type Weissman: adaptation de l’estimateur de [Weissman, 1978] au cas conditionnel.

ˆ

qWnn|x) = ˆqnn|x)(αnn)−ˆγn(x),

avec ˆ

qnn|x) l’estimateur `a noyau pr´ec´edent, ˆ

γn(x) est un estimateur de l’indice de queue conditionnel, (αnn)−ˆγn(x)permet d’extrapoler.

(41)

Normalit´e asymptotique de l’estimateur ` a noyau de Weissman

Th´eor`eme Si de plus

βn→0tqnhpnβn→ ∞etnhp+2n βnlog2n)→0.

αnn→0.

pnhnpβn(ˆγn(x)−γ(x))→ NL 0,v2(x)

avecv(x)>0.

Alors pour toutx∈Rp tel queg(x)>0, pnhpnβn

log (βnn)

Wnn|x) q(αn|x) −1

L

→ N

0,v2(x) .

Au del`a du Th´eor`eme

La loi limite de ˆqnW(.|x) peut d´ependre du comportement de ˆqn(.|x).

30 / 44

(42)

Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives

(43)

Exp´eriences num´eriques

On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.

F¯(y|x) = 1−exp

−y−1/γ(x) , avecγ(x) = 1

2 1

10+ sin (πx) 11 10−1

2exp

−64 (x−1/2)2 .

0.0 0.2 0.4 0.6 0.8 1.0

0.10.20.30.40.5

x

γ(x)

32 / 44

(44)

Exp´eriences num´eriques

On g´en`erem= 100r´eplications d’un ´echantillon{(Xi,Yi),i = 1, . . . ,n}de taillen= 1000suivant le mod`eleX ∼U[0,1]etY|X =x est distribu´e selon une loi deFr´echet,i.e.

F¯(y|x) = 1−exp

−y−1/γ(x) , avecγ(x) = 1

2 1

10+ sin (πx) 11 10−1

2exp

−64 (x−1/2)2 .

But: estimer le quantile extrˆeme conditionnel

q(αn|x) = (−log(1−αn))−γ(x)d’ordreαn∈ {5 log(n)/n,1/2n}.

On utilise unnoyau bi-quadratique

K(x) =15 16

1−x22

1{|x|≤1}.

(45)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x)

Choix du param`etre de lissage

Validation crois´ee:

ˆhcv= arg min

hn∈H n

X

i=1 n

X

j=1

n

1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2

, [Yao, 1999]

ˆ¯

Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(X,Y),1n, ℓ6=i}.

33 / 44

(46)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x)

Choix du param`etre de lissage

Validation crois´ee:

ˆhcv= arg min

hn∈H n

X

i=1 n

X

j=1

n

1{Yi≥Yj}−Fˆ¯n,−i(Yj|Xi)o2

, [Yao, 1999]

ˆ¯

Fn,−i est l’estimateur `a noyau calcul´e sur l’´echantillon {(X,Y),1n, ℓ6=i}.

Strat´egie Oracle:

oracle= arg min

hn∈HD(ˆqnn|.),q(αn|.)), avec

D(u,v) = ( L

X(u(t)−v(t))2 )1/2

.

(47)

Exp´eriences num´eriques : l’estimateur ˆ q

n

n

|x).

Oracle : transparent – Validation crois´ee : gris

Histogramme des erreurs calcul´ees surN= 100 r´eplications.

0 2 4 6 8 10 12 14

0.00.10.20.30.4

34 / 44

(48)

Exp´eriences num´eriques : l’estimateur ˆ q

Wn

n

|x)

Choix des param`etreshnetβn

Dans la suite de ces exp´eriences,

ˆ

qnWn|x) = ˆqnn|x) (αnn)−ˆγHn(x).

Approche pr´econis´ee:

(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,

(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.

βˆ1,2= arg min

βn∈]0,1]D

ˆ

qWn,1n|.),qˆWn,2n|.) ,

qˆn,1Wn|.) construit avecτjHa= 1/jo`uJoptHa= 9.

ˆ

qn,2Wn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.

(49)

Exp´eriences num´eriques : l’estimateur ˆ q

Wn

n

|x)

Choix des param`etreshnetβn

Dans la suite de ces exp´eriences,

ˆ

qnWn|x) = ˆqnn|x) (αnn)−ˆγHn(x).

Approche pr´econis´ee:

(1) Choisirhnpar le crit`ere devalidation crois´eepr´ec´edent,

(2) Estimerβnen mesurant lasimilarit´eentre deux estimateurs de quantiles,i.e.

βˆ1,2= arg min

βn∈]0,1]D

ˆ

qWn,1n|.),qˆWn,2n|.) ,

qˆn,1Wn|.) construit avecτjHa= 1/jo`uJoptHa= 9.

ˆ

qn,2Wn|.) construit avecτjBR= (8/9)2jo`uJoptBR= 11.

Strat´egie Oracle: hˆi,oracle,βˆi,oracle

= arg min

hn∈H,βn∈]0,1]D ˆ

qWn,in|.),q(αn|.) , aveci = 1,2. Dans la suitei = 1.

35 / 44

(50)

Exp´eriences num´eriques : estimation du quantile d’ordre α

n

= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs m´edians

0123

(51)

Exp´eriences num´eriques : estimation du quantile d’ordre α

n

= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs m´edians

0.0 0.2 0.4 0.6 0.8 1.0

−101234

37 / 44

(52)

Plan : 4 - Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles Exp´eriences num´eriques

Estimation des niveaux de retour de pluies dans les C´evennes

4 Conclusions et perspectives

(53)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

39 / 44

(54)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

190019502000

1000 1500 2000 Privas

Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

Pourquoi ?

Construire des digues d’une hauteur appropri´ee,

op´erations de nettoyage des fleuves.

(55)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Horizontalement : longitude (km), verticalement : latitude (km), ´echelle des couleurs : altitude (m), losanges roses : villes, triangles : montagnes, lignes grises : cours d’eaux, losanges blancs : 225 stations de M´et´eo France.

La r´egion des C´evennes-Vivarais et ses alentours

650 700 750 800 850

1850190019502000

500 1000 1500 2000

Montpellier Privas Mende

Millau Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Estimer leniveau de retoursur 100 ans, i.e.le quantile des pr´ecipitations journali`eres d’ordre1/(365×100).

Pourquoi ?

Construire des digues d’une hauteur appropri´ee,

op´erations de nettoyage des fleuves.

n= 821925 observations

Noyau uniformeK(x) =1{|x|≤1}.

39 / 44

(56)

Estimation des niveaux retour de pluies (en mm) dans les C´evennes

Niveaux de retour journalier (mm) sur 100 ans en fonction de la longitude et de la latitude

1850190019502000

100 150 200 250 300 350

Montpellier Privas Mende

Millau

Le˙Puy

Nimes Valence

Ales Mt Aigoual

Mt Gerbier Mt Mezenc

Mt Lozere Serre Cx Bauzon

Voir [Molini´e et al., 2008] pour une comparaison.

(57)

Plan : 5 - Conclusions et perspectives

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives Conclusions

Perspectives

41 / 44

(58)

Conclusions

Trois contributions

Lorsque la loi conditionnelle deY en un pointx de la covariableX appartient au domaine d’attraction de Fr´echet.

(1/3) X ∈Rpal´eatoire, voir la pr´esentation.

Contribution: Kernel estimators of extreme level curves.TEST. `A paraˆıtre. En collaboration avecA. Daouia, L. Gardes et S. Girard.

(2/3) X d´eterministe et de dimension non-n´ecessairement finie.

Contribution: Functional nonparametric estimation of conditional extreme quantiles.Journal of Multivariate Analysis, 101, 419–433, 2010.

En collaboration avecLaurent Gardes et St´ephane Girard.

Lorsque la loi deY appartient au domaine d’attraction de Fr´echet.

(59)

Plan : 5 - Conclusions et perspectives

1 Introduction

2 Estimation des courbes de niveaux extrˆemes

3 Exp´eriences num´eriques et illustration sur des donn´ees r´eelles

4 Conclusions et perspectives Conclusions

Perspectives

43 / 44

(60)

Perspectives

A court terme`

1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.

2 Etendre ces r´esultats aux autres domaines d’attractions.´

3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.

4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.

(61)

Perspectives

A court terme`

1 Normalit´e asymptotique de nos estimateurs dans le cas des donn´ees α-m´elangeantes.

2 Etendre ces r´esultats aux autres domaines d’attractions.´

3 Adapter d’autres estimateurs existants de l’indice de queue au cadre conditionnel.

4 Proposer de nouveaux estimateurs `a noyau (ou double noyau) de l’indice de queue et des quantiles extrˆemes conditionnels dans le cadre fonctionnel.

A moyen terme`

1 Affiner les crit`eres de s´election des param`etresβn ethn.

A long terme`

1 Convergence en processus des estimateurs de l’indice de queue et des quantiles extrˆemes conditionnels.

44 / 44

(62)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D

0123

(63)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 5 log(n)/n.

— ˆqnn|.): validation crois´ee— ˆqnn|.) : oracle— ˆqWn,1n|.) : oracle

Estimateurs correspondants au 1er d´ecile de l’erreurD.

0.0 0.2 0.4 0.6 0.8 1.0

−10123

(64)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs correspondants au 9`eme d´ecile de l’erreur de l’erreur D.

1234

(65)

Annexe

Exp´eriences num´eriques : estimation du quantile d’ordreαn= 1/2n.

— ˆqn,1Wn|.): validation crois´ee + similarit´e— ˆqWn,1n|.): oracle

Estimateurs correspondants au 1er d´ecile de l’erreurD

0.0 0.2 0.4 0.6 0.8 1.0

−101234

(66)

Bibliographie I

Berlinet, A., Gannoun, A., and Matzner-Lober, E. (2001).

Asymptotic normality of convergent estimates of conditional quantiles.

Statistics, 18 :1400–1415.

Bingham, N. H., Goldie, C. M., and Teugels, J. L. (1987).

Regular Variation, volume 27.

Encyclopedia of Mathematics and its Applications, Cambridge University Press.

Collomb, G. (1980).

Estimation non param´etrique de probabilit´es conditionnelles.

Comptes Rendus de l’Acad´emie des Sciences, 291 :427–430.

Fisher, R. and Tippet, L. (1928).

Limiting forms of the frequency distribution of the largest or smallest member of a sample.

Proceedings of the Cambridge Philosophical Society, 24 :180–190.

(67)

Bibliographie II

Hill, B. (1975).

A simple general approach to inference about the tail of a distribution.

Annals of Statistics, 3(5) :1163–1174.

Molini´e, G., Yates, E., Ceresetti, D., Anquetin, S., Boudevillain, B., Creutin, J., and Bois, P. (2008).

Rainfall regimes in a mountainous mediterranean region : Statistical analysis at short time steps.

Article soumis.

Pickands, J. (1975).

Statistical inference using extreme order statistics.

Annals of Statistics, 3(1) :119–131.

Weissman, I. (1978).

Estimation of parameters and large quantiles based on thek-largest observations.

Journal of the American Statistical Association, 73(364) :812–815.

(68)

Bibliographie III

Yao, Q. (1999).

Conditional predictive regions for stochastic processes.

Technical report, University of Kent at Canterbury.

Références

Documents relatifs

The application we are concerned with in this paper is the estimation of the rotor position of a non-salient Permanent Magnet Synchronous Motors (PMSM) with known inductance L ,

Estimation des param` etres et de l’´ etat cach´ e des mod` eles d’espace d’´ etats: application au mod`

Extrêmes multifractals, incertitudes et estimation des quantiles hydrologiques, enjeux pour la région parisienne.. CNFSH

Estimation non-paramétrique de mesures de risque pour des lois conditionnelles à queues lourdes avec application.. à des

Estimation non-paramétrique de mesures de risque pour des lois conditionnelles à queues lourdes avec application.. à des

Sous des conditions de m´ elange assez g´ en´ erales, on ´ etablit la convergence presque compl` ete (avec vitesse) d’un estimateur ` a noyau pour la fonction de hasard d’une