Estimation de quantiles de odes

Nousonsidéronsàprésentleproblèmedel'estimationdesquantilesde lavariablede sortie

Y ∈ R

d'unmodèle numérique dépendant de variables d'entrée aléatoires

X ∈ R ^d

où

d

êst ûn êntier ^positif.

Les quantiles reherhés sont de type élevés (supérieurs à

80%

⁾ êt ^le ^modèle ^numérique êst ôûteux

en temps de alul. Ainsi, seul un nombre limité d'appels au ode est possible (typiquement moins

n = 200

^), ^induisant ^des estimations empiriques relativement impréises. Les résultats que je vais présenter dansette setionsontissusd'unsujetdereherhe quej'aiproposéaveAgnèsde Creyet

Pasal Bazin 8

lors de l'éole d'étédu CEMRACS (Centre d'ÉtéMathématique de Reherhe Avanée

en Calul Sientique) en 2006 et que j'ai traité en ollaboration ave Josselin Garnier et Claire

Cannamela (Cannamelaetal. [36 ℄).

Mon intérêt pour e problème est motivé par des questions relatives à la sûreté nuléaire, pour

le fontionnement des entrales nuléaires REP (Réateur à Eau sous Pression). Lors d'un sénario

(hypothétique)d'aidentAPRP- GB(Aident dePertedeRéfrigérantPrimaire - GrosseBrèhe),il

estimpératif quelatempérature delagaineduombustibleresteinférieure àlatempératurede fusion

de l'aier de gaine, an d'éviter tout endommagement du ÷ur du réateur. Pour évaluer e risque,

desodesde alulsontutiliséspoursimulerlesphénomènesthermohydrauliquesintervenantauours

dusénariod'aident, permettantde alulerl'évolution temporellede latempérature de lagainedu

ombustible (Petruzzi et al. [169 ℄, Caui et al. [33℄). L'un des ritères de sûreté onsiste à montrer

que l'estimation du quantile à

95%

^du ^premier ^pi ^de température de gaine, assoié à un niveau de onanede

95%

^,^est^bien ^inférieur^à ^la^limite^énonée préédemment (Nutt&Wallis[159 ℄,Zio &Di Maio[233℄). Bien entendu, e problème d'estimation de quantiles de odesest générique etpeutêtre

renontré dans bien d'autres problématiques, omme par exemple la oneption aéronautique ou les

alulsd'impat environnementaux.

Lespremièreetdeuxièmesetions deehapitreprésententlesrésultatsonnus surl'estimationde

quantiles par laméthode empirique, les statistiques d'ordre etl'utilisation d'unevariable de ontrle.

Les troissetions suivantes expliitent les nouveaux résultatsque nous avons obtenus sur les

estima-teursdequantilesparstratiationontrlée,stratiationontrléeadaptativeettiraged'importane

ontrlé. Enn, ladernière setion évoque les nombreuses perspetivesde reherhe sur e sujet

rela-tivement réent pour moi.

3.4.1 Quantile empirique

Mathématiquement, le problème se pose de la manière suivante. On dispose d'un

n

-éhantillon

(Y ₁ , . . . , Y _n )

^de^variables^aléatoiresindépendantesidentiquement distribuées(i.i.d.)selonuneloi onti-nue,inonnueetàdensité

p(y)

^.^On^assoie^àl'éhantillon

(Y ₁ , . . . , Y _n )

^lesstatistiquesd'ordre

(Y ₍₁₎ , . . . , Y _(n) )

telque

Y ₍₁₎ ≤ . . . ≤ Y _(n)

^.Ôn ^herhe ûn êstimateur^du

α

^-quantile

y _α

^déni^par

P (Y ≤ y _α ) = α .

^(3.46)

L'estimateur lassiquedu

α

^-quantile ^est ^le^quantile^empirique

Y b _EE (α) = Y b _α,n = Y _{(⌊αn⌋+1)} .

^(3.47)

CEAGrenoble,Diretiondel'ÉnergieNuléaire

où

⌊ . ⌋

^est ^la ^fontion ^partie ^entière. ^Si ^la ^densité

p(y)

^est ^dérivable ^en

y _α

Y b _EE (α)

êst ûn êstimateur

asymptotiquement normal(f.par exemple David &Nagaraja [51℄):

√ n( Y b EE (α) − y α ) ^n→∞ −→ N (0, σ _EE ² ) , σ ² _EE = α(1 − α)

p ² (y _α ) .

^(3.48)

La variane est don d'autant plus grande que l'on herhe à évaluer un quantile extrême (la densité

au point

y _α

êst âlors ^petite). ^Dans^le ôntexte^de ^sortie ^d'un ôde ^de âlul, êt êstimateur ^peut^être

utilisé si une méthode de Monte Carlo non biaisée a été utilisée pour générer les variables d'entrée

du ode :

(X ⁽¹⁾ , . . . , X ⁽ⁿ⁾ )

^est ^un

n

-éhantillon de veteurs aléatoires i.i.d. Cependant, l'estimateur empirique n'est passatisfaisant dansle asde notre problème (

y _α = 0.95

^et

n = 200

⁾ ôù îlônduit ^à

desestimations tropimpréises, i.e.devariane tropélevée.

En sûreté nuléaire, on veut avoir en plus un ertain niveau de onane

β ∈ ]0, 1[

^sur ^le ^quantile

estimé,'est-à-direque l'onherhe unestimateur

Y b _α,n

^tel ^que

P ( Y b _α,n ≥ y _α ) ≥ β .

^(3.49)

Unesolutionàeproblèmeestdonné parunthéorèmepourlesstatistiquesd'ordre(David&Nagaraja

[51℄) qui stipule que le nombre de dépassements d'un seuil

y

^par ^la ^suite ^de ^variables ^aléatoires ^i.i.d

(Y 1 , . . . , Y n )

^suit^une^loi^binomiale^de^paramètres

(n, q)

^,^ave

q = P (Y > y)

^.^La^formule^que^l'on^obtient

estonnue,dansledomainedelaabilité,souslenomdeformuledeWilks(Wilks[228 ℄,Nutt&Wallis

[159 ℄)etestdonnéei-après.

Théorème 3.4.1 Si on note

r

^le ^plus^petit ^entier ^tel ^que

n(1−α)−r X

j=0

C _n ^j (1 − α) ^j α ^n−j ≤ 1 − β

^(3.50)

alors

P (Y _{(⌊αn⌋+r)} > y _α ) ≥ β

^, 'est-à-dire que l'estimateur

Y _{(⌊αn⌋+r)}

^est ^sûr ^au ^niveau

β

La failité d'utilisation de e théorème le rend très populaire en pratique. Par exemple, il permetde

déterminerle nombre

n

^de âluls ^(de^type ^Monte ^Carlo) ^qu'il ^faut ^faire^pour ôbtenir ûne êstimation

du quantile d'ordre

α

âve ûn ^niveau ^de ônane

β

^, ^grâe^à ^la ^v^aleur ^maximale

Y _(n)

^de l'éhantillon

(Y ₁ , . . . , Y _n )

^des^réponses ^du^ode.

L'estimateur de Wilks soure, omme l'estimateur empirique, d'une grande dispersion. Dans la

suite,onprésentelesméthodesquej'aiétudiéesetquipermettentderéduirelavarianedel'estimation

duquantile.

3.4.2 Quantile par variable de ontrle

Lors desétudes d'inertitude desmodèles numériques, ilest ourant de disposer, en plus duode

de alul,d'unode simpliéou d'unmodèlemathématique dérivant sommairement les phénomènes

simulésdansleodedealul.Cemodèleréduitpeutaussiêtreunmétamodèleajustéaupréalablesur

unertainnombred'évaluationsbienhoisiesduode(f.3.2.5et3.3).Parrapportauodedealul

étudié,l'avantagedeemodèleréduitestqu'ilesttrèspeuoûteuxentempsdealul;soninonvénient,

parontre,résidedanssondegréd'approximation.L'estimationdirete(parMonteCarlo)d'unquantile

faible ou élevé à partird'unmétamodèle dière substantiellement du vraiquantile du odede alul.

Eneet,lemétamodèleestusuellementonstruitpourimiterleomportementmoyenduodedealul

etnonpourreproduiresonomportementdansdeszonesdequantilesélevés(Oakley[160℄,Cannamela

et al. [36℄). Pour résoudre e problème, deux stratégies peuvent être envisagées. La première onsiste

àonstruireun métamodèleadaptéàl'estimationd'unquantile,par exempleen utilisant larégression

quantile (Koenker [123℄), la onstrution adaptative d'un métamodèle PG (Oakley [160 ℄), voire les

tehniques de simulations onditionnelles de diérentes réalisations du métamodèle PG (Rutherford

[179 ℄).La seonde,ellequenousavonsétudiée,onsiste àinorporer,dansles stratégiesd'estimation

noté

Z = f _r (X )

L'estimation par variable de ontrle est une tehnique lassique dansles méthodes de rédution

devariane deMonte Carlo(Rubinstein[178℄). Elleonsiste àsoustraireà l'estimateurempiriqueune

fontion faisant intervenir une variable orrélée à la variable étudiée. Ii, il sut d'utiliser omme

variabledeontrle lemétamodèle

Z

êtômme ^fontion^de ôntrle

g(z) = 1 z≤z α

^,^ave

z _α

^le ^quantile

d'ordre

α

^de

Z

^.Ônôbtientâlorsl'estimationduquantileparvariabledeontrleàpartirdel'éhantillon

(Y _i , Z _i ) _i=1..n

Hesterberg&Nelson[85 ℄ sesont intéressésauxpropriétésde l'estimateur duquantilepar variable

de ontrle, noté

Y b _CV (α)

^. Îlsônt ^montré, ên^se ^basant ^sur^les ^résultats^de ^Nelson^{[158 ℄} ônernant ^les

propriétés desestimateurs par variable de ontrle, lethéorème asymptotiquesuivant :

Théorème 3.4.2 Si

Y b _CV (α)

^est l'estimateurduquantile

y _α

^par ^la ^méthode^de^la ^variable ^de^ontr^le,

on a

√ n( Y b _CV (α) − y _α ) ^n→∞ −→ N (0, σ _CV ² ) , σ _CV ² = α(1 − α)

p ² (y _α ) (1 − ρ ² _I ) ,

^(3.51)

où

ρ _I

êst ^le ôeient ^deôrrélation êntre

1 Y ≤y α

^et

1 Z≤z α

ρ _I = P (Y ≤ y _α , Z ≤ z _α ) − α ²

α(1 − α) .

^(3.52)

Cerésultatmontreunerédutiondevarianed'unfateur

(1 − ρ ² _I )

^par^rapport^au^quantile^empirique^:

plus les variables aléatoires

Y

^et

Z

^sont ^orrélées ^à ^proximité ^du ^quantile ^reherhé, ^meilleure ^est ^la

rédution de variane. Ce résultat est intéressant ar il est faile d'obtenir un estimateur de

ρ _I

^, ^en

alulant leoeient de orrélation empirique (à partir de l'éhantillon disponible), et don d'avoir

une idéede larédutionde variane.

3.4.3 Une méthode de rejet : la stratiation ontrlée

La méthode par variable de ontrle n'utilise ependant pas toute la spéiité du métamodèle

arautant de aluls sont réalisés ave leode qu'ave le métamodèle (alors que e dernier peutêtre

utiliséintensivement).Uneautrestratégieonsisteàutiliserlemodèleréduitnonpaspourapproherla

réponsedumodèleomplet

Y = f (X )

^dans^desongurations exeptionnelles,maispourséletionner un éhantillon de

X

^dans ^des ^zones intéressantes pour l'estimation du quantile. L'idée grossière est simplement detirerun

X

^selon^sa^loiôriginaleêt^deâluler

f _r (X )

^par ^le^modèle^réduit.^Si^la^réponse

dumodèle réduit ne nousonvient pas (parexemple sielle n'est passituéedans lesquantiles prohes

du quantiled'ordre

α

^du^modèle ^réduit), ^alors ^on ^rejette ^le

X

ên ^question ^(ou ^plus êxatement, ônâ

tendane à le rejeter). Si la réponse du modèle réduit nous onvient, alors on alule

f (X )

^. ^Il ^s'agit

don d'uneméthodede rejet.

La méthodeque nousavonsproposée, lastratiation ontrlée, onsistedon àstratier l'espae

des valeurs prises par

Z = f _r (X)

^en

m

intervalles

I ₁ , . . . , I _m

^, ^et ^à ^forer ^le ^nombre ^de réalisations de

X

^qui ^sont ^telles ^que

Z = f _r (X)

^tombe ^dans ^un ^intervalle

I _j

^. Mathématiquement, on se donne

m + 1

^niveaux

0 = α ₀ < α ₁ < . . . < α _m = 1

^,^et^les ^quantiles ^de

Z

orrespondant

−∞ = z _α ₀ < z _α ₁ <

. . . < z _α _m = ∞

^. ^Ces ^quantiles ^sont êstimables âve ^préision ^sans âuun ^problème âr ^la ^génération

deréalisations

Z

êst ^peu ôûteuse ên ^temps ^deâlul. Ôn^vaûtiliser ^lesintervalles

]z _α _j−1 , z _α _j ]

^omme

strates.Onsedonne unesuited'entiers

N ₁ , . . . , N _m

^tels^que

P m

j=1 N _j = n

^.^Pour ^haque

j

^,^on^tire ^(par

une méthode d'aeptation-rejet)

N _j

réalisations desveteurs aléatoires d'entrée

(X ⁽ⁱ⁾ ) ^(j) _i=1,...,N

j

telles

que les sorties

Z _i ^(j)

orrespondantes soient dans

]z _α _j−1 , z _α _j ]

^. ^Pour ^haune ^de ^es

N _j

réalisations, on alule

Y _i ^(j)

^.L'estimateur du

α

^-quantile ^de

Y

^parstratiation ontrléevautalors (Cannamelaetal.

[36℄)

Y b _CS (α) = inf n

y, F b _CS (y) > α o

,

^(3.53)

où

F b _CS (y)

^estl'estimateur parstratiation ontrlée delafontion de répartitionde

Y

Nousavonsmontré dansCannamela etal.[36 ℄ lethéorème asymptotiquesuivant :

Théorème 3.4.3 Si

Y b _CS (α)

^est l'estimateur duquantile

y _α

^par^la ^métho^de ^destratiationontrlée, on a

La rédution de variane par rapportà ellede l'estimateur empirique peutdon être très

impor-tantesi

Y

^est

Z

^sont^fortement ^orréléspositivement. Onaalors intérêt à mettreplusde pointsdans la queue de distribution de la variable aléatoire de ontrle

Z

^, ^an ^de ^renforer ^le ^nombre ^de

réali-sationspotentiellement intéressantes. Plus préisément, onpeutmontrer quelarédution devariane

augmente ave la orrélationentre

Y

^et

Z

^autour^du ^quantile^herhé. ^Sur ^quelquesappliations(des fontionsjouéesetun asd'étude industrielle onernant unode de sûreténuléaire), nousavonspu

montrerdansCannamela etal.[36 ℄ quel'eaitédeette méthode dépend,aumoinsen partie,dela

valeur de

ρ _I

^(f. ^Eq.^(3.52)). ^Pour ^l'objetif d'estimation d'unquantile, il onvient don d'adopter, si possible,une stratégie partiulière de onstrution du métamodèle.

Nousavonstestélasituationave

n = 200

^et

α = 95%

^.^Les^trois^paramètres ^à^hoisir^pour^pouvoir

appliqueretteméthodesont lenombre

m

^de^strates,^les^niveaux

(α _j ) _j=0..m

^de^elles-i ^et^les^nombres

(N _j ) _j=1..m

^de^points^dans^haque^strate.^Sur^nos^tests,^lastratiationontrléeenquatrestrates,ave

α ₁ = 50%

α ₂ = 90%

α ₃ = 95%

^et

N ₁ = N ₂ = N ₃ = N ₄ = 50

^nous^a ^donné^des^résultatssatisfaisants.

Ellepermetderéaliser

n/2

âlulsêntrés^sur^le^quantile^herhéêt

n/2

^aluls^ailleurs^(pour ^déteter

d'éventuelleszonesintéressantesnonapturéesparlemétamodèle).D'autresétudesontmontréqu'une

stratégie àtrois stratespeutégalement être performante(Bazin [19℄).

La méthode destratiation ontrléeà

4

^stratesêstîllustréeî-dessous^sur^la^fontion ^d'Ishigami

f ( · )

^et ^un ^métamodèle

f r ( · )

^polynomial^:

méthodede stratiationontrlée. Lagure3.3(a)montrequeelle-iréduit demanièresigniative

lavariane del'estimateurduquantile,parrapportàl'estimateurempirique. Pour jugerdel'inuene

de la qualité du métamodèle sur la variane de l'estimation du quantile obtenue par stratiation

ontrlée, quatre métamodèles à

ρ

^et

ρ _i

^variables ^sont ûtilisés. Ôn ônstate ^sur ^la ^gure ^3.3 ^(b) ^que

lavaleurde

ρ _I

^inue^fortement^sur^la^qualitéd'estimation par stratiationontrlée:lesestimations ave unmétamodèleà

ρ _I

^élevéônt^des^varianes^nettement^plus^faibles^queêllesâveûn^métamodèle

ρ _I

^peu ^élevé.

3.4.4 Quantile par stratiation ontrlée adaptative

Il est possible de hoisir optimalement les nombres

(N _j ^∗ ) _j=1..m

^de ^points ^dans ^haque ^strate ^en

minimisant lavariane (3.56). Larépartitiondes

n

simulationssur lesstrates dépend desprobabilités

5 10 15

Fig.3.3Estimationsduquantileà

95%

^de^la^fontion^d'Ishigami^à^partir^d'un^éhantillon^de^taille

n = 200

^.^(a)Comparaisonentrelesestimateurs empiriqueetparstratiationontrlée.Leshistogrammes des estimateurs sont traés à partir de

10 ⁴

expérienes. (b) Estimations par stratiation ontrlée pourquatremétamodèlesdiérents. Lesdensitésorrespondentàunlissagedeshistogrammesobtenus

àpartirde

10 ³

expérienes.Le vraiquantile estdonné par letrait vertial.

onditionnelles

P j (y)

^qui ^sont ^les ^quantités ^que ^l'on ^doit êstimer. ^Nous âvons âlors ^proposé ûne

pro-édure adaptative, nommée stratiation ontrlée adaptative, pour estimer les nombres de points à

allouerpar strate(Cannamela etal. [36℄). Elleproède enplusieurs étapes:

1. estimation des probabilités onditionnelles

P _j (y)

⁽

j = 1, . . . , m

^). ^On ^applique ^la stratiation ontrlée ave

n e = n ^γ

simulations,

0 < γ < 1

^, êt âve ûne âlloation â ^priori

β _j = N j

n

^. ^Une

première estimationdesprobabilités onditionnellesest obtenue :

P e _j (y) = 1

quipermetd'obtenirun estimateurdu quantile d'ordre

α

Y e _α = inf n

3. réalisation des

n − e n

simulations nales en allouant les simulations dans haque strate pour atteindreles nombres optimaux

[ β e _j n]

j = 1, . . . , m

4. estimationdu quantile

Y b _ACS (α)

Y b _ACS (α) = inf n

y, F b _ACS (y) > α o

(3.62)

F b _ACS (y) =

Dans Cannamelaet al.[36 ℄,nous avonsobtenu lethéorème asymptotiquesuivant :

Théorème 3.4.4 Si

Y b _ACS (α)

^est l'estimateurduquantile

y _α

^par ^la ^métho^de ^destratiation ontrlée adaptative, on a

Depremierstestsontpermisdevoirqu'ilfautque

n

^soit^susamment^élevé^pour^que^ette^méthode

adaptative soit eae (enpermettant notamment que lapremière étape soitréellement utile).

3.4.5 Quantile par tirage d'importane ontrlé

L'estimation par tiraged'importane est une autreméthode bienonnue pour larédutionde

va-rianedeMonteCarlo(Rubinstein[178℄).Laméthodepartiraged'importaneontrlé,quenousavons

proposéedans Cannamela etal. [36℄,onsiste à estimer ladensité biaisée pour le tiraged'importane

parsimulationsintensivessurlemétamodèle

Z

^,^àéhantillonnerles entrées

X

^selon ^la^densité^biaisée,

àproduireles sortiesdu ode

Y = f (X )

^sur^etéhantillon, puisàaluler l'estimateurnonbiaisédu quantile.

Lastratégiedetiraged'importaneontrlépourestimerunquantileonsisteàherherunedensité

d'importane orretepour lealulde l'intégralesuivante:

E h

trouver la densité

q

^qui ^minimise ^la ^variane ^de l'estimateur

1

s'approher des régionsd'importane de notre ode numérique

f (X)

^.^La ^variane ^est ^minimale ^pour

ladensitéoptimale (Rubinstein [178℄)

q ^∗ (x) = 1 f r ( x )≤z α q _ori (x)

R 1 f r ( x ^′ )≤z α q _ori (x ^′ )dx ^′ .

^(3.67)

Onreherhe une densitéd'importane parmi une famille paramétrique

Q

^de^densités

q γ

paramétrées parleursdeuxpremiersmoments

γ = (λ, C )

^.^Par simulationsintensivessurlemétamodèle(éhantillon detaille

n e

^),ôn ôbtient ûn êstimateur

γ b = ( b λ, C) b

^des^paramètres ^de^la ^densité^optimale ^:

L'estimateur du

α

^-quantile^de

Y

^par^tirage d'importane ontrlé vaut alors :

Nousavonsmontré dansCannamela etal.[36 ℄ lethéorème asymptotiquesuivant :

Théorème 3.4.5 Si

Y b CIS (α)

^est l'estimateur du quantile

y α

^par ^la ^méthode ^de ^tirage d'importane ontrlé, on a

Sur ertains tests joués, ette méthode a donné d'exellents résultats, parfois meilleurs que eux

desautres méthodes. Par exemple,ave lesfontions

f ( · )

^et

f r ( · )

^données^par

montre une orrélationmoyenne à proximité du quantile. Le quantile à

95%

^de

Y = f (X )

^est^estimé

parsimulationsintensivesà

y _α ≃ 2.75

^.L'estimateur empiriqueetl'estimateurpartiraged'importane ontrlédu quantile à

95%

^de

Y

^,^en ^utilisant

n = 200

simulations, sont omparéssurlagure3.4(b).

Pour la densité d'importane, la famille

Q

^hoisie êst ûn ênsemble ^de gaussiennes bidimensionnelles paramétrées par leur moyenne et ovariane. La gure 3.4 (b) montre également que les résultats

obtenus par tirage d'importane ontrlé sont meilleurs que eux obtenus par variable de ontrle et

par stratiation ontrlée. quantile à

95%

^de

Y

^à ^partir ^d'un ^éhantillon ^de ^taille

n = 200

^. Comparaisons entre les estimateurs empirique(moyenne

2.83

^,^éart-type

0.52

^),^par^variable^de^ontrle^(moyenne

2.74

^,^éart-type

0.38

^),^par

stratiation ontrlée (moyenne

2.71

^,^éart-type

0.25

^), ^et^par ^tiraged'importaneontrlé (moyenne

2.77

^,^éart-type

0.21

^).^Les histogrammesdesestimateurs sont traésàpartir de

5000

expérienes.

d'importane qui limite son appliabilité à l'existene d'une seule région d'importane pour haque

variable d'entrée.Celasigniequeleodedealulne doitatteindreles valeursduquantilereherhé

quedansundomaine restreintde variationdesesentrées.L'utilisationdemélanges dedensitépour la

densitéd'importane seraitune piste intéressante pour remédier à e problème.

3.4.6 Perspetives

Les méthodes présentées dans ette setion supposent la disponibilité d'un métamodèle. Elles ne

néessitent pasquelemétamodèle soit une exellente approximationdu ode de alul;surnostests,

desapproximations assez grossièresont donnéde bonsrésultats.Ceivient du faitquelequantile est

estimé à l'aide de simulations sur le ode de alul, le métamodèle guidant juste la planiation de

es aluls. L'une des voies de reherhe futures serait d'étudier en détail les stratégies d'alloation

dealuls entre laonstrution dumétamodèle etl'estimationdu quantile. Depremièresétudesen e

sensontétéraliséespar Bazin[19 ℄.Lastratiationontrléeadaptative pourraitégalementbénéier

d'uneréestimation dumétamodèleàl'issuede lapremière étape.Cesméthodespermettent également

d'envisager l'utilisation de odesde alulsimpliés,par exemple à maillage plus grossier queleode

dealul initial,qui sont souvent disponibles danslesappliations industrielles.

Par ailleurs, pour estimer les quantiles de odes, l'utilisation d'un métamodèle tel que le modèle

proessusgaussien (modèlePG, f.3.3) semble assez naturel. L'utilisation de lavariane du modèle

PGpermetd'élaborer desstratégiesdeplaniation adaptativedesalulsenprivilégiant

progressive-mentlessimulationsduodedealuldanslarégiond'intérêt(Oakley[160 ℄,Vazquez&Piera-Martinez

[220 ℄). La moyenne et la ovariane du modèle PG étant onnues (Eqs. (3.29) et (3.40)), il est alors

aiséde simuler desréalisationsdumodèle PGetd'estimerun quantilesurhaunede esréalisations

(Oakley[160 ℄,Rutherford [179 ℄). Aunal,on obtientun intervalle de onanesurlequantile

reher-hé. Sur des fontions tests à faible nombre d'entrées, ette approhe semble extrèmement eae.

Bien entendu, en plus grande dimension, la validation du modèle PG (préditeur et ovariane) doit

être partiulièrement soignée, ar les quantiles estimés par ette méthode dépendent entièrement du

métamodèle, et don desparamètres estimésde laovariane. L'unde mes sujetsde reherhe futurs

sera de omparer sur des as onrets, de taille industrielle, les avantages et inonvénients de

l'esti-mation de quantiles entre les méthodespar Monte Carlo ontrlé (variable de ontrle, stratiation

ontrlée,stratiation ontrléeadaptative,tirage d'importane ontrlé) etpar lemodèlePG.

Dans le document Bertrand Iooss. To cite this version: HAL Id: tel (Page 68-75)

Y ∈ R

X ∈ R d

d

80%

n = 200

95%

95%

n

(Y 1 , . . . , Y n )

p(y)

(Y 1 , . . . , Y n )

(Y (1) , . . . , Y (n) )

Y (1) ≤ . . . ≤ Y (n)

α

y α

P (Y ≤ y α ) = α .

α

Y b EE (α) = Y b α,n = Y (⌊αn⌋+1) .

⌊ . ⌋

p(y)

y α

Y b EE (α)

√ n( Y b EE (α) − y α ) n→∞ −→ N (0, σ EE 2 ) , σ 2 EE = α(1 − α)

p 2 (y α ) .

y α

(X (1) , . . . , X (n) )

n

y α = 0.95

n = 200

β ∈ ]0, 1[

Y b α,n

P ( Y b α,n ≥ y α ) ≥ β .

y

(Y 1 , . . . , Y n )

(n, q)

q = P (Y > y)

r

n(1−α)−r X

j=0

C n j (1 − α) j α n−j ≤ 1 − β

P (Y (⌊αn⌋+r) > y α ) ≥ β

Y (⌊αn⌋+r)

β

n

α

β

Y (n)

(Y 1 , . . . , Y n )

Z = f r (X )

Z

g(z) = 1 z≤z α

z α

α

Z

(Y i , Z i ) i=1..n

Y b CV (α)

Y b CV (α)

y α

√ n( Y b CV (α) − y α ) n→∞ −→ N (0, σ CV 2 ) , σ CV 2 = α(1 − α)

p 2 (y α ) (1 − ρ 2 I ) ,

ρ I

1 Y ≤y α

1 Z≤z α

ρ I = P (Y ≤ y α , Z ≤ z α ) − α 2

α(1 − α) .

(1 − ρ 2 I )

Y

Z

ρ I

Y = f (X )

X

X

f r (X )

α

X

f (X )

Z = f r (X)

m

I 1 , . . . , I m

X ∈ R ^d

(Y ₁ , . . . , Y _n )

(Y ₁ , . . . , Y _n )

(Y ₍₁₎ , . . . , Y _(n) )

Y ₍₁₎ ≤ . . . ≤ Y _(n)

y _α

P (Y ≤ y _α ) = α .

Y b _EE (α) = Y b _α,n = Y _{(⌊αn⌋+1)} .

y _α

Y b _EE (α)

√ n( Y b EE (α) − y α ) ^n→∞ −→ N (0, σ _EE ² ) , σ ² _EE = α(1 − α)

p ² (y _α ) .

y _α

(X ⁽¹⁾ , . . . , X ⁽ⁿ⁾ )

y _α = 0.95

Y b _α,n

P ( Y b _α,n ≥ y _α ) ≥ β .

C _n ^j (1 − α) ^j α ^n−j ≤ 1 − β

P (Y _{(⌊αn⌋+r)} > y _α ) ≥ β

Y _{(⌊αn⌋+r)}

Y _(n)

(Y ₁ , . . . , Y _n )

Z = f _r (X )

z _α

(Y _i , Z _i ) _i=1..n

Y b _CV (α)

Y b _CV (α)

y _α

√ n( Y b _CV (α) − y _α ) ^n→∞ −→ N (0, σ _CV ² ) , σ _CV ² = α(1 − α)

p ² (y _α ) (1 − ρ ² _I ) ,

ρ _I

ρ _I = P (Y ≤ y _α , Z ≤ z _α ) − α ²

(1 − ρ ² _I )

ρ _I

f _r (X )

Z = f _r (X)

I ₁ , . . . , I _m

Z = f _r (X)

I _j

0 = α ₀ < α ₁ < . . . < α _m = 1

−∞ = z _α ₀ < z _α ₁ <

. . . < z _α _m = ∞

]z _α _j−1 , z _α _j ]

N ₁ , . . . , N _m

j=1 N _j = n

N _j

(X ⁽ⁱ⁾ ) ^(j) _i=1,...,N

Z _i ^(j)

]z _α _j−1 , z _α _j ]

N _j

Y _i ^(j)

Y b _CS (α) = inf n

y, F b _CS (y) > α o

F b _CS (y)

Y b _CS (α)

y _α

ρ _I

(α _j ) _j=0..m

(N _j ) _j=1..m

α ₁ = 50%

α ₂ = 90%

α ₃ = 95%

N ₁ = N ₂ = N ₃ = N ₄ = 50

ρ _i

ρ _I

ρ _I

ρ _I

(N _j ^∗ ) _j=1..m

10 ⁴

10 ³

P _j (y)

n e = n ^γ

β _j = N j

P e _j (y) = 1