• Aucun résultat trouvé

Estimation d’un quantile

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 184-189)

Chapitre 4 : Application au combustible HTR 113

5.4 Estimation de quantile par stratification contrˆol´ee

5.4.2 Estimation d’un quantile

On est int´eress´e par la d´etection d’unα-quantile deY, avec α proche de 1. Un estimateur duα-quantile deY est :

α,n|SC= infn

y,Fˆ(y)> αo

o`u ˆF(y) est l’estimateur de la fonction de r´epartition que l’on vient de d´ecrire. La d´efinition est correcte car ˆF(y) est une fonction croissante dey, qui est nulle poury assez petit et ´egale

`

a 1 pour y assez grand.

L’estimateur ˆYα,n est asymptotiquement normal

√n( ˆYα,n−yα)|SCn−→ N→∞ (0, σ2), σ2= Pm

j=1

jαj−1)2 βj

pj(yα)−pj(yα)2 p2(yα)

o`up est la densit´e deY.

Si Z et Y sont corr´el´ees positivement, on a alors int´erˆet `a mettre plus de points dans la queue de distribution de la v.a. de contrˆole Z, afin de renforcer le nombre de r´ealisations potentiellement int´eressantes. La stratification contrˆol´ee en quatre strates d´ecrite page 167 semble un bon compromis. Du moins, elle apparaˆıt performante sur les quelques exemples que nous avons ´etudi´es.

Nous donnons dans le prochain paragraphe les r´esultats pour quatre exemples qui nous ont sembl´e typiques de situations r´ealistes.

5.4.2.2 Simulations Exemple 1 : fonction 1D

On consid`ere la situation suivante.X est suppos´ee ˆetre une v.a. gaussienne centr´ee r´eduite, et les fonctionsf etfr sont donn´ees par

fr(x) =x2, f(x) = 0.95x2[1 + 0.5 cos(10x) + 0.5 cos(20x)] (5.4.5) et sont dessin´ees sur la figure 5.4.1a. Les quantiles de la v.a. de contrˆole Z = fr(X) sont calculables analytiquement :

zα =

Φ1

1 +α 2

2

Ceux de Y ne le sont pas, comme on peut le voir en tra¸cant la densit´e de probabilit´e de Y (figure 5.4.1b) obtenue par une simulation de Monte Carlo intensive (avec 5×107 r´ealisations).

a) −4 −2 0 2 4

0 5 10 15 20 25 30

x

y

modele y=f(x) modele reduit z=fr(x)

b) 0 1 2 3 4 5 6 7

10−3 10−2 10−1 100

y

pdf

pdf de Z pdf de Y

c) 2 3 4 5 6 7

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

y

histogramme

quantile empirique quantile avec SC vrai quantile

Fig. 5.4.1 – Figure a : graphes des fonctions f et fr donn´ees par (5.4.5). Figure b : pdf de Y = f(X) et Z = fr(X) pour X ∼ N(0,1), obtenues avec 5×107 tirages de Monte Carlo.

Figure c : Estimations du α-quantile pour la v.a. Y = f(X) avec α = 95% `a partir d’un

´echantillon de taille n = 200. Les histogrammes des estimateurs sont trac´es `a partir de 104 exp´eriences.

On souhaite d´eterminer le α-quantile de Y. On dispose d’un nombre limit´e n d’appels `a la fonction f, mais d’un nombre quasi-illimit´e d’appels `a la fonction r´eduite fr. On utilise la m´ethode de stratification contrˆol´ee avec les param`etres d´ecrits page 167, et on compare le quantile obtenu avec le quantile empirique (figure 5.4.1c). On peut voir d’une part que le quantile empirique a beaucoup de mal `a pr´edire la valeur du vrai quantile, tandis que l’estimateur avec stratification contrˆol´ee apparaˆıt plus performant. En utilisant des simulations intensives, nous avons d´etermin´e le 0.95-quantile deY :y0.95= 3.66, ainsi que le coefficient de corr´elation entreY etZ :ρ= 0.84. La r´eduction de variance de la m´ethode par stratification contrˆol´ee est li´e au coefficient ρI, qui peut aussi ˆetre ´evalu´e par les simulations et l’´equation (5.3.12) :ρI = 0.52.

Exemple 2 : fonction 2D

On effectue le mˆeme travail dans le cas o`u X = (X1, X2) est un couple de v.a. normales centr´ees r´eduites ind´ependantes et les fonctionsf etfr sont donn´ees par :

fr(x1, x2) = x21x2, (5.4.6)

f(x1, x2) = 0.95x21[1 + 0.5 cos(10x1) + 0.5 cos(20x1)]

×x2[1 + 0.4 cos(7x2) + 0.3 cos(14x2)] (5.4.7) Ces fonctions et leur densit´e de probabilit´e sont illustr´ees en figure 5.4.2 (a, b, c).

a)

−40 −2 0 2 4

10 20 30 40

x1

y

modele y=f(x 1,1) modele reduit z=f

r(x 1,1)

b)

−4 −2 0 2 4

−4

−2 0 2 4 6

x2

y

modele y=f(1,x 2) modele reduit z=f

r(1,x 2)

c) 0 1 2 3 4 5 6 7

10−2 10−1 100

y

pdf

pdf de Z pdf de Y

d) 1 2 3 4 5

0 0.5 1 1.5 2 2.5

y

histogramme

quantile empirique quantile avec SC vrai quantile

Fig. 5.4.2 – Figures a,b : graphes en coupe des fonctions f(x1, x2) et fr(x1, x2) donn´ees par (5.4.6-5.4.7). Figure c : pdf de Y = f(X1, X2) et Z = fr(X1, X2) pour X1, X2 ∼ N(0,1), obtenues avec 5×107 tirages de Monte Carlo. Figure d : Estimations du α-quantile pour la v.a.Y =f(X1, X2)avecα= 95%`a partir d’un ´echantillon de taillen= 200. Les histogrammes des estimateurs sont trac´es `a partir de 104 exp´eriences.

Ici encore, la m´ethode par stratification contrˆol´ee r´eduit de mani`ere significative la variance de l’estimateur du quantile, par rapport `a l’estimateur empirique, comme on peut le voir sur la figure 5.4.2d.

Exemple 3 : fonction d’Ishigami

On effectue le mˆeme travail dans le cas o`u X = (X1, X2, X3) est une famille de trois v.a.

uniformes sur [−π, π] et les fonctionsf etfr sont donn´ees par :

fr(x1, x2, x3) = 1.908 + 1.727x1+ 2.059x22−0.2756x31

−0.2663x42+ 0.2499x23x1, (5.4.8) f(x1, x2, x3) = sin(x1) + 7 sin(x2)2+ 0.1x43sin(x1) (5.4.9)

Ici, la fonction f est la fonction d’Ishigami, bien connue en analyse de sensibilit´e [HS 96], et illustr´ee en figure 5.4.3 (a, b, c, d).fr est une surface de r´eponse polynomiale `a cinq monˆomes (l’intercept ne jouant aucun rˆole dans le contrˆole). Elle a ´et´e ajust´ee par r´egression lin´eaire multiple `a partir d’une base de 10000 calculs def. Seuls les monˆomes dont les coefficients ont

´et´e jug´es significativement non nuls par le test de Student (t-values) ont ´et´e conserv´es. On constate que les termes de fr correspondent `a ceux du d´eveloppement limit´e `a l’ordre 4 de la fonctionf, et ainsi que la surface de r´eponse ne reproduit pas toute la variabilit´e def (figure 5.4.3 a, b, c, d).

Les capacit´es d’approximation de la surface de r´eponse peuvent ˆetre mesur´ees `a l’aide du coefficient de d´etermination de la r´egression : R2 = 0.75. Par validation crois´ee (la base des 10000 points est divis´ee en 100 intervalles), on v´erifie que le R2 en pr´ediction est du mˆeme ordre de grandeur : R2pred = 0.74. Dans la m´ethode de stratification contrˆol´ee, c’est la valeur du coefficient de corr´elation entre f(X) etfr(X) qui est importante ; ici on aρ= 0.86, ce qui montre une corr´elation forte.

Leα-quantile de Z = fr(X) estzα ≃8.51, assez loin du α-quantile de Y =f(X) qui est yα ≃9.30 (voir figure 5.4.3e). La surface de r´eponse ne peut pas ˆetre utilis´ee ici pour estimer directement le quantile, mais elle peut ˆetre efficacement utilis´ee avec la stratification contrˆol´ee : celle-ci r´eduit de mani`ere significative la variance de l’estimateur du quantile, par rapport `a l’estimateur empirique, comme on peut le voir sur la figure 5.4.3e.

Exemple 4 : fonction de Morris

On effectue le mˆeme travail dans le cas o`u X = (Xi)i=1,...,10 est une famille de dix v.a.

uniformes sur [0,1] et la fonctionf est une simplification de la fonction de Morris, bien connue

a) −3 −2 −1 0 1 2 3

0 5 10 15

x1

y

modele y=f(x1,1,1) modele reduit z=fr(x1,1,1)

b) −3 −2 −1 0 1 2 3

0 5 10 15

x2

y

modele y=f(1,x2,1) modele reduit z=fr(1,x2,1)

c) −3 −2 −1 0 1 2 3

0 5 10 15

x3

y

modele y=f(1,1,x 3) modele reduit z=fr(1,1,x3)

d) −10 −5 0 5 10 15

10−3 10−2 10−1

y

pdf

pdf de Z pdf de Y

e) 5 10 15

0 0.2 0.4 0.6 0.8 1

y

histogramme

quantile empirique quantile avec SC vrai quantile

Fig. 5.4.3 –Figures a,b,c : graphes en coupe des fonctions f(x1, x2, x3) et fr(x1, x2, x3) don-n´ees par (5.4.8-5.4.9). Figure d : pdf de Y = f(X1, X2, X3) et Z = fr(X1, X2, X3) pour X1, X2, X3 ∼ U(−π, π), obtenues avec 5×107 tirages de Monte Carlo. Figure e : Estimations duα-quantile pour la v.a.Y =f(X1, X2, X3) avec α= 95% `a partir d’un ´echantillon de taille n= 200. Les histogrammes des estimateurs sont trac´es `a partir de104 exp´eriences.

en analyse de sensibilit´e [Mor 91], donn´ee par : f(x) =

X10 i=1

wi(x) + X

1i<j6

wi(x)wj(x) + X

1≤i<j<k≤5

wi(x)wj(x)wk(x)

+ X

1≤i<j<k<l≤4

wi(x)wj(x)wk(x)wl(x) (5.4.10)

wi(x) =



 2

1.1xi

xi+ 0.1−0.5

si i= 3,5,7 2(xi−0.5) sinon

(5.4.11)

La fonction fr est une surface de r´eponse polynomiale de degr´e deux, ajust´ee par r´egression lin´eaire multiple `a partir d’une base de 10000 calculs de f. Deux surfaces de r´eponse sont test´ees, une pas tr`es bien ajust´ee (avec R2 = 0.7 etρ= 0.82), et l’autre de bonne qualit´e avec (R2 = 0.9 et ρ = 0.95). Leur densit´e de probabilit´e est compar´ee `a celle def en figure 5.4.4 (a, b).

On compare sur la figure 5.4.4 (c, d) les r´esultats de la stratification contrˆol´ee avec ces deux surfaces de r´eponse. Une fois de plus, la stratification contrˆol´ee r´eduit de mani`ere significative la variance de l’estimateur du quantile. Cette r´eduction est d’autant plus importante que le coefficient de corr´elation ρ entref(X) et fr(X) est ´elev´e.

a) −100 −50 0 50 100

10−4 10−3 10−2

y

pdf

pdf de Z pdf de Y

b) −100 −50 0 50 100

10−4 10−3 10−2

y

pdf

pdf de Z pdf de Y

c) 65 70 75 80 85 90 95

0 0.05 0.1 0.15 0.2 0.25

y

histogramme

quantile empirique quantile avec SC vrai quantile

d) 65 70 75 80 85 90 95

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

y

histogramme

quantile empirique quantile avec SC vrai quantile

Fig. 5.4.4 – En haut : pdf de Y =f(X) et Z =fr(X) pour X= (Xi)i=1,...,10 et Xi ∼ U(0,1), avec une surface de r´eponse de R2 = 0.7 (a) et R2 = 0.9 (b). En bas : Estimations du α-quantile pour la v.a. Y =f(X) avec α= 95% `a partir d’un ´echantillon de taillen= 200. Les histogrammes des estimateurs sont trac´es `a partir de 104 exp´eriences. On utilise une surface de r´eponse avecR2= 0.7 (resp.R2 = 0.9) comme variable de contrˆole sur la figure c (resp. d).

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 184-189)