• Aucun résultat trouvé

Stratification control´ee adaptative pour l’estimation d’un quantile

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 193-197)

Chapitre 4 : Application au combustible HTR 113

5.4 Estimation de quantile par stratification contrˆol´ee

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile







α(1−F(y)) (1−α)F(y)

1/2

si zα < φ(y) (1−α)F(y)

α(1−F(y)) 1/2

si zα ≥φ(y)

En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de r´epartition autour d’un certainy, alors on a int´erˆet `a choisir α=F(y).

Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la r´eduction de variance pour les m´ethodes VC, PS, SC et SCA dans le cas o`u le nombre m de strates est grand. Das la m´ethode PS et dans la m´ethode SC avec la distributionβjj−αj1, la variance r´eduite est (5.4.3). Si la probabilit´e conditionnelle P(Y ≤ y|Z) a une densit´e continueg par rapport `a la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞

σ2 |PS=E

P(Y ≤y|Z)−P(Y ≤y|Z)2

=F(y)−E

P(Y ≤y|Z)2

Il s’agit en fait de la variance r´eduite de l’estimateur CV avec la fonction de contrˆole optimale g d´efinie par (5.3.13). Dans la m´ethode SCA, l’expression de la variance r´esuiteσ2est (5.4.13) qui a la limite suivante quandm→ ∞

σ2|SCA=Eh

P(Y ≤y|Z)−P(Y ≤y|Z)21/2i2

L’in´egalit´e de Cauchy-Schwarz montre alors clairement que la r´eduction de variance est plus importante pour la m´ethode SCA que pour la m´ethode CV utilisant la fonction de contrˆole optimaleg.

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile 5.4.4.1 Mise en oeuvre

On cherche ici `a d´eterminer leα-quantile deY, avec α proche de 1. En reprenant les id´ees de la m´ethode d’estimation adaptative pour la fonction de r´epartition qu’on vient de d´ecrire, on propose la proc´edure adaptative suivante :

1) On commence par appliquer la proc´edure de stratification contrˆol´ee avecen=nγsimulations, γ <1, et avec un choix a priori des βj, et on obtient ainsi une premi`ere estimation despj(y) :

e

pj(y) = 1 [βjen]

Xjn]e i=1

1Yi(j)≤y

de la fonction de r´epartitionFe(y) : Fe(y) =

Xm j=1

j−αj1)pej(y) et du quantileyα :

Yeα= infn

y,Fe(y)> αo

2) On estime la proposition id´eale de simulations par strates pour le quantile estim´eYeα : βej =

j −αj1)h e

pj(Yeα)−pej(Yeα)2i1/2

Pm

l=1l−αl1)h e

pl(Yeα)−pel(Yeα)2i1/2 (5.4.17) 3) On effectue lesn−enderni`eres simulations en affectant le nombre de simulations n´ec´essaires dans chaque strate pour atteindre le nombre id´eal estim´e [βejn].

4) On peut alors estimerpj(y) et F(y) par

ˆ

pj(y) = 1 [eβjn]

[Xβejn]

i=1

1Yi(j)y, Fˆ(y) = Xm j=1

ˆ

pj(y)(αj−αj1) et le quantileyα par

α,n = infn

y,F(y)ˆ > αo L’estimateur ˆYα,n est asymptotiquement normal

√n( ˆYα,n−yα)|SCAn−→ N→∞ (0, σ2), σ2= Pm

j=1j −αj1)

pj(yα)−pj(yα)21/2

p2(yα) o`up est la densit´e deY.

Pour conclure, on a donc obtenu que la variance r´eduiteσ2 est, pour l’estimateur empirique usuel :

σ2|EE= α(1−α) p2(yα)

pour l’estimateur PS ou pour l’estimateur VC avec la distribution βj = αj −αj1 (voir (5.3.11)) :

σ2|VC= α(1−α)

p2(yα) ×(1−ρ2I)

et pour l’estimateur par stratification contrˆol´ee adaptative `a deux strates, avec la s´eparatrice des strates en α:

σ2 |SCA= α(1−α) p2(yα) ×

1− ρ2I

8α(1−α) +O(ρ3I)

Ici, ρI est le coefficient de corr´elation entre 1Yyα et 1Zzα donn´e par (5.3.12). Cela montre que la m´ethode par variable de contrˆole et la m´ethode par stratification contrˆol´ee adaptative apportent une r´eduction de variance du mˆeme ordre lorsqu’on cherche `a estimer des quantiles

autour de la m´ediane α ∼ 1/2. Mais, lorsqu’on cherche `a estimer des quantiles importants, pour lesquelsα∼0 ou 1, alors la m´ethode par stratification contrˆol´ee adaptative apporte une bien meilleure r´eduction de variance.

5.4.4.2 Simulations Exemple 1 : fonction 1D

On reprend l’exemple 1 de la page 168 et on cherche le quantile `a α = 95% de Y. On compare les performances de l’estimateur empirique, de l’estimateur avec variable de contrˆole Z, et de l’estimateur par stratification contrˆol´ee adaptatif. Pour ce dernier, on impl´emente d’abord la m´ethode avec deux strates [0, α1] et ]α1,1] avec une s´eparatrice en α1 = α. On utilise ˜n = 2 ×n/10 simulations pour l’´evaluation (5.4.17) de la r´epartition optimale, en mettant n/10 simulations dans chacune des deux strates. Les r´esultats tir´es d’une s´erie de 10000 simulations peuvent ˆetre r´esum´es de la mani`ere suivante :

Estimation du α-quantile avecα = 0.95, n= 2000, yα = 3.66 estimation empirique : moyenne ´ecart-type

α,n 3.6614 0.33473

estimation CV : moyenne ´ecart-type

α,n 3.6502 0.29433 m´ethode SCA `a 2 strates

[0,0.95], ]0.95,1]

:

moyenne ´ecart-type βe1 0.8562 0.01874 Yˆα,n 3.6495 0.27839

Remarquer que la m´ethode par stratification contrˆol´ee adaptative d´ecide ici d’allouer 85%

des simulations dans la strate [0,0.95[, et donc 15% dans la strate [0.95,1]. On est donc bien ici dans un cadre o`u il faut augmenter le nombre de simulations dans la strate [0.95,1] par rapport `a ce qui est pr´evu dans le cas o`u il n’y a pas de contrˆole, o`u on aurait seulement 5%

de simulations dans la strate [0.95,1].

On a aussi appliqu´e la m´ethode de stratification contrˆol´ee adaptative avec trois strates [0, α1[, [α1, α2[, [α2,1], avec des s´eparatrices en α1 = 0.85 et α2 = 0.95. On utilise 3×n/10 simulations pour l’´evaluation (5.4.17) de la r´epartition optimale, en mettantn/10 simulations dans chacune des trois strates. Les r´esultats tir´es d’une s´erie de 10000 simulations peuvent ˆetre r´esum´es de la mani`ere suivante :

Estimation duα-quantile aveα= 0.95, n= 2000, yα = 3.66

m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]

:

moyenne ´ecart-type βe1 0.10136 0.023284 βe2 0.57666 0.016999 βe3 0.32199 0.0098153 Yˆα,n 3.6509 0.11703

On peut ici noter une importante r´eduction de l’´ecart-type de l’estimateur par stratification contrˆol´ee adaptative. On peut aussi remarquer que la r´epartition optimale devrait en fait avoir une fractionβ1 <0.1, mais la borne 0.1 ne peut pas ˆetre franchie du fait qu’on a utilis´en/10 simulations dans la strate [0, α1[ durant la premi`ere phase de l’estimation.

Les simulations pr´ec´edentes ont ´et´e r´ealis´ees avec des ´echantillons de taille n= 2000. Dans ce cas, la m´ethode SCA est tr`es robuste, dans le sens o`u le choix du nombre ˜n de simulations d´edi´ees `a l’estimation de l’allocation optimale n’est pas critique. Quandnest plus petit, comme par exemplen= 200, le choix de ˜ndevient plus critique : si ˜nest trop petit, alors l’estimation de l’allocation optimale peut ˆetre mauvaise ; si ˜n est trop grand, alors n−n˜ peut ˆetre trop petit et il devient alors impossible d’allouer le nombre voulu de simulations dans chaque strate.

Nous avons appliqu´e la m´ethode SCA avecn = 200 avec l’exemple 1, et il est apparu que la m´ethode SCA avec ˜n=n/10 est encore tr`es performante. Cependant,on ne peut pas jurer que ce sera le cas dans toutes les applications. Les r´esultats tir´es d’une s´erie de 10000 simulations sont les suivants :

Estimation du α-quantile avecα= 0.95,n= 200, yα= 3.66 estimation empirique : moyenne ´ecart-type

α,n 3.8756 0.83453

estimation VC : moyenne ´ecart-type

α,n 3.7347 0.74391

m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]

:

moyenne ´ecart-type βe1 0.14331 0.16441 βe2 0.55261 0.11466 βe3 0.30408 0.063331 Yˆα,n 3.6201 0.37801

Les ´ecart-types des estimations des βj sont beaucoup plus grands ici que dans le cas n= 2000, mais la qualit´e de l’estimation de l’allocation optimale est encore assez bonne pour permettre une r´eduction de variance significative pour l’estimation du quantile. L’´ecart-type

de l’estimateur SCA est ici 2 fois plus petit compar´e `a l’estimateur empirique ou l’estimateur VC. Attention, si n= 100, alors la m´ethode SCA ne marche plus, car il commence `a arriver des simulations o`u la m´ethode donne une mauvaise estimation de l’allocation optimale, et alors l’estimation du quantile peut ˆetre mauvaise. Dans ce cas, la m´ethode SC avec une allocation des niveaux prescrites par l’utilisateur est `a recommander.

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 193-197)