Chapitre 4 : Application au combustible HTR 113
5.4 Estimation de quantile par stratification contrˆol´ee
5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile
α(1−F(y)) (1−α)F(y)
1/2
si zα < φ(y) (1−α)F(y)
α(1−F(y)) 1/2
si zα ≥φ(y)
En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de r´epartition autour d’un certainy, alors on a int´erˆet `a choisir α=F(y).
Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la r´eduction de variance pour les m´ethodes VC, PS, SC et SCA dans le cas o`u le nombre m de strates est grand. Das la m´ethode PS et dans la m´ethode SC avec la distributionβj =αj−αj−1, la variance r´eduite est (5.4.3). Si la probabilit´e conditionnelle P(Y ≤ y|Z) a une densit´e continueg∗ par rapport `a la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞
σ2 |PS=E
P(Y ≤y|Z)−P(Y ≤y|Z)2
=F(y)−E
P(Y ≤y|Z)2
Il s’agit en fait de la variance r´eduite de l’estimateur CV avec la fonction de contrˆole optimale g∗ d´efinie par (5.3.13). Dans la m´ethode SCA, l’expression de la variance r´esuiteσ2est (5.4.13) qui a la limite suivante quandm→ ∞
σ2|SCA=Eh
P(Y ≤y|Z)−P(Y ≤y|Z)21/2i2
L’in´egalit´e de Cauchy-Schwarz montre alors clairement que la r´eduction de variance est plus importante pour la m´ethode SCA que pour la m´ethode CV utilisant la fonction de contrˆole optimaleg∗.
5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile 5.4.4.1 Mise en oeuvre
On cherche ici `a d´eterminer leα-quantile deY, avec α proche de 1. En reprenant les id´ees de la m´ethode d’estimation adaptative pour la fonction de r´epartition qu’on vient de d´ecrire, on propose la proc´edure adaptative suivante :
1) On commence par appliquer la proc´edure de stratification contrˆol´ee avecen=nγsimulations, γ <1, et avec un choix a priori des βj, et on obtient ainsi une premi`ere estimation despj(y) :
e
pj(y) = 1 [βjen]
[βXjn]e i=1
1Yi(j)≤y
de la fonction de r´epartitionFe(y) : Fe(y) =
Xm j=1
(αj−αj−1)pej(y) et du quantileyα :
Yeα= infn
y,Fe(y)> αo
2) On estime la proposition id´eale de simulations par strates pour le quantile estim´eYeα : βej =
(αj −αj−1)h e
pj(Yeα)−pej(Yeα)2i1/2
Pm
l=1(αl−αl−1)h e
pl(Yeα)−pel(Yeα)2i1/2 (5.4.17) 3) On effectue lesn−enderni`eres simulations en affectant le nombre de simulations n´ec´essaires dans chaque strate pour atteindre le nombre id´eal estim´e [βejn].
4) On peut alors estimerpj(y) et F(y) par
ˆ
pj(y) = 1 [eβjn]
[Xβejn]
i=1
1Yi(j)≤y, Fˆ(y) = Xm j=1
ˆ
pj(y)(αj−αj−1) et le quantileyα par
Yˆα,n = infn
y,F(y)ˆ > αo L’estimateur ˆYα,n est asymptotiquement normal
√n( ˆYα,n−yα)|SCAn−→ N→∞ (0, σ2), σ2= Pm
j=1(αj −αj−1)
pj(yα)−pj(yα)21/2
p2(yα) o`up est la densit´e deY.
Pour conclure, on a donc obtenu que la variance r´eduiteσ2 est, pour l’estimateur empirique usuel :
σ2|EE= α(1−α) p2(yα)
pour l’estimateur PS ou pour l’estimateur VC avec la distribution βj = αj −αj−1 (voir (5.3.11)) :
σ2|VC= α(1−α)
p2(yα) ×(1−ρ2I)
et pour l’estimateur par stratification contrˆol´ee adaptative `a deux strates, avec la s´eparatrice des strates en α:
σ2 |SCA= α(1−α) p2(yα) ×
1− ρ2I
8α(1−α) +O(ρ3I)
Ici, ρI est le coefficient de corr´elation entre 1Y≤yα et 1Z≤zα donn´e par (5.3.12). Cela montre que la m´ethode par variable de contrˆole et la m´ethode par stratification contrˆol´ee adaptative apportent une r´eduction de variance du mˆeme ordre lorsqu’on cherche `a estimer des quantiles
autour de la m´ediane α ∼ 1/2. Mais, lorsqu’on cherche `a estimer des quantiles importants, pour lesquelsα∼0 ou 1, alors la m´ethode par stratification contrˆol´ee adaptative apporte une bien meilleure r´eduction de variance.
5.4.4.2 Simulations Exemple 1 : fonction 1D
On reprend l’exemple 1 de la page 168 et on cherche le quantile `a α = 95% de Y. On compare les performances de l’estimateur empirique, de l’estimateur avec variable de contrˆole Z, et de l’estimateur par stratification contrˆol´ee adaptatif. Pour ce dernier, on impl´emente d’abord la m´ethode avec deux strates [0, α1] et ]α1,1] avec une s´eparatrice en α1 = α. On utilise ˜n = 2 ×n/10 simulations pour l’´evaluation (5.4.17) de la r´epartition optimale, en mettant n/10 simulations dans chacune des deux strates. Les r´esultats tir´es d’une s´erie de 10000 simulations peuvent ˆetre r´esum´es de la mani`ere suivante :
Estimation du α-quantile avecα = 0.95, n= 2000, yα = 3.66 estimation empirique : moyenne ´ecart-type
Yˆα,n 3.6614 0.33473
estimation CV : moyenne ´ecart-type
Yˆα,n 3.6502 0.29433 m´ethode SCA `a 2 strates
[0,0.95], ]0.95,1]
:
moyenne ´ecart-type βe1 0.8562 0.01874 Yˆα,n 3.6495 0.27839
Remarquer que la m´ethode par stratification contrˆol´ee adaptative d´ecide ici d’allouer 85%
des simulations dans la strate [0,0.95[, et donc 15% dans la strate [0.95,1]. On est donc bien ici dans un cadre o`u il faut augmenter le nombre de simulations dans la strate [0.95,1] par rapport `a ce qui est pr´evu dans le cas o`u il n’y a pas de contrˆole, o`u on aurait seulement 5%
de simulations dans la strate [0.95,1].
On a aussi appliqu´e la m´ethode de stratification contrˆol´ee adaptative avec trois strates [0, α1[, [α1, α2[, [α2,1], avec des s´eparatrices en α1 = 0.85 et α2 = 0.95. On utilise 3×n/10 simulations pour l’´evaluation (5.4.17) de la r´epartition optimale, en mettantn/10 simulations dans chacune des trois strates. Les r´esultats tir´es d’une s´erie de 10000 simulations peuvent ˆetre r´esum´es de la mani`ere suivante :
Estimation duα-quantile aveα= 0.95, n= 2000, yα = 3.66
m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]
:
moyenne ´ecart-type βe1 0.10136 0.023284 βe2 0.57666 0.016999 βe3 0.32199 0.0098153 Yˆα,n 3.6509 0.11703
On peut ici noter une importante r´eduction de l’´ecart-type de l’estimateur par stratification contrˆol´ee adaptative. On peut aussi remarquer que la r´epartition optimale devrait en fait avoir une fractionβ1 <0.1, mais la borne 0.1 ne peut pas ˆetre franchie du fait qu’on a utilis´en/10 simulations dans la strate [0, α1[ durant la premi`ere phase de l’estimation.
Les simulations pr´ec´edentes ont ´et´e r´ealis´ees avec des ´echantillons de taille n= 2000. Dans ce cas, la m´ethode SCA est tr`es robuste, dans le sens o`u le choix du nombre ˜n de simulations d´edi´ees `a l’estimation de l’allocation optimale n’est pas critique. Quandnest plus petit, comme par exemplen= 200, le choix de ˜ndevient plus critique : si ˜nest trop petit, alors l’estimation de l’allocation optimale peut ˆetre mauvaise ; si ˜n est trop grand, alors n−n˜ peut ˆetre trop petit et il devient alors impossible d’allouer le nombre voulu de simulations dans chaque strate.
Nous avons appliqu´e la m´ethode SCA avecn = 200 avec l’exemple 1, et il est apparu que la m´ethode SCA avec ˜n=n/10 est encore tr`es performante. Cependant,on ne peut pas jurer que ce sera le cas dans toutes les applications. Les r´esultats tir´es d’une s´erie de 10000 simulations sont les suivants :
Estimation du α-quantile avecα= 0.95,n= 200, yα= 3.66 estimation empirique : moyenne ´ecart-type
Yˆα,n 3.8756 0.83453
estimation VC : moyenne ´ecart-type
Yˆα,n 3.7347 0.74391
m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]
:
moyenne ´ecart-type βe1 0.14331 0.16441 βe2 0.55261 0.11466 βe3 0.30408 0.063331 Yˆα,n 3.6201 0.37801
Les ´ecart-types des estimations des βj sont beaucoup plus grands ici que dans le cas n= 2000, mais la qualit´e de l’estimation de l’allocation optimale est encore assez bonne pour permettre une r´eduction de variance significative pour l’estimation du quantile. L’´ecart-type
de l’estimateur SCA est ici 2 fois plus petit compar´e `a l’estimateur empirique ou l’estimateur VC. Attention, si n= 100, alors la m´ethode SCA ne marche plus, car il commence `a arriver des simulations o`u la m´ethode donne une mauvaise estimation de l’allocation optimale, et alors l’estimation du quantile peut ˆetre mauvaise. Dans ce cas, la m´ethode SC avec une allocation des niveaux prescrites par l’utilisateur est `a recommander.