Stratification control´ee adaptative pour l’estimation d’un quantile

Chapitre 4 : Application au combustible HTR 113

5.4 Estimation de quantile par stratification contrˆol´ee

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile









α(1−F(y)) (1−α)F(y)

1/2

si z_α < φ(y) (1−α)F(y)

α(1−F(y)) 1/2

si zα ≥φ(y)

En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de répartition autour d’un certainy, alors on a intérêt à choisir α=F(y).

Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la réduction de variance pour les méthodes VC, PS, SC et SCA dans le cas où le nombre m de strates est grand. Das la méthode PS et dans la méthode SC avec la distributionβ_j =α_j−α_j₋₁, la variance réduite est (5.4.3). Si la probabilité conditionnelle P(Y ≤ y|Z) a une densité continueg^∗ par rapport à la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞

σ² |PS=E

P(Y ≤y|Z)−P(Y ≤y|Z)²

=F(y)−E

P(Y ≤y|Z)²

Il s’agit en fait de la variance réduite de l’estimateur CV avec la fonction de contrôle optimale g^∗ définie par (5.3.13). Dans la méthode SCA, l’expression de la variance résuiteσ²est (5.4.13) qui a la limite suivante quandm→ ∞

σ²|SCA=Eh

P(Y ≤y|Z)−P(Y ≤y|Z)²1/2i2

L’inégalité de Cauchy-Schwarz montre alors clairement que la réduction de variance est plus importante pour la méthode SCA que pour la méthode CV utilisant la fonction de contrôle optimaleg^∗.

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile 5.4.4.1 Mise en oeuvre

On cherche ici à déterminer leα-quantile deY, avec α proche de 1. En reprenant les idées de la méthode d’estimation adaptative pour la fonction de répartition qu’on vient de décrire, on propose la procédure adaptative suivante :

1) On commence par appliquer la procédure de stratification contrôlée avecen=n^γsimulations, γ <1, et avec un choix a priori des β_j, et on obtient ainsi une première estimation desp_j(y) :

p_j(y) = 1 [β_jen]

[βXjn]e i=1

1Y_i^(j)≤y

de la fonction de r´epartitionFe(y) : Fe(y) =

Xm j=1

(α_j−α_j₋₁)pe_j(y) et du quantiley_α :

Ye_α= infn

y,Fe(y)> αo

2) On estime la proposition id´eale de simulations par strates pour le quantile estim´eYe_α : βe_j =

(α_j −α_j₋₁)h e

p_j(Ye_α)−pe_j(Ye_α)²i1/2

l=1(α_l−α_l₋₁)h e

p_l(Ye_α)−pe_l(Ye_α)²i1/2 (5.4.17) 3) On effectue lesn−endernières simulations en affectant le nombre de simulations nécéssaires dans chaque strate pour atteindre le nombre idéal estimé [βejn].

4) On peut alors estimerp_j(y) et F(y) par

p_j(y) = 1 [eβ_jn]

[Xβejn]

i=1

1Y_i^(j)≤y, Fˆ(y) = Xm j=1

p_j(y)(α_j−α_j₋₁) et le quantiley_α par

Yˆα,n = infn

y,F(y)ˆ > αo L’estimateur ˆY_α,n est asymptotiquement normal

√n( ˆY_α,n−y_α)|SCAⁿ−→ N^→∞ (0, σ²), σ²= Pm

j=1(αj −αj−1)

pj(yα)−pj(yα)²1/2

p²(y_α) o`up est la densit´e deY.

Pour conclure, on a donc obtenu que la variance r´eduiteσ² est, pour l’estimateur empirique usuel :

σ²|EE= α(1−α) p²(y_α)

pour l’estimateur PS ou pour l’estimateur VC avec la distribution βj = αj −αj−1 (voir (5.3.11)) :

σ²|VC= α(1−α)

p²(y_α) ×(1−ρ²_I)

et pour l’estimateur par stratification contrôlée adaptative à deux strates, avec la séparatrice des strates en α:

σ² |SCA= α(1−α) p²(yα) ×

1− ρ²_I

8α(1−α) +O(ρ³_I)

Ici, ρ_I est le coefficient de corrélation entre 1_Y_≤_y_α et 1_Z_≤_z_α donné par (5.3.12). Cela montre que la méthode par variable de contrôle et la méthode par stratification contrôlée adaptative apportent une réduction de variance du même ordre lorsqu’on cherche à estimer des quantiles

autour de la médiane α ∼ 1/2. Mais, lorsqu’on cherche à estimer des quantiles importants, pour lesquelsα∼0 ou 1, alors la méthode par stratification contrôlée adaptative apporte une bien meilleure réduction de variance.

5.4.4.2 Simulations Exemple 1 : fonction 1D

On reprend l’exemple 1 de la page 168 et on cherche le quantile à α = 95% de Y. On compare les performances de l’estimateur empirique, de l’estimateur avec variable de contrôle Z, et de l’estimateur par stratification contrôlée adaptatif. Pour ce dernier, on implémente d’abord la méthode avec deux strates [0, α₁] et ]α₁,1] avec une séparatrice en α₁ = α. On utilise ñ = 2 ×n/10 simulations pour l’évaluation (5.4.17) de la répartition optimale, en mettant n/10 simulations dans chacune des deux strates. Les résultats tirés d’une série de 10000 simulations peuvent être résumés de la manière suivante :

Estimation du α-quantile avecα = 0.95, n= 2000, y_α = 3.66 estimation empirique : moyenne ´ecart-type

Yˆ_α,n 3.6614 0.33473

estimation CV : moyenne ´ecart-type

Yˆ_α,n 3.6502 0.29433 m´ethode SCA `a 2 strates

[0,0.95], ]0.95,1]

moyenne ´ecart-type βe₁ 0.8562 0.01874 Yˆα,n 3.6495 0.27839

Remarquer que la méthode par stratification contrôlée adaptative décide ici d’allouer 85%

des simulations dans la strate [0,0.95[, et donc 15% dans la strate [0.95,1]. On est donc bien ici dans un cadre où il faut augmenter le nombre de simulations dans la strate [0.95,1] par rapport à ce qui est prévu dans le cas où il n’y a pas de contrôle, où on aurait seulement 5%

de simulations dans la strate [0.95,1].

On a aussi appliqué la méthode de stratification contrôlée adaptative avec trois strates [0, α1[, [α1, α2[, [α2,1], avec des séparatrices en α1 = 0.85 et α2 = 0.95. On utilise 3×n/10 simulations pour l’évaluation (5.4.17) de la répartition optimale, en mettantn/10 simulations dans chacune des trois strates. Les résultats tirés d’une série de 10000 simulations peuvent être résumés de la manière suivante :

Estimation duα-quantile aveα= 0.95, n= 2000, y_α = 3.66

m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]

moyenne ´ecart-type βe₁ 0.10136 0.023284 βe2 0.57666 0.016999 βe₃ 0.32199 0.0098153 Yˆα,n 3.6509 0.11703

On peut ici noter une importante réduction de l’écart-type de l’estimateur par stratification contrôlée adaptative. On peut aussi remarquer que la répartition optimale devrait en fait avoir une fractionβ₁ <0.1, mais la borne 0.1 ne peut pas être franchie du fait qu’on a utilisén/10 simulations dans la strate [0, α₁[ durant la première phase de l’estimation.

Les simulations précédentes ont été réalisées avec des échantillons de taille n= 2000. Dans ce cas, la méthode SCA est très robuste, dans le sens où le choix du nombre ñ de simulations dédiées à l’estimation de l’allocation optimale n’est pas critique. Quandnest plus petit, comme par exemplen= 200, le choix de ñdevient plus critique : si ñest trop petit, alors l’estimation de l’allocation optimale peut être mauvaise ; si ñ est trop grand, alors n−n˜ peut être trop petit et il devient alors impossible d’allouer le nombre voulu de simulations dans chaque strate.

Nous avons appliqué la méthode SCA avecn = 200 avec l’exemple 1, et il est apparu que la méthode SCA avec ñ=n/10 est encore très performante. Cependant,on ne peut pas jurer que ce sera le cas dans toutes les applications. Les résultats tirés d’une série de 10000 simulations sont les suivants :

Estimation du α-quantile avecα= 0.95,n= 200, yα= 3.66 estimation empirique : moyenne ´ecart-type

Yˆ_α,n 3.8756 0.83453

estimation VC : moyenne ´ecart-type

Yˆ_α,n 3.7347 0.74391

m´ethode SCA `a 3 strates [0,0.85], ]0.85,0.95], ]0.95,1]

moyenne ´ecart-type βe₁ 0.14331 0.16441 βe₂ 0.55261 0.11466 βe₃ 0.30408 0.063331 Yˆ_α,n 3.6201 0.37801

Les écart-types des estimations des β_j sont beaucoup plus grands ici que dans le cas n= 2000, mais la qualité de l’estimation de l’allocation optimale est encore assez bonne pour permettre une réduction de variance significative pour l’estimation du quantile. L’écart-type

de l’estimateur SCA est ici 2 fois plus petit comparé à l’estimateur empirique ou l’estimateur VC. Attention, si n= 100, alors la méthode SCA ne marche plus, car il commence à arriver des simulations où la méthode donne une mauvaise estimation de l’allocation optimale, et alors l’estimation du quantile peut être mauvaise. Dans ce cas, la méthode SC avec une allocation des niveaux prescrites par l’utilisateur est à recommander.

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 193-197)