Chapitre 4 : Application au combustible HTR 113
5.4 Estimation de quantile par stratification contrˆol´ee
5.4.3 Stratification contrˆol´ee adaptative
5.4.3.1 Choix optimal du nombre de simulations par strates
Consid´erons l’estimateur par stratification contrˆol´ee d´ecrit dans la section 5.4.1.1 et repre-nons les mˆemes notations. Fixons y ∈R. L’estimateur (5.4.1) de F(y) est asymptotiquement
normal et sa variance r´eduiteσ2 est donn´ee par (5.4.3) : σ2 =
Xm j=1
(αj −αj−1)2 βj
pj(y)−pj(y)2
En fait, si on n´eglige les petites erreurs dues aux parties enti`eres, σ2/n est la variance de l’estimateur ˆF(y) pour tout n en vertu de (5.4.2).
Si on se fixe le nombrem et les niveaux (αj)j=0,...,m des strates, ainsi que le nombre total de simulationsn, alors il est possible de choisir le nombre de simulations [βjn] par strate pour minimiser la variance de l’estimateur. En posantqj = (αj−αj−1)2
pj(y)−pj(y)2
, le probl`eme de minimisation
argmin
Xm j=1
qj
βj
sous la contrainte βj ≥0, Xm j=1
βj = 1
a pour solution :
βj = qj1/2 Pm
l=1q1/2l
Avec ce choix optimal, la variance r´eduite de l’estimateur ˆF(y) est
σ2 =
Xm j=1
(αj−αj−1)
pj(y)−pj(y)21/2
2
(5.4.12)
Noter que le choix optimal desβj d´epend en g´en´eral de y, et qu’on ne peut donc pas proposer de choix qui soit optimal pour l’estimation compl`ete de la fonction de r´epartition. On peut cependant voir que :
1) Si le contrˆole est faible, alors pj(y) d´epend faiblement de y, et le choix optimal est alors βj =αj−αj−1.
2) Si le contrˆole est fort, alors il faut mettre plus de simulations dans les strates ]zαj−1, zαj] autour deF(y). En effet, supposons par exemple un contrˆole tr`es fort, dans le sens o`uZ =φ(Y) est une fonction croissante deY. Alors
pj(y) =P(Y ≤y|Z ∈]zαj−1, zαj]) =P(Y ≤y≤ |Y ∈]φ−1(zαj−1), φ−1(zαj)])
est ´egal `a 1 sizαj ≤φ(y) (i.e.αj ≤F(y)) et `a 0 sizαj−1 > φ(y) (i.e.αj−1 > F(y)). Dans les deux cas, qj, et doncβj, est nul, et il faut mettre toutes les simulations dans la strate ]zαj0−1, zαj0] pour laquelle αj0−1 < F(y) ≤αj0. Bien sˆur, le contrˆole tr`es fort suppos´e ici est peu r´ealiste, mais cet exemple illustre bien comment varie la r´epartition optimale des simulations dans les strates.
5.4.3.2 Estimateur adaptatif de la fonction de r´epartition
Nous savons maintenant qu’il existe un choix optimal pour la r´epartition desnsimulations sur lesmstrates. Cette r´epartition d´epend despj(y), qui sont les quantit´es `a estimer. On peut alors proposer une proc´edure adaptative :
1) On commence par appliquer la proc´edure de stratification contrˆol´ee avecen=nγsimulations, γ ∈]0,1[, et avec un choix a priori desβj, et on obtient ainsi une premi`ere estimation despj(y) :
e
pj(y) = 1 [βjen]
[βXjn]e i=1
1Yi(j)≤y
2) On estime la proportion id´eale de simulations par strates : βej = (αj −αj−1)
e
pj(y)−pej(y)21/2
Pm
l=1(αl−αl−1) [pel(y)−pel(y)2]1/2
3) On effectue lesn−enderni`eres simulations en affectant le nombre de simulations n´ec´essaires dans chaque strate pour atteindre le nombre optimal estim´e [nβej].
4) On peut alors estimerpj(y) et F(y) par
ˆ
pj(y) = 1 [βejn]
[Xβejn]
i=1
1Yi(j)≤y, Fˆ(y) = Xm j=1
ˆ
pj(y)(αj−αj−1)
L’estimateur ˆF(y) obtenu par stratification contrˆol´ee adaptative (SCA) est asymptotiquement normal
√n
Fˆ(y)−F(y)
|SCAn−→ N→∞ (0, σ2), σ2=
Xm j=1
(αj−αj−1)
pj(y)−pj(y)21/2
2
(5.4.13) L’expression de la variance r´eduiteσ2 est donc la mˆeme que celle de la variance r´eduite (5.4.12) de l’estimateur lorsqu’on choisit a priori la r´epartition optimale des βj. La diff´erence est que, dans la cas de l’estimateur adaptatif, la varianceσ2/nest atteinte asymptotiquement par ˆF(y) lorsquen→ ∞, alors que pour l’estimateur optimal, la variance estσ2/npour tout n.
5.4.3.3 R´eduction de variance
On va mener ici une analyse de la r´eduction de variance apport´ee par la m´ethode de stratification contrˆol´ee adaptative ou non dans le cas dem= 2 strates.
Dans le cas de la m´ethode PS, ou dans le cas de la stratification contrˆol´ee en imposant βj =αj−αj−1, la variance r´eduite dans (5.4.3) est
σ2 |PS=α−1P(Y ≤y, Z ≤zα)P(Y > y, Z ≤zα) + (1−α)−1P(Y ≤y, Z > zα)P(Y > y, Z > zα)
Dans le cas de la stratification contrˆol´ee adaptative, l’expression de la variance r´eduiteσ2dans
Pour pouvoir comparer la r´eduction de variance apport´ee par la m´ethode de variable de contrˆole et celles apport´ees par les m´ethodes de stratification contrˆol´ee, il faut comparer ces expressions avec (5.3.9). Pour rendre cette comparaison plus explicite, on peut par exemple supposer que ρI est petit, et d´evelopper chaque expression enρI. On trouve
σ2 |VC = F(y)(1−F(y)) alors que la variance r´eduite pour l’estimateur empirique usuel estF(y)(1−F(y)). Cela montre que les m´ethodes par variable de contrˆole et par stratification contrˆol´ee adaptative apportent `a peu pr`es la mˆeme r´eduction de variance lorsqu’on cherche `a estimer la fonction de r´epartition autour de la m´edianeF(y)∼1/2 (en fait, la m´ethode SCA apporte une r´eduction de variance par un facteur ∼1−ρ2I/2 si F(y) ∼1/2). Mais, lorsqu’on cherche `a estimer les queues de la fonction de r´epartitionF(y)∼0 ou 1, alors la m´ethode par stratification contrˆol´ee adaptative apporte une bien meilleure r´eduction de variance.
Les expressions que l’on vient d’obtenir permettent aussi d’orienter le choix a priori deα.
En effet, la r´eduction de variance sera d’autant plus grande que le coefficient de corr´elationρI
est grand. Si on suppose par exemple que Z =φ(Y) est une fonction croissante de Y, ce qui repr´esente le cas d’un contrˆole tr`es fort, alors on trouve que
ρI =
α(1−F(y)) (1−α)F(y)
1/2
si zα < φ(y) (1−α)F(y)
α(1−F(y)) 1/2
si zα ≥φ(y)
En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de r´epartition autour d’un certainy, alors on a int´erˆet `a choisir α=F(y).
Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la r´eduction de variance pour les m´ethodes VC, PS, SC et SCA dans le cas o`u le nombre m de strates est grand. Das la m´ethode PS et dans la m´ethode SC avec la distributionβj =αj−αj−1, la variance r´eduite est (5.4.3). Si la probabilit´e conditionnelle P(Y ≤ y|Z) a une densit´e continueg∗ par rapport `a la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞
σ2 |PS=E
P(Y ≤y|Z)−P(Y ≤y|Z)2
=F(y)−E
P(Y ≤y|Z)2
Il s’agit en fait de la variance r´eduite de l’estimateur CV avec la fonction de contrˆole optimale g∗ d´efinie par (5.3.13). Dans la m´ethode SCA, l’expression de la variance r´esuiteσ2est (5.4.13) qui a la limite suivante quandm→ ∞
σ2|SCA=Eh
P(Y ≤y|Z)−P(Y ≤y|Z)21/2i2
L’in´egalit´e de Cauchy-Schwarz montre alors clairement que la r´eduction de variance est plus importante pour la m´ethode SCA que pour la m´ethode CV utilisant la fonction de contrˆole optimaleg∗.
5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile