Stratification contrôlée adaptative - Estimation de quantile par stratification contrôlée

Chapitre 4 : Application au combustible HTR 113

5.4 Estimation de quantile par stratification contrˆol´ee

5.4.3 Stratification contrˆol´ee adaptative

5.4.3.1 Choix optimal du nombre de simulations par strates

Considérons l’estimateur par stratification contrôlée décrit dans la section 5.4.1.1 et repre-nons les mêmes notations. Fixons y ∈R. L’estimateur (5.4.1) de F(y) est asymptotiquement

normal et sa variance r´eduiteσ² est donn´ee par (5.4.3) : σ² =

Xm j=1

(α_j −α_j−1)² β_j

p_j(y)−p_j(y)²

En fait, si on n´eglige les petites erreurs dues aux parties enti`eres, σ²/n est la variance de l’estimateur ˆF(y) pour tout n en vertu de (5.4.2).

Si on se fixe le nombrem et les niveaux (α_j)_j=0,...,m des strates, ainsi que le nombre total de simulationsn, alors il est possible de choisir le nombre de simulations [β_jn] par strate pour minimiser la variance de l’estimateur. En posantq_j = (α_j−α_j−1)²

p_j(y)−p_j(y)²

, le probl`eme de minimisation

argmin



 Xm j=1

β_j



 sous la contrainte β_j ≥0, Xm j=1

β_j = 1

a pour solution :

βj = q_j^1/2 Pm

l=1q^1/2_l

Avec ce choix optimal, la variance r´eduite de l’estimateur ˆF(y) est

σ² =



 Xm j=1

(α_j−α_j−1)

p_j(y)−p_j(y)²1/2





(5.4.12)

Noter que le choix optimal desβ_j dépend en général de y, et qu’on ne peut donc pas proposer de choix qui soit optimal pour l’estimation complète de la fonction de répartition. On peut cependant voir que :

1) Si le contrˆole est faible, alors p_j(y) d´epend faiblement de y, et le choix optimal est alors β_j =α_j−α_j₋₁.

2) Si le contrôle est fort, alors il faut mettre plus de simulations dans les strates ]z_αj−1, z_α_j] autour deF(y). En effet, supposons par exemple un contrôle très fort, dans le sens oùZ =φ(Y) est une fonction croissante deY. Alors

p_j(y) =P(Y ≤y|Z ∈]z_α_j−1, z_α_j]) =P(Y ≤y≤ |Y ∈]φ⁻¹(z_α_j−1), φ⁻¹(z_α_j)])

est égal à 1 siz_α_j ≤φ(y) (i.e.α_j ≤F(y)) et à 0 siz_α_j−1 > φ(y) (i.e.α_j₋₁ > F(y)). Dans les deux cas, qj, et doncβj, est nul, et il faut mettre toutes les simulations dans la strate ]zαj0−1, zαj0] pour laquelle α_j₀₋₁ < F(y) ≤α_j₀. Bien sûr, le contrôle très fort supposé ici est peu réaliste, mais cet exemple illustre bien comment varie la répartition optimale des simulations dans les strates.

5.4.3.2 Estimateur adaptatif de la fonction de r´epartition

Nous savons maintenant qu’il existe un choix optimal pour la répartition desnsimulations sur lesmstrates. Cette répartition dépend desp_j(y), qui sont les quantités à estimer. On peut alors proposer une procédure adaptative :

1) On commence par appliquer la procédure de stratification contrôlée avecen=n^γsimulations, γ ∈]0,1[, et avec un choix a priori desβ_j, et on obtient ainsi une première estimation desp_j(y) :

p_j(y) = 1 [β_jen]

[βXjn]e i=1

1Y_i^(j)≤y

2) On estime la proportion id´eale de simulations par strates : βej = (α_j −α_j₋₁)

p_j(y)−pe_j(y)²1/2

l=1(α_l−α_l₋₁) [pe_l(y)−pe_l(y)²]^1/2

3) On effectue lesn−endernières simulations en affectant le nombre de simulations nécéssaires dans chaque strate pour atteindre le nombre optimal estimé [nβe_j].

4) On peut alors estimerp_j(y) et F(y) par

p_j(y) = 1 [βejn]

[Xβejn]

i=1

1Y_i^(j)≤y, Fˆ(y) = Xm j=1

p_j(y)(α_j−α_j₋₁)

L’estimateur ˆF(y) obtenu par stratification contrˆol´ee adaptative (SCA) est asymptotiquement normal

√n

Fˆ(y)−F(y)

|SCAⁿ−→ N^→∞ (0, σ²), σ²=



 Xm j=1

(α_j−α_j₋₁)

p_j(y)−p_j(y)²1/2





(5.4.13) L’expression de la variance réduiteσ² est donc la même que celle de la variance réduite (5.4.12) de l’estimateur lorsqu’on choisit a priori la répartition optimale des β_j. La différence est que, dans la cas de l’estimateur adaptatif, la varianceσ²/nest atteinte asymptotiquement par ˆF(y) lorsquen→ ∞, alors que pour l’estimateur optimal, la variance estσ²/npour tout n.

5.4.3.3 R´eduction de variance

On va mener ici une analyse de la réduction de variance apportée par la méthode de stratification contrôlée adaptative ou non dans le cas dem= 2 strates.

Dans le cas de la méthode PS, ou dans le cas de la stratification contrôlée en imposant β_j =α_j−α_j−1, la variance réduite dans (5.4.3) est

σ² |PS=α⁻¹P(Y ≤y, Z ≤z_α)P(Y > y, Z ≤z_α) + (1−α)⁻¹P(Y ≤y, Z > z_α)P(Y > y, Z > z_α)

Dans le cas de la stratification contrôlée adaptative, l’expression de la variance réduiteσ²dans

Pour pouvoir comparer la réduction de variance apportée par la méthode de variable de contrôle et celles apportées par les méthodes de stratification contrôlée, il faut comparer ces expressions avec (5.3.9). Pour rendre cette comparaison plus explicite, on peut par exemple supposer que ρ_I est petit, et développer chaque expression enρ_I. On trouve

σ² |VC = F(y)(1−F(y)) alors que la variance réduite pour l’estimateur empirique usuel estF(y)(1−F(y)). Cela montre que les méthodes par variable de contrôle et par stratification contrôlée adaptative apportent à peu près la même réduction de variance lorsqu’on cherche à estimer la fonction de répartition autour de la médianeF(y)∼1/2 (en fait, la méthode SCA apporte une réduction de variance par un facteur ∼1−ρ²_I/2 si F(y) ∼1/2). Mais, lorsqu’on cherche à estimer les queues de la fonction de répartitionF(y)∼0 ou 1, alors la méthode par stratification contrôlée adaptative apporte une bien meilleure réduction de variance.

Les expressions que l’on vient d’obtenir permettent aussi d’orienter le choix a priori deα.

En effet, la r´eduction de variance sera d’autant plus grande que le coefficient de corr´elationρ_I

est grand. Si on suppose par exemple que Z =φ(Y) est une fonction croissante de Y, ce qui représente le cas d’un contrôle très fort, alors on trouve que

ρI =











α(1−F(y)) (1−α)F(y)

1/2

si z_α < φ(y) (1−α)F(y)

α(1−F(y)) 1/2

si zα ≥φ(y)

En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de répartition autour d’un certainy, alors on a intérêt à choisir α=F(y).

Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la réduction de variance pour les méthodes VC, PS, SC et SCA dans le cas où le nombre m de strates est grand. Das la méthode PS et dans la méthode SC avec la distributionβ_j =α_j−α_j₋₁, la variance réduite est (5.4.3). Si la probabilité conditionnelle P(Y ≤ y|Z) a une densité continueg^∗ par rapport à la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞

σ² |PS=E

P(Y ≤y|Z)−P(Y ≤y|Z)²

=F(y)−E

P(Y ≤y|Z)²

Il s’agit en fait de la variance réduite de l’estimateur CV avec la fonction de contrôle optimale g^∗ définie par (5.3.13). Dans la méthode SCA, l’expression de la variance résuiteσ²est (5.4.13) qui a la limite suivante quandm→ ∞

σ²|SCA=Eh

P(Y ≤y|Z)−P(Y ≤y|Z)²1/2i2

L’inégalité de Cauchy-Schwarz montre alors clairement que la réduction de variance est plus importante pour la méthode SCA que pour la méthode CV utilisant la fonction de contrôle optimaleg^∗.

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 189-193)