• Aucun résultat trouvé

Stratification contrˆol´ee adaptative

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 189-193)

Chapitre 4 : Application au combustible HTR 113

5.4 Estimation de quantile par stratification contrˆol´ee

5.4.3 Stratification contrˆol´ee adaptative

5.4.3.1 Choix optimal du nombre de simulations par strates

Consid´erons l’estimateur par stratification contrˆol´ee d´ecrit dans la section 5.4.1.1 et repre-nons les mˆemes notations. Fixons y ∈R. L’estimateur (5.4.1) de F(y) est asymptotiquement

normal et sa variance r´eduiteσ2 est donn´ee par (5.4.3) : σ2 =

Xm j=1

j −αj−1)2 βj

pj(y)−pj(y)2

En fait, si on n´eglige les petites erreurs dues aux parties enti`eres, σ2/n est la variance de l’estimateur ˆF(y) pour tout n en vertu de (5.4.2).

Si on se fixe le nombrem et les niveaux (αj)j=0,...,m des strates, ainsi que le nombre total de simulationsn, alors il est possible de choisir le nombre de simulations [βjn] par strate pour minimiser la variance de l’estimateur. En posantqj = (αj−αj−1)2

pj(y)−pj(y)2

, le probl`eme de minimisation

argmin



 Xm j=1

qj

βj



 sous la contrainte βj ≥0, Xm j=1

βj = 1

a pour solution :

βj = qj1/2 Pm

l=1q1/2l

Avec ce choix optimal, la variance r´eduite de l’estimateur ˆF(y) est

σ2 =



 Xm j=1

j−αj−1)

pj(y)−pj(y)21/2



2

(5.4.12)

Noter que le choix optimal desβj d´epend en g´en´eral de y, et qu’on ne peut donc pas proposer de choix qui soit optimal pour l’estimation compl`ete de la fonction de r´epartition. On peut cependant voir que :

1) Si le contrˆole est faible, alors pj(y) d´epend faiblement de y, et le choix optimal est alors βjj−αj1.

2) Si le contrˆole est fort, alors il faut mettre plus de simulations dans les strates ]zαj−1, zαj] autour deF(y). En effet, supposons par exemple un contrˆole tr`es fort, dans le sens o`uZ =φ(Y) est une fonction croissante deY. Alors

pj(y) =P(Y ≤y|Z ∈]zαj−1, zαj]) =P(Y ≤y≤ |Y ∈]φ1(zαj−1), φ1(zαj)])

est ´egal `a 1 sizαj ≤φ(y) (i.e.αj ≤F(y)) et `a 0 sizαj−1 > φ(y) (i.e.αj1 > F(y)). Dans les deux cas, qj, et doncβj, est nul, et il faut mettre toutes les simulations dans la strate ]zαj0−1, zαj0] pour laquelle αj01 < F(y) ≤αj0. Bien sˆur, le contrˆole tr`es fort suppos´e ici est peu r´ealiste, mais cet exemple illustre bien comment varie la r´epartition optimale des simulations dans les strates.

5.4.3.2 Estimateur adaptatif de la fonction de r´epartition

Nous savons maintenant qu’il existe un choix optimal pour la r´epartition desnsimulations sur lesmstrates. Cette r´epartition d´epend despj(y), qui sont les quantit´es `a estimer. On peut alors proposer une proc´edure adaptative :

1) On commence par appliquer la proc´edure de stratification contrˆol´ee avecen=nγsimulations, γ ∈]0,1[, et avec un choix a priori desβj, et on obtient ainsi une premi`ere estimation despj(y) :

e

pj(y) = 1 [βjen]

Xjn]e i=1

1Yi(j)≤y

2) On estime la proportion id´eale de simulations par strates : βej = (αj −αj1)

e

pj(y)−pej(y)21/2

Pm

l=1l−αl1) [pel(y)−pel(y)2]1/2

3) On effectue lesn−enderni`eres simulations en affectant le nombre de simulations n´ec´essaires dans chaque strate pour atteindre le nombre optimal estim´e [nβej].

4) On peut alors estimerpj(y) et F(y) par

ˆ

pj(y) = 1 [βejn]

[Xβejn]

i=1

1Yi(j)≤y, Fˆ(y) = Xm j=1

ˆ

pj(y)(αj−αj1)

L’estimateur ˆF(y) obtenu par stratification contrˆol´ee adaptative (SCA) est asymptotiquement normal

√n

Fˆ(y)−F(y)

|SCAn−→ N→∞ (0, σ2), σ2=



 Xm j=1

j−αj1)

pj(y)−pj(y)21/2



2

(5.4.13) L’expression de la variance r´eduiteσ2 est donc la mˆeme que celle de la variance r´eduite (5.4.12) de l’estimateur lorsqu’on choisit a priori la r´epartition optimale des βj. La diff´erence est que, dans la cas de l’estimateur adaptatif, la varianceσ2/nest atteinte asymptotiquement par ˆF(y) lorsquen→ ∞, alors que pour l’estimateur optimal, la variance estσ2/npour tout n.

5.4.3.3 R´eduction de variance

On va mener ici une analyse de la r´eduction de variance apport´ee par la m´ethode de stratification contrˆol´ee adaptative ou non dans le cas dem= 2 strates.

Dans le cas de la m´ethode PS, ou dans le cas de la stratification contrˆol´ee en imposant βjj−αj−1, la variance r´eduite dans (5.4.3) est

σ2 |PS−1P(Y ≤y, Z ≤zα)P(Y > y, Z ≤zα) + (1−α)−1P(Y ≤y, Z > zα)P(Y > y, Z > zα)

Dans le cas de la stratification contrˆol´ee adaptative, l’expression de la variance r´eduiteσ2dans

Pour pouvoir comparer la r´eduction de variance apport´ee par la m´ethode de variable de contrˆole et celles apport´ees par les m´ethodes de stratification contrˆol´ee, il faut comparer ces expressions avec (5.3.9). Pour rendre cette comparaison plus explicite, on peut par exemple supposer que ρI est petit, et d´evelopper chaque expression enρI. On trouve

σ2 |VC = F(y)(1−F(y)) alors que la variance r´eduite pour l’estimateur empirique usuel estF(y)(1−F(y)). Cela montre que les m´ethodes par variable de contrˆole et par stratification contrˆol´ee adaptative apportent `a peu pr`es la mˆeme r´eduction de variance lorsqu’on cherche `a estimer la fonction de r´epartition autour de la m´edianeF(y)∼1/2 (en fait, la m´ethode SCA apporte une r´eduction de variance par un facteur ∼1−ρ2I/2 si F(y) ∼1/2). Mais, lorsqu’on cherche `a estimer les queues de la fonction de r´epartitionF(y)∼0 ou 1, alors la m´ethode par stratification contrˆol´ee adaptative apporte une bien meilleure r´eduction de variance.

Les expressions que l’on vient d’obtenir permettent aussi d’orienter le choix a priori deα.

En effet, la r´eduction de variance sera d’autant plus grande que le coefficient de corr´elationρI

est grand. Si on suppose par exemple que Z =φ(Y) est une fonction croissante de Y, ce qui repr´esente le cas d’un contrˆole tr`es fort, alors on trouve que

ρI =









α(1−F(y)) (1−α)F(y)

1/2

si zα < φ(y) (1−α)F(y)

α(1−F(y)) 1/2

si zα ≥φ(y)

En tant que fonction de α, cette fonction est maximale lorsque α = F(y). Cela montre que, si on veut estimer la fonction de r´epartition autour d’un certainy, alors on a int´erˆet `a choisir α=F(y).

Pour finir cette section, nous allons effectuer une nouvelle analyse asymptotique de la r´eduction de variance pour les m´ethodes VC, PS, SC et SCA dans le cas o`u le nombre m de strates est grand. Das la m´ethode PS et dans la m´ethode SC avec la distributionβjj−αj1, la variance r´eduite est (5.4.3). Si la probabilit´e conditionnelle P(Y ≤ y|Z) a une densit´e continueg par rapport `a la mesure de Lebesgue, alors (5.4.3) est une somme de Riemann qui a la limite suivante quandm→ ∞

σ2 |PS=E

P(Y ≤y|Z)−P(Y ≤y|Z)2

=F(y)−E

P(Y ≤y|Z)2

Il s’agit en fait de la variance r´eduite de l’estimateur CV avec la fonction de contrˆole optimale g d´efinie par (5.3.13). Dans la m´ethode SCA, l’expression de la variance r´esuiteσ2est (5.4.13) qui a la limite suivante quandm→ ∞

σ2|SCA=Eh

P(Y ≤y|Z)−P(Y ≤y|Z)21/2i2

L’in´egalit´e de Cauchy-Schwarz montre alors clairement que la r´eduction de variance est plus importante pour la m´ethode SCA que pour la m´ethode CV utilisant la fonction de contrˆole optimaleg.

5.4.4 Stratification control´ee adaptative pour l’estimation d’un quantile

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 189-193)