J sont ind´ependants, alors la variance de IbnS est donn´ee par Var IbnS = J X j=1 p2jσj2 nj

(1)

Universit´e de Strasbourg S´egolen Geffray

M1 - Magist`ere geffray@math.unistra.fr

Statistique - ´etudes de cas Ann´ee 2014/2015

Sujet 4: variations autour de la m´ethode de Monte-Carlo

• Echantillonnage stratifi´e:

On veut calculerI =E[ϕ(X)] = Z

ϕ(x)f(x)dxoùXest une variable aléatoire deR^dadmettant la densité f par rapport à la mesure de Lebesgue. On introduit une partition (A_j)_j=1,...,J de X(Ω) ⊂R^det on pose p_j =E[ϕ(X)|X ∈A_j] pourj = 1, ..., J. On réécrit alors I sous la forme:

I =

J

X

j=1

E[ϕ(X)|X ∈A_j]P(X ∈A_j) =

J

X

j=1

p_jI_j.

L’idée de la méthode consiste à estimer I_j par la moyenne empirique Ib_j d’un échantillon de taille n_j de la loi conditionnelle deX sachant{X ∈A_j}, ce qui mène à l’estimateur suivant de I:

Ib_n^S =

J

X

j=1

p_jIb_j.

L’estimateur Ib_n^S est sans biais pour I et fortement consistant lorsque n_j → ∞pourj = 1, ..., J.

Notons σ_j² = Var(ϕ(X)|X ∈ A_j). Si les estimateurs Ib_j pour j = 1, ..., J sont ind´ependants, alors la variance de Ib_n^S est donn´ee par

Var Ib_n^S

=

J

X

j=1

p²_jσ_j² n_j .

Si l’on dispose d’un total de n =

J

X

j=1

n_j simulations, alors alors le minimum de Var Ib_n^S

sous la contrainte de n =

J

X

j=1

n_j est r´ealis´e lorsque σ_j =cp_jσ_j pourj = 1, ..., J soit

n_j =n pjσj

PJ

k=1pkσk

et vaut

Var Ib_n^S

= 1 n

J

X

j=1

p_jσ_j

!² .

Il reste à comparer cette variance à la variance de l’estimateur par la méthode Monte-Carlo usuelle Ib_n= 1

n

X

i=1

ϕ(X_i) laquelle vaut

Var

Ibn

= Var(ϕ(X))

n .

1

(2)

D´ecomposons

Var(ϕ(X)) =E

ϕ(X)²

−E[ϕ(X)]²

=

J

X

j=1

p_jE

ϕ(X)²|X ∈A_j

−

J

X

j=1

p_jE[ϕ(X)|X ∈A_j]

!2

=

J

X

j=1

p_jσ_j²+

J

X

j=1

p_jE[ϕ(X)|X ∈A_j]²−

J

X

j=1

!2

Utilisons la convexit´e de la fonction x→x² et le fait que

J

X

j=1

p_j = 1 pour obtenir que

J

X

j=1

p_jE[ϕ(X)|X ∈A_j]² ≥

J

X

j=1

!²

et donc

Var(ϕ(X))≥

J

X

j=1

p_jσ_j².

En r´eutilisant la convexit´e de la fonction x→x² et le fait que

J

X

j=1

p_j = 1, on en conclut que

Var(Ib_n)≥ 1 n

J

X

j=1

p_jσ_j

!2

= Var Ib_n^S

.

Notons toutefois que le choix optimal de n_j demande de connaˆıtre les variances conditionnelles σ_j² ce qui n’est pas toujours le cas. On peut penser les estimer à leur tour par méthode de Monte-Carlo ... mais il faut prendre garde au fait qu’un mauvais choix des n_j peut augmenter la variance. Cependant, notons que le choix n_j = np_j diminue toujours la variance même s’il n’est pas optimal. En effet, dans ce cas, on a

Var Ib_n^S

= 1 n

J

X

j=1

p_jσ_j² ≤ Var (ϕ(X))

n = Var(bI_n).

Pour simuler des variables selon une loi uniforme stratifi´ee, on peut proc´eder comme suit:

• on choisit une partition de ]0,1] =

J

[

j=1

A_j o`u lesA_j sont disjoints et de la formeA_j =]a_j, b_j] (typiquement, on peut choisir A_j =ij−1

J , j J i

)

• la loi de U ∼ U(0,1) conditionnelle `a {U ∈A_j} est la loi U(a_j, b_j)

• on génère donc un échantillon de taillen_j de V_i,j ∼ U(a_j, b_j)

• on fournit les variables Vi,j

2

(3)

Pour simuler des variables selon une loi quelconque de fonction de répartition associée notée F stratifiée, on peut procéder comme suit:

• on choisit la partition de ]0,1] =

J

[

j=1

A_j o`u les A_j sont de la forme A_j =]aj−1, a_j] avec a₀ = −∞, a_j = F⁻¹

j

X

`=1

p_`

!

pour j = 1, ..., J o`u l’on se donne les p_j sont tels que 0< p_j <1 et

J

X

j=1

p_j = 1.

NB: dans le cas o`u aJ = +∞, on prend Aj =]aJ−1, aJ[

• la loi de U ∼ U(0,1) conditionnelle `a {U ∈A_j} est la loi U(a_j, b_j)

• on génère un échantillon de taillen_j de V_i,j ∼ U(aj−1, a_j)

• on fournit les variables Y_i,j =F⁻¹(V_i,j) qui suivent la loi F sachant que Y_i,j ∈A_j.

Exercice 1.

Calculer une estimation de π en utilisant le fait que l’int´egrale suivante vautπ:

I₁ = Z 1

0

√ 2

1−x²dx.

Pour cela, vous utiliserez tour `a tour:

1. la méthode de Monte-Carlo usuelle, 2. la méthode des variables antithétiques, 3. la méthode de stratification,

4. la méthode de l’échantillonnage préférentiel en coupant l’intégrale en deux et en choisissant sur chaque morceau une loi de proposition de densité affine.

Comparer l’efficacité des différentes méthodes mises en oeuvre.

3