Méthodes de Monte-Carlo

(1)

Méthodes de Monte-Carlo

Examen du mardi 28 janvier 2020

Partie 1 : Une technique de biaisage adapté à des calculs de risques

On s’intéresse à la modélisation d’un cumul de risques petits mais nombreux (on peut penser au risque d’une compagnie d’assurance automobile ou au risque de défaillance de contrepartie d’une banque) et au calcul de la “value at risk” associée.

Pour cela, on considèremvariables aléatoires de Bernouilli (valant0ou1) indépendantesY = (Y1, . . . , Ym) telles que, pouri= 1, . . . , m,P(Y_i = 1) =p_i = 1−P(Y_i = 0),0< p_i <1.

Y_i = 1correspond à la réalisation de la pertei. On se donne aussi une famille(e₁, . . . , e_m)où chaquee_iest un réel strictement positif représentant la valeur de la perte lorsque le risqueise réalise.

On s’intéresse au risque totalL, donné parL=l(Y)où

l(y) =e₁y₁+· · ·+e_my_m.

On cherche en particulier à calculer des probabilités du typeP(L > c)pour des valeurs de cette probabilité petite, en vue d’évalue une “value at risk”.

1. Montrer que

P(L > c) = X

y∈{0,1}^m

1{l(y)> c}

m

Y

i=1

p^y_iⁱ(1−p_i)^1−yⁱ.

Lorsquemest de l’ordre de quelques milliers est il raisonnable d’espérer calculer explicitement cette somme (2¹⁰⁰⁰ >10⁶⁹³)?

On va utiliser une méthode de Monte-Carlo pour évaluer cette probabilité. Expliquer comme simuler la variable aléatoireLà partir demtirages indépendants et uniformes sur[0,1].

2. Lorsque la probabilité que l’on cherche à calculer P(L > c) est d’ordre 10⁻³, donner l’ordre de grandeur du nombre de tirages deLqui sont nécessaires pour obtenir une précision relative de l’ordre de50%sur la probabilité.

3. On poseM(t) = E(e^t×l(Y⁾), pour unt ≥ 0. CalculerM(t)explicitement en fonction det, des p_i et dese_i.

4. Poury = (y₁, . . . , y_m)oùy_i ∈ {0,1}, i = 1, . . . , m, on notepla loi de Y, p(y) = P(Y = y). On définitq_t(y)par,

qt(y) = e^t×l(y) M(t)p(y).

Vérifier queqtest la loi d’une variable aléatoire et que qt(y) =

m

Y

i=1

q^y_t,iⁱ(1−qt,i)^1−yⁱ, lesq_t,i prenant des valeurs que l’on explicitera.

5. Comment peut on simuler un vecteur aléatoireY_tselon la loi deq_t?

6. SiYtsuit la loiqt, vérifier que, pour toute fonction mesurable bornéef deRdansR E(f(Y_t)) = 1

M(t)E(e^t×l(Y⁾f(Y)).

(2)

7. On noteψla fonction définie parψ(t) =E(l(Y_t)). Montrer que ψ(t) =

m

X

i=1

p_ie_i

p_i+ (1−p_i)e^−teⁱ.

En déduire queψest une fonction strictement croissante detet calculer ses limites en±∞.

En déduire que, pour tout c, 0 < c < Pm

i=1ei, il existe un unique tc entre −∞ et +∞ tel que E(l(Y_t_c)) =c. Vérifier quet_cest strictement positif lorsquec > Pm

i=1p_ie_i =E(l(Y)).

On va voir dans ce qui suit que l’on peut utiliser cette valeurt_cpour réduire la variance de la méthode de Monte-Carlo précédente.

8. Montrer que, siYtest un vecteur aléatoire de loiqt, on a pour toute fonctionf˜nesurable bornée deR dansR

E( ˜f(Y)) =M(t)E

f˜(Y_t)e^−t×l(Y^t⁾ . En déduire queP(Y > c) =E(Z_t)oùZ_t =M(t)1{l(Yt)> c}e^−t×l(Y^t⁾.

Expliquer comment utiliser cette derniere égalité pour construire une nouvelle méthode de Monte- Carlo. A quelle condition sur Z_t cette méthode est-elle préférable à la méthode de Monte-Carlo classique ?

9. On va maintenant expliciter la variance deZ_t. Montrer que E Z_t²

=M(t)E

e^−t×l(Y⁾1{l(Y)> c}

. 10. Vérifier que _dt^dM(t) = M(t)E(l(Y_t)),puis que

d

dtVar(Z_t) =M(t)E

{E(l(Y_t))−l(Y)}1{l(Y)> c}e^−t×l(Y⁾ . Lorsquec >Pm

i=1p_ie_i, en déduire que sur l’intervalle[0, t_c], la variance deZ_test décroissante.

Comment utiliser ce résultat pour proposer une méthode de réduction de variance pour le calcul de P(L > c)?

(3)

Partie 2 : Ordre convexe entre deux diffusions via leurs schémas d’Euler

Soit T > 0 un horizon de temps. Sur un espace de probabilité (Ω,A,P) muni d’une filtration(Ft)t≥0, on considère un F_t-mouvement brownienW_t à valeurs R^d. On se donne également des coefficientsσ : [0, T]×Rⁿ →R^n×detb : [0, T]×Rⁿ→Rⁿmesurables et qui vérifient

(Lip)∃K<∞, ∀t∈[0,T],

(∀x∈Rⁿ, |σ(t, x)|+|b(t, x)| ≤K(1 +|x|)

∀x, y ∈Rⁿ, |σ(t, x)−σ(t, y)|+|b(t, x)−b(t, y)| ≤K|x−y| . On s’intéresse à l’Équation Différentielle Stochastique

(dXt =σ(t, Xt)dWt+b(t, Xt)dt, t∈[0, T]

X0 =z ∈Rⁿ (1)

1. Quel résultat assure l’existence d’une unique solutionX = (X_t)_t∈[0,T]à (44)?

SoitN ∈N^∗,(t_k = ^kT_N)0≤k≤N+1etτ_t=b^{N t}_T c_N^T l’instant de cette grille uniforme qui précèdet ∈[0, T].

2. Écrire le schéma d’Euler en temps continu(X_t^N)t∈[0,T]de pasT /N. 3. Rappeler le résultat de convergence forte de ce schéma.

Pourx_0:N ∈R^N⁺¹on noteL_N[x_0:N]la fonction définie par

∀t ∈[0, T], L_N[x_0:N](t) =

1− N

T (t−τ_t)

x_bN t T c+ N

T (t−τ_t)x_1+bN t T c. Enfin, pourk ∈ {0, . . . , N}, on noteX_t_0:k = (X_t₀, X_t₁, . . . , X_t_k)etX_t^N

0:k = (X_t^N₀, X_t^N₁, . . . , X_t^N

k).

5. Montrer que pourx_0:N, y_0:N ∈R^N+1,sup_t∈[0,T]|L_N[x_0:N](t)− L_N[y_0:N](t)|= max0≤k≤N|x_k−y_k|.

En déduire queE[sup_t∈[0,T_]|L_N[X_t^N_0:N](t)−X_t|]tend vers0lorsqueN → ∞.

6. Conclure que pour toute fonctionnelleΦ :C([0, T],R)→Rlipschitzienne sur l’espaceC([0, T],R) des fonctionsg continues de[0, T]dansRmuni de la normesup_t∈[0,T_]|g(t)|, E[Φ(L_N[X_t^N

0:N])]tend versE[Φ(X)]lorsqueN → ∞.

On se place désormais en dimension n =d = 1 et on suppose que le coefficient de dérivebest nul, et que pour toutt∈[0, T],R3x7→σ(t, x)est convexeet à valeurs dansR+.

Soit Φ_N : R^N+1 → R une fonction convexe à croissance affine. Pour k ∈ {0, . . . , N − 1}, et (x_0:k, u) ∈ R^k+1 ×R avec x_0:k = (x₀, x₁, . . . , x_k), on définit par récurrence descendante Ψ_k(x_0:k, u) = E[Φk+1(x0:k, xk+u(Wt_k+1 −Wt_k))]etΦk(x0:k) = Ψk(x0:k, σ(tk, xk)).

7. Vérifier que pourk ∈ {0, . . . , N −1},E[Φ_k+1(X_t^N

0:k+1)|X_t^N

0:k] = Φ_k(X_t^N

0:k). En déduire queΦ₀(z) = E

ΦN(X_t^N_0:N) .

8. Vérifier que pourx_0:k∈R^k+1 et0≤u≤v,

Ψ_k(x_0:k, v) =E[Φ_k+1(x_0:k, x_k+u(W_t_k+1−W_t_k) +√

v²−u²(W_t_k+2 −W_t_k₊₁))]

et en déduire que siΦ_k+1 est convexe alors

∀x_0:k ∈R^k+1, ∀0≤u≤v, Ψ_k(x_0:k, u)≤Ψ_k(x_0:k, v).

(4)

9. Vérifier également que la convexité deΦ_k+1entraîne celle deΨ_k.

10. Montrer que pour toutk ∈ {0, . . . , N −1}, Φ_k est convexe. On pourra comparerΦ_k(αx_0:k+ (1− α)y_0:k)àαΦ_k(x_0:k) + (1−α)Φ_k(y_0:k)avecα∈[0,1],x_0:k, y_0:k ∈R^k+1.

On noteY^N le schéma d’Euler de pas _N^T pour l’équation différentielle stochastique dY_t=η(t, Y_t)dW_t, Y₀ =z oùη: [0, T]×R→R₊est telle que

∃K <∞, ∀t∈[0, T], ∀x∈R, |η(t, x)| ≤K(1 +|x|)et∀y∈R, |η(t, x)−η(t, y)| ≤K|x−y|.

Partant deΦ˜_N = Φ_N, on définit par récurrence descendanteΨ˜_k(x_0:k, u) = E[ ˜Φ_k+1(x_0:k, x_k+u(W_t_k+1 − W_t_k))]etΦ˜_k(x_0:k) = ˜Ψ_k(x_0:k, η(t_k, x_k))pourk ∈ {0, . . . , N −1}.

11. Montrer queΦ˜_k+1 ≤Φ_k+1entraîneΨ˜_k ≤Ψ_k.

12. On suppose que∀(t, x)∈[0, T]×R, 0≤η(t, x)≤σ(t, x). Montrer que pour toutk∈ {0, . . . , N− 1},Φ˜_k ≤Φ_k. En déduire queE

Φ_N(Y_t^N

0:N)

≤E

Φ_N(X_t^N

0:N) .

13. Soit Φ : C([0, T],R) → R une fonctionnelle lipschitzienne et convexe. Montrer que x_0:N 7→

Φ(L_N[x_0:N]) est convexe. En déduire que E[Φ(Y)] ≤ E[Φ(X)]. Que peut-on dire de E[Φ(X)]

comme fonction de la condition initialezde l’EDS (44)?

14. Comment comparerE[Φ(Y)]àE[Φ(X)]lorsque∀(t, x)∈[0, T]×R, η(t, x)≥σ(t, x)?

(5)

Méthodes de Monte-Carlo

Partie 1 : Schéma randomisé pour un coefficient de dérive irrégulier en temps

Soit T > 0 un horizon de temps. Sur un espace de probabilité (Ω,A,P) muni d’une filtration(F_t)t≥0, on considère un F_t-mouvement brownienW_t à valeurs R^d. On se donne également des coefficientsσ : [0, T]×Rⁿ →R^n×detb : [0, T]×Rⁿ→Rⁿmesurables et qui vérifient

(Lip)∃K<∞, ∀t∈[0,T],

(∀x∈Rⁿ, |σ(t, x)|+|b(t, x)| ≤K(1 +|x|)

∀x, y ∈Rⁿ, |σ(t, x)−σ(t, y)|+|b(t, x)−b(t, y)| ≤K|x−y| . On s’intéresse à l’Équation Différentielle Stochastique

(dX_t =σ(t, X_t)dW_t+b(t, X_t)dt, t∈[0, T]

X₀ =x₀ ∈Rⁿ (2)

1. Quel résultat assure l’existence d’une unique solution à cette équation?

SoitN ∈N^∗,(t_k = ^kT_N)0≤k≤N etτ_t=b^{N t}_T c_N^T l’instant de cette grille uniforme qui précèdet∈[0, T].

2. Écrire le schéma d’Euler sur la grille(t_k)0≤k≤N.

3. Rappeler le résultat de convergence forte de ce schéma.

On suppose désormais(Lip)et

∃K <∞, ∀x∈Rⁿ, ∀0≤s≤t ≤T, |σ(t, x)−σ(s, x)| ≤K(1 +|x|)√

t−s, (3) mais on ne fait pas d’hypothèse sur la régularité du coefficient de dérive b en la variable temporelle t.

On se donne (U_k)0≤k≤N−1 une suite de variables aléatoires indépendantes et uniquement distribuées sur [0,1] indépendantes de (W_t)t≥0. On pose η_k = t_k + _N^TU_k pour k ∈ {0, . . . , N − 1} et on définit le schéma d’Euler avec randomisation de la variable temporelle dans la dérive en posantX˜₀^N =x₀ puis pour k ∈ {0, . . . , N −1},

X˜_t^N_k+1 = ˜X_t^N_k +σ(t_k,X˜_t^N_k)(W_t_k+1 −W_t_k) +b(η_k,X˜_t^N_k)(t_k+1−t_k).

4. Quelle est la loi de la suite(η_k)0≤k≤N−1? 5. Montrer que pourk ∈ {0, . . . , N −1},

(a) Eh

|X˜_t^N

k+1|²i

=Eh

|X˜_t^N

k|²i + T

NEh

|σ(t_k,X˜_t^N

k)|²+ 2 ˜X_t^N

k.b(η_k,X˜_t^N

k)i + T²

N²Eh

|b(η_k,X˜_t^N

k)|²i , (b) puis que

Eh

|X˜_t^N

k+1|²i

≤

1 + K(3 + 2K)T

N +2K²T² N²

Eh

|X˜_t^N

k|²i

+K(1 + 2K)T

N +2K²T² N² (c) et enfin que1 +Eh

|X˜_t^N

k+1|²i

≤

1 + K(3+2K+2KT)T

N 1 +Eh

|X˜_t^N

k|²i .

(6)

(d) Conclure que sup

N∈N^∗

max

k∈{0,...,N}Eh

|X˜_t^N

k|²i

≤eK(3+2K+2KT)T(1 +|x₀|²)−1.

Pour k ∈ {0, . . . , N}, on pose M_k^N = _N^T Pk−1

`=0 b(η_`,X˜_t^N

`)−Rtk

0 b(s,X˜_τ^N_s)ds (Convention : M₀^N = 0) et G_k^N =F_t_k∨σ(η_`,0≤`≤k−1).

6. (a) Montrer que(M_k^N)k∈{0,...,N}est uneG_k^N-martingale de carré intégrable.

(b) CalculerhM^Nikpourk ∈ {0, . . . , N}.

(c) En déduire à l’aide de l’inégalité de Doob que E

max

k∈{0,...,N}|M_k^N|²

≤4 T N

Z T 0

E[|b(s,X˜_τ^N

s)|²]ds−

N−1

X

k=0

E

"

Z tk+1

tk

b(s,X˜_τ^N

s)ds

2#!

.

(d) Conclure quesup_N∈_N^∗NE

maxk∈{0,...,N}|M_k^N|²

<∞.

Pourt ∈[0, T], on poseXˆ_t^N =x0+Rt

0 σ(τs,X˜_τ^N_s)dWs+Rt

0 b(s,X˜_τ^N_s)ds.

7. (a) Que peut-on dire deC := sup_N∈_N^∗NEh

maxk∈{0,...,N}|Xˆ_t^N

k −X˜_t^N

k|²i

? (b) Montrer que pour toutN ∈N^∗et toutt∈[0, T],

E

"

sup

u∈[0,t]

|X_u−Xˆ_u^N|²

#

≤2 Z t

0

4E[|σ(s, X_s)−σ(τ_s,X˜_τ^N_s)|²] +tE[|b(s, X_s)−b(s,X˜_τ^N_s)|²]ds

(c) Vérifier que

E[|σ(s, X_s)−σ(τ_s,X˜_τ^N_s)|²]≤4K²

E[|X_s−X_τ_s|²] + (s−τ_s)E[(1 +|X_τ_s|)²] +E[|X_τ_s−Xˆ_τ^N_s|²] + C

N

. (d) Comment majorerE[|b(s, X_s)−b(s,X˜_τ^N_s)|²]?

(e) En déduire quesup_N∈

N^∗NEh

sup_t∈[0,T]|X_t−Xˆ_t^N|²i

<∞.

(f) Quel est l’ordre de convergence forte du schéma( ˜X_t^N

k)k∈{0,...,N}? Comment se dégrade-t-il si on suppose seulementσhöldérienne d’ordreα∈]0,1/2[en la variable temporellet(i.e.√

t−sest remplacé par(t−s)^α au membre de droite de (2))?

(g) Pourquoi la randomisation du coefficient de diffusion ne conduit-elle pas au même ordre de convergence forte sous l’hypothèse(Lip)?

(7)

Partie 2 : Réduction de variance vectorielle

Préliminaires.On suppose que(U₁, U₂)est un couple de variables aléatoires réelles indépendantes de lois données.

1. Décrire la méthode de Monte-Carlo classique permettant de calculerP(U₁ ≤ U₂)à l’aide de tirages indépendants selon la loi de (U₁, U₂) et expliquer comment l’on peut estimer l’erreur commise à l’issue dentirages.

On considère une variable réelle X, de carré intégrable, sur un espace de probabilité (Ω,A,P) et une sous-tribuBdeA. On poseY =E(X|B).

2. Montrer que Var(Y)≤Var(X).

3. On noteX = 1{U₁ ≤U₂}. CalculerY = E(X|U₁)à l’aide de la fonction de répartitionF₂ deU₂, supposée explicite. Expliquer comment l’on peut utiliser ce calcul pour construire un estimateur de variance réduite deP(U₁ ≤U₂)n’utilisant que des tirages indépendants selon la loi deU₁ .

Matrice de covariance d’un vecteur conditionné. On considère maintenant un vecteur aléatoire X = (X₁, . . . , X_d)et une tribuB. On suppose que lesX_isont de carré intégrable et l’on appelleΓ(X)la matrice de variance-covariance deX

Γ(X)i,j = Cov (Xi, Xj).

On définit le vecteurY = (Y₁, . . . , Y_d)en posant, pour touti,1≤i≤d,Y_i =E(X_i|B).

4. Montrer que les coordonnées deY sont de carré intégrable et que pour tout vecteurλ∈R^d Var

d

X

i=1

λ_iY_i

!

≤Var

d

X

i=1

λ_iX_i

! .

On note Γ(Y)la matrice de variance-covariance de Y. En déduire que Γ(Y) ≤ Γ(X)où sens des matrices définies positives, ce qui signifie, pour toutλ∈R^d,

λ·Γ(Y)λ≤λ·Γ(X)λ, où l’on a notéx·y =Pd

i=1x_iy_i le produit scalaire dansR^d.

La méthode “Delta”. On considère une fonctionf deRⁿdansR, telle que les dérivées partielles _∂x^∂f

i(θ) existent pouri= 1, . . . , det vérifiant de plus¹que

f(x) =f(θ) +

d

X

i=1

(x_i −θ_i)∂f

∂xi

(θ) +o(x−θ), avec|o(h)| ≤ |h|(h)etlim|h|→0(h) = 0.

On suppose que(Z_n, n ≥0)est une suite de variables aléatoires deR^dconvergeant presque sûrement versθ, un vecteur deR^d, telle que√

n(Z_n−θ)converge en loi vers un vecteur gaussien de moyenne nulle et de matrice de variance-covarianceΓ.

1Cette hypothèse signifie quef est différentiable au pointθ, ce qui est plus exigeant que la seule existence des dérivées partielles en ce point.

(8)

5. Montrer que, si l’on note∇f(θ) =

∂f

∂xi(θ),1≤i≤d .

√n(f(Z_n)−f(θ)) =∇f(θ)·√

n(Z_n−θ) +R_n, où|R_n| ≤ |√

n(Z_n−θ)|(Z_n−θ), puis, en utilisant le lemme de Slutzky, prouver queR_ntend en loi vers0.

6. En déduire que√

n(f(Z_n)−f(θ))tend en loi vers une gaussienne de moyenne nulle et de variance

∇f(θ)·Γ∇f(θ).

Une application. Soit((X_n, Y_n), n≥1)une suite de couple de variables aléatoires réelles indépendantes suivant la loi du couple (X, Y). A et B sont deux sous ensemble de R. On cherche à calculer P(X ∈ A)/P(Y ∈A)par une méthode de type Monte-Carlo.

7. Quelle est la limite presque sûre du quotientQ_n=Pn

i=11{Xi ∈A}/Pn

i=11{Yi ∈B}? 8. On considère la suite de variables aléatoires deR²

Z_n= 1 n

n

X

i=1

1{X_i ∈A}, 1 n

n

X

i=1

1{Y_i ∈B}

! .

On posepA=P(X ∈A)etpB =P(Y ∈B)etθ = (pA, pB). Montrer en appliquant le théorème de la limite centrale multidimensionnel (voir la question 15 pour un énoncé et une preuve) que√

n(Z_n− θ)tend vers un vecteur gaussien centré de matrice de variance covarianceΓ₁ que l’on calculera en fonction depA,pB etpAB =P(X ∈A, Y ∈B).

9. En déduire, en utilisant la question 6, la convergence en loi de√

n(Q_n−p_A/p_B)vers une gaussienne de varianceσ₁² =λ₀·Γ₁λ₀, avecλ₀ = (1/p_B,−p_A/p²_B).

10. Comment peut on utiliser en pratique ce résultat pour estimer l’erreur commise lorsque l’on approx- imep_A/p_BparQ_n?

11. SoitT une variable aléatoire, alors, il existe deux fonctionsf_X etf_Y telles queE

1{X ∈A}

T

= f_X(T)et E

1{Y ∈B}

T

= f_Y(T). On suppose quef_X et f_Y se calculent explicitement et l’on considère une suite(T_n, n ≥ 1)de variables aléatoires indépendantes suivant la loi deT. Quelle est la limite presque sûre deQ¯_n=Pn

i=1f_X(T_i)/Pn

i=1f_Y(T_i)? 12. Montrer que√

n( ¯Q_n−p_A/p_B)tend vers une gaussienne dont on calculera la varianceσ₂²à l’aide de λ₀ et de la matrice de variance-covarianceΓ₂ du couple(f_X(T), f_Y(T)).

13. En utilisant le résultat de la question 4, comparer σ₁ et σ₂ et expliquez pourquoi cette deuxième méthode est préférable pour calculerpA/pB.

Rappel: Théorème de la limite centrale multidimensionnel.

Soit (Z_n, n ≥ 1) une suite de vecteurs aléatoires de même loi queZ = (Z¹, . . . , Z^d). On suppose que Z est de carré intégrable (i.e. E(|Z|²) < +∞), que le vecteur E(Z) = 0et l’on note Γ_Z la matrice de variance-covariance du vecteurZ.

14. Montrer, en utilisant le théorème de la limite centrale dansR, que pour, toutλdeR^d et pour toutu réel

n→+∞lim E

eⁱ^√^uⁿ^(λ·Z¹^{+···+λ·Z}ⁿ⁾

=e⁻^u

2 2 λ·Γ_Zλ.

15. En déduire que les vecteurs ^√¹_n(Z₁ +· · ·+Z_n) convergent en loi vers un vecteur gaussien centrée de matrice de variance-covarianceΓ_Z. Étendre le résultat au cas oùE(Z)6= 0.

(9)

Méthodes de Monte-Carlo

Partie I : Biaisage de loi

SoitX une variable aléatoire réelle telle que pour unt₀ >0, sit < t₀,E e^t|X^|

<+∞. On note M_t=E e^tX

. (4)

1. Vérifier que cette hypothèse est vérifiée pour une variable aléatoireXgaussienne centrée réduite avec t₀ = +∞. Que vaut alorsM_t?

SoitX une variable aléatoire suivant une loi gamma de densitép(λ, α, x) p(λ, α, x) = 1{x >0}x^α−1λ^αe^−λx

Γ(α) . oùα >0,λ >0etΓ(α) =R+∞

0 e^−xx^α−1dx. CalculerE(e^tX)pourt < λ. Que vautE(e^λX)? Sous l’hypothèse (3) on définit, pour t < t0, une mesure µt par, pour f est une fonction mesurable et positive

µ_t(f) = E(e^tXf(X)) M_t .

µ_test alors une mesure positive de masse totale1surR(autrement dit une loi de probabilité).

2. Soit Y^(t) une variable aléatoire de loi µ_t sous P (On a donc, pour f mesurable et positive E(f(Y^(t))) = ^E(e^tX_M^f(X))

t ). Montrer que pour 0 ≤ t < t₀, E(|Y^(t)|) < +∞, puis vérifier que t→E(Y^(t))est une fonction différentiable dont la dérivée vaut

d

dtE(Y^(t)) = E(e^tXX²)E(e^tX)−E(e^tXX)² E(e^tX)² . En déduire quet→E(Y^(t))est une fonction croissante.

La loiµ_tn’est pas toujours facile à simuler. Voici, toutefois, deux cas où les choses se passent bien.

3. Quelle est la loi deY^(t) lorsqueX suit une loi gaussienne centrée réduite ? Comment simuler Y^(t) dans ce cas ?

4. SoitX une variable aléatoire suivant une loi gamma de densitép(λ, α, x). Quelle est la loi deY^(t), pourt < λ?

Comment simuler cette loi lorsqueα = 1et plus généralement lorsqueαest un réel arbitraire.

On considèrenvariables aléatoires indépendantes(X₁, . . . , X_n)suivant la loi deX. On poseS_n^X =X₁ +

· · ·+X_net l’on cherche à calculer

θ =P S_n^X ≥a . pour une valeur deatelle queθ est de l’ordre de10⁻¹².

5. Quel est l’ordre de grandeur du nombreNde tirages du vecteur(X₁, . . . , X_n)nécessaires pour obtenir un précision relative de50%sur l’estimation deθpar une méthode de Monte-Carlo?

On va (donc) chercher à améliorer la méthode ...

(10)

6. Pourt < t₀etY^(t)une variable aléatoire de loiµ_tsousP, vérifier que pour toute fonctiongmesurable, positiveE(g(X)) = M_tE

e^−tY^(t)g(Y^(t)) .

7. Pour unt < t₀, on considéren variables aléatoires(Y₁^(t), . . . , Yn^(t))indépendantes suivant la loi µ_t sous une probabilitéP. On noteS_n^Y^(t) =Y₁^(t)+· · ·+Yn^(t). Montrer que pour toute fonctionF de la formef₁(x₁)× · · · ×f_n(x_n)où lesf_isont mesurables et bornées deRdansR

E(F(X₁, . . . , X_n)) =M_tⁿE

F(Y₁^(t), . . . , Y_n^(t))e^−tS^Y

(t) n

.

On admettra que cette égalité se généralise à toute fonctionF(x₁, . . . , x_n)mesurable bornée deRⁿ dansR.

8. En déduire que :θ =P S_n^X ≥a

=M_tⁿE



1n

S_n^Y^(t) ≥aoe^−tS^Y

(t) n



.

On noteZ_tla variable aléatoireZ_t =1n

S_n^Y^(t) ≥aoMⁿ(t)e^−tS^Y

(t)

n .Comment utiliserZ_tpour mettre en œuvre une méthode de Monte-Carlo, permettant de calculerθ, possiblement plus efficace ? Quel critère doit-on utiliser pour choisirtde façon optimale pour cette méthode ?

On suppose dans la suiteque²E(X)< a/net que³a/n <E(Y^(t⁰⁾).

9. Vérifier que Var(Z_t)≤ (M_tⁿe^−ta)²−θ². En minimisant la partie de droite de l’inégalité précédente, montrer qu’un choix raisonnable pourtest donné par la solution uniquet_cdans l’intervalle]0, t₀[de l’équation

E(Y^(t)) = E(e^tXX) E(e^tX) = a

n. 10. Montrer que, pour tout t < t₀, Var(Z_t) = E

1S_n^X ≥a M_tⁿe^−tS^Xⁿ

−θ², et que Var(Z_t) admet une dérivée donnée par

d

dtVar(Z_t) =M_tⁿ E

1S_n^X ≥a e^−tS^Xⁿ

nE(Y^(t))−S_n^X

.

11. En déduire que _dt^dVar(Z_t) ≤ 0 pour 0 ≤ t ≤ t_c où t_c est la solution unique de E(Y^(t^c⁾) = a/n.

As t’on intérêt à utiliser des valeurs de t < t_c pour mettre en œuvre la méthode de Monte-Carlo proposée?

12. Montrer que le résultat de la question précédente reste vrai si l’on remplace1

S_n^X ≥a parH(S_n^X) oùH est une fonction qui s’annule sur l’ensemble{x < a}(exemple: H(x) = (x−a)₊).

13. En supposant que E(Y^(t)) se calcule explicitement et sans chercher à en prouver la convergence, proposer un algorithme stochastique permettant de résoudre l’équation d’Euler pour la minimisation de la variance, c’est à dire:

E

1S_n^X ≥a M_tⁿe^−tSⁿ^X

nE(Y^(t))−S_n^X

= 0.

2Hypothèse naturelle lorsqueθest supposé petit.

3Ceci est vrai lorsque,E(Y^(t⁰⁾) = +∞, hypothèse vérifiée pour les deux exemples précédents.

(11)

Partie II : Comparaison des variances asymptotiques dans le théorème ergodique pour les chaînes de Markov

Sur l’espace d’étatEmuni de la tribuE, on se donne une mesure de probabilitéπ.

1. On suppose dans cette question queP0 etP1 sont deux noyaux markoviens sur(E,E)qui laissentπ invariante et que

∀A∈ E, ∀x /∈A, P₀(x, A)≥P₁(x, A). (5) Soitg :E →Rmesurable et telle queπ(g²)<∞.

(a) Pouri ∈ {0,1}, montrer queπ(P_i|g|)≤ p

π(g²)et en déduire queπ(dx)p.p.,P_ig(x)est bien défini. Montrer que π(dx) p.p., (P_ig(x))² ≤ P_ig²(x) et en déduire à l’aide de l’inégalité de Cauchy-Schwarz queπ(|g(Pig)|)≤π(g²). Conclure queπ(|g(P0g−P1g)|)<∞.

SoitP(x, dy) =δ_x(dy) +P₀(x, dy)−P₁(x, dy).

(b) Montrer que pour tout x ∈ E et toutA ∈ E, P(x, A) ≥ 0 et en déduire queP est un noyau markovien sur(E,E).

(c) Vérifier queπest invariante parP. En déduire que Z

E

g²(x)π(dx) = 1 2

Z

E×E

(g²(x) +g²(y))π(dx)P(x, dy).

(d) Remarquer queπ(g(P₁g−P₀g)) =R

E×Eg(x)g(y)π(dx)(δ_x(dy)−P(x, dy))et en déduire que π(g(P1g−P0g)) = 1

2 Z

E×E

(g(x)−g(y))²π(dx)P(x, dy).

Conclure que

∀g :E →Rmesurable et t.q. π(g²)<∞, π(g(P1g−P0g))≥0. (6) 2. On suppose que π(dx) = ^R^η(x)λ(dx)

Eη(y)λ(dy) où λ est une mesure de référence sur (E,E) et η une fonction mesurable de E dans R₊ telle que R

Eη(x)λ(dx) ∈]0,∞[. Soit q : E ×E → R₊ une fonction mesurable telle que ∀x ∈ E, R

Eq(x, y)λ(dy) = 1 et on sait simuler suivant la probabilité q(x, y)λ(dy). On pose

P₁(x, dy) =α(x, y)q(x, y)λ(dy) + Z

E\{x}

(1−α(x, z))q(x, z)λ(dz)

δ_x(dy) oùα(x, y) =

(a

η(y)q(y,x) η(x)q(x,y)

siη(x)q(x, y)>0 1siη(x)q(x, y) = 0 ,

pour une fonctiona:R₊ →[0,1]mesurable vérifianta(0) = 0et∀u >0, a(u) =ua(1/u).

(a) Quel est le choix de Metropolis-Hastings pour la fonctiona?

On note α₀(x, y) et P₀(x, dy) la probabilité d’acceptation de la proposition et le noyau markovien obtenus pour ce choix.

(b) Verifier que pouru > 0, a(u) ≤ min(1, u) et en déduire que pour tous x, y ∈ E, α(x, y) ≤ α₀(x, y). Conclure que (4) est vérifiée.

(12)

3. On suppose maintenant queπest réversible pour les noyauxP₀etP₁qui vérifient (5). Pourt ∈[0,1], on noteP_t=tP₁+ (1−t)P₀.

(a) Montrer queπ est réversible pour le noyauP_t. En déduire que pourg, h : E → Rmesurables et telles queπ(g²+h²)<∞,π(g(P_th)) = π(h(P_tg)).

Soit f : E → R mesurable. On suppose qu’il existe une unique fonction F_t : E → R telle que π(F_t²)<∞etπ(F_t) = 0solution de l’équation de Poisson

Ft−PtFt=f−π(f) (7)

et que la variance asymptotique de l’estimateur ergodique _n¹ Pn−1

k=0f(X_k^t) de π(f) reposant sur la chaîne de Markov(X_k^t)k∈N de noyau de transitionP_testσ_t²(f) = π(F_t²)−π((P_tF_t)²). On suppose également queF_test dérivable par rapport àtet que tous les échanges de dérivées avec des intégrales sont justifiés dans ce qui suit⁴.

(b) Vérifier queF_t²−(P_tF_t)² = (f−π(f))(2F_t−f+π(f)).

En déduire que^dσ^t_dt²^(f) = 2π (f−π(f))^dF_dt^t

= 2π F_t ^dF_dt^t −P_t^dF_dt^t . (c) En dérivant (6), vérifier que ^dF_dt^t −P_t^dF_dt^t =P₁F_t−P₀F_t.

(d) Conclure que ^dσ_dt²^t^(f⁾ ≥0puis queσ₁²(f)≥σ₀²(f).

4Une condition suffisante est

∃V :E→R+mesurable t.q. sup

x∈E

|f(x)|

1 +p

V(x)<∞et∃K∈R+, ∃γ∈]0,1[, ∀x∈E, P0V ∨P1V(x)≤γV(x) +K,

∃R > 4K (1−√

γ)², ∃α∈]0,1], ∀x, yt.q.V(x) +V(y)≤R, (P0(x, .)∧P0(y, .)(E))∧(P1(x, .)∧P1(y, .)(E))≥α.

(13)

Méthodes de Monte-Carlo en finance

Examen du mardi 24 janvier 2017 8h30-11h30

Partie I : Annulation du biais d’une suite d’estimateur

On se donne une variable aléatoireY à valeurs dansRde carré intégrable.

1. On suppose, tout d’abord, que l’on sait simuler exactement la variable aléatoire Y. Pour un réel positif, montrer que le nombre N() de tirages aléatoires de Y indépendants permettant d’obtenir (avec une grande probabilité) une approximation deE(Y)avec une erreur d’environcroit comme Cte/².

On suppose maintenant que l’on ne sait pas simuler exactementY mais seulement qu’il existe une suite de variables aléatoires de carré intégrable(Y_n, n ≥0)facilement simulables⁵ telles que

n→+∞lim E (Y_n−Y)²

= 0. (8)

2. Montrer que le biais b_n = E(Y) − E(Y_n) tend vers 0 lorsque n tend vers +∞. Vérifier que lim_n→+∞E((Y_n − Y)Y) = 0. En déduire que lim_n→+∞E(Y_n²) = E(Y²) et en conclure que limn→+∞Var(Y_n) = Var(Y).

3. On se place dans un cas où l’on a une estimation a priori du bias du type|b_n| ≤ _n^Cα, avecα > 0. On choisit unn >0et le nombre de tirageN,(Y_n¹, . . . , Y_n^N), selon la loi deYn. On approximeE(Y)par Y¯^n,N = _N¹ PN

i=1Y_nⁱ.Montrer que, pourN grand, avec une probabilité proche de1, on a

|Y¯^n,N −E(Y)| ≤R(n, N) := C

n^α + 2 K

√N.

4. On prend comme mesure de l’erreurR(n, N)et l’on suppose que le coût de N tirages selon la loi de Y_n est donné par Coût(n, N) = C₁nN. On s’impose une contrainte sur le coût total du calcul C_total. On s’intéresse à l’erreur minimale R(n, N)que l’on peut obtenir sous la contrainte de coût Coût(n, N) =C_total, définie par :

Error(C_total) = min

n,N,Cost(n,N)=Ctotal

R(n, N) Montrer que Error(C_total) = Cte×C⁻

α 2α+1

total .En déduire que le coût minimal nécessaire pour obtenir une précisioncroît comme Cte×⁻^2α+1^α . En comparant avec le résultat de la question 1, expliquer en quoi la présence du biais dégrade la performance de l’algorithme de simulation.

Comment se débarasser du biais ? Nous allons voir que l’on peut construire, à partir de la suite(Y_n, n≥ 0)une variable aléatoire simulable et sans biais Y˜ (c’est-à-dire telle que E() = E(Y)) au prix toutefois d’une augmentation de la variance.

On considère, pour cela, une variable aléatoire τ à valeurs dans N^∗ indépendant de la suite (Y_n, n ≥ 0) dont la loi est donnée par

P(τ =n) = p_n, avecp_n>0pour toutn≥1. (9) On note∆Y_n=Y_n−Yn−1, pourn ≥1(lorsquen = 1, on poseY₀ = 0). On définitY˜ par

Y˜ = ∆Y_τ

p_τ =X

n≥1

∆Y_n

p_n 1{τ =n}.

5C’est le cas lorsque l’on discrétise une équation différentielle stochastique.

(14)

5. Montrer que, sous l’hypothèse (8), E(|Y˜|) = P

n≥1E(|∆Y_n|). En déduire que lorsque E(|Y˜|) <

+∞, on aE( ˜Y|Y_n, n≥1) = Y etE( ˜Y) =E(Y).

6. Donner un exemple de suite déterministe (∆Y_n, n ≥ 1) où Y = P

n≥1∆Y_n converge mais où E(|Y˜|) = +∞, pour tout choix depvérifiant l’hypothèse (8).

7. Montrer que l’on a

E( ˜Y²) = X

n≥1

E((∆Yn)²) p_n , et que lorsqueE( ˜Y²)<+∞, Var( ˜Y)≥Var(Y).

8. On cherche à approximer E(Y) où Y = f(X_T) et Y_n = f(X_T⁽ⁿ⁾) où X une solution d’une EDS et X⁽ⁿ⁾ son approximation par un schéma d’Euler de pas h_n = 1/2ⁿ. Montrer (en supposant les coefficients de l’EDS et f aussi réguliers que souhaité) que E

f(X_T⁽ⁿ⁾)−f(X_T)

2

≤ Cρⁿ, ρ étant un réel positif inférieur à1que l’on précisera. En déduire queE((∆Y_n)²)≤4Cρⁿ.

Par ailleurs le coût d’une simulation deY_n est donné par Cte×2ⁿ. Montrer que, si l’on néglige le temps de simulation deτ, le coût moyen d’une simulation deY˜ est proportionnel àP

n≥1p_n2ⁿ. 9. On suppose que, comme dans l’exemple précédent,E((∆Y_n)²) ≤ Cρⁿ, avecρ < 1et que le coût

d’une simulation deY_nest donné par parcαⁿavecα >1.

On suppose enfin que la loi de τ est une loi géométrique⁶ de paramètre qavec 0 < q < 1(on note q⁰ = 1−q). Vérifier que, siq⁰ > ρ,E(( ˜Y)²)<+∞et que :

E( ˜Y²)≤ Cρq⁰ q(q⁰−ρ).

Par ailleurs, montrer que le coût moyen d’une simulation deY˜, Cmoy = E(cα^τ), est fini lorsque αq⁰ <1et qu’il alors égal àcαq/(1−αq⁰).

En supposant⁷ que la performance de la simulation est mesurée par le produitE(Cmoy)×E(( ˜Y)²) montrer que l’on doit avoirρα <1pour espérer obtenir une méthode efficace et que, dans ce cas, le meilleur choix deq⁰ estq⁰ =p

ρ/α.

Partie II : Théorème de Wong-Zakai

Sur l’espace de probabilité(Ω,F,P), on se donne un mouvement brownien(Wt)t≥0de dimensiond. Pour un horizon T ∈]0,+∞[et un nombre N ∈ N^∗ de pas, on considère la grille uniforme (t_k = ^kT_N )0≤k≤N. Pour discrétiser la solution de l’EDS

dX_t=σ(X_t)dW_t+b(X_t)dt, X₀ =x₀ (10) où x₀ ∈ Rⁿ, σ : Rⁿ → R^n×d et b : Rⁿ → Rⁿ sont supposées lipschitziennes, on peut être tenté d’approcher la trajectoire brownienne par interpolation linéaire sur chaque intervalle [t_k, t_k+1] en posant W_t^N =W_t_k+ ^W^tk+1_t ^−W^tk

k+1−t_k (t−t_k)puis de résoudre

dX_t^N =σ(X_t^N)dW_t^N +b(X_t^N)dt, X₀^N =x₀. (11)

6i.e. pour toutn≥1,pn =q(1−q)ⁿ.

7Voir, pour des élèments de justification,Glynn P.W., Whit W., 1992, The asymptotic efficiency of simulation estimators, Oper.

Res. 40(3):505-520.

(15)

1. Vérifier que pour toutk ∈ {0, . . . , N−1},(X_t^N)t∈[t_k,tk+1]satisfait une équation différentielle ordinaire et en déduire que (10) admet une unique solution.

On se place d’abord en dimensionn=d= 1.

2. On suppose en outre queσ:R→R^∗₊estC¹ etb ≡0et on poseϕ(x) =Rx x0

dy σ(y). (a) Vérifier que pour toutk ∈ {0, . . . , N},ϕ(X_t^N

k) =W_t_k et en déduire queX_T^N ne dépend pas de N. On noteYT cette valeur.

(b) Dans le cas σ(x) ≡ x, calculer ϕ et vérifier que Y_T 6= X_T. En déduire que le procédé d’approximation ne converge pas vers la solution de (9).

(c) Calculer(ϕ⁻¹)⁰ et(ϕ⁻¹)⁰⁰. En déduire que(Yt = ϕ⁻¹(Wt))t∈[0,T] est solution de l’EDSdYt = σ(Y_t)dW_t+ ¹₂σσ⁰(Y_t)dt, Y₀ =x₀.

3. On suppose que le processus d’Itô(Y_t)t∈[0,T]est solution de l’EDS au sens de Stratonovitch

dY_t=σ(Y_t)◦dW_t+b(Y_t)dt, Y₀ =x₀ (12) où, pour un processus d’Itô(H_s)s∈[0,T]ett ∈[0, T], on définit l’intégrale de StratonovitchRt

0 H_s◦dW_s comme la limite en probabilité lorsquen → ∞dePN−1

k=0

H_tk+1+H_tk

2 (W_t_k+1_∧t−W_t_k_∧t). La fonction σ:R→Rest supposéeC² avecσσ⁰ lipschitzienne.

(a) Quelle est la limite en probabilité de PN−1

k=0 H_t_k(W_t_k+1∧t −W_t_k∧t)? En déduire que Rt 0 H_s ◦ dW_s =Rt

0 H_sdW_s+ ¹₂hH, Wi_t.

(b) En déduire la partie intégrale d’Itô par rapport à dW_t de la décomposition de σ(Y_t) comme processus d’Itô puisdhσ(X), Wi_t.

(c) Conclure que(Y_t)t∈[0,T]est solution de l’EDS au sens d’Itô dY_t =σ(Y_t)dW_t+

b+ σσ⁰ 2

(Y_t)dt, Y₀ =x₀. (13) 4. On suppose queσ estC² avecσ,σ⁰ etσ⁰⁰bornées et quebestC¹ avecb etb⁰ bornées. L’objectif de

cette question est de montrer que sous cette hypothèse

∃C <∞, ∀N ∈N^∗, max

0≤k≤NE

|X_t^N

k −Y_t_k|²

≤ C

N. (14)

(a) Écrire le schéma d’Euler(Y_t^N

k )_0≤k≤N appliqué à (12) et préciser son erreur forte.

(b) Vérifier que pourt ∈[tk, tk+1],dX_t^N =fk(X_t^N)dtavecfk(x) = σ(x)^W^tk+1_t ^−W^tk

k+1−t_k +b(x).

(c) En déduire que pourr∈[tk, tk+1],

σσ⁰(X_r^N) = σσ⁰(X_t^N

k) + Z r

tk

f_k(σσ⁰)⁰(X_u^N)du et que pourt∈[t_k, t_k+1],

X_t^N =X_t^N

k +f_k(X_t^N

k)(t−t_k) + Z t

tk

Z s tk

f_kf_k⁰(X_r^N)drds.