M ÉTHODEDE M ONTE C ARLO .

(1)

M

ÉTHODE DE

M

ONTE

C

ARLO

.

Alexandre Popier

Université du Maine, Le Mans

(2)

P

LAN DU COURS

1 MÉTHODE DEMONTECARLO

2 PROBLÈME DE SIMULATION Théorème fondamental Simulation de la loi uniforme Fonction de répartition Méthode d’inversion Cas particuliers Vérifications Méthode de rejet Lois gaussiennes

3 RÉDUCTION DE VARIANCE Variables antithétiques Variables de contrôle Monte Carlo conditionnel Échantillonnage d’importance Échantillonnage stratifié

(3)

B

UT

:

CALCUL D

’

ESPÉRANCE

.

SoientX une v.a.r. etf :R→Rune fonction.

BUT

Calculer numériquementE(f(X)).

EXEMPLES

FINANCE: prix d’une option d’achat

I modèle de Cox-Ross-Rubinstein :

C= 1 (1+r)^NE



 S0 N

Y

i=1

Ti −K

!⁺

.

P(Ti =1+u) =p=1−P(Ti =1+d)oùp= (u−r)/(u−d).

I modèle de Black-Scholes : C=e^−rTE

S e^(r−σ²^/2)T^+σW^T−K+

avecW ∼ N(0,T).

(4)

B

UT

:

CALCUL D

’

ESPÉRANCE

.

SoientX une v.a.r. etf :R→Rune fonction.

BUT

Calculer numériquementE(f(X)).

EXEMPLES

FINANCE: prix d’une option d’achat ASSURANCE: calcul de la prime

I Prime pure :E(X),

I Prime exponentielle : ¹_clnE(e^cX),

I Prime quantile :F_X⁻¹(1−ε),

CALCUL DE PERTE ou Value At Risk en finance :P(X <seuil).

etc.

(5)

P

LAN

3 RÉDUCTION DE VARIANCE Variables antithétiques Variables de contrôle Monte Carlo conditionnel Échantillonnage d’importance

(6)

L

OI DES GRANDS NOMBRES

.

THÉORÈME

Soit(Y_i)i∈Nune suite de variables aléatoires.

HYPOTHÈSES

indépendance

distribution identique (comme une v.a.Y) E(|Y|)<+∞.

Alors presque sûrement :

n→+∞lim Yn = lim

n→+∞

1

n(Y₁+. . .+Yn) =E(Y).

Autrement dit, pournassez grand 1 n

n

XY_i ≈E(Y).

(7)

M

ÉTHODE DE

M

ONTE

C

ARLO

.

MÉTHODE

Pour calculerµ=E(f(X)),

simuler N v.a.(X_n)_1≤n≤N i.i.d. de même loi que X , poser :

ˆ µ_N = 1

N

X

i=1

f(X_i) = f(X₁) +. . .+f(X_N)

N .

Loi des grands nombres :µˆ_N ≈µpourN grand.

PROBLÈME: quelle est l’erreur commise ?

(8)

L

OI EXPONENTIELLE

(2) (

ESPÉRANCE

1/2)

(9)

L

OI DE

P

ARETO

(0,5)

PAS D

’

ESPÉRANCE

(10)

T

HÉORÈME CENTRAL LIMITE

.

THÉORÈME

Soit(Y_i)i∈Nune suite de v.a.

HYPOTHÈSES

indépendance

distribution identique (comme une v.a.Y) E(|Y|²)<+∞.

AlorsY_n∼=N(0,1): pour touta<b

n→+∞lim P a<√

nYn−µ σ <b

!

=P(a<Z <b), Z ∼ N(0,1).

(11)

I

NTERVALLE DE CONFIANCE

.

TCL:µ=E(Y₁),Yn= _n¹(Y₁+. . .+Yn) P

Y_n−a σ

√n ≤µ≤Y_n+a σ

√n

= P −a≤√

nY_n−µ

σ ≤a

!

≈ P(|Z| ≤a), oùσ²=Var(f(X)).

Pour unniveau de confianceα∈[0,1]fixé, il existec_α >0 tel que P(|Z| ≤c_α) =α.

Donc aveca=cα, pourngrand

P(µ∈I_α,n)≈P(|Z| ≤c_α) =α avec

I_α,n=

Y_n−c_α σ

√ ,Y_n+c_α σ

√

: intervalle de confiance.

(12)

M

ÉTHODE DE

M

ONTE

C

ARLO

:

ERREUR

.

MÉTHODE

Simuler N v.a.(X_n)_1≤n≤N i.i.d. de même loi que X . Poser :

ˆ µ_N = 1

N

X

i=1

f(X_i) = f(X₁) +. . .+f(X_N)

N .

Erreur donnée par un intervalle de confiance : P µ∈I_α,N

≈α

avec

I_α,N =

ˆ µ_N−cα

√σ

N,µˆ_N+cα

√σ N

, σ²=Var(f(x)).

Problème: on ne connaît pas en général la varianceσ².

(13)

E

STIMATION DE LA VARIANCE

.

On estimeσ²grâce à l’estimateurS_n²= 1 n−1

n

X

i=1

(Y_i−Yn)².On peut montrer que

ES_n²=σ²=Var(Y)et lim

n→+∞S_n²=σ².

MÉTHODE

Simuler N v.a.(Xn)1≤n≤N i.i.d. de même loi que X . Poser :

ˆ σN=

v u u t

1 N−1

N

X

i=1

(f(X_i)−µˆN)².

(14)

M

ÉTHODE DE

M

ONTE

C

ARLO COMPLÈTE

.

MÉTHODE

1 Simuler N v.a.(Xn)1≤n≤N i.i.d. de même loi que X .

2 Poser :

ˆ µ_N = 1

N

X

i=1

f(X_i) = f(X₁) +. . .+f(X_N)

N ,

ˆ σ_N=

v u u t

1 N−1

N

X

i=1

(f(X_i)−µˆ_N)².

3 Erreur donnée par intervalle de confiance avec niveau de confianceα

I_α,N =

ˆ

µ_N−c_α σˆ_N

√N,µˆ_N+c_α σˆ_N

√N

.

(15)

L

OI EXPONENTIELLE

(2) (

ESPÉRANCE

1/2)

(16)

L

OI EXPONENTIELLE

(2) (

DÉCROISSANCE EN

1/ √

N )

(17)

P

ARETO

(1,5) (

ESPÉRANCE

3,

PAS DE VARIANCE

)

(18)

P

ARETO

(1,5) (

TAILLE INTERVALLE CONFIANCE

)

(19)

M

ÉTHODE DE

M

ONTE

C

ARLO

:

REMARQUES

.

OBLIGATOIRE

Donnerµˆ_N sans intervalle de confiance n’a aucune valeur !

ERREUR

Pour diminuer la taille de IC,

diminuer le niveau de confianceα, augmenterN,

diminuerσ (−→réduction de variance).

AVANT: SIMULATION

(20)

P

LAN

(21)

P

LAN

(22)

T

HÉORÈME FONDAMENTAL DE LA SIMULATION

.

THÉORÈME

Toute variable aléatoireX à valeurs dansR^d peut être simulée sous la forme

X =

en loif(U₁,U₂, . . . ,U_n) où

(U₁,U₂, . . . ,U_n)est uniformément répartie sur[0,1]ⁿ, la fonctionf :Rⁿ→R^d est borélienne et a ses points de discontinuité dans un ensemble Lebesgue-négligeable.

Il est même possible de réaliser ceci en imposantn=1 oun=d ou encoren≥1 donné.

REMARQUE:f est « explicite ».

(23)

P

LAN

(24)

S

UITES ALÉATOIRES

.

Considérons une suite finiex :=x₁, . . . ,x_n ∈ {0,1}. Toutes les suites finies de ce type sont équiprobables et de probabilité 2⁻ⁿ.

Certaines suites moins aléatoires que d’autres

1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1 1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,0,1,1 1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,0,1,0

Quel sens donner et comment quantifier le caractère aléatoire d’une suite finie ou infinie donnée ?

Comment produire des suites finies qui sont de « bonnes » approximations finies des suites infinies probables correspondant à des réalisations i.i.d. d’une loi donnée ? Comment mesurer la qualité de ces algorithmes ?

(25)

S

UITES ALÉATOIRES

.

D.H. Lehmer (1951) :

A random sequence is a vague notion... in which each term is unpredictable to the uninitiated and whose digits pass a certain number of tests traditional with statisticians...

(26)

N

OMBRES PSEUDO

-

ALÉATOIRES

.

Simuler la loi uniforme consistera à produire par un algorithme des suites finies de nombres que nous pouvons considérer comme autant de réalisations indépendantes de variables aléatoires uniformes sur [0,1].

Mathématiquement lesnsorties successives d’un tel générateur seront considérées comme la donnée deU₁(ω), . . . ,Un(ω)pour un ω ∈Ωoù lesU_isont des v.a.r.U_i: (Ω,F,P)→[0,1]de loi uniforme.

Matlab permet de simuler la loi uniforme via la fonctionrand, qui renvoie un nombre « aléatoire » compris entre[0,1].

(27)

N

OMBRES PSEUDO

-

ALÉATOIRES

.

Intéressons nous au nombre

0,950129285147175.

C’est par défaut le premier nombre produit par la fonctionrandde Matlab.

Pour cela redémarrer Matlab, et exécuter les commandes

format l o n g

rand

Si tous les utilisateurs de Matlab trouvent toujours ce même nombre il ne peut être qualifié d’aléatoire. D’ailleurs il ne l’est pas.

(28)

N

OMBRES PSEUDO

-

ALÉATOIRES

.

À ce stade il est important de faire la distinction entre deux types de méthodes de génération de suites « aléatoires ».

Méthodesprédictibles: ce sont des méthodes déterministes basées entièrement sur des algorithmes bien établis qui nécessitent d’être initialisés. On parlera desuites ou nombres pseudo-aléatoires.

Méthodesnon-prédictibles: surtout utiles en cryptographie, où il est capital que le hasard utilisé ne soit pas prédictible ni

reproductible. Elles peuvent être obtenues à partir des premières en utilisant des « fonctions de hachage », difficilement inversibles en terme de temps de calcul.

(29)

A

LGORITHMES PAR CONGRUENCE

(L

EHMER

, 1950).

utilisent trois paramètres entiersa,cetmet une valeur initialex₀, appeléseed;

créent une suite d’entiersy_n+1=ay_n+c modmcompris entre 0 etm;

ramènent les valeurs entre 0 et 1 :x_n=y_n/m.

Exemple :a=13,c =0,m=31 etx₀=1. Suite desyn:

1 13 14 27 10 6 16 22 7 29 5 3. . .

Celle desx_n:

0.0323, 0.4194, 0.4516, 0.8710, 0.3226, 0.1935, 0.5161, . . .

(30)

A

(L

EHMER

, 1950).

Dans les années 60, sur IBM, Scientific Subroutine Package (SSP) : a=65539,c =0, etm=2³¹.

Comme le codage se fait en 32-bits, l’arithmétique modulo 2³¹ se fait très rapidement.

a=2¹⁶+3 : multiplication para= shift + addition.

Problème:y_k+2=6y_k+1−9y_k : très forte corrélation.

cf. graphique randssp

(31)

A

(L

EHMER

, 1950).

À partir deMatlab 4, on a choisi :a=7⁵=16807,c=0, m=2³¹−1=2147483647.

Toujours disponible via

I s=rand(’seed’): fournit le paramètrex₀de cette méthode.

I rand(’seed’,s): impose à Matlab d’utiliser cet algorithme avec x₀=s.

Périodicité grande :m−1.

Génére toutes les valeursk/maveck =1, . . . ,m, i.e.

[0,1] ≈ D_r ={k/m, 1≤k ≤m}

⊂ [0.00000000046566,0.99999999953434].

cf. graphique randmcg

(32)

A

LGORITHME PAR DÉFAUT

.

À partir de laversion 5(1995), Du à G. Marsaglia.

N’utilise plus les algorithmes à la Lehmer, plus de multiplication, plus de division.

Génère directement des nombres décimaux.

Disponible via

I s=rand(’state’): fournit le paramètrex0de cette méthode (vecteur de dimension 35).

I rand(’state’,s): impose à Matlab d’utiliser cet algorithme avecx₀=s.

Peut générer tous les nombres (flottants) entre 2⁻⁵³ et 1−2⁻⁵³ (on ne connaît pas de nombre non atteint).

Période proche de 2¹⁴⁹².

(33)

A

LGORITHME

« M

ERSENNE

T

WISTER

».

Troisième algorithme implémenté sous Matlab (version 5 et plus).

Disponible via

I s=rand(’twister’): fournit le paramètrex₀de cette méthode (vecteur de dimension 625).

I rand(’twister’,s): impose à Matlab d’utiliser cet algorithme avecx0=s.

Période de l’ordre de(2¹⁹⁹³⁷−1)/2.

(34)

I

MPORTANCE DE LA RACINE

.

REMARQUE

Connaître la valeur de la racine avant de lancer un programme peut être important ! Notamment pour pouvoir :

comparer des vitesses de calcul ;

générer des variables aléatoires couplées.

Pour éviter d’avoir toujours le même nombre de départ :

rand( ’ s t a t e ’,sum(100∗clock) )

rand

(35)

P

LAN

(36)

F

ONCTION DE RÉPARTITION

.

DÉFINITION

Lafonction de répartitionde X , notée F_X, est définie surRpar :

∀x ∈R, F_X(x) =P(X ≤x).

PROPOSITION

Soit F_X la fonction de répartition d’une v.a.r. X . Alors :

1 F_X(x)∈[0,1].

2 F_X est croissante.

3 lim

x→−∞F_X(x) =0et lim

x→+∞F_X(x) =1.

4 F_X est continue à droite et a une limite à gauche en tout point.

(37)

V.

A

.

À DENSITÉ

.

DÉFINITION

Une v.a. X està densité(par rapport à la mesure de Lebesgue) s’il existe f t.q.

pour tout x ∈R, f(x)≥0; Z +∞

−∞

f(x)dx =1;

et pour tout−∞ ≤a<b≤+∞,P(a<X ≤b) =Rb a f(t)dt.

EXEMPLE:LOI UNIFORME SUR[a,b]

X suit une loi uniforme sur[a,b]si sa densitéf est f(x) = 1

b−a1_[a,b](x).

(38)

V.

A

.

À DENSITÉ

.

PROPOSITION

Si X a pour densité f , alors

∀x ∈R, F_X(x) =P(X ≤x) =Rx

−∞f(t)dt.

F_X est continue.

F_X est dérivable aux points de continuité de f avec f_X(x) =F_X⁰ (x).

EXEMPLE:LOI UNIFORME SUR[a,b]

SiX suit la loi uniforme sur[a,b], alors F_X(x) =0 six ≤a,

F_X(x) = x −a

b−a six ∈[a,b], F_X(x) =1 pourx ≥b.

(39)

V.

A

.

DISCRÈTES

.

DÉFINITION

Une v.a. X estdiscrètesi elle ne prend qu’un nombre fini (ou dénombrable) de valeurs{x_i ∈R, i ∈N}avec probabilité p_i =P(X =x_i)≥0. De plus

+∞

X

i=0

P(X =x_i) =

+∞

X

i=0

p_i =1.

REPRÉSENTATIONen tableau

X x₀ x₁ x₂ x₃ . . . (valeurs prises parX) P(X =x_i) p₀ p₁ p₂ p₃ . . . (probabilité)

PROPOSITION

Si X est une v.a. discrète, F_X est constante par morceaux.

(40)

E

XEMPLE

:

DÉ À SIX FACES

.

FONCTION DE RÉPARTITIONd’une v.a. de loi uniforme sur{1, . . . ,6}

(41)

P

LAN

(42)

M

ÉTHODE D

’

INVERSION

.

SiX est une v.a.r. alors la fonction de répartitionF_X est définie par

∀x ∈R, F_X(x) =P(X ≤x).

CommeF_X est croissante, on peut définir la fonctionpseudo-inverse q_X deF_X ainsi :

∀u∈(0,1), q_X(u) =inf{x ∈R, F_X(x)>u}.

THÉORÈME

SiU suit une loi uniforme sur[0,1],q_X(U)suit la même loi queX. PROPOSITION

Si F est inversible, alors q =F⁻¹.

(43)

E

XEMPLES

.

SiU suit une loi uniforme sur[0,1], alors LOI UNIFORME SUR[a,b]

X =a+ (b−a)Usuit la loi uniforme sur[a,b].

LOI EXPONENTIELLE X =−1

λln(1−U)suit la loi exponentielle de paramètreλ.

LOI DECAUCHY

X =ctan(π(U−1/2))suit la loi de Cauchy de paramètrec.

LOI DEBERNOULLI

SiU <1−p,X =0, sinonX =1 : suit la loi de Bernoulli de paramètre

(44)

L

OI DISCRÈTE À SUPPORT FINI

.

f u n c t i o n r e a l i s = r d i s t ( x , p ) n=length( p ) ;

r = rand; a = 0 ; b = p ( 1 ) ; f o r i = 1 : n−1,

i f ( ( r >=a ) & ( r <b ) ) r e a l i s = x ( i ) ; r e t u r n;

end

a = b ; b = b + p ( i + 1 ) ; end

r e a l i s = x ( n ) ;

(45)

L

OI UNIFORME

.

f u n c t i o n r e a l i s = r a n d d i s c r ( x , n ,m)

%Renvoie des realisations iid

%de loi uniforme sur x(1),...,x(length(x)).

%n et m sont des entiers optionnels, valant 1 par defaut.

i f (nargin==0)

e r r o r( ’ Pas assez de parametres ’) ; e l s e i f (nargin==1)

n = 1 ;m= 1 ;

e l s e i f (nargin==2) m= 1 ;

e l s e i f (nargin>3)

e r r o r( ’ Trop de parametres ’) ; end;

r e a l i s = reshape( x (c e i l(length( x )∗rand( n ,m) ) ) , n ,m) ; r e t u r n;

(46)

I

NVERSION

:

DIMENSION QUELCONQUE

.

Soit une v.a.X = (X₁,X₂)de loi connuePX surR²avec densitéf >0.

Fonction de répartition deX₁: F_X₁(x₁) =

Z x1

−∞

Z

R

f(x,y)dxdy. Soitq₁son inverse.

Fonction de répartitionF_X^X¹^=x¹

2 de la loi conditionnelle deX₂sachant X₁=x₁:

F_X^X¹^=x¹

2 (x₂) = Rx2

−∞f(x₁,y)dy R+∞

−∞ f(x₁,y)dy. Inverse :q₂.

MÉTHODE

Si U₁et U₂sont deux v.a. uniformes sur[0,1]indépendantes, alors X =q (U ), X =q (q (U ),U ).

(47)

P

LAN

(48)

L

OI BINOMIALE

.

DÉFINITION

Une v.a. X à valeurs entières comprises entre 1 et N suit uneloi binômialede paramètres N∈N^∗et p ∈[0,1]si :

∀k =1, . . . ,N, P(X =k) =C_N^kp^k(1−p)^N−k. PROPOSITION

Soient U_i, i=1, . . . ,N des v.a. uniformes sur[0,1]indépendantes.

Soit X le nombre des U_i inférieures à p∈[0,1], i.e.X =

N

X

i=1

1_U_i_<p. Alors X suit une loi binomiale de paramètres N et p.

MÉTHODE

SimulerN v.a. de BernoulliX_i et en faire la somme.

(49)

L

OI GÉOMÉTRIQUE

.

DÉFINITION

Une v.a. X à valeurs entières strictement positives suit uneloi géométriquede paramètre p∈]0,1[si :

∀n≥1, P(X =n) =p(1−p)ⁿ⁻¹. QUELQUES RÉSULTATS:

E(X) = ¹_p, Var(X) = ^1−p_p₂ . P(X ≥k) = (1−p)^k−1. PILE OU FACE

Une loi géométrique est la loi du nombre de tirages à pile ou face (indépendants) à réaliser pour obtenir face (si face ap% de chances de sortir).

(50)

L

OI DE

P

OISSON

.

DÉFINITION

Une v.a. X à valeurs entières positives suit uneloi de Poissonde paramètreλ >0si :

∀n≥0, P(X =n) =e^−λλⁿ n!. MOMENTS:E(X) =Var(X) =λ.

PROPOSITION

Soit(E_n)n∈Nv.a. i.i.d. exponentielles de paramètreλ. Alors

P(E₁+. . .+En≤1<E₁+. . .+E_n+1) =e^−λλⁿ n!.

(51)

L

OI DE

P

OISSON

.

DÉFINITION

Une v.a. X à valeurs entières positives suit uneloi de Poissonde paramètreλ >0si :

∀n≥0, P(X =n) =e^−λλⁿ n!. MOMENTS:E(X) =Var(X) =λ.

MÉTHODE

X = 1_E₁_≤1<E₁_+E₂+2×1_E₁_+E₂_≤1<E₁_+E₂_+E₃+. . . +n×1_E₁_+...+E_n_≤1<E₁_+...+E_n+1+. . .

suit une loi de Poisson de paramètreλ.

(52)

P

LAN

(53)

Q

UELLES VÉRIFICATIONS

?

DEUX TYPESde vérifications :

histogramme normalisé contre densité,

fonctions de répartition empirique contre théorique.

Dans les deux cas, il faut d’abord simuler ungrand nombre de foisla loi en question. Pourn∈N^∗, on obtient un vecteur(x₁, . . . ,x_n)qui contientnréalisations de la loi deX.

(54)

H

ISTOGRAMME VS

.

DENSITÉ

.

HISTOGRAMME NORMALISÉ

1 regrouper lesntermes dans un certain nombremde classes (avecm<n). Dans chaque classermréalisations deX avec X

m

rm=n.

2 normalisation : la somme des aires des colonnes fait 1

−→rm/(n(C_m+1−Cm)).

3 tracé : sur l’axe des abscisses, placer lesmcentres desm classes, et mettre une colonne de hauteurrm/(n(C_m+1−Cm)).

CONVERGENCE VERS LA DENSITÉ r_m

n(C_m+1−C_m) −→

n→+∞

1

C_m+1−C_mP(X ∈[C_m,C_m+1[).

(55)

H

ISTOGRAMME VS

.

DENSITÉ

.

CONVERGENCE VERS LA DENSITÉ r_m

n(C_m+1−C_m) −→

n→+∞

1

C_m+1−C_mP(X ∈[C_m,C_m+1[).

CONCLUSION

SiX discrète avecC_k espacés de 1, approximativementp_k. SiX à densité, alors

P(X ∈[C_m,C_m+1[) C_m+1−Cm

= 1

C_m+1−Cm

Z Cm+1

Cm

f(t)dt −→

Cm+1−Cm→0f(C_m).

(56)

R

ÉPARTITION EMPIRIQUE VS

.

THÉORIQUE

.

FONCTION DE RÉPARTITION EMPIRIQUE

∀t∈R, Fⁿ(t) = 1 n

n

X

i=1

1_]−∞,t](x_i).

THÉORÈME DEKOLMOGOROV-SMIRNOV

∀t∈R, lim

n→+∞Fⁿ(t) =F_X(t).

(57)

E

XEMPLE SUR LA LOI EXPONENTIELLE

(2).

n=100

0 1 2 3 4 5 6

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

Histogramme vs densite

!1 0 1 2 3 4 5

!0.2 0.0 0.2 0.4 0.6 0.8 1.0

Fcts de repartition

empirique theorique

(58)

E

XEMPLE SUR LA LOI EXPONENTIELLE

(2).

n=10000

0 1 2 3 4 5 6 7 8

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

Histogramme vs densite

!1 0 1 2 3 4 5 6 7

!0.2 0.0 0.2 0.4 0.6 0.8 1.0

Fcts de repartition

empirique theorique

(59)

E

XEMPLE SUR LA LOI DE

B

ERNOULLI

(0.3).

n=100

!0.5 0.0 0.5 1.0 1.5 2.0

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

Histogramme

!1.0 !0.5 0.0 0.5 1.0 1.5 2.0

!0.2 0.0 0.2 0.4 0.6 0.8 1.0

Fcts de repartition

empirique theorique

(60)

E

XEMPLE SUR LA LOI DE

B

ERNOULLI

(0.3).

n=10000

!0.5 0.0 0.5 1.0 1.5 2.0

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

Histogramme

!1.0 !0.5 0.0 0.5 1.0 1.5 2.0

!0.2 0.0 0.2 0.4 0.6 0.8 1.0

Fcts de repartition

empirique theorique

(61)

P

LAN

(62)

M

ÉTHODE DE REJET

.

On veut simuler une v.a. de densitéf, et il existe une densitég simulable facilementet uneconstantek ≥1telle que

∀x ∈R, f(x)≤kg(x).

Soitα(x) = f(x) kg(x). PROPOSITION

Soit(X_i)i≥1une suite de v.a. i.i.d. de densité g, et(U_i)i≥1une suite de v.a. i.i.d. de loi uniforme sur[0,1], indépendante de la suite(X_i)i≥1. Soit

T =inf{i ≥1, U_i ≤α(X_i)}.

La variable X_T a pour densité f .

(63)

M

ÉTHODE DE REJET

.

MÉTHODE

Soit(X₁,U₁)un couple de v.a. indépendantes telles que X₁suive la loi de densité g et U₁suive une loi uniforme sur[0,1]. Si U₁≤α(U₁), on pose X =X₁.

Sinon on rejette X₁et on recommence en générant une suite

(X_n,U_n)_n≥2de v.a. indépendantes de même loi que(X₁,U₁)jusqu’à l’instant p où U_p≤α(X_p). On pose alors X =X_p.

REMARQUES

on n’a pas besoin de connaîtreF, niF⁻¹. elle s’étend àR^d, à des lois discrètes, etc.

(64)

M

ÉTHODE DE REJET

:

VITESSE

.

Calcul de la probabilité d’acceptation :

p=P(U ≤α(X)) = 1 k.

DoncT a pour distribution uneloi géométrique de paramètrep.En moyenne, on doit rejeterk =1/p fois avant d’accepter la valeur.

Ainsi il faut choisirg telle que

k =max f

g

soit la plus petite possible.

(65)

P

LAN

(66)

L

OI NORMALE

:

MÉTHODE POLAIRE

.

PROPOSITION

SiY ∼ N(µ, σ²), alorsX = (Y −µ)/σ∼ N(0,1).

Pour simulerX (etY)

simuler deux lois uniformesUetV sur[0,1]; poser

X =√

−2 lnUcos(2πV), Y =√

−2 lnUsin(2πV).

PROPOSITION

X et Y sont deux v.a. normales centrées réduites indépendantes.

Ou utiliser sous Matlabrandn(n,m).

(67)

L

OI NORMALE

:

MÉTHODE POLAIRE

.

Pour simulerX (etY)

simuler deux lois uniformesUetV sur[0,1]; poser

X =√

−2 lnUcos(2πV), Y =√

−2 lnUsin(2πV).

c l f; hold on

t i t l e( ’ S i m u l a t i o n d ’ ’ une l o i normale ’) y l a b e l( ’ E f f e c t i f s ’) ; x l a b e l( ’ V a l e u r s ’) ; [ E , C] = e c d f (s q r t(−2∗log(rand( 5 0 0 0 , 1 ) ) )

.∗cos( 2∗p i∗rand( 5 0 0 0 , 1 ) ) ) ; e c d f h i s t ( E , C, 4 0 ) ;

hold on

p l o t( C, ( 2∗p i) ^ (−1 / 2 )∗exp(−C . ^ 2 / 2 ) , ’ r−’) ; legend( ’ Empirique ’,’ Theorique ’)

hold o f f

(68)

L

OI NORMALE

:

MÉTHODE POLAIRE

.

(69)

L

OI NORMALE

:

MÉTHODE POLAIRE

.

(70)

L

OI NORMALE

:

MÉTHODE POLAIRE

-

REJET

.

PROPOSITION

(X,Y) = (ρcos(θ), ρsin(θ))suit uneloi uniforme sur le disque unité du plan, alors

p−4 ln(ρ) ρ (X,Y)

suit une loi normale centrée réduite bidimensionnelle.

(X,Y)facile à simuler par rejet à partir d’une uniforme sur le carré [−1,1]²(rejet dans 21 % des cas puisqueπ/4≈0,79).

θetρindépendantes,

ρloi de densitéu7→2u1_[0,1](u),−4 ln(ρ)exponentielle de paramètre 1/2,

θuniforme sur[0,2π].

(71)

L

OI UNIFORME SUR LE DISQUE

.

(72)

V

ECTEUR GAUSSIEN

.

PROPOSITION Soit

m∈Rⁿ,

Γ∈S_n⁺(R)matrice réelle de taille n symétrique positive, Y vecteur aléatoire gaussien standard de moyenne nulle et matrice de covariance Idn.

Alors le vecteur aléatoireX = Γ^1/2Y+mest gaussien de moyenne m et de matrice de covarianceΓ.

SiY est un vecteur gaussien de loiN(0,Idn), ses coordonnées sont i.i.d. de loiN(0,1). Ainsi on peut simuler une réalisation deY en simulantnréalisations indépendantesY₁(ω), . . . ,Y_n(ω)de loiN(0,1).

(73)

P

LAN

(74)

D

EUX EXEMPLES

.

EXEMPLE THÉORIQUE.Calculerθ=E(e^5Z) =e⁵²^/2avecZ ∼ N(0,1) variance théorique :σ²=e⁵⁰−e²⁵≈7×10¹⁰.

valeur exacte : 268337.

nombre tirages :N=500000.

valeur estimée :θ=221741.

Intervalle de confiance :I= [−65186,508668].

(75)

D

EUX EXEMPLES

.

EXEMPLE PLUS CONCRET.CallC=E((5e^(Z^−1/2)−3)⁺)avec Z ∼ N(0,1)

valeur exacte : 2,71.

nombre tirages :N=1000.

valeur estimée : 2,83.

Intervalle de confiance :I= [2,42;3,24].

PutP =E((3−5e^(Z−1/2))⁺)etC−P=2.

valeur exacte : 0,71.

valeur estimée : 0,70.

Intervalle de confiance :I= [0,64;0,76].

Contrôle:C=2+P.

(76)

R

ÉDUCTION DE VARIANCE

:

MÉTHODES

.

Variables antithétiques.

Variables de contrôle.

Échantillonnage préférentiel (ou d’importance).

Échantillonnage stratifié.

Méthodes adaptatives (chaînes de Markov).

(77)

P

LAN

(78)

V

ARIABLES ANTITHÉTIQUES

.

BUT :calculerθ=E(Y) =E(f(X)).

DEUX V.A.Y₁etY₂de même loi queY. E(Y) = ¹₂(E(Y₁) +E(Y₂)) =E

Y₁+Y₂ 2

; Var

Y₁+Y₂ 2

= Var(Y₁)+Var(Y₂)+2Cov(Y₁,Y₂)

4 ;

siY₁etY₂décorrélées (ou indépendantes), Var

Y₁+Y₂ 2

= Var(Y)

2 ;

si Cov(Y₁,Y₂)<0, alors Var

Y1+Y2

2

< Var(Y) 2 .

QUESTION:comment obtenirY₁etY₂de même loi queY avec Cov(Y₁,Y₂)<0?

(79)

V

ARIABLES ANTITHÉTIQUES UNIFORMES

.

HYPOTHÈSE:Y =g(U)oùUuniforme sur[0,1]. ALGORITHME CLASSIQUEavec échantillon de taille 2n.

MÉTHODE de i=1 à 2n générerU_i

définirY_i =g(U_i) fin

définirθˆ_2n=Y_2n= 1 2n

2n

X

i=1

Y_i etσˆ_2n² = 1 2n−1

2n

X

i=1

(Y_i−θˆ_2n)²

définirCI = [ˆθ2n−c_α√σˆ2n

2n,θˆ2n+c_α√ˆσ2n

2n]

(80)

V

.

HYPOTHÈSE:Y =g(U) avecU uniforme sur[0,1].

ALGORITHMEavec échantillon de taille 2n.

MÉTHODE de i=1 à 2n générerU_i

définirY_i =g(1−U_i) fin

définirθˆ2n=Y_2n= 1 2n

2n

X

i=1

Y_i etσˆ_2n² = 1 2n−1

2n

X

i=1

(Y_i−θˆ2n)²

définirCI = [ˆθ_2n−c_α σˆ_2n

√

2n,θˆ_2n+c_α ˆσ_2n

√ 2n]

(81)

V

.

ALGORITHME MÉLANGÉ avec échantillon de taillen.

MÉTHODE de i=1 à n générerU_i

définirY_i =g(U_i),Y˜_i =g(1−U_i)etZ_i = Y_i+ ˜Y_i fin 2

définirθˆ_n,a=Z_n= 1 n

n

X

i=1

Z_ietσˆ_n²= 1 n−1

n

X

i=1

(Z_i−θˆ_n)²

définirCI = [ˆθn,a−c_α σˆn

√n,θˆn,a+c_ασˆn

√n]

(82)

V

.

DIFFÉRENTS RÉSULTATS: θˆ_2n =Y_2n= _2n¹ P2n

i=1Y_i; θˆn,a=Zn= ¹_nPn

i=1Z_i. COMPARAISON DES VARIANCES

Var(ˆθ_2n) =Var

P2n i=1Y_i 2n

!

= Var(Y) 2n Var(ˆθn,a) =Var(ˆθ_2n) + Cov(Y,Y˜)

2n .

Ainsi

Var(ˆθn,a)<Var(ˆθ2n)⇐⇒Cov(g(U),g(1−U))<0.

(83)

V

.

THÉORÈME

Sig est une fonction monotone, alors Cov(g(U),g(1−U))<0.

CONSÉQUENCE

Méthode d’inversion :g=f(F_X⁻¹)est monotone sif l’est.

(84)

V

ARIABLES ANTITHÉTIQUES

:

GÉNÉRALISATION

.

HYPOTHÈSE SURX :il existeat.q.X eta−X aient la même loi.

EXEMPLES

Lois normalesN(µ, σ²):a=2µ.

Lois de Laplace de paramètreλ >0 :f(x) = ^λ₂exp(−λ|x|).a=0.

MÉTHODE de i=1 à n générerX_i

définirY_i =g(X_i),Y˜_i =g(a−X_i)etZ_i = Y_i+ ˜Y_i fin 2

définirθˆn,a=Z_n= 1 n

n

X

i=1

Z_ietσˆ_n²= 1 n−1

n

X

i=1

(Z_i−θˆn)²

définirCI = [ˆθ_n,a−c_α σˆ_n

√n,θˆ_n,a+c_ασˆ_n

√n]

(85)

E

XEMPLE

:

OPTION

K

NOCK

-I

N

.

CONTRAT FINANCIERde payoffh(S_T) =max(0,S_T −K)1_S_T_>B. MODÈLEBLACK-SCHOLESS_T =S₀exp((r −σ²/2)T +σ√

T X, X ∼ N(0,1).

PRIX DU CONTRAT

C =e^−rTE(h(S_T)) =e^−rTE max(0,S_T −K)1_S_T_>B .

JEU DE PARAMÈTRESS₀=2,K =1,B =2,5,r =0,1,σ =0.3, T =10,N=5000.

RÉSULTATS OBTENUS

sans réduction de variance :C=1.5720 (variance 5.4236) ; avec réduction de variance :C =1.5543 (variance 1.5827).

(86)

P

LAN

(87)

V

ARIABLES DE CONTRÔLE

.

BUT :calculerθ=E(Y) =E(f(X)).

AJOUT d’une variableZ facilement simulable ;

E(Z)connue ou facilement calculable (variance « petite »).

DEUX CALCULS POSSIBLES DEθ:

par méthode de Monte Carlo standard,

en posantW_c =Y +c(Z−E(Z))et en calculantE(W_c)par Monte Carlo (c : paramètre constant fixé).

QUESTION:Var(W_c)<Var(Y)?

(88)

V

ARIABLES DE CONTRÔLE

.

CALCUL DE LA VARIANCE:

Var(Wc) =Var(Y) +c²×Var(Z) +2c×Cov(Y,Z).

CHOIX OPTIMAL DEc :c^∗ =−Cov(Y,Z)

Var(Z) ; Var(Wc^∗) =Var(Y)−Cov(Y,Z)²

Var(Z) ; Var(W_c^∗)<Var(Y)⇔Cov(Y,Z)<0; Z :variable de contrôledeY.

ALGORITHME:

θˆN,c^∗ = 1 N

N

X

i=1

(Y_i+c^∗(Z_i−E(Z)))≈θ.

(89)

MMC

AVEC VARIABLE DE CONTRÔLE

.

MÉTHODE

ÉTAPE1 :ppetit→détermine une valeur approchée de c^∗. Simuler p v.a.(Yn)1≤n≤pet p v.a.(Zn)1≤n≤p.

Poser :

Eb(Z) = 1 p

p

X

i=1

Z_i, Eb(Y) = 1 p

p

X

i=1

Y_i,

Vard(Z) = 1 p−1

p

X

j=1

(Z_j−Eb(Z))²,

Cov(Yd ,Z) = 1 p−1

p

X

j=1

(Y_i−Eb(Y))(Z_j−Eb(Z))).

Cov

(90)

MMC

AVEC VARIABLE DE CONTRÔLE

.

MÉTHODE

ÉTAPE1 :ppetit→détermine une valeur approchée de c^∗. ÉTAPE2 :N grand.

Simuler N v.a.(Y_n)1≤n≤N et N v.a.(Z_n)1≤n≤N. Poser :

θb= 1 N

N

X

i=1

(Y_i +cb^∗(Z_i−E(Zb )))≈θ.

(91)

U

N EXEMPLE

.

ÉNONCÉ

Calculerθ=E(e^(U+V⁾²)avecU etV de loi uniforme sur[0,1].

Y =e^(U+V)².

Variables de contrôle :Z₁=U+V,Z₂= (U+V)²ou encore Z₃=exp(U+V).

(92)

L

E PROGRAMME

(

CALCUL DE

c

^∗

).

p =500;

u=rand( p , 1 ) ; v=rand( p , 1 ) ;

y=exp( ( u+v ) . ^ 2 ) ; z1=u+v ; z2 = ( u+v ) . ^ 2 ; z3=exp( u+v ) ; a1=cov( [ y z1 ] ) ;

a2=cov( [ y z2 ] ) ; a3=cov( [ y z3 ] ) ;

c _ e s t 1=−a1 ( 1 , 2 ) / a1 ( 2 , 2 ) c _ e s t 2=−a2 ( 1 , 2 ) / a2 ( 2 , 2 ) c _ e s t 3=−a3 ( 1 , 2 ) / a3 ( 2 , 2 )

Valeurs obtenues : c est1 = - 11.088954 c est2 = - 5.7049857 c est3 = - 3.9928724

(93)

L

E PROGRAMME

(MMC).

n =5000;

u=rand( n , 1 ) ; v=rand( n , 1 ) ;

y=exp( ( u+v ) . ^ 2 ) ; z1=u+v ; z2 = ( u+v ) . ^ 2 ; z3=exp( u+v ) ; m1=mean( z1 )

m2=mean( z2 ) m3=mean( z3 )

w1=y+ c _ e s t 1∗( z1−m1 ) ; w2=y+ c _ e s t 2∗( z2−m2 ) ; w3=y+ c _ e s t 3∗( z3−m3 ) ; b0 = [mean( y ) s t d e v ( y ) ^ 2 ] b1 = [mean( w1 ) v a r ( w1 ) ] b2 = [mean( w2 ) v a r ( w2 ) ] b3 = [mean( w3 ) v a r ( w3 ) ]

%Intervalle de confiance

CI = [ b2 (1)−1.96∗s t d e v ( w2 ) /s q r t( n ) ,

b2 ( 1 ) + 1 . 9 6∗s t d e v ( w2 ) /s q r t( n ) ]

(94)

B

ILAN

.

Valeurs obtenues :

m1 = 1.0006399 (exacte 1) ;

m2 = 1.171765 (exacte 7/6≈1.1666667) ; m3 = 2.959135 (exacte(e−1)²≈2.9524924) ;

moyenne variance b0 4.9317203 34.564778 b1 4.9317203 13.840552 b2 4.9317203 7.7461357 b3 4.9317203 7.2175877 CI =[4.8545742,5.0088663].

(95)

P

LAN

(96)

M

ONTE

C

ARLO CONDITIONNEL

.

IDÉE:au lieu de calculerθ=E(Y) =E(f(X)), pourZ v.a.

poserV =E(Y|Z) =g(Z)v.a. ; etθ=E(V).

CONDITIONS:

Z facilement simulable ; V facilement calculable.

CALCULS DE LA VARIANCE:Var(Y|Z)est une v.a. positive : Var(Y|Z) =E

h

(Y −E(Y|Z))² Zi

, et commeY −E(Y)−(E(Y|Z)−E(Y))⊥E(Y|Z)−E(Y),

Var(Y)=E(Var(Y|Z)) +Var(E(Y|Z))⇒Var(Y)≥Var(E(Y|Z)).

(97)

P

LAN

(98)

É

VÉNEMENTS RARES

.

Technique utilisée beaucoup pour

θ=P(X ≤seuil) =E(1_X_≤seuil),

quand l’occurence deX ≤seuil est très petite.

EXEMPLES.

Catastrophes climatiques, ferroviaires, aériennes, etc.

Faillites de grosses entreprises, d’états, etc.

Cracks boursiers importants

BUT :mesurer les risques de portefeuille, opérationnels, etc.

(obligation légale pour les banques ou les assurances).

(99)

E

XEMPLE

.

X suit une loi normale de paramètres 0 et 1

θ=P(X ≤ −10) =E(1_X≤−10).

MONTE-CARLO CLASSIQUE.

Nombre de tiragesN variant de 1000 à 10000000.

Valeur estimée : 0.

CONCLUSION ERRONÉE:θ=0.

VALEUR EXACTE:θ=7.6199×10⁻²⁴.

Nombre de tirages nécessairesde l’ordre de 10²⁵: impossible !

(100)

É

CHANTILLONNAGE PRÉFÉRENTIEL

:

PRINCIPE

.

Changer la loi.Soientφla densité deX etψune autre densité telle queψ(x)6=0 siφ(x)6=0. Alors

θ = E(f(X)) = Z

f(x)φ(x)dx = Z

f(x)φ(x)

ψ(x)ψ(x)dx

= E(h(Y)), avech(x) =f(x)φ(x)

ψ(x) etY ∼ψ.

DÉFINITION :g est unefonction d’importance.

QUESTION:comment choisirg?

(101)

R

ETOUR SUR L

’

EXEMPLE

.

X ∼ N(0,1)etθ=P(X ≤ −10):forcerles tirages deY à être aux alentours de -10. DoncY ∼ N(−10,1).

REMARQUE

SiY ∼ N(µ, σ²), alorsP(Y ≤µ) =1/2.

θ = P(X ≤ −10) = Z

R

1_x≤−10 1

√ 2π exp

−x² 2

= Z

R

1_x≤−10





√1

2πexp

−^x₂²

√1 2πexp

−^(x+10)₂ ²





√1 2π exp

−(x +10)² 2

dx

= Z

R

1x≤−10exp

10x+ (−10)²/2 1

√2πexp

−(x+10)² 2

dx