Simulations
En programmation dynamique stochastique, on doit calculer les valeurs espérées des prots, pour diérentes décisions.
On utilise des simulations pour calculer les espérances selon des distributions de probabilités données (intégration Monte Carlo).
(voir cours IFT6561 Simulations: aspects stochastiques)
Option européenne (aucune programmation dynamique)
Option européenne: paiement à l'échéance
Option américaine: on peut exercer l'option avant l'échéance (stratégie d'exercice à optimiser)
Exemple: option de vente européenne sur une action suivant le modèle Black-Scholes. Le paiement à T = 1 an est max ( 0 , K − S
T) , où K est le prix d'exercice et S
Test le prix (stochastique) de l'action après 1 an.
(K = 101 $, S
0= 100 $ )
ST($)
70 95 120 145
paiement ($)
0 5 10 15 20
Mouvement brownien géométrique (Black-Scholes)
La probabilité de distribution du prix de l'action est supposée suivre:
dS
S = r dt + σ dB On discrétise le temps:
log(S
k+1) = log(S
k)+(r −σ
2/2)(t
k+1−t
k)+σ √
t
k+1− t
k· valeur aleatoire N(0, 1)
temps (an)
0 0.25 0.5 0.75 1
S ($)
89 100 114
Fig.: S
0= 100 $ , r = 0 . 05, σ = 0 . 08, T = 1 an, 13 temps discrets
Le prix de l'option est l'espérance des prots (actualisés):
prix = e
−rTE
ST[ paiement ( S
T)]
= e
−rTZ
dS
Tprobabilite ( S
T) · paiement ( S
T)
= e
−rT1 N
N
X
j=1
paiement ( S
T(j)) = 1 . 5489 $ La distribution de S
Test log-normale (64000 simulations):
ST($) 80 90 100 110 120 130 140 probabilite relative
Moindres carrés
On a un ensemble de points {( x
j, y
j) : j = 1 , . . . , N } et on veut approximer leur dépendance sous la forme y ( x ) = ˜ f
~β( x ) , où
˜ f
β~( x ) = P
di=1
β
iψ
i( x ) est une combinaison linéaire de fonctions de base (par exemple, f
~β( x ) = β
0+ β
1x + β
2x
2+ β
3x
3).
Les paramètres β ~ optimaux minimisent la somme des diérences carrées:
min
β~ NX
j=1
˜ f
β~(x
j) − y
j2
.
Il s'agit d'un problème d'optimisation quadratrique qui se réduit à
un système d'équations linéaire.
Option de vente américaine
Exemple: sur T = 1 an, à chaque mois (k = 1 , . . . , 12), on a le choix d'exercer l'option (paiement = max(0, K − S
k)) ou
d'attendre, en espérant que le paiement futur soit plus grand que
l'exercice immédiat.
An de déterminer le prix de l'option au temps 0, on doit déterminer la stratégie d'exercice optimale, pour chaque temps intermédiaire, k. On trouve ces stratégies optimales par chaînage arrière, en évaluant la valeur de l'option aux temps intermédiaires (la valeur de l'option est la fonction de valeur, J
k( S
k) ).
Équation de récurrence de programmation dynamique:
J
k( S
k) = max “
paiement d
0exercise ( S
k), e
−r(tk+1−tk)E
Sk+1[ J
k+1( S
k+1)| S
k] ”
Résultats (stratégie optimale et prix)
temps (an)
0.25 0.50 0.75 1.00
prix de l'action, Sk
90 95 100101 105 110
Le prix de cette option américaine est de 2.16$ (la version
européenne vaut 1 . 55 $ ).
Méthode TvR
Sk($) 90 95 100 105 110 valeur d'exercice/valeur d'attendreau mois k=6
0 2.5 5 7.5 10 12.5
La valeur d'attente, Q
k( S
k) = e
−r(tk+1−tk)E
Sk+1[ J
k+1( S
k+1)| S
k] , est estimée par moindres carrés sur l'ensemble de points
stochastique:
n S
k(j), e
−r(tk+1−tk)J ˜
k+1( S
k(j+)1)
: j = 1 , . . . , N o
.
Méthode TvR (suite)
Sk($) 90 95 100 105 110 valeur d'exercice/valeur d'attendreau mois k=6
0 2.5 5 7.5 10 12.5