• Aucun résultat trouvé

A contribution in stochastic control applied to finance and insurance

N/A
N/A
Protected

Academic year: 2021

Partager "A contribution in stochastic control applied to finance and insurance"

Copied!
179
0
0

Texte intégral

(1)

UNIVERSITY OF Paris - Dauphine

CEREMADE

P H D T H E S I S

to obtain the title of

PhD of Applied Mathematics

of the University Paris - Dauphine

Defended by

Ludovic Moreau

on September 25th 2012

A Contribution in Stochastic

Control Applied to Finance and

Insurance

Thesis Advisor: Bruno Bouchard-Denize

Reviewed and examined by:

Peter Bank, Professor at Technische Universität Berlin Nizar Touzi, Professor at École Polytechnique

and presented to the jury composed of:

Bruno Bouchard-Denize, Professor at Univerité Paris Dauphine Luciano Campi, Professor at Université Paris 13

Nicole El Karoui, Professor at École Polytechnique Pierre Cardaliaguet, Professor at Université Paris Dauphine

(2)
(3)

Remerciements

Je tiens avant tout à remercier chaleureusement les deux Bruno qui sont à l'origine de cette thèse. Bruno Bouchard pour ses nombreux conseils, sa grande disponi-bilité ainsi que sa patience, mais aussi parce que travailler avec lui a été source d'inspiration, et un grand plaisir. Bruno Lepoivre pour sa très grande ouverture d'esprit, sa patience et sa conance.

Je remercie également Peter Bank et Nizar Touzi pour avoir accepté de rapporter cette thèse, ainsi que Luciano Campi, Pierre Cardaliaguet et Nicole El Karoui pour avoir accepté de participer à ce jury, j'en tire une grande erté.

Il est aussi important pour moi d'exprimer toute ma gratitude à Jean-Michel Geeraert, Patrick Degiovanni, Patrick Duplan et Thierry Langreney pour m'avoir accueilli pendant ces trois années au sein de Pacica, liale assurance dommages de Crédit Agricole Assurances, et pour m'avoir laissé la liberté d'explorer certaines de mes idées jusqu'au bout. Je remercie aussi à ce titre Cécile et Céline.

Merci aussi à Romuald, Marcel, Adrien, Minh, Damien, Jerey ou Alexandre, pour avoir de près ou de loin travaillé à mes côtés, ces expériences ont toutes été enrichissantes.

J'ai une pensée particulière pour mes collègues de Pacica, pour la bonne am-biance qui a régné pendant ces 3 années dans ces locaux. Je remercie donc Christine, François, Romain, Gilles, Jérôme, Antoine, Julien et Éliette.

Merci à Yann Mercuzot et à tous les stagiaires que j'ai eu l'occasion d'encadrer de près ou de loin, la qualité de votre travail m'a permis de passer plus de temps sur cette thèse.

Je tiens aussi à remercier Christine Vermont pour son extrême gentillesse et sa très grande disponibilité, ce qui m'a certainement permis d'accomplir tout ce qui a suivi.

Finalement, toute ma reconnaissance va à Carlo, Franck, Jennifer, Éléonore pour m'avoir aidé/supporté pendant toute cette période, et à Charlie pour tout le reste.

(4)
(5)

Contents

1 Introduction 1

1.1 Stochastic Target in Finance and Insurance . . . 2

1.1.1 The GDP in P-a.s. criterion . . . 3

1.1.2 The stochastic target with controlled expected loss . . . 4

1.1.3 The extension of the GDP for the moment criterion . . . 5

1.1.4 The mixed diusion case. . . 6

1.1.5 Further references and advances in the eld of Stochastic Targets 8 1.2 The stochastic target games . . . 9

1.2.1 The game version of GDP . . . 10

1.2.2 Derivation of the Hamilton-Jacobi-Bellman-Isaacs' equation . 12 1.3 Utility Asymptotics - Pricing of Hybrid claims. . . 13

1.3.1 Examples of hybrid products . . . 14

1.3.2 Utility Asymptotics . . . 15

1.4 Further references on Utility Indierence Price Asymptotics . . . 18

2 Introduction 19 2.1 Cibles Stochastiques en Finance et en Assurance . . . 20

2.1.1 Le GDP en contrainte P-a.s. . . 21

2.1.2 Les cibles stochastiques avec pertes contrôlées . . . 22

2.1.3 L'extension du GDP pour le critère en moment . . . 24

2.1.4 Le cas des diusions à sauts . . . 24

2.1.5 Références et avancées dans le domaine des cibles stochastiques 27 2.2 La version jeu des cibles stochastiques . . . 27

2.2.1 La version jeu du GDP. . . 28

2.2.2 Dérivation de l'équation d'Hamilton-Jacobi-Bellman-Isaacs. . 31

2.3 Asymptotiques d'utilité - Valorisation de produits dérivés hybrides . 32 2.3.1 Exemples de produits hybrides . . . 33

2.3.2 Asymptotique d'Utilité. . . 33

(6)

iv Contents

3 Controlled Loss with Jump Diusions 43

3.1 Introduction . . . 43

3.2 Singular stochastic target problems . . . 45

3.2.1 Problem formulation . . . 45

3.2.2 Main results . . . 48

3.2.3 Derivation of the PDE for singular stochastic target problems 55 3.3 Target reachability with controlled expected loss . . . 69

3.3.1 Problem reduction . . . 69

3.3.2 PDE characterization in the domain . . . 72

3.3.3 Boundary conditions and state constraint . . . 78

3.3.4 On the Terminal Condition . . . 82

3.3.5 Derivation of the boundary conditions for the stochastic target with controlled expected loss . . . 85

4 Stochastic Target Games 101 4.1 Introduction . . . 101

4.2 Geometric dynamic programming principle. . . 103

4.2.1 Problem statement . . . 103

4.2.2 The geometric dynamic programming principle . . . 105

4.2.3 Proof of (GDP1) . . . 108

4.2.4 Proof of (GDP2) . . . 112

4.2.5 Proof of Corollary 4.2.3 . . . 115

4.3 The PDE in the case of a controlled SDE . . . 118

4.3.1 Setup . . . 118

4.3.2 PDE for the reachability set Λ . . . 120

4.3.3 PDE in the monotone case . . . 127

4.4 Application to hedging under uncertainty . . . 130

4.4.1 Proof of Theorem 4.4.1. . . 132

5 Utility based pricing: Asymptotic Risk diversication 141 5.1 Introduction . . . 141

5.2 Diversication based pricing rules and risk aversion . . . 143

5.2.1 The market model . . . 143

5.2.2 Diversication and utility based pricing . . . 145

5.3 Asymptotic diversication rule . . . 148

5.3.1 General convergence result. . . 149

5.3.2 Semi-complete markets. . . 153

5.3.3 Incomplete markets and asymptotically exponential utility be-haviors. . . 154

(7)

Contents v

(8)
(9)

Chapter 1

Introduction

Consider a claim g, sold at time t ≥ 0, of maturity T ≥ t, with underlying Xt,x

satisfying Xt,x(t) = x. In case of a European option, the seller of the claim has to

deliver the payo g(Xt,x(T ))at terminal date T to the buyer. The natural question

arising then is to determine a price π to be paid at time t to the seller which will satisfy both the seller and the buyer, so that the risk transfer may occur.

In the so-called complete market case of [BS73, AS92, DS94, HP81], the seller may replicate the payo of the claim by dynamically trading on the market. That is, under good integrability conditions on g(Xt,x(T )), one can nd y ∈ R as well as

a predictable process ν such that g (Xt,x(T )) = y +

Z T

t

νs· dX(s) P-a.s..

The unique fair price is in this case y, since it would lead to arbitrage opportunity otherwise.

In the more realistic situation of incomplete market, when there are e.g. intrinsic, non-traded sources of risk, both the valuation and the hedging problems may become highly non-trivial issues. Considering the no-arbitrage condition leads to an innity of viable prices (see e.g. [DS94]). The risk taker needs thus to dene the amount of money he has to invest at time t in some nancial portfolio that reduces the risk in an appropriate way. The pricing of contingent claims in incomplete markets thus requires a description of preferences of the agents.

Among the dierent approaches one could think of, we refer to [BCS98, CPT99, CM96, CK93, EKQ95, KS98] for the super-replication in incomplete markets, [Dav97] for the marginal utility approach, [BL89, DR91, SF85, Sch88, Sch91, Sch99] for the quadratic error

(10)

minimiza-2 Chapter 1. Introduction tion approach, [Cvi00, FL99, FL00] for the quantile hedging and shortfall risk minimization point of view.

The aim of this thesis is to contribute to this eld.

The rst part of this manuscript is dedicated to the stochastic target approach introduced by Soner and Touzi [ST02c,ST00,ST02a,ST03a], and recently developed by Bouchard, Elie and Touzi [BET09] in order to deal with more general frameworks. More specically, we rst provide a generalization of the work of [BET09] in the case of mixed diusions. This contribution is introduced in Section 1.1.4 below.

Secondly, we establish a game version of the Geometric Dynamic Programming Principle of [ST02a]. This allows us to deal with a more general stochastic target problem in which an adverse player is controlling the diusion. This is related to hedging problems under Knightian ambiguity. This work is introduced in Section 1.2.1.

We nally focus on the utility indierence pricing framework. Our main aim is to study hybrid claims (see e.g. Section1.3.1), that is, claims which are in between Finance and Insurance. We provide for the rst time in this hybrid framework an asymptotic result for general utility functions dened on the whole real line, when the absolute risk aversion converges uniformly towards 0, and the number of sold claims goes to innity. This contribution is introduced in Section1.3.

1.1 Stochastic Target in Finance and Insurance

In a geometric form, a stochastic target problem can be formulated as follows. Let G be a Borel subset of a metric space (Z, dZ), and Zt,zν a Z-valued controlled process

with initial conditions Zν

t,z(t) = z ∈ Z. Consider the so-called reachability set Λ(t)

of initial conditions z ∈ Z such that Zν

t,z(T ) ∈ G P-a.s. for some ν ∈ U, with U the

set of admissible controls:

Λ(t) :=z ∈ Z : there exists ν ∈ U s.t. Zt,zν (T ) ∈ G P-a.s. . (1.1.1) In [ST02a], Soner and Touzi prove that it satises a dynamic programming prin-ciple, the so-called Geometric Dynamic Programming Principle (hereafter GDP). This GDP then allows one to perform the derivation of the associated dynamic programming equation, as it is usual in optimal control.

As we shall see below, the GDP opened the door to a wide range of practical applications in nance and insurance. In particular, the results of Chapter3heavily rely on this GDP.

(11)

1.1. Stochastic Target in Finance and Insurance 3 1.1.1 The Geometric Dynamic Programming and the

super-hedging problem

Fix Z := Rd × R. The GDP of Soner and Touzi [ST02a] reads as follows. In

Markovian Settings, and under good assumptions on the set of controls U, the reachability set

Λ(t) =z ∈ Z : Zν

t,z(T ) ∈ G P-a.s. for some admissible ν

coincides with the set ¯Λ ¯

Λ(t) :=z ∈ Z, Zt,zν (τ ) ∈ Λ(τ ) P-a.s. for some admissible ν ,

for all stopping times τ. Under a "Flow-like" assumption, the rst inclusion Λ(t) ⊆ ¯Λ(t)is straightforward, whereas the second is the "tricky one". It essentially relies on a measurable selection theorem (see [BS78, Proposition 7.49]), which is made possible by the fact that the map (t, z, ν) ∈ [0, T ] × Z × U 7→ Zν

t,z(T ) is

Borel-measurable. We refer the interested reader to [ST02a] for the proof (see [BV10] for an obstacle version).

Fix now Z := (X, Y ) and G := {z := (x, y) ∈ Rd× R s.t. Ψ(x, y) ≥ 0} for

some Borel measurable map Ψ. Consider furthermore that both y 7→ Ψ(·, y) and y 7→ Yν

t,x,y(T )are non-decreasing, for all ν ∈ U. The set Λ(t) can then be identied

to {(x, y) ∈ Rd× R : y ≥ y(t, x)}, with

y(t, x) := infy ∈ R : there exists ν ∈ U s.t. Ψ Xt,xν (T ), Yt,x,yν (T ) ≥ 0 P-a.s. , whenever the above inmum is achieved.

Formulated as above, this problem may be seen as a generalization of the so-called super-replication problem, see e.g. [EKQ95, CK93, CM96, KS98, BCS98,

CPT99].

In the literature, the super-hedging problem is usually solved as follows. The idea is to consider the dual problem, which is a classical optimal control problem, see [JK95,EKQ95,CK93,FK97]. Classical dynamic programming allows to derive the corresponding PDE for the dual value function, which in turns gives a PDE characterization of the value function y.

Soner and Touzi were the rst to propose a treatment of this problem in its primal form, that is, to obtain the PDE characterization of y by means of the GDP. The main advantage is that the primal approach of [ST00,ST02c,ST02b, ST03b,

(12)

4 Chapter 1. Introduction (e.g. gamma constraint), whereas the usual dual approach heavily relies on the fact that the coecients of the wealth dynamics are linear in the control variable, and the stock prices are not inuenced by the trading strategy.

This approach was further exploited in Touzi [Tou00], Bouchard and Touzi [BT00], extended to locally bounded jumps in Bouchard [Bou02], and to path de-pendent constraints in Bouchard and Vu [BV10].

1.1.2 The stochastic target with controlled expected loss in Fi-nance

The approach developed in Section 1.1.1 is very powerful to study a large family of non-standard stochastic control problems, in which a target has to be reached with probability one at time T . As mentioned above, it provides in particular an extension of the classical super-replication problem. However, in most cases, the super-hedging price leads to an unbearable cost for the buyer, which is not reasonable in practice.

Very recently, Bouchard, Elie and Touzi [BET09] relaxed the P-a.s. criterion Ψ(Zt,zν (T )) ≥ 0into a moment constraint of the form E[Ψ(Zt,zν (T ))] ≥ p, with p ∈ R a given threshold. This new approach has opened the door to a wide range of applications, especially in mathematical nance.

We shall briey present in this section some possible applications of stochastic target with controlled loss in nance and insurance.

Let Xν be a process denoting roughly the risks in the portfolio of an agent (one

might think of stocks, but also a xed number of non-tradeable idiosyncratic sources of risks, see Section 1.3.1). Fix g, a map dened on Rd such that g(Xν

t,x(T )) has

enough regularity. The quantity g(Xν

t,x(T ))may be seen as the random payo of a

European claim, given the initial condition Xν

t,x(t) = x. The process Yt,x,yν represents

the wealth of the agent, with initial value y at time t, where ν denotes his strategy in terms of Xν. Consider the value function

y(t, x, p) := infy ∈ R : ∃ ν ∈ U s.t. E Ψ Xt,xν (T ), Yt,x,yν (T ) ≥ p . (1.1.2) For p = 1 and

Ψ : (x, y) 7−→ 1{y≥g(x)},

the value function (1.1.2) represents the super-replication price of the claim g(Xt,xν (T ), as discussed above. If p ∈ (0, 1), Equation (1.1.2) may be written as

(13)

1.1. Stochastic Target in Finance and Insurance 5 and allows one for a treatment of the quantile hedging problem introduced in Föllmer and Leukert [FL99], but in a more general framework, e.g. when the strategy of the agent may inuence the value of the risky assets (large investor model). It also permits to deal with more general investment policies. The original treatment of the problem by Fölmer and Leukert relies on the fact that this strategy is linear in the control.

Consider now the case where p ∈ R and Ψ belongs to some general class of utility functions. More precisely, for an utility function U : R → R and

Ψ : (x, y) ∈ Rd× R 7−→ U(y − g(x)), the problem (1.1.2) reads

y(t, x, p) := infy ∈ R : ∃ ν ∈ U s.t. E U Yt,x,yν (T ) − g Xt,xν (T ) ≥ p . That is, nding the minimum amount of money the investor has to invest in some strategy ν in order to have his expected utility above a given threshold p. If p happens to be chosen as

p := sup

ν0∈UE

h

UYt,x,yν0 o(T )i,

a straightforward reformulation of this problem denes the value function y as the utility indierence price of the claim g:

y(t, x, p) = infy ∈ R : ∃ ν ∈ U s.t. E Ψ Xt,xν (T ), Yt,x,yν o+y(T ) ≥ p . Finally, some minor modications in the previous reasoning allow us to consider the case where Ψ belongs to some class of risk functions,

Ψ : (x, y) ∈ Rd× R 7−→ −ρ([y − g(x)]−)

for some convex non-decreasing loss function ρ : R → R, or the success ratio of Föllmer and Leukert [FL99]

Ψ : (x, y) ∈ Rd× R 7−→ 1{g(x)≤y}(x, y) +

y

g(x)1{g(x)>y∧0}.

1.1.3 The extension of the Geometric Dynamic Programming Principle to moment constraints

When dealing with stochastic target problems with controlled expected loss, the underlying reachability set (although it is not introduced explicitly in Bouchard, Elie and Touzi [BET09] or [Mor11]) is now

Λ(t) :=n(z, p) ∈ Rd× R : there exists ν ∈ U s.t. EΨ Zν

t,z(T ) ≥ p

o .

(14)

6 Chapter 1. Introduction When trying to relate the time-t reachability set to a later time-τ, it is obvious that the value p ∈ R has to be incorporated as a part of the state process. The original idea of Bouchard, Elie and Touzi [BET09, Proposition 3.1] (extended to the mixed diusion case in Proposition 3.3.2) is to apply the martingale representation theorem to the conditional expectation E[Ψ(Zν

t,z(T ))|F·].

The reachability set may actually be dened as Λ(t) :=

 

(z, p) ∈ Rd× R : there exists ν ∈ U and M ∈ Mt,p

s.t. ˜Ψ Zν t,z(T ), M (T ) ≥ 0    , (1.1.4) where ˜Ψ : (z, p) ∈ Rd× R 7−→ Ψ(z) − p and M

t,p denotes a set of martingales M

satisfying M(t) = p. We thus recover a stochastic target problem in P-a.s. criterion on the state process (Z, M), and the GDP of Soner and Touzi reads in this context

Λ(t) =  

(z, p) ∈ Rd× R : there exists ν ∈ U and M ∈ Mt,p

s.t. Zν t,z(τ ), M (τ ) ∈ Λ(τ ) P-a.s.    .

We are then able to derive the dynamic programming PDE from the GDP of [ST02a], up to non-trivial diculties, as explained below.

1.1.4 The derivation of the PDE in the mixed diusion case In Chapter 3, we extend the results of Bouchard, Elie and Touzi [BET09] to the mixed diusion case. Namely, we consider a ltration G generated by a Brownian motion W and a E-marked right continuous point process J. For 0 ≤ t ≤ T , we are given two controlled diusion processes Xν

t,x(s), t ≤ s ≤ T

and {Yν

t,x,y(s), t ≤ s ≤

T } taking their values respectively in Rd and R. These processes satisfy the initial condition Xν

t,x(t), Yt,x,yν (t) = (x, y), and are Rd× R-valued strong solutions of the

stochastic dierential equations

dX(s) = µX(X(s), νs) ds + σX(X(s), νs) dWs + Z E βX X(s−), νs1, νs2(e), e J(de, ds) dY (s) = µY (Z(s), νs) ds + σY (Z(s), νs) dWs + Z E βY Z(s−), νs1, νs2(e), e J(de, ds).

In Bouchard, Elie and Touzi [BET09], the ltration F is generated by the Brownian motion W , and βX ≡ βY ≡ 0. We shall see briey below that this has non-trivial

impacts on both the formulation and the derivation of the associated partial dierential equations.

(15)

1.1. Stochastic Target in Finance and Insurance 7 For a given measurable map Ψ and threshold p, the controller wants to compute:

y(t, x, p) := inf    y ∈ R :E Ψ Xν t,x(T ), Yt,x,yν (T ) ≥ p for some ν ∈ U    . (1.1.5)

As explained in the previous section, increasing the dimension of both the state and the control processes by use of the martingale representation theorem allows to reduce this problem into a standard stochastic target problem.

In the present setting, any martingale M ∈ Mt,pmay be written as

Mt,pα,χ(·) = p + Z · t αs· dWs+ Z · t Z E χs(e) ˜J (de, ds), (1.1.6)

for some control processes α and χ, with ˜J (de, ds) := J (de, ds) − λ(de)dsbeing the compensated measure associated to J. Recalling (1.1.4), we are interested in

y(t, x, p) = inf    y ∈ R : there exists (ν, α, χ) ∈ ˆU s.t. ˜Ψ ˆXt,x,pν,α,χ(T ), Yt,x,yν (T )≥ 0    ,

where ˆXt,x,pν,α,χ stands for the augmented state process (Xt,xν (T ), Mt,pα,χ), and ˆU is the augmented set of controls (ν, α, χ).

In order to understand how we can provide a PDE characterization for y, consider the following informal reasoning. In the present settings, (x, p, y) ∈ Λ(t) is equivalent to y ≥ y(t, x, p). Hence, the rst part of the GDP (the inclusion Λ(t) ⊆ ¯Λ(t), recall Section1.1.1) gives that, for y ≥ y(t, x, p), there is (ν, α, χ) ∈ ˆU such that

Yt,x,pν (τ ) ≥ y τ, Xt,xν (τ ), Mt,pα,χ(τ )P-a.s. for any stopping time τ ≥ t. Assuming that y is smooth enough and that the above GDP holds even for y = y(t, x, p), an application of Itô's Lemma around the initial time t shows that the control (ν, α, χ) should ensure that

• the volatility of Yν − y(·, Xν, Mα,χ) is zero,

• the jumps of Yν− y(·, Xν, Mα,χ)are non-negative,

• the drift of Yν − y(·, Xν, Mα,χ)is non-negative,

at the original time t. This informal reasoning implies that y is a supersolution of H0,0y(t, x, p) ≥ 0,

(16)

8 Chapter 1. Introduction with

Hε,ηy(t, x, p) := sup (u,a,π)∈Nε,ηy(t,x,p)

n

µY(x, y(t, x, p), u) − Lu,a,π(X,M )y(t, x, p)

o

, (1.1.7) where Lu,a,π

(X,M ) denotes the Dynkin operator associated to the diusion (X, M), and,

for ε > 0, η ∈ [−1, 1] and (t, x, p) ∈ [0, T ] × Rd× R, Nε,ηy :=         

(u, a, π) s.t. |σY(·, y, u) − σX>(·, u)∂xy − a∂py| ≤ ε

and for λ-a.e. e ∈ E

βY(·, y, u, e) − y(·, · + βX(·, u, e), · + π(e)) + y ≥ η

         . (1.1.8)

In a Brownian ltration, where the only additional control is α, the major di-culty comes from the fact that the process α has a priori no boundedness properties: it comes from the martingale representation theorem. In this context, the operator associated to (1.1.7) typically fails to be semi-continuous.

It is shown in [BET09] that, in the no-jump case, one needs to consider the relaxed semi-limits as ε ↓ 0 of the operator associated to Hε,0. This relaxation is

local, as it only concerns the space point, the gradient and the Hessian matrix of the test function at this point.

In our setting, we need two further relaxations to deal with the non-local term in (1.1.8). Firstly, the semi-limits are taken with respect to the additional parameter η as it goes to 0. Secondly, an additional non-local relaxation is performed by con-sidering the semi-continuous envelopes with respect to the test function appearing in the non-local term of (1.1.8), for the topology of the uniform convergence. This adds non-trivial technical diculties.

The precise statement of the PDE characterization and the associated bound-ary conditions (in the sense of viscosity solutions) are given in Theorems3.2.5,3.2.9 and Corollaries3.3.7,3.3.17. In particular, we generalize the convex face-lifting phe-nomenon in the p-variable that was observed in Bouchard, Elie and Touzi [BET09] in the context of quantile hedging problems to much more general situations.

Finally, we provide in Theorem 3.3.14 a boundary condition in the p-variable when the function Ψ takes its values in a set of the form [m, M] with m or/and M is/are nite. Theorem 3.3.14 is the counterpart in this framework of [BET09, Theorem 3.1], up to non trivial dierences due to the presence of the control χ. 1.1.5 Further references and advances in the eld of Stochastic

Targets

We conclude this section with some references of recent advances in this eld. In Bouchard and Dang [BD10], the authors give a PDE characterization of a singular

(17)

1.2. The stochastic target games 9 with state constraints version of stochastic target problems. This work allows one to treat the case of market models with proportional transaction costs, and may also be applied to order book liquidation issues.

In [BV11], Bouchard and Vu provide a PDE characterization of the minimal initial endowment required so that the terminal wealth of a nancial agent can match a set of constraints in probability. Their original idea was to consider that the agent has a rough idea on the type of P&L he can aord, and that he considers the latter as a target. It was motivated by the fact that, if the attitude of the nancial agent toward risk is usually described in academic literature in terms of utility or loss function, this is in practice not so trivial for an agent to characterize precisely his "utility function".

We nally refer to Bouchard, Elie and Reveillac [BER12] for a BSDE formulation of this moment criterion, and to Bouchard, Elie and Imbert [BEI10] and Bouchard and Nutz [BN11] for an optimal stochastic control problem under stochastic target constraint.

1.2 A robust version of the stochastic target problems

As exemplied in Section 1.1.2, the stochastic target problems in expectation form allow one to deal with several risk approaches, which is useful in incomplete markets. However, as usual in mathematical nance, the stochastic target problems rely on a choice for the controller of a "mathematical model", that is, a specication of the coecients µ, σ and β, as well as their parameters.

In practice, the choice of a model and its calibration give rise to model risk (what are the consequences of choosing the wrong model?), or model uncertainty (what strategies to employ when no a-priori information on the true coecient is given?). One way to tackle the model uncertainty is to consider a situation in which an adverse player, the nature, is playing the unknown coecients against the controller. In the case where the parameters can be observed in a progressive way, this naturally leads to a game version of the stochastic target problems as discussed in the previous sections.

In Chapter 4, we introduce for the rst time this new class of dierential games, and provide a version of the GDP which allows us to derive the Hamilton-Jacobi-Bellman-Isaacs' (in short HJBI) equation associated to the corresponding reachability set. This requires a game version of the GDP of Soner and Touzi [ST02a].

(18)

10 Chapter 1. Introduction We refer to [BCR05, Rai07, TH07, MØ08, CR09, BCQ11, Bis10] for advance researches in the eld of stochastic dierential games.

1.2.1 The game version of the Geometric Dynamic Programming Principle

We investigate in Chapter 4 a robust (or game) version of the stochastic target problems. It takes the form of a one sided game, dened as follows.

For a given initial position (t, z) ∈ [0, T ] × Z, the aim of the controller is to nd a strategy u[·] ∈ U, in the sense of dierential games (see Section 4.3.1 for a precise denition), such that the controlled state process Zu[ν],ν

t,z reaches a given target at

time T , whatever the player controlling the adverse controls ν ∈ V could do to prevent it from happening.

We consider a loss function `, and formulate a target in moment in robust form, i.e. E h `  Zt,zu[ν],ν(T ) i ≥ p for all ν ∈ V.

For t ∈ [0, T ], the corresponding reachability set consists in all initial positions (z, p) ∈ Z × R enabling the controller to nd a strategy u that allows him to reach the target, for every adverse control ν ∈ V:

Λ(t) :=    (z, p) ∈ Z × R : there exists u ∈ U s.t. J (t, z, u) ≥ p    , (1.2.1) with J (t, z, u) := inf ν∈VE h `Zt,zu[ν],ν(T )i. (1.2.2) As explained in Section1.1.3, in the absence of adverse control, one can retrieve the GDP of [ST02a] by considering the martingale E[`(Zu

t,z(T ))|F·]. Here, the natural

counterpart is the family of submartingales {Sν, ν ∈ V}:

Sν(·) := ess inf ¯ ν∈V E h `Zu[ν⊕·¯ν],ν⊕·ν¯ t,z (T )  |F· i , (1.2.3)

where ν ⊕s ν¯ means that the two adverse controls ν and ¯ν are pasted at time

s ≥ t. This should be interpreted as the adverse's player value process, if the controller play the strategy u. Recalling the arguments of Bouchard, Elie and Touzi [BET09] presented in Section1.1.3, a rough version of the GDP should be that Λ(t) coincides with the set of elements (z, p) ∈ Z ×R for which there exist a strategy and an appropriate family of submartingales {Sν, ν ∈ V}, which initial values satisfy

Sν(t) = pfor all ν ∈ V, such that 

(19)

1.2. The stochastic target games 11 As we will show in Section 4.2.3, one can actually restrict to the martingale parts of each Sν: Λ(t) =    (z, p) ∈ Z × R : ∃ u ∈ U and {Mν, ν ∈ V} ⊂ Mt,p s.t.  Zt,zu[ν],ν(τ ), Mν(τ ) 

∈ Λ(τ ) P-a.s. ∀ ν ∈ V and stopping times τ  

 ,

where Mt,pdenotes a suitable set of martingale starting from p at time t. Neglecting

the nite variation parts of the Sν's has the advantage of not having to deal with

their possible path irregularities. The fact that the martingale part is enough can be understood as follows. The worst situation for the controller playing u is when the adverse player plays the optimal adverse control associated to u. Along an optimal adverse control, Sν is a martingale.

Observe that the denitions in (1.2.2) and (1.2.3) do not guarantee that J (t, z, u) = Sν(t). From the mathematical point of view, one faces the issue of dealing with one nullset for every ν ∈ V. One possible answer to handle this prob-lem could be to follow the arguments of Fprob-leming and Souganidis [FS89], and use a discrete time approximation argument. In the context of zero-sum dierential games, this provides a Dynamic Programming Principle (DPP) for the approximat-ing problems on the time grids. A limit argument combined with a comparison result for PDEs allows to conclude. Unfortunately, discrete time DPP is not strong enough to derive PDEs in the context of stochastic target problems.

Contrary to Section 1.1.3, we therefore use a formulation of (1.2.2) in terms of essential inmum as in (1.2.3): J (t, z, u) := ess inf ν∈V E h `Zt,zu[ν],ν(T )|Fti and Λ(t) :=    (z, p) ∈ Z × R : there exists u ∈ U s.t. J (t, z, u) ≥ p P-a.s.    .

The consideration of essential inmum is made possible by an argument of Buckdahn and Li [BL08, Proposition 4.1, Lemma 4.1] (see also Buckdahn, Hu and Li [BHL11, Lemmata 3.1 and 3.2] for an extension to jump diusions), which states that, in a Brownian framework, the random variable

K : (t, z) 7−→ ess sup

u∈U

J (t, z, u) is deterministic. (1.2.4) One major diculty in establishing a game version of GDP is that we can not apply a measurable selection theorem as in the standard context of [ST02a]. This is due to the presence of strategies for which we do not have a good topological framework. To surround this, we formulate a weak version based on a covering

(20)

12 Chapter 1. Introduction argument in space, in the spirit of Bouchard and Touzi [BT11] or Bouchard and Nutz [BN11]. It only relies on "regularity properties" in the space variable. In particular, we do not impose any time regularity. This issue is solved by a stopping time approximation argument, which leads to a non-trivial additional relaxation. More precisely, our GDP is not stated in terms of

Γ := {(t, z, p) ∈ [0, T ] × Z × R s.t. (z, p) ∈ Λ(t)} , but in terms of its interior and its closure.

Note that the absence of measurable selection result adapted to the context of games prevents us to consider more general stochastic target games in which the terminal constraint is stated in the P-a.s. sense. This highly dicult issue is left for further researches.

We nally observe that, if the weak GDP is rst stated in Theorem4.2.1 under strong regularity assumptions on the (deterministic) map K dened in (1.2.4), we show in Corollary 4.2.3 how to relax these assumptions in case of a continuous function ` with polynomial growth, and when the state process Z satises suitable estimates.

1.2.2 Derivation of the Hamilton-Jacobi-Bellman-Isaacs' equation Our weak GDP happens to be sucient for the derivation of the dynamic program-ming equation in the viscosity sense. We exemplify this fact with the treatment of a game version of two general problems introduced by Soner and Touzi [ST02c,ST02a] in the context of Brownian controlled SDEs, with controls taking their values in a bounded subset of Rd.

In Theorem 4.3.3, we characterize the reachability set with a Hamilton-Jacobi-Bellman-Isaacs' (HJBI) equation. Namely, we state the PDE satised, in the vis-cosity sense, by the indicator function of the complement of the graph of Λ:

χ(t, z, p) := 1 − 1Λ(t)(z, p).

In Theorem 4.3.5, we consider a robust version of the stochastic target problem with controlled expected loss discussed in Section 1.1.2. We hence derive the PDE satised by a game version of the problem (1.1.2), i.e.

y(t, x, p) := inf  

 y ∈ R :

there exists u ∈ U s.t. for all ν ∈ V E h `Zt,zu[ν],ν(T )|Ft i ≥ p P-a.s.    .

This allows us to give a robust characterization of the problems considered in Section 1.1.2.

(21)

1.3. Utility Asymptotics - Pricing of Hybrid claims 13 As discussed in Section 1.1.4, these equations are stated in terms of relaxed HJBI operators, in order to take into account the possible unboundedness of the controls α, which come from the martingale representation of the additional state variable.

Finally, we give an example of application to the partial hedging of a European option, in the case where both the drift and the volatility of the underlying are uncertain (controlled by the adverse player, which in that case is the market). We are interested in the problem

y(t, x, p) := inf    y ∈ R : ∃ u ∈ Us.t. for all ν ∈ V

EΨ Yt,x,yu,ν (T ) − g Xt,xν (T ) |Ft ≥ p P-a.s.

 

, (1.2.5)

in which Ψ denotes some utility function (concave, non-decreasing), g(Xν

t,x(T ))the

payo of the claim, ν = (µ, σ) stands for the drift and the volatility of the stock price process Xν, whereas u is the trading strategy and Yu[ν],ν is the corresponding

wealth process.

In this case, strategies do not take bounded values, and we restrict ourselves to the set of strategies satisfying an integrability condition of the form:

sup ν∈V E   Z T 0 |u[ν]r|2dr ¯ q 2  < ∞,

for some ¯q > 2. We extend the PDE characterization obtained for bounded controls to this context. This allows us to give an explicit characterization of the problem (1.2.5). Surprisingly, although the hedging criteria is weak, the result is degenerate. Namely, we prove that

y(t, x, p) = sup

ν∈V0E

g Xν

t,x(T ) |Ft + Ψ−1(p),

where V0 denotes the subset of adverse controls such that the drift µ is degenerate:

µ ≡ 0. This corresponds to the super-hedging price for the shifted option g(·) + Ψ−1(p)in the (driftless) uncertain volatility model.

1.3 Utility Asymptotics - Pricing of Hybrid claims

These last years have seen the explosion of the number of liabilities combining pure nancial and pure insurancial risks. They typically have the following form: an insurance company sells to each client i ≤ n a claim of maturity T , whose value depends on the evolution of some tradable nancial assets S = (St)t≥0 and some

(22)

14 Chapter 1. Introduction additional idiosyncratic risk Ri. The number n introduced above denotes the number

of claims sold by the company.

In Chapter 5, we investigate the problem of pricing such claims, in the realistic situation where the Ri's are independent and identically distributed, conditionally

to S.

Our main result concerns the convergence of the utility indierence price of a claim when the absolute risk aversion of a sequence of general utility functions tends to 0, and the number of sold claims goes to innity.

1.3.1 Examples of hybrid products

The wide range of applications in life or non-life insurance justies the interest of both insurance and nancial mathematics. We list here some examples of such contracts.

The agents are interested in pricing aggregated claims of the following form Gn=

n

X

i=1

f (S, Ri) , (1.3.1)

where for each client i ∈ {1, · · · , n}, the Ri's are independent and identically

dis-tributed random variables, n denotes the number of unit claims f(S, Ri) sold, and

f is some measurable function. In the latter, one could think e.g. of unit-linked contract,

f (S, Ri) = 1{Ri>T }ST,

or unit-linked with guarantee,

f (S, Ri) = 1{Ri>T }max(ST, K),

where Ri denotes in both examples the time of death of the customer i, and S a

nancial index. Contracts with similar features are currently very popular in life insurance.

We might also think of more elaborated claims, with Ri being for example a

weather index, or a production yield.

Consider for instance a producer of some good (e.g. wheat), which market price is S, expecting to produce the yield Ki

G at time T , and to sell each unit of this

quantity at least at the price KS. His expected revenue is then KS× KGi , while his

realized revenue is Ri× ST, with Ri his realized production level. In order to cover

himself, he can buy a European put on his revenue:

fi(S, Ri) := (KS× KG− STRi)+. (1.3.2)

These revenue guarantees are already widely sold in the U.S. and are about to be exploited in Europe too.

(23)

1.3. Utility Asymptotics - Pricing of Hybrid claims 15 1.3.2 Utility Asymptotics

Consider an insurance company selling to the client i a claim with payo gi, paid at

maturity T , whose value depends on the evolution of some tradable nancial assets S = (St)t≥0 and some additional idiosyncratic risk. Typically, recall (1.3.1), for

every i ≤ n, each individual contract gi is of the following form

gi = f (S, Ri).

The gi's are usually not unconditionally independent, but still independent

condi-tionally to S. The company is then interested in the unit premium π(Gn)/nof the

aggregated claim Gn:= n X i=1 gi,

i.e. the premium associated to the global claim Gn, π(Gn), equally divided by the

number of sold contracts n.

Such contracts, and especially unit-linked contracts, have been studied by actu-aries since the late sixties. While in nance, any pricing rule is fundamentally based on the notion of no-arbitrage and the corresponding set of martingale measures, the premium principles in insurance are mainly motivated by the application of the law of large numbers. (see e.g. [Buh70], [GfIE79] or [BoA86]).

In fact, neither the usual actuarial principles nor the arbitrage arguments seem to be satisfactory to price such claims. Still, it was suggested to combine both. Namely, the valuation principle proposed in Brennan and Schwartz [BS79a,BS79b] consists in combining the law of large numbers with a nancial hedging-based valuation. The idea is to replace the insured risks by their expected value, so that the modied claim only contains nancial uncertainty. It remains then for the insurer to price and hedge the following modied claim

ˆ Gn= N X i=1 E [ f (S, Ri)| S] .

This pricing rule has been widely used in practice, see e.g. [BH03,MP00,MPY06]. The mathematical insight behind this trivial pricing rule is the following. If the Ri's are independent and identically distributed given S, then Gn/n →

E[f (S, R1)|S] =: ¯g a.s. for a large number n of sold contracts. If the nancial

market formed by the asset S is complete (this is the semi-complete market of Becherer, see [Bec03, Section 4]), then the payo E[f(S, R1)|S] may be replicated

(24)

16 Chapter 1. Introduction from the initial wealth EQ[E[f (S, R1)|S]] by a suitable trading strategy, where Q is

the unique martingale measure on the (complete) pure nancial market.

However, both the theory of pricing in incomplete markets and the usual actu-arial principles (recall the notion of safety loading) seem to agree on the fact that a linear pricing rule corresponds to a risk neutral agent. Roughly speaking, in our context, selling a large number of claims (necessary for the application of the law of large numbers) entails a bigger exposition on the nancial market. If the law of large numbers does not operate well enough, then the losses may be leveraged by an unfavorable evolution of the nancial market. A risk-adverse agent shall take this fact into account, so that the (linear) trivial pricing rule should not hold for such agents (see Examples 5.2.3 and 5.2.4 for trivial counterexamples).

This intuitive reasoning leads us to expect this pricing rule to hold only at the limit for a small level of risk aversion and a large number of sold claims. In Chapter 5, we provide conditions under which the limit unit price is given by this linear pricing rule.

Given a locally bounded càdlàg (F, P)-semi-martingale S, we denote as usual by M the set of P-equivalent local martingale measures such that S is a (F, Q)-local martingale. Let (Un)n∈Nbe a sequence of utility functions dened on the whole real

line and satisfying the usual assumptions (Inada, reasonable asymptotic elasticity, see Schachermayer [Sch01]). Assume furthermore that M 6= ∅ and that for each n ∈ N, the corresponding dual problem (see e.g. [Sch01]) is nite, and dene the unit utility indierence prices pn(Gn, Un):

pn(Gn, U ) := inf  p ∈ R : sup X E [U (X + np − Gn )] ≥ sup X E [U (X)]  , (1.3.3) with X running over the set of achievable terminal wealth. Moreover the optimal dual probability and multiplier are given by

(yn0, Q0n) := arg min  E  Vn  ydQ dP  , (y, Q) ∈ (0, ∞) × M  ,

in which Vn is the usual convex conjugate of Un. We assume that the sequence of

claims (Gn)n≥1 satises sup n≥1 |Gn/n|L∞ < ∞, (1.3.4) and that n|rn|∞ −→ n→∞ 0 , with rn: x 7→ − Un00(x) Un0(x) , (1.3.5) and |rn|∞:= supx∈R|rn(x)|. Observe that Assumption (1.3.4) allows us to consider

(25)

1.3. Utility Asymptotics - Pricing of Hybrid claims 17 We show in Theorem5.3.2 that

lim

n→∞pn(Gn, Un) = limn→∞E Q0n[G

n/n] . (1.3.6)

One side of the equality (stated in terms of liminf and limsup) is straightforward with the use of the dual problem (see e.g. Owen [Owe02] or Bouchard, Touzi and Zeghal [BTZ04]). Surprisingly, the second inequality is obtained directly from the primal formulation of the problem (contrary to most results on the asymptotic of utility indierence prices, see Section1.4 below). It relies on a simple second order Taylor expansion of Un, and crucially on Assumptions (1.3.4) and (1.3.5) .

As a byproduct, under the weaker condition krnk∞ → 0, and whenever the

sequence (Gn)n≥1 is assumed to be uniformly bounded in L∞, we also provide a

general convergence result for bounded sequences of contingent claims when the absolute risk aversion vanishes in the sup norm, which is of own interest.

Notice that the right hand side term in (1.3.6) is somehow theoretical. In the context of a complete pure nancial market (see Denition5.2.1 for a more precise denition of the so-called Half-Complete Market assumption), a similar reasoning as in [Bec03, Theorem 4.10 and Assertion (4.5)] shows that, if Gn/n → ¯gas n → ∞,

with ¯g a FS

T-measurable random variable, then

lim n→∞E Q0n[G n/n] = EQ ∗ [¯g],

where Q∗ is the pricing measure on the complete pure nancial market.

In order to characterize the limit lim

n→∞E Q0n[G

n/n]

in the incomplete market case, we shall restrict the class of utility functions. First note that the fact that rn → 0 uniformly as n → ∞ entails that there exists a

sequence (η1

n)n≥1 satisfying ηn1 → 0 such that

rn(x) ≤ ηn1 for all x ∈ R and n ≥ 1.

We assume in addition that the convergence rn → 0 is not too fast: there exists

another sequence (η2

n)n≥1 such that for all n ≥ 1,

0 < ηn2 ≤ rn≤ ηn1 and ηn2/ηn1 n→∞−→ 1.

The sequence (Un)n≥1 is "stucked" in between two sequences of exponential utility

functions with vanishing asymptotically equivalent risk aversions. We thus are able to show that EQ 0 n[G n/n] −→ n→∞E Qeg],

where Qe is the element of M which minimizes the relative entropy EhdQ dPlog

dQ dPi.

(26)

18 Chapter 1. Introduction

1.4 Further references on Utility Indierence Price

Asymptotics

Asymptotic results for utility indierence prices have been stated for exponential utility function in El Karoui and Rouge [EKR00] for Brownian diusion models, and in Delbaen et al. [DGR+02] in a general semi martingale setting. In the

above quoted papers, it was shown that the utility indierence price converges toward the super-replication price as the absolute risk aversion tends to in-nity. A slightly more general class of utility functions is studied in [Bou00]. Carassus and Rásonyi consider general utility functions, in discrete time models, in [CR07,CR06], and deal with the continuous time case in the recent paper [CR11]. Importantly, note that Becherer [Bec03] has studied almost similar problems in the context of exponential utility functions. More precisely, he is interested in the indierence price p1(Gn/n; U ) of the mean claim Gn/n, whereas we consider the

unit price of the components of Gn, pn(Gn; U ) = p1(Gn, U )/n, recall the notation

(1.3.3).

However, our result can be recovered in his more restrictive context from the additivity property stated in his Theorem 4.10 and the standard asymptotic result of his Proposition 3.2.

(27)

Chapter 2

Introduction

Considérons une option g, vendue au temps t ≥ 0, de maturité T ≥ t, sur le sous-jacent Xt,x satisfaisant Xt,x(t) = x. Dans le cas d'une option Européenne, le

vendeur doit délivrer le payo g(Xt,x(T )) à l'acheteur à la date terminale T . La

question naturelle dans ce cas est de déterminer un prix π à payer au temps t au vendeur qui soit satisfaisant pour l'acheteur et pour le vendeur, de telle que sorte que le transfert de risque puisse avoir lieu.

Dans le cas de marché complet de [BS73,AS92, DS94,HP81], le vendeur peut répliquer le payo de l'option par une stratégie de trading de manière dynamique. C'est à dire, sous de bonnes conditions d'intégrabilité de g(Xt,x(T )), nous pouvons

trouver y ∈ R ainsi qu'un processus prévisible ν tels que g (Xt,x(T )) = y +

Z T

t

νs· dX(s) P-a.s..

L'unique prix viable est dans ce cas y, puisque cela conduirait à des opportunités d'arbitrage dans le cas contraire.

Dans la situation plus réaliste de marchés incomplets, quand il y a par exemple des sources de risque intrinsèques, non-tradables, la valorisation mais aussi la cou-verture deviennent des problèmes beaucoup plus compliqués. La condition d'absence d'opportunités d'arbitrage donne donc une innité de prix viables (voir par exemple [DS94]).

Le preneur de risque doit donc dénir la richesse initiale qu'il doit investir à la date t dans un portefeuille nancier qui lui permette de réduire le risque d'une manière acceptable. La valorisation de produits dérivés en marchés incomplets né-cessite donc une description des préférences des agents.

(28)

20 Chapter 2. Introduction [BCS98,CPT99,CM96,CK93,EKQ95,KS98] pour la sur-réplication, [Dav97] pour l'approche d'utilité marginale, [BL89,DR91,SF85,Sch88,Sch91,Sch99] l'approche de minimisation de l'erreur quadratique, [Cvi00,FL99,FL00] pour l'approche par quantile.

Le but de cette thèse est d'apporter une contribution à ce domaine.

La première partie de ce manuscrit est dédiée à l'approche par cibles stochas-tiques introduites par Soner and Touzi [ST02c, ST00, ST02a, ST03a], et récem-ment développée par Bouchard, Elie and Touzi [BET09] an de traiter des cas plus généraux. Plus particulièrement, nous commençons par généraliser le travail de [BET09] an de traiter des problèmes dans lesquels les diusions sont sujettes à des sauts. Cette contribution est introduite dans la Section 2.1.4 ci-dessous.

Deuxièmement, nous établissons une version jeu du principe géométrique de pro-grammation dynamique de [ST02a]. Cela permet de traiter des problèmes de cibles stochastiques plus généraux dans lesquels un joueur adverse contrôle la diusion. Ceci est en relation avec des problèmes de hedging sous ambiguité de Knightian. Ce travail est introduit dans la Section 2.2.1.

Nous nous intéressons nalement au cadre de valorisation par indiérence d'utilité. Notre principal objectif est d'étudier des produits dérivés hybrides (voir la Section 2.3.1), c'est à dire, des produits dérivés qui se situent à mi-chemin de la nance et de l'assurance. Nous donnons pour la première dans ce contexte hybride un résultat asymptotic pour des fonctions d'utilité générales dénies sur R, quand l'aversion au risque absolue converge vers 0, et que le nombre d'options vendues tend vers l'inni. Cette contribution est introduite dans la Section2.3.

2.1 Cibles Stochastiques en Finance et en Assurance

Sous une forme géométrique, un problème de cibles stochastiques peut être formulé de la façon suivante. Soit G un sous-ensemble Borélien d'un espace métrique (Z, dZ),

et Zν

t,zun processus controllé à valeurs dans Z de conditions initiales Zt,zν (t) = z ∈ Z.

Considérons le reachability set Λ(t) consistant en toutes les conditions intiales z ∈ Z telles que Zν

t,z(T ) ∈ G P-a.s. pour un certain ν ∈ U, avec U l'ensemble des contrôles

admissibles:

Λ(t) :=z ∈ Z : il existe ν ∈ U t.q. Zν

t,z(T ) ∈ G P-a.s. . (2.1.1)

Dans [ST02a], Soner et Touzi prouvent que cet ensemble satisfait un principe de programmation dynamique, le Principe de Programmation Dynamique Géométrique

(29)

2.1. Cibles Stochastiques en Finance et en Assurance 21 (ci-après GDP). Ce GDP permet ensuite de dériver l'équation de programmation dynamique correspondante, comme cela se fait en contrôle optimal.

Comme nous allons le voir ci-dessous ce GDP a ouvert la porte à un large spectre d'applications en nance et en assurance. En particulier, les résultats du Chapitre 3 reposent de manière crucialle sur ce GDP.

2.1.1 Le GDP et le problème de super-hedging

Fixons Z := Rd × R. Le GDP de Soner et Touzi [ST02a] se lit de la manière

suivante. Dans un cadre Markovien, et sous de bonnes hypothèses sur l'ensemble U, le reachability set

Λ(t) =z ∈ Z : Zν

t,z(T ) ∈ G P-a.s. for some admissible ν

coincide avec l'ensemble ¯Λ ¯

Λ(t) :=z ∈ Z, Zt,zν (τ ) ∈ Λ(τ ) P-a.s. for some admissible ν ,

pour tous les temps d'arrêt τ. Sous une hypothèse de type "Flow", la première inclusion Λ(t) ⊆ ¯Λ(t) est directe, tandis que la seconde est plus complexe. Elle repose essentiellement sur un théorème de sélection mesurable (see [BS78, Proposition 7.49]) qui est possible principalement grâce au fait que l'application (t, z, ν) ∈ [0, T ] × Z × U 7→ Zt,zν (T )est Borel-mesurable. Nous renvoyons le lecteur intéressé à [ST02a] pour une preuve (voir [BV10] pour une version obstacle).

Fixons maintenant Z := (X, Y ) et G := {z := (x, y) ∈ Rd× R t.q. Ψ(x, y) ≥ 0}

pour une certaine application Borel-mesurable Ψ. Considérons de plus que y 7→ Ψ(·, y)et y 7→ Yt,x,yν (T )sont des fonctions croissantes, pour tout ν ∈ U. L'ensemble Λ(t)peut alors être identié à {(x, y) ∈ Rd× R : y ≥ y(t, x)}, avec

y(t, x) := infy ∈ R : il existe ν ∈ U t.q. Ψ Xt,xν (T ), Yt,x,yν (T ) ≥ 0 P-a.s. , quand le précédent inmum est atteint.

Formulé de la manière précédente, ce problème peut être vu comme une général-isation du problème de super-replication, voir par exemple [EKQ95,CK93,CM96,

KS98,BCS98,CPT99].

Dans la littérature, le problème de super-hedging est traditionnellement résolu de la manière suivante. L'idée est de considérer le problème dual, qui est un prob-lème classique de contrôle optimal, voir [JK95,EKQ95,CK93,FK97]. Un principe

(30)

22 Chapter 2. Introduction de programmation dynamique classique permet ensuite de dériver l'EDP correspon-dante pour la fonction valeur duale, ce qui donne enn une caractérisation sous forme d'EDP de la fonction valeur primale y.

Soner et Touzi furent les premiers à proposer un traitement de ce problème sous sa forme primale, c'est à dire, d'obtenir la caractérisation EDP de y directement à partir du GDP. Le principal avantage est que l'approche primale de [ST00,ST02c,

ST02b, ST03b, ST03b, CST05] s'applique à des dynamiques générales (telles que le modèle de gros investisseur), ou des contraintes plus générales (par exemple les contraintes de gamma), tandis que l'approche duale repose cruciallement sur le fait que les coecients de la richesse sont linéaires en la variable de contrôle, et que le prix des actifs ne sont pas inuencés par la stratégie de trading.

Cette approche a été exploitée par Touzi [Tou00], Bouchard et Touzi [BT00], étendue à des sauts localement bornés dans Bouchard [Bou02], et à des contraintes de trajectoire dans Bouchard et Vu [BV10].

2.1.2 Les cibles stochastiques avec pertes controllées en nance L'approche développée dans la Section2.1.1 s'avère être très puissante pour étudier une large classe de problèmes de contrôle stochastiques non standard, dans lesquels une cible doit être atteinte avec probabilité 1 à la date T . Comme cela a déjà été mentionné précédemment, cela fournit en particulier une extension au problème classique de super-réplication. Toutefois, dans la plupart des cas, le prix de sur-réplication est très élevé, ce qui n'est pas raisonnable en pratique.

Très récemment, Bouchard, Elie et Touzi [BET09] ont relâché le critère P-a.s. Ψ(Zt,zν (T )) ≥ 0en un critère en moment de la forme E[Ψ(Zt,zν (T ))] ≥ p, avec p ∈ R un certain seuil. Cette nouvelle approche ouvre grand la porte d'un large spectre d'applications en mathématiques nancières.

Nous allons présenter brièvement dans cette section quelques-unes des applica-tions de cette nouvelle approche.

Soit Xν un processus qui dénote vulgairement les risques présents dans le

porte-feuille de l'agent (nous pouvons bien évidemment penser à des actions, mais aussi à un nombre xé de sources de risques idiosyncratiques non-tradables, voir la Section 2.3.1). Soit g, une application dénie sur Rdtelle que g(Xν

t,x(T ))soit susamment

régulière. La quantité g(Xν

t,x(T )) peut être vue comme la payo aléatoire d'une

option Européenne, connaissant la valeur initiale Xν

t,x(t) = x. Le processus Yt,x,yν

représente la richesse de l'agent, de valeur intiale y au temps t, où ν représente sa stratégie en terme de Xν.

(31)

2.1. Cibles Stochastiques en Finance et en Assurance 23 Intéressons-nous à la fonction valeur

y(t, x, p) := infy ∈ R : ∃ ν ∈ U t.q. E Ψ Xt,xν (T ), Yt,x,yν (T ) ≥ p . (2.1.2) Pour p = 1 et

Ψ : (x, y) 7−→ 1{y≥g(x)},

la fonction valeur (2.1.2) représente le prix de sur-réplication de l'option g(Xν t,x(T ),

comme cela a déjà été discuté précédemment. Si p ∈ (0, 1), l'Équation (2.1.2) peut s'écrire

y(t, x, p) := infy ∈ R : ∃ ν ∈ U t.q. P Yt,x,yν (T ) ≥ g Xt,xν (T ) ≥ p , (2.1.3) et permet de traiter le problème de quantile hedging introduit par Föllmer et Leukert [FL99], mais dans un contexte plus général, par exemple dans le cas où la stratégie de l'agent peut inuencer la valeur des actifs risqués (modèle de gros investisseur). Cela permet également de traiter des politiques d'investissement plus générales. L'approche originelle de Fölmer et Leukert s'appuie très fortement sur le fait que cette stratégie est linéaire.

Considérons maintenant le cas où p ∈ R et Ψ appartient à une certaine classe de fonctions d'utilité. Plus précisément, pour une fonction d'utilité U : R → R et

Ψ : (x, y) ∈ Rd× R 7−→ U(y − g(x)), le problème (2.1.2) s'écrit

y(t, x, p) := infy ∈ R : ∃ ν ∈ U t.q. E U Yt,x,yν (T ) − g Xt,xν (T ) ≥ p . Il s'agit dans ce cas de trouver la plus petite somme initiale à investir dans une certaine stratégie ν de telle sorte que l'espérance d'utilité de l'agent soit au-dessus du seuil p. Si p est choisi comme étant

p := sup ν0∈UE h U  Yt,x,yν0 o(T ) i ,

Une re-formulation directe de ce problème permet de montrer que la fonction valeur coincide avec le prix d'indiérence d'utilité de l'option g:

y(t, x, p) = infy ∈ R : ∃ ν ∈ U t.q. E Ψ Xt,xν (T ), Yt,x,yν o+y(T ) ≥ p . Finalement, de légères modications dans le raisonnement précédent permettent de considérer le cas où Ψ appartient à une certaine classe de fonctions de risque,

(32)

24 Chapter 2. Introduction pour une certaine fonction de perte convex croissante ρ : R → R, ou encore le success ratio de Föllmer et Leukert [FL99]

Ψ : (x, y) ∈ Rd× R 7−→ 1{g(x)≤y}(x, y) +

y

g(x)1{g(x)>y∧0}.

2.1.3 L'extension du Principe de Programmation Dynamique Géométrique au critère en moment

Quand nous avons aaire à un problème de cibles stochastiques avec pertes con-trollées en espérance, le reachability set sous-jacent (bien qu'il ne soit pas déni explicitement dans Bouchard, Elie et Touzi [BET09] ou [Mor11]) est maintenant

Λ(t) := n (z, p) ∈ Rd× R : il existe ν ∈ U t.q. EΨ Zν t,z(T ) ≥ p o .

Quand nous cherchons à relier la version au temps-t de cet ensemble avec sa ver-sion au temps-τ, il est évident que la valeur p ∈ R doit diuser, et être incor-porée au processus d'état. L'idée originale de Bouchard, Elie et Touzi [BET09, Proposition 3.1] (étendue au cas diusions à sauts dans la Proposition 3.3.2) est d'appliquer le théorème de représentation des martingales à l'espérance condition-nelle E[Ψ(Zν

t,z(T ))|F·].

Nous pouvons alors dénir le reachability set de la façon suivante Λ(t) :=    (z, p) ∈ Rd× R : il existe ν ∈ U et M ∈ Mt,p t.q. ˜Ψ Zν t,z(T ), M (T ) ≥ 0    , (2.1.4) où ˜Ψ : (z, p) ∈ Rd× R 7−→ Ψ(z) − p et M

t,preprésente un ensemble de martingales

M satisfaisant M(t) = p. Nous retrouvons ainsi un problème de cibles stochastiques en critère P-a.s. sur le processus d'état (Z, M), et le GDP de Soner et Touzi se lit alors Λ(t) =    (z, p) ∈ Rd× R : il existe ν ∈ U et M ∈ Mt,p t.q. Zν t,z(τ ), M (τ ) ∈ Λ(τ ) P-a.s.    .

Nous sommes donc en mesure de dériver l'EDP de programmation dynamique cor-respondante à partir du GDP de [ST02a], à quelques dicultés non triviales près, comme nous allons l'expliquer ci-après.

2.1.4 La dérivation de l'EDP dans le cas de diusions à sauts Dans le Chapitre3, nous étendons les résultats de Bouchard, Elie et Touzi [BET09] au cas de diusions à sauts. Nous considérons une ltration G générée par un mouvement Brownien W et un processus de point E-marqué continu à droite J. Pour 0 ≤ t ≤ T , nous avons deux diusions controlées Xν

t,x(s), t ≤ s ≤ T

et

(33)

2.1. Cibles Stochastiques en Finance et en Assurance 25 {Yν

t,x,y(s), t ≤ s ≤ T }à valeurs respectives dans Rdet R. Ces processus satisfont les

conditions initiales Xν

t,x(t), Yt,x,yν (t) = (x, y), et sont solutions fortes de l'équation

diérentielle stochastique dX(s) = µX(X(s), νs) ds + σX(X(s), νs) dWs + Z E βX X(s−), νs1, νs2(e), e J(de, ds) dY (s) = µY (Z(s), νs) ds + σY (Z(s), νs) dWs + Z E βY Z(s−), νs1, νs2(e), e J(de, ds).

Dans Bouchard, Elie et Touzi [BET09], la ltration F est générée par le mouvement Brownien W , et βX ≡ βY ≡ 0.

Nous allons voir brièvement ci-dessous que ceci a un impact non trivial à la fois sur la formulation ainsi que sur la dérivation des équations aux dérivées partielles correspondantes.

Pour une application Ψ donnée et un seuil p, le contrôleur veut calculer: y(t, x, p) := inf    y ∈ R :E Ψ Xν t,x(T ), Yt,x,yν (T ) ≥ p pour un certain ν ∈ U    . (2.1.5)

Comme expliqué dans la section précédente, augmenter à la fois la dimension de l'espace d'état et de l'espace des contrôles à l'aide du théorème de représentation des martingales permet de réduire ce problème en un problème de cibles stochastiques standard.

Dans le cas présent, toute martingale M ∈ Mt,ppeut s'écrire

Mt,pα,χ(·) = p + Z · t αs· dWs+ Z · t Z E χs(e) ˜J (de, ds), (2.1.6)

avec α et χ deux processus, et ˜J (de, ds) := J (de, ds) − λ(de)dsla mesure de sauts compensée associée à J. Si nous rappelons (2.1.4), nous sommes intéressés par

y(t, x, p) = inf    y ∈ R : il existe (ν, α, χ) ∈ ˆU t.q. ˜Ψ ˆXt,x,pν,α,χ(T ), Yt,x,yν (T )≥ 0    ,

où ˆXt,x,pν,α,χ représente le processus d'état augmenté (Xt,xν (T ), Mt,pα,χ), et ˆU l'ensemble des contrôles augmentés (ν, α, χ).

An de clarier les idées sur la manière de dériver l'EDP caractérisant y, con-sidérons le raisonnement informel suivant. Dans le cas présent, il est équivalent

(34)

26 Chapter 2. Introduction de dire que (x, p, y) ∈ Λ(t) ou bien y ≥ y(t, x, p). Ainsi, la première partie du GDP (l'inclusion Λ(t) ⊆ ¯Λ(t), rappelons la Section2.1.1) donne, pour y ≥ y(t, x, p), l'existence d'un (ν, α, χ) ∈ ˆU tel que

Yt,x,pν (τ ) ≥ y τ, Xt,xν (τ ), Mt,pα,χ(τ )P-a.s. pour tout temps d'arrêt τ ≥ t. Si nous supposons que y est susamment régulière et que le précédent GDP tient aussi pour y = y(t, x, p), une application du Lemma d'Itô's autour du temps initial t montre que le contrôle (ν, α, χ) doit assurer que

• la volatilité de Yν− y(·, Xν, Mα,χ) est nulle,

• les sauts de Yν− y(·, Xν, Mα,χ) sont positifs,

• le drift de Yν− y(·, Xν, Mα,χ) est positif,

au temps original t. Ce raisonnement informel implique que y est une sur-solution de H0,0y(t, x, p) ≥ 0, avec Hε,ηy(t, x, p) := sup (u,a,π)∈Nε,ηy(t,x,p) n

µY(x, y(t, x, p), u) − Lu,a,π(X,M )y(t, x, p)

o

, (2.1.7) où Lu,a,π

(X,M ) dénote l'opérateur de Dynkin associé à la diusion (X, M) et pour ε >

0, η ∈ [−1, 1]et (t, x, p) ∈ [0, T ] × Rd× R, Nε,ηy :=         

(u, a, π) t.q. |σY(·, y, u) − σX>(·, u)∂xy − a∂py| ≤ ε

et for λ-a.e. e ∈ E

βY(·, y, u, e) − y(·, · + βX(·, u, e), · + π(e)) + y ≥ η

         . (2.1.8)

Dans une ltration Brownienne, où l'unique contrôle additionel est α, la diculté majeure vient du fait que le processus α n'a aucune propriété de bornitude: il vient du théorème de représentation des martingales. Dans ce contexte, l'opérateur associé à (2.1.7) échoue généralement à être semi-continu.

Dans le cas sans sauts de [BET09], les auteurs montrent qu'il faut considérer les semi-limites relaxées quand ε ↓ 0 de l'opérateur associé à Hε,0. Cette relaxation

est locale, puisqu'elle ne concerne que le point de l'espace, le gradient et la matrice Hessienne de la fonction test en ce point.

Dans notre cas, nous devons considérer deux relaxations supplémentaires pour gérer le terme non-local dans (2.1.8). Tout d'abord, les semi-limites sont prises par rapport au paramètre additionnel η allant vers 0. Ensuite, une relaxation addi-tionnelle, non-locale, était utilisée, en considérant les enveloppes semi-continues par

(35)

2.2. La version jeu des cibles stochastiques 27 rapport à la fonction teste apparaissant dans le terme non-local de (2.1.8), pour la topologie de la convergence uniforme. Cela entraine des dicultés additionnelles non triviales.

La caractérisation précise de l'EDP ainsi que les conditions terminales associées (au sens des viscosités) sont données dans les Théorèmes3.2.5,3.2.9et les Corollaires 3.3.7,3.3.17. En particulier, nous généralisons le phénomène de face-lifting convexe en la variable p qui est observé dans Bouchard, Elie et Touzi [BET09] dans le contexte du quantile hedging à des situations plus générales.

Finalement, nous fournissons dans le Théorème3.3.14une condition au bord en la variable p quand la fonction Ψ prend ses valeurs dans un ensemble borné (à gauche et/ou à droite) [m, M]. Le Theorème3.3.14est la contrepartie dans ce contexte de [BET09, Theorem 3.1], à des diérences non trivialles dues à la présence du contrôle χ.

2.1.5 Références et avancées dans le domaine des cibles stochas-tiques

Nous conluons cette section avec des références à des travaux supplémentaires dans ce domaine. Dans Bouchard et Dang [BD10], les auteurs donnent une caractérisa-tion par EDP d'un problème de cibles stochastiques singulier avec des contraintes d'état. Ce travail permet de traiter le cas de marchés avec coûts de transaction proportionnels, mais peut aussi être appliqué à un problème de liquidation optimal d'ordres.

Dans [BV11], Bouchard et Vu fournissent une caractérisation du montant minimal requis pour que la richesse terminale d'un agent satisfasse un ensemble de contraintes en probabilités. Leur idée originale a été de considérer que, si dans la littérature, l'aversion au risque des agents est modélisée par des fonctions de perte ou d'utilité, ceux-ci peinent à caractériser cette fonction, alors qu'ils aident une idée de la distribution du P&L qu'ils souhaitent atteindre.

Nous renvoyons nalement à Bouchard, Elie et Reveillac [BER12] pour une for-mulation EDSR du critère en moment, et à Bouchard, Elie et Imbert [BEI10] et Bouchard et Nutz [BN11] pour un problème de contrôle stochastique sous con-traintes de cibles stochastiques.

2.2 Une version robuste des cibles stochastiques

Comme cela a été souligné dans la Section2.1.2, les cibles stochastiques avec critère en moment permettent de traiter plusieurs approches du risque, ce qui est très utile

(36)

28 Chapter 2. Introduction dans le cadre de marchés incomplets. Toutefois, comme dans beaucoup d'approches en mathématiques nancières, les cibles stochastiques n'échappent pas à la règle, et reposent de manière cruciale sur le choix par le contrôleur d'un "modèle mathéma-tique", c'est à dire, une spécication des coecients µ, σ et β, ainsi que de leurs paramètres.

En pratique, le choix d'un modèle et la calibration de ses paramètres donnent naissance au risque de modèle (quelles sont les conséquences relatives au choix d'un mauvais modèle ?) ou à l'incertitude de modèle (quelles stratégies employer quand aucune information a-priori n'est donnée sur les vrais coecients ?)

Une manière de traiter l'incertitude de modèle est de considérer une situation dans laquelle un joueur adverse, la nature, joue les coecients incertains contre le contrôleur. Dans le cas où les paramètres sont observables de manière progressive, cela mène naturellement à étudier une version jeu des cibles stochastiques discutées dans les sections précédentes.

Dans le Chapitre4, nous introduisons pour la première fois cette nouvelle classe de jeux diérentielles, et nous fournissons une version du GDP qui permet de dériver l'équation d'Hamilton-Jacobi-Bellman-Isaacs' (ci-après HJBI) associée au reachability set correspondant. Cela requiert une version jeu du GDP de Soner et Touzi [ST02a].

2.2.1 La version jeu du Principe de Programmation Dynamique Géométrique

Nous nous intéressons dans le Chapitre 4à une version robuste (ou une version jeu) des problèmes de cibles stochastiques. Cela prend la forme d'un jeu à un côté, déni de la manière suivante.

Pour une position initiale (t, z) ∈ [0, T ] × Z, le but du contrôleur est de trouver une stratégie u[·] ∈ U, au sens des jeux diérentiels (Voir la Section 4.3.1 pour une dénition précise), qui lui permet d'amener le processus d'état Zu[ν],ν

t,z dans une

certaine cible au temps T , quoi que puisse faire le joueur adverse contrôlant ν ∈ V pour l'en empêcher.

Nous considérons une fonction de perte `, et formulons la cible en moment, i.e. E

h

`Zt,zu[ν],ν(T )i≥ p for all ν ∈ V.

Pour t ∈ [0, T ], le reachability set correspondant consiste en toutes les positions ini-tiales (z, p) ∈ Z ×R permettant au contrôleur de trouver une strategie u permettant

(37)

2.2. La version jeu des cibles stochastiques 29 d'atteindre la cible, pour tous les contrôles adverses ν ∈ V:

Λ(t) :=    (z, p) ∈ Z × R : there exists u ∈ U t.q. J (t, z, u) ≥ p    , (2.2.1) avec J (t, z, u) := inf ν∈VE h `Zt,zu[ν],ν(T )i. (2.2.2) Comme expliqué dans la Section 2.1.3, dans le cas où il n'y a pas de contrôles ad-verses, nous pouvons retrouver le GDP de Soner et touzi [ST02a] en considérant la martingale E[`(Zu

t,z(T ))|F·]. Ici, la contrepartie naturelle est la famille de

sous-martingales {Sν, ν ∈ V}: Sν(·) := ess inf ¯ ν∈V E h `Zu[ν⊕·ν],ν⊕¯ ·ν¯ t,z (T )  |F· i , (2.2.3)

où ν ⊕sν¯ signie que les contrôles adverses ν et ¯ν sont collés au temps s. Cela

correspond au processus valeur du joueur adverse, si le contrôleur joue la stratégie u. Rappelant les arguments de Bouchard, Elie et Touzi [BET09] présentés dans la Section 2.1.3, une version informelle du GDP devrait être que Λ(t) coïncide avec l'ensemble des éléments (z, p) ∈ Z × R pour lesquels il existe une stratégie et une famille de sous-martingales adéquate {Sν, ν ∈ V}, dont la valeur initiale satisfait

Sν(t) = ppour tout ν ∈ V, telles que 

Zt,zu[ν],ν(τ ), Sν(τ )∈ Λ(τ ) P-a.s. for all ν ∈ V et stopping times τ.

Comme nous allons le montrer dans la Section 4.2.3, nous pouvons en fait nous restreindre à la partie martingale de chaque Sν:

Λ(t) =    (z, p) ∈ Z × R : ∃ u ∈ U et {Mν, ν ∈ V} ⊂ Mt,pt.q.  Zt,zu[ν],ν(τ ), Mν(τ ) 

∈ Λ(τ ) P-a.s. ∀ ν ∈ V et temps d'arrêt τ  

 ,

où Mt,p dénote un ensemble de martingales convenables partant de p à la date t.

Négliger les parties variations nies des Sν's présente l'avantage de ne pas avoir

à considérer les possibles irrégularités de leurs trajectoires. Le fait que la partie martingale est susante peut être compris de la manière suivante. Le pire scénario pour le contrôleur jouant u est la situation dans laquelle le joueur adverse joue le contrôle adverse optimal associé à u. The worst situation for the controller playing u is when the adverse player plays the optimal adverse control Avec ce contrôle optimal, Sν est une martingale.

Observons maintenant que les dénitions dans (2.2.2) et (2.2.3) ne garantissent pas que J(t, z, u) = Sν(t). D'un point de vue mathématique, nous nous trouvons

Références

Documents relatifs

Le premier constat qu'on peut faire à sa lecture est que les quatre auteurs sur lesquels porte cette enquête représentent une part importante du total des emplois des termes de notre

bacteriophages infect the cell and force production of four entities: 1) more bacteriophages; 2) repressors of bacterial DNA damage repair mechanisms (stop sign); 3)

Comparisons between the CO columns above the ISSJ de- rived from the FTIR and from the MOPITT space borne in- strument, taking into account the smoothing affecting MO- PITT

We report here a high resolution powder neutron diffraction study of MnFe 3 O 5 , revealing the Mn/Fe chemical order and the temperature evolution of the magnetic behaviour between

This incentive is reflected in the right-hand sides of equations (7) and (8) which are null in the risk-neutral case. When c p is large the return from peak plants is low and the

I Un constructeur de T1 qui prend un unique param`etre de type T2 d´efinit implicitement une conversion de T2 dans T1.. Plan 14 Introduction 15 Regroupement de donn´ees 16 Classes

Image processing and data extraction has been proven to work effectively for both IOT’s Marine Icing Monitoring System and Impact Module, and will be used greatly in future

On the other hand, only trace amounts of this starting reactant was ob- served in the solid product obtained at 80 °C which confirmed the fa- vorable effect of the reaction