Contrˆ ole impulsionnel appliqu´ e ` a la gestion de changement de technologie dans une entreprise
Rim Amami
Institut de Math´ ematiques de Toulouse Facult´ e des Sciences de Tunis
Colloque ”Jeunes Probabilistes et Statisticiens”
Le Mont Dore - 07 Mai 2010
Plan
1 Introduction
2 Pr´ esentation du mod` ele
3 Crit` ere d’optimalit´ e
Gains maximaux conditionnels R´ esolution
4 Travail en cours
Probl` eme et objectif
Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.
Cons´ equences:
Changement de technologie −→ Temps d’arrˆ et du syst` eme.
⇒ Une impulsion.
La renaissance du syst` eme en suivant une nouvelle technologie.
Objectif: Optimiser le gain de la firme.
Observations:
Un caract` ere markovien et homog` ene entre deux instants d’impulsions.
Une forme markovienne de chaque renaissance.
Probl` eme et objectif
Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.
Cons´ equences:
Changement de technologie −→ Temps d’arrˆ et du syst` eme.
⇒ Une impulsion.
La renaissance du syst` eme en suivant une nouvelle technologie.
Objectif: Optimiser le gain de la firme.
Observations:
Un caract` ere markovien et homog` ene entre deux instants d’impulsions.
Une forme markovienne de chaque renaissance.
Probl` eme et objectif
Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.
Cons´ equences:
Changement de technologie −→ Temps d’arrˆ et du syst` eme.
⇒ Une impulsion.
La renaissance du syst` eme en suivant une nouvelle technologie.
Objectif: Optimiser le gain de la firme.
Observations:
Un caract` ere markovien et homog` ene entre deux instants d’impulsions.
Une forme markovienne de chaque renaissance.
Probl` eme et objectif
Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.
Cons´ equences:
Changement de technologie −→ Temps d’arrˆ et du syst` eme.
⇒ Une impulsion.
La renaissance du syst` eme en suivant une nouvelle technologie.
Objectif: Optimiser le gain de la firme.
Observations:
Un caract` ere markovien et homog` ene entre deux instants d’impulsions.
Une forme markovienne de chaque renaissance.
Outils
Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:
α = (τ n , ζ n+1 , ∆ n , n > −1).
⇒ Les trois composantes de la variable du contrˆ ole sont:
Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ
n.
ζ n+1 le choix de la technologie ` a l’instant τ n .
∆ n la taille du saut.
Outils
Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:
α = (τ n , ζ n+1 , ∆ n , n > −1).
⇒ Les trois composantes de la variable du contrˆ ole sont:
Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ
n.
ζ n+1 le choix de la technologie ` a l’instant τ n .
∆ n la taille du saut.
Outils
Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:
α = (τ n , ζ n+1 , ∆ n , n > −1).
⇒ Les trois composantes de la variable du contrˆ ole sont:
Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ
n.
ζ n+1 le choix de la technologie ` a l’instant τ n .
∆ n la taille du saut.
Outils
Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:
α = (τ n , ζ n+1 , ∆ n , n > −1).
⇒ Les trois composantes de la variable du contrˆ ole sont:
Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ
n.
ζ n+1 le choix de la technologie ` a l’instant τ n .
∆ n la taille du saut.
Outils
Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:
α = (τ n , ζ n+1 , ∆ n , n > −1).
⇒ Les trois composantes de la variable du contrˆ ole sont:
Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ
n.
ζ n+1 le choix de la technologie ` a l’instant τ n .
∆ n la taille du saut.
(Ω, A, F, P): Un espace de probabilit´ e.
(F t ) t≥0 : Une filtration compl` ete continue ` a droite.
(G t ) t>0 : Une filtration pr´ evisible: G t = ∨ s<t F s , ∀ s < t.
Le processus c` adl` ag ξ t indique la technologie ` a l’instant t:
ξ t = ξ 0 1 [0,τ
0[ (t) + X
n≥0
ζ n+1 1 [τ
n,τ
n+1[ (t) + ∅ 1 [τ,+∞[ (t).
Ce processus est ` a valeurs dans U, l’ensemble fini des technologies
possibles. De plus, ζ n+1 est une v.a. G τ
n-mesurable et (τ n ) n> −1 est
une suite des G-temps d’arrˆ et. On note U = U ∪ {∅}.
La valeur de la firme est S t = exp Y t , t ≥ 0, o` u Y est le processus continu ` a droite ` a valeurs dans R = R ∪ {∆} d´ efini par:
Y t = Y 0 1 [0,τ
0[ (t) + X
n≥0
∆ n 1 [τ
n,τ
n+1[ (t)
+ Z t
0
(b(ξ s ) ds + σ(ξ s ) dW s ) + ∆ 1 [τ,+∞[ (t),
avec ∆ signifie que la firme a disparu et ∆ n est la taille du saut du log de la valeur de la firme, une v.a. G τ
n-mesurable. On note r α la probabilit´ e de transition du couple (ζ n , Y τ
−n
) au couple (ζ n+1 , Y τ
n):
P (ζ n+1 = j , Y τ
n= x + dy
ζ n = i , Y τ
−n
= x) = r α (i, x; j , dy ).
La fonction gain ´ economique
A chaque strat´ egie α, nous associons le gain k (α) =
Z τ 0
e −βs f (ξ s , Y s ) ds − X
n≥0
e −βτ
nc (ζ n , Y τ
−n
, ζ n+1 , Y τ
n) (1) o` u
β > 0 est un coefficient d’actualisation.
La fonction f repr´ esente le b´ en´ efice net de la firme.
La fonction c repr´ esente le coˆ ut de changement de technologie avec c (i , x, i , x) = 0.
Soit le gain moyen:
But
Prouver l’existence d’une strat´ egie admissible α b qui maximise la fonction gain K (α) d´ efinie par l’expression (2), c’est ` a dire:
K ( α) = b ess sup
α∈D
K (α), (3)
o` u D est l’ensemble des strat´ egies admissibles.
Gain maximal conditionnel
D´ efinition
Le gain maximal conditionnel est la famille d´ efinie p.s. par:
F θ α = ess sup
{µ
t=α
t, t<θ}
E (k (µ)| G θ ) . De mˆ eme,
F θ α
+= ess sup
{µ
t=α
t, t≤θ}
E (k (µ)| F θ ) .
Proposition
Le gain maximal conditionnel F θ α (resp. F θ α
+) est une sur-martingale positive c’est ` a dire que F θ α (resp. F θ α
+) est P -integrable et que
E (F θ α | G γ ) ≤ F γ α resp. E
F θ α
+| F γ
≤ F γ α
+.
Corollaire (Premier crit` ere d’optimalit´ e (N. El Karoui))
Une condition n´ ecessaire et suffisante pour que la strat´ egie α b soit
optimale est que le gain maximal conditionnel F . α b
+soit une
martingale.
Proposition
Le gain maximal conditionnel F θ α (resp. F θ α
+) est une sur-martingale positive c’est ` a dire que F θ α (resp. F θ α
+) est P -integrable et que
E (F θ α | G γ ) ≤ F γ α resp. E
F θ α
+| F γ
≤ F γ α
+.
Corollaire (Premier crit` ere d’optimalit´ e (N. El Karoui))
Une condition n´ ecessaire et suffisante pour que la strat´ egie α b soit
optimale est que le gain maximal conditionnel F . α b
+soit une
martingale.
D´ efinition
Nous appellons gain maximal conditionnel apr` es θ (respectivement
` a droite apr` es θ), la famille d´ efinie p.s. par:
W θ α = ess sup
{µ
t=α
t, ∀ t<θ} E [k θ (µ) |G θ ] ,
o` u k θ est le gain apr` es θ. (Respectivement, pour tout θ ≥ 0:
W θ α
+= ess sup
{µ
t=α
t, ∀ t≤θ} E [k θ
+(µ) |F θ ] ,
o` u k θ
+est le gain ` a droite apr` es θ).
Principe de la programmation dynamique
Proposition (Bellman)
Pour toute strat´ egie admissible α et 0 < γ ≤ θ, nous avons p.s.
W γ α ≥ E
k γ (α) − k θ (α) + W θ α | G γ
. (4)
Respectivement, pour 0 ≤ γ ≤ θ, nous avons p.s.
W γ α
+≥ E
k γ
+(α) − k θ
+(α) + W θ α
+| F γ
. (5)
De plus, α b est optimale si et seulement si l’´ egalit´ e (5) a lieu p.s.
pour tout couple (γ, θ).
Notations
On introduit M = ∪ (i ,x)∈U×
R M (i,x) avec M (i,x) v´ erifie:
M (i ,x) =
r α (i, x; ., .), δ i,x ; α ∈ D si (i, x) 6= (∅, ∆)
M (∅,∆) = δ (∅,∆) sinon.
On rappelle que r α est une probabilit´ e de transition du couple (ζ n , Y τ
−n
) au couple (ζ n+1 , Y τ
n).
Hypoth` ese
L’ensemble M est faiblement ferm´ e, faiblement compact et
s´ eparable.
Th´ eor` eme: Deuxi` eme crit` ere d’optimalit´ e
Pour toute strat´ egie α nous avons les in´ egalit´ es suivantes:
W 0 α
+≥ E Z τ
00
e −βs f (ξ s , Y s ) ds − e −βτ
0c(ξ 0 , Y τ
−0
, ζ 1 , Y τ
0) + W τ α
0+W τ α
n≥ −e −βτ
nZ
U× R
c(ζ n , Y τ
−n
, i, x)r α (., i, dx ) + E (W τ α
n+| G τ
n) W τ α
n+≥ E
Z τ
n+1τ
ne −βs f (ξ s , Y s ) ds| F τ
n+ E(W τ α
n+1| F τ
n)
De plus, la strat´ egie α b est optimale ssi l’´ egalit´ e a lieu dans ces trois
in´ egalit´ es.
Corollaire
On a les ´ egalit´ es p.s. suivantes:
W τ α
n= e −βτ
nρ(ζ n , Y τ
−n
), ∀ n ≥ 0, o` u ρ(i , x) = ess sup µ∈D E {i ,x} (k (µ)).
W τ α+
n= e −βτ
nρ + (ζ n+1 , Y τ
n), ∀ n ≥ −1, o` u ρ + (i , x) = ess sup {µ∈D, ζ
µ1
6=∅} E {i ,x} (k(µ)).
Proposition (Lepeltier-Marchal)
Pour toute strat´ egie admissible α et tout n ≥ 0, on a W τ α
n= e −βτ
nmρ + (ζ n , Y τ
−n
) p.s.
o` u mρ + est l’op´ erateur d´ efini par (i, x) → ess sup
ν∈M
(i,x)Z
U× R
ν(i, x; j , dy ) −c(i, x, j , y) + ρ + (j , y ) .
De plus, le gain moyen ρ(i , x) est ´ egal ` a mρ + (i, x).
Proposition
L’application ρ + ne d´ epend pas de la strat´ egie α et satisfait ` a l’´ egalit´ e suivante:
ρ + (i , x) = ess sup
T>0,T∈R
−1E {i,x}
Z T ((i,x),.) 0
e −βs f (i , Y s ) ds + e −βT((i,x),.)
mρ + (i , Y T
−((i,x),.) )
, (6)
o` u R −1 : Ensemble des applications mesurables T sur U × R × Ω
tel que T ((i, x), .) est un G-temps d’arrˆ et.
Th´ eor` eme: Crit` ere d’optimalit´ e
Pour toute strat´ egie α, nous avons les in´ egalit´ es suivantes:
ρ + (i , x) ≥ E {i ,x}
Z τ
00
e −βs f (i, Y s ) ds + e −βτ
0mρ + (i, Y τ
−0
)
. (7)
mρ + (ζ n , Y τ
−n
) ≥
Z
U× R
r α (ζ n , Y τ
−n
, i, dx) − c (ζ n , Y τ
−n
, j , y ) + ρ + (j, y)
. (8)
e −βτ
nρ + (ζ n+1 , Y τ
n) ≥ E {ζ
n+1,Y
τn}
Z τ
n+1τ
ne −βs f (ζ n+1 , Y s ) ds + e −βτ
n+1mρ + (ζ n+1 , Y τ
−n+1