• Aucun résultat trouvé

Contrˆole impulsionnel appliqu´e `a la gestion de changement de technologie dans une entreprise

N/A
N/A
Protected

Academic year: 2022

Partager "Contrˆole impulsionnel appliqu´e `a la gestion de changement de technologie dans une entreprise"

Copied!
32
0
0

Texte intégral

(1)

Contrˆ ole impulsionnel appliqu´ e ` a la gestion de changement de technologie dans une entreprise

Rim Amami

Institut de Math´ ematiques de Toulouse Facult´ e des Sciences de Tunis

Colloque ”Jeunes Probabilistes et Statisticiens”

Le Mont Dore - 07 Mai 2010

(2)

Plan

1 Introduction

2 Pr´ esentation du mod` ele

3 Crit` ere d’optimalit´ e

Gains maximaux conditionnels R´ esolution

4 Travail en cours

(3)

Probl` eme et objectif

Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.

Cons´ equences:

Changement de technologie −→ Temps d’arrˆ et du syst` eme.

⇒ Une impulsion.

La renaissance du syst` eme en suivant une nouvelle technologie.

Objectif: Optimiser le gain de la firme.

Observations:

Un caract` ere markovien et homog` ene entre deux instants d’impulsions.

Une forme markovienne de chaque renaissance.

(4)

Probl` eme et objectif

Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.

Cons´ equences:

Changement de technologie −→ Temps d’arrˆ et du syst` eme.

⇒ Une impulsion.

La renaissance du syst` eme en suivant une nouvelle technologie.

Objectif: Optimiser le gain de la firme.

Observations:

Un caract` ere markovien et homog` ene entre deux instants d’impulsions.

Une forme markovienne de chaque renaissance.

(5)

Probl` eme et objectif

Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.

Cons´ equences:

Changement de technologie −→ Temps d’arrˆ et du syst` eme.

⇒ Une impulsion.

La renaissance du syst` eme en suivant une nouvelle technologie.

Objectif: Optimiser le gain de la firme.

Observations:

Un caract` ere markovien et homog` ene entre deux instants d’impulsions.

Une forme markovienne de chaque renaissance.

(6)

Probl` eme et objectif

Probl` eme: L’entrepreneur d’une entreprise d´ ecide ` a certains instants de changer de technologie.

Cons´ equences:

Changement de technologie −→ Temps d’arrˆ et du syst` eme.

⇒ Une impulsion.

La renaissance du syst` eme en suivant une nouvelle technologie.

Objectif: Optimiser le gain de la firme.

Observations:

Un caract` ere markovien et homog` ene entre deux instants d’impulsions.

Une forme markovienne de chaque renaissance.

(7)

Outils

Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:

α = (τ n , ζ n+1 , ∆ n , n > −1).

⇒ Les trois composantes de la variable du contrˆ ole sont:

Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ

n

.

ζ n+1 le choix de la technologie ` a l’instant τ n .

n la taille du saut.

(8)

Outils

Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:

α = (τ n , ζ n+1 , ∆ n , n > −1).

⇒ Les trois composantes de la variable du contrˆ ole sont:

Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ

n

.

ζ n+1 le choix de la technologie ` a l’instant τ n .

n la taille du saut.

(9)

Outils

Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:

α = (τ n , ζ n+1 , ∆ n , n > −1).

⇒ Les trois composantes de la variable du contrˆ ole sont:

Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ

n

.

ζ n+1 le choix de la technologie ` a l’instant τ n .

n la taille du saut.

(10)

Outils

Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:

α = (τ n , ζ n+1 , ∆ n , n > −1).

⇒ Les trois composantes de la variable du contrˆ ole sont:

Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ

n

.

ζ n+1 le choix de la technologie ` a l’instant τ n .

n la taille du saut.

(11)

Outils

Un contrˆ ole impulsionnel (ou strat´ egie admissible) a la forme:

α = (τ n , ζ n+1 , ∆ n , n > −1).

⇒ Les trois composantes de la variable du contrˆ ole sont:

Les instants d’impulsion: (τ n ) n> −1 une suite croissante de temps d’arrˆ et qui converge vers τ et v´ erifiant τ −1 = 0 et τ n+1 = τ n + τ 0 ◦ φ τ

n

.

ζ n+1 le choix de la technologie ` a l’instant τ n .

n la taille du saut.

(12)

(Ω, A, F, P): Un espace de probabilit´ e.

(F t ) t≥0 : Une filtration compl` ete continue ` a droite.

(G t ) t>0 : Une filtration pr´ evisible: G t = ∨ s<t F s , ∀ s < t.

Le processus c` adl` ag ξ t indique la technologie ` a l’instant t:

ξ t = ξ 0 1 [0,τ

0

[ (t) + X

n≥0

ζ n+1 1

n

n+1

[ (t) + ∅ 1 [τ,+∞[ (t).

Ce processus est ` a valeurs dans U, l’ensemble fini des technologies

possibles. De plus, ζ n+1 est une v.a. G τ

n

-mesurable et (τ n ) n> −1 est

une suite des G-temps d’arrˆ et. On note U = U ∪ {∅}.

(13)

La valeur de la firme est S t = exp Y t , t ≥ 0, o` u Y est le processus continu ` a droite ` a valeurs dans R = R ∪ {∆} d´ efini par:

Y t = Y 0 1 [0,τ

0

[ (t) + X

n≥0

n 1

n

n+1

[ (t)

+ Z t

0

(b(ξ s ) ds + σ(ξ s ) dW s ) + ∆ 1 [τ,+∞[ (t),

avec ∆ signifie que la firme a disparu et ∆ n est la taille du saut du log de la valeur de la firme, une v.a. G τ

n

-mesurable. On note r α la probabilit´ e de transition du couple (ζ n , Y τ

n

) au couple (ζ n+1 , Y τ

n

):

P (ζ n+1 = j , Y τ

n

= x + dy

ζ n = i , Y τ

n

= x) = r α (i, x; j , dy ).

(14)

La fonction gain ´ economique

A chaque strat´ egie α, nous associons le gain k (α) =

Z τ 0

e −βs f (ξ s , Y s ) ds − X

n≥0

e −βτ

n

c (ζ n , Y τ

n

, ζ n+1 , Y τ

n

) (1) o` u

β > 0 est un coefficient d’actualisation.

La fonction f repr´ esente le b´ en´ efice net de la firme.

La fonction c repr´ esente le coˆ ut de changement de technologie avec c (i , x, i , x) = 0.

Soit le gain moyen:

(15)

But

Prouver l’existence d’une strat´ egie admissible α b qui maximise la fonction gain K (α) d´ efinie par l’expression (2), c’est ` a dire:

K ( α) = b ess sup

α∈D

K (α), (3)

o` u D est l’ensemble des strat´ egies admissibles.

(16)

Gain maximal conditionnel

D´ efinition

Le gain maximal conditionnel est la famille d´ efinie p.s. par:

F θ α = ess sup

t

t

, t<θ}

E (k (µ)| G θ ) . De mˆ eme,

F θ α

+

= ess sup

t

t

, t≤θ}

E (k (µ)| F θ ) .

(17)

Proposition

Le gain maximal conditionnel F θ α (resp. F θ α

+

) est une sur-martingale positive c’est ` a dire que F θ α (resp. F θ α

+

) est P -integrable et que

E (F θ α | G γ ) ≤ F γ α resp. E

F θ α

+

| F γ

≤ F γ α

+

.

Corollaire (Premier crit` ere d’optimalit´ e (N. El Karoui))

Une condition n´ ecessaire et suffisante pour que la strat´ egie α b soit

optimale est que le gain maximal conditionnel F . α b

+

soit une

martingale.

(18)

Proposition

Le gain maximal conditionnel F θ α (resp. F θ α

+

) est une sur-martingale positive c’est ` a dire que F θ α (resp. F θ α

+

) est P -integrable et que

E (F θ α | G γ ) ≤ F γ α resp. E

F θ α

+

| F γ

≤ F γ α

+

.

Corollaire (Premier crit` ere d’optimalit´ e (N. El Karoui))

Une condition n´ ecessaire et suffisante pour que la strat´ egie α b soit

optimale est que le gain maximal conditionnel F . α b

+

soit une

martingale.

(19)

D´ efinition

Nous appellons gain maximal conditionnel apr` es θ (respectivement

` a droite apr` es θ), la famille d´ efinie p.s. par:

W θ α = ess sup

t

t

, ∀ t<θ} E [k θ (µ) |G θ ] ,

o` u k θ est le gain apr` es θ. (Respectivement, pour tout θ ≥ 0:

W θ α

+

= ess sup

t

t

, ∀ t≤θ} E [k θ

+

(µ) |F θ ] ,

o` u k θ

+

est le gain ` a droite apr` es θ).

(20)

Principe de la programmation dynamique

Proposition (Bellman)

Pour toute strat´ egie admissible α et 0 < γ ≤ θ, nous avons p.s.

W γ α ≥ E

k γ (α) − k θ (α) + W θ α | G γ

. (4)

Respectivement, pour 0 ≤ γ ≤ θ, nous avons p.s.

W γ α

+

≥ E

k γ

+

(α) − k θ

+

(α) + W θ α

+

| F γ

. (5)

De plus, α b est optimale si et seulement si l’´ egalit´ e (5) a lieu p.s.

pour tout couple (γ, θ).

(21)

Notations

On introduit M = ∪ (i ,x)∈U×

R M (i,x) avec M (i,x) v´ erifie:

M (i ,x) =

r α (i, x; ., .), δ i,x ; α ∈ D si (i, x) 6= (∅, ∆)

M (∅,∆) = δ (∅,∆) sinon.

On rappelle que r α est une probabilit´ e de transition du couple (ζ n , Y τ

n

) au couple (ζ n+1 , Y τ

n

).

Hypoth` ese

L’ensemble M est faiblement ferm´ e, faiblement compact et

s´ eparable.

(22)

Th´ eor` eme: Deuxi` eme crit` ere d’optimalit´ e

Pour toute strat´ egie α nous avons les in´ egalit´ es suivantes:

W 0 α

+

≥ E Z τ

0

0

e −βs f (ξ s , Y s ) ds − e −βτ

0

c(ξ 0 , Y τ

0

, ζ 1 , Y τ

0

) + W τ α

0+

W τ α

n

≥ −e −βτ

n

Z

U× R

c(ζ n , Y τ

n

, i, x)r α (., i, dx ) + E (W τ α

n+

| G τ

n

) W τ α

n+

≥ E

Z τ

n+1

τ

n

e −βs f (ξ s , Y s ) ds| F τ

n

+ E(W τ α

n+1

| F τ

n

)

De plus, la strat´ egie α b est optimale ssi l’´ egalit´ e a lieu dans ces trois

in´ egalit´ es.

(23)

Corollaire

On a les ´ egalit´ es p.s. suivantes:

W τ α

n

= e −βτ

n

ρ(ζ n , Y τ

n

), ∀ n ≥ 0, o` u ρ(i , x) = ess sup µ∈D E {i ,x} (k (µ)).

W τ α+

n

= e −βτ

n

ρ +n+1 , Y τ

n

), ∀ n ≥ −1, o` u ρ + (i , x) = ess sup {µ∈D, ζ

µ

1

6=∅} E {i ,x} (k(µ)).

(24)

Proposition (Lepeltier-Marchal)

Pour toute strat´ egie admissible α et tout n ≥ 0, on a W τ α

n

= e −βτ

n

+ (ζ n , Y τ

n

) p.s.

o` u mρ + est l’op´ erateur d´ efini par (i, x) → ess sup

ν∈M

(i,x)

Z

U× R

ν(i, x; j , dy ) −c(i, x, j , y) + ρ + (j , y ) .

De plus, le gain moyen ρ(i , x) est ´ egal ` a mρ + (i, x).

(25)

Proposition

L’application ρ + ne d´ epend pas de la strat´ egie α et satisfait ` a l’´ egalit´ e suivante:

ρ + (i , x) = ess sup

T>0,T∈R

−1

E {i,x}

Z T ((i,x),.) 0

e −βs f (i , Y s ) ds + e −βT((i,x),.)

+ (i , Y T

((i,x),.) )

, (6)

o` u R −1 : Ensemble des applications mesurables T sur U × R × Ω

tel que T ((i, x), .) est un G-temps d’arrˆ et.

(26)

Th´ eor` eme: Crit` ere d’optimalit´ e

Pour toute strat´ egie α, nous avons les in´ egalit´ es suivantes:

ρ + (i , x) ≥ E {i ,x}

Z τ

0

0

e −βs f (i, Y s ) ds + e −βτ

0

+ (i, Y τ

0

)

. (7)

+n , Y τ

n

) ≥

Z

U× R

r αn , Y τ

n

, i, dx) − c (ζ n , Y τ

n

, j , y ) + ρ + (j, y)

. (8)

e −βτ

n

ρ + (ζ n+1 , Y τ

n

) ≥ E {ζ

n+1

,Y

τn

}

Z τ

n+1

τ

n

e −βs f (ζ n+1 , Y s ) ds + e −βτ

n+1

+n+1 , Y τ

n+1

)

.

(27)

Pour tout (i , x), on d´ efinit le temps T ((i , x), .) =

inf{t ≥ 0 : e −βt ρ(i , Y t x ) = e −βt m ρ + (i, Y t x )}.

+∞ si l’ensemble est vide.

L’ensemble d’impulsion est I =

(i, x) : ρ(i , x) = m ρ + (i , x) , o` u pour M (i ,x) = M (i,x) − δ (i ,x) , m ρ + est l’op´ erateur:

(i , x) → ess sup

ν∈M

(i,x )

Z

U× R

ν(i , x; j , dy )(−c (i , x, j, y) + ρ + (j , y)).

Lemme

Il existe un noyau bor´ elien r ∈ M qui r´ ealise le maximum tel que p.s. pour tout (i , x) de I:

m ρ + (i , x) = Z

r (i, x; j , dy ) − c(i, x, j , y) + ρ + (j , y)

.

(28)

Pour tout (i , x), on d´ efinit le temps T ((i , x), .) =

inf{t ≥ 0 : e −βt ρ(i , Y t x ) = e −βt m ρ + (i, Y t x )}.

+∞ si l’ensemble est vide.

L’ensemble d’impulsion est I =

(i, x) : ρ(i , x) = m ρ + (i , x) , o` u pour M (i ,x) = M (i,x) − δ (i ,x) , m ρ + est l’op´ erateur:

(i , x) → ess sup

ν∈M

(i,x )

Z

U× R

ν(i , x; j , dy )(−c (i , x, j, y) + ρ + (j , y)).

Lemme

Il existe un noyau bor´ elien r ∈ M qui r´ ealise le maximum tel que

p.s. pour tout (i , x) de I:

(29)

Th´ eor` eme: Une strat´ egie optimale

La famille α b = ( b τ n , ζ n+1 , ∆ b n ) d´ efinie par:

 

 

 b τ 0 :=

T ((ξ 0 , Y 0 ), ω) sur (ξ 0 6= ∅) ∩ (T ((ξ 0 , Y 0 ), ω) > 0) +∞ sur (ξ 0 6= ∅) ∩ (T ((ξ 0 , Y 0 ), ω) = 0)

0 sur (ξ 0 = ∅),

r 0 , Y 0

, ζ 1 , Y 0 ) est la loi de passage sur G

τ b

0

, puis par r´ ecurrence pour tout n ≥ 1 :

τ b n = b τ n−1 + T ((ζ n , Y τ

n−1

), .), le couple (ζ n+1 , ∆ b n ) est de loi:

r n , Y

b τ

n

; ., .) sur (ξ 0 6= ∅) ∩ (0 < T ((ζ n , Y

b τ

n

), ω ) < +∞)

δ {∅,∆} sinon,

(30)

Formuler le probl` eme d’optimisation comme un probl` eme du contrˆ ole impulsionnel avec trois variables li´ ees ` a la fonction gain, la technologie choisie et la valeur de la firme.

Etablir une caract´ erisation de la fonction valeur et la

consid´ erer comme solution des in´ equations de

Hamilton-Bellman-Jacobi.

(31)

Formuler le probl` eme d’optimisation comme un probl` eme du contrˆ ole impulsionnel avec trois variables li´ ees ` a la fonction gain, la technologie choisie et la valeur de la firme.

Etablir une caract´ erisation de la fonction valeur et la

consid´ erer comme solution des in´ equations de

Hamilton-Bellman-Jacobi.

(32)

R´ ef´ erences

A. Bensoussan et J.L. Lions: Contrˆ ole Impulsionnel et In´ equations quasi-variationnelles. Dunod, Paris, 1982

M.H.A. Davis: Markov Models and Optimization. Chapman et Hall,1993.

N. El Karoui: Les Aspects Probabilistes du Contrˆ ole Stochastique. Lecture Notes in Mathematics 876, Springer-Verlag, Berlin, 1981.

P.A. Lepeltier et B. Marchal: Th´ eorie G´ en´ erale du Contrˆ ole

Impulsionnel Markovien. SIAM J.Control and optimization,

Vol.22, No.4, 1984.

Références

Documents relatifs

[r]

Donner la d´efinition de la borne sup´erieure de A ainsi qu’une condition n´ecessaire et suffisante pour son existence. En particulier, on peut faire la seconde partie en admettant

La principale (dont les autres d´ ecoulent) est la suivante : Pour deux arˆ etes parall` eles, la diff´ erence de cotes entre les extr´ emit´ es est la mˆ eme (pour une

Cette expression peut aussi permettre de voir la pression exerc´ee par le flux de photons ou de l’onde ´electromagn´etique sur la surface S, en effet, il suffit de diviser la force

Le plus simple pour aboutir dans cette recherche du champ magn´etique est d’utiliser un rep`ere cylindrique associ´es ` a chacun des deux fils et d’exprimer ensuite le

Toutes les justifications doivent figurer sur votre copie, mais la r´edaction doit rester sobre.. Vous pouvez admettre un r´esultat, `a condition de le signaler

Donn´ ee: une machine de Turing M , qui ne revient jamais en d´ ebut de ruban, ne revient jamais dans l’´ etat initial, n’´ ecrit jamais de blancs?. Question: M ne s’arrˆ ete

´ Enoncer le th´eor`eme de la limite monotone pour les suites, puis d´emontrer l’un des quatre r´esultats (au