M. F UJISAKI
Unicité des lois optimales du contrôle stochastique continu dans le cas complètement observable
Annales scientifiques de l’Université de Clermont-Ferrand 2, tome 69, sérieMathéma- tiques, no19 (1981), p. 37-45
<http://www.numdam.org/item?id=ASCFM_1981__69_19_37_0>
© Université de Clermont-Ferrand 2, 1981, tous droits réservés.
L’accès aux archives de la revue « Annales scientifiques de l’Université de Clermont- Ferrand 2 » implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNICITE DES LOIS
OPTIMALES
DU CONTROLESTOCHASTIQUE
CONTINU DANS LE CAS COMPLETEMENTOBSERVABLE
M.
FUJISAKI
Université de KOBE
(Japon)
Dans
[2],
l’auteur a eu un critère pour unicité des loisoptimales
du contrôle
stochastique
dans le cas continu etcomplètement
observable.Dans cet article nous résumons le résultat de [21 et ensuite nous
résolvons un
problème
d’unicité des loisoptimales
à propos d’unexemple qui
est traité dans E2].I PRELIMINAIRES NOTATIONS, DEFINITIONS
Soit T un temps
fixé,
fini, Soit Cl’espace
des fonctions continuessur à valeurs dans
Rn,
muni de la norme uniforme.Désignons
par wun élément de C et
1 Iwl 1 .
supIw(t) 1.
. Soient F la tribu borélienne de C-
et 0 t 5 T, la famille croissante des sous tribus de F, telle que pour tout t >,
0, Ft soit engendrée
par des ensemblescylindriques jusqu’à
l’ instant t. Soit U un ensemble borélien de
R que
nousappelons l’espace
descontrôles,
muni la sous tribu de tribu borélienne deR~
Posons
Nous considérons le
système
deséquations
différentiellesstochastiques suivant,
avec condition initialeX(O)
= x, où x est un vecteur fixé deRn :
où B =
(Bt) , 0 ~ t ~ T,
est un mouvement brownien à n dimensions.u =
u(t,X)
est leparamètre
du contrôle : il sera définirigoureusement plus
loin. Nous allons tout d’abord considérer l’existence et unicité des solutions del’équation (1.1).
Ici l’existencesignifie
celle dessolutions faibles et unicité de même
signifie
unicité en loi(voir
[3]pour les définitions de solution faible et d’unicité en
loi). Supposons
que le coefficient g =
g(t,w,u)
del’équation (1.1)
satisfait auxconditions suivantes :
(g.l)
g est mesurable entriple (t,w,u),
(g.2)
pour tout(t,u), g(t,
.. , ,u)
estFt - mesurable,
Définissons la classe admissible des contr8les de la manière suivante :
Définition 1.1. Soit
st(0~st~T).
On dit que uappartient
àUt
=s si u est uneapplication
de[s,t]
" :J x C dans Uqui
est mesurable en(t,w)
et pour tout t,u(t,.)
est F - mesurable. On dit queU est
laclasse admissible
des
contrôles sur[s, Pt]
*UT ,
alors on ditsimplement que U
est la classe admissible des contrôles. Deplus,
tout élément u deU
estappelé
uncontrôle
admissible. DDans ce cas, la remarque suivante est claire.
Remarque
1 . 1 .1 )
Soient 1alors
u C Ut
Mr
2)
alors la restriction de u surj]s,t]
appartient
àUs
DSoit P la mesure de Wiener
uniquement
déterminée surl’espace canonique (C,F). Supposons
que la f amille(it) 0
0 , t ~T,
satisfaitaux conditions
habituelles,
i.e. elle est continue à droite etcomplète
par rapport à P. D’ailleurs nous supposons que F est P - triviale. Alors
MO
on a le résultat
qui
assure l’existence et unicité del’équation (1.1).
Proposition t.l.
Pour tout il existe une solution et une seule pourl’ équation ( 1,1 ) .
Deplus,
la solutionPu (la loi)
surl’ espace canonique (C,E)
peut s’écrire :où est déf inie par
(1.3) :
0
Autrement
dit, Pu
est une mesure(unique)
sur(C,F)
pourlaquelle
est
(Et) -
mouvementbrownien.0
Remarque 1.2.
1 )
Il est bien connu queaj(u)
définie par( 1.3)
est unemartingale
par rapport àqui
estpositive
et uniformémentintégrable.
2)
Soit B =t la filtration naturelle de(B)définie
t par(1.4).
Alorsil faut noter que pour tout t.D
Nous allons définir la fonction de perte. Soit h une
application
borélienne de
JO,T] xtR dans IR1 satisfaisant
aux conditions suivantes :1)
pour tout u ~ U ,EU [ h (T,w ) 1 ]
2)
pour toutu~~ U ,
tout t >0,
il existe une fonction telle que pour toutv e UT.
tT, où
Eu désigne l’espérance
relative à
Pu
définie par(1.2).
Remarquons
que si h estpositive
alors la condition2)
est satisfaite.Déf inition 1. 2. Pour tout u E U posons
On dit que
J(u)
est la fonction de perte associée à u.D Déf inition 1.3. On dit queu e U
estoptimal
siRemarque 1, 3, Dans la définition
1.2,
la fonction h nedépend
pas de u.Toutefois nous pouvons démontrer que certains cas où h
dépend
de u seréduit au cas où la fonction de perte peut s’écrire comme
(1.5).
Parexemple,
prenons comme la fonction de perteDans ce cas, en introduisant un autre espace
probabilisé
et un pouvement brownien à une dimension sur cet espace, il estpossible
que la fonction de perte nedépend plus
de contrôle u.(pour
ledétail,
voir[21)
0II LE PRINC IPLE OPTIMAL ET UNICITE EN LOI OPTIMAL Soient
u,v E
U - et si on définitutv
par0
alors
utv appartient
à U. Définissons la fonction de valeurqui jouera
o =
un rôle très
important plus
loin.Définition 2.1. Pour tout t ~
0,
et toutut,
U, posonsOn dit que
W
est la fonction de valeur.DRemarque
2.1. Il f aut noter queWt
t estFt -
=tadaptée (plus précisément,
F -
Mtoptionnelle puisque Ft
t est continue à droite t ent).
Deplus,
dans cecas, pour tout u 6
y, W
=Pu -ess.
(vo ir F4l)D
=cLe théorème suivant est fondamental pour nos discussions ultérieures.
Théorème 2,1,
(Rishel, Davis, Varaiya)
1)
Pour tout u EPu)
est unesous-martingale,
t t
2)
Pour que u E U soitoptimal
il faut et il suffit que(W ,
F .Pu)
soit une
martingale
unif ormémentintégrable,
3)
Deplus,
pour que u E U soitoptimal
il faut et il suffit que u soit conditionnellemento timal ;
i.e, pour toutt j 0,
Remarquons
que si u estoptimal
alorsWt
est unemartingale
continuepar rapport à
(Et,
tPu).
Plusprécisément,
si u estoptimal
alors il existeune fonction
(Et) -
-prévisible 0t
t telle que, pour toutt >, 0,
’ W t peuts’exprimer :
,est un mouvement brownien sur
l’espace canonique (C, F) ,
_ déf ini parl’équation ( 1,1 )
associée à u, etWo
o =J(u).
Définissons trois ensembles des mesures sur
l’espace (C, F)
de la manière suivante :Disons que tout élément de
~o
est une loioptimale.
Alors il résulteimmédiatement du théorème 2.1 que
M
= m n . Le théorème suivantd’après
Jacod-Yor donne un critère pour unicité des loisoptimales.
Théorème 2.2. Soit R R est absolument continue par
{W} Q
rapport àQ }. Supposons
queQ
alors pour quel’ensemble M
consiste en un seul
point (= Q)
il faut et il suffit que(V )
a lapropriété
de représentation prévisible par
rapport à(Et, Q) :
i.e. pour toute(Et, Q) - martingale M -
réellebornée,
il existe une fonctionprévisible $ ,
convenablementintégrable,
telle queDonc on a un résultat à propos d’unicité des lois
optimales
ainsi :Proposition
2.3. Soit uoptimal
dans U. SiWt
est unemartingale
ayantm-- ... a
la
propriété
dereprésentation prévisible
par rapport à(Et,
=tPu),
alors laloi
optimale unique.
0Pour la
démonstration,
il suffit que l’on note que pour tout u,pu
estéquivalente
à la mesure de WienerP d’après
laproposition
1.1. Laproposition suivente
donne une condition suffisantepourqu’une martingale
ait la
propriété
dereprésentation prévisible.
Pro osition
2.4. Soit(Bt)
un mouvement brownien à n dimensions sur un espaceprobabilisé (0, E, p)
et soit(Et)
la filtration naturelle det
(B ).
t est un élément deL1 (B)
ioc ne s’annulantjamais
sauf desensembles évanescents et si Y = $.B
(i.e.
Y = Y t +lt (O, d8 ) ) ,
alors0 0 s s
Y -
(Yt)
a lapropriété
dereprésentation prévisible.
pEn
effet,
l’énoncé découle immédiatement du fait 0 et(Bt)
a luimême cette
propriété.
III EXEMPLE
Considérons un
exemple
dont lesystème
de contrôle est défini parl’équation
différentiellestochastique
suivante :et la fonction de perte est définie par
où B -
(Bt) ,
0 , t 4T,
est un mouvement brownien à ndimensions,
et xest un vecteut fixé
de Rn. F(t,x)
est uneapplication
de[0 ; T]
xR1
dansRl
mesurable en(t x~
croissante en x pour tout t. Dans cetexemple,;
nous allons déf inir la classe admissible contrôle de la manière suivante :
on écrit u ~
Ub
si1 ) u est une
application
de0 ; T]
x Cdans Rn ,
mesurable en(t,w),
2) it - adaptée,
3)
pour tout(t,w) , k,
où k est une constante
positive.
On dit que u est un contrôle admissible si ueu
bmRemarquons
que pour tout u il existe une solution del’équation (3.1 )
et une seule
(toujours
enloi),
et laclasse Ub
est aussi relativement=
complète.
En cequi
concerne leproblème
de trouver uncontrôle optimal,
le théorème suivant est bien connu :
Théorème 3.1.
Soit ~** l’application
deRn
à valeurs dansRn
telle que, pour tou t x =( x 1,
... ,xn) ,
Alors
u*(t,X) = w*(t,Xt)
est un contrôleoptimal,
où X =(X )
est launique
solution(en trajectoire)
del’équation (3.1 )
sur un espaceprobabilisé (Ç2, E, p)
associée àu*.
Par ailleurs cette solution X =(Xt)
t est forte(i, e. cy{Xs,
s st}
= s st} ) ,
DNous allons considérer unicité des lois
optimales.
Dans ce cas, la fonction de valeurWt
définie par(2.2)
peut s’écrire :étant
optimal, d’après
le théorème2.1, Wt
estégale
*
où
E* signif ie l’ espérance
relative àpU.
On sait que la solution del’équation (3.1)
associée àu*
est un processus deMarkov,
demême, (
est aussi un processus de Markov. En utilisant le
semigroupe
de ceprocessus, si F
appartient
au domaine dugénérateur,
alorsWt
peut s’écrire :où P
T est le
semigroupe
de processus(JX jt)
et(B*)
est un mouvementt,T
* ~ tbrownien sous
Pu
à unedimension,
défini par(3.6) :
Si l’ensemble
{(s,w) ; 2-
P s, T= 0 est
nêgllseable
p ar rapport às,
sla mesure
produit
dtx dP,
alors(W )
t a lapropriété
dereprésentation prévisible d’après
laproposition
2.4. Parconséquent,
il résulte de lapropositio n
2.3 que la loioptimale
estunique.
Cependant,
on peut aussi vérifier unicité directement sansutiliser les
pro p ositions
2.3 et 2.4. Eneffet ,
si alors il fautremarquer que
B*apparaissant
dans(3.6),
est un mouvement brownien à une dimension souso
En substituant
(Bo)
à(B*)
dans la formule(3.6),
on a alorsD’après
le théorème2.1,
pour que u soitoptimal
il faut et il suffit quele
terme de variation fini est nulle. Par
conséquent,
sia
ax P s,T s nes’annule
jamais
sauf des ensemblesnégligeables(ds (x) dP),
alorsu°
estoptimal
si et seulement siPosons ,
Par
conséquent,
v etu*
sontorthogonales.
Finalement,
1
Toutefois,
en tant queu 0 appartient à Ub,
k. Donc v ae 0. Enrécapitulant
les argumentsprécédents,
on a le théorème suivant :Théorème 3.2. Si ax
F(t,lXti)
=O}
est un ensemblenégligeable
PT
t(dt (x) dP),
alors la loioptimale
estunique.
D .. BIBLIOGRAPHIE
’
[1]
N. EL-KAROUI, Cours de l’Ecole d’été de calcul desprobabilités,
1979.[21] M.