A NNALES DE L ’I. H. P., SECTION B
E. L ANERY
Solutions bayésiennes en théorie de la décision statistique
Annales de l’I. H. P., section B, tome 18, n
o1 (1982), p. 55-79
<http://www.numdam.org/item?id=AIHPB_1982__18_1_55_0>
© Gauthier-Villars, 1982, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P., section B » (http://www.elsevier.com/locate/anihpb) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
Solutions bayésiennes
en
théorie de la décision statistique
E. LANERY
Université Paris IX Dauphine, 75775 Paris Cedex 16
Vol. XVIII, n° 1-1982, p. SS-79. Calcul des Probabilités et Statistique.
RÉSUMÉ. - Les résultats
classiques
du calcul desprobabilités
sur lamesurabilité,
les tempsd’arrêt,
lesmartingales
et ladésintégration,
per- mettent d’obtenir l’existence de solutionsbayésiennes
pour le modèle de décisionstatistique proposé
par A.Wald,
et ce, sanshypothèse
d’absoluecontinuité sur les
probabilités,
pour des coûts non nécessairementbornés,
et avec une observation éventuellement en temps continu.
ABSTRACT. - Classic results in
probability
aboutmeasurability, stopping- times, martingals
anddisintegration, give
existence ofbayesian
solutionsas for Wald’s Statistical Decision Model on
large assumptions:
absolutecontinuity of probabilities,
or bounded costs are notrequired,
and observa-tion
period
may be continuous time.I. INTRODUCTION ET
RÉSULTAT
Étant
donné unsystème stochastique dynamique
dont la loi deproba-
bilité est fixée mais
inconnue,
on se propose,après
une certainepériode d’observation,
deprendre
une décision defaçon
à minimiser la sommedes deux coûts suivants :
- le
premier,
fonction de la décisionprise
et de la loi deprobabilité
effective du
système,
Annales de l’Institut Henri Poincaré-Section B-Vol. XVIII, 0020-2347/1982/55/~ 5,00/
© Gauthier-Villars
- le.
second,
fonction de l’observation effectuée.Une
caractéristique
essentielle de ceproblème d’optimisation provient
du fait que le coût de la décision finale
dépend
aussi de la loi deprobabilité
fixée mais inconnue suivie par le
système
étudié. Iln’y
a pas alors engénéral
de solution
optimale,
mais des solutions admissibles. Et pour choisirentre celles-ci on est amené
- soit à raisonner en terme de
jeu (solution minimax),
- soit à se donner une idée
préconçue
de la solution(par exemple
dansle maximum de
vraisemblance),
- soit encore à
partir
d’une idée apriori
sur la loi deprobabilité
suiviepar le
système (solution bayésienne).
De telles situations sont très
fréquentes
enStatistique [5 ].
C’est à la fin des années quarante
qu’A.
Wald[17] formalisa
cette théoriede la Décision
Statistique,
et en donna les résultats fondamentaux.Depuis,
le calcul des
probabilités
s’estlui-même
considérablementdéveloppé,
etil est maintenant
possible d’alléger
sensiblement leshypothèses proposées
par A.
Wald,
sans rienperdre
des conclusions : c’estl’objet
de cetravail ; déjà d’ailleurs,
A. Irle[6 ] [7] a présenté
une version du formalisme pour des observations en temps continu. Orparmi
les résultats essentiels de lathéorie,
il y al’appréhension
de toute solution admissible par des solutionsbayésiennes.
C’estpourquoi
lapremière partie exposée
ici est consacréeà l’existence de celles-ci. Une seconde
partie
est enpréparation
sur larelaxation,
pour uneapproche
en terme dejeu,
et sur le résultatindiqué
ci-dessus.
Mathématiquement,
on considèrel’espace
mesurable(Q, j~)
des réali-sations du
système étudié,
et un sous-ensemble T contenant 0 etreprésentant l’espace
destemps.
Achaque
instant t E T est associée unesous-tribu
~
de j~ surQ, correspondant
à l’informationqu’on
peutacquérir
par une observation au cours de l’intervalle[0, t ] de T ;
le coût de cetteobservation, quand
lesystème
est dans la réalisation cv, seranoté
a(t,
Soit(P(m))mEM
une famille de lois deprobabilité
sur(Q, j~) parmi lesquelles
se trouve, pour une certaine valeur fixée mais inconnue duparamètre
m, la loi deprobabilité
réelle dusystème étudié ;
l’ensemble M est celui des « états de la nature ».Enfin,
soit Z l’ensemble des décisions finalespossibles ;
on notera parb(m, z)
le coût de la décision finale zquand
l’état de la nature est m.
Dans ces conditions
(cf. [18 ]),
unetactique (de décision)
est un cou-ple (T, gz)
constitué par un temps d’arrêt T sur Q relatif à la famille croissante de sous-tribus et par une fonction dedécision gL
de Q dansZ,
sup-Poincaré-Section
posée F03C4-mesurable,
où est évidemment la tribu des événements anté- rieurs à T. Dans l’éventualité le coût de cettetactique, quand
l’état dela nature est m, vaut alors :
ce
qui
donne un coût moyenégal
à :Ainsi,
unetactique (d, lu)
est admissible si pour toute autretactique (r, g~)
on a dans
l’espace
lRM de toutes les fonctions de M dans R :Par
ailleurs,
étant donné une loi deprobabilité
apriori J1
sur les états de la nature, une solutionbayésienne
est unetactique ( â~‘,
telle que,pour
n’importe quelle tactique (r, g~),
en posant :on ait :
Théorème d’existence des solutions
bayésiennes.
On suppose que :
1 °
l’espace
des temps T muni de l’ordre induit par est lui-même untreillis
complet
de minimum0,
de sorte que toutepartie
de Tpossède
dans Tune borne
inférieure
et une bornesupérieure ;
2° la
famille
de sous-tribus de ~ surl’espace
S2 des éventualitésest croissante et continue à droite sur
T,
c’est-à-direqu’en
tout instant sde T distinct de Max
T,
on a :3 ° le coût d’observation a est un processus sur T x
Q,
à valeurs dans I~+, adapté
à lafamille
de sous-tribus àtrajectoires
croissantes et continues àgauche
surT,
c’est-à-dire que pourchaque
éventualité cc~ E Q on a en tout instant s de T strictementpositi, f ’ :
s =
SupT {
r Es }
~a(s,
=a(r, ce) )
r ET,
rs }
4°
l’espace
M des états de la nature est un espacetopologique
sous-Vol. 1-1982.
linien,
c’est-à-direl’image séparée
d’un espacepolonais
par uneapplication
continue
surjective [2 ], §
6 ;5°
l’application
m HP(m)
est uneprobabilitÉ
de transition[12 ], § III-2,
sur
(S2, ) paramétrée
surl’espace (M, (M))
des états de la nature munide sa tribu
borélienne ;
6°
l’espace
Z des décisionsfinales
est un compactmétrisable ;
7° le coût de décision
finale
b est uneapplication
borélienne duproduit
M x Z dans la demi-droite achevée
f~ +,
telle que toutes lesfonctions
par- tielles),
pour mEM,
sont semi-continuesinférieurement
sur Z.Dans ces
conditions, quelle
que. soit laprobabilité
deBayes
apriori
,usur
l’espace (M, ~(M))
des états de la nature muni de sa tribuborélienne,
il existe une
stratégie
de décisionfinale
c’est-à-dire un processus progres- sivement mesurable[ll ],
IV.D45, défini
sur(T
xSZ,
à valeurs dans(Z, ~(Z)),
et il existe un temps d’arrêt d’observation tels que pour toutetactique (i, g~)
on ait :En
particulier,
latactique
est une solutionoptimale
duproblème
de décision pour la loi de
Bayes
apriori
,u sur M. En outre, lastratégie
est
indépendante
du coût d’observation a ; celui-ci n’intervient que dans la détermination du temps d’arrêtoptimal
Pour établir l’existence de la
stratégie optimale
de décision finalef ~,
l’argumentation
estclassique [7~] :
: l’informationacquise
au cours del’observation de l’éventualité cc~
jusqu’à
l’instant t transforme la loi apriori
,usur M en une loi a
posteriori qui
permet d’obtenir le coût minimum de la décision finale par minimisation sur Zindépendamment
enchaque couple (t,
A ce stade(§ III),
les difficultés sont essentiellement dues à desquestions
de mesurabilité. Aussi a-t-on rassemblé auparagraphe
IIun certain nombre d’outils
mathématiques
utilisés au cours de la démons-tration. Il
s’agit
en fait d’énoncésqui
ne diffèrent souvent de résultats bienconnus que par
quelques précisions
dedétail,
et celles-ci peuvent être obtenues sans modifications notables des démonstrations habituelles.De toute
façon,
des preuves_complètes
ont été réunies dans[9].
Une fois déterminée la
stratégie
l’existence du temps d’arrêtopti-
mal est
appuyée
surl’argumentation
suivante : on se propose d’arrêter l’observation de l’éventualité c~ à l’instant où le coûtglobal correspondant
n’est
plus
strictementsupérieur
au coût moyen minimumqu’on pourrait
obtenir en
prolongeant
cette observation. Ce raisonnement futdéveloppé
par J.-L. Snell
[14 ] puis
M.Thompson [15 ]
pour résoudre leproblème
Annales de l’Institut Henri Poincaré-Section B
général
du temps d’arrêtoptimal. Cependant,
pour éviter les référencesen cascade et
plusieurs
mises aupoint
consécutives à des modifications dans leshypothèses,
on enprésente
auparagraphe
IV une version appro-priée
au contexteparticulier
étudié ici.Généralement, l’espace
des temps T est soit (~ soit I~ + . C’estpourquoi
on va
alléger
les démonstrations en supposant dans tout cequi
suit que cet ensemble T estuniquement
la demi-droite achevée R+ toutentière,
le cas discret s’établissant par les mêmes argumentssimplifiés.
D’ailleurs moyen- nantquelques modifications,
le casgénéral
d’un espace des temps treilliscomplet
contenu dans (~ + peut lui aussi en être déduit sans difficultés[10 ].
Des
hypothèses faites,
laplus contraignante
est sans doute la continuité à droite de la famille des sous-tribus~
pour t E T. Malheureusement certainscontre-exemples
permettent de penserqu’elle
estindispensable.
D’ailleurs,
si on se limite auxtactiques correspondant
aux temps d’arrêt accessibles[ll ],
VII.D42,
il n’est pas sûr nonplus qu’il
existetoujours
une solution
bayésienne. Quant
à la continuité àgauche
destrajectoires
du coût d’observation a, du fait
qu’elles
sontcroissantes,
cela revient àdire que ces
trajectoires
sont semi-continues inférieurement. Comme on aura l’occasion de lesignaler
auparagraphe IV,
unehypothèse
de continuitéde ces
trajectoires allégerait
lesdémonstrations,
mais onperdrait
alors parexemple
lapossibilité
de forcer à la décision avant untemps
d’arrêt (7,en posant :
Par contre, il est
possible
d’éviter quel’espace topologique
M des étatsde la nature soit souslinien : mais dans ce cas, le coût de décision
finale
bdoit être une
fonction
semi-continuein~ f ’érieurement
sur leproduit
M xZ,
et le théorème ne
s’applique
alorsqu’aux probabilités
deBayes
apriori
,usur la tribu borélienne de M
qui
sont intérieurementrégulières
par rapportaux compacts
(remarque au § III).
II.
RÉSULTATS MATHÉMATIQUES PRÉALABLES
II.1. Treillis
complet
des classes de variables aléatoires.Soit
(W, ’~, x)
un espace deprobabilité.
L’ensembleL-°~(W, ’~, x)
detoutes les
classes,
modulol’égalité
x-presque sûre, des variables aléatoiresdéfinies
sur(W, ’~, x)
et à valeurs dansR,
est un treilliscomplet [12],
1-1982.
prop.
II-4.1,
danslequel
de toutefamille quelconque
d’éléments (Xi)i~I onpeut extraire une
sous-famille finie
ou dénombrable(Xh)hEH
telle que :En
conséquence,
les théorèmes de Fatou etLebesgue relatifs
àl’espérance mathématique,
ou même àl’espérance
conditionnelle par rapport à une sous- tribu ’~’ de’~,
s’étendent des suites dénombrables auxfamilles filtrantes.
Par
exemple,
si est une famille filtrante décroissante d’élémentsquasi-intégrables
de ~~~, x)
dont l’un au moins estintégrable,
on a :Une classe X dans
L°-~(W, ’~, x)
sera dite ’~-mesurable si ellepossède
un
représentant .qui
est une variable aléatoire-mesurable,
et la classedans
L°-~(W, ’~, x)
d’une variable aléatoire x à valeurs dans la droite ache- vée f~ sera notée x ;enfin,
pour toutepartie
A deW,
ondésignera
par xA safonction
indicatrice.II.2. Relèvement d’une
sous-martingale.
Soit
(W, ’~, x)
un espace deprobabilité
et unefamille
croissantecontinue à droite de sous-tribus de indexée sur T = ~ +. Un processus
progressivement
mesurable x sur(W,
peut être considéré comme uneapplication
mesurable t, m--~x(t, w) définie
surl’espace produit
T x Wmuni de la tribu des
parties progressivement
mesurables associées à lafamille
croissante des sous-tribus
~t
pour t E T.Étant
donné alors un temps d’arrêt irelatif
lui aussi à(W,
on notera par x[z ] la
variable aléatoire rable[11 ],
IV.T49,
w -x(i(w), w).
Enparticulier :
Un processus réel
adapté [ll ],
IV. D31, dont lestrajectoires
sont toutes continues à droite ou toutes continues àgauche
estprogressivement
mesu- rable[Il ],
IV. T47.THÉORÈME. Soit une
sous-martingale définie
sur(W, ,
x, à valeurs dansl’espace L1(W, ’~h,
xO et telle quel’application
t ~--~soit continue à droite de T dans ~. Il existe alors un processus
progressivement
mesurable x
défini
sur(W, ( ~)tE.l.),
àtrajectoires
continues à droite(et
presque sûrementréglées~,
telqu’en chaque
instant t E T la variable aléatoire x[t] ]
soit un
représentant t-mesurable
de la classeX(t).
En outre, ce processusest
unique
àl’indistinguabilité [4 ],
IV.7, près
etdéfinit
unesous-martingale régulière
sur(W,
x, c’est-à-dire que pour deux temps d’arrêtquelconques
Q et i sur(W,
on a :Par rapport aux énoncés
classiques,
on ne suppose pas que les sous-tribus
’~t
pour t E T sontcomplètes,
mais par contre, le processus initial(X(t))tET
est à valeurs « classe ». La démonstration en estcependant
toutà fait
calquée
sur cellesprésentées
habituellement[12 ],
cor. 2 de la prop. IV- 5-4 et prop. IV-5-5.PROPOSITION . -
Étant
donné une suite croissante de processusprogressivement
mesurables sur(W,
àtrajectoires
continues à droite de T tels que pour tout entier naturel nl’application
t Hxn(t)
soit une
surmartingale
sur(W, ’~,
x, il existe un processus progres- sivement mesurable y sur(W,
à valeurs dansIl~ +,
àtrajectoires
continues à droite
(et
presque sûrementréglées), qui
soitindistinguable
del’enveloppe supérieure
de la suite En outre ce processus ydéfinit
unesurmartingale régulière
sur(W, ’~,
x,On trouve un énoncé similaire dans
[11 ],
VI . T 16.II.3.
Désintégration
relativement à une famille croissante de sous-tribus.THÉORÈME. Soit
(W, )
un espace mesurable surlequel
on considèreune
famille
croissante continue à droite de sous-tribus de ’~ indexéesur T = ~+. Soit par ailleurs X un
espace topologique
souslinien et~(X)
la tribu
engendrée
sur X par sesparties
sousliniennes. Considérons alors surl’espace produit (X
xW,
Q~)
une loi deprobabilité
~, dont onnotera par x
l’image
par laprojection canonique
de X x W sur W.Étant
donné une sous-tribu dénombrablementengendrée
~’ de(X),
ilexiste une
probabilité
detransition 03BE
surl’espace
mesurable(X,
para- métrée sur leproduit
T x W muni de la tribu desparties progressivement
mesurables associées à lafamille
croissante de sous-tribus et cetteprobabilité
de transitionpossède
lespropriétés
suivantes :1 ° pour toute
fonction
réelle mesurable ~p bornée oupositive
sur(X, ~’),
le processus
est
progressivement
mesurable sur(W,
x,(’~’t)tET),
Ydéfinit
une martin-gale régulière (et
est àtrajectoires
x-presque sûrementcàdlàg~ ;
2°
quels
que soient le temps d’arrêt irelatif
à(W, ()tET)
et lafonction
réelle mesurable
~r
bornée oupositive
sur(X
xW,
~’ ~~z),
lafonction
est
’~~-mesurable
surW,
et on a :c’est-à-dire que la
probabilité
de transitionw H ~ [i ~(w) _ w)
estune
désintégration
de la mesure ~, surl’espace (X
xW,
~’ ~~)
relativement à laprojection canonique
de X x W surW ;
3° une telle
probabilité
detransition ~
estunique
àl’indistinguabilité près
en tant que processusdéfini
surl’espace
deprobabilité (W, x),
indexé sur
T,
et à valeurs dansl’espace
des mesures sur(X,
4°
enfin,
si est unefamille
dénombrable defonctions
réelles mesu-rables bornées sur
(X,
on peutchoisir ~
de telle sorte que tous les processuspour i E
I,
soient àtrajectoires
continues à droite.Là encore, les sous-tribus
t
pour t E T ne sont passupposées
x-com-plètes
sur W. Par contre, ladésintégration
de la mesure 03BB n’est obtenueque sur la tribu dénombrablement
engendrée
~’.Enfin, l’espace
X estsupposé
souslinien pour que, suivant le théorème de P. A.Meyer [4 ], 111.69,
toute
probabilité
sur sa tribu borélienne soit intérieurementrégulière
par rapport aux compacts ; il en est alors de même pour touteprobabilité
sur
(X, ~(X)),
en raison de lacapacitabilité
des ensemblessousliniens [2],
§ 6,
n°9,
th. 5.Comparé
au résultatanalogue
de L. Schwartz[13 ],
le théorème ci-dessusdistingue l’espace X,
où se trouve la tribu ~’ surlaquelle
est obtenue ladésintégration,
del’espace W,
où se trouve la famille croissante des tribus~
par rapport
auxquelles
se fait le conditionnement. Cela modifie évidem-ment la
démonstration,
mais les arguments essentiels restent les mêmes : dansl’espace produit (X
xW, ir, À)
on construit une désinté-gration régulière
de laprobabilité ~,
sur la tribuengendrée
par laprojection canonique
de X x W sur X muni de la tribu relativement à la filtra-Annales de l’Institut Henri Poincaré-Section
tion où pour tout t dans T la tribu
~Jt
estengendrée
par laprojection canonique
de X x W sur W muni de la tribu Et biensûr,
c’est le théorème d’Alexandrov[12 ],
prop.1-6 . 2, qui
permet d’obtenir desprobabilités
àpartir
de fonctionspositives
additivesd’ensembles,
comme dans le théorème de Jirina[12 ],
prop. V-4 . 4 et cor.II.4. Une
propriété
deminisup.
PROPOSITION. Soit X un espace compact et une
famille
croissantede
fonctions
semi-continuesinférieurement
de X dans indexée sur unensemble J ordonné
filtrant
croissant. Alors :Le
premier
membre est évidemmentsupérieur
au second. Parailleurs,
pour tout
indice j
dansJ,
soit y~ un élément del’espace
X pourlequel :
Si y
est unpoint
adhérent à la famille filtrante on a,puisque
chacunedes fonctions ({Ji pour i E J est semi-continue inférieurement :
et par
conséquent :
ce
qui
prouvel’inégalité opposée
à celledéjà remarquée,
et doncl’égalité.
III. EXISTENCE D’UNE
STRATÉGIE
OPTIMALEDE
DÉCISION
FINALELes
hypothèses
et les notations sont celles du théorème d’existence énoncé auparagraphe
1 avec T = f~ + .Du fait que
l’espace
Z des décisions finales est de typedénombrable,
la tribu borélienne du
produit
M x Z est aussi la tribuproduit
des tribusboréliennes et de Sorte
que le
coût d’observation b est mesurable de(M
xZ,
(x)Par
ailleurs,
soit une famille dénombrable dense d’éléments del’espace CCu(Z)
de toutes les fonctions continues de Z dans R muni de latopologie
de la convergence uniforme[3 ], § 3,
n°3,
th. 1.Quel
que soit l’indice i dans l’ensemblesuivant,
est un borélien du
produit
M xZ,
de sorte que saprojection canonique Bi
sur M est une
partie
souslinienne de cet espace[2 ], § 6,
n°3,
corol. prop. 11.Si donc on note
(M)
la tribu sur Mengendrée
par lessousliniens,
toutesles fonctions
pour i E sont mesurables de
(M
xZ, ~(M)
Q~(Z))
infé-rieures
à b,
et leursapplications partielles b~(m, ~ ), quand m
parcourtM,
sont continues sur Z. Comme par
hypothèse
tous les éléments de la famille(b(m, . ))mEM
sont des fonctions semi-continues inférieurement de Z dansIl~+,
on vérifie alors que b est la bornesupérieure
de la suite dansl’espace Finalement,
en posant :il est
prouvé
que le coût d’observation b estl’enveloppe supérieure
d’unesuite croissante de
fonctions
à valeursrespectivement
dans l’inter-valle
[o, j ],
mesurables sur(M
x Z,~(M)
Q~(Z)),
et telles que toutesles fonc-
tions
partielles ), quand (j, m)
varie dans I~ xM,
sont continuessur Z.
Or étant donné un sous-ensemble dénombrable D dense dans
Z,
on apour toute fonction continue
~r
de Z dans~ ~ et pour tout nombrepositif
r :autrement
dit,
les boules fermées del’espace métrique rcu(Z) appartiennent
toutes à la tribu
engendrée
sur cet espace par lesapplications
de
rcu(Z)
dans Rquand
z parcourt Z. Comme ils’agit
d’un espace de typedénombrable,
on en déduit que sa tribu borélienne estengendrée
par ces fonctions.
Par
conséquent,
toutes lesapplications b~(m, ~ ) pour j E
sontmesurables de
(M, ~(M))
dansl’espace rcu(Z)
muni de sa tribu borélienne.C’est
pourquoi, quels
que soientl’indice j
E ~) et l’entierpositif h,
il existeune
partition
dénombrable de M en éléments de et unefamille
dénombrable
de fonctions
réelles continues surZ,
à valeurs dans l’intervalle[0, j J,
telles que, dansl’espace
desfonctions
bornées de M x Z dans R muni de la norme de la convergenceuni, f ’orme,
on ait :Les résultats ci-dessus sont à comparer aux
propriétés
desintégrandes
normales
[1 ].
Considérons maintenant sur
l’espace
mesurable(M
xQ, ~(M)
Qj~)
la mesure
qui
à toute fonction mesurable bornée ~p de ceproduit
dans Rassocie le nombre :
On notera par
P~ l’image
de cetteprobabilité
~~ par laprojection canonique
de M x SZ sur S2.
Soit u la tribu
engendrée
sur M par la famille dénombrable des sous-ensembles
Bk
pour( j, h, k)
ED’après
cequi précède,
toutes les fonc-tions
partielles b~( ~ , z) quand J, z)
varie dans I~ xZ,
sont -6-mesurablessur M.
Seulement,
en raison du théorème énoncé enII-3,
il existe surl’espace (M, ~~)
unedésintégration (t,
H de la mesure ~c~définie
ci-dessus pour la
projection canonique
de M x SZ surSZ,
relativement à lafamille
croissante continue à droite indexée sur T = ~ + des sous-tribus~t
de
~,
etpossédant
toutes lespropriétés indiquées.
En
particulier
tous les processusadaptés
sur(SZ,
pour
J, h, k)
E~l 3,
etquand j
parcourt I~ et z un sous-ensemble dénombrable dense D deZ,
peuvent êtresupposés
àtrajectoires
continues à droite. En outre,quel
que soit l’entiernaturel j
et lepoint
z deZ,
le processusest
progressivement
mesurable sur(Q, ~, PJl’
et y définit unemartingale.
Parailleurs, quel
que soit letriplet ( j,
t,cv)
de N x T x Q,la fonction
est continue de Z dans
~,
de sorte que son minimum surchaque
fermé Fde Z y est
égal
à sa borne inférieure sur un sous-ensemble dénombrable dense de F.Dans ces
conditions,
le coût moyen minimum de décisionfinale
pour l’éventualité cc~ à l’instant t est le nombre :et suivant
l’argumentation exposée
dans l’introduction(§ I),
lastratégie optimale
de décisionfinale f u
devravéri, fier :
Tout
d’abord,
remarquons qued’après
cequi précède
tous les processuspour j E
I~ sontprogressivement
mesurables sur(Q,
et donc aussileur
enveloppe supérieure.
Mais comme la suite est croissantedans on déduit de la
propriété
deminisup
énoncée en II-4 que :si bien que le coût moyen minimum de décision finale
{3
est un processusprogressivement
mesurable sur(Q,
De
plus,
pourchaque
élément(t, co)
de T xQ,
la fonctionest semi-continue inférieurement sur Z. Aussi la
correspondance
est à valeurs dans les fermés non vides de Z. Montrons que pour tout ouvert G de Z le sous-ensemble
de T x Q
appartient
à la tribu 9 desparties progressivement
mesurablesde ce
produit,
relativement à la famille croissante de sous-tribus Comme dansl’espace
métrisable Z tout ouvert est la réunion d’une suite dénombrable defermés,
il suffit en fait de prouver que pourn’importe quel
fermé F de Z :Mais un fermé dans Z est lui-même un compact, si bien que :
et cet ensemble ~ -
(F) appartiendra
effectivement à la tribu 9 si le processusest
progressivement
mesurable sur(Q,
Or cela se démontre enraisonnant exactement comme on l’a
déjà fait,
pour établir laprogressive
mesurabilité du processus
~3.
En
conséquence,
et conformément au théorème de K.Kuratowski,
C.
Ryll-Nardzewski [8 ],
lacorrespondance ~ possède
une section mesu-rable,
c’est-à-direqu’il
existe un processusprogressivement
mesurablef "~
défini sur
(Q,
et à valeurs dans(Z, ~(Z)),
vérifiant pour toutcouple (t, cv)
duproduit
T x Q :Dans ces
conditions,
soit i un temps d’arrêt sur(Q,
et g7: une fonc- tion de décision finale mesurable de(Q,
dans(Z, ~(Z)). Puisque d’après
le théorème énoncé en
II-3,
laprobabilité
detransition Vil [r] est
une désin-tégration
de la mesure ~c~ sur(M
xQ,
~~ (x) relativement à laprojec-
tion
canonique
de M x Q surQ,
on a :et par
conséquent :
Autrement
dit,
le processus est bien unestratégie optimale
de décisionfinale qui
nedépend
pas du coût d’observation a.Pour terminer ce
paragraphe,
montronsqu’il
existe un processus progres- sivement mesurable à valeurs dans ~+ et àtrajectoires
continues à droiteJ3’
sur
(S2, A,Pu, (Ft)~T), qui
ydéfinit
unesurmartingale
etqui
soit indistin-guable
du processus03B2,
de telle sorte que pour tout temps d’arrêt irelatif
à
(SZ,
on aura : ,C’est un résultat
qu’on
utilisera auparagraphe
suivant pour obtenir letemps d’arrêt
optimal
d’observation 6~.En tant
qu’enveloppes
inférieures demartingales,
lesprocessus (3~
pourdéfinissent des
surmartingales
sur(Q, ~, P/l’
Etpuisque :
ils sont aussi à
trajectoires
semi-continuessupérieurement
à droite. Prou-vons
qu’en
fait ils sont tous àtrajectoires
continues à droite. Pourcela,
étant donné un indice
arbitraire j
de N et une éventualitéquelconque
03C9dans Q à un certain instant
sET,
il suffit d’établir que pour toute suite d’éléments de Tsupérieurs
à s et convergeant vers cetinstant,
on a :Or
quel
que soit l’entiernaturel n,
il existe une décision zn dans Z pourlaquelle :
Mais on peut extraire de l’ensemble I~ une suite strictement croissante d’entiers de telle sorte, d’une
part
que :et d’autre part que la suite converge vers un certain
point
z de Z.Pour
chaque
entiernaturel h,
on a alors :Il est donc bien
prouvé
que :et la continuité à droite des
trajectoires
de tous les processus/3~
pourj
E ~i est établie.Dans ces
conditions,
l’existence duprocessus /3’
est assurée par la propo- sitionindiquée
en II-2.Remarque
auparagraphe
III. Si le coût de décision finale b est semi- continu inférieurement sur leproduit
M xZ,
pour toute fonction conti-nue 03A8
de Z dansR,
le sous-ensemble de M xZ,
Vol.
est fermé dans ce
produit.
Comme Z est un espace compact, saprojection canonique B,~
sur M est encorefermée,
de sorte que la fonctionest mesurable de
(M
xZ, ~(M)
(x)~(Z))
dans I~.Par
ailleurs,
dans le théorème dedésintégration
énoncé enII-3,
il n’estpas nécessaire que
l’espace
X soittopologique
souslinien : il suffit quel’image
de la mesure À par laprojection canonique
de X x W sur X soitintérieurement
régulière
par rapport à une classe compacte[12 ],
déf.1-6.2,
contenue dans la tribu ~ considérée sur cet ensemble X. L’existence du
système
de lois aposteriori (t, co)
Hvu(t, m)
est donc assurée sur toute sous-tribu dénombrablementengendrée
de la tribu borélienne de M dès que la mesure deBayes a priori p
sur cette dernière est intérieurementrégulière
par rapport aux compacts.En
conséquence,
les raisonnementsqui
ontpermis
d’aboutir à l’existence de lastratégie optimale
de décision finale et duprocessus (3’
peuvent êtreadaptés
aux modificationsapportées
à la fin duparagraphe
1 dansles
hypothèses
du théorèmed’existence,
defaçon
à éviter quel’espace topologique séparé
M des états de la nature soit souslinien.IV. EXISTENCE
D’UN TEMPS
D’ARRÊT
OPTIMAL D’OBSERVATION Ils’agit
maintenant de prouver l’existence d’un temps d’arrêt à" sur(Q,
tel que pour tout autre temps d’arrêt i, on ait :Seulement, quand
on a montré quef "~
était bien unestratégie optimale
de décision
finale,
il a été établi que : -c’est-à-dire
qu’en appelant
y la somme a + ilfaut
que surl’espace
deprobabilité (Q, ~,
Comme le processus
/3’
définit unesurmartingale
sur(Q, ~,
dans le cas où
[+ o~o ])
= + oo, on peutprendre
pourn’importe quel
temps d’arrêt. On admettra donc désormais que la variable aléatoire/3’ [+
oo]
estP -intégrable.
Annales de l’Institut Henri Poincaré-Section
Soit Yf l’ensemble des
parties
H de Qqui
sontP~-négligeables,
c’est-à-dire contenues dans un ensemble -mesurable de mesure
P
nulle.Quel
que soit l’instant t deT, l’ensemble rgt
desparties
de Qqui
s’écrivent :quand
A et H parcourentrespectivement ~t
et~,
est une tribu conte-nant
~t ;
en outre, la famille est croissante continue à droite. On va alors établir l’existence d’un temps d’arrêt 6 sur(Q, (t)tET)
tel que pour tout autre temps d’arrêt i on ait :En
effet,
tout temps d’arrêt 03C4 sur(Q,
en est encore un relativement à(Q,
et inversement[4 ],
IV.59,
le temps d’arrêt û relatif à(Q,
est
P,-presque
sûrementégal
à untemps
d’arrêt 6~‘ sur(Q,
Lerésultat désiré découlera donc immédiatement de celui
qu’on projette
établir.
Pour commencer, supposons que le coût d’observation a est borné.
Soit ~ l’ensemble de tous les temps d’arrêt sur
(Q,
On se pro- pose de construire un processusprogressivement
mesurable u sur(Q, ~, P,, (t)tET)
tel que :Conformément à
l’argumentation indiquée
dans l’introduction(§ I),
le temps d’arrêt â- sera alors lepremier
instantd’égalité
des processus y et u.Cependant
l’étude de ce processus u se trouvecompliquée
par le fait que lestrajectoires
du processus y ne sont pas continues àdroite ;
c’estpourquoi
cette étude de u se fera par l’intermédiaire d’un processus x,
qui
lui seraà
trajectoires
continues à droite. Demême,
l’absence de continuité àgauche
destrajectoires
des processus y et u conduit à définir $ indirecte- ment au moyen d’une suite croissante de tempsd’arrêt,
cequi
permettra d’assurer la convergence, d’une suite minimisante
Étant
donné un temps d’arrêt 03C3 sur(Q,
posons :et considérons la famille des classes
~( y [i ] ~ ~Q) quand
i parcourt~~.
Si i’ et i" sont deux éléments de
03C3,
soitg’
etg"
desreprésentants 03C3-mesu-
rables de
E(y[03C4’] y03C3)
etE(y[03C4"] y03C3) respectivement ; l’application
ide Q dans T définie par :
est encore un temps d’arrêt appartenant à et :
de sorte que la famille de classe considérée est filtrante décroissante dans le cône
positif
ded, P~).
Deplus d’après
leshypothèses
faites sur aet
[3’ [ + oo ],
il existe au moins un élément de~6,
à savoir + oo, pourlequel
la classe
correspondante E(y[+
oo] ~ ~~)
estintégrable.
Enconséquence,
et suivant le théorème de convergence monotone
indiqué
enII-1,
pour toute sous-tribu de on a dans le treilliscomplet L0 R :
Soit maintenant une suite décroissante de temps d’arrêt sur
(Q,
et p sa limite. Pour tout entier naturel n posons6n = ~n -~-1/(t2 -~-1).
Si i’ est un élément de
Jp
pourlequel ~(~3’ [i’ ] )
+ la suite des classesfi’ [T’
V(7~] ] pour n
est unesurmartingale
uniformémentintégrable [11 ], V. T21,
relative à(Q, ~, PJL’ (~T- ~ 6n)nE~),
etqui
converge vers/3’ [i’ ].
Parailleurs,
si 03C9 est une éventualité pourlaquelle
estfini,
il existe unentier tel que pour tout indice n
qui
lui estsupérieur
on a6~(cc~) ;
par
conséquent :
C’est
pourquoi,
endéfinitive, quelle
que soit la sous-tribu 8 de on adans le treillis
complet L£ :
Comme
l’inégalité
inverse estimmédiate,
il est doncprouvé
que :Ce résultat et le
précédent
serontplusieurs
fois utilisés dans cequi
suit.Ainsi,
en posant :on définit une
sous-martingale
sur(Q, d, PJL’ (t)tET)
à valeurs dans le cônepositif
ded, P~),
et la fonction t -E(X(t))
est continue àdroite. Il existe donc
(§ II-2)
un processusprogressivement
mesurable xdéfini sur
(Q, (t)tET)
et àtrajectoires
continues àdroite,
telqu’en chaque
instant t la variable aléatoire
x [t ]
soit unreprésentant t-mesurable
dela classe
X(t).
Etquitte
àremplacer
x par sapartie positive
et à le modifier. Annales de l’Institut Henri Poincaré-Section B