A NNALES DE L ’I. H. P., SECTION B
J EAN J ACOD
Sur le processus de vraisemblance partielle
Annales de l’I. H. P., section B, tome 26, n
o2 (1990), p. 299-329
<http://www.numdam.org/item?id=AIHPB_1990__26_2_299_0>
© Gauthier-Villars, 1990, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P., section B » (http://www.elsevier.com/locate/anihpb) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
Sur le processus de vraisemblance partielle
Jean JACOD
Laboratoire de Probabilités, Université Pierre-et-Marie-Curie,
tour n° 56, 3e étage, 4, place Jussieu, 75252 Paris Cedex 05, France
Vol. 26, n° 2, 1990, p. 299-329.
Probabilités
t1 RÉSUMÉ. - Nous proposons une définition du processus de vraisem- blance
partielle
pour dessemi-martingales générales, qui
étend la définition donnée en[10]
etqui
nous semble mieuxadaptée
auxproblèmes statistiques
«
semi-paramétriques » :
cette assertion est illustrée par diversesapplica-
tions
statistiques.
Nous montrons aussi que cette vraisemblancepartielle jouit d’agréables propriétés
d’invariance : parexemple,
elle nechange
pas si onremplace
lasemi-martingale
de base X parY = f (X), où f
est unefonction inversible de classe
C2. Finalement,
nous montrons que les résul- tats de normalitéasymptotique
de[10]
restent vrais pour cette définitionplus générale.
Mots clés : Processus de vraisemblance, vraisemblance partielle, semi-martingales, norma- lité asymptotique.
ABSTRACT. - We propose a definition of
partial
likelihood processes forgeneral semimartingales,
which extends the definitiongiven
in[10]
andis better fit for statistical
problems:
we illustrate this statement with somestatistical
applications.
We also prove thatpartial
likelihoodsenjoy
niceinvariance
properties:
forexample they
do notchange
if wereplace
thebasic
semimartingale
Xby Y = f (X)
with an invertibleC2 function f Finally,
we observe that theasymptotic normality
result of[10]
remainstrue in the
present setting.
Key words : Likelihood processes, partial likelihood, semimartingales, asymptotic norma- lity.
Classification A.M.S. : .
Annales de l’Institut Henri Poincaré - Probabilités et Statistiques - 0246-0203 299-
1. INTRODUCTION
On considère un modèle
statistique
« filtré » : :l’espace
d’état estD,
l’ensemble des
temps
est ou T= on notefft
t la tribu des événements observablesjusqu’à l’instant t,
et On s’intéresse à la valeur d’unparamètre
9 E 4.Dans le cas « idéal » la valeur de 0 détermine la
probabilité Pa,
et lerôle essentiel est
joué
par les processus de vraisemblanceLorsque
e ne détermine pascomplètement
laprobabilité,
Cox asuggéré
dans
[3]
et[4] (pour
deremplacer
les par desprocessus de
vraisemblance
partielle (PVP), quand
on est dans la situation suivante :on observe un processus « de base » X =
(Xt)t E T (disons,
à valeursréelles), plus
un ouplusieurs
autres processusauxiliaires, symbolisés
par et, de manière un peu vague, leparamètre
0 ne déterminepas
complètement
laprobabilité Pe,
mais seulement la « loi conditionnelle de X si on connaît Y ». Celapermet d’englober
certains modèles avecparamètre
nuisible : laprobabilité dépend
de 0 et d’unparamètre nuisible 11 qui
décrit lecomportement
du processus auxiliaireY;
celapermet
aussi de considérer la situationsemi-paramétrique
où on ne veutpas
préciser
la loi de Y.Exemple
1 : le cas discret. - On suppose que T = I~ et, poursimplifier, que ff 0
est la tribu triviale. C’est le cas étudié par Cox([3], [4])
etWong [17]. L’hypothèse
de base est que, pourchaque n >_ l,
leparamètre
e détermine la loi conditionnelle
dx)
deXn - Xn-l
parrapport
à~ n -1.
Si on suppose enplus
que admet ladensité (m, .)
parrapport
à la mesure deLebesgue,
Cox proposed’appeler
PVP deP~
parrapport
àPe,
relativement àX,
le processusBien
entendu,
si~ n = 6 (X p : p __ n),
les déterminent entièrement laprobabilité Pe,
et le processus( 1. 1 )
est le véritable processus de vraisem- blance deP,
parrapport
àPe.
En
général
les ne déterminent pasPe,
maisplutôt
la famillego
deprobabilités
pourlesquelles
les sont les lois conditionnelles deXn - X~ _ 1
si Cox montrecependant
que les PVP secomportent
comme les vrais processus de vraisemblance : par
exemple,
est unePe-surmartingale,
pour tout choix dePe
dans et, sous deshypothèses
convenables
(comme
la normalitéasymptotique
deslogarithmes
desPVP)
les estimateurs de « maximum de vraisemblance
partielle »
ont les mêmespropriétés
deconsistance,
normalitéasymptotique,
etc. que le maximum de vraisemblanceclassique.
DExemple
2 : les processusponctuels. -
Ici T =(~ +
et le processus de base X est un processusponctuel. L’hypothèse
essentielle est que e détermine lecompensateur Ae
deX, qui
se met sous la formeDans ce cas, Andersen et Gill
[ 1 ], Arjas
et Haara[2],
Gill[6],
Slud[14], proposent
deprendre
pour PVP deP,
parrapport
àPe
le processussuivant,
où ...Tn
...désignent
lestemps
de saut successifs de X :Là encore ce processus est la véritable vraisemblance
lorsque ( ~ t)
est lafiltration
engendrée
par X.En
général,
n’est pas lavraisemblance,
mais c’est unePe-surmartin- gale
pour touteprobabilité Po appartenant
à la classe desprobabilités
sous
lesquelles
X admetAe
pourcompensateur.
DDans cet article nous considérons la situation bien
plus générale
où leprocessus de base X est une
semi-martingale.
Les deuxexemples précédents suggèrent
que le cadre naturel où les PVP s’introduisent est celui où leparamètre
0 détermine letriplet
ie descaractéristiques
de X. Notons aussique le
problème
de la définition du PVP concerneuniquement
lescouples 8, ç
de valeurs duparamètre.
On va donc étudier le
problème
suivant :soit
X un processusadapté
sur un espace filtré
(Q, ~, ( ~ t)t > o) ;
soitégalement /
et 1’ deuxtriplets
de
caractéristiques
«potentielles
». On note ~(resp. ff’)
l’ensemble desprobabilités
sur(Q, ~)
souslesquelles
X est unesemi-martingale
decaractéristiques
1(resp. !T’) :
ce sont donc les ensembles de solutions de certainsproblèmes
demartingales (cf. [13], § III.2).
Comment définir le PVP de P’ E ff’ parrapport
à P E ff ?Sous certaines conditions
(impliquant
notamment le faitque J
et 1’déterminent P et P’ :
(cf [ 13], § III . 5)),
on saitexprimer
la vraisemblance de P’ par rapport à P en termes destriplets
~ et 1’ et du processus Xlui-même,
par une « formule de Girsanov ». L’idée essentielle consistealors à
définir,
en toutegénéralité,
le PVP de P’ E ~’ par rapport à P E g par cette formule de Girsanov(comme
dans lesexemples
1 et2).
Dans
[10]
nous avionsproposé
cettesolution,
enadoptant
lepoint
de vuesuivant : fixons P et
P’,
etappelons
Z le vrai processus devraisemblance ;
le’
triplet
!!T’ n’est défini de manièreunique qu’en
dehors d’un ensembleP’-négligeable.
Donc onpeut
considérerqu’il
n’estP-p.
s. bien défini quesur l’intervalle
stochastique { t : Zt _ > 0 ~ ,
et nous n’avions donc défini le PVPZ
que sur ce même intervalle. Cepoint
de vue est naturel si on considèrequ’on
connaît P etP’ ;
il ne l’estplus
si on considèrequ’on
saitseulement que P et P’
appartiennent
à J et ff’(en effet,
dans ce cas P etP’ sont souvent
étrangères
surchaque
tribu doncZt = 0 P-p. s.).
Ici,
nous définissons le PVPZ
sur un intervalle « maximal »dépendant
seulement de !!T et 1’ : c’est
l’objet
duparagraphe 2 ;
onpeut
noter queZ dépend
de !!T et~ ’,
et aussi de P(dans
la mesure où sonexpression
faitintervenir des
intégrales stochastiques),
mais nullement deP’,
et sonexpression
formelle nedépend
pas de P. Nous illustrons cette notion sur unexemple statistique simple
auparagraphe 3,
et leparagraphe
4 estconsacré à des
propriétés
naturelles d’invariance : on ne modifie pas le PVP si onremplace
X par un processus Y de la forme Y = p . X(intégrale stochastique
de p parrapport
àX)
ouY =, f ’ (X), lorsque
ces transforma- tions sont « inversibles ».Les
paragraphes
suivants sont de natureplus technique :
auparagraphe
5 nous montrons que l’intervalle maximal de définition du PVPZ
contientl’intervalle {
Z _> 0 ~ (Z =
véritablevraisemblance),
et quesur ce dernier
Z
coïncide avec la version donnée en[10].
Leparagraphe
6est consacré au « calcul » de Z à
partir
de Z surl’intervalle {
Z_> 0 ~ :
on
peut
dire que Z est une sorte de «projection »
de Z surl’espace
desmartingales engendré
par le processus X. Enfin auparagraphe
7 nousétendons les processus de
Hellinger partiels
et le résultat de normalitéasymptotique
de[10].
Les notations sont celles usuelles en théorie
générale ([5], [13]) : H.Yt= LHsdYs (Y
=semi-martingale)
etW*~t
=t0E
W(s, (ds, dx)
(11
= mesure aléatoire sur xE)
sont les processus.intégrale stochastique,
Y~
désigne
lapartie martingale
continue de lasemi-martingale Y,
etc. Lesvecteurs sont des matrices
colonne,
et latransposée
de A est notéeAT.
2.
DÉFINITION
DU PROCESSUS DE VRAISEMBLANCE PARTIELLEOn se donne un espace
filtré (S2, ~ ,
muni de :(2 .1 )
un processuscàdlàg adapté q-dimensionnel
X = avecXo
=0 ; (2 . 2)
deuxtriplets ~ _ (B, C, v)
et ~ ’ _(B’, C’, v’)
decaractéristiques potentielles
pourX,
relativement à une fonction de troncation fixée h surRq.
Rappelons
ce que veut dire(2.2). D’abord,
h est une fonction de IRq dans àsupport compact, bornée, égale
à l’identité sur unvoisinage
de0 ; ensuite,
est un processusprévisible q-dimensionnel
à varia-tion finie avec
Bo = 0 ;
est un processusadapté
continucroissant dans l’ensemble des matrices
symétriques
nonnégatives,
avecCo = 0 ;
v est une mesure aléatoireprévisible sur R+
x IRq vérifiantOn note ~
(resp. i7’)
l’ensemble desprobabilités
sur(Q, ~ )
faisant deX une
semi-martingale
decaractéristiques
Y(resp. ~ ’).
On se donne et P’ E ~’. Afin de définir le PVP de P’ par
rapport
àP,
il nous faut une série de notations assezlourdes,
semblables à celles duparagraphe
IV. 3 . a de[13].
D’abord,
il existe un processus continuadapté
croissant F et un proces-sus
prévisible
c = à valeurs dans l’ensemble des matricessymétri-
ques non
négatives,
tels queOn note ~ la tribu
prévisible
sur Q + ; soit latribu ~ _ ~
Q surX ~ +
PosonsOn considère une mesure
prévisible 11 qui
domine v etv’,
parexemple 11 == v + v’.
Il existe deux fonctionspositives ~-mesurables
y,y’
surfi
tellesque
Les
quantités
suivantes nedépendent P-p.
s. pas du choix de r), y,y’
dans (2. 5) :
Remarquer
que G estprévisible croissant,
et c.-à-d.excepté peut-être
aupoint
S =inf (t : Gt
=oo).
On acomme h I2 y * ~t = |h|2*
vt oo et de mêmeI
hI2 y’
* ~, le processus~ (y’ - y) h ~
* 11 est fini sur et le processus B’ - B -(y’ - y)
h * ~ est donc bien défini surLl.
Il admet alors une(P-p. s.) unique décomposition
enune somme de trois termes :
ou
sont
prévisibles,
(co)
estorthogonal
dans IRq àl’image
de IRq parl’application
linéaireassociée à la
matrice ct (co),
~ les
composantes F’i
sontprévisibles
à variation finie sur lescompacts
et les mesures
et dFt
sontétrangères
surE 1.
Un calcul
simple
montre que F’ est continu. Posons enfinLes
Li
sont des ensemblesprévisibles
de la forme U[0, Sn],
pour desn
temps
d’arrêtSn
convenables. Noter que les ensemblesLi
sont définis demanière non
ambiguë (à
un ensembleP-négligeable près) indépendamment
du choix de c,
F, y, y’, (3, ~
dans(2 . 3), (2 . 5), (2 . 7).
(2 . 9) Remarque. -
Laprobabilité
P intervient dans(2 . 3), (2 . 5)
et(2 . 7).
Si on ne veut pas la faire intervenir à ce
stade,
il faut fairel’hypothèse (plutôt anodine) qu’on
a(2.5) identiquement
avec y,y’ prévisibles (sans
aucune
hypothèse,
on atoujours (2. 5) identiquement
avec y,y’ optionnels,
mais pas forcément
prévisibles). Quant
à(2.3)
et(2.7),
ils sonttoujours
vérifiés
identiquement
avec c,optionnels,
cequi
est sans inconvénient pour la suite car ces processus interviennent commeintégrands
parrapport
à desmartingales
continues. DEncore un dernier
rappel :
on aCi = (
X~~B (le
crochet et lapartie martingale
continue Xc sont relatifs àP)
et v est leP-compensateur
de lamesure des sauts de
X,
définie parou
On a aussi
P-p.
s. :(en effet,
vient de(2 . 5) ;
admet pourP-compensateur ;
1- a est laP-projection prévisible
du processus1 DC
par laproposition
II.1 . 7 de[13]).
(2 .12)
LEMME. -Les formules
où
définissent
un processus croissantprévisibles fini 1~
sur~2,
uneP-martingale
locale
M
sur~2,
et uneP-surmartingale
localeL
sur~2 vérifiant
OL >_ -1et
Étant
donné(2.11),
la formule(2. 16)
a un sensP-p.
s. ; comme~2 = U [o, Sn]
pour destemps
d’arrêtSn,
dire que M(resp. L)
est unen
P-martingale (resp. surmartingale)
locale surL2 signifie
que les processusarrêtés
Msn (resp. Lsn)
sont desP-martingales (resp. surmartingales) locales,
et ceci ne
dépend
pas de la suite(Sn)
choisie.Noter aussi que
A, M
et L nedépendent
pas du choix de y,y’
dans(2. 5),
ni def3
dans(2. 7).
(2.17) Remarque. -
Le processus Lpeut
aussi être caractérisé ainsi : c’estl’unique P-surmartingale
locale surL2
telle que Le =~iT . Xc,
queOL
soit donné par(2. 16),
et que le processusA
de sadécomposition
deDoob-Meyer L
=M - À
soit donné par(2.13).
0Preuve de
(2 . 12). -
On a AG,
d’où lapremière
assertion. Comme F= (
Xc,i, X~°’ ~
et c~i) .
F oo surL2’
lapremière intégrale
stochas-tique
de(2.14)
définit uneP-martingale
locale continue surL2.
Pour la seconde
intégrale,
introduisons d’abord la notationsuivante,
pour toute fonction V sur
fi :
puis,
U étant défini par(2.14),
on pose etAppliquons
alors le résultat II. 1 . 36 de[13] :
siU >_ -1
et si le processus G’ est fini surL2’
alorsl’intégrale stochastique
U *(~, - v)
est bien définiesur
L2;
deplus,
c’est unemartingale
locale surL2
dont le processus de sautségale Û.
Mais a’ - H =
y’ (t, x) x~ = o ~ ~l ( ~ t ~
x dx)
AG sur E 1
par (2 . 5)
et
(2. 6),
donc G’ 4 G +2 03A3
1 =qui
est fini sur 03A31.s ,
On a ainsi montré que
M,
et doncL,
sont bien définis surE2.
Deplus
et comme un calcul
simple
utilisantles
propriétés (2. 11 )
montrequ’on
a(2. 16),
doncOL >_- -1.
LJ(2.19)
DÉFINITION. - Onappelle
processus de vraisemblancepartielle (PVP)
de P’ parrapport
àP,
relativement à X et auxtriplets (B, C, v)
et(B’, C’, v’),
le processus défini sur~2
parc’est-à-dire
Z = ~ (L) (exponentielle
de Doléans deL).
DComme
L
est uneP-surmartingale
surL2
avec~L >_- -1,
on voit queZ
’
est une
P-surmartingale
localepositive
surE2.
Si~2
= Q x I~ +, Z est doncune
P-surmartingale positive.
Remarquons
que la dénomination : PVP de P’ parrapport
àP,
est unpeu
impropre,
car laprobabilité
P’ nejoue
aucun rôle dans cette définition.On
peut
aussi noter queZ
etL2
nedépendent
pas du choix de c, r~, y,y’, P
dans(2. 3), (2. 5)
et(2. 7).
L’ensemble
E2
est l’ensemble maximal surlequel
Zpeut
être défini(car
lesintégrales stochastiques
de(2.14)
n’ont pas de sens sur soncomplémentaire).
Toutefois nous verrons auparagraphe
4qu’à
certainségards
il seraitplus
naturel de ne définir Z quesur 03A33
ouLs.
Exemple
1 . -Reprenons l’exemple
1 de l’introduction. Le cas discretse ramène au cas continu en
posant Xt=Xn
et pour n _ t n + 1.Dire
qu’on
connaît les lois conditionnelles e, n revient à se donner letriplet (Be, Ce, ve),
avec(si [t]
=partie
entière det) :
Sous
l’hypothèse
où(dx)
=(x) dx,
on a(2 . 5)
avecpour
p _ t p + 1,
à condition deprendre
r~ _ ~ Ep (dt) dx,
et aussiae
= 1 dans(2 . 4).
Comparons
alors et Ilvient 03A31=03A9 R+
dans(2. 6),
et le
premier
membre de(2. 7)
estnul,
de sorte que pour2 _ i 5. D’après
les formules du lemme(2.12),
L estpurement
discontinuet ne saute
qu’aux
instantsentiers,
tandis que les sauts sont donnés par(2.16).
On a doncde sorte que
d’après (2 . 20)
le PVP est bien donné par(1 . 1).
[JExemple
2. -Reprenons l’exemple
2 de l’introduction. Pour h choisie de sorte queh ( 1 ) = 0,
et sousl’hypothèse ( 1. 2),
letriplet
estSi alors
5=5e
et~ ’ _ ~% ~,
on vérifie aisément quef~+ (prendre
11 = dt Si
(dx), y
=ae
ety’
= dans(2 . 5))
et que a = a’ = 0 dans(2 . 4).
Les formules
(2. 13)
et(2. 14)
donnentDonc
d’après (2 . 15)
et(2 . 20)
on voit que le PVP est donné par(1 . 3).
0Pour terminer ce
paragraphe,
et afin de motiver la définition(2.19)
dansun cadre
plus général
que celui des deuxexemples ci-dessus,
supposons queP’~P (i.
e. P’ P en restriction àchaque Ft)
etappelons
Z le véritable processus de vraisemblance.Supposons qu’on
ait lapropriété
dereprésen-
tation
prévisible
pour lesP-martingales,
relativement àX,
au sens de[13],
III . 4 . 22.
D’après
la version III. 5 . 19 de[13]
du théorème deGirsanov,
ona alors
Z =
Z sur~2,
donc le P VP coihcide avec la véritable vraisemblance là où il est bien défini.Remarquons
d’ailleurs que dans ce cas, Z = 0 sur(L2)C,
et Z _ > 0 sur~5,
et = 0 P-p.
s. sur[R+.
Signalons
enfin que Slud[15]
a donné une autrejustification
de(2.19) (lorsque
X est un processusponctuel
ou unediffusion)
en faisant uneapproximation
« entemps
discret » et en montrant que les PVP de Cox(exemple
1ci-dessus)
convergent vers le PVP de(2. 19) lorsque
le pas de la subdivision tend vers 0.3. UN EXEMPLE D’APPLICATION A
L’ESTIMATION
Nous allons considérer ci-dessous un modèle très
simple ;
ils’agit
d’uncas
particulier
des modèlesproposés
par Hutton et Nelson[8] (le
processus de base est unidimensionnel etcontinu),
mais étendu à la situation où on observeégalement
des processus auxiliaires. Les résultats de ceparagraphe
sont donc des extensions immédiates de ceux de Hutton et
Nelson,
maisils montrent bien
l’usage qu’on peut
faire des PVP au sens de(2. 19),
alors que les PVP au sens de
[10]
et afortiori
les véritables processus de vraisemblance seraientinopérants.
Nous étudierons de manière
systématique
dans[12]
lesrapports
entre les PVP et lesquasi-vraisemblances
au sens de Hutton etNelson,
deGodambe et
Heyde [7]
ou de Sorensen[16].
On
prend
pour Ql’espace canonique
des fonctions sur à valeurs dans [R x[ 1, 2]
x[1,2], continues,
avec le processuscanonique (X, U, V)
etla filtration
canonique ( ~ t). L’espace
desparamètres
estO = f~,
et onobserve le
triplet (X, U, V).
Pour la valeur 8 on se donne les caractéristi- ques suivantes pour X :où f est
une fonction connue : f~-~]0, oo [.
On ne veut pas
préciser
la loi de U et V(modèle semi-paramétrique),
donc
Pe désigne
un élémentquelconque
de l’ensemble~8
desprobabilités
sous
lesquelles
X est unesemi-martingale
decaractéristiques Ce, ve).
En d’autres termes, sousPe
le processus X vérifiedXt
= 8Ut dt + , J~’ (e) Vt dWt,
W mouvement brownien linéaire.Remarquons
tout de suitequ’on
nepeut
pas(en général)
utiliser pource modèle les véritables
vraisemblances,
car :(1)
on ne connaît pascomplètement
lesPe,
engénéral ;
(2)
même si onimpose
la « trivialité » des processus U et V(par exemple identiquement),
les mesuresPe
sont deux à deuxétrangères
surmoins que la fonction
f
ne soit constante(cf
3.6-(2)
ci-dessous).
Pour construire le PVP de
P~
parrapport
àPe,
on définitLfe = ~~
et comme au
paragraphe 2,
avec(B, C, v) _ (B8, Ce, ve)
et(B’, C’,
v’B03B6, C03B6, 03BD03B6).
Il vient03A303B6/03B82
= R+ et 1-’ 03B6/03B8= 03B6 - 03B8 f(03B8) V
Donc si onpose
il vient finalement
(dans
cetteformule,
le processus Y est uneintégrale stochastique prise
par
rapport
à la mesurePe).
Supposons
alorsqu’on
calcule l’estimateur du maximum de« vraisemblance
partielle »
àl’instant t,
c’est-à-dire lepoint 8t qui
maximisela
fonction § -
Apriori, 8t
devraitdépendre
dupoint
de référence8,
mais
d’après (3 . 3)
on obtient immédiatement la valeursuivante, indépen-
dante de 8 :
Supposons
alors que lavraie
valeur duparamètre
soit 0.L’intégrale stochastique
donnant Y est alorsprise
naturellement parrapport
àPo,
etd’après (3 . 2)
onpeut
alors écrireoù
M = (U/V) . (X - B8)
est uneP03B8-martingale
de crochet( M, M> = f (0)
H. CommeHt ~
ooquand t~
oo, la loi desgrands
nombrespour les
martingales
continues entraîne que 0Pe-p.
s.quand t~
oo .Par suite les estimateurs
9t
sont consistants : .’Enfin,
enappliquant
le théorème central limite pour lesmartingales continues,
on obtient que tend en loi sousPg
vers~V’ {o, 1).
Cela donne enparticulier
la vitesse de convergence de8t
vers lavraie valeur
0,
en fonction de t.(3 . 6)
COMMENTAIRES. -(1)
SiUt = Vt =1 identiquement (ou plus généra-
lement si U et V sont
déterministes),
et sif
est constante, toutes lesmesures
Pe
sont localementéquivalentes,
etZ~~e = Z~~~
est la véritable vraisemblance : on retrouve bien entendu les résultatsclassiques
sur l’esti-mation d’un drift linéaire
quand
on observe un mouvement brownien avecdrift.
(2)
SiUt = Vt = 1,
mais sif
n’est pas constante, on obtient un casparticulier (très simple)
des résultats de[8].
Supposons
même quef
soitbijective
de [R dans]0, oo [.
Enthéorie,
laconnaissance de la
trajectoire
de Xpermet
de connaître aussi la variationquadratique ( X,
X(8)
t, donc onpeut
décider sûrement de la valeur de 8 au bout d’un temps d’observation arbitrairementpetit (cela
corres-pond
au fait que les mesuresPg
sont deux à deuxétrangères
sur~ o - ~ o +).
Dans lapratique
une telleprocédure
est évidemmentimpossi- ble,
car on nepeut
observer engénéral
latrajectoire
de Xqu’en
desinstants discrets.
Cependant,
on a alorsYt=Xt
etHt=t,
donc esteffectivement observable
(aux
instants t effectifs d’observation deX).
Bienentendu, 8t n’est
pas, pour un tfixé,
le meilleur estimateurpossible
de e.(3) Lorsque
U et V sont des processus nontriviaux,
mais suffisammentréguliers
entemps, Yt s’approxime
correctement par des sommes discrètes(de Riemann) :
on a donc un estimateurqui approche
« raisonnablement »et (et,
si on ne connaît pas les lois de U et V sousPe,
on nedispose
d’aucun autre estimateur
raisonnable).
(4)
Dans les cas(2)
et(3) ci-dessus,
on nepeut
pas utiliser le PVP au sens de[7],
carl’ensemble ~ Z~!~ > 0 ~
surlequel
ce dernier est défini estinconnu,
ou réduità ~ 0 ~ .
(5)
On voit immédiatement sur(3. 3)
quel’égalité
estfausse en
général :
le PVP ne satisfait pas lapropriété
demultiplicativité
des dérivées de
Radon-Nikodym.
4. DEUX
PROPRIÉTÉS
D’INVARIANCE DE LA VRAISEMBLANCE PARTIELLEIl est naturel de se poser la
question
de voir comment est transformé le PVPquant
onremplace
le processus de base X par un processus Y de la forme Y = p.X,
ou de la formeY = f (X) :
apriori,
onperd
de l’information et le nouveau PVP devrait être une «partie »
de l’ancien : nous étudierons ceci auparagraphe
6.Ici,
nous considérons le cas où la transformation X-Y est « inversible », c’est-à-direqu’on
a aussiX = p - 1 . Y
ouX = f 1 (Y).
Dans ce cas ondevrait trouver le même PVP pour X et Y. C’est ce que nous allons
(presque)
vérifier ci-dessous : l’invariance du PVP a lieu surL3
dans lepremier
cas,sur 03A35
dans le second.4-a. Transformation par
intégrale stochastique
Considérons d’abord un processus
prévisible
tel queY = p . X
soit bien défini(sous P),
et h’ une fonction de troncation surSoit
(BY, Cy, v~)
lescaractéristiques
deY,
etJl y
la mesure des sauts[voir (2 . 10)].
Noter que
Y~ = p . X~,
etAY=pAX.
Enparticulier
cette relation passe aux
compensateurs.
Enfinrappelons
queX = B + XÇ + h * (~ - v) + (x - h (x)) *
p, et une relation ana-logue
pour Y. Avec la notation(2. 3),
on en déduit aisément queP-p.
s. :Passons maintenant au
problème qui
nous intéresse : on se donne unprocessus
prévisible
à valeurs matricielles inversibles et telqu’il
existe un processus Y vérifiant Y = p. X sous P et sous P’. Considérons lescaractéristiques (By, C~, v~) définies
par(4 .1 ) (avec
h’ =h),
etC’y, v’Y)
définies de manièreanalogue
àpartir
de(B’, C’, v’).
Notons
Zy
le PVP de P’ parrapport
àP,
relativement à Y et auxtriplets (By, Cy, v~)
et(B’y, C’y, v’~),
et aussi~Y
les ensembles aléatoires associés par(2. 8).
(4. 2)
THÉORÈME. - Si p estinversible,
on aE3
=~3
et les processusZ
etZY
coihcident sur~3.
On n’a pas en
général ~2
=£§.Vu
le caractère naturel de lapropriété Z = ZY,
ilpeut
donc sembler souhaitable de ne définir le PVP que sur l’ensembleL3 (les exemples
duparagraphe
3 restent valides avec cettedéfinition
restrictive).
Preuve. - On utilise les notations du
paragraphe 2,
et on affecte del’exposant
« Y » celles relatives à Y et auxtriplets (BY, CY, vY), (B’Y, C’Y, v’~).
Commev ((~ + ~ ~ 0 ~) = 0
et commep est inversible,
on déduit de(4.1)
queaY = a
eta’y
= a’.Définissons la mesure par
de sorte
qu’on
a(2. 5)
pour Y avec(notation abrégée
pouryY (m, t, x) = y (~, t,
Dans(2 . 6),
on aalors
GY =G
et En utilisant encore(4.1)
et(2 . 5), puis (2 . 7),
on a
On ne sait pas si
p e
estorthogonal
àl’image
de [Rq parcY,
sauf biensûr
si $ = 0.
Parsuite,
surl’ensemble L3
on aen posant
P;
deplus
de sortequ’on
obtientEn
échangeant
les rôles de X etY,
il vientfinalement 03A33=03A3Y3.
Enfin
d’après (2. 17)
il reste à montrer que surL3’
on aet
LY~ ~
=L~.
Lapremière propriété
estévidente;
la seconde vient de(4 . 4)
et de ce queDY=D
etAY=pAX;
enfin0
4-b. Transformation fonctionnelle
Considérons d’abord une
fonction : IRq’
de classeC2,
donc .y =1 (X)
est uneP-semi-martingale
decaractéristiques
notées(BY, CY, vY),
relativement à la fonction de troncation h’ surSi V
f =
on aj(X_).XC.
On a aussi+ OX) - f {X _ ).
En utilisant la formuled’Ito,
on voit facilementqu’une
version descaractéristiques
est donnée parPassons maintenant au cas « inversible ». On suppose
que f
est unebijection
de f~q danslui-même,
de classeC2,
et on poseY = f (X).
Onconsidère les
caractéristiques (By, CY, v~)
définies par(4 . 6) (avec
h’ =h)
et
(B’y, C’y, v’Y)
définies de la même manière àpartir
de(B’, C’, v’).
Onutilise les mêmes notations
ZY, Li qu’au paragraphe
4 a.(4 . 7)
THÉORÈME. -Si f est
inversible et de classeC2,
on a et Zet
ZY
coïncident sur03A35.
Il semblerait donc naturel de définir le PVP Z en restriction
seulement,
mais alors cela excluerait lesapplications
duparagraphe
3.Preuve. - On
reprend
la preuve de(4.2)
avec les modifications suivantes : si p est défini par(4.6),
on définit parComme ’x - p
(m, t, x)
estinversible,
on a(2 . 5)
pour Y avecOn a aussi
aY = a, a’Y=a’ (car p (m, t, x) = 0 ~ x = o),
doncGY=G
etOn choisit F de sorte
qu’on
ait(2 . 3)
et aussi C’ =c’ . F,
et on définit 8’ comme 5 dans(4. 6),
avec c’ au lieu de c. Il vientSur 1:5
on a(4 . 5)
avec[iY = O , f ’ (X _ )T~ -1 (3 (noter
que ~’ _ ~ surL4’
etque V f est
inversibled’après l’hypothèse
faitesur f ).
On termine alorscomme dans la preuve du théorème
(4. 2).
D5. COMPARAISON AVEC LE PROCESSUS DE VRAISEMBLANCE PARTIELLE DE
[10]
. Nous allons vérifier que la définition
(2 . 19)
étend la version du PVP introduite en[10].
Commençons
parrappeler
comment on construit le PVP dans[10].
Leshypothèses
sont celles duparagraphe
2. On considère aussi uneprobabilité
loc loc
Q
telle queP ~ Q, P’ Q,
etqui
fait de X unesemi-martingale,
decaractéristiques
notées(B", C", v") :
onpeut
parexemple prendre Q = (P + P’)/2.
On pose On note z et z’ les processus densité de P et P’ parrapport
àQ,
avec les conventions zo _= z~ _
=1,
etD’après
le théorème de Girsanov[13],
il existe des processusprévisibles
et des fonctions
~-mesurables positives ), 1’
surfi,
tel
qu’on
aitQ-p.
s. surr n
r’ : .(les
relations entre(B, C, v),
resp.(B’, C’, v’)
et(B", C", v")
sont en faitvraie
Q-p. s.
surF,
resp. surr). D’après [10]
onpeut
définir lesQ-martingales
locales sur r suivantes :ensuite,
on pose(toujours
sur r (~r’) :
Ce sont des
Q-martingales
localespositives
sur rn r’;
deplus
sur r n r’on a les
implications
z > 0 =>F>
0 et z’ > 0 ===> z’ >0, Q-p.
s.Par
ailleurs,
notons Z le processus de vraisemblances de P’ parrapport
à P : ilpeut
être défini parZ = z’/z (rappelons
queinf zt
> 0P-p. s.);
c’estt
une
P-surmartingale positive,
et on a0393’={Z_>0}
à un ensemble P-évanescent
près (toujours
avecZo _ = 1).
Selon
[10],
onappelle
processus de vraisemblancepartielle
de P’ parrapport
àP,
relativement àX,
le processusC’est une
P-surmartingale positive
surr’,
et Z > 0 ~Z > 0
sur rB Deplus, Z
nedépend
pas de la mesure dominanteQ
choisie.Étant
donné(5.2),
onpeut
dans(2.5) remplacer
la mesure 11 par lamesure
11’
=lr ~
r" v" +l(r n r->~ . r~,
de sortequ’on
a(2 . 5)
avec(5 . 7)
LEMME. - On a r’ n F’ c~5 Q-p.
s., et on peutchoisi~ (3
de sorteque
Preuve. - Comme les
intégrales stochastiques
dans(5.3)
sont biendéfinies sur r ~1
r’,
relativement àQ,
les processus suivants sontQ-p.
s.finis sur r n r’
(utiliser [ 10]-II . ( 1. 3 6), (5 . 6)
et aussi le fait que C = C" etComme a"
= 1 => ~ == 1,
a’ = 1 sur r nr’,
on voit donc que sur cet ensembleG 2 G3 + 2 G4,
et par suiteIl reste à comparer
(2 . 7)
et(5 . 2) :
on voit que,Q-p.
s. sur~ . F = F’ = 0
et(c /3) . F = (c (y’ - y)) . F
et C’ = C. Onpeut
doncprendre
sur Enfin sur découle de ce que
Gl
etG2
sont finis sur cetensemble,
etd’après (2.8)
on a finalementQ-p.s.
0(5 . 9)
THÉORÈME. - Les processusZ définis
par(2. 19)
et(5. 5)
coïncidentP-p.
s. sur l’ensemble r n I~’’.Preuve. -
(a)
SoitZ
le processus défini par(5.5).
On a vu que c’estune
P-surmartingale positive
surr’,
avecZ _ > 0
sur r’. Onpeut
donc définir une nouvelleP-surmartingale
sur r’ parL = ( 1 /Z _ ) . Z,
dont onnote
L
=M - A
ladécomposition
deDoob-Meyer.
On aZ
= ~(L)
surr’,
donc
d’après (2. 17)
il suffit de montrer que surF’,
on a les formules(2 .1 ~) et (2 . 16) et L~ _ [3T . X~.
(b) Commençons
parÀ. D’après
la fin de la preuve de(5 . 8)
de[10],
ceprocessus est le
Q-compensateur
sur F’ du processus suivant :Par
(5 . 3),
il vient surDonc sur F H JT" :