2.3 Annexe : calculs r´ecursifs pour les fonctionnelles additives
3.2.1 Contrˆ ole de l’erreur L p
Enonc´e du r´esultat
Le premier r´esultat, donn´e par le Th´eor`eme 7.1 au Chapitre 7, fournit un contrˆole de la norme Lp de l’erreur de l’approximation de l’esp´erance
conditionnelle d’une fonctionnelle additive dans les HMM. Le r´esultat en question s’applique `a des fonctions de la forme PT
t=rht(Xt−r:t). Ceci nous
permet d’obtenir des bornes pour des fonctionnelles additives de la forme (3.1) (en choisissant r = 1) aussi bien que pour des fonctions plus g´en´erales
d´ependant de toute la trajectoire (en choisissant r = T ). Nous ne pr´esentons ici que le cas r = 1 par souci de clart´e - voir les chapitres 5 et 6 pour des applications `a des algorithmes de type EM. Dans le cas o`u ST est de la forme
(3.1), ce contrˆole s’´ecrit, pour p ≥ 2, φ N 0:T |T[ST] − φ0:T |T[ST] p ≤ √C N 1 + r T N ! T X t=1 osc(ht)2 !1/2 , (3.6) o`u l’approximation φN
0:T |T[ST] est donn´ee par (3.3) et o`u C ne d´epend ni
de N ni de T . On rappelle ici que nous supposons dans ce chapitre que les observations sont fix´ees. Dans ce cas, pour toute variable al´eatoire Z, kZkp def= E [|Z|p]1/p o`u l’esp´erance ne porte que sur les variables al´eatoires
simul´ees lors de l’´etape d’approximation particulaire. Ce r´esultat est valable pour des fonctions {ht}Tt=1 born´ees et sous certaines hypoth`eses donn´ees au
Chapitre 7. Nous supposons en particulier la condition de m´elange fort : ∃(σ−, σ+) ∈ R2+, ∀(x, x
0
) ∈ X2 , 0 < σ−≤ m(x, x0) ≤ σ+< +∞ . (3.7)
L’int´erˆet de cette in´egalit´e provient de la d´ependance en T /N (o`u T est le nombre d’observations et N le nombre de particules) de la borne sup´erieure. Contrairement aux r´esultats connus que nous pr´esentons plus bas, la borne d´epend de T et de N de fa¸con homog`ene : l’erreur Lp peut ˆetre contrˆol´ee en
choisissant un nombre de particules de l’ordre de T .
La d´emarche adopt´ee pour obtenir ce r´esultat est donn´ee en Section 7.3. Elle repose sur l’oubli g´eom´etrique forward et backward de la chaˆıne de Mar- kov, cons´equence de l’hypoth`ese (3.7). La borne Lp d´ecoule ensuite d’une
nouvelle d´ecomposition de l’erreur : cette d´ecomposition fait apparaˆıtre un premier terme martingale dont la norme Lp est contrˆol´ee par des outils
classiques (voir l’in´egalit´e de Burkholder, [Hall et Heyde, 1980, Th´eor`eme 2.10, page 23]). L’autre terme, plus complexe, est trait´e en utilisant une d´ecomposition plus fine (voir la Proposition 7.2).
Les r´esultats donn´es au Chapitre 7 contiennent ´egalement une in´egalit´e du mˆeme type pour l’approximation donn´ee par l’algorithme FFBSi d´efinie par (3.5) (la d´ependance en T et en N est la mˆeme que pour le FFBS, seules les constantes changent). Ce r´esultat provient du contrˆole de l’erreur entre les algorithmes FFBS et FFBSi qui repose `a nouveau sur les propri´et´es d’oubli g´eom´etrique backward de la chaˆıne de Markov.
Comparaison avec les r´esultats connus
Le r´esultat donn´e par le Th´eor`eme 7.1 peut ˆetre compar´e avec cer- tains contrˆoles propos´es dans la litt´erature. Bien qu’il ne soit qu’une borne sup´erieure, il donne un crit`ere de choix parmi plusieurs algorithmes d’ap- proximation particulaire.
Contrˆoles des m´ethodes de Monte Carlo s´equentielles 43
Par exemple, lorsqu’il est appliqu´e `a des fonctions de la formes (3.1) et sous des hypoth`eses similaires aux notres (en particulier sous l’hypoth`ese (3.7)), [Del Moral et Doucet, 2003, Th´eor`eme 4] prouve que l’erreur Lp du
path-space smoother v´erifie φ N,ps 0:T |0:T[ST] − φ0:T |0:T[ST] p = O T2 √ N . (3.8)
Dans ce cadre, la d´ependance de la borne est explicite en T et N mais, pour un contrˆole similaire `a celui donn´e par (3.6) utilis´e avec un nombre de particules de l’ordre de T , N doit ˆetre choisi dans (3.8) de l’ordre de T4.
[Olsson et al., 2008] propose une alternative d´edi´ee aux approximations des quantit´es φ0:T |T[ST] lorsque ST est une fonctionnelle additive de la forme
(3.1). Puisque nous avons
φ0:T |T[ST] = T
X
t=1
φ0:T |T[ht] ,
il s’agit donc d’approcher T esp´erances conditionnelles se rapportant aux fonctions ht, chacune ne d´ependant que des deux ´etats Xt−1 et Xt. L’id´ee
est alors de
i) remplacer chaque esp´erance φ0:T |T[ht] par φ0:κ(t)|κ(t)[ht], o`u κ(t) def
= T ∧ (t + ∆T) et o`u ∆T > 0 (voir aussi [Kitagawa et Sato, 2001]),
ii) choisir une approximation des esp´erances φ0:κ(t)|κ(t)[ht].
[Olsson et al., 2008] applique simplement le path-space smoother pour calcu- ler une valeur approch´ee des esp´erances φ0:κ(t)|κ(t)[ht]. L’estimateur propos´e
est alors donn´e par
φN,lag0:T |T[ST] def = T X t=1 φN,ps0:κ(t)|κ(t)[ht] .
De cette fa¸con, mˆeme pour les grandes valeurs de T , le calcul des esp´erances φN,ps0:κ(t)|κ(t)[ht], pour t T , ne souffre plus du probl`eme de d´eg´en´erescence,
puisque le calcul se fait `a l’aide des trajectoires particulaires pour lesquelles le r´e´echantillonnage s’arrˆete apr`es l’instant κ(t). Dans le cas o`u ∆T = O(log T )
et avec l’hypoth`ese (3.7), [Olsson et al., 2008, Th´eor`eme 3.3] prouve alors que l’erreur Lp v´erifie
φ N,lag 0:T |T[ST] − φ0:T |T[ST] p = O T log T √ N . (3.9)
Cette borne est meilleure que celle du path-space smoother de l’´equation (3.8) mais fournit toujours un contrˆole pour lequel l’exposant de T est plus ´elev´e que celui de N .
La borne (3.6) nous permet ´egalement d’am´eliorer des in´egalit´es Lp d´ej`a
existantes pour les algorithmes FFBS et FFBSi. En effet, [Douc et al., 2011a, Th´eor`eme 5 et Corollaire 6] ´etablissent une majoration de l’erreur Lp de la
forme φ N 0:T |T[h] − φ0:T |T[h] p ≤ C(p, T ) osc(h) √ N ,
pour n’importe quelle fonction born´ee h sur XT +1, o`u φN
0:T |T[h] est l’ap-
proximation fournie par l’algorithme FFBS. [Douc et al., 2011a] donne la mˆeme in´egalit´e pour l’algorithme FFBSi. Ces r´esultats sont obtenus sans supposer la condition de m´elange fort (3.7) mais, la valeur de C ´etant d´ependante de T , la borne n’est pas directement exploitable. Si (3.7) est ajout´ee, [Douc et al., 2011a, Th´eor`eme 11] donne des bornes uniformes en T uniquement dans le cas des lois marginales (i.e. lorsque la fonction h ne d´epend que d’un ´etat, voir la Section 1.2), mais pas de nouveaux r´esultats pour des fonctions h d´ependant de toute la trajectoire.
D’autre part, [Del Moral et al., 2010a] fournit, sous (3.7) un contrˆole de la forme φ N 0:T |T[h] − φ0:T |T[h] p≤ C(p, T ) √ N , (3.10) o`u φN
0:T |T[h] est l’approximation fournie par l’algorithme FFBS. C(p, T ) est
un O(T ) dans certains cas :
i) lorsque la fonction h est une fonctionnelle additive de la forme (3.1), ii) lorsque la fonction h est une fonction born´ee sur XT +1.
(3.10) fournit donc toujours un contrˆole plus faible en T que la borne (3.6).