2.3 Annexe : calculs r´ecursifs pour les fonctionnelles additives
2.3.2 Cas g´en´eral
Lorsque l’espace d’´etat n’est pas fini ou lorsqu’il contient un grand nombre d’´el´ements, il est possible de tirer profit des ´equations (2.16) et (2.17) pour d´efinir des approximations `a l’aide de m´ethodes de Monte Carlo s´equentielles. La m´ethode que nous pr´esentons ici est donn´ee dans [Del Moral et al., 2010b] et [Capp´e, 2011a]. Dans ce cas, chaque loi de filtrage φχθ,t, pour t ∈ {0, · · · , T }, est approch´ee par un nuage de particules pond´er´ees :nξtN,`, ωtN,`oN
`=1, voir
Section 3.1 pour les d´etails sur la fa¸con de produire ces particules pond´er´ees. Nous pr´esentons ´egalement en Section 5.3 un algorithme d´etaill´e combinant le calcul r´ecursif donn´e ci-dessous et la m´ethode particulaire de la Section 3.1. Pour toute fonction mesurable h sur X, la quantit´e φχt,θ[h] est approch´ee
par φN,pst,θ [h], o`u φN,pst,θ [h]def= 1 PN `=1ω N,` t N X `=1 ωN,`t h(ξtN,`) .
Le calcul r´ecursif souhait´e est alors obtenu en rempla¸cant dans (2.17), la loi φχT −1,θ par son approximation particulaire φN,psT −1,θ. Nous d´efinissons ainsi, `a chaque instant t ∈ {0, · · · , T }, une approximation ρbt,θ(ξ
N,` t ) de ρ χ t,θ(ξ N,` t ).
Nous obtenons, pour tout ` ∈ {1, · · · , N },
b ρθ,T(ξTN,`) = N X i=1 1 TS(ξ N,i T −1, ξ N,` T , YT) + 1 − 1 T b ρθ,T −1(ξT −1N,i ) × ω N,i T −1mθ(ξN,iT −1, ξ N,` T ) PN j=1ω N,j T −1mθ(ξ N,j T −1, ξ N,` T ) .
Et nous concluons en rempla¸cant dans (2.15), φχT ,θ par son approximation particulaire φN,psT ,θ et ρχT ,θ(ξTN,`) par ρbT,θ(ξTN,`), pour ` ∈ {1, · · · , N }.
Chapitre 3
Contrˆole de
l’approximation
particulaire pour le lissage
de fonctionnelles additives
(pr´eambule)
Dans ce chapitre, nous nous int´eressons au contrˆole de l’er- reur effectu´ee lorsque, dans un HMM, l’esp´erance condition- nelle d’une fonctionnelle additive d´ependant des ´etats cach´es X0:T, sachant les observations Y0:T, est remplac´ee par une
approximation particulaire. Nous proposons un contrˆole de la norme Lp de l’erreur ainsi que des in´egalit´es de d´eviation
exponentielles. Les bornes donn´ees sont valables lorsque l’ap- proximation particulaire est calcul´ee `a l’aide de diff´erents al- gorithmes propos´es dans la litt´erature. Les contrˆoles mettent en avant la d´ependance explicite des bornes en fonction du nombre d’observations et du nombre de particules utilis´ees.
Dans ce chapitre, nous proposons diff´erents types de contrˆoles pour l’er- reur commise lorsque l’esp´erance conditionnelle d’une fonctionnelle additive est approch´ee `a l’aide de m´ethodes de Monte Carlo s´equentielles. L’objectif est d’obtenir une d´ependance explicite en fonction du nombre de particules et du nombre d’observations utilis´ees.
De tels contrˆoles ont tout d’abord un int´erˆet pratique : ils permettent d’obtenir un crit`ere pour choisir le nombre de particules `a utiliser en fonction du nombre d’observations disponibles pour obtenir une pr´ecision souhait´ee. De plus, bien que ne fournissant que des bornes sup´erieures, ils constituent
un outil de comparaison entre les diff´erents algorithmes qui peuvent ˆetre uti- lis´es pour r´ealiser les approximations recherch´ees. D’autre part, ces in´egalit´es peuvent servir `a d´emontrer des th´eor`emes limites lorsque le nombre de par- ticules croˆıt vers +∞ (en choisissant par exemple un nombre de particules fonction du nombre d’observations). Enfin, ce type de majorations est indis- pensable pour d´emontrer la consistance de certains algorithmes d’estimation dans les HMM. Le cadre des fonctionnelles additives est particuli`erement adapt´e `a des algorithmes de type EM (voir les chapitres 2 et 6) ou de type gradient (utilisant une approximation du score).
Nous pr´esentons en Section 3.1 le cadre g´en´eral des m´ethodes de Monte Carlo s´equentielles ainsi que les algorithmes pour lesquels nos bornes sont ´etablies. La Section 3.2 contient notre contribution au contrˆole de l’erreur d’approximation li´ee `a ces algorithmes : nous proposons de nouvelles bornes de la norme Lp de l’erreur lorsque la quantit´e φχ0:T |T[h], d´efinie par (1.1), est
approch´ee par son approximation particulaire lorsque h est une fonction- nelle additive. Nous exposons ´egalement des in´egalit´es de d´eviation expo- nentielles. Les r´esultats de la Section 3.2 ont fait l’objet de l’article de revue [Dubarry et Le Corff, 2011], sujet du Chapitre 7.
3.1 Algorithmes consid´er´es
Nous rappelons tout d’abord le contexte dans lequel les algorithmes uti- lis´es sont mis en oeuvre. Nous consid´erons une chaˆıne de Markov cach´ee {(Xk, Yk)}k≥0 de loi initiale χ sur (X, X ) et dont les noyaux ont pour den-
sit´es m et g, voir la Section 1.2. Dans la suite de ce chapitre, nous notons, pour tout x0:T ∈ XT +1, ST(x0:T) def = T X t=1 ht(xt−1, xt) , (3.1)
o`u les fonctions {ht}Tt=1 sont born´ees sur X2 et `a valeurs dans Rd. Par la
d´efinition de la loi conditionnelle jointe donn´ee par (1.1), nous avons alors φχ0:T |T[ST] = Eχ[ST(X0:T)|Y0:T] .
Dans la suite de ce chapitre, nous omettons la d´ependance en χ, de mani`ere `
a utiliser des notations similaires `a celles du Chapitre 7. Nous travaillons ´egalement avec un jeu de donn´ees Y0:T fixe.
Cette section pr´esente diff´erents algorithmes pour approcher φ0:T |T[ST]
`
a l’aide de nuages de particules associ´ees `a des poids. On pr´esente en Sec- tion 3.1.1 un algorithme s´equentiel permettant de produire des approxi- mations des lois de filtrage {φt}Tt=0 et des lois de lissage {φu:v|s:t} pour
Contrˆoles des m´ethodes de Monte Carlo s´equentielles 37
0 ≤ s ≤ u ≤ v ≤ t ≤ T dont les d´efinitions sont donn´ees par (1.1). Cet algo- rithme est utilis´e comme ´etape interm´ediaire en Section 3.1.2 pour pr´esenter les algorithmes pour lesquels les bornes donn´ees sont valables. La mise en place de ces algorithmes n´ecessite l’introduction de quelques quantit´es :
i) Une mesure ρ sur (X, X ), telle que χ soit absolument continue par rap- port `a ρ. ρ permet de simuler les premi`eres particules `a l’instant 0. ii) Une famille de fonctions {ϑt}Tt=1 d´efinies sur X et `a valeurs dans R?+.
Les fonctions {ϑt}Tt=1 permettent d’ajuster les poids avec lesquels une
particule de l’instant t−1 est choisie pour simuler une nouvelle particule `
a l’instant t.
iii) Une famille de noyaux de Markov {Pt}Tt=1 sur X × X tels que, pour
tout x ∈ X, Pt(x, ·) admette une densit´e pt(x, ·) par rapport `a la mesure
de r´ef´erence λ, voir la Section 1.2. Le noyau Pt permet de simuler les
particules de l’instant t.