Cas général - Annexe : calculs récursifs pour les fonctionnelles additives

2.3 Annexe : calculs r´ecursifs pour les fonctionnelles additives

2.3.2 Cas g´en´eral

Lorsque l’espace d’état n’est pas fini ou lorsqu’il contient un grand nombre d’éléments, il est possible de tirer profit des équations (2.16) et (2.17) pour définir des approximations à l’aide de méthodes de Monte Carlo séquentielles. La méthode que nous présentons ici est donnée dans [Del Moral et al., 2010b] et [Cappé, 2011a]. Dans ce cas, chaque loi de filtrage φχ_θ,t, pour t ∈ {0, · · · , T }, est approchée par un nuage de particules pondérées :nξ_tN,`, ω_tN,òN

`=1, voir

Section 3.1 pour les détails sur la fa¸con de produire ces particules pondérées. Nous présentons également en Section 5.3 un algorithme détaillé combinant le calcul récursif donné ci-dessous et la méthode particulaire de la Section 3.1. Pour toute fonction mesurable h sur X, la quantité φχt,θ[h] est approchée

par φN,ps_t,θ [h], o`u φN,ps_t,θ [h]def= 1 PN `=1ω N,` t N X `=1 ωN,`_t h(ξ_tN,`) .

Le calcul récursif souhaité est alors obtenu en rempla¸cant dans (2.17), la loi φχ_{T −1,θ} par son approximation particulaire φN,ps_{T −1,θ}. Nous définissons ainsi, à chaque instant t ∈ {0, · · · , T }, une approximation ρbt,θ(ξ

N,` t ) de ρ χ t,θ(ξ N,` t ).

Nous obtenons, pour tout ` ∈ {1, · · · , N },

b ρθ,T(ξ_TN,`) = N X i=1 1 TS(ξ N,i T −1, ξ N,` T , YT) + 1 − 1 T b ρθ,T −1(ξ_{T −1}N,i ) × ω N,i T −1mθ(ξN,iT −1, ξ N,` T ) PN j=1ω N,j T −1mθ(ξ N,j T −1, ξ N,` T ) .

Et nous concluons en rempla¸cant dans (2.15), φχ_{T ,θ} par son approximation particulaire φN,ps_{T ,θ} et ρχ_{T ,θ}(ξ_TN,`) par ρ_bT,θ(ξTN,`), pour ` ∈ {1, · · · , N }.

Chapitre 3

Contrˆole de

l’approximation

particulaire pour le lissage

de fonctionnelles additives

(pr´eambule)

Dans ce chapitre, nous nous intéressons au contrôle de l’erreur effectuée lorsque, dans un HMM, l’espérance conditionnelle d’une fonctionnelle additive dépendant des états cachés X0:T, sachant les observations Y0:T, est remplacée par une

approximation particulaire. Nous proposons un contrôle de la norme Lp de l’erreur ainsi que des inégalités de déviation

exponentielles. Les bornes données sont valables lorsque l’approximation particulaire est calculée à l’aide de différents algorithmes proposés dans la littérature. Les contrôles mettent en avant la dépendance explicite des bornes en fonction du nombre d’observations et du nombre de particules utilisées.

Dans ce chapitre, nous proposons différents types de contrôles pour l’erreur commise lorsque l’espérance conditionnelle d’une fonctionnelle additive est approchée à l’aide de méthodes de Monte Carlo séquentielles. L’objectif est d’obtenir une dépendance explicite en fonction du nombre de particules et du nombre d’observations utilisées.

De tels contrôles ont tout d’abord un intérêt pratique : ils permettent d’obtenir un critère pour choisir le nombre de particules à utiliser en fonction du nombre d’observations disponibles pour obtenir une précision souhaitée. De plus, bien que ne fournissant que des bornes supérieures, ils constituent

un outil de comparaison entre les différents algorithmes qui peuvent être uti- lisés pour réaliser les approximations recherchées. D’autre part, ces inégalités peuvent servir à démontrer des théorèmes limites lorsque le nombre de particules croˆıt vers +∞ (en choisissant par exemple un nombre de particules fonction du nombre d’observations). Enfin, ce type de majorations est indis- pensable pour démontrer la consistance de certains algorithmes d’estimation dans les HMM. Le cadre des fonctionnelles additives est particulièrement adapté à des algorithmes de type EM (voir les chapitres 2 et 6) ou de type gradient (utilisant une approximation du score).

Nous présentons en Section 3.1 le cadre général des méthodes de Monte Carlo séquentielles ainsi que les algorithmes pour lesquels nos bornes sont établies. La Section 3.2 contient notre contribution au contrôle de l’erreur d’approximation liée à ces algorithmes : nous proposons de nouvelles bornes de la norme Lp de l’erreur lorsque la quantité φχ_{0:T |T}[h], définie par (1.1), est

approchée par son approximation particulaire lorsque h est une fonctionnelle additive. Nous exposons également des inégalités de déviation exponentielles. Les résultats de la Section 3.2 ont fait l’objet de l’article de revue [Dubarry et Le Corff, 2011], sujet du Chapitre 7.

3.1 Algorithmes consid´er´es

Nous rappelons tout d’abord le contexte dans lequel les algorithmes uti- lisés sont mis en oeuvre. Nous considérons une chaˆıne de Markov cachée {(Xk, Yk)}k≥0 de loi initiale χ sur (X, X ) et dont les noyaux ont pour den-

sit´es m et g, voir la Section 1.2. Dans la suite de ce chapitre, nous notons, pour tout x0:T ∈ XT +1, ST(x0:T) def = T X t=1 ht(xt−1, xt) , (3.1)

où les fonctions {ht}Tt=1 sont bornées sur X2 et à valeurs dans Rd. Par la

d´efinition de la loi conditionnelle jointe donn´ee par (1.1), nous avons alors φχ_{0:T |T}[ST] = Eχ[ST(X0:T)|Y0:T] .

Dans la suite de ce chapitre, nous omettons la d´ependance en χ, de mani`ere `

a utiliser des notations similaires à celles du Chapitre 7. Nous travaillons également avec un jeu de données Y0:T fixe.

Cette section pr´esente diff´erents algorithmes pour approcher φ_{0:T |T}[ST]

a l’aide de nuages de particules associées à des poids. On présente en Sec- tion 3.1.1 un algorithme séquentiel permettant de produire des approximations des lois de filtrage {φt}Tt=0 et des lois de lissage {φu:v|s:t} pour

Contrôles des méthodes de Monte Carlo séquentielles 37

0 ≤ s ≤ u ≤ v ≤ t ≤ T dont les définitions sont données par (1.1). Cet algorithme est utilisé comme étape intermédiaire en Section 3.1.2 pour présenter les algorithmes pour lesquels les bornes données sont valables. La mise en place de ces algorithmes nécessite l’introduction de quelques quantités :

i) Une mesure ρ sur (X, X ), telle que χ soit absolument continue par rapport à ρ. ρ permet de simuler les premières particules à l’instant 0. ii) Une famille de fonctions {ϑt}Tt=1 définies sur X et à valeurs dans R?+.

Les fonctions {ϑt}Tt=1 permettent d’ajuster les poids avec lesquels une

particule de l’instant t−1 est choisie pour simuler une nouvelle particule `

a l’instant t.

iii) Une famille de noyaux de Markov {Pt}Tt=1 sur X × X tels que, pour

tout x ∈ X, Pt(x, ·) admette une densit´e pt(x, ·) par rapport `a la mesure

de r´ef´erence λ, voir la Section 1.2. Le noyau Pt permet de simuler les

particules de l’instant t.

Dans le document Estimations pour les modèles de Markov cachés et approximations particulaires. Application à la cartographie et à la localisation simultanées. (Page 35-38)