Contrˆ ole de l’erreur L p - Annexe : calculs r´ecursifs pour les fonctionnelles additives

2.3 Annexe : calculs r´ecursifs pour les fonctionnelles additives

3.2.1 Contrˆ ole de l’erreur L p

Enonc´e du r´esultat

Le premier résultat, donné par le Théorème 7.1 au Chapitre 7, fournit un contrôle de la norme Lp de l’erreur de l’approximation de l’espérance

conditionnelle d’une fonctionnelle additive dans les HMM. Le r´esultat en question s’applique `a des fonctions de la forme PT

t=rht(Xt−r:t). Ceci nous

permet d’obtenir des bornes pour des fonctionnelles additives de la forme (3.1) (en choisissant r = 1) aussi bien que pour des fonctions plus g´en´erales

dépendant de toute la trajectoire (en choisissant r = T ). Nous ne présentons ici que le cas r = 1 par souci de clarté - voir les chapitres 5 et 6 pour des applications à des algorithmes de type EM. Dans le cas où ST est de la forme

(3.1), ce contrôle s’écrit, pour p ≥ 2, φ N 0:T |T[ST] − φ0:T |T[ST] p ≤ √C N 1 + r T N ! _T X t=1 osc(ht)2 !1/2 , (3.6) où l’approximation φN

0:T |T[ST] est donnée par (3.3) et où C ne dépend ni

de N ni de T . On rappelle ici que nous supposons dans ce chapitre que les observations sont fixées. Dans ce cas, pour toute variable aléatoire Z, kZk_p def= E [|Z|p_]1/p _o`_{u l’espérance ne porte que sur les variables aléatoires}

simulées lors de l’étape d’approximation particulaire. Ce résultat est valable pour des fonctions {ht}Tt=1 bornées et sous certaines hypothèses données au

Chapitre 7. Nous supposons en particulier la condition de m´elange fort : ∃(σ−, σ+) ∈ R2+, ∀(x, x

) ∈ X2 , 0 < σ−≤ m(x, x0) ≤ σ+< +∞ . (3.7)

L’intérêt de cette inégalité provient de la dépendance en T /N (où T est le nombre d’observations et N le nombre de particules) de la borne supérieure. Contrairement aux résultats connus que nous présentons plus bas, la borne dépend de T et de N de fa¸con homogène : l’erreur Lp peut être contrôlée en

choisissant un nombre de particules de l’ordre de T .

La démarche adoptée pour obtenir ce résultat est donnée en Section 7.3. Elle repose sur l’oubli géométrique forward et backward de la chaˆıne de Mar- kov, conséquence de l’hypothèse (3.7). La borne Lp découle ensuite d’une

nouvelle décomposition de l’erreur : cette décomposition fait apparaˆıtre un premier terme martingale dont la norme Lp est contrôlée par des outils

classiques (voir l’inégalité de Burkholder, [Hall et Heyde, 1980, Théorème 2.10, page 23]). L’autre terme, plus complexe, est traité en utilisant une décomposition plus fine (voir la Proposition 7.2).

Les résultats donnés au Chapitre 7 contiennent également une inégalité du même type pour l’approximation donnée par l’algorithme FFBSi définie par (3.5) (la dépendance en T et en N est la même que pour le FFBS, seules les constantes changent). Ce résultat provient du contrôle de l’erreur entre les algorithmes FFBS et FFBSi qui repose à nouveau sur les propriétés d’oubli géométrique backward de la chaˆıne de Markov.

Comparaison avec les r´esultats connus

Le résultat donné par le Théorème 7.1 peut être comparé avec certains contrôles proposés dans la littérature. Bien qu’il ne soit qu’une borne supérieure, il donne un critère de choix parmi plusieurs algorithmes d’approximation particulaire.

Contrôles des méthodes de Monte Carlo séquentielles 43

Par exemple, lorsqu’il est appliqué à des fonctions de la formes (3.1) et sous des hypothèses similaires aux notres (en particulier sous l’hypothèse (3.7)), [Del Moral et Doucet, 2003, Théorème 4] prouve que l’erreur Lp du

path-space smoother v´erifie φ N,ps 0:T |0:T[ST] − φ0:T |0:T[ST] p = O T2 √ N . (3.8)

Dans ce cadre, la dépendance de la borne est explicite en T et N mais, pour un contrôle similaire à celui donné par (3.6) utilisé avec un nombre de particules de l’ordre de T , N doit être choisi dans (3.8) de l’ordre de T4_.

[Olsson et al., 2008] propose une alternative dédiée aux approximations des quantités φ0:T |T[ST] lorsque ST est une fonctionnelle additive de la forme

(3.1). Puisque nous avons

φ0:T |T[ST] = T

t=1

φ0:T |T[ht] ,

il s’agit donc d’approcher T espérances conditionnelles se rapportant aux fonctions ht, chacune ne dépendant que des deux états Xt−1 et Xt. L’idée

est alors de

i) remplacer chaque esp´erance φ_{0:T |T}[ht] par φ0:κ(t)|κ(t)[ht], o`u κ(t) def

= T ∧ (t + ∆T) et o`u ∆T > 0 (voir aussi [Kitagawa et Sato, 2001]),

ii) choisir une approximation des esp´erances φ0:κ(t)|κ(t)[ht].

[Olsson et al., 2008] applique simplement le path-space smoother pour calcu- ler une valeur approchée des espérances φ_{0:κ(t)|κ(t)}[ht]. L’estimateur proposé

est alors donn´e par

φN,lag_{0:T |T}[ST] def = T X t=1 φN,ps_{0:κ(t)|κ(t)}[ht] .

De cette fa¸con, même pour les grandes valeurs de T , le calcul des espérances φN,ps_{0:κ(t)|κ(t)}[ht], pour t T , ne souffre plus du problème de dégénérescence,

puisque le calcul se fait à l’aide des trajectoires particulaires pour lesquelles le rééchantillonnage s’arrête après l’instant κ(t). Dans le cas où ∆T = O(log T )

et avec l’hypothèse (3.7), [Olsson et al., 2008, Théorème 3.3] prouve alors que l’erreur Lp vérifie

φ N,lag 0:T |T[ST] − φ0:T |T[ST] p = O T log T √ N . (3.9)

Cette borne est meilleure que celle du path-space smoother de l’équation (3.8) mais fournit toujours un contrôle pour lequel l’exposant de T est plus élevé que celui de N .

La borne (3.6) nous permet également d’améliorer des inégalités Lp déjà

existantes pour les algorithmes FFBS et FFBSi. En effet, [Douc et al., 2011a, Théorème 5 et Corollaire 6] établissent une majoration de l’erreur Lp de la

forme φ N 0:T |T[h] − φ0:T |T[h] p ≤ C(p, T ) osc(h) √ N ,

pour n’importe quelle fonction born´ee h sur XT +1_{, o`}_{u φ}N

0:T |T[h] est l’ap-

proximation fournie par l’algorithme FFBS. [Douc et al., 2011a] donne la même inégalité pour l’algorithme FFBSi. Ces résultats sont obtenus sans supposer la condition de mélange fort (3.7) mais, la valeur de C étant dépendante de T , la borne n’est pas directement exploitable. Si (3.7) est ajoutée, [Douc et al., 2011a, Théorème 11] donne des bornes uniformes en T uniquement dans le cas des lois marginales (i.e. lorsque la fonction h ne dépend que d’un état, voir la Section 1.2), mais pas de nouveaux résultats pour des fonctions h dépendant de toute la trajectoire.

D’autre part, [Del Moral et al., 2010a] fournit, sous (3.7) un contrˆole de la forme φ N 0:T |T[h] − φ0:T |T[h] p≤ C(p, T ) √ N , (3.10) o`u φN

0:T |T[h] est l’approximation fournie par l’algorithme FFBS. C(p, T ) est

un O(T ) dans certains cas :

i) lorsque la fonction h est une fonctionnelle additive de la forme (3.1), ii) lorsque la fonction h est une fonction born´ee sur XT +1_.

(3.10) fournit donc toujours un contrˆole plus faible en T que la borne (3.6).

Dans le document Estimations pour les modèles de Markov cachés et approximations particulaires. Application à la cartographie et à la localisation simultanées. (Page 42-45)