Echantillonnage de Gibbs ´

2.6 Conclusion

3.1.3 Echantillonnage de Gibbs ´

a savoir l’´echantillonneur de Gibbs.

3.1.3 Echantillonnage de Gibbs^´

L’algorithme de Metropolis-Hastings peut présenter des difficultés à explorer conve-nablement le support de la loi cible. Ces difficultés sont d’autant plus marquées lorsque la loi est multidimensionnelle car le nombre d’échantillons nécessaires pour avoir une cou-verture suffisante du support est alors très important. L’algorithme d’échantillonnage

de Gibbs est particulièrement adapté à la simulation de lois multidimensionnelles. Pour simuler suivant la loi cible, l’échantillonneur de Gibbs exploite ses distributions condi-tionnelles si elles existent. Pour résumer, l’algorithme d’échantillonnage de Gibbs est utilisé pour simuler π(x) quand :

1. x admet une d´ecomposition de la forme :

x = (x₁, . . . , x_N), (3.6) 2. les lois conditionnelles

π_i(x_i|x−i) (3.7)

sont simulables facilement, avec la notation x−i = (x1, x2, . . . , xi−1, xi+1, . . . xN) et π_i(x_i|x−i) d´esigne la densit´e conditionnelle de x_i sachant x−i.

L’algorithme est pr´esent´e dans le tableau 3.2.

Schéma de l’algorithme d’échantillonnage de Gibbs 1. itération t = 0, initialiser x(0) ∼ π0(x),

2. it´eration t, tirer

x₁^(t+1) ∼ π1(x₁|x2^(t), . . . , x_N^(t)) x^(t+1)₂ ∼ π2(x₂|x^(t+1)1 , x^(t)₃ . . . , x^(t)_N) .. . x^(t+1)_i ∼ πi(xi|x^(t+1)1 , . . . , x^(t+1)_i−1 , x^(t)_i+1. . . , x^(t)_N) .. . x^(t+1)_N ∼ πN(x_N|x^(t+1)1 , . . . , x^(t+1)_{N −1}) 3. t← t + 1 et aller en (2).

Table 3.2 – ´Echantillonneur de Gibbs.

L’échantillonneur de Gibbs fut introduit par Geman et Geman [GG84] pour le trai-tement d’image, puis généralisé à une variété de problèmes conventionnels en Statistique par Gelfand et Smith [GS90]. L’algorithme de Gibbs est décrit en détails dans le livre de Robert [Rob96, paragraphe 5]. Pour une description simple et rapide, on pourra se reférer à Casella et George [CG92].

Remarques

– L’échantillonneur de Gibbs nécessite la connaissance et la possibilité d’échantillonner suivant les lois conditionnelles au contraire de l’algorithme MH.

M´ethodes MCMC

– Seules les lois conditionnelles sont utilisées pour la simulation. Donc pour un problème de grande dimension, toutes les simulations sont univariées. En fait, on verra dans le paragraphe qui suit que les composantes x_i ne sont pas forcément scalaires.

– À l’inverse de l’algorithme MH, ici tous les échantillons simulés sont acceptés (taux d’acceptation=1). L’échantillonneur de Gibbs est la composition de N algorithmes MH avec des probabilités d’acceptation uniformément égales à 1.

– Le schéma de simulation de l’algorithme de Gibbs est, par construction, multidi-mensionnel. Cet algorithme est donc seulement applicable aux modèles comportant au moins deux variables aléatoires. Dans certains cas, il est nécessaire de considérer et de simuler des variables artificielles pour l’implantation.

– Comme nous le verrons plus tard, l’échantillonneur de Gibbs est particulièrement bien adapté aux modèles hiérarchiques.

´

Echantillonnage par blocs, compl´etion, marginalisation

Nous avons présenté l’échantillonneur de Gibbs comme un algorithme consistant en la simulation de N lois univariées pour générer un paramètre N -dimensionnel. Dans certains cas, l’algorithme peut être rendu plus efficace en échantillonnant conjointement plusieurs variables, c’est l’échantillonnage par blocs. Par exemple, quand deux compo-santes sont fortement corrélées dans la loi cible π, le mélange peut être lent en utilisant une mise à jour s’effectuant coordonnée par coordonnée. Échantillonner ces deux com-posantes corrélées de fa¸con jointe dans un seul bloc peut alors améliorer le mélange. De fa¸con générale, l’échantillonnage par blocs permet d’accélérer la convergence de l’algo-rithme, surtout quand l’on traite des variables de grandes dimensions.

La simulation peut aussi être facilitée par la complétion du modèle qui consiste à introduire des variables supplémentaires. On dit que la densité g est une complétion de f si f est une loi marginale de g. L’intérêt d’une complétion du modèle est que les lois conditionnelles de g sont parfois plus simples à simuler que celles de f . C’est souvent le cas dans les modèles bayésiens hiérarchiques. Cette complétion peut être naturelle, cela signifie que les variables introduites ont un sens physique et on parle de variables de complétion. Un exemple est un modèle avec des données manquantes. La complétion peut aussi être artificielle, au sens où les variables rajoutées ne sont qu’utilitaires et n’ont pas de signification physique. Elles servent alors uniquement à simplifier la simulation des variables d’intérêt : on parle de variables auxiliaires. De tels algorithmes sont développés dans cette thèse comme on le verra dans la partie sur l’inférence des modèles de mélange de processus de Dirichlet (paragraphe3.2).

Enfin, dans certaines situations, le mélange dans l’échantillonneur de Gibbs peut être rendu plus efficace en marginalisant certaines variables. Ce sont les méthodes mar-ginales dites aussi algorithmes de Gibbs collapsés. Elles reposent sur la marginalisation analytique d’un ou de plusieurs paramètres du modèle. Ces paramètres pouvant être des paramètres de nuisance ou des variables d’intérêt. Si les variables marginalisées sont de grande dimension, le mélange peut être plus efficace puisque l’espace des paramètres est alors réduit de fa¸con drastique.

Nous verrons des exemples de ces trois types d’´echantillonneurs dans le paragraphe

Remarque 12. On souligne qu’il existe des algorithmes MCMC dits hybrides. Ce sont des algorithmes utilisant simultanément des étapes d’échantillonnage de Gibbs et des étapes de l’algorithme de Metropolis-Hastings. Leur utilisation est motivée par le fait que dans l’échantillonnage de Gibbs, certaines lois conditionnelles peuvent être impossibles `

a simuler. On peut donc remplacer chaque étape i où une simulation suivant la loi conditionnelle π_i(x_i|x−i) est impossible par une étape MH. Les méthodes que nous avons développées pour la reconstruction des images TEP utilisent ce principe (chapitres 4 et

5).

Dans le document Modélisation stochastique de processus pharmaco-cinétiques, application à la reconstruction tomographique par émission de positrons (TEP) spatio-temporelle (Page 76-79)

2.6 Conclusion

3.1.3 Echantillonnage de Gibbs ´

3.1.3 Echantillonnage de Gibbs´

´

Echantillonnage par blocs, compl´etion, marginalisation

3.1.3 Echantillonnage de Gibbs^´