• Aucun résultat trouvé

Echantillonneur de Gibbs

4.2 Algorithmes de simulation

4.2.1 Echantillonneur de Gibbs

L’´echantillonneur de Gibbs a ´et´e introduit par les fr`eres Geman en 1984 dans le contexte de la reconstruction d’images [44]. Cette m´ethode repose sur l’utilisation des lois conditionnelles totales, selon une terminologie employ´ee dans [10], et d’un balayage de l’ensemble des sites.

Principe

On consid`ere un sous-ensemble T de S. L a loi π peut se d´ecomposer selon le sch´ema :

π(z) = πT(zT|zT)πT(zT) (4.35) L e principe de l’´echantillonneur de Gibbs est de substituer la valeur en T par une variable simul´ee selon la loi conditionnelle πT(.|zT). On dit alors que l’on a relax´e T . A chaque ´etape, la transition de z vers z est la suivante :

zT = zT

zT ∼ πT(.|zT) (4.36)

Le noyau de transition associ´e a donc pour expression :

K(z, dz) = πT(zT |zT)µT(dzT zT(dzT) (4.37)

Il est ais´e de v´erifier que la loi π est bien invariante par cette transition. En effet, pour tout A∈ E :  E π(z)K(z, A)µ(dz) =  E π(zT, zT)  A πT(zT |zT)δzT(dzT)µT(dzT )µ(dz) =  E  A π(zT, zT)πT(zT |zT)δzT(dzT)µT(dzT )µ(dz) =  E  A π(zT, zT)πT(zT|zT)δzT(dzT)µT(dzT)µ(dz) =  A π(zT , zT)  E πT(zT|zT)δzT(dzT)µT(dzT)µ(dz) =  A π(z)µ(dz) = π(A)

Cependant, ce noyau de transition n’assure pas l’irr´eductibilit´e de la chaˆıne, puis- qu’une partie du vecteur n’est pas relax´ee. C’est pour cela qu’il est n´ecessaire de

visiter s´equentiellement l’ensemble des sites. On a effectu´e un cycle lorsque chacun des sites a ´et´e relax´e au moins une fois. Soit (T1, . . . , Tp) une partition de S, le

noyau de transition s’´ecrit :

K(z, dz) =

p



i=1

πTi(zTi|zT1, . . . , zTi−1, zTi+1, . . . , zTpTi(dzTi) (4.38)

Au i-`eme balayage, on relaxe le vecteur zTi suivant la loi conditionnelle appropri´ee. Chacune de ces transitions garantit l’invariance de π, il est ais´e de v´erifier en reprenant le calcul pr´ec´edent qu’il en est de mˆeme pour le noyau compos´e 4.38. Il existe plusieurs strat´egies de balayage : la plus simple consiste `a visiter les parties Ti dans un ordre fixe et d´etermin´e. On peut d’ailleurs remarquer que les mˆemes r´esultats d’ergodicit´e sont valables si certains sites sont visit´es plusieurs fois au cours d’un mˆeme cycle. De mani`ere plus g´en´erale, il est possible de choisir al´eatoirement les sites `a relaxer. La convergence est assur´ee d`es que le balayage choisi permet de visiter chaque site une infinit´e de fois [10]. On parle alors de balayage al´eatoire, par rapport au balayage syst´ematique. Une derni`ere variante est possible : on peut tirer `a chaque cycle une origine de mani`ere al´eatoire, puis visiter les sites de mani`ere d´eterministe `a partir de cette origine.

La mise en œuvre la plus simple de l’´echantillonneur de Gibbs consiste `a ne relaxer qu’un site `a la fois. L e noyau de transition de l’´equation 4.38 s’´ecrit alors :

K(z, dz) =

n



i=1

πi(zi|z1, . . . , zi−1 , zi+1, . . . , zn)ν(dzi) (4.39)

Nous allons voir cependant par la suite que dans certaines situations, il peut ˆetre plus int´eressant de regrouper les sites.

Pour r´esumer, remarquons que l’utilisation de l’´echantillonneur de Gibbs ne requiert que la connaissance des lois conditionnelle totales. En revanche, il sup- pose que l’on puisse simuler selon ces lois conditionnelles, ce qui explique que cet algorithme ne soit employ´e que dans certains cas particuliers o`u celles-ci ont une expression simple. C’est notamment le cas des champs de Markov (cf. an- nexe C). Cependant, il est ´egalement possible d’utiliser l’´echantillonneur de Gibbs en combinaison avec l’algorithme de Metropolis-Hastings (cf. paragraphe 4.2.2). Nous avons insist´e dans cette pr´esentation sur l’application de l’´echantillonneur de Gibbs aux simulations spatiales. La mˆeme technique peut ˆetre utilis´ee lorsque le vecteur Z regroupe plusieurs variables diff´erentes, typiquement l’´etat du sys- t`eme et les param`etres du mod`ele. On simule ainsi tour `a tour conditionnellement chaque composante du mod`ele.

La figure 4.1 montre la trajectoire d’une chaˆıne g´en´er´ee par l’´echantillonneur de Gibbs, dans le cas d’une loi bivariable. On remarque notamment que les transi- tions ne peuvent avoir lieu que le long des axes, puisqu’`a chaque ´etape seule une coordonn´ee est relax´ee. Ceci explique que dans certains cas particuliers, l’irr´educ-

z z 1 2 z z’ π

Fig. 4.1 – Transitions dans l’espace d’´etats g´en´er´ees par l’´echantillonneur de Gibbs. La loi π, bivariable, est repr´esent´ee en lignes de niveau. z est l’´etat obtenu en partant de z apr`es 4 cycles.

tibilit´e de la chaˆıne puisse ˆetre mise en d´efaut : c’est le cas notamment si l’espace E n’a pas la forme d’un espace produit.

Strat´egies de groupement par blocs

Afin d’´etudier l’int´erˆet de regrouper les sites `a chaque relaxation, nous ´etudions le cas particulier d’une loi gaussienne. En effet, un certain nombre de r´esultats th´eoriques [98, 95, 97, 41], que nous reprenons, existent en ce qui concerne la vitesse de convergence de l’algorithme. Ces r´esultats permettent d’avoir une id´ee de l’impact d’un groupement par blocs dans des situations plus g´en´erales.

Les d´etails sont report´es en annexe B. Le r´esultat important est que l’´echan- tillonneur de Gibbs peut ˆetre vu comme une it´eration stochastique de matrice de transition B :

Z = BZ + W (4.40)

o`u W est un vecteur gaussien. L’expression de la matrice B est donn´ee en annexe B.

Il existe un parall`ele ´evident entre les it´erations stochastiques de ce type et les it´erations lin´eaires du point fixe, pour lesquelles on sait qu’une condition n´ecessaire

et suffisante de convergence est ρ(B) < 1, o`u ρ(B) est le rayon spectral de la matrice B. On peut montrer que cette mˆeme condition est ´egalement n´ecessaire et suffisante dans le cas d’it´erations stochastiques. De plus, le caract`ere sym´etrique d´efini positif de la matrice de covariance C entraˆıne automatiquement ρ(B) < 1. Une preuve de ces r´esultats est pr´esent´ee dans [41].

Ainsi, il apparaˆıt que le param`etre qui gouverne la vitesse de convergence de l’´echantillonneur de Gibbs est le rayon spectral ρ(B).

Dans [97] et [41], plusieurs strat´egies de groupement par blocs et de visite des sites sont ´etudi´ees ; voici en substance les principales conclusions en ce qui concerne les vitesses de convergence (ou ce qui est ´equivalent la valeur du rayon spectral) :

– le groupement par blocs l’emporte sur la strat´egie consistant `a relaxer chaque site s´equentiellement [41],

– le groupement est d’autant plus efficace qu’il r´eunit les variables corr´el´ees, de telle sorte que la corr´elation entre des variables de deux blocs diff´erents diminue [41],

– si la matrice de covariance inverse est tridiagonale par blocs, alors une visite d´eterministe des blocs est plus efficace qu’une visite al´eatoire (th´eor`eme 5 et son corollaire 1 de [97]),

– si toutes les corr´elations partielles de la matrice de covariance sont positives, alors une visite d´eterministe des blocs est plus efficace qu’une visite al´eatoire (th´eor`eme 6 de [97]).