• Aucun résultat trouvé

Théorie L 2

Dans le document Chaînes de Markov Jean Bérard (Page 120-125)

5.6.1 Généralités

Dans toute cette partie p désigne un noyau ergodique de loi invariante ν. On rappelle que l'action dep sur les fonctions envoie L2(ν) dans lui-même, et que l'ad-joint de p pour le produit scalaire de L2(ν) n'est autre que le noyau renversé dans le temps pˆ. Dans ce contexte, la distance entre deux fonctions est mesurée par la norme deL2(ν), i.e. ||f−g||2:= P

x∈S(f(x)−g(x))21/2, et la convergence vers la loi stationnaire ν pourra par exemple être mesurée sur les fonctions de L2(ν), par

||pnf−ν(f)||2, qui n'est autre que l'écart-type def(Xn) sousPν.

On peut également dénir une distanceL2entreµpnetνpar la formuleP

x∈S|µ(x)/ν(x)−

1|2ν(x)(avec la convention 0/0 = 1), mais, dans le cas oùS est inni, il se peut que cette distance prenne une valeur innie. Notez que le fait que µ/ν (vue comme une

fonction surS) se trouve dans L2(ν)signie que µ(vue comme une fonction surS) se trouve dansL2(1/ν).

On peut alors poser d2(t) := supx∈S P

y∈S|pt(x, y)/ν(y)−1|2ν(y)1/2

, et l'on vérie que, par convexité, pour toute loi initialeµ, P

x∈S|µpt(x)/ν(x)−1|2ν(x)1/2

≤ d2(t).

Par ailleurs, on voit que l'on a l'inégalité

2dV T(µ, ν) =X

x∈S

ν(x)|µ(x)/ν(x)−1| ≤ X

x∈S

|µ(x)/ν(x)−1|2ν(x)

!1/2

. D'autre part, on vérie quepˆest, comme p, ergodique de loi invarianteν, et que (µp)/ν = ˆp(µ/ν). Par conséquent, la convergence de µpn vers ν peut être analysée dans notre contexte en étudiant la convergence dansL2(ν) de l'action de pˆn sur les fonctions. Nous nous restreindrons donc à aborder le problème du point de vue de l'action sur les fonctions.

On se rappelle au passage que la suite (||pnf −ν(f)||2)n≥0 est décroissante du fait que la norme de l'action dep de L2 dans lui même est de norme ≤1.

5.6.2 Formes de Dirichlet

La présentation de cette section est calquée sur celle de Jerrum [27], elle-même reprenant un argument dû à Mihail.

Etant donné un noyau pergodique, et ν sa loi invariante, on dénit la forme de Dirichlet associée àp comme la forme quadratique suivante sur L2(ν):

Ep(f, f) = 1 2

X

x,y∈S

ν(x)p(x, y)(f(y)−f(x))2.

Il s'agit d'une forme quadratique sur L2(ν) (on vérie facilement qu'elle est bien dénie, du fait quepf etf sont dansL2(ν)).

La forme de Dirichlet représente donc une mesure de la variation locale de f : partant d'un élément deS choisi selon la loi invarianteν, on mesure dansL2 la variation def lorsque l'on fait un pas de la chaîne.

On vérie queEp(f, f) =Epˆ(f, f).

Partant d'un noyau p, nous allons considérer le noyau ppar. sur S (par. pour paresseux) déni par ppar.(x, y) := (1/2)p(x, y) si x 6= y, et ppar.(x, x) := 1/2 + 1/2p(x, x). On vérie queppar.est également ergodique, et possède égalementν pour loi invariante. En outre,ppar. est réversible si et seulement sip l'est.

Exercice 164 Partant d'une chaîne de Markov de noyau de transitionp, comment fabriquer une chaîne de noyau de transitionppar.?

Nous allons prouver le résultat suivant :

En utilisant l'identité (5.5) établie plus haut, on en déduit que

||ppar.f||22= (1/4) Un petit coup d'inégalité de Cauchy-Schwarz, et nous obtenons que

||ppar.f||22 = (1/4)

soit encore, en utilisant l'invariance deν parppour le membre de droite,

||f||22 = (1/2) X

x,y∈S

f(x)2ν(x)p(x, y) + (1/2) X

x,y∈S

ν(x)p(x, y)f(y)2,

soit nalement

||f||22= (1/2) X

x,y∈S

(f(x)2+f(y)2)ν(x)p(x, y). (5.7) En soustrayant (5.7) de (5.6), nous obtenons nalement que

||f||22− ||ppar.f||22≥(1/2)Ep(f, f).

Ce résultat montre en particulier que la suite ||(ppar.)nf −ν(f)||22

n≥1 est dé-croissante. De manière plus intéressante, notons que, si l'on dispose d'une inégalité du typeEp(f, f)≥γ||f−ν(f)||22, oùγ >0on obtient des bornes exponentielles quantita-tives sur la convergence vers la stationnarité. Une telle inégalité est appelée inégalité de Poincaré ; elle borne la variationL2 globale d'une fonction, soit ||f −ν(f)||22, en termes d'une somme de variations L2 locales, soit Ep(f, f). Nous verrons plus loin comment obtenir des inégalités de Poincaré dans certaines situations.

Dans le cas où S est ni, une telle inégalité existe toujours, car on vérie facile-ment que, siEp(f, f) = 0,f doit être une fonction constante, et donc on doit avoir f =ν(f). On conclut ensuite en utilisant l'homogénéité de Ep(f, f) et||f−ν(f)||22 pour se ramener à la sphère unité deL2(ν), et un argument de compacité.

Nous verrons plus bas des techniques permettant de prouver ce type d'inégalité dans certains cas. Si cette inégalité vous paraît mystérieuse, vous pouvez noter que, en considérant une version en temps continu de la même chaîne, possédant exactement le même noyau de transision, et des taux de sauts constants égaux à 1, la forme de Dirichlet apparaît de manière plus naturelle : on a en eet l'identité

d

dt||ptf−ν(f)||22 =−2Ep(f, f),

qui suggère, par ailleurs, que l'inégalité de la proposition ci-dessus perd un facteur 4 par rapport à ce qui devrait être l'ordre de grandeur correct, un facteur 2 s'expliquant par le caractère paresseux de la chaîne considérée, un autre facteur 2 demeurant inexpliqué.

5.6.3 Le cas réversible

Rappelons la propriété fondamentale des chaînes réversibles, en nous plaçant dans le cas ergodique : siν désigne la loi invariante, l'action depde L2(ν)dans lui-même est autoadjointe. Cette propriété fait des chaînes réversibles un cadre intéressant pour l'utilisation des méthodes spectrales. Notons que, si S est un ensemble ni, cette propriété entraîne automatiquement que p est diagonalisable dans une base

orthonormée (pour le produit scalaire de L2(ν)) et que ses valeurs propres sont des nombres réels.

Cependant, hormis dans de rares cas, il est dicile, voire impossible de calculer précisément la diagonalisation d'un noyau réversible. Un exemple remarquable, dans le cas des marches aléatoires sur le groupe symétrique est fourni par [16] (voir éga-lement [14]), dans lequel l'analyse de Fourier sur le groupe symétrique (utilisant la théorie des représentations) est mise à contribution.

Proposition 66 Pour une chaîne réversible, la forme de Dirichlet possède l'expres-sion alternative suivante :

Ep(f, f) =<(I−p)f, f >L2(ν). Preuve :

Par dénition, < (I −p)f, f >= P

x,y∈Sν(x)p(x, y)f(x)(f(x)−f(y)). Ceci se réécrit <(I−p)f, f >=P

x,y∈Sν(y)p(y, x)f(y)(f(y)−f(x)), et, par réversibilité, se réécrit encore <(I−p)f, f >=P

x,y∈Sν(x)p(x, y)f(y)(f(y)−f(x)). En écrivant

<(I−p)f, f > comme la demi-somme de la permière et de la dernière expression,

on obtient la formule annoncée.

On note au passage qu'il est facile de vérier que la valeur propre 1 est de multi-plicité 1 dans ce contexte, en notant qu'une fonction f vériant pf =f doit annuler la forme de Dirichlet d'après l'expression ci-dessus, ce qui entraîne très facilement le fait que f doit être constante, en utilisant la dénition deEp(f, f).

Dans le cas oùS est ni, on a, en se rappelant que la valeur propre 1 est asso-ciée aux fonctions constantes et le fait que toutes les valeurs propres sont réelles et inférieures ou égales à 1 (et d'ailleurs>−1), la caractérisation classique suivante :

inf{1−λ∈Spec(p);λ <1}= inf

Ep(f, f)

||f||22 ;< f,1>= 0, f ∈L2(ν)

. Ou, en termes plus probabilistes, en notant queEp(f, f)n'est pas modiée par l'ajout à f d'une constante, et en notant que < f,1>=P

x∈Sf(x)ν(x), sup{λ∈Spec(p);λ <1}= inf

Ep(f, f)

V arν(f);f ∈L2(ν)

.

(Cette caractérisation a encore un sens dans le cadre plus général de la décom-position spectrale en dimension innie.)

On voit alors qu'une inégalité de Poincaré entraîne une borne sur la distance à1 du spectre dep. On voit que le fait de considérer le noyau ppar.= 1/2(I+p)permet de n'avoir que des valeurs propres entre 0 et1et que, par conséquent, l'inégalité de Poincaré entraîne une borne sur le trou spectral de ppar., ce qui éclaire quelque peu les résultats de la partie précédente, dans le cas oùp est réversible.

Exercice 165 Fabriquez un exemple de chaîne ergodique réversible sur un ensemble la vitesse de convergence vers la loi stationnaire dans votre exemple ?

Dans le document Chaînes de Markov Jean Bérard (Page 120-125)