• Aucun résultat trouvé

Ceci étant vrai pour toutα etβ, on peut prendre le sup sur ces fonctionsρ−mesurables qui vérient kαkL2(ν)≤1etkβkL2(µ)≤1et ainsi :

Et comme on a trouvé une mesure γ ∈ M(ν, µ) pour laquelle ces inégalités sont vraies, on a nalement le résultat :

γ∈M(ν,µ)inf sup

7.2 En dimension nie quelconque

→ Nous allons énoncer l'équivalent du théorème 7.1 en dimension nie quelconque (n≥1). Pour cela, nous avons besoin d'autres notations, reprises là encore dans [2].

Considérons un échantillon X de taille n de variables aléatoires sur Rn et de loi µ. Soit Γ =

2 la norme de la topologie euclidienne. Re-marquons que si n= 1, l'échantillon est de taille 1 et la matrice Γ est réduite à (1) donc kΓk= 1. La qualité des majorations obtenues dépend donc fortement de la dimension de l'espace considéré.

Nous sommes en mesure d'énoncer le théorème dans le cadre général.

Théorème 7.2 Si µ est à densité strictement positive par rapport à ρ1 ⊗ · · · ⊗ρn sur Rn et ν une probabilité sur Rn admettant une dérivée de Radon-Nikodym par rapport à µ, alors on a les inégalités :

Liaison entropie et écart d2 7.2 En dimension nie quelconque

Démonstration :

Pour n= 1 : est traité par le théorème 7.1.

Pour n >1 : on raisonne par récurrence et on suppose le résultat vrai pour n−1. Soient f est la densité deµ etgcelle de ν par rapportρ1⊗ · · · ⊗ρn. La relation

g= dν dµf,

impose également g à être strictement positive. Considérons α = (α1, . . . , αn) et β = (β1, . . . , βn) des vecteurs de fonctions positives telles que :

Z n

X

i=1

αi(y)2dν(y) ≤ 1 Z n

X

i=1

βi(x)2dµ(x) ≤ 1 Commef >0 on peut écrire :

f(x1, . . . , xn) =fn(xn|x1, . . . , xn−1)· · ·f2(x2|x1)f1(x1), avec :

fj(xj|x1, . . . , xj−1) =

R f(x1, . . . , xj, zj+1, . . . , zn)dρj+1(zj+1). . . dρn(zn) Rf(x1, . . . , xj−1, zj, . . . , zn)dρj(zj). . . dρn(zn) . On a R

fj(xj|x1, . . . , xj−1)dρj(xj) = 1. Soient alors Fj(.|x1, . . . , xj−1) les probabilités qui ont pour densité respective fj(.|x1, . . . , xj−1) par rapport à ρj pour j = 1, . . . , n. Introduisons maintenant pour 1≤i < j≤k≤n:

fjk(xj, . . . , xk|x1, . . . , xi) = Z

f(x1, . . . , xi, zi+1, . . . , zi−1, xj, . . . , xk, zk+1, . . . , zn) dρi+1(zi+1). . . dρj−1(zj−1)dρk+1(zk+1). . . dρn(zn).

Soit alors Fjk(., . . . , .|x1, . . . , xi) la probabilité ayantfjk(., . . . , .|x1, . . . , xi) pour densité par rap-port à dρj⊗ · · · ⊗dρk. On dénit de façon similaire pourg les gn, . . . , g1 et Gj pour j = 1, . . . , n.

Et pour 1 ≤ i < j ≤ k ≤ n les gkj(., . . . , yk|y1, . . . , yi) et Gkj(., . . . , .|y1, . . . , yi). Soit enn pour i= 1, . . . , n :

Ei= Z

EntFi(.|y1,...,yi−1)

gi(.|y1, . . . , yi−1) fi(.|y1, . . . , yi−1)

dGi−11 (y1, . . . , yi−1).

Lemme 7.2 On a : n

X

i=1

Ei =Entµ

. Démonstration :

Rappelons que :

Entµ

=Entµ g

f

= Z g

f log g

f

dµ.

On réécrit f etg, pour(y1, . . . , yn)∈Rn : g(y1, . . . , yn) f(y1, . . . , yn) =

n

Y

i=1

gi(yi|y1, . . . , yi−1) fi(yi|y1, . . . , yi−1).

Liaison entropie et écart d2 7.2 En dimension nie quelconque

Mais d'après les notations ci-dessus :

dGn1(y1, . . . , yn) = Gn(dyn|y1, . . . , yn−1)× · · · ×G1(dy1)

Finalement on obtient le résultat : Entµ

Nous allons voir que ce Lemme est une clef importante de la démonstration. Pour alléger les notations, notons maintenant pour 1≤j≤n:

j =R

→ Dans [2], pour obtenir le résultat du Théorème 7.2, l'auteur construit une probabilité γ ∈ M(ν, µ)qui vérie les inégalités suivantes :

Z Z

Application : une inégalité de Poincaré

Avec ces inégalités (7.26) et (7.27), le résultat du Théorème 7.2 s'en suit facilement. En eet, partant de (7.26), montrons (7.24) ((7.27) impliquera (7.25) de la même façon). En sommant sur j, en appliquant plusieurs fois l'inégalité de Cauchy-Schwarz et en se rappelant queγij = 0 pouri > j, on a :

Ceci étant vrai pour tout α vériant les conditions de départ, et le membre de droite de l'inégalité ne dépendant pas de αon peut prendre lesup sur celui de gauche, puis enn l'inf sur les couplages γ ∈ M(Q, P)pour obtenir ce que l'on veut, à savoir :

8 Application : une inégalité de Poincaré

Gardons les mêmes notations que la partie précédente. On se donne pour toute la suite : une mesure de probabilité µ sur[0,1]n et f : [0,1]n−→R une fonction µ-mesurable, continue sur [0,1]

Application : une inégalité de Poincaré

Démonstration : Supposonsf convexe.

∗ Prouvons déjà le lemme pourn= 1. Soientx, y∈[0,1]n.f0 est continue sur]0,1[et alors on écrit f(y)−f(x) =Ry

x f0(t)dt. De plus la convexité de f entraînée la croissante de f0

→ Siy=x, l'inégalité est trivialle.

→ Siy > xalors :

f(y)−f(x)≤f0(y) Z y

x

dt=f0(y)(x−y).

→ Siy < xalors :

f(y)−f(x)≥f0(y)(y−x).

Finalement on a donc f(y)−f(x)≤ |f0(y)|11y6=x.

∗ Supposons maintenantn >1. Pourx, y∈[0,1]n, il est facile de voir que l'application g:t∈[0,1]7−→f((1−t)x+ty)

est convexe. Elle est de plus continue sur [0,1]etC1 sur]0,1[. On peut donc lui appliquer l'inégalité précédente pour en particulier 0 et1:

g(1)−g(0) =f(y)−f(x)≤ |g0(1)|.

On en déduit que :

f(y)−f(x)≤

n

X

j=1

|∂j(y)|11yj6=xj. Cela étant vrai pour tout x, y∈[0,1]n, on a l'inégalité (8.28).

Dans le cas où f est concave, on applique l'inégalité précédente à −f qui alors convexe, et on retrouve bien (8.29)

Passons maintenant à la proposition qui nous permet d'obtenir facilement l'inégalité de Poincaré recherchée. On dénote par ∇f le gradient def et|∇f|sa norme euclidienne dansRn.

Proposition 8.1 Si f est convexe alors :

Entµ(ef)≤2kΓk2 Z

|∇f|2efdµ. (8.30)

Si f est concave alors :

Entµ(ef)≤2kΓk2 Z

|∇f|2dµ Z

efdµ. (8.31)

Démonstration :

Souvenons nous de la dénition de l'entropie conditionnelle en (7.18) : Entµ(ef) =

Z

[0,1]n

f(y)ef(y)dµ(y)− Z

[0,1]n

ef(x)dµ(x)

! log

Z

[0,1]n

ef(x)dµ(x)

! .

Comme −log est convexe, on peut appliquer l'inégalité de Jensen au deuxième facteur du terme de gauche, et avecEµ(ef) =R

efdµ il vient que : Entµ(ef)

Eµ(ef) ≤ Z

f(y) ef(y)

Eµ(ef)dµ(y)− Z

f(x)dµ(x).

Application : une inégalité de Poincaré

Soit maintenant µf la mesure de probabilité sur [0,1]n qui admet la densité ef/Eµ(ef) par rapport à µ. On a alors la relation suivante f = ef

Eµ(ef). Soit γ ∈ M(µ, µf). Alors l'inégalité précédente nous dit exactement :

Entµ(ef) Eµ(ef) ≤

Z Z

f(y)−f(x)dγ(x, y). (8.32)

Sif est convexe, alors en réinjectant (8.28) du Lemme précédent dans (8.32) on obtient : Entµ(ef)

→SiIµf(f) = 0alors cela signie que toutes les dérivées partielles defsont nulles, i.efest constante.

Et sif est constante, l'entropie deef selon µest nulle, donc l'inégalité (8.30) est immédiate.

→ SinonIµf(f)>0 et on peut écrire : Finalement, on obtient (8.30) en divisant cette inégalité parEµ(ef).

De même sif est concave on obtient successivement les inégalités suivantes grâce à (8.29), (7.17) avec d2f, µ), puis au Théorème (7.2) : On obtient (8.31) en divisant la dernière inégalité par EP(ef)

Enonçons maintenant l'inégalité de Poincaré désirée.

Application : une inégalité de Poincaré

Proposition 8.2 Si f est convexe ou concave, alors : Z

Remarquons d'abord que l'on peut supposer que Eµ(f) = 0. Dans ce cas si on démontre l'inégalité de Poincaré, alors en remplaçantf parf −Eµ(f):

On peut donc appliquer le théorème de convergence dominée qui nous dit que :

→0lim

Par continuité de la fonctionlog, on en déduit que :

→0limlog Z

ef(x)dµ(x) = 0.

De la même façon, avec le théorème de convergence dominée, on vérie facilement que :

→0lim

Ce qui nous permet une fois encore d'appliquer le théorème de convergence dominée :

→0lim

Application : une inégalité de Poincaré

pour toutx∈[0,1]n,7−→ ef(x)−1−f(x)2 est continue en0de limite f(x)2 2,

ef(x)−1−f(x) 2

|f(x)|2 2ef(x) pour tout ∈[0, a], et toutx∈[0,1]n, x7−→ |f(x)|2 2ef(x) est µ-intégrable sur[0,1]n.

En appliquant une fois de plus le théorème de convergence dominée, on a : lim→0log

Z

ef(x)dµ(x) = 2 2

Z

f2(x)dµ(x).

Finalement en divisant tout par2 et en passant à la limite quand−→0dans (8.33), il vient que : Z

f(x)2dµ(x)≤2kΓk Z

|∇f(x)|2dµ(x) +1 2

Z

f(x)2dµ(x).

Cela nous donne bien le résultat.

∗ Dans le cas oùf est concave, on obtient le résultat en appliquant (8.31) àf, puis en utilisant de la même façon le théorème de convergence dominée

Mesure dérivée et application à W2

Quatrième partie

Introduction à la théorie du transport

L'objet de cette partie est d'établir et d'étudier certaines équations diérentielles sur l'espace des mesures. Pour cela, nous avons besoin de mettre sur l'espace des probabilités, une structure pseudo-diérentiable. C'est la raison pour laquelle on introduit la notion de mesure dérivée.

9 Mesure dérivée et application à W

2

Nous souhaitons généraliser la notion de dérivée de fonction à celle de dérivée de mesure.

Dénition 9.1 Soient(M, d) est un espace métrique etI un intervalle deR. On dit queu:I −→M est absolument continue s'il existe une fonction m∈L1(I) telle que :

d(u(s), u(t))≤ Z t

s

m(τ)dτ, ∀s≤t∈I. (9.34)

On admettra le résultat suivant :

Théorème 9.1 Si u:I −→E est absolument continue, la quantité

|u0|(t) := lim

→0

d(u(t+), u(t))

||

existe pour presque tout t∈I, et est appelée mesure dérivée de u. De plus la fonction t7−→ |u0|(t) est intégrable sur I et est minimale dans la dénition de l'absolue continuité de u au sens suivant : si m∈L1(I) vérie (9.34) alors :

|u0|(t)≤m(t) pour presque toutt∈I.

Regardons des résultats de cette notion sur l'espace (P2(Rd), W2). On se donne deux mesures µ, ν ∈P2(Rd)etγ ∈ M20(µ, ν).et on considère la famille de mesures :

µt= (1−t)π1+tπ2

γ, ∀t∈[0,1].

Siϕ∈ Cb(Rd), cela s'écrit : Z

Rd

ϕ dµt= Z

Rd×Rd

ϕ((1−t)x+ty)dγ(x, y).

On peut voir (µt)t∈[0,1] comme une géodésique qui relie µ à ν dans P2(Rd). Le lemme suivant indique que cette famille relie µà ν à vitesse constante :

Lemme 9.1 Pour tout 0≤1< t <1, on a l'égalité :

W2s, µt) = (t−s)W2(µ, ν).

Démonstration :

Soit γs,t = (1−s)π1+sπ2,(1−t)π1+tπ2

γ.Alors : (π1)γs,t = (1−s)π1+sπ2

γ =µs

2)γs,t = (1−t)π1+tπ2

γ =µt.

Mesure dérivée et application à W2

Cela signie que γs,t ∈ C(µs, µt). On a alors : Z

Rd×Rd

|x−y|2s,t(x, y) = Z

Rd×Rd

|((1−s)x+sy)−((1−t)x+ty)|2dγ(x, y)

= |s−t|2 Z

Rd×Rd

|x−y|2dγ(x, y)

= |s−t|2W2(µ, ν).

Cela implique que W2s, µt)≤ |s−t|W2(µ, ν). S'il existes0< t0<1 tels que l'inégalité est stricte alors :

W2(µ, ν) ≤ W2(µ, µs0) +W2s0, µt0) +W2t0, µ)

< W2(µ, ν)((s0−0) + (t0−s0) + (1−t0)) =W2(µ, ν).

Ce qui est absurde. Ainsi l'inégalité est en fait une égalité et le résultat en découle.

Ce lemme nous permet d'établir que, pour tout >0 : W2t+, µt)

|| =W2(µ, ν)

et donc que la dérivée de la mesure µtest exactement la distance de Wasserstein W2(µ, ν) :

0t|=W2(µ, ν).

Remarquons que l'absolue continuité implique la continuité. Ainsi si t 7−→ µt ∈ P2(Rd) est absolument continue sur I alorsµt+ −→µt (au sens deW2) quandtend vers 0.

Proposition 9.1 Pour I intervalle ouvert de R, on considère une application t ∈ I 7−→ µt ∈ P2(Rd). Si cette application est absolument continue sur I alors il existe un champs de vecteurs mesurable V : (t, x)∈I×Rd7−→Vt(x)∈Rd tel que :

1. Vt∈L2(Rd, µt), etkVtkL2t)≤ |µ0t|pour presque tout t∈I. 2. µt vérie l'équation

∂µt

∂t +∇(Vt·µt) = 0

au sens où, pour toute fonction ψ:I×Rd7−→R C à support compact : Z

I

Z

Rd

∂tψ(t, x)+<∇xψ(t, x), Vt(x)> dµt(x)dt= 0 3. Pour presque toutt∈I, V ∈ {∇ψ;ψ∈ Cc(Rd)}L

2(µ)

. Démonstration :

On peut raisonner dans I =]0,1[pour se xer les idées.

∗ Fixons ϕ ∈ Cc(Rd). Pour s < t∈ I, on considère un couplage optimal γs,t ∈ M20s, µt). On a grâce à l'inégalité de Cauchy-Schwarz :

t(ϕ)−µs(ϕ)| = Z

Rd×Rd

(ϕ(y)−ϕ(x))dγs,t(x, y)

≤ kϕkLip Z

Rd×Rd

|y−x|dγs,t(x, y) =kϕkLipW2s, µt).

Comme t7−→µt est absolument continue surI, il existem∈L1(I) telle que pour touts < t∈I : W2s, µt)≤

Z t s

m(τ)dτ.

Mesure dérivée et application à W2

Cela entraîne quet7−→µt(ϕ) est absolument continue surI.

∗ Considérons maintenant la fonctionH dénie surRd×Rd par : H(x, y) =

la dernière inégalité provenant de Cauchy-Schwarz. On sait que µs+ −→ µs au sens de W2. Cela implique (par la proposition (4.5)) queµs+converge faiblement versµs. On en déduit que{γs,s+} est tendue. Quitte à considérer une sous-suite, on peut supposer queγs,s+ converge faiblement vers une certaine mesure ˆγs. On a donc pour M >0, commeγs,s+ est un couplage optimal :

Cela signie que la mesure γˆs est portée par la diagonale {x = y}. Mais H est bornée et continue sur la diagonale donc pour la mesure ˆγs. Ainsi on a la convergence :

→0lim

On en déduit nalement que : lim sup paramètres, on a :

Z

Méthode itérative sur des mesures

Ainsi grâce à (9.35), on obtient :

Z

Rd

∂sψ(s, x)dµs(x)ds

≤ Z

I

0|(s)k∇xψ(s, .)kL2s) ds

≤ Z

I

0|2(s)ds

1/2Z

I

Z

Rd

|∇xψ(s, x)|2s(x)ds 1/2

. Posons alors V = {∇ψ; ψ ∈ Cc(I ×Rd)} et V sont adhérence dans L2(˜µ), où d˜µ := dµsds. La dernière inégalité signie que l'application

L:V −→ R

∇ψ 7−→ − Z

Rd

∂sψ(s, x)dµs(x)ds

est bien dénie. L est de plus linéaire et donc s'étend de manière unique à V (on note son pro-longement encore L). Par le théorème de Riesz-Fisher, il existe donc un élément V(., .) ∈ V telle que :

L(w) =< V, w >L2µ) pourw∈ V. En particulier, pour∇ψ∈ V, on a :

− Z

Rd

∂sψ(s, x)dµs(x)ds= Z

Rd

< V(s, x),∇xψ(s, x)> dµs(x)ds.

A savoir, en combinant la dernière inégalité obtenue et en prenant ∇xψ(s, x) =V(s, x), que : Z

I

kVtkL2t) dt≤ Z

I

0|(t)dt.

Ceci étant vrai pour tout intervalle J ouvert dansI, on en déduit nalement que : kVtkL2t)≤ |µ0|(t),

pour presque toutt∈I

10 Méthode itérative sur des mesures

Notations :dγd(x) = (2π)1d/2e|x|

2

2 dx représente la mesure Gaussienne sur Rd. Il s'agira de notre mesure de référence pour toute la suite. On note aussi :

K =

ρ:R2 →R+; Z

Rd

ρ dγd= 1; m2(ργd)<+∞

. Et siρ∈ K :

S(ρ) = Z

Rd

ρlogρ dγd, Eψ(ρ) =

Z

Rd

ψρ dγd+S(ρ) pourψ:Rd→R+ mesurable.

Remarquons queS(ρ)est positif, et qu'il en est de même pour Eψ(ρ) (que l'on notera E(ρ)).

Proposition 10.1 Soit ψ:Rd−→R+ mesurable. S'il existe une mesureρ∈ Ktelle que Eψ(ρ)<

+∞, alors pour tout ρ(0) ∈ K, eth >0, il existe une unique mesureρˆ∈ K qui minimise la fonction : ρ7−→ 1

2W22(0), ρ) +hEψ(ρ).

Méthode itérative sur des mesures

Démonstration :

Notons m= infρ∈K{12W22(0), ρ) +hE(ρ)}. Comme il existeρ∈ K tel queE(ρ)<+∞, la quantité m est nie. Pour chaquen≥1, il existe alorsρn∈ K tel que :

1

2W22(0), ρn) +hE(ρn)≤ 1

n+m. (10.36)

Cela implique en particulier quesupn≥1W22(0), ρn)<+∞. Grâce au lemme 4.1, on a : C := sup

n≥1

Z

Rd

|x|2ρnd<+∞.

Soit >0 xé. PourR >0on a : Z

Rd

|x|2n≥ Z

|x|>R

|x|2n≥R2ρn(|x|> R).

Comme la quantité de gauche est uniformément bornée enn, on en déduit que pourRassez grand : sup

n≥1

ρn(|x|> R)≤.

Cela signie que la suite{ρnγd}n≥1 est tendue : quitte à considérer une sous-suite, on peut supposer que (ρnγd)n converge faiblement vers une mesureµ.

∗ PourR >0, on a par dénition de la convergence faible : Z

|x|2∧R dµ= lim

n→+∞

Z

(|x|2∧R)ρnd≤C <+∞.

Donc par Beppo Lévi, on a nalement que :

m2(µ)<+∞.

∗ (10.36) nous indique aussi que C1 := supn≥1S(ρn)<+∞. Pour R >1, on a : Z

ρn≥R

ρnd≤ 1 logR

Z

ρn≥R

ρnlogρndγ.

Mais min0≤x≤1(xlogx) = −1e et par convexité de cette fonction, on a : xlogx ≥ −1e pour tout x∈R. Donc :

Z

ρn≥R

ρnlogρnd=S(ρn)− Z

0≤ρn≤1

ρnlogρnd≤S(ρn) +1 e. D'où nalement :

Z

ρn≥R

ρnd≤ 1

logR(C1+1

)−→0 quand R−→+∞

donc lim

R→+∞sup

n≥1

Z

ρn≥R

ρnd= 0.

∗ On a vu que (ρnγd)n convergeait faiblement vers µ. On veut étendre cette notion de convergence qui est caractérisée sur les fonctions continues bornées, à des fonctions seulement mesurables bornées.

Soitψ:Rd−→Rmesurable bornée parCψ. On sait queCc(Rd)est dense dans l'ensembleB(γd+µ) = {ψ:Rd−→Rmesurable bornée}. Pourδ >0, il existe doncϕ∈ Cc(Rd) telle que kϕk≤Cψ et :

Z

|ψ−ϕ|dγd< δ,

Z

|ψ−ϕ|dµ < δ.

Méthode itérative sur des mesures Seul le premier terme du membre de droite peut poser problème. Mais :

Z ce que l'on recherche.

→ On sait quem2(µ)<+∞ et donc R

Par le même raisonnement, on obtient pour ψ:Rd−→Rd mesurable bornée, que : Z

Méthode itérative sur des mesures

Par (10.36), on en déduit que : 1

2W22(0),ρ) +ˆ h Z

ψρ dγˆ d−≤m+ 1 n. Considérons alors le sous-ensemble deK :

C =

ρ∈ K, hS(ρ)≤(m+ 1 n)−1

2W22(ρ(0),ρ)ˆ −h Z

ψρ dγˆ d+

.

D'après ce qui précéde,ρk∈C pour toutk≥noù n≥n0. De plus C est clairement convexe, grâce à la convexité dex7→xlogx. De plus on a vu que(ρn)n converge faiblement versρˆ, mais que cette convergence a lieu aussi sur les fonctions mesurables bornées (de L). Mais L(Rd, γd) est le dual de L1(Rd, γd), et cela signie que(ρn)n converge faiblement versρˆdansL1. D'oùρˆ∈Cf aible. Par le théorème de Hahn-Banach, on sait que :

Cf aible=Cf orte.

Cela signie qu'il existe ( ˆρq)q⊂C qui converge vers ρˆdans L1. Quitte à considérer une sous-suite, on peut supposer que ( ˆρq)q converge versρ γˆ d−presque sûrement. Et par le lemme de Fatou on a :

S( ˆρ)≤lim inf

q→+∞S( ˆρq).

Mais par dénition de C on a :

hS( ˆρ)≤hS( ˆρq)≤m+ 1 n −1

2W22(0),ρ)ˆ −h Z

ψˆρ dγd+. En faisantn−→+∞ et−→0, on obtient nalement :

1

2W22(0),ρ) +ˆ E( ˆρ)≤m.

Finalementρˆréalise le minimum voulu. Siρ0etρ1 sont deux mesures deKqui réalisent ce minimum, alors on va montrer que ces deux mesures sont égales, grâce à des arguments de convexité. Comme la fonction x 7−→ xlogx est convexe, il est clair que ρ 7−→ E(ρ) est convexe. On considère ρt = (1−t)ρ0+tρ1 pour 0 ≤t≤ 1. On a ρt ∈ K pour tout t entre0 et 1. Prenons alors des couplages optimaux γ1 ∈ M0(0), ρ0) et γ2 ∈ M0(0), ρ1). On voit alors que la mesure (1−t)γ1 +tγ2

appartient à M(ρ(0), ρt) pour tout 0≤t≤1. On a donc si 0< t <1 : W22(0), ρt) <

Z

|x−y|2d((1−t)γ1+tγ2)(x, y)

= (1−t) Z

|x−y|21(x, y) +t Z

|x−y|22(x, y) = (1−t)W22(0), ρ0) +tW22(0), ρ1).

E étant convexe etρ7−→W22(0), ρ)étant strictement convexe, on a alors : 1

2W22(0), ρt) +E(ρt)<(1−t)m+tm=m,

et cela contredit que m est la borne inférieure. On en déduit que le minimum atteint est unique.

Cela prouve le théorème

Partant de ρ(0) ∈ K, on a construit une unique mesure ρ(1) ∈ K qui réalise le minimum de la fonction

ρ7−→ 1

2W22(0), ρ) +hE(ρ).

Partant maintenant de ρ(1), on peut de même construire un ρ(2)... Ainsi de suite, et on nit par obtenir une suite de mesures (ρ(n))n dans K. Cette méthode d'itérations est en fait un outil très puissant pour résoudre des fonctions aux dérivées partielles, comme celle de Fokker-Plank :

tu− ∇(∇u+u∇V) = 0.

Théorème de convergence Lp

Appendices

A Théorème de convergence L

p

Lemme A.1 Soit p ∈ N. On considère une suite de variables aléatoires (Xn)n admettant des moments d'ordre p, toutes dénies sur(Ω,F,P) etX dénie sur(Ω,F,P). On a équivalence entre :

1. La suite (Xn)n converge dans Lp vers X.

2. La suite (|Xn|p)n est uniformément intégrable et(Xn)n converge en probabilité vers X. Remarquons tout d'abord, que grâce à la croissance de la fonctionx7−→xp surRet la convexité sur R+, on a pour tout a, b, c∈R:

|a−b|p ≤2p−1(|a−c|p+|c−b|p). (A.38) Démonstration :

1.⇒2.Par dénition on alimn→+∞E(|Xn−X|p) = 0. L'inégalité de Minkowski, nous dit que pour n, m≥1, on a :

kXn−Xmkp≤ kXn−Xkp+kX−Xmkp.

Cela signie que(Xn)nest de Cauchy dansLp. SoitN ≥1tel que, pourn, m≥N :E(|Xn−Xm|p)≤ /2p. Par l'inégalité (A.38), on a pour A∈ F etn≥N :

Z

A

|Xn|pdP ≤2p−1 Z

A

|XN|pdP + Z

A

|Xn−XN|pdP

≤2p−1 Z

A

|XN|pdP + 2. Et donc en prenant le sup surn, on a pour toutA∈ F :

sup

n≥1

Z

A

|Xn|pdP ≤ sup

n≤N

Z

A

|Xn|pdP + 2p−1 Z

A

|XN|pdP +2.

On en déduit que {|Xn|p}n≥1 est bornée dans L1 et donc uniformément intégrable dans L1. Par l'inégalité de Markov, on a pour >0, etn, m≥1 :

P(|Xn−Xm|> )≤ 1

pE(|Xn−Xm|p).

Et donc la suite (Xn)n est de Cauchy en probabilité et converge donc en probabilité versX. 2.⇒1.Soit >0. Il découle de l'inégalité (A.38) que :

E|Xn−X|p ≤ Z

|Xn−X|≤1/p

|Xn−X|2dP + 2p−1 Z

|Xn−X|>1/p

(|Xn|p+|X|p)dP

≤ + 2p−1 Z

|Xn−X|>1/p

|Xn|pdP + Z

|Xn−X|>1/p

|X|pdP

! .

La famille {|Xn|p, n≥1;|X|p}étant équi-continue, il existe η >0tel que siP(A)≤η alors : sup

n≥1

Z

A

|Xn|pdP + Z

A

|X|pdP ≤ 2p−1.

Et par hypothèse, (Xn)n converge en probabilité vers X donc il existe N ≥ 1, tel que pour tout n≥N :

P(|Xn−X|> 1/p)≤η.

On en déduit nalement que :

lim sup

n→+∞ E|Xn−X|p≤2.

Ceci étant vrai pour tout >0, il en résulte que (Xn)n converge dans Lp versX.

RÉFÉRENCES RÉFÉRENCES

Références

[1] G. Savare L. Ambrosio, N. Gigli. Gradient Flows in Metric Spaces and in the Space of Probability Measures. 2008.

[2] P-M. Samson. Concentration of measure inequalities for markov chains and φ-mixing processes.

The Annals of Probability, 2000.

[3] A.D. Barbour and Louis H.Y. Chen. An introduction to Stein's Method.

[4] S. Fang. Wasserstein space and fokker planck equation. 2007.

[5] Franck et Patrick Gabriel. Notes sur les couplages discrets, exemples avec la loi de poisson.

[6] T. Lindvall. Lectures on the Coupling Method. Wiley-Interscience, 1992.

Documents relatifs