• Aucun résultat trouvé

4.4 Distance W2

Remarquons en premier lieu queW2 est toujours nie. En eet, pourx, y∈Rd on a :

|x+y|2=

d

X

i=1

(xi+yi)2≤2

d

X

i=1

x2i + 2

d

X

i=1

y2i = 2|x|2+ 2|y|2. Ainsi pour µ, ν ∈P2(Rd), etγ ∈ M(µ, ν), il vient que :

W22(µ, ν)≤ Z

Rd×Rd

|x−y|2dγ(x, y) ≤ 2 Z

Rd×Rd

|x|2dγ(x, y) + Z

Rd×Rd

|y|2dγ(x, y)

= 2

m2(µ) +m2(ν)

<+∞.

Un cas particulier de la proposition 4.1, est la proposition suivante :

Proposition 4.3 Pour µ, ν ∈P2(Rd), il existe un couplage γ0 ∈ M(µ, ν) tel que : W22(µ, ν) =

Z

Rd×Rd

|x−y|20(x, y). (4.6)

Un tel couplage est dit optimal entre µ etν pour le coût quadratique : (x, y)7→ |x−y|2 .

Notations : On désignera l'ensemble des couplages optimaux pour W2 entreµetν par M20(µ, ν) ={γ ∈ M(µ, ν); qui v´erifie (4.6)}.

Justions maintenant la terminologie de distance pour W2. Proposition 4.4 W2 est bien une distance sur P2(Rd).

Démonstration :

On vérie les trois axiomes de la dénition de distance.

i) Considérons l'application i : Rd −→ Rd ×Rd qui : x 7→ (x, x). Soit γ := i∆∗µ. Vu que : π1◦i=idE2◦i, on a :γ∈ M(µ, µ) et :

W22(µ, µ)≤ Z

Rd×Rd

1−π2|2 dγ= Z

Rd

1◦i−π2◦i|2 dµ= 0.

Si maintenant µ et ν sont telles que W2(µ, ν) = 0. On peut, d'après la proposition précédente, considérer un couplage optimalγ ∈ M20(µ, ν), pour lequel on a :

Z

Rd×Rd

1−π2|2 dγ = 0.

C'est donc que π1 = π2, γ−p.p, à savoir que γ est portée par la diagonale ∆Rd. Ainsi pour toute fonction ϕborélienne bornée dénie sur Rd, on a :

Z

Rd

ϕ dµ= Z

Rd×Rd

ϕ◦π1 dγ = Z

Rd×Rd

ϕ◦π2 dγ= Z

Rd

ϕ dν, . On en déduit que µ=ν.

ii)Considérons l'applicationS :Rd×Rd→Rd qui :(x, y)7→(y, x). Soitγ ∈ M20(µ, ν)etγˆ:=Sγ.

Couplage optimal pour un coût donné 4.4 Distance W2

Vu que π1 ◦ S = π2, on a : π1∗γˆ = π1∗(Sγ) = (π1 ◦ S)γ = π2∗γ = ν. On obtient de même (π2)ˆγ=µ, de sorte queγˆ∈ M(ν, µ). Comme par ailleurs,γ est un couplage optimal, on a :

W22(ν, µ)≤ Z

Rd×Rd

1−π2|2 dˆγ = Z

Rd×Rd

2−π1|2 dγ =W22(µ, ν).

D'où en échangeant les rôles de µetν, la symétrie de W2.

iii) Soientµ1, µ2, µ3∈P2(Rd), γ1∈ M201, µ2) etγ2 ∈ M202, µ3). Les marginales (π2)?γ12 = (π1)?γ2 sont identiques et si on note ˆπi : Rd×Rd×Rd −→ Rd la iieme projection, il existe une probabilité λ∈P2(R2×Rd×Rd) telle que :

(ˆπ1,πˆ2)λ=γ1 et (ˆπ2,πˆ3)λ=γ2. De plus on a les égalités :

(ˆπ1)∗λ= (π1)γ1= (π1)(ˆπ1,πˆ3)λ = µ1, (ˆπ3)∗λ= (π2)γ2= (π2)(ˆπ1,πˆ3)λ = µ3,

qui impliquent que(ˆπ1,πˆ3)λ∈ M(µ1, µ3). Si on notek ˙kL2(λ)la norme habituelle sur L2(λ), on a, par successions d'inégalités triangulaires :

W21, µ3) ≤ Z

Rd×Rd

|x1−x3|2d((ˆπ1,πˆ3)λ)(x1, x3) 12

=k|ˆπ1−πˆ3|kL2(λ)

≤ k|ˆπ1−πˆ2|kL2(λ)+k|ˆπ2−πˆ3|kL2(λ) =W21, µ2) +W22, µ3).

Donc W2 vérie bien l'inégalité triangulaire

Donnons à présent une caractérisation de la convergence dans P2(Rd)au sens de W2. Proposition 4.5 Soient (µn)n, µ∈P2(Rd). On a équivalence entre :

1. (µn)n converge vers µau sens de W2

2. (µn)n converge faiblement versµ et

R→+∞lim sup

n

Z

|x|≥R

|x|2n(x)

!

= 0.

Notations : Dans la suite, on noteraR

pour R

Rd ouR

Rd×Rd.

Remarque : Chercher α, β >0 tels que(a+b)2≤(1 +α2)a2+ (1 +β2)b2, revient à trouverα, β >0 tels que

2ab≤α2a22b2= (αa−βb)2+ 2αβab.

Ce qui est le cas siαβ = 1. Ainsi pour tout >0, on peut prendre α=√

,β= 1/√

et obtenir : (a+b)2 ≤(1 +)a2+ (1 + 1

)b2. Il résulte de cette remarque, le lemme suivant :

Lemme 4.1 Soient (µn)n est une suite de mesures et µ dans P2(Rd). 1. Sisupn≥1W2n, µ)<+∞ alors :

sup

n≥1

m2n)<+∞, et (µn)n est tendue.

Couplage optimal pour un coût donné 4.4 Distance W2

2. Si de plus(µn)n qui converge vers µau sens de W2, alors pour toutx0∈Rd : lim sup

n→+∞

Z

|x−x0|2n(x)≤ Z

|x−x0|2dµ(x).

Démonstration :

On considère pour chaque n ≥ 1, γn ∈ M20n, µ) un couplage optimal entre µn et µ. Fixons x0∈Rd. En appliquant successivement l'inégalité triangulaire de la norme euclidienne, et la remarque précédente on a :

Z

|x−x0|2n(x) ≤ Z

(|x−y|+|y−x0|)2n(x, y)

≤ (1 +1 )

Z

|x−y|2n(x, y) + (1 +) Z

|y−x0|2dµ(y).

On reconnaît dans le membre de droite, le premier terme W22n, µ).

1. Sisupn≥1W2n, µ)<+∞, on a en spécialisant x0 = 0:K := supn≥1m2n)<+∞. Soit alors >0. PourR >√

K/√

, on a pour tout n∈N et grâce à l'inégalité de Markov : µn(|x|> R)≤ 1

R2 Z

|x|2n(x)≤ K R2 < . Il en découle que (µn)n est tendue.

2.SiW2n, µ) tend vers0 quandn−→+∞, alors on obtient le deuxième point du lemme Nous pouvons passer à la démonstration de la proposition :

Démonstration :

2.⇒1.Par hypothèse, on a déjà que(µn)nconverge faiblement versµ. Le théorème de représentation de Skorohod nous dit qu'il existe (Ω,F,P) un espace probabilisé et des variables aléatoires sur cet espace : (Xn)n,X telles que :

∀n≥1 L(Xn) =µn, L(X) =µ (Xn)n −→ X p.s En utilisant l'autre hypothèse, on a :

R→+∞lim sup

n

Z

|x|>R

|x|2n(x) = lim

R→+∞sup

n

Z

|Xn|>R

|Xn|2dP= 0.

Autrement dit la suite(|Xn|2)nest équi-intégrable. Et la convergence presque sûre entraîne la conver-gence en probabilité, donc(Xn)nconverge en probabilité versX. Par le Lemme (A.1) (voir Annexe), cela est équivalent à dire que :

(Xn)n −→ X dansL2(P) i.e E(|Xn−X|2) −→ 0.

De plus, d'après la dénition de W2 on a l'inégalité : W22n, µ) = inf

(Yn,Y)∈M(µn,µ)E(|Yn−Y|2)≤E(|Xn−X|2)−→0.

On a donc montré que (µn)n converge versµau sens de W2. 1.⇒2.Par hypothèse on a :limn→+∞W2n, µ) = 0.

∗ Le lemme 4.1 nous donne l'inégalité : lim sup

n→+∞

Z

|x|2n(x)≤ Z

|x|2dµ(x).

Couplage optimal pour un coût donné 4.4 Distance W2

Pour >0, il existe donc n0 ∈N? tel que, pour toutn≥n0 : Z

|x|2n(x)≤ Z

|x|2dµ(x) +.

SoitR >0. La fonction surRd−→R+,x7−→1{|x|<R}|x|2est semi-continue inférieurement et donc : lim inf

n→+∞

Z

|x|<R

|x|2n(x)≥ Z

|x|<R

|x|2dµ(x).

Il existe alors n1≥n0 tel que, pour toutn≥n1 : Z

|x|<R

|x|2n≥ Z

|x|<R

|x|2dµ(x)−. Ainsi pour n≥n1, on obtient :

Z

|x|≥R

|x|2n≤ Z

|x|≥R

|x|2dµ+ 2.

En prenant le sup surn≥1et la limite quand R tend vers+∞, il vient que :

R→+∞lim sup

n≥1

Z

|x|≥R

|x|2n= 0. (4.7)

∗ Comme (µn)n converge au sens deW2 vers µ, le lemme 4.1 indique en particulier que la suite est tendue. Il existe donc une sous-suite (µnk)k qui converge faiblement vers une mesure µ. De plus cette sous-suite vérie aussi (4.7). On peut donc appliquer le sens2.⇒1.à cette sous-suite :(µnk)k

converge au sens de W2 versµ. Mais par hypothèse(µn)nconverge versµau sens deW2 donc par unicité de la limite, il en découle que µ=µ. Ainsi, toute sous-suite de (µn)n converge faiblement vers µ, et donc (µn)nconverge faiblement vers µ

Enn terminons cette partie, en donnant la propriété fondamentale de la distance de Wasserstein : Proposition 4.6 L'espace métrique (P2(Rd), W2) est complet.

Démonstration :

Prenons une suite de Cauchy (µn)n ⊂P2(Rd) pour la distance W2. Soit > 0. Il existe un entier n0 >0 tel que pour toutn, m≥n0, on aitW2n, µm)< .

∗ Montrons dans un premier temps que (µn)n est tendue. Soitm≥n0. On a par inégalité triangu-laire :

W21, µn)≤W21, µn0) +W2n0, µm)< W21, µn0) +≤C0 <+∞.

Ainsi :

sup

m≥n0

W21, µm)≤C0 <+∞ et sup

1≤m≤n0

W21, µm) =C1 <+∞

donc sup

m≥1

W21, µm) ≤ max(C0, C1)<+∞.

Donc(µn)nest bornée pourW2et par le lemme 4.1, cela implique que la suite(µn)nest bien tendue.

∗ On en déduit qu'il existe une sous-suite (µnk)k qui converge faiblement vers une mesure µ. On considère pour chaque mesure de cette sous-suite, un couplage γn,nk ∈ M20n, µnk). Comme (µn)n

est tendue, il s'ensuit que(γn,nk)k. Il existe donc une sous-suite(γn,nkp)pqui converge faiblement vers γn,∞. Pour ne pas alourdir les notations, on va supposer que c'est (γn,nk)k qui converge faiblement vers γn,∞. Soitϕ∈ Cb(Rd×Rd). La convergence faible se traduit par :

Z

ϕ dγn,nk −→

Z

ϕ dγn,∞.

Couplage optimal pour un coût donné 4.4 Distance W2

Soit alors ψ∈ Cb(Rd). Posonsϕ=ψ◦π1 ∈ Cb(Rd×Rd), alors on a : Z

ϕ dγn,nk = Z

ψ dµnk −→

Z ψ dµ.

Donc par unicité de la limite, on a que R

ψ dµ=R

ϕ dγn,∞. Cela signie que (π2)γn,∞

Remarque : Peut-être que cette démonstration aurait été plus succinte en utilisant la caractérisation de la convergenceW2 donnée par la proposition 4.5. Faute de temps, nous n'avons pas pu y rééchir de manière approfondie.

Quelques Couplages classiques

Deuxième partie

Couplages avec une loi de Poisson

Cette partie est consacrée à l'étude de cas discrets.

La loi de Poisson de paramètreλ >0est la loi portée par N, de moyenneλet variance λ: P(λ) =X

n∈N

λn

n!e−λ·δn, de fonction génératrice : s7→e−λ(1−s).

5 Quelques Couplages classiques

5.1 Couplages entre deux lois de Poisson P(λ) et P(λ0) avec λ > λ0

Si nous calculons la variation totale entre ces deux lois, et puisque e−λ < e−λ0, alors que n

n∈N/ λn!0ne−λ0 < λn!ne−λ

oest une demi-droite d'entiers : [Nλ,λ0,+∞[, avecNλ,λ0 ≥1, on obtient :

kP(λ)− P(λ0)kV T = X

n∈N

λn

n!e−λ− λ0n n!e−λ0

+

= X

n≥Nλ,λ0

λn

n!e−λ−λ0n n!e−λ0

= (e−λ0 −e−λ) + X

1≤n<Nλ,λ0

λ0n

n!e−λ0− λn n!e−λ

= e−λ0(1−e−(λ−λ0)) + X

1≤n<Nλ,λ0

λ0n

n!e−λ0 −λn n!e−λ

Notons qu'il n'est en général pas facile d'avoir un estimé eectif de ces quantités.

Cependant dans le cas où : 0< λ0 < λ < 1, on constate que : λ0e−λ0 < λe−λ (il sut d'étudier les variations de la fonction qui : x7→xe−x), et que de ce faitNλ,λ0 = 1, avec ainsi :

kP(λ)− P(λ0)kV T =e−λ0(1−e−(λ−λ0))≤1−e−(λ−λ0)≤λ−λ0

En fait nous pouvons retrouver cette majoration dans le cas général de façon assez simple en utilisant un couplage particulier (susamment bon, bien que non optimal).

Nous utiliserons le fait (dont la vérication est immédiate en termes de fonctions génératrices), que la somme de deux variables de Poisson indépendantes est une variable de Poisson (de paramètre la somme des paramètres). Si X0 et X00 sont deux variables aléatoires de Poisson de paramètres respectifsλ0 etλ00=λ−λ0, toutes deux dénies sur le même espace de probabilité et indépendantes entre elles, leur sommeX :=X0+X00est une variable de Poisson de paramètreλ. Le couple(X, X0) réalise un couplage γ entre les lois de PoissonP(λ) etP(λ0). Vu que :

γ(∆cN) =P[X6=X0] =P[X006= 0] = 1−e−(λ−λ0) on en déduit que :

kP(λ)− P(λ0)kV T ≤1−e−(λ−λ0)≤λ−λ0. 5.2 Couplages d'une loi de Bernoulli avec une loi de Poisson

La loi de Bernouilli de paramètrep∈]0,1[est la loi portée par {0,1}, de moyennepet variance p(1−p) :

B(p) = (1−p)δ0+pδ1, de fonction génératrice : s7→1−p(1−s).

Documents relatifs