wLP(X, Y) := inf{ε >0; ∃σ∈SN/ ♯{i,|xi−yσ(i)|> ε}< N ε},
et on appelle “distance” de Monge-Kantorovich-Wasserstein (MKW) la fonction wp ainsi d´efinie sur EN et EN/SN, et “distance” de Levy-Prokorov la fonction wLP ainsi d´efinie sur EN et EN/SN. On note ´egalement w0 =wLP.
1.2 Mesures empiriques et distances dans P(E) lorsque E est un compact.
subsec:MFG-1
Dans cette section nous supposerons toujours (sauf mention explicite du contraire) que E ⊂ Rd est un compact. Commen¸cons par d´efinir l’application canonique “mesure empirique” qui est l’objet fondamental permettant de passer de la suite d’espaces EN `a l’espace fixe P(E)⊃ PN(E).
def:MesureEmpirique D´efinition 1.2.4 Soit E un espace polonais (ou juste mesurable). Etant donn´ee la va-riable/l’´etat X = (x1, ..., xn) ∈ EN, on d´efinit la mesure empirique µNX ∈ P(E) associ´ee par
µNX(dx) := 1 N
XN i=1
δxi(dx)∈P(E).
On d´efinit ainsi une application ΠNE :EN → P(E). Mieux, en notant PN(E) l’ensemble des mesures empiriques de la forme ci-dessus (N masses de Dirac de poids 1/N), on d´efinit une application bijective
ΠNE : EN/SN → PN(E), X7→µNX.
On munit P(E) d’une distance D m´etrisant sa topologie/convergence faible. On va voir dans cette section que ΠNE est alors un hom´eomorphisme de (EN/SN, wp) dans (PN(E), D). C’est mˆeme une isom´etrie lorsque PN(E) est muni d’une distance de trans-port convenable, ce que nous verrons dans la section subsec:MFG-3
1.4.
Nous allons donc maintenant rappeler la d´efinition de l’espace P(E), exhiber deux distances sur P(E) et ´etablir quelques propri´et´es deP(E).
L’espace P(E). On d´efinit l’espace M1(E) des mesures de Radon sur E comme ´etant l’espace dual de l’espaceC(E) des fonctions continues muni de la norme de la convergence uniforme, on note M1(E) = (C(E))′. Comme C(E) est un espace de Banach, M1(E) est ´egalement un espace de Banach lorsqu’il est muni de la norme duale “de la variation totale”
∀Λ∈M1(E) kΛkT V := sup
ϕ∈C(E),kϕk≤1|hΛ, ϕi|.
De plus, pour tout Λ∈M1(E) il existe une unique d´ecomposition Λ = Λ+−Λ−, Λ±≥0, kΛkT V =kΛ+kT V +kΛ−kT V,
o`u la positivit´e Λ±≥0 signifie queϕ∈C(E),ϕ≥0, impliquehΛ, ϕi ≥0. On noteM+1(E) le cˆone des “mesures de Radon positives”.
D’autre part, on d´efinit l’ensemble M+1(E) des“mesures de Borel positives finies” sur E comme l’ensemble des fonctions d’ensemble σ-additives sur la tribuBE `a valeurs dans R+. Soit donc µ∈ M+1(E) si µ:BE → R+, µ(∅) = 0 et pour toute famille (Ai)i∈I finie ou d´enombrable deBE deux `a deux disjointesAi 6=Aj si i, j∈I et i6=j, on a
µ[
i∈I
Ai
=X
i∈I
µ(Ai).
A une telle mesureµ ∈M+1(E), on peut associer une int´egrale de Lebesgue d´efinie pour les fonctions mesurables et positives, pour toutes les fonctions int´egrables et donc, en particulier, pour toutes les fonctions continues (et born´ees). On d´efinit ainsi
Iµ:C(E)→R, ϕ7→Iµ(ϕ) =hIµ, ϕi:=
Z
E
ϕ dµ= Z
E
ϕ(x)µ(dx).
L’applicationIµ est lin´eaire, positive et born´ee, c’est donc un ´el´ement deM+1(E), et kIµkT V = sup
ϕ∈C(E),kϕk≤1
Z
E
ϕ dµ =
Z
E
dµ=µ(E).
th:RieszMarkovCompact Th´eor`eme 1.2.5 (Riesz-Markov) Lorsque E est compact, on a la r´eciproque : pour tout Λ∈M+1(E) il existe un unique ρ∈M+1(E) tel que
∀ϕ∈C(E), hΛ, ϕi=Iρ(ϕ).
Ainsi, l’application M+1(E) →M+1(E), ρ →Iρ, est bijective et on peut identifier M+1(E) et M+1(E). On note d´esormais Iρ=ρ.
De la mˆeme mani`ere on caract´erise l’ensemble des mesures de probabilit´es grˆace aux deux d´efinitions ´equivalentes suivantes
P(E) ={Λ∈M+1(E), hΛ,1i= 1}={µ∈M+1(E), µ(E) = 1}. En d´efinissantM1(E) l’ensemble des mesures de Borel sign´ees par
M1(E) ={µ+−µ−, µ±∈M+1(E)}, on g´en´eralise la notion d’int´egrale en posant
Iµ(f) = Z
E
f(x)µ(dx) :=
Z
E
f(x)µ+(dx)− Z
E
f(x)µ−(dx)
pour toute fonction f ∈ L1(E,BE,|µ|) o`u |µ| = µ++µ− est une mesure de Borel po-sitive. Grˆace `a la d´ecomposition des mesures de Radon en diff´erence de mesures de Ra-don positives et grˆace au th´eor`eme de Riesz-Markov on a ´egalement que l’application
M1(E)→ M1(E),ρ →Iρ, est bijective et on peut identifierM1(E) et M1(E). On note toujoursIρ=ρ. Ainsi, on a
∀ρ∈M1(E) |ρ|(E) = kρkT V := sup
ϕ∈C(E),kϕk≤1
Z
E
ϕ dρ
:= inf{µ+(E) +µ−(E); µ±≥0, µ+−µ−=ρ}
o`u donc ici|ρ|=ρ++ρ−avecρ±est la d´ecomposition de Hahn deρobtenue en choisissant ρ± ≥ 0 ´etrang`eres (∃A tel que ρ+(A) = 0 et ρ−(E\A) = 0) dans la classe des mesures η±≥0 v´erifiantρ=η+−η−.
Convergence faible dans P(E). Lorsque E est compact, on dit qu’une suite (µn) de P(E) converge faiblement vers µ∈P(E), on noteµn⇀ µ, si
∀ϕ∈C(E) Z
E
ϕ dµn → Z
E
ϕ dµ.
Il s’agit bien sˆur ici de la (trace surP(E) de la) convergence faible ∗ σ(M1(E), C(E)).
th:BanachAlaoglu Th´eor`eme 1.2.6 (Banach-Alaoglu pour P(E)). On suppose E compact. L’ensemble P(E) est s´equentiellement compact au sens de la convergence faible.
Preuve du th´eor`eme de Banach-Alaoglu pour P(E). Soit (µn) une suite de P(E). D’une part C(E) est s´eparable et on note (ϕk) une famille d´enombrable et dense dans C(E).
Alors, par compacit´e de [−kϕkk,kϕkk] pour tout k ∈ N∗ et par le proc´ed´e de Cantor d’extraction d’une sous-suite diagonale, il existe une sous-suite (µn′) et une suite λk ∈R telles que hµn′, ϕki → λk lorsque n′ → ∞. Maintenant pour tout ϕ ∈ C(E), on obtient
´egalement qu’il existe λϕ ∈R tel quehµn′, ϕi →λϕ lorsquen′→ ∞ en approchant ϕpar une suite (ϕk′). On constante que l’application Λ :C(E) →R, Λ(ϕ) = λϕ est lin´eaire et positive (donc continue) et Λ(1) = 1. Par le th´eor`eme de Riesz-Markov c’est une mesure
de probabilit´e. ⊔⊓
th:densitePN Th´eor`eme 1.2.7 (Krein-Milman pour les mesures). On suppose E compact. Les combinaisons convexes de masses de Dirac sont denses au sens de la convergence faible.
En d’autres termes et plus pr´ecis´ement, (PN(E))N≥1 est dense dans P(E).
Preuve 1 du th´eor`eme th:densitePN
1.2.7. Les masses de Dirac sont les points extr´emaux1 de P(E).
En effet, si δa = t µ+ (1−t)ν, avec a∈E, t∈ (0,1), µ, ν ∈P(E) alors n´ecessairement suppµ= suppν ={a}, et doncµ=ν =δa. Inversement, si µ∈P(E) et µn’est pas une masse de Dirac, alors il existeϕ∈C(E), 0≤ϕ≤1 telle queµ(ϕ)>0 etµ(1−ϕ)>0, de sorte que l’on peut ´ecrire µsous la forme d’une combinaison convexe
µ=µ(ϕ) ([µ(ϕ)]−1ϕ µ) + (1−µ(ϕ)) ([µ(1−ϕ)]−1(1−ϕ)µ),
et donc µ n’est pas un point extr´emal. Il suffit alors d’appliquer le Th´eor`eme thKMabsA.3.5 de Krein-Milman.
Preuve 2 du th´eor`eme th:densitePN
1.2.7. Comme E est compact, pour tout k, il existe Nk ∈ N et (xki)1≤i≤Nk une suite de E tels que E ⊂ ∪B(xki,1/k), puis il existe une suite (ϕki)
1voir la D´efinitionKMdef1
A.3.3 pour la d´efinition d’un point extr´emal
de partitions de l’unit´e dans C(E) associ´ee au recouvrement par les B(xki,1/k). Plus pr´ecis´ement, il existeϕki ∈C(E), 1≤i≤Nk, telles que suppϕki ⊂B(xki,1/k), 0≤ϕki ≤1 et PNk
i=1ϕki = 1. Pour construire de telles fonctions dans le cas E ⊂ Rd (dans le cas g´en´eral consulter un cours de topologie) on choisitNk et (xki)1≤i≤Nk tels que de plusE ⊂
∪B(xki,1/(2k)), on consid`ere un noyau de convolution 0≤ γ ∈ C(Rd), suppγ ⊂B(0,1), Rγ = 1, on note γε(x) =ε−dγ(x/ε) et on d´efinit
ϕki := φki PNk
j=1φkj, φkj =1B(xk
i,1/(2k))∗γ1/(2k). On pose maintenant
µk :=
Nk
X
i=1
µ(ϕki)δxk i. Pour toutψ∈C(E) on a alors
hµk, ψi=
Nk
X
i=1
µ(ϕki)ψ(xki) =hµ, ψki avec ψk :=
Nk
X
i=1
ψ(xki)ϕki. Or, pour toutx∈E, on a
ψ(x)−ψk(x) =
Nk
X
i=1
(ψ(x)−ψ(xki))ϕki(x)
≤
Nk
X
i=1
sup
1≤i≤Nk
kψ−ψ(xki)kL∞(B(xki,1/k))ϕki(x)≤ω(1/k)→0 lorsquek→ ∞, o`u ω d´esigne un module de continuit´e de ψ, i.e. ω ∈C(R+),ω(s) >0 si s 6= 0. On en d´eduit bien que hµk, ψi → hµ, ψi. Pour ´etablir la densit´e de (PN(E))N≥1 dansP(E) il suffit enfin d’approcherµk par un ´el´ement µk,N de PN(E) en rempla¸cant les coefficients µ(ϕki) par [N µ(ϕki)]/N pour tout 2 ≤ i ≤ N et en rempla¸cant le coefficient µ(ϕk1) par ce qu’il faut de sorte que µk,N soit de masse 1. ⊔⊓ Distances sur P(E). L’objectif est maintenant de d´efinir deux m´etriques sur P(E) telles que la notion de convergence associ´ee soit la convergence faible d´efinie plus haut. On note Lip(E) l’espace des fonctions Lipschitziennes surE et Lip1(E) l’espace des fonctions Lipschitziennes surE de constante de Lipschitz inf´erieure `a 1 :
ϕ∈Lip1(E) si, et seulement si, |ϕ(y)−ϕ(x)| ≤dE(x, y) ∀x, y∈E.
On noteM01(E) le sous-espace (ferm´e) des mesures de Radon de masse nulle : µ∈M01(E) si, et seulement si,µ∈M1(E) et
Z
E
dµ= 0.
def&lem:distKR Lemme 1.2.8 (i) Pour tout µ∈M01(E) on d´efinit kµkKR:= sup
Z
E
ϕ dµ; ϕ∈Lip1(E)
.
L’application µ 7→ kµkKR est une norme sur M01(E), appel´ee norme de Kantorovich-Rubinstein, et donc l’application P(E)×P(E)→R+, (µ, ν)7→DKR(µ, ν) :=kµ−νkKR
d´efinit une distance sur P(E).
(ii) Soit R >0 tel queE ⊂B(0, R). Pour tout µ∈M01(E) on a kµkKR ≤RkµkT V.
(iii) Pour tout X, Y ∈EN on a ineq:KRW1
ineq:KRW1 (1.2.3) kµNX−µNYkKR ≤w1(X, Y).
Preuve du lemme def&lem:distKR
1.2.8 . La v´erification de (i) ne pose pas de difficult´e d`es que l’on sait que Lip(E) est dense dans C(E). Lorsque E ⊂ Rd on peut proc´eder par r´egularisation par convolution. Dans le cas g´en´eral, on utilise le th´eor`eme A.2.2 de Stone-Weierstrass.thStoneW (ii) On ´ecrit pour tout ϕ∈Lip1(E)
Z
E
ϕ dµ = Z
E
(ϕ(x)−ϕ(0)) (µ+(dx)−µ−(dx))
≤ Z
E|x|(µ+(dx) +µ−(dx))≤R|µ|(E), et on prend le supr´emum enϕ.
(iii) Pour toutϕ∈Lip1(E) etσ∈SN on a
|hµNX −µNY, ϕi|=
1 N
XN i=1
(ϕ(xi)−ϕ(yσ(i))) ≤ 1
N|xi−yσ(i)|
d’o`u on d´eduit (1.2.3) en prenant le minimum enineq:KRW1 σ et le supr´emum en ϕ. ⊔⊓ lem:topoPE1 Lemme 1.2.9 (i) Etant donn´ee une suite(ϕk)dense dansC(E)et une suite (ak)de r´eels
strictement positifs telle que la s´erie ((akkϕkk)) converge, l’application D(µ, ν) :=
X∞ k=1
ak|hµ−ν, ϕki|
d´efinit une distance sur P(E).
(ii) De mˆeme, si de plus(ϕk) est une suite de Lip(E) et si la s´erie((akk∇ϕkk))converge et est de somme A, alors l’application D d´efinie ci-dessus est encore une distance, et de plus
∀µ, ν∈P(E) D(µ, ν)≤Akµ−νkKR. Preuve du Lemme lem:topoPE1
1.2.9. Traitons seulement (ii), le point (i) se traitant de la mˆeme mani`ere. D’une part, puisqueµ−ν ∈M01(E) et en fixantx0∈E, on a
D(µ, ν) = X∞ k=1
akk∇ϕkk |hµ−ν,ϕk−ϕk(x0) k∇ϕkk i| ≤
X∞ k=1
akk∇ϕkk kµ−νkKR. D’autre part, pour montrer queDest une distance, le seul point qui m´erite d’ˆetre d´etaill´e est l’implicationD(µ, ν) = 0 entraˆıneµ=ν. Or sous cette hypoth`ese, on ahµ−ν, ϕki= 0 pour toutk, et si ϕ∈C(E) est une fonction quelconque, il existe une sous-suite (ϕkj) qui converge uniform´ement versϕet donc ´egalement hµ−ν, ϕi= limhµ−ν, ϕkji= 0. ⊔⊓
theoMK&Cvgce* Th´eor`eme 1.2.10 Pour toute suite (µn) de P(E) et tout µ ∈ P(E), il y a ´equivalence entre
(i) D(µn, µ)→0 lorsque n→ ∞ (pour une distance d´efinie comme au lemme lem:topoPE1
1.2.9) ; (ii) kµn−µkKR →0 lorsque n→ ∞;
(iii) µn ⇀ µau sens de la convergence faible lorsque n→ ∞. Preuve du th´eor`eme theoMK&Cvgce*
1.2.10. On proc`ede en plusieurs ´etapes.
Etape 1. (i) ⇔ (iii) (tr`es classique). Si D(µn, µ) → 0 alors hϕk, µn−µi → 0 ∀k. Pour ϕ∈C(E) quelconque, pour toutε >0 et en prenantk tel quekϕ−ϕkk< ε, on a
lim sup
n→∞ |hϕ, µn−µi| ≤sup
n kµn−µkT V kϕ−ϕkk+ lim
n→∞h|ϕk, µn−µi| ≤2ε, puisque kµn−µkT V ≤ kµnkT V +kµkT V =µn(E) +µ(E) = 2. Ainsiµn ⇀ µfaiblement.
R´eciproquement, supposons queµn ⇀ µfaiblement. Pourε >0 fixonsK tel que X∞
K+1
ak2kϕkk ≤ε,
puis N de sorte queak|hϕk, µn−µi| ≤ε/K pour n≥N etk = 1, ..., K, alors pour tout n≥N
D(µn, µ)≤ sup
k=1,...,K
ak|hµ−µn, ϕki|+ X∞ k=K+1
ak|hµ−µn, ϕki| ≤2ε.
Etape 2. (ii)⇒ (iii).Supposons (ii). Pour tout ϕ∈Lip(E) on a
Z
E
ϕ d(µn−µ)
≤ kϕkLipkµn−µkKR→0 lorsque k→0.
Par densit´e Lip(E)⊂C(E) on en d´eduit (iii).
Etape 3. (iii) ⇒ (ii). Supposons (iii) et que, par l’absurde, on n’ait pas (ii) : ∃ε > 0 et une sous-suite de (µn), toujours not´ee (µn), telle que
∀k ∃ϕn∈Lip(E), kϕnkLip≤1 Z
E
ϕnd(µn−µ)≥ε.
Par le th´eor`eme d’Ascoli, il existe une sous-suite de (ϕn), toujours not´ee (ϕn), et ϕ∞ ∈ C(E) telles queϕn→ϕ∞ uniform´ement. On a alors
lim inf Z
E
ϕ∞d(µn−µ) =
= lim Z
E
(ϕ∞−ϕn)d(µn−µ) + lim inf Z
E
ϕnd(µn−µ)≥0 +ε >0,
ce qui contredit la convergence µn⇀ µ. ⊔⊓