2.3 Autres définitions de la distance de Wasserstein
2.3.1 Le problème de Monge
Z Z
[0,1]×Ω
ρ|v|2dtdx (BB)
avec
C(ρ0, ρ1) :=
(ρ, v) tel que
∂tρ+div(ρv) = 0,
ρ(t= 0) =ρ0, ρ(t= 1) =ρ1,
ρv·~n= 0 p.p. sur [0,1]×∂Ω
où les équations sont à prendre au sens faible. Il existe d’autres écritures de la distance de Wasserstein
qui sont les plus couramment introduites dans les ouvrages de référence du transport optimal puisque
historiquement plus anciennes. Nous allons les présenter dans cette partie. L’équivalence entre les
différentes écritures de la distance ajoute de la richesse à la compréhension du transport optimal. En
particulier, nous les utiliserons toutes dans le suite de ce manuscrit pour prouver différents résultats
ou pour la construction de schémas numériques.
Nous écrirons donc les équivalences entre les différentes formes du transport optimal. Ces
équi-valences sont bien connues. Cependant, les liens entre les différents éléments optimaux sont décrits
de manière succincte et éparse dans la littérature, c’est pourquoi nous avons souhaité les regrouper
proprement dans ce manuscrit. On notera notamment l’élément central de ces éléments optimaux
qui est le potentiel de Kantorovich.
2.3.1 Le problème de Monge
En 1781 Gaspard Monge introduit le problème du transport optimal dans un traité appelé
Mémoires sur les déblais et les remblais [Monge, 1781]. G. Monge se pose le problème suivant :
comment remplir un trou avec un tas de sable, en minimisant l’énergie totale pour le déplacer ?
On représente le tas de sable par une densité ρ0(x), le trou par une densitéρ1(y)1, et le
déplace-ment par une fonction T(x) qui déplace la quantité de sable présente en x vers le point y =T(x),
voir figure 2.11. Le coût du déplacement associé àT est :
Z
Ω
c(x, T(x))ρ0(x)dx.
Le terme c(x, y) est le coût de déplacement d’une unité de sable de x vers y. Il est courant de
prendre le coût quadratique c(x, y) = |x−y|2/2. Ainsi, on cherche le déplacement (ou le plan de
transport)T optimisant ce coût.
x T(x)
ρ0
−ρ1
Figure 2.11 – Problème de Monge entre le tas de sable à gauche représenté parρ0(x) et le trou à
droite représenté par −ρ1(y). Le plan de transport T(x) indique la destination du sable contenu en
x. La valeur de ρ0 enx ne doit pas forcément être égale à la valeur deρ1 enT(x); grâce aux effets
de compression/dilatation locale deT on permet au sable de s’étaler ou de se concentrer enT(x).
Il y a plusieurs contraintes sur les données :
• Le tas de sable et le trou doivent avoir le même volume, qu’on fixe égal à 1. De plus les
fonctions qui les représentent doivent être positives. Ainsi on retrouve que la contrainte sur
ρ0 etρ1 est :
ρ0, ρ1∈ P(Ω).
• Le déplacementT est aussi assujetti à une contrainte, la contrainte de transport. En effet, il
doit déplacer le tas dans le trou, ce qu’on noteT#ρ0 =ρ1. On va écrire ceci
mathématique-ment. On ne demande pas que la masse envoyée sur T(x) soit exactement la même que celle
provenant de x. Ainsi on peut avoir ρ0(x) 6=ρ1(T(x)). Plutôt, on écrit les choses ainsi : soit
A⊂Ωun ensemble quelconque. Tout le sable qui a été transporté surA est exactement tout
le sable qui était enT−1(A) :
∀A⊂Ω,
Z
T
−1(A)
ρ0(x)dx=
Z
A
ρ1(y)dy. (2.3.1)
1. Le réel problème que se posait Monge était celui-ci mais dans le cas oùρ
0etρ
1valent 1 sur un ensemble et 0
Pour des plans de transport T différentiables, on peut effectuer un changement de variable
dans (2.3.1) et la condition de transport est équivalente à :
ρ1(T(x))|det(∇T)|(x) =ρ0(x). (2.3.2)
Pour résumer, le problème de Monge est :
minimiser
T
1
2
Z
Ω
|x−T(x)|2ρ0(x)dx
sous la contrainte : T#ρ0=ρ1 (voir (2.3.1) ou (2.3.2))
(M)
Il existe un résultat d’existence d’un plan de transport T minimiseur. C’est le théorème de
Brenier [Brenier, 1991] :
Théorème 2.3.1 (Théorème de Brenier)
Soient ρ0, ρ1 ∈ P(Ω). Il existe une fonction scalaire Ψ(x), convexe, telle que T = ∇Ψ est
minimiseur de (M).
Théorème 2.3.2 (Théorème de Benamou-Brenier [Benamou et Brenier, 2000])
Les deux problèmes (BB)et (M)sont équivalents, c’est-à-dire que les valeurs des minima sont
égales (au carré de la distance de Wasserstein). De plus, le(ρ, v)∈C(ρ0, ρ1)optimum pour (BB)
et leT optimal pour (M)sont liés par le fait que v(t, x) résout l’équation de Burgers
∂tv+v· ∇v= 0
de condition initiale
v(0, x) =T(x)−x.
L’ébauche de la démonstration manipule l’équation de continuité pour passer d’une formulation
à l’autre. Elle n’est pas essentielle pour la compréhension du reste du manuscrit. C’est une ébauche
puisqu’elle suppose un peu de régularité sur les densités. Elle est tirée de [Benamou et Brenier, 2000].
Démonstration : La preuve s’appuie sur la résolution de l’équation de continuité par les
caractéris-tiques. Soitv une vitesse, siρ(t, x)est solution de l’équation de continuité
∂
tρ+div(ρv) = 0,
alors il existe un plan de transportT
t(x)(la caractéristique) tel queρest donné explicitement par
ρ(t, T
t(x))|det(∇T
t(x))|=ρ
0(x) (2.3.3)
qu’on note aussiT
t#ρ
0=ρ(t), avecT
t(x)la caractéristique de piedx, définie par l’équation
∂T
t(x)
∂t =v(t, T
t(x))avecT
0(x) =x. (2.3.4)
Dans le problème (BB), l’énergie cinétique se récrit avec ces caractéristiques à l’aide d’un changement
de variable x = T
t(y), ce qui fait disparaître la vitesse. En effet, soit (ρ, v) ∈ C(ρ
0, ρ
1) et soit la
caractéristique T
tliée àv, alors l’énergie cinétique se récrit
E(ρ, v) = 1
2
Z Z
[0,1]×Ωρ|v|
2dtdx =
x=Tt(y)1
2
Z Z
[0,1]×Ωρ(t, T
t)|v(t, T
t)|
2|det(∇T
t)|dtdy
=
(2.3.3) (2.3.4)1
2
Z Z
[0,1]×Ωρ
0(y)|∂
tT
t(y)|
2dtdy
≥
Jensen1
2
Z
Ωρ
0(y)
Z
[0,1]∂
tT
t(y)dt
2dy
= 1
2
Z
Ωρ
0(y)|T
1(y)−y|
2dy.
(2.3.5)
Et comme T
1vérifie la condition de transport T
1#ρ
0=ρ
1, on a prouvé en prenant l’infimum sur
tous les plans de transport T que
∀(ρ, v)∈C(ρ
0, ρ
1), E(ρ, v)≥C
M(2.3.6)
en notant C
Mla valeur du problème de Monge (M). On rappelle que le problème (BB) consiste à
prendre l’infimum (notéC
BB) de l’énergie cinétique sur les (ρ, v)appartenant àC(ρ
0, ρ
1). Ainsi, en
prenant l’infimum dans (2.3.6), on peut tomber sur deux cas : soitC
BB> C
M, soitC
BB=C
M. On
va montrer qu’on est dans ce deuxième cas en exhibant un couple(ρ, v)dont l’énergie cinétique égale
la valeur du problème de Monge.
En reprenant le calcul (2.3.5), on a en fait en reprenant les notations que l’égalité
E(ρ, v) = 1
2
Z
Ω
ρ
0(y)|T
1(y)−y|
2dy.
n’est possible que dans le cas d’égalité dans l’inégalité de Jensen, ce qui arrive lorsque ∂
tT
t(x)est
une constante du temps ; doncT
t(x) =x+t(T
1(x)−x). Ceci se produit lorsque la vitessevassociée
résout l’équation de Burgers
∂
tv+v· ∇v= 0
de condition initiale v(0, x) =T
1(x)−x.
Ainsi, soitT le transport optimal entreρ
0etρ
1, celui qui résout le problème de Monge (M). Soit
v(t)un champ de vitesse qui résout l’équation de Burgers de condition initialev(0, x) =T(x)−x. Ce
champv(t)existe pourt∈[0,1]car la caractéristique associéeT
t(x) = (1−t)x+tT(x)est toujours
inversible (voir le théorème de Brenier 2.3.1 qui dit que T a les propriétés suffisantes pour : c’est le
gradient d’une fonction convexe). Soit ρ(t) la densité résolvant l’équation de continuité avec cette
vitesse v, et de condition initiale ρ
0. Par construction, ce couple est d’énergie cinétique égale à la
valeur du problème de Monge. Il reste à montrer que ce couple(ρ, v)appartient àC(ρ
0, ρ
1):
• premièrement, ρ(t)satisfait l’équation de continuité etρ(0) =ρ
0;
• ensuite, ρ(1) =ρ
1. En effet, commeρ vérifie l’équation de continuité, (2.3.3) est vérifié avec
T
tla caractéristique. Donc on a à t= 1:
ρ(1, T
1)|det(∇T
1)|=ρ
0.
De plus,T est le transport optimal entreρ
0et ρ
1, et vérifie notammentT#ρ
0=ρ
1:
ρ
1(T)|det(∇T)|=ρ
0.
En utilisant queT
1=T et en divisant une équation par l’autre, on trouve que ρ(1) =ρ
1.
• Enfin, ρv·~n = 0 presque partout sur le bord du domaine et pour presque tout temps. En
effet, ceci se base sur (i) le fait que la caractéristique s’écrit T
t(x) = tT(x) + (1−t)x, que
(ii) le domaine Ω est convexe,(iii) T(x)∈Ω pour tout x. Par conséquent, T
t(x)∈ Ωpour
tout temps. Ainsi, une particule ne sort jamais du domaine, ce qui s’exprime par le fait
que v(t, x)·~n(x) ≤0 sur ∂Ω. Mais comme ρ
0et ρ
1sont de même masse, on a en fait que
Donc ceci montre queC
BB=C
M. Le couple(ρ, v)ainsi construit est aussi le couple optimal pour le
problème de Benamou-Brenier.
Remarque 2.3.3
La différence entre le problème de Monge (M) et la formulation Benamou-Brenier (BB) est
que l’on cherche un plan de transport T(x) à la place d’un chemin ρ(t, x) et d’un champ de
vitessev(t, x). La dimension temporelle a disparu. Ce problème plus simple à écrire souffre d’un
gros défaut : la contrainte de transport (2.3.2) est très difficile à gérer, notamment à cause du
déterminant du gradient de T.
La démonstration du précédent théorème fait ressortir un point important du transport
opti-mal : la caractérisation du chemin optiopti-mal(ρ, v). La proposition suivante 2.3.4 permet premièrement
d’écrire l’équation surρ plus simplement, et deuxièmement, de simplifier encore l’équation de
Bur-gers sur v. Cette proposition est issue de [Villani, 2003, Ex.5.42].
Proposition 2.3.4
Soit(ρ, v)∈C(ρ0, ρ1) le chemin optimal entreρ0 etρ1, etT =∇Ψle transport optimal. Alors :
1. ρ(t)s’écrit aussi :
ρ(t) = ((1−t)Id+t∇Ψ)#ρ0;
2. on a quev(t, x) =∇φ(t, x), avecφ(t, x) solution de l’équation d’Hamilton-Jacobi
∂tφ+ |∇φ|
2
2 = 0, φ(0, x) = Ψ(x)−
|x|2
2 . (2.3.7)
Si bien que les équations du minimiseur du transport optimal (ρ, v=∇φ)s’écrivent :
∂tρ+div(ρ∇φ) = 0
∂tφ+|∇φ|
2
2 = 0
ρ(0) =ρ0, ρ(1) =ρ1, φ(0, x) = Ψ(x)−|x|
2
2 .
(2.3.8)
Démonstration : Le premier point se démontre à l’aide des caractéristiques. SoitT
tla caractéristique
associée àv. Commevsuit une équation de Burgers et que v(0, x) =T(x)−x, on a que
T
t(x) =x+tv(0, x) = (1−t)x+t∇Ψ(x)
Commeρsuit une équation de continuité de vitessev, on écrit sa solution comme dans (2.3.3) dans
la preuve du théorème précédent,
ρ(t) =T
t#ρ
0= ((1−t)Id+t∇Ψ)#ρ
0.
Pour le deuxième point, on prendφrésolvant l’équation d’Hamilton-Jacobi (2.3.7). En appliquant
l’opérateur ∇ à cette équation, on trouve que ∇φ résout également l’équation de Burgers avec la
même condition initiale quev. Par unicité des solutions de l’équation de Burgers,∇φ(t, x)et v(t, x)
Dans le document
Transport optimal pour l'assimilation de données images
(Page 45-50)