Le problème de Monge

2.3 Autres définitions de la distance de Wasserstein

2.3.1 Le problème de Monge

Z Z

[0,1]×Ω

ρ|v|²dtdx (BB)

avec

C(ρ₀, ρ₁) :=







(ρ, v) tel que

∂_tρ+div(ρv) = 0,

ρ(t= 0) =ρ₀, ρ(t= 1) =ρ₁,

ρv·~n= 0 p.p. sur [0,1]×∂Ω







où les équations sont à prendre au sens faible. Il existe d’autres écritures de la distance de Wasserstein

qui sont les plus couramment introduites dans les ouvrages de référence du transport optimal puisque

historiquement plus anciennes. Nous allons les présenter dans cette partie. L’équivalence entre les

différentes écritures de la distance ajoute de la richesse à la compréhension du transport optimal. En

particulier, nous les utiliserons toutes dans le suite de ce manuscrit pour prouver différents résultats

ou pour la construction de schémas numériques.

Nous écrirons donc les équivalences entre les différentes formes du transport optimal. Ces

équi-valences sont bien connues. Cependant, les liens entre les différents éléments optimaux sont décrits

de manière succincte et éparse dans la littérature, c’est pourquoi nous avons souhaité les regrouper

proprement dans ce manuscrit. On notera notamment l’élément central de ces éléments optimaux

qui est le potentiel de Kantorovich.

2.3.1 Le problème de Monge

En 1781 Gaspard Monge introduit le problème du transport optimal dans un traité appelé

Mémoires sur les déblais et les remblais [Monge, 1781]. G. Monge se pose le problème suivant :

comment remplir un trou avec un tas de sable, en minimisant l’énergie totale pour le déplacer ?

On représente le tas de sable par une densité ρ₀(x), le trou par une densitéρ₁(y)¹, et le

déplace-ment par une fonction T(x) qui déplace la quantité de sable présente en x vers le point y =T(x),

voir figure 2.11. Le coût du déplacement associé àT est :

Z

Ω

c(x, T(x))ρ₀(x)dx.

Le terme c(x, y) est le coût de déplacement d’une unité de sable de x vers y. Il est courant de

prendre le coût quadratique c(x, y) = |x−y|2/2. Ainsi, on cherche le déplacement (ou le plan de

transport)T optimisant ce coût.

x ^T(x)

ρ₀

−ρ₁

Figure ^{2.11 – Problème de Monge entre le tas de sable à gauche représenté par}ρ₀(x) et le trou à

droite représenté par −ρ1(y). Le plan de transport T(x) indique la destination du sable contenu en

x. La valeur de ρ₀ enx ne doit pas forcément être égale à la valeur deρ₁ enT(x); grâce aux effets

de compression/dilatation locale deT on permet au sable de s’étaler ou de se concentrer enT(x).

Il y a plusieurs contraintes sur les données :

• Le tas de sable et le trou doivent avoir le même volume, qu’on fixe égal à 1. De plus les

fonctions qui les représentent doivent être positives. Ainsi on retrouve que la contrainte sur

ρ₀ etρ₁ est :

ρ₀, ρ₁∈ P(Ω).

• Le déplacementT est aussi assujetti à une contrainte, la contrainte de transport. En effet, il

doit déplacer le tas dans le trou, ce qu’on noteT#ρ0 =ρ1. On va écrire ceci

mathématique-ment. On ne demande pas que la masse envoyée sur T(x) soit exactement la même que celle

provenant de x. Ainsi on peut avoir ρ₀(x) 6=ρ₁(T(x)). Plutôt, on écrit les choses ainsi : soit

A⊂Ωun ensemble quelconque. Tout le sable qui a été transporté surA est exactement tout

le sable qui était enT⁻¹(A) :

∀A⊂Ω,

Z

T

−1

(A)

ρ₀(x)dx=

Z

A

ρ₁(y)dy. (2.3.1)

1. Le réel problème que se posait Monge était celui-ci mais dans le cas oùρ

etρ

valent 1 sur un ensemble et 0

Pour des plans de transport T différentiables, on peut effectuer un changement de variable

dans (2.3.1) et la condition de transport est équivalente à :

ρ₁(T(x))|det(∇T)|(x) =ρ₀(x). (2.3.2)

Pour résumer, le problème de Monge est :

minimiser

T

1

2 Z

Ω

|x−T(x)|2ρ₀(x)dx

sous la contrainte : T#ρ₀=ρ₁ (voir (2.3.1) ou (2.3.2))

(M)

Il existe un résultat d’existence d’un plan de transport T minimiseur. C’est le théorème de

Brenier [Brenier, 1991] :

Théorème 2.3.1 (Théorème de Brenier)

Soient ρ0, ρ1 ∈ P(Ω). Il existe une fonction scalaire Ψ(x), convexe, telle que T = ∇Ψ est

minimiseur de (M).

Théorème 2.3.2 (Théorème de Benamou-Brenier [Benamou et Brenier, 2000])

Les deux problèmes (BB)et (M)sont équivalents, c’est-à-dire que les valeurs des minima sont

égales (au carré de la distance de Wasserstein). De plus, le(ρ, v)∈C(ρ0, ρ1)optimum pour (BB)

et leT optimal pour (M)sont liés par le fait que v(t, x) résout l’équation de Burgers

∂_tv+v· ∇v= 0

de condition initiale

v(0, x) =T(x)−x.

L’ébauche de la démonstration manipule l’équation de continuité pour passer d’une formulation

à l’autre. Elle n’est pas essentielle pour la compréhension du reste du manuscrit. C’est une ébauche

puisqu’elle suppose un peu de régularité sur les densités. Elle est tirée de [Benamou et Brenier, 2000].

Démonstration : La preuve s’appuie sur la résolution de l’équation de continuité par les

caractéris-tiques. Soitv une vitesse, siρ(t, x)est solution de l’équation de continuité

∂

ρ+div(ρv) = 0,

alors il existe un plan de transportT

(x)(la caractéristique) tel queρest donné explicitement par

ρ(t, T

(x))|det(∇T

(x))|=ρ

(x) (2.3.3)

qu’on note aussiT

#ρ

₀

=ρ(t), avecT

(x)la caractéristique de piedx, définie par l’équation

∂T

(x)

∂t ⁼^v⁽^{t, T}

⁽^x⁾⁾^avec^T

⁰

⁽^x^{) =}^x. ^(2.3.4)

Dans le problème (BB), l’énergie cinétique se récrit avec ces caractéristiques à l’aide d’un changement

de variable x = T

(y), ce qui fait disparaître la vitesse. En effet, soit (ρ, v) ∈ C(ρ

, ρ

) et soit la

caractéristique T

liée àv, alors l’énergie cinétique se récrit

E(ρ, v) = ¹

2 Z Z

[0,1]×Ω

ρ|v|

dtdx =

x=T_t(y)

1

2 Z Z

[0,1]×Ω

ρ(t, T

)|v(t, T

)|

|det(∇T

)|dtdy

=

(2.3.3) (2.3.4)

1

2 Z Z

[0,1]×Ω

ρ

₀

(y)|∂

T

(y)|

dtdy

≥

Jensen

1

2 Z

Ω

ρ

(y)

Z

[0,1]

∂

T

(y)dt

dy

= ¹

2 Z

Ω

ρ

(y)|T

(y)−y|

dy.

(2.3.5)

Et comme T

vérifie la condition de transport T

#ρ

=ρ

, on a prouvé en prenant l’infimum sur

tous les plans de transport T que

∀(ρ, v)∈C(ρ

, ρ

), E(ρ, v)≥C

(2.3.6)

en notant C

la valeur du problème de Monge (M). On rappelle que le problème (BB) consiste à

prendre l’infimum (notéC

_BB

) de l’énergie cinétique sur les (ρ, v)appartenant àC(ρ

₀

, ρ

₁

). Ainsi, en

prenant l’infimum dans (2.3.6), on peut tomber sur deux cas : soitC

_BB

> C

, soitC

_BB

=C

. On

va montrer qu’on est dans ce deuxième cas en exhibant un couple(ρ, v)dont l’énergie cinétique égale

la valeur du problème de Monge.

En reprenant le calcul (2.3.5), on a en fait en reprenant les notations que l’égalité

E(ρ, v) = ¹

2 Z

Ω

ρ

₀

(y)|T

₁

(y)−y|

dy.

n’est possible que dans le cas d’égalité dans l’inégalité de Jensen, ce qui arrive lorsque ∂

T

(x)est

une constante du temps ; doncT

(x) =x+t(T

₁

(x)−x). Ceci se produit lorsque la vitessevassociée

résout l’équation de Burgers

∂

v+v· ∇v= 0

de condition initiale v(0, x) =T

(x)−x.

Ainsi, soitT le transport optimal entreρ

etρ

, celui qui résout le problème de Monge (M). Soit

v(t)un champ de vitesse qui résout l’équation de Burgers de condition initialev(0, x) =T(x)−x. Ce

champv(t)existe pourt∈[0,1]car la caractéristique associéeT

(x) = (1−t)x+tT(x)est toujours

inversible (voir le théorème de Brenier 2.3.1 qui dit que T a les propriétés suffisantes pour : c’est le

gradient d’une fonction convexe). Soit ρ(t) la densité résolvant l’équation de continuité avec cette

vitesse v, et de condition initiale ρ

₀

. Par construction, ce couple est d’énergie cinétique égale à la

valeur du problème de Monge. Il reste à montrer que ce couple(ρ, v)appartient àC(ρ

, ρ

):

• premièrement, ρ(t)satisfait l’équation de continuité etρ(0) =ρ

;

• ensuite, ρ(1) =ρ

. En effet, commeρ vérifie l’équation de continuité, (2.3.3) est vérifié avec

T

la caractéristique. Donc on a à t= 1:

ρ(1, T

₁

)|det(∇T

₁

)|=ρ

₀

.

De plus,T est le transport optimal entreρ

₀

et ρ

₁

, et vérifie notammentT#ρ

₀

=ρ

₁

:

ρ

(T)|det(∇T)|=ρ

.

En utilisant queT

=T et en divisant une équation par l’autre, on trouve que ρ(1) =ρ

.

• Enfin, ρv·~n = 0 presque partout sur le bord du domaine et pour presque tout temps. En

effet, ceci se base sur (i) le fait que la caractéristique s’écrit T

(x) = tT(x) + (1−t)x, que

(ii) le domaine Ω est convexe,(iii) T(x)∈Ω pour tout x. Par conséquent, T

(x)∈ Ωpour

tout temps. Ainsi, une particule ne sort jamais du domaine, ce qui s’exprime par le fait

que v(t, x)·~n(x) ≤0 sur ∂Ω. Mais comme ρ

et ρ

sont de même masse, on a en fait que

Donc ceci montre queC

=C

. Le couple(ρ, v)ainsi construit est aussi le couple optimal pour le

problème de Benamou-Brenier.

Remarque 2.3.3

La différence entre le problème de Monge (M) et la formulation Benamou-Brenier (BB) est

que l’on cherche un plan de transport T(x) à la place d’un chemin ρ(t, x) et d’un champ de

vitessev(t, x). La dimension temporelle a disparu. Ce problème plus simple à écrire souffre d’un

gros défaut : la contrainte de transport (2.3.2) est très difficile à gérer, notamment à cause du

déterminant du gradient de T.

La démonstration du précédent théorème fait ressortir un point important du transport

opti-mal : la caractérisation du chemin optiopti-mal(ρ, v). La proposition suivante 2.3.4 permet premièrement

d’écrire l’équation surρ plus simplement, et deuxièmement, de simplifier encore l’équation de

Bur-gers sur v. Cette proposition est issue de [Villani, 2003, Ex.5.42].

Proposition 2.3.4

Soit(ρ, v)∈C(ρ0, ρ1) le chemin optimal entreρ0 etρ1, etT =∇Ψle transport optimal. Alors :

1. ρ(t)s’écrit aussi :

ρ(t) = ((1−t)Id+t∇Ψ)#ρ₀;

2. on a quev(t, x) =∇φ(t, x), avecφ(t, x) solution de l’équation d’Hamilton-Jacobi

∂tφ+ ^|∇^φ^|

2 2 ^{= 0}^, ^φ⁽⁰^{, x}^{) = Ψ(}^x⁾⁻

|x|2

2 ^. ^(2.3.7)

Si bien que les équations du minimiseur du transport optimal (ρ, v=∇φ)s’écrivent :







∂_tρ+div(ρ∇φ) = 0

∂_tφ+^|∇^φ^|

2 2 ^{= 0}

ρ(0) =ρ₀, ρ(1) =ρ₁, φ(0, x) = Ψ(x)−^|^x^|

2 2 ^.

(2.3.8)

Démonstration : Le premier point se démontre à l’aide des caractéristiques. SoitT

la caractéristique

associée àv. Commevsuit une équation de Burgers et que v(0, x) =T(x)−x, on a que

T

(x) =x+tv(0, x) = (1−t)x+t∇Ψ(x)

Commeρsuit une équation de continuité de vitessev, on écrit sa solution comme dans (2.3.3) dans

la preuve du théorème précédent,

ρ(t) =T

#ρ

= ((1−t)Id+t∇Ψ)#ρ

.

Pour le deuxième point, on prendφrésolvant l’équation d’Hamilton-Jacobi (2.3.7). En appliquant

l’opérateur ∇ à cette équation, on trouve que ∇φ résout également l’équation de Burgers avec la

même condition initiale quev. Par unicité des solutions de l’équation de Burgers,∇φ(t, x)et v(t, x)

Dans le document Transport optimal pour l'assimilation de données images (Page 45-50)

2.3 Autres définitions de la distance de Wasserstein

2.3.1 Le problème de Monge

Z Z

[0,1]×Ω

ρ|v|2dtdx (BB)

avec

C(ρ0, ρ1) :=







(ρ, v) tel que

∂tρ+div(ρv) = 0,

ρ(t= 0) =ρ0, ρ(t= 1) =ρ1,

ρv·~n= 0 p.p. sur [0,1]×∂Ω







où les équations sont à prendre au sens faible. Il existe d’autres écritures de la distance de Wasserstein

qui sont les plus couramment introduites dans les ouvrages de référence du transport optimal puisque

historiquement plus anciennes. Nous allons les présenter dans cette partie. L’équivalence entre les

différentes écritures de la distance ajoute de la richesse à la compréhension du transport optimal. En

particulier, nous les utiliserons toutes dans le suite de ce manuscrit pour prouver différents résultats

ou pour la construction de schémas numériques.

Nous écrirons donc les équivalences entre les différentes formes du transport optimal. Ces

équi-valences sont bien connues. Cependant, les liens entre les différents éléments optimaux sont décrits

de manière succincte et éparse dans la littérature, c’est pourquoi nous avons souhaité les regrouper

proprement dans ce manuscrit. On notera notamment l’élément central de ces éléments optimaux

qui est le potentiel de Kantorovich.

2.3.1 Le problème de Monge

En 1781 Gaspard Monge introduit le problème du transport optimal dans un traité appelé

Mémoires sur les déblais et les remblais [Monge, 1781]. G. Monge se pose le problème suivant :

comment remplir un trou avec un tas de sable, en minimisant l’énergie totale pour le déplacer ?

On représente le tas de sable par une densité ρ0(x), le trou par une densitéρ1(y)1, et le

déplace-ment par une fonction T(x) qui déplace la quantité de sable présente en x vers le point y =T(x),

voir figure 2.11. Le coût du déplacement associé àT est :

Z

Ω

c(x, T(x))ρ0(x)dx.

Le terme c(x, y) est le coût de déplacement d’une unité de sable de x vers y. Il est courant de

prendre le coût quadratique c(x, y) = |x−y|2/2. Ainsi, on cherche le déplacement (ou le plan de

transport)T optimisant ce coût.

x T(x)

ρ0

−ρ1

Figure 2.11 – Problème de Monge entre le tas de sable à gauche représenté parρ0(x) et le trou à

droite représenté par −ρ1(y). Le plan de transport T(x) indique la destination du sable contenu en

x. La valeur de ρ0 enx ne doit pas forcément être égale à la valeur deρ1 enT(x); grâce aux effets

de compression/dilatation locale deT on permet au sable de s’étaler ou de se concentrer enT(x).

Il y a plusieurs contraintes sur les données :

• Le tas de sable et le trou doivent avoir le même volume, qu’on fixe égal à 1. De plus les

fonctions qui les représentent doivent être positives. Ainsi on retrouve que la contrainte sur

ρ0 etρ1 est :

ρ0, ρ1∈ P(Ω).

• Le déplacementT est aussi assujetti à une contrainte, la contrainte de transport. En effet, il

doit déplacer le tas dans le trou, ce qu’on noteT#ρ0 =ρ1. On va écrire ceci

mathématique-ment. On ne demande pas que la masse envoyée sur T(x) soit exactement la même que celle

provenant de x. Ainsi on peut avoir ρ0(x) 6=ρ1(T(x)). Plutôt, on écrit les choses ainsi : soit

A⊂Ωun ensemble quelconque. Tout le sable qui a été transporté surA est exactement tout

le sable qui était enT−1(A) :

∀A⊂Ω,

Z

T

(A)

ρ0(x)dx=

Z

A

ρ1(y)dy. (2.3.1)

1. Le réel problème que se posait Monge était celui-ci mais dans le cas oùρ

etρ

valent 1 sur un ensemble et 0

Pour des plans de transport T différentiables, on peut effectuer un changement de variable

dans (2.3.1) et la condition de transport est équivalente à :

ρ1(T(x))|det(∇T)|(x) =ρ0(x). (2.3.2)

Pour résumer, le problème de Monge est :

minimiser

T

1

2

Z

ρ|v|²dtdx (BB)

C(ρ₀, ρ₁) :=

∂_tρ+div(ρv) = 0,

ρ(t= 0) =ρ₀, ρ(t= 1) =ρ₁,

On représente le tas de sable par une densité ρ₀(x), le trou par une densitéρ₁(y)¹, et le

c(x, T(x))ρ₀(x)dx.

x ^T(x)

ρ₀

−ρ₁

Figure ^{2.11 – Problème de Monge entre le tas de sable à gauche représenté par}ρ₀(x) et le trou à

x. La valeur de ρ₀ enx ne doit pas forcément être égale à la valeur deρ₁ enT(x); grâce aux effets

ρ₀ etρ₁ est :

ρ₀, ρ₁∈ P(Ω).

provenant de x. Ainsi on peut avoir ρ₀(x) 6=ρ₁(T(x)). Plutôt, on écrit les choses ainsi : soit

le sable qui était enT⁻¹(A) :

ρ₀(x)dx=

ρ₁(y)dy. (2.3.1)

ρ₁(T(x))|det(∇T)|(x) =ρ₀(x). (2.3.2)

|x−T(x)|2ρ₀(x)dx

sous la contrainte : T#ρ₀=ρ₁ (voir (2.3.1) ou (2.3.2))

∂_tv+v· ∇v= 0

∂t ⁼^v⁽^{t, T}

⁽^x⁾⁾^avec^T

⁽^x^{) =}^x. ^(2.3.4)

E(ρ, v) = ¹