• Aucun résultat trouvé

Calcul de la distance de Monge-Kantorovich sur le cercle

5.2 Applications du transport optimal et précédents travaux

6.1.2 Calcul de la distance de Monge-Kantorovich sur le cercle

Dans ce qui suit, nous allons montrer que la distance de Monge-Kantorovich sur le cercle peut être exprimée analytiquement et calculée à moindre coût, notamment dans le cas λ = 1 qui correspond à la distance EMD entre deux ensembles de points. Pour cela, nous montrons que si σ est une permutation optimale au sens de l’équation (6.4), alors il existe toujours un point sur le cercle qui n’appartient à aucun des chemins optimaux de σ. Ce résultat est obtenu dans un premier temps avec λ > 1 pour n’importe quelle permutation optimale σ, et ensuite avec λ = 1 pour une configuration bien choisie de permutation optimale. Cela signifie que le calcul de la distance de Monge-Kantorovich sur le cercle revient au calcul de la même distance sur un intervalle de R.

Proposition 4 Supposons que λ > 1. Soient x1, . . . xP et y1, . . . yP, P points de [0, 1[. Supposons que

tous ces points sont deux à deux différents. Alors pour toute permutation σ de ΣP qui minimise (6.4)

avec le coût (6.1), il existe k ∈ {1, . . . P } tel que pour tout l 6= k, xk∈ γ(x/ l, yσ(l)).

La preuve de la proposition4repose sur le lemme suivant, qui donne quelques propriétés des géodé- siques γ(xl, yσ(l)) obtenues lorsque σ est un minimiseur de (6.4) avec λ > 1.

Lemme 1 Supposons que λ > 1. Soit σ un minimiseur de (6.4), et les chemins γl = γ(xl, yσ(l)) et

γk= γ(xk, yσ(k)) (avec l6= k) deux géodésiques selon l’assignement défini par σ. Supposons également

que xl 6= xket yσ(l) 6= yσ(k). Alors, l’une des deux hypothèses est vérifiée :

– γl∩ γk=∅ ;

– γl∩γk6= ∅ et dans ce cas γlet γkont la même orientation (tous deux positifs ou négatifs) et aucun

n’est contenu dans l’autre.

Preuve du lemme1Supposons que γl∩ γk 6= ∅. Si γl∩ γkest égal à γ(xl, xk) ou γ(yσ(l), yσ(k)), alors

c(xl, yσ(l))λ+ c(xk, yσ(k))λ > c(xl, yσ(k))λ+ c(xk, yσ(l))λ,

ce qui contredit l’hypothèse d’optimalité de σ. De plus, λ étant strictement supérieur à 1, la fonction x7→ |x|λest strictement convexe. Si, par exemple, le chemin γ

lest inclus dans γk, alors

c(xl, yσ(l))λ+ c(xk, yσ(k))λ > c(xl, yσ(k))λ+ c(xk, yσ(l))λ,

ce qui contredit également l’hypothèse d’optimalité de σ. La seule alternative possible est donc que γl∩ γk est égal à γ(xl, yσ(k)) ou bien à γ(xk, yσ(l)). Il s’ensuit que γk et γl sont tous deux de même

orientation sur le cercle (soit tous les deux positifs, soit tous les deux négatifs).  Preuve de la proposition4Soit σ un minimiseur de (6.4). Par souci de clarté, on note dans ce qui suit γlle chemin γ(xl, yσ(l)). Sans perdre en généralité, on peut supposer que les points{x1, . . . , xP} sont

Supposons que la proposition4est fausse. Dans ce cas, pour chaque l ∈ {1, . . . P }, il existe q(l) 6= l

tel que xlappartient au chemin ouvert γq(l). Alors, pour chaque l, on obtient γq(l)∩γl6= ∅, ce qui signifie

d’après le lemme1 que les chemins γq(l) et γl ont la même orientation. Supposons par exemple qu’ils

sont tous les deux positifs, et montrons que dans ce cas xl∈ γl−1.

Si q(l) = l − 1, le résultat est immédiat. Si q(l) 6= l − 1, cela signifie que xq(l), xl−1, xl sont

dans l’ordre trigonométrique sur le cercle. Comme γq(l) est un chemin positif partant du point xq(l) et

contenant xl, il contient également le point xl−1(car les points étant supposés deux à deux distincts, on

a xl−1 6= xq(l)). Ainsi γl−1∩ γq(l) 6= ∅, ce qui implique que le chemin γl−1est également positif.

On en déduit alors que xl est nécessairement inclus dans γl−1, car d’après le lemme 1, le chemin

γl−1 ne peut être inclus dans γq(l). En conclusion, s’il existe pour chaque l ∈ {1, . . . P } , q(l) 6= l tel

que xl∈ γq(l), alors xl∈ γl−1lorsque γlest positif, et on montre de la même manière que lorsque γlest

négatif, alors xl∈ γl+1.

Supposons maintenant que pour un k ∈ {1, . . . P } donné, le chemin γk soit positif, si bien que

d’après le raisonnement précédent xk ∈ γk−1. D’après le lemme1, le chemin γk−1est également positif,

ce qui signifie que xk−1 doit appartenir à γk−2. De manière récursive, on en déduit que pour chaque

l ∈ {1, . . . P }, xl ∈ γl−1. Finalement, envoyer xl sur yσ(l−1) est strictement moins coûteux que de

l’envoyer sur yσ(l): c(xl, yσ(l−1)) < c(xl, yσ(l)). En comparant le coût de l’assignement σ avec celui de

l’assignement correspondant à l’élément précédent, on obtient

P X l=1 c(xl, yσ(l))λ > P X l=1 c(xl, yσ(l−1))λ, (6.9)

ce qui vient contredire le fait que σ est un minimiseur de (6.4). On arrive à la même conclusion en supposant que pour un k ∈ {1, . . . P } donné, le chemin γkest négatif. 

Le même résultat peut être obtenu lorsque λ = 1, mais il n’est cependant vérifié que pour un bon choix de permutation σ minimiseur de (6.4), et non pour toutes les permutations qui sont solutions de (6.4) comme dans le cas λ > 1. Ce résultat peut être vu comme le cas limite de la proposition4 où λ→ 1.

Corollaire 1 Supposons que λ = 1. Soient {x1, . . . , xP} et {y1, . . . , yP} deux ensembles de P points

dans [0, 1[. On suppose que tous ces points sont deux à deux distincts. Alors, il existe une permutation σ de ΣP qui minimise (6.4) et un point xk∈ {x1, . . . xP} tel que pour tout l 6= k, xk∈ γ(x/ l, yσ(l)).

Preuve du corollaire1Nous savons d’après la proposition4que pour tout λ > 1, si σλminimise le coût

σ7→ Wλ

σ(f, g), il existe k∈ {1, . . . P } tel que pour tout l 6= k, xk∈ γ/ l= γ(xl, yσλ(l)).

Si σ et les points x1, . . . , xP, et y1, . . . , yP sont fixés, Wσλ(f, g) est alors une fonction continue de λ.

Ainsi, pour tout ε > 0, il existe β > 1 tel que pour tout λ ∈ [1, β], |Wλ

σ(f, g)− Wσ1(f, g)| ≤ ε. ΣP étant

un ensemble fini, on peut choisir β suffisamment proche de 1 pour que cette propriété soit satisfaite pour tout σ de ΣP. On peut également choisir β de manière à vérifier | minσWσ1(f, g)− minσWσλ(f, g)| ≤ ε

(le minimum d’un ensemble fini de fonctions continues étant une fonction continue). Il s’ensuit que pour λ∈ [1, β], en notant σλ = argmin σ∈ΣP Wσλ(f, g) | minσ Wσ1(f, g)− Wσ1λ(f, g)| = | min σ W 1 σ(f, g)− Wσλλ(f, g) + W λ σλ(f, g)− W 1 σλ(f, g)| ≤ | min σ W 1 σ(f, g)− minσ Wσλ(f, g)| + |Wσλλ(f, g)− W 1 σλ(f, g)| ≤ 2ε.

Ce qui montre que lorsque λ est suffisamment proche de 1, un minimiseur σλde Wσλ(f, g) est également

un minimiseur de W1

σ(f, g). Cela prouve qu’il existe alors au moins un minimiseur σ de σ7→ Wσ1(f, g)

Nous allons maintenant montrer que la conséquence directe de ce résultat est que le calcul du trans- port optimal sur le cercle revient à chercher une coupure de S1, de telle sorte que ce transport soit optimal

sur la droite réelle. Cela nous permet d’écrire la distance de Monge-Kantorovich d’indice λ dans le cas du cercle sous une nouvelle forme à partir de la proposition4et du corollaire1, lorsque tous les points sont distincts.

Corollaire 2 Supposons que x1, . . . , xP et y1, . . . , yP sont des points deux à deux différents. Alors,

∀λ ≥ 1, MKλ(f, g) =  inf x∈S1 Z |Fx−1− G−1x |λ 1/λ , (6.10) où F−1

x et G−1x sont respectivement les fonctions pseudo-inverses des fonctions croissantes Fx et Gx,

définies comme : F−1

x (y) = inf{t; Fx(t) > y} et G−1x (y) = inf{t; Gx(t) > y}.

Preuve du corollaire2Nous avons vu que pour tout λ ≥ 1, si x1, . . . , xP et y1, . . . , yP sont des points

distincts, une permutation optimale σλ (minimisant6.4) peut être choisie de manière à ce qu’il existe un

point xkqui n’est contenu dans aucun des chemins {γ(xl, yσλ(l))}1≤l≤P définis par σλ(pour rappel, les

chemins γ(xl, yσλ(l)) ont été définis comme des ouverts, si bien qu’il ne contiennent pas leurs frontières

xlet yσλ(l)). Puisque les points sont supposés être deux à deux différents, le seul chemin qui inclut une

partie du voisinage de xk est γk. Il existe donc un ensemble ouvert ne contenant pas xk (situé d’un

côté ou de l’autre de xk selon l’orientation de γk), qui n’est inclus dans aucun des chemins définis par

la permutation optimale σλ. En particulier, le milieu x de cet ensemble ouvert n’appartient à aucun de

ces chemins. On peut donc « couper » le cercle S1 en ce point x de façon à réduire le problème du

transport sur le cercle à celui du transport sur la ligne réelle, ainsi que l’illustre la figure6.2. Or, dans le cas de la droite réelle, la distance Monge-Kantorovich d’indice λ entre deux distributions f et g sur R peut être exprimée à l’aide des pseudo-inverses des fonctions de répartition F et G (voir la remarque 2 du théorème 13 dans [Vil03]) :

∀λ ≥ 1, MKλ(f, g) =

Z

|F−1− G−1|λ 1/λ

,

où F−1 et G−1 sont respectivement les fonctions pseudo-inverses des fonctions de répartition F et G

depuis −∞, définies ainsi : F−1(y) = inf{t ∈ R; F (t) > y} et G−1(y) = inf{t ∈ R; G(t) > y}.

Ainsi, en choisissant x comme point de référence sur le cercle, on peut exprimer de manière similaire la distance Monge-Kantorovich d’indice λ entre deux distributions f et g sur S1 à l’aide des pseudo-

inverses de Fxet Gx, les fonctions de répartition de f et de g à partir de x :

∀λ ≥ 1, MKλ(f, g) =  inf x∈S1 Z |Fx−1− G−1x |λ 1/λ = inf x∈S1kF −1 x − G−1x kλ. (6.11)  Nous venons de montrer que le transport optimal entre deux distributions de points sur le cercle, minimisant la distance Monge-Kantorovich d’indice λ, permet de couper S1 en un point par lequel ne

passe aucun chemin. Dans le cas λ = 1, sachant que les fonctions Fxet Gxsont des applications de [0, 1[

dans [0, 1], l’expression (6.11) peut être réécrite sous la forme (voir la formule (72) [Vil03]) : MK1(f, g) = inf

x∈S1kFx− Gxk1. (6.12)

Afin de généraliser l’expression (6.12) au cas où les points x1, . . . , xP et y1, . . . , yP peuvent coïnci-

FIG. 6.2 –Avec une distance au sol strictement convexe (λ > 1) et dans le cas limite où λ = 1, le

transport optimal sur le cercle S1revient au transport sur la droite réelle si l’on connaît le lieu du cercle

où l’on peut couper.

expression qu’il sera plus facile de manipuler par la suite. Nous avons vu en préliminaire de cette section (équation (6.8)), que la fonction Fxpeut s’exprimer exclusivement à l’aide de F , ce qui nous donne ici :

kFx− Gxk1 = Z 1−x 0 |F (t + x) − F (x) − G(t + x) + G(x)|dt + Z 1 1−x|F (t + x − 1) − F (x) − G(t + x − 1) + G(x)|dt = Z 1 x |F (t) − F (x) − G(t) + G(x)|dt + Z x 0 |F (t) − F (x) − G(t) + G(x)|dt = kF − F (x) − G + G(x)k1.

Or, bien que l’ensemble des x solutions de (6.12) soit un ensemble ouvert de [0, 1[, la quantité F (x) −

G(x) est quantifiée et prend l’une des valeurs à{l

P; l = −P, . . . P }. Cela signifie donc que la quantité

kF − G − l

Pk1atteint un minimum pour l’une de ces valeurs (solution non nécessairement unique). On

peut donc finalement écrire

MK1(f, g) = min

l∈{−P,...P }kF − G −

l Pk1.

Nous allons montrer, à la suite du corollaire suivant, que ce résultat peut être généralisé au cas où les points x1, . . . , xP et y1, . . . , yP ne sont pas nécessairement distincts.

Corollaire 3 Soient f = 1 P PP k=1δxk et g = 1 P PP

k=1δykdeux distributions discrètes sur S

1, les points

x1, . . . , xP et y1, . . . , yP pouvant coïncider. La distance Monge Kantorovich d’indice λ = 1 entre f et g

peut être exprimée comme

MK1(f, g) = min

l∈{−P,...P }kF − G −

l

Pk1. (6.13)

Preuve du corollaire3Soient 2P points x1, . . . , xP, y1, . . . , yP sur S1, non nécessairement différents.

On peut construire pour chaque ε > 0, les points xε

1, . . . xεP, yε1, . . . yεP, deux à deux différents, tels que

∀k ∈ {1, . . . P }, c(xε k, xk) ≤ ε et c(yεk, yk) ≤ ε. Soient fε = P1 PPk=1δxεk et g ε = 1 P PP k=1δyεk les

distributions qui leur sont respectivement associées. Alors, σ étant fixé, ∀σ ∈ ΣP

|Wσ1(fε, gε)− Wσ1(f, g)| ≤ P

X

k=1

Puisque MK1est un minimum sur un ensemble fini, il s’ensuit que

MK1(fε, gε)−−−→

ε→0 MK1(f, g) .

Or, si l’on note Fεet Gεles fonctions de répartition de fεet gε, on a :

∀l ∈ {−P, . . . P }, kFε− Gε−Pl k1−−−→

ε→0 kF − G −

l Pk1. Puisque l prend un nombre fini de valeurs, on obtient la convergence suivante :

min l∈{−P,...P }kF ε− Gε l Pk1−−−→ε→0 l∈{−P,...P }min kF − G − l Pk1. Nous pouvons ainsi finalement écrire

MK1(f, g) = min

l∈{−P,...P }kF − G −

l Pk1.

 En remarquant que la quantité kF − G − l

Pk1atteint son minimum pour l’une des valeurs prises par

kF − G − F (x) + G(x)k1, on peut donc conclure que la formule (6.12) est valide dans le cas général où

les points peuvent coïncider.