Mod`eles convexes et algorithmes d’optimisation en imagerie.

(1)

en imagerie.

Pierre Weiss.

October 25, 2011

(2)

III.2/ Th´eorie de la complexit´e en optimisation convexe.

Applications ` a l’imagerie.

(3)

Jusqu’` a pr´ esent, on n’est pas capable de r´ esoudre les probl` emes annonc´ es au d´ epart !

•

Les descentes de sous-gradient sont trop lentes.

•

Les sch´ emas acc´ el´ er´ es ne s’adaptent pas aux non-diff´ erentiabilit´ es.

Conclusion :

Pour obtenir des algorithmes plus efficaces, il faut :

•

Se concentrer sur des classes de fonctions plus restreintes que les fonctions convexes quelconques.

•

Utiliser d’autres propri´ et´ es que les gradients et

sous-gradients (op´ erateurs proximaux, dualit´ e).

(4)

Quelques algorithmes d’optimisation non lisse efficaces.

•

Deux mots sur les op´ erateurs proximaux (Moreau 1960).

•

Algorithmes primaux quand une partie du probl` eme est diff´ erentiable.

•

Algorithmes duaux quand une partie du probl` eme est fortement convexe.

•

Algorithmes primaux-duaux dans le cas g´ en´ eral.

(5)

[Combettes, Wajs 03], Signal recovery by proximal forward-backward splitting. SIAM MMS

D´ efinition : Soit f :

Rⁿ

→

R

∪ {+∞} un fonction convexe s.c.i.

On appelle op´ erateur proximal ou r´ esolvante de f l’op´ erateur : prox

_f

(x

₀

) = arg min

x∈Rⁿ

f (x) + 1

2 kx − x

₀

k

²

. Notes :

•

Cet op´ erateur est bien d´ efini car f (x) +

¹₂

kx − x

0

k

²

est strictement convexe et coercive.

•

Il est parfois not´ e (Id + ∂f)

⁻¹

(x

0

) car les conditions d’optimalit´ e m` enent ` a

0 ∈ ∂f(prox

_f

(x

0

)) + prox

_f

(x

0

) − x

0

.

(6)

Op´ erateurs proximaux.

Intuition :

C’est une g´ en´ eralisation de la projection.

Si f(x) =

0 si x ∈ X

+∞ sinon , alors : prox

_f

(x

0

) = arg min

x∈X

1 2 kx − x

0

k

²

(1)

= Π

X

(x

0

). (2)

Propri´ et´ es ´ el´ ementaires :

•

L’op´ erateur proximal est non expansif :

∀(x, y) ∈

Rⁿ

×

Rⁿ

, kprox

_f

(x) − prox

_f

(y)k ≤ kx − yk.

•

Il caract´ erise les minimiseurs : x ∈ Arg min

x∈Rⁿ

f (x) ⇔ 0 ∈ ∂f(x) ⇔ prox

_f

(x) = x (point fixe).

(7)

L’op´ erateur proximal est central pour la r´ esolution - ` a l’aide de m´ ethodes de premier ordre - des probl` emes non diff´ erentiables.

Nous allons montrer son utilisation pour la r´ esolution de quelques classes de prob` emes :

1. Somme d’une fonction convexe diff´ erentiable et d’une fonction convexe (Primal).

2. Somme d’une fonction convexe et d’une fonction fortement convexe (Dual).

3. Autres probl` emes de type point selle.

(8)

Une classe de probl` emes non diff´ erentiable Auslender70:

On consid` ere d´ esormais et jusqu’` a nouvel ordre le probl` eme suivant :

x∈

min

Rⁿ

f

1

(x) + f

2

(x)

•

f

1

est convexe, diff´ erentiable, ` a gradient L-Lispchitz.

•

f

₂

est convexe, s.c.i telle que prox

_f₂

peut ˆ etre calcul´ e.

Propri´ et´ e : Les minimiseurs x

^∗

sont caract´ eris´ es par x

^∗

= prox

_{τ f}₂

(x

^∗

− τ ∇f

₁

(x

^∗

)) .

Preuve :

0 ∈ ∇f

₁

(x

^∗

) + ∂f

₂

(x

^∗

)

⇔ x

^∗

− τ ∇f

₁

(x

^∗

) ∈ x

^∗

+ τ ∂f

₂

(x

^∗

)

⇔ x

^∗

= prox

_{τ f}₂

(x

^∗

− τ ∇f

₁

(x

^∗

)) .

(9)

convexe..

Le gradient proximal : la caract´ erisation de point-fixe pr´ ec´ edente donne envie d’utiliser le sch´ ema :

x

_k+1

= prox

_{τ f}₂

(x

_k

− τ ∇f

₁

(x

_k

)) Exemple (compressive sensing) :

x∈

min

Rⁿ

1 2 kAx − bk

²

+ kxk

₁

x

k+1

= shrink

τ

(x

k

− τ A

^T

(Ax − b))

[I. Daubechie etal 03] An iterative thresholding algorithm for linear inverse problems with a sparsity constraint, CPAM.

Convergence lin´ eaire : Si µ = λ

_min

(A

^T

A) > 0, alors le

sch´ ema pr´ ec´ edent converge lin´ eairement en choisissant τ =

_µ+L²

.

(10)

Somme d’une fonction diff´ erentiable et d’une fonction convexe..

Preuve :

kx

_k+1

− x

^∗

k = kprox

_{τ f}

2

(x

_k

− τ A

^T

(Ax

_k

− b)) − x

^∗

k

= kprox

_{τ f}₂

(x

_k

− τ A

^T

(Ax

_k

− b))

−prox

_{τ f}₂

(x

^∗

− τ A

^T

(Ax

^∗

− b))k

≤ k(I − τ A

^T

A)(x

k

− x

^∗

)k (non expansif)

≤ |||(I − τ A

^T

A)||| · k(x

_k

− x

^∗

)k avec : |||(I − τ A

^T

A)||| = max(|1 − τ µ|, |1 − τ L|).

Enfin, on a

min

τ

max(1 − τ µ, 1 − τ L) = 2

µ + L .

Que se passe-t-il dans le cas non fortement convexe ?

(11)

Somme d’une fonction diff´ erentiable et d’une fonction convexe.

f

₁

diff´ erentiable + gradient Lipschitz ⇒ f

₁

(x) ≤ f

₁

(x

_k

) + h∇f

₁

(x

_k

), x − x

_k

i + L

2 ||x − x

_k

||

²₂

f

₁

(x)+f

₂

(x) ≤ f

₁

(x

_k

) + h∇f

₁

(x

_k

), x − x

_k

i +

2 ||x − x

_k

||

₂

+f

₂

(x)

| {z }

Ψ_k(x)

En prenant x

_k+1

= arg min

x∈Rⁿ

Ψ

_k

(x) on assure :

f (x

_k+1

) ≤ f (x

_k

) − ♣

o` u ♣ est une “g´ en´ eralisation” de

^k∇f(x_2L^k^)k²

.

(12)

Somme d’une fonction diff´ erentiable et d’une fonction convexe.

f

₁

diff´ erentiable + gradient Lipschitz ⇒ f

₁

(x) ≤ f

₁

(x

_k

) + h∇f

₁

(x

_k

), x − x

_k

i + L

2 ||x − x

_k

||

²₂

f

1

(x)+f

2

(x) ≤ f

1

(x

k

) + h∇f

₁

(x

k

), x − x

k

i + L

2 ||x − x

k

||

²₂

+f

2

(x)

| {z }

Ψ_k(x)

En prenant x

_k+1

= arg min

x∈Rⁿ

Ψ

_k

(x) on assure :

f (x

_k+1

) ≤ f (x

_k

) − ♣

o` u ♣ est une “g´ en´ eralisation” de

^k∇f(x_2L^k^)k²

.

(13)

convexe.

L’it´ eration pr´ ec´ edente est ´ equivalente ` a : x

_k+1

= arg min

x∈Rⁿ

1 L f

₂

(x) + 1 2

x −

x

_k

− ∇f

₁

(x

_k

) L

Soit encore :

x

_k+1

= prox

_f₂_/L

x

^k

− ∇f

₁

(x

^k

)) L

(14)

Somme d’une fonction diff´ erentiable et d’une fonction convexe.

R´ esultat de convergence 1 [Nesterov 07]

Sous les hypoth` eses pr´ ec´ edentes, pour d admissible tel que

||d|| ≤ 1

Df (x

^k

)(d) ≥ −O

L f (x

⁰

) − min f

√ k

R´ esultat de convergence 2 Si de plus f

₁

est convexe alors :

f (x

^k

) − f (x

^∗

) ≤ L||y

⁰

− y

^∗

||

²

k (variables duales)

Nette am´ elioration par rapport aux techniques de

sous-gradient!

(15)

•

In: Nombre d’ it´ erations N , point initial x

₀

∈

Rⁿ

.

•

Out: x

_N

une estim´ ee de x

^∗

.

•

Init: Poser t

₁

= 1, y

₁

= x

₀

. Pour k allant de 0 ` a N :

•

Poser x

_k

= prox

_f₂_/L

y

_k

−

^∇f¹_L^(y^k⁾

.

•

Calculer t

_k+1

=

¹⁺

√

1+4t²_k

2

.

•

Poser y

_k+1

= x

_k

+

tk−1 tk+1

(x

_k

− x

k−1

).

(16)

Sch´ ema multi-pas [Nesterov 07].

R´ esultat de convergence L’algorithme assure que :

f(x

^k

) − f (x

^∗

) ≤ L||x

⁰

− x

^∗

||

²

k

² C’est un taux de convergence optimal.

R´ esultats pratiques...

•

Pour les transform´ ees “simples” de l’analyse harmonique, 30 it´ erations m` enent ` a une pr´ ecision suffisante pour le syst` eme visuel.

•

Vers du temps r´ eel ? De l’ordre de la seconde pour une

image 1000 × 1000 (architecture GPU).

(17)

convexes.

Le cadre pr´ ec´ edent ne permet pas de traiter des probl` emes de type :

x∈

min

Rⁿ

k∇xk

₁

+ 1

2 kx − x

0

k

²

en effet :

•

x 7→ k∇xk

₁

est trop complexe pour en calculer la r´ esolvante.

•

x 7→ k∇xk

₁

n’est pas diff´ erentiable...

On va voir que la dualit´ e permet de contourner ces probl` emes.

(18)

Une classe de fonctions fortement convexes.

x∈

min

Rⁿ

P(x) := f

₁

(Ax) + f

₂

(x)

•

f

1

:

Rⁿ

→

R

∪ {+∞} convexe, s.c.i.

•

A :

Rⁿ

→

R^m

lin´ eaire (ou affine).

•

f

2

:

Rⁿ

→

R

∪ {+∞} µ-fortement convexe.

•

A · ri(dom(f

₂

)) ∩ ri(dom(f

₁

)) 6= ∅.

Exemple typique (TV + terme

l²

) :

x∈

min

Rⁿ

||∇x||

₁

+ λ

2 ||x − x

⁰

||

²₂

(19)

D´ efinition (polaire)

Soit f :

Rⁿ

→

R

∪ {+∞} une fonction convexe s.c.i. La transform´ ee de Fenchel ou polaire de

f

est d´ efinie par

f

^∗

(x

⁰

) = sup

x∈Rⁿ

hx

⁰

, xi − f (x) Propri´ et´ es

•

f

^∗

est convexe s.c.i.

•

On a f

^∗∗

= f ce qui implique que : f(x

⁰

)

=f

^∗∗

(x

⁰

)

= sup

x∈Rⁿ

hx

⁰

, xi − f

^∗

(x)

On peut red´ efinir f ` a partir de sa polaire.

(20)

Compl´ ements d’analyse convexe...

Dualit´ e de Fenchel-Rockafellar : On a donc :

x∈

min

Rⁿ

f

1

(Ax) + f

2

(x)

| {z }

Probl`eme primal

= min

x∈Rⁿ

sup

y∈R^m

hAx, yi − f

₁^∗

(y) + f

₂

(x)

= min

x∈Rⁿ

sup

y∈R^m

hx, A

^∗

yi − f

₁^∗

(y) + f

2

(x)

= sup

y∈R^m x∈

inf

Rⁿ

hx, A

^∗

yi − f

₁^∗

(y) + f

2

(x) (Voir sch´ ema)

= sup

y∈R^m

−f

₁^∗

(y) − sup

x∈Rⁿ

−hx, A

^∗

yi − f

₂

(x)

= sup

y∈R^m

−f

₁^∗

(y) − f

₂^∗

(−A

^∗

x)

= − inf

y∈R^m

f

₁^∗

(y) + f

₂^∗

(−A

^∗

x)

| {z }

Probl`eme dual

(21)

Figure: Une fonction convexe-concave et son point-selle.

(22)

Compl´ ements d’analyse convexe...

Relations primales-duales.

Soit (x

^∗

, y

^∗

) un point selle, on a :

0 ∈ Ax

^∗

− ∂f

₁^∗

(y

^∗

) 0 ∈ −A

^∗

y

^∗

− ∂f

2

(x

^∗

) Soit encore :

y

^∗

∈ (∂f

₁

)(Ax

^∗

) x

^∗

∈ (∂f

₂^∗

)(−A

^∗

y

^∗

) Car :

x

2

∈ ∂f (x

1

) ⇔ x

1

∈ ∂f

^∗

(x

2

)

Les solutions du probl` eme dual apportent des informations sur

le primal et vice-versa !

(23)

Th´ eor` eme (derni` eres pages du livre de J.B.

Hiriart-Urruty et C. Lemar´ echal): Soit

f :

Rⁿ

→

R

∪ {+∞} une fonction convexe, s.c.i. Les deux propositions suivantes sont ´ equivalentes :

1. f est diff´ erentiable et ∇f est L-Lipschitz.

2. f

^∗

est fortement convexe de module

_L¹

.

(24)

Minimisation d’une classe de fonctions fortement convexes.

Conclusion

Si f

₂

est µ-fortement convexe, on a :

x∈

min

Rⁿ

f

1

(Ax) + f

2

(x) = − min

y∈R^m

f

₂^∗

(−A

^∗

y) + f

₁^∗

(y)

• f₂^∗

est diff´ erentiable avec un gradient

¹_µ

-Lipschitz.

•

f

₁^∗

est convexe.

•

Pour tout y

^∗

∈ Y

^∗

, x

^∗

= ∇f

₂^∗

(−A

^∗

y

^∗

).

Un algorithme naturel : gradient proximal y

^k+1

= prox

_f^∗

1/L

y

^k

+ A∇f

₂^∗

(−A

^∗

y

^k

)

x

^k+1

= ∇f

₂^∗

(−A

^∗

y

^k+1

).

(25)

convexes.

Analyse du taux de convergence.

On a :

x∈

min

Rⁿ

f

₁

(Ax) + f

₂

(x)

| {z }

P(x)

= − min

y∈R^m

f

₂^∗

(−A

^∗

y) + f

₁^∗

(y)

| {z }

D(y)

et pour tout y

^∗

∈ Y

^∗

, x

^∗

= ∇f

₂^∗

(−A

^∗

y

^∗

).

Proposition [Peyr´ e, Fadili, Weiss] (sur demande) Soit

x(y) = ∇f

₂^∗

(−A

^∗

y) Alors

kx(y) − x

^∗

k

²

≤ 2

µ |D(y) − D(y

^∗

)|

Un taux de CV sur le dual ⇒ taux de CV sur le primal.

(26)

Minimisation d’une classe de fonctions fortement convexes.

R´ esultat de convergence (gradient proximal dual) Sous les hypoth` eses pr´ ec´ edentes :

||x

^k

− x

^∗

||

²

≤ |||A|||

²

||y

⁰

− y

^∗

||

²

µk

En notant ∆(x

^k

, y

^k

) = P (x

^k

) − D(y

^k

), le saut de dualit´ e on a :

||x

^k

− x

^∗

||

²

≤ ∆(x

^k

, y

^k

).

La distance au minimiseur peut ˆ etre ´ evalu´ ee ` a chaque

it´ eration !

(27)

convexes..

Exemple : le probl` eme TV-L2

x∈

min

Rⁿ

||∇x||

₁

+ λ

2 ||x − x

⁰

||

²

= − min

y∈R²ⁿ,||y||∞≤1

||λ∇

^∗

y − x

⁰

||

²

Similaire ` a :

• [A. Chambolle 04] An algorithm for TV minimization.

Le sch´ ema assure que :

||x

^k

− x

^∗

||

²

≤ 8n λk .

La complexit´ e augmente lin´ eairement avec la

dimension !

(28)

Minimisation d’une classe de fonctions fortement convexes.

Taux de convergence

Les sch´ emas acc´ el´ er´ es de Nesterov appliqu´ es au dual assurent :

||x

^k

− x

^∗

||

²

≤ 2|||A|||

²

||y

⁰

− y

^∗

||

²

µ

²

k

²

et si dom(f

1

) =

R^m

:

f (x

^k

) − f(x

^∗

) ≤ 2||y

⁰

− y

^∗

||

²

|||A|||

²

µk

²

.

(Sinon, rien n’assure que les it´ er´ ees primales soient

admissibles...)

(29)

pr´ ec´ edents

On consid` ere le probl` eme :

x∈

min

Rⁿ

k∇xk

₁

+ λ

2 kx − x

0

k

²₂

D´ ebruitage de

x₀

sous l’hypoth` ese de bruit gaussien additif.

[FILM, AUTRES EXEMPLES]

(30)

Quelques applications pratiques des algorithmes pr´ ec´ edents

D´ ebruitage d’images SPIM.

Travail en collaboration avec J´ erˆ ome Fehrenbach (Institut de Math´ ematiques de Toulouse) et le canc´ eropole.

•

L’existence de sch´ emas efficaces doit guider la mod´ elisation.

(31)

Images SPIM: les images sont affect´ ees par des raies sombres

(ou parfois brillantes).

(32)

Motivation et pr´ esentation de la m´ ethode

On se propose d’´ eliminer ces raies, pour obtenir des images plus lisibles.

ã

L’origine physique de ces raies est peu claire. On va donc adopter une m´ ethode de traitement d’image sans

mod´ elisation de la physique.

(33)

Notre algorithme s’inspire des m´ ethodes r´ ecentes de d´ ecomposition d’images en :

ã

u

0

= u + v (structure + texture),.

ã

u

0

= u + v + b (structure + texture + bruit).

[Meyer 01, Starck Donoho 05, Aujol 05, Fadili 10, ]

= +

(34)

Motivation et pr´ esentation de la m´ ethode

ã

Difficult´ e : grand nombre d’inconnues (plus de 500 images 1000 × 1000 ∼ 1-50Go.).

ã

Pour s’en sortir : formuler le probl` eme comme un probl` eme

de minimisation convexe. Cela permet le d´ eveloppement

d’algorithmes efficaces, qui convergent vers un minimum

global.

(35)

On d´ ecrit le bruit comme ´ etant compos´ e de raies + bruit blanc (deux composantes).

La raie est un “motif ´ el´ ementaire” qui se retrouve ` a plusieurs endroits dans l’image.

Pour d´ eplacer et r´ epliquer un motif ψ dans l’espace on utilise un produit de convolution :

λ ∗ ψ(x) =

X

y

λ(y)ψ(x − y).

Hypoth` ese sous-jacente : le bruit est stationnaire.

∗ =

(36)

Mod´ elisation du bruit

De fa¸ con plus g´ en´ erale, le bruit est mod´ elis´ e comme le produit de convolution entre un bruit blanc (pas forc´ ement gaussien) et un noyau donn´ e.

Figure: Exemples de bruits stationaires obtenus par convolution d’un noyau avec un bruit blanc.

(37)

Autres exemples de produit de convolution:

∗ =

Le produit de convolution s’exprime facilement en Fourier.

(38)

Mod´ elisation du bruit

Mod´ elisation d’une raie : un

filtre de Gabor

(=une gaussienne

anisotrope modul´ ee par une sinuso¨ıde).

(39)

Le bruit est décrit par plusieurs types de raies (longueur/largeur différentes). Il s’écrit

b=

m

X

i=1

λ_i∗ψ_i.

La loi de probabilité de chaqueλ_i dépend de la modélisation du bruit.

D’une manière générale on écrit:

P(λi) = exp(−φi(λi)).

L’hypothèse que le bruit est blanc permet de choisir des fonctionsφ_i séparables(ce qui simplifie l’analyse numérique et est justifié par l’hypothèse destationnarité).

(40)

Mod´ ele de restauration

On utilise le principe du Maximum A Posteriori. On cherche l’image u la plus probable ´ etant donn´ ees :

1) la forme et l’orientation de chaque raie ψ

i

(en pratique : une/deux raie + un bruit Gaussien), 2) une description de la probabilit´ e de chaque bruit φ

_i

, 3) une description d’un mod` ele d’image a priori.

La recherche de l’image u la plus probable peut s’exprimer

comme un probl` eme de minimisation convexe.

(41)

Principe du Maximum A Posteriori (MAP) : Connaissant u

⁰

∈

Rⁿ

, trouver Arg max

λ∈R^m×n

P (λ|u

⁰

).

Loi de Bayes : P (λ|u

⁰

) = P (u

⁰

|λ)P (λ) P (u

⁰

) , donc sous l’hypoth` ese d’ind´ ependance de

u

et de

λ

:

Arg max

λ∈R^m×n

P (λ|u

⁰

) = Arg min

λ∈R^m×n

(− log(P(u)) − log(P (λ))) Soit encore :

Arg min

λ∈R^m×n





∇ u

0

−

m

X

i=1

λ

i

∗ Ψ

i

! 1,

+

m

X

i=1

φ

i

(λ

i

)





(42)

R´ esultats (v´ erification du principe)

Arg min

λ∈R³ⁿ

∇ u −

3

X

i=1

λ

i

? ψ

i

! 1

+ kλ

₁

k

∞

+ kλ

₂

k

²₂

+ kλ

₃

k

₁ Noyaux : “raie verticale (l^∞)”, “Dirac (l²)”, ”poisson (l¹)”.

=

+ + +

(43)

→

(44)

R´ esultats (v´ erification du principe)

→

Figure: Le filtre naturel : un filtre en forme de gradient topologique... Mais mauvaise r´esolution.

Figure: Super-r´esolution... Le cerveau de l’ombre.

(45)

R´ esultats (v´ erification du principe)

→

Figure: Le filtre naturel : un filtre en forme de gradient topologique...

Mais mauvaise r´esolution.

(46)

R´ esultats (v´ erification du principe)

→

Figure: Le filtre naturel : un filtre en forme de gradient topologique...

Mais mauvaise r´esolution.

Figure: Super-r´esolution... Le cerveau de l’ombre.

(47)

(48)

R´ esultats

Figure: de gauche `a droite : originale; 2 filtres (raie de Gabor + Dirac pour le bruit gaussien) ; m´ethode TV-L²

(49)

Sur une autre image :

= +

(50)

Remarque sur le choix des fonctions φ

_i

Le mod` ele de d´ ecomposition est le suivant : Arg min

λ∈R^m×n

∇ u −

m

X

i=1

ψ

_i

? λ

_i

! 1

+

m

X

i=1

φ

_i

(λ

_i

) Comment choisir les fonctions

φ_i

?

Les choix classiques sont :

•

φ

_i

(·) = k · k

₁

: bruit laplace ou de type impulsionnel.

•

φ

i

(·) =

¹₂

k · k

²₂

: bruit Gaussien.

•

φ

i

(·) = k · k

_∞

: bruit uniforme/amplitude born´ ee.

Est-ce bien n´ ecessaire ?

(51)

i

Th´ eor` eme de Lindeberg-Feller : Soit

b = λ ? ψ

•

λ ∈

R^N

est un bruit blanc.

•

ψ ∈

R^N

est un noyau de convolution.

Si la d´ ecroissance de ψ est suffisamment lente

→

b_i

suit une loi gaussienne pour tout

i.

Conclusion : si les noyaux ψ sont “suffisamment” ´ etal´ es, la norme l

²

suffit.

Int´ erˆ et : si φ

i

(·) =

¹₂

k · k

²₂

, ∀i, le probl` eme est fortement

convexe.

(52)

Liens avec les mod` eles ` a base de normes n´ egatives

Objectif des planches ` a venir :

Les mod` eles de d´ ecomposition en texture+ structure avec

normes n´ egatives sont un cas particulier du formalisme pr´ esent´ e.

(53)

[Meyer 01] Oscillating patterns in image processing and nonlinear evolution equations

Une texture est d’autant plus “probable” qu’elle est oscillante.

Les normes n´ egatives (W

^−1,p

) permettent de d´ etecter les fonctions oscillantes.

Soit :

||v||

_−1,p

= min

|q|∈L^p(Ω),div(q)=v

||q||

_p

[Aubert, Aujol, 2004] : Sur un ensemble born´ e v

n

* 0 ⇒

||v

_n

||

_−1,p

→ 0 (pour p ≥ 1).

(54)

Liens avec les mod` eles ` a base de normes n´ egatives

[Meyer 01, Osher-Vese 03, Aujol 05, Vese 03-10...]

D´ ecomposer u

0

en structure + texture:

u

0

= u + v.

En r´ esolvant :

arg min

u+v=u0,u0∈Rⁿ

k∇uk

₁

+ αkvk

_−1,p

En posant v = divg, ce probl` eme peut ˆ etre r´ e´ ecrit :

arg min

g∈Rⁿ×Rⁿ

k∇(u

₀

− divg)k

₁

+ αkgk

_p

.

(55)

On a :

divg = ∂

₁

g

₁

+ ∂

₂

g

₂

Et apr` es discr´ etisation:

∂

₁

g

₁

+ ∂

₂

g

₂

= g

₁

? h

₁

+ g

₂

? h

₂

o` u h

1

et h

2

d´ ependent du choix de discr´ etisation.

Par exemple :

h

₁

= [1, −1] h

₂

=

1 −1

. Les coefficients g

₁

et g

₂

rep´ esentent :

les coefficients de la texture

v

dans un dictionnaire compos´ e des

fonctions

h1

et

h2

translat´ ees dans l’espace.

(56)

Liens avec les mod` eles ` a base de normes n´ egatives

Interpr´ etation bay´ esienne du mod` ele de Y. Meyer.

•

Soit Γ un v.a. de

Rⁿ

de densit´ e P (Γ) ∝ exp(−αkΓk

_p

).

•

Soit θ un v.a. de

Rⁿ

de densit´ e uniforme sur [0, 2π].

•

Soit G =

Γ cos(θ) Γ sin(θ)

.

Alors la d´ ecomposition u

₀

= u + v du probl` eme de Y.Meyer correspond ` a une solution MAP

•

o` u u est la r´ ealisation d’un v.a. de densit´ e exp(−k∇uk

₁

).

•

o` u v est la r´ ealisation d’un v.a. V = divG.

(57)

U nif orme Gaussien Bernoulli

p = ∞ p = 2 p = 1

Figure: Haut : bruits standards. Bas : bruits synthétisés correspondant aux modèles W^−1,p.

(58)

Conclusion SPIM

ã

Suppression des raies par post-traitement des images SPIM.

ã

Des techniques d’optimisation convexe sont utilis´ ees et d´ evelopp´ ees.

ã

Une mod´ elisation originale du bruit.

ã

Pour acc´ el´ erer : programmation sous CUDA (facteur 100/Matlab).

ã

Traitement en un temps inf´ erieur ` a la seconde pour une

image 1000x1000.

(59)

Un nouveau cadre de travail :

x∈

min

Rⁿ

P(x) := f

1

(Ax) + f

2

(x)

•

f

₁

et f

₂

convexes, s.c.i. et “simples”.

•

A :

Rⁿ

→

R^m

lin´ eaire.

•

A · ri(dom(f

2

)) ∩ ri(dom(f

1

)) 6= ∅.

Remarque centrale : On sait r´ esoudre rapidement

x∈

min

Rⁿ

f

₁

(Ax) + f

₂

(x) + 2 f

₃

(x) o` u f

3

est fortement convexe ou

x∈

min

Rⁿ

f

1,

(Ax) + f

2

(x)

o` u f

_1,

est une r´ egularis´ ee de f

₁

(e.g. Moreau-Yosida).

La rapidit´ e des sch´ emas peut-elle compenser les erreurs

d’approximation ?

(60)

Justification des techniques de lissage...

Oui ! Id´ ee de la preuve : On consid` ere le probl` eme :

f

^∗

= min

x∈Rⁿ

f

1

(Ax) +

2 kx − x

0

k

²

(P

)

On g´ en` ere une suite (x

_k

) avec un algorithme optimal sur P

.

0 ≤ P (x

_k

) − P

^∗

≤

2 kx

^∗

− x

₀

k

²

| {z }

approximation

+ |||A||| · ky

₀

− y

^∗

k

²

k

²

| {z }

sch´ema

Puis ` a k fix´ e, on minimise le membre de droite par rapport ` a .

(61)

Lissage primal (Nesterov 2003) R´ esultat

Si µ est proportionel ` a 1/k, le sch´ ema pr´ ec´ edent assure : P (x

^k

) − P (x

^∗

) ≤ ||A|| · ||x

⁰

− x

^∗_µ

||

₂

· ||y

⁰

− y

^∗

||

₂

k .

Optimalit´ e

Le sch´ ema est “optimal”.

•

Nemirovski 1992

Information-based complexity of linear operator equations.

Journal of Complexity.

(62)

Justification des techniques de lissage...

Lissage dual R´ esultat

Si est proportionel ` a 1/k, le sch´ ema assure :

P (x

^k

) − P (x

^∗

) ≤ ||A|| · ||x

⁰

− x

^∗

||

₂

· ||y

⁰

− y

^∗

||

₂

k .

Avantages du dual

•

La solution du probl` eme r´ egularis´ e est unique.

•

On obtient un taux de convergence en norme.

(63)

C’est un r´ esultat profond.

•

Meilleur que les descentes de sous-gradient en O

_k¹

.

•

M´ ethode optimale pour une vaste classe d’in´ egalit´ e variationnelles.

Cependant...

•

D´ ependance de et de k ` a fixer au d´ epart.

•

Allez voir le dernier preprint de A. Chambolle et T. Pock !

(64)

Design de bobines de gradient pour l’IRM

(En collaboration avec M. Poole, U. Brisbane).

(65)

•

Les champs magn´ etiques varient rapidement dans le temps

⇒ courants de Foucault induits, vibrations des structures m´ ecaniques, bruits (> 130dB).

•

Pour am´ eliorer la qualit´ e, courants importants ⇒

´

echauffements locaux des bobines, d´ et´ eriorations.

⇒ Trouver un design qui r´ eduit ces effets.

(66)

Design de bobines pour l’IRM : mod´ elisation

Probl` eme inverse :

Trouver un arrangement de fils qui produise un champs magn´ etique donn´ e apr` es mise sous tension.

Solutions:

•

Optimisation de forme classique et topologiques inefficaces.

• Des fils adjacents pourraient ˆetre reli´es.

• On ne cherche qu’un seul fil continu.

•

Utilisation d’une m´ ethode de type level set.

(67)

(68)

Design de bobines pour l’IRM : mod´ elisation

R´ egime statique.

Le champs magn´ etique B est reli´ e au champs de courant J par la loi de Biot-Savart :

B(r) = µ

₀

4π

Z

J(r

⁰

) × r − r

⁰

|r − r

⁰

|

³

dv

⇒ Probl` eme inverse :

trouver J pour obtenir un B donn´ e.

C’est un probl` eme inverse mal-pos´ e.

(69)

R´ egime statique.

Le champs magn´ etique B est reli´ e au champs de courant J par la loi de Biot-Savart :

B(r) = µ

₀

4π

Z

J(r

⁰

) × r − r

⁰

|r − r

⁰

|

³

dv

⇒ Probl` eme inverse :

trouver J pour obtenir un B donn´ e.

C’est un probl` eme inverse mal-pos´ e.

(70)

Design de bobines pour l’IRM : mod´ elisation

Termes d’´ energie classiques :

•

La distance au champ cible : kB(r) − µ

0

4π

Z

J(r

⁰

) × r − r

⁰

|r − r

⁰

|

³

dvk

²₂

•

L’´ energie stock´ ee : W = µ

0

8π

Z Z

J (r) · J (r

⁰

)

|r − r

⁰

| dvdv

⁰

•

La chaleur (effet Joule) : R = ρ

_C

Z

|J (r)|

²

dv

•

Des forces de couple de Lorentz : τ =

Z

r × J (r) × B

0

dv.

(71)

discr´ etisation

(72)

Design de bobines pour l’IRM : discr´ etisation

On discr´ etise :

J(r) ∼

n

X

i=1

x

n

j

n

(r) avec div(j

n

) = 0.

De la mˆ eme fa¸con :

B(r) ∼

n

X

i=1

x

n

b

n

(r) Puis :

W (x) = hx, M

_W

xi ´ energie stock´ ee

P (x) = hx, M

_R

xi r´ esistance

T x = M

T

x couple magn´ etique

(73)

Design de bobines pour l’IRM

Finalement le probl` eme inverse standard est : Trouver x ∈ arg min

x∈Rⁿ,T x=0

kBx − bk

²₂

+ αW (x) + βP (x) Peut ˆ etre r´ esolu par des techniques d’alg` ebre lin´ eaire.

Trouver x ∈ arg min

x∈Rⁿ,T x=0

kBx − bk

²₂

+ αW (x) + βP (x) + γkj(x)k

∞

C’est un probl` eme d’optimisation convexe (programmation

quadratique).

(74)

Design de bobines pour l’IRM

Finalement le probl` eme inverse standard est : Trouver x ∈ arg min

x∈Rⁿ,T x=0

kBx − bk

²₂

+ αW (x) + βP (x) Peut ˆ etre r´ esolu par des techniques d’alg` ebre lin´ eaire.

Nouveaut´ e : minimiser les ´ echauffements locaux de la bobine

Trouver x ∈ arg min

x∈Rⁿ,T x=0

kBx − bk

²₂

+ αW (x) + βP (x) + γkj(x)k

∞

C’est un probl` eme d’optimisation convexe (programmation

quadratique).

(75)

(76)

Design de bobines pour l’IRM : r´ esultats.

(77)

(78)

Design de bobines pour l’IRM : r´ esultats.

Comparaisons chaleur. Design classique - Nouveau Design.

(79)

•

Merci ´ enorm´ ement ` a Ma¨ıtˆıne et Pierre pour l’invitation et

l’organisation !