• Aucun résultat trouvé

II.2 R´egularisation par approches p´enalis´ees

II.2.3 P´enalisations non quadratiques

L’´echec de la m´ethode de Tikhonov pour restaurer les discontinuit´es des images peut ˆetre expliqu´e simplement en consid´erant le cas o`u la matrice D est celle des diff´erences du premier ordre. La p´enalisation quadratique (II.8) p´enalise “sans distinction” les diff´erences inter-pixels et conduit ainsi `a une solution “douce”. L’approche par pr´eservation des discontinuit´es consiste `

a “adapter” la p´enalisation en fonction de l’amplitude des variations. En particulier, il s’agit de p´enaliser moins fortement qu’une quadratique les fortes valeurs correspondant aux discontinuit´es afin que ces caract´eristiques recherch´ees puissent se retrouver dans l’image restaur´ee.

Ainsi, `a la place de la p´enalisation quadratique (II.8) est substitu´ee la p´enalisation non quadratique suivante P(x) = C X c=1 φ([Dx]c) (II.9)

o`u φ : R 7→ R est appel´ee fonction de r´egularisation. Notons que lorsque la fonction de

r´egularisation est la parabole φ(t) = t2alors la p´enalisation (II.9) s’identifie `a celle de Tikhonov (II.8). L’int´erˆet de l’approche par p´enalisation non quadratique est illustr´e dans la figure II.1

page34pour un probl`eme de restauration d’image en IRM [Labat et al.,2005]. La figureII.1(b) qui est la version restaur´ee de la figure II.1(a) montre que cette approche permet bien de pr´eserver les discontinuit´es de l’image.

De nombreux candidats pour le choix de la fonction de r´egularisation φ ont ´et´e propo- s´es. Le principe de toutes ces fonctions de r´egularisation consiste `a remplacer la p´enalisation quadratique de Tikhonov par une fonction mieux adapt´ee `a la pr´eservation des discontinuit´es, c’est-`a-dire permettant ponctuellement des variations importantes de l’estim´ee. Il est `a noter que le choix de la fonction de r´egularisation et les arguments rattach´es sont tr`es similaires `a l’utilisation des normes robustes en statistique [Black et Rangarajan,1996].

Inversion par approches p´enalis´ees (a) 50 100 150 200 250 300 350 50 100 150 200 250 300 350 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (b) 50 100 150 200 250 300 350 50 100 150 200 250 300 350 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Fig. II.1: Restauration d’une image IRM de genou (GRBB, Ecole Polytechnique de Montr´eal). (a) Image originale, (b) Image restaur´ee par approche p´enalis´ee pr´eservant les discontinuit´es (fonction de r´egularisation hyperbolique (II.12) page 36 avec pour matrice D (II.9) celle des diff´erences du premier ordre).

II.2 R´egularisation par approches p´enalis´ees

Plutˆot que de r´epertorier toutes les fonctions de r´egularisation pr´eservant les discontinuit´es que nous avons rencontr´ees dans la litt´erature, nous pr´ef´erons ´etablir ce qui nous a paru ˆetre le plus petit d´enominateur commun. A notre connaissance, toutes les fonctions de r´egularisa- tion φ pr´eservant les discontinuit´es utilis´ees en restauration d’images pr´esentent les propri´et´es suivantes :                      positive : φ(t)≥ 0, ∀t ∈R, (II.10a) paire : φ(t) = φ(−t), (II.10b)

non d´ecroissante surR

+, (II.10c)

φ(t) = 0 ssi t = 0 (II.10d)

croˆıt moins vite qu’une parabole vers l’infini : lim t→∞φ(t)/t

2= 0, (II.10e)

d´epend d’un seul param`etre de r´eglage δ. (II.10f)

Le param`etre δ des fonctions de r´egularisation non quadratiques pr´eservant les discontinuit´es, utilis´e en restauration d’images, repr´esente un “´ecart” par rapport au caract`ere quadratique. En g´en´eral, plus δ est grand et plus la fonction de r´egularisation ainsi d´efinie est proche d’une quadratique.

Pr´ecisons que nous distinguons ici les conditions de r´egularisation assurant la pr´eservation des discontinuit´es de la mise en œuvre algorithmique. Les fonctions de r´egularisation seront suppos´ees diff´erentiables dans les prochains chapitres portant sur les aspects algorithmiques. Indiquons que les termes φ′(t)/t et φ′′(t) peuvent ˆetre interpr´et´es g´eom´etriquement comme des termes de lissages dans le cadre d’une p´enalisation portant sur le gradient de l’image [Blanc- F´eraud et al., 1995]. Ainsi, le choix d’une fonction de r´egularisation quadratique induit un lissage isotrope tandis qu’une fonction non quadratique induit un lissage anisotrope permettant de restituer les discontinuit´es de l’image. Notons que si certaines fonctions de r´egularisation φ d´efinies dans la litt´erature ne v´erifient pas directement φ(0) = 0, il est toujours possible d’effectuer un changement d’origine en les rempla¸cant par

φ(t) := φ(t)− φ(0)

car la p´enalisation r´esultante est inchang´ee `a une constante pr`es. D’ailleurs, pour des raisons de stabilit´e num´erique, il est souvent pr´ef´erable d’utiliser une fonction de r´egularisation s’annulant en z´ero.

Il est `a remarquer que les fonctions de r´egularisation non quadratiques d´ependent d’un param`etre δ, contrairement `a la fonction quadratique de Tikhonov. Ainsi, les fonctions de r´egu- larisation pr´eservant les discontinuit´es r´epondent `a l’exigence de pr´eservation de discontinuit´es, mais au prix d’une certaine augmentation de complexit´e du r´eglage par rapport `a l’approche par p´enalisation quadratique. Dans le cadre de la d´efinition II.2.1d’un r´egularisateur, le couple de param`etres (λ, δ) de r´egularisation se trouve dans l’ensemble Λ =R

+×

R

+ dans l’immense ma- jorit´e des fonctions de r´egularisation, `a l’exception notable de la famille ℓp pr´esent´ee ci-dessous o`u Λ =R

+× [1, 2[.

Si les fonctions de r´egularisation consid´er´ees dans le cadre de la restauration d’images sont paires, il est `a noter que ce n’est pas syst´ematiquement le cas en traitement du signal. Par exemple, il est fait usage en spectroscopie de fonctions de r´egularisation asym´etriques, d´efinies par une partie quadratique enR

et avec une partie pr´eservant les discontinuit´es en

R

+[Mazet

et al.,2005].

Bien que toutes les fonctions de r´egularisation pr´eservant les discontinuit´es utilis´ees en res- tauration d’images v´erifient les propri´et´es (II.10a)-(II.10f), une d´emarcation importante peut ˆetre effectu´ee selon leur nature convexe ou non. Cette distinction n’a rien de formel puisque qu’elle conditionne la convexit´e du crit`ere p´enalis´eJ qui elle-mˆeme a un impact tr`es sensible sur la solution ainsi estim´ee comme expliqu´e ci-apr`es.

Inversion par approches p´enalis´ees

[A] P´enalisations convexes

Parmi les p´enalisations convexes, on peut distinguer deux familles qui satisfont bien aux caract´eristiques de pr´eservation des discontinuit´es (II.10a)-(II.10f), si on effectue un changement `

a l’origine.

(i) Les fonctions de r´egularisation ℓ2ℓ1 :

Elles sont convexes, C1, C2 en 0 et asymptotiquement lin´eaires. La d´esignation ℓ2ℓ1 fait explicitement r´ef´erence au r´egime ℓ2 (quadratique) pr`es de 0 et au r´egime ℓ1 (droite de pente non nulle) vers l’infini. Les fonctions de r´egularisation ℓ2ℓ1 les plus connues sont la fonction de Huber, C1, introduite initialement en statistique robuste [Huber,1981] :

φ(t) = (

t2 pour |t| < δ,

|t| − δ2 sinon (II.11)

repr´esent´ee `a la figure II.2(a) et la fonction hyperbolique, C2, utilis´ee notamment par [Vogel et

Oman,1996;Charbonnier et al.,1997] :

φ(t) =pt2+ δ2 (II.12)

repr´esent´ee `a la figureII.2(b). Le param`etre δ est `a valeur dans R

+ pour ces deux fonctions.

(ii) Les fonctions de r´egularisation ℓp :

Elles sont utilis´ees notamment par [Bouman et Sauer,1993] et sont d´efinies par φ(t) =|t|δ

avec δ ∈ [1, 2). Elles sont C1pour δ > 1 et non diff´erentiables en z´ero pour δ = 1. Un repr´esentant est donn´e `a la figureII.2(c).

(a) (b) (c)

Fig. II.2: Fonctions : (a) de Huber : (II.11), (b) hyperbolique :√δ2+ t2, (c) ℓ p :|t|δ.

II.2 R´egularisation par approches p´enalis´ees

[B] P´enalisations non convexes

Les fonctions de r´egularisation ℓ2ℓ0 sont des repr´esentantes classiques des fonctions de r´egu- larisation non convexes. Elles satisfont aux caract´eristiques de pr´eservation des discontinuit´es (II.10a)-(II.10f) et sont asymptotiquement constantes (caract`ere ℓ0). La quadratique tronqu´ee introduite par [Blake et Zisserman, 1987] est un repr´esentant des fonctions de r´egularisation ℓ2ℓ0 :

φ(t) = mint2, δ2 (II.13)

avec δ > 0. Cette fonction n’est pas diff´erentiable en t = ±δ. Un repr´esentant est donn´e `a la figure II.3(a).

D’autres fonctions de r´egularisation ℓ2ℓ0 plus r´eguli`eres sont introduites dans [Geman et

McClure,1987] comme

φ(t) = t 2

t2+ δ2 (II.14)

avec δ > 0 et qui est cette fois C2. Un repr´esentant est donn´e `a la figureII.3(b).

(a) (b)

Fig. II.3: Fonctions : (a) quadratique tronqu´ee : mint2, δ2 , (b) : t 2 δ2+ t2.

Les fonctions de r´egularisation ℓ2ℓ0 sont non convexes et non coercives. Notons qu’il existe des fonctions de r´egularisation non convexes mais coercives comme la fonction suivante propos´ee dans [Hebert et Leahy,1989]

φ(t) = log t2+ δ2.

Cette fonction est pr´esent´ee comme un compromis entre la quadratique et la fonction de Geman et McClure (II.14). Un repr´esentant est donn´e `a la figureII.4.

Inversion par approches p´enalis´ees

[C] Avantages de la p´enalisation convexe

La convexit´e du crit`ere p´enalis´e J est conditionn´ee par le caract`ere convexe de la fonction de r´egularisation non quadratique. Si un crit`ere convexe a pour propri´et´e d’ˆetre unimodal, un crit`ere non convexe est en g´en´eral multimodal.

L’emploi de fonctions de r´egularisation ℓ2ℓ0 conduit syst´ematiquement `a un crit`ere J mul- timodal [Li, 1995, Sec. IV.B], [Blake, 1989, p. 3]. Ce caract`ere multimodal qu’entraˆıne l’usage de fonctions de r´egularisation non convexes a pour cons´equence un manque de robustesse de la solution. En effet, le crit`ere non convexe, de par ses multiples minima locaux pr´esente une forme d’instabilit´e de la solution ˆxpar rapport aux donn´ees et aux param`etres de r´eglage. Cette instabilit´e est soulign´ee notamment dans [Bouman et Sauer,1993, Sec. I.B]. Indiquons que cette instabilit´e est li´ee `a un aspect d´ecision induit par les fonctions de r´egularisation non convexes [Idier et Blanc-F´eraud,2001, Sec. 6.3.2].

Ce manque de stabilit´e introduit par les fonctions de r´egularisation non convexes tient au fait que ˆxn’est pas une fonction continue des donn´ees ni des param`etres de r´eglage. En d’autres termes, la troisi`eme condition de Hadamard n’est pas satisfaite par ˆx, donc le probl`eme est en- core mal pos´e malgr´e la p´enalisation. Par contre, l’usage de fonctions de r´egularisation convexes ne pr´esente pas ces faiblesses et conduit `a un probl`eme bien pos´e.

Mˆeme s’il est possible de trouver un exemple en simulation o`u l’utilisation de fonctions de r´e- gularisation non convexes permet d’obtenir une solution plus proche de l’original que l’utilisation de fonctions de r´egularisation convexes, face `a des donn´ees r´eelles, le r´eglage des hyperpara- m`etres est rendu difficile par l’instabilit´e de la solution. Ainsi, il peut ˆetre pr´ef´erable d’utiliser dans un cadre r´eel des fonctions de r´egularisation convexes pour des raisons de robustesse. Il est int´eressant de noter que si initialement, les fonctions de r´egularisation non convexes introduites par [Geman et Geman, 1984] ont ´et´e largement utilis´ees avant les fonctions de r´egularisation convexes, un revirement est observ´e faisant du recours aux fonctions de r´egularisation convexes l’approche pr´epond´erante, `a la suite de travaux tels que [Bouman et Sauer,1993].

En outre, la minimisation d’un crit`ere multimodal n´ecessite la mise en œuvre d’algorithmes d’optimisation autrement plus complexes et donc d’un coˆut calculatoire bien plus ´elev´e que la minimisation d’un crit`ere unimodal.