• Aucun résultat trouvé

Agrégation d'estimateurs pour le débruitage d'image

N/A
N/A
Protected

Academic year: 2021

Partager "Agrégation d'estimateurs pour le débruitage d'image"

Copied!
5
0
0

Texte intégral

(1)

HAL Id: inria-00386668

https://hal.inria.fr/inria-00386668

Submitted on 22 May 2009

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de

Agrégation d’estimateurs pour le débruitage d’image

Joseph Salmon, Erwan Le Pennec

To cite this version:

Joseph Salmon, Erwan Le Pennec. Agrégation d’estimateurs pour le débruitage d’image. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386668�

(2)

Agr´

egation d’estimateurs pour le d´

ebruitage

d’image

Joseph Salmon & Erwan Le Pennec

Laboratoire de Probabilit´e et Mod`eles Al´eatoires, CNRS-UMR 7599, Universit´e Paris 7-Diderot

175 rue du Chevaleret 75013 Paris

MOTS CLEFS: Mod`eles semi et non param´etriques, Statistique math´ematique, Agr´egation, NL-Means, Diffusion.

R´ESUM´E: Dans ce travail sur le d´ebruitage d’image, nous pr´esentons un nouveau type d’estimateur par patchs inspir´e de la m´ethode NL-Means propos´ee par Buades, Coll et Morel (2005) et des techniques PAC-Bay´esienne ´etudi´ees par Dalalyan et Tsybakov (2007). Nous pr´esentons le cadre th´eorique adapt´e pour ces estimateurs, leur impl´ementation ainsi que leurs performances th´eoriques et pratiques.

ABSTRACT: In this work on image denoising, we present a novel type of patch base estimator inspired by the Non Local Means proposed by Buades, Coll et Morel and the PAC-Bayesian techniques studied by Dalalyan and Tsybakov. We present the theo-retical framework adapted to these estimators and deal with both theotheo-retical and pratical performances of these estimators.

Le d´ebruitage d’images num´eriques, l’estimation d’images corrompues par un bruit, est un th`eme classique `a la fronti`ere du traitement du signal et des statistiques. Inspir´es par les travaux de Buades, Coll et Morel (2005) sur les Non Local Means (NL-means) et les techniques PAC-Bay´esienne ´etudi´e par Dalalyan et Tsybakov (2007), nous proposons un nouveau type d’estimateur utilisant des patchs qui repose sur des techniques d’agr´egation d’estimateurs.

Le mod`ele consid´er´e est le mod`ele classique de r´egression sur une grille fixe: pour chaque pixel i d’une image de taille n × n, on observe

Yi = f (i) + εi ,

o`u f (i) est la vraie valeur et εi, une suite i.i.d. de gaussienne centr´ee de variance σ2connue.

Vectoriellement, Y = f + ε. On recherche alors des bons estimateurs de f en tout point de la grille `a partir de l’observation de Y , la perte ´etant mesur´ee par la norme ℓ2. De

nombreux estimateurs ont ´et´e propos´es dans ce cadre: estimateurs `a noyaux, seuillage dans des bases d’ondelettes ou des repr´esentations g´eom´etriques... Nous ´etudions ici une classe d’estimateurs diff´erente : celle des estimateurs bas´es sur des moyennes de patchs voisins.

(3)

Le premier estimateur de ce type a ´et´e propos´e par Buades, Coll et Morel en 2005 sous le nom de NL-Means. Il est construit de la mani`ere suivante. On place autour d’un pixel i0 une petite fenˆetre (que l’on choisira en pratique de taille 5 × 5), et l’on appelle

patch bruit´e Pi0 la restriction de Y `a celle-ci. On consid`ere ´egalement dans un voisinage

de ce pixel, M patchs P (i0, 1), . . . , P (i0, M ) de mˆeme forme. On cherche alors `a estimer

la restriction de f `a la fenˆetre centr´ee autour de i0 par une combinaison lin´eaire ˆP (i0) des

patchs voisins, ˆ P (i0) = M X j=1 λ(i0, j)P (i0, j) ,

o`u les poids λ(i0, j) d´ependent de la similarit´e du patch correspondant `a P (i0, j) avec le

patch central. De mani`ere plus pr´ecise, les poids associ´es `a la m´ethode des NL-means sont proportionnels `a des exponentielles en la distance ℓ2 des patchs et somment `a 1:

λ(i0, j) = exp (−β −1kP i0 − P (i0, j)k 2) PM k=1exp (−β−1kPi0 − P (i0, k)k 2) .

Le param`etre β, dit param`etre de temp´erature, permet de r´egler la mesure de similarit´e et joue le rˆole de la fenˆetre dans les m´ethodes `a noyaux. Il contrˆole donc le niveau de lissage. Cette m´ethode simple donne de tr`es bon r´esultats pratiques mais il n’existe pas de preuve th´eorique de son efficacit´e.

Dans le travail de Dalalyan et Tsybakov (2007) sur l’agr´egation d’estimateurs on voit apparaˆıtre une construction similaire pour laquelle ils obtiennent des r´esultats th´eoriques. Dans le mˆeme mod`ele statistique, ils se donnent une famille P (1), . . . , P (M ) de pr´e-estimateurs et cherche `a estimer f `a partir d’une combinaison lin´eaire Pλ de ceux-ci

Pλ = M

X

i=1

λ(i)P (i) .

Pour cela, ils fixent une loi a priori π sur RM et d´efinissent l’estimateur PAC-Bay´esien

associ´e ˆfπ par ˆ fπ = R RM Pλexp (−β−1kY − Pλk2) π(dλ) R RM exp (−β−1kY − Pλk2) π(dλ) .

La similarit´e entre cette formule et celle des NL-Means est frappante. De mani`ere plus pr´ecise, on retrouve exactement les NL-Means en restreignant l’estimation au voisinage autour de i0, en choisissant pour pr´e-estimateurs les patchs voisins P (i) = P (i0, i) et pour

π la loi discr`ete uniforme sur les pr´e-estimateurs, soit π = 1/MPMi=1δei o`u e1, . . . , eM

est la base canonique de RM, et δ

ei est la mesure de Dirac associ´ee. Lorsque les

pr´e-estimateurs sont ind´ependants de Y , ils d´emontrent que si β ≥ 4σ2 alors

Ekf − ˆfπk2 ≤ inf p

Z

(4)

o`u p parcours l’ensemble des probabilit´es sur RM et K(p, π) est la divergence de

Kullback-Leibler entre p et π. Le risque de l’estimateur est plus petit que le risque de toute com-binaison des estimateurs Pλ `a un terme pr`es mesurant la distance entre ces combinaisons

et l’a priori utilis´e. L’hypoth`ese d’ind´ependance n’est pas v´erifi´ee dans le cas d’utilisation des patchs mais des travaux en cours sugg`erent qu’une in´egalit´e de la forme

Ekf − ˆfπk2 ≤ inf p

Z

kf − fλk2+ σ2|λ|2p(dλ) + βK(p, π) ,

est v´erifi´ee. Celle-ci signifie que le risque de l’estimateur est major´ee par toute le risque de toute combinaison d’estimateur `a noyaux `a un terme mesurant la distance entre l’a priori et cette combinaison pr`es; on fait “aussi bien” que le meilleur des noyaux possibles au terme de divergence pr`es.

Deux questions se posent alors: Comment choisir l’a priori π pour assurer que le membre de droite de l’in´egalit´e pr´ec´edente soit proche du minimum sans le terme de divergence? Comment calculer en pratique cet estimateur?

L’efficacit´e de la m´ethode repose en grande partie sur le choix de l’a priori sur les pr´e-estimateurs. L’avantage des NL-means est la simplicit´e de leur calculs. Le choix d’un a priori uniforme sur les valeurs P (i0, 1), . . . , P (i0, M ) permet de ne pas avoir d’int´egrale

`a calculer. Dalalyan et Tsybakov ont montr´e l’int´erˆet d’un a priori sym´etrique `a queue lourde (par exemple une loi 3-Student) lorsque le meilleur estimateur est une combinaison parcimonieuse des pr´e-estimateurs. Dans le cadre du d´ebruitage, une approche “noyau” conduit `a regarder un a priori gaussien, ou un m´elange gaussien.

Dalalyan et Tsybakov (2009) sugg`erent une m´ethode de type Langevin-Monte Carlo, analogue continu des m´ethodes MCMC classiques, pour le calcul de l’estimateur. Cette m´ethode est bas´ee sur le faite que si V est une fonction suffisamment r´eguli`ere (et sous quelques conditions techniques), la solution L de la diffusion r´egie par l’´equation de Langevin,

dLt= ∇V (Lt)dt +

2 dW t , L0 = λ0 , t ≥ 0 ,

avec λ0 ∈ RM, Wtun mouvement Brownien M -dimensionnel, a pour distribution

station-naire pV(λ) ∝ eV (λ), λ ∈ RM. En prenant

V (λ) = −β−1kY − f

λk2n− log (π(λ)) ,

la diffusion converge vers la distribution apparaissant dans les estimateurs PAC-Bay´esien. L’int´egrale RRM λpV(dλ) s’obtient alors comme limite des int´egrales le long d’une

trajec-toire ¯LT = T1

RT 0 Ltdt.

Cette int´egrale est approch´ee num´eriquement grˆace `a la r´esolution d’un sch´ema d’Euler discret `a pas constant associ´e `a la diffusion. On d´efinit LE

0 = λ0 et pour k = 1, . . . , [T /h]−

1,

(5)

o`u W1, W2, . . . sont des gaussiennes standardis´ees et i.i.d de RM. On approche alors naturellement ¯LT par: ˆ LET,h = 1 [T /h] [T /h]−1X k=0 LEk.

Cette m´ethode permet de calculer un estimateur proche de l’estimateur th´eorique. Nous avons comparer les diff´erents a priori sur des images usuelles et nous montrerons les variations de performances selon le type d’a priori choisi.

Bibliographie

[1] A. Buades, B. Coll, and J-M. Morel (2005) ”A review of image denoising algorithms, with a new one”, Multiscale Model.Simul., vol. 4, no. 2, pp. 490-530.

[2] A. Dalalyan and A. Tsybakov (2007) ”Aggregation by exponential weighting, sharp oracle inequalities and sparsity” in COLT, pp. 97-111.

[3] A. Dalalyan and A. Tsybakov (2009) ”PAC-Bayesian bounds for the expected error of aggregation by exponential weigths” to appear.

Références

Documents relatifs

On s’int´ eresse dans ce travail ` a la m´ ethode de d´ ecomposition en deux sous do- maine pour r´ esoudre des probl` emes de contrˆ ole optimal r´ egis par des in´

Dans la suite de cette exp´ erimentation, nous d´ etaillons les r´ esultats num´ eriques obtenus avec notre m´ ethode, en comparaison avec ceux fournis par d’autres m´ ethodes

2 Sondage Ifop pour le Valeurs Actuelle réalisé du 4 au 6 septembre 2013 par questionnaire auto-administré en ligne auprès d’un échantillon de 1 014 personnes, représentatif de

Nous attendons du/de la future titulaire du poste qu’il/elle ait une expertise en histoire contemporaine récente (après 1945), démontrée par la thèse de doctorat ou le nouveau

Pour une image marquée et potentiellement dégradée par la compression JPEG (ou image test), le but poursuivi par ce marquage multiple n'est pas d'évaluer une valeur

Nous exposons ensuite le d´ eveloppement de cette th´ eorie et son utilisation par Batyrev, Denef—Loeser et Nicaise—Sebag notamment, en mettant l’accent sur ses applications

Le fait de calculer le champ de d´eformation par sommet et non plus par triangle modifie notre m´ethode de dessin de ligne.. Afin de prendre en compte la continuit´e du champ, on

Dans la premi`ere exp´erience, notre m´ethode et le d´etecteur de coins de Har- ris sont capables de d´etecter deux types de jonctions : les jonctions connectives (coins) (par