• Aucun résultat trouvé

Estimation non-paramétrique dans les problèmes inverses à opérateur bruité

N/A
N/A
Protected

Academic year: 2021

Partager "Estimation non-paramétrique dans les problèmes inverses à opérateur bruité"

Copied!
174
0
0

Texte intégral

(1)

HAL Id: tel-00957985

https://tel.archives-ouvertes.fr/tel-00957985

Submitted on 11 Mar 2014

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

inverses à opérateur bruité

Thomas Vareschi

To cite this version:

Thomas Vareschi. Estimation non-paramétrique dans les problèmes inverses à opérateur bruité.

Statis-tiques [math.ST]. Université Paris-Diderot - Paris VII, 2013. Français. �tel-00957985�

(2)

UFR de Mathématiques

Thèse de do torat

présentée pour obtenir letitre de

Do teur en s ien es de l'université Paris VII

Spé ialité : Mathématiques appliquées

soutenue par

Thomas Vares hi

Estimation Non-paramétrique Dans Les Problèmes

Inverses À Opérateur Bruité

Dire tri e de thèse : Dominique Pi ard

Soutenue publiquementle 6dé embre 2013 devant lejury omposé de:

Mme Cristina Butu ea Université Paris-Est Marne-la-Vallée Rapporteur

M. Markus Reiss Humboldt-Universität zu Berlin Rapporteur

M. Stéphane Bou heron Université Paris Diderot Examinateur

Mme Fabienne Comte Université Paris Des artes Examinatri e

M. Sylvain Delattre Université Paris Diderot Examinateur

M. Mar Hoffmann Université Paris Dauphine Examinateur

(3)
(4)

Mespremiersremer iementsvontàmadire tri eDominiquePi ard. Dominique,mer i de m'avoirfait dé ouvrirle mondede la re her he dans e domainepassionnant qu'est elui de la statistique (non paramétrique, mais pas que). Mer i pour ton soutien on-stant, pour la patien e dont tu as fait preuve et pour ta gentillesse à mon égard au ours de es trois années.

Je remer ie haleureusement Cristina Butu ea et Markus Reiÿ d'avoir a epté de rapporter mathèse. Je leur en suis très re onnaissant.

Je remer ie Fabienne Comte, Stéphane Bou heron, Sylvain Delattre et Mar Ho-mannd'avoir a epté de parti iperà mon jury de thèse. Leur présen e dans mon jury est un honneur, etleurstravauxontété une sour ed'inspirationpendant es trois ans. Un des travaux de ette thèse est le résultat d'une ollaboration ave plusieurs auteurs. J'en prote don pour remer ier (au risque d'être redondant) Dominique Pi ard,SylvainDelattre,etMar Homannpour etteagréableexpérien e. Jeremer ie parti ulièrementMar pour sonénergie etson initiationpédagogique(et patiente) aux lowers bounds. Certaines parties de ette thèse lui doiventbeau oup.

Cefutun plaisird'assurerlestravauxdirigésdu oursdeKarineTribouleyau ours de es trois ans. Jela remer ie de m'avoirdonné ette opportunité.

Cestroisannéesfurentégalementl'o asionderen ontresagréablesetenri hissantes auseindu laboratoireduLPMA.Jeremer iedon StéphaneBou heron,Sylvain Delat-tre, GérardKerkya harian,Erwan LePenne , MathildeMougeot, etKarine Tribouley pour m'avoira ordé ne serait- e qu'un peu de leur temps en expli ationsou onseils. Un grand mer i également au personnel administratif du laboratoire et de l' U.F.R : Nathalie Bergame, Pas al Chiettini et Valérie Juvé pour leur e a ité et leur sympa-thie.

Enn, e préambule est l'o asion pour moid'exprimer masin èregratitude à mes ompagnons de route thésards qui ont entre autres rendu les moments di iles plus supportablesetmoinssolitaires. Pournevexerpersonne,mer idon parordre alphabé-tiqueàAnna Benhamou,GuillaumeBarraquand, OrianeBlondel, JiatuCai, Sébastien Choukroun, Sophie Coquan, Aser Cortines, Pierre Gruet, Lori k Huang, Ni olas Lan-grené,Vi tor Perez, ChristophePoquet et Maud Thomaspour labonne ambian e que vous avez maintenue lors des pauses afé ou bien des soirées passées ensemble. Qu'ils m'ex usent pour l'absen e de remer iements personnalisés, mais le temps me manque a tuellement! Je porte une attention parti ulière à mes 'frères de thèse' Jean-Baptiste

(5)

m'avoirremer ié dans son manus rit de thèse.

Cette thèse n'aurait pas été la même sans le soutien de ma famille qui tient une pla e de premier plan pour moiet que je tiens à remer ier i i. J'ai bien entendu une pensée pour mes amis, qui mepardonneront manon-exhaustivité.

Pournir, mer ià ellequiapatiemmentsupporté, sans(trop)seplaindre, estrois annéesparfois di iles. Amélie, estravauxtedoiventaussibeau oup etlesmotsseuls ne peuvent exprimer toute mare onnaissan e, et plus en ore...

(6)

1 Introdu tion aux problèmes inverses 11

1.1 Qu'est- e qu'un problème inverse? . . . 11

1.2 Cadre statistique des problèmes inverses . . . 13

1.2.1 Diérents modèles statistiques . . . 13

1.2.2 Critère de performan e et adre minimax . . . 14

1.3 Méthodes de résolution . . . 15

1.3.1 La méthode SVD . . . 16

1.3.2 La méthode SVD par blo s. . . 16

1.4 Généralisation: méthode de Galerkin . . . 19

1.4.1 Choix des bases . . . 20

1.4.2 Dé omposition biais-varian e . . . 22

1.5 Degree of ill-posedness, espa es de régularité, adaptativité . . . 23

1.6 Né essité de onsidérer des opérateurs bruités . . . 24

2 Problèmes inverses à opérateurs bruités 27 2.1 Modèle . . . 27

2.1.1 Conséquen e sur le ompromis biais-varian e . . . 29

2.2 S hémas génériques de résolution . . . 30

2.2.1 Régularisation de l'opérateur bruité . . . 31

2.2.2 Pro edures IR et RI . . . 33

2.2.3 Détermination de bornes inférieurespour lerisque minimax . . 35

2.3 Retour sur la dé onvolution aveugle par ondelettes. . . 35

2.4 Traitement des opérateurs diagonauxpar blo s. . . 37

2.4.1 Modèle . . . 37

2.4.2 Algorithme . . . 38

2.5 Traitement des opérateurs intégraux de Volterra . . . 41

2.5.1 Hypothèses du modèle . . . 43

2.5.2 Algorithme etvitesse de onvergen e . . . 44

2.5.3 Aspe ts pratiques . . . 45

2.6 Opérateurs diagonaux par blo s : as

L

p

. . . 47

2.6.1 Needlets . . . 50

(7)

3 Blo kwise SVD with error in the operator 55

3.1 Introdu tion . . . 56

3.1.1 Motivation . . . 56

3.1.2 Main results and organisationof the paper . . . 57

3.2 Estimationby blo kwise SVD . . . 58

3.2.1 The blo kwise SVD property. . . 58

3.2.2 Blo kwise SVD re onstru tion with noisy data . . . 60

3.3 Main results . . . 60

3.3.1 Minimax rates of onvergen e . . . 60

3.3.2 Dis ussion . . . 61

3.4 Appli ationto blind de onvolution . . . 64

3.4.1 Spheri al de onvolution . . . 64 3.4.2 Cir ular de onvolution . . . 68 3.5 Proofs . . . 71 3.5.1 Preliminary estimates. . . 71 3.5.2 Proof of Theorem 3.3.1 . . . 73 3.5.3 Proof of Theorem 3.3.2 . . . 80

4 Noisy Lapla e de onvolution with error in the operator 87 4.1 Introdu tion . . . 88

4.2 Dis retization of Lapla e de onvolution . . . 90

4.2.1 Laguerre fun tions . . . 90

4.2.2 Galerkin method . . . 90

4.2.3 Appli ation tothe regression modelwith irregulardesign . . . . 91

4.2.4 Error inthe operator . . . 93

4.3 Features of the target fun tionand the kernel . . . 93

4.3.1 Sobolev spa es asso iated to Laguerrefun tions . . . 93

4.3.2 Banded Toeplitz matri es . . . 94

4.3.3 Degree of illposedness . . . 95

4.3.4 A rst algorithmof estimation . . . 96

4.4 Adaptation tothe standard framework . . . 97

4.5 Pra ti al performan es . . . 99

4.6 Proofs . . . 104

4.6.1 Proof of Proposition 4.4.2 . . . 104

4.6.2 Proofs of theorems 4.3.3 and 4.4.5 . . . 105

4.6.3 Proof of theorem 4.4.6 . . . 114

5 Needlets on

S

2

and the NEED-VD pro edure 119 5.1 A brief introdu tionto frametheory . . . 119

5.2 Needlets . . . 121

5.2.1 The needletframework . . . 122

5.2.2 Properties of needlets . . . 124

(8)

5.3 The NEED-VD pro edure . . . 126

6 Needlets and blind spheri al de onvolution 129 6.1 Introdu tion . . . 130

6.1.1 Statisti alframework . . . 130

6.1.2 Harmoni analysis on

SO

p

3

q and

S

2

. . . 132 6.2 Estimationpro edure . . . 135 6.2.1 Main pro edure . . . 136 6.2.2 Pra ti al study . . . 140 6.3 Proofs . . . 142 6.3.1 Proof of Theorem 6.2.2 . . . 148 6.3.2 Proof of Theorem 6.2.3 . . . 151

A Wavelets and statisti al estimation 155 A.1 MultiResolution Analysis . . . 155

A.2 Wavelets and approximation theory . . . 157

A.2.1 Besov spa es. . . 157

A.2.2 Besov spa es and Littlewood-Paleyde omposition . . . 157

A.2.3 Chara terization of Besov spa esvia wavelet expansion . . . 158

A.3 Statisti alestimation using wavelets . . . 159

A.3.1 Dire t estimation using wavelets . . . 159

A.3.2 Appli ation of wavelets toinverse problems . . . 160

(9)
(10)

Cettethèse est onsa réeà l'étudedes problèmesinverses ave opérateurbruité. Nous exposeronsdon dansunpremiertempsauChapitre1,demanièreintrodu tive,le adre mathématiquedesproblèmesinversesainsiquediérentesméthodesderésolution. Nous expliqueronsauChapitre 2 ommentla questionde larésolution ave opérateurbruité se pose naturellement pour ertains opérateurs, avant de passer en revue plusieurs solutionsdans le adre non paramétrique. Nousaborderons ensuite auxChapitres 3, 4 et6lesprin ipales ontributionsde ettethèseaudomainedesproblèmesinverses ave opérateurbruité, àsavoir:

AuChapitre 3, letraitement d'opérateurs diagonauxpar blo s dans un as

L

2

.

Au Chapitre 6, l'adaptation de ette pro édure à une perte de type

L

p

, dans le as pré is de la dé onvolution sphérique.

AuChapitre 4, letraitement d'opérateurs de onvolutionde Lapla e/Volterra. Uneversion résumée de es trois hapitres, ayant ha un fait l'objet d'une publi ation ou d'une soumission dans une revue s ientique, se trouve dans le Chapitre 2. Le Chapitre 5sert d'interludeentre les Chapitres 3et 6. On y présente lesneedlets, sorte d'équivalent des ondelettes sur la sphère, mises en oeuvre dans le Chapitre 6.

Au oursde emanus rit,nousdénirons leplus souventlesnotationsen jeu. Nous apportons i iquelques pré isions sur ertaines d'entre elles:

Lesnotations

a

À

b

,

a

Á

b

ou

a

¤

Cb

,

a

¥

Cb

signientinégalitéà une onstante multipli ativeprès. La onstante

C

peut dépendre dedonnées annexes, quenous ne pré iserons pas lorsque le ontexte sera lair.

Lanormespe trale d'un opérateuroubien d'une matri esera désignée par }

.

} op

, lanorme de Hilbert-S hmidtd'une matri epar }

A

}

HS Trp

t

AA

q.

Enn,lorsque enesera paspré isé,lanorme}

.

}seralanormeasso iéeàl'espa e de Hilbert

H

ou

K

sous-ja ent.

(11)
(12)

Introdu tion aux problèmes inverses

Ce hapitre est dédié à laprésentation et autraitementdes problèmes inverses (se tion1.1). On s'intéressera en parti ulier au adre statistiquesous-ja entà

l'ensemblede ette thèse en se tion1.2 avant de passer en revue diverses méthodes de résolution (se tion1.3). Nousverrons que l'étudedu ompromis biais varian einduit par une méthode de Galerkin (se tion1.4)introduit naturellementles notions

d'espa e de régularité et de 'degree of ill-posedness' (se tion1.5). Enn, un bref exemplepratique(se tion 1.6)motivera l'introdu tiondu adredes problèmesinverses ave erreur dans l'opérateurau hapitresuivant.

Contents

1.1 Qu'est- e qu'un problème inverse? . . . 11

1.2 Cadre statistique des problèmes inverses . . . 13

1.3 Méthodes de résolution . . . 15

1.4 Généralisation: méthode de Galerkin . . . 19

1.5 Degree of ill-posedness,espa es de régularité, adaptativité 23 1.6 Né essité de onsidérerdes opérateurs bruités . . . 24

1.1 Qu'est- e qu'un problème inverse?

Un problème inverse onsiste en la détermination de l'anté édent d'un état par un pro édé évolutif. Ou bien, formulé de manière plus simpliste, à déterminer des auses onnaissant leurs eets. Bienévidemment, etteformulationest trop générale dans un ontexte mathématique,aussi nous pré isons maintenantnotre adre de travail. Lamodélisationd'untelpro édé sefait par lebiais d'un opérateur

K

,agissant sur un ensemble

H

(de auses), à valeurs dans un ensemble

K

(d'eets). Un problème inverse onsistedon ,étantdonnéunélément

g

P

K

imaged'unélément

f

P

H

selonl'équation

(13)

àdéterminer l'in onnue

f

. Dansnotre as, l'ensemble

H

est un ensemble de fon tions, quenoussupposeronsdéniessurun espa emesurablep

Y, dµ

q. Nousomettronsparfois la mesure

µ

lorsque le ontexte sera lair. Avant de poursuivre, donnons-en quelques exemplesan de motiverleur étude:

Opérateur de onvolution: L'exemple le plus emblématique est sans doute elui de la dé onvolution. I i, la fon tion

f

P

L

2

pr

0, 1

sq est observée au travers d'un dispositif bruitant quimoyenne lo alement lafon tion, selon l'équation

g

p

x

q

Kf

p

x

q

k



f

p

x

q »

1

0

f

p

x



t

q

k

p

t

q

dt ,

(1.2) où

k

est une fon tion de

L

2

pr

0, 1

sq. Plus généralement, onobserve

g

p

x

q

Kf

p

x

q

k



f

p

x

q »

H

f

p

h



1

x

q

k

p

h

q

dh ,

oùHestungroupeagissantsur

Y

,et

dh

est lamesurede Haarsur

H

. Cette mod-élisation très générique re ouvre des domaines très variés, in luant par exemple letraitementd'images, laspe tros opie, oubien l'astrophysique.

Opérateur de Wi ksell: Supposons que des sphères, dont le rayon suit une loi de probabilité de densité

f

, baignent dans un milieu. On désire retrouver

f

à partirde oupes planaires. Ce modèle possède des appli ations en biologieet en stéréologieentreautres. JohnstoneandSilverman[45℄ontmontréqu'il onduisait àl'inversion de l'opérateur

K : L

2

r

0, 1

s

,

p

4x

q 

1

dx

 Ñ

L

2

r

0, 1

s

, 4π



1

p

1



y

2

q

1

{

2

dy



f

ÞÑ

Kf

p

y

q

π

4

y

p

1



y

2

q 

1

{

2

»

1

y

p

x

2



y

2

q 

1

{

2

f

p

x

qp

4x

q 

1

dx .

Opérateurintégral de Volterra: Soit

f

P

L

2

p

R

q. On observe, pour

t

¥

0

,

g

p

t

q »

t

0

k

p

τ

q

f

p

t



τ

q

dτ .

(1.3) Cetopérateurest l'analoguede l'opérateurde onvolutionpourdes systèmesnon anti ipants, 'est-à-dire que

g

p

t

q ne dépend que des valeurs de

k

et de

f

prises aux temps

τ

 

t

. En ore une fois, les appli ations sont nombreuses et in luent par exemple la dynamique des populations et la spe tros opie par uores en e. On pourra par exemple seréférer à [59, Chap. 2℄.

Cettelisteestbiensûr hautementnonexhaustive,etonpourra onsulter[53,Chap. 1℄ pour y apporter de nouveaux exemples. De plus, remarquons que nous n'avons mentionné que des opérateurs linéaires. Lathéorie des problèmes inverses à opérateur nonlinéairesétantautrementplus omplexe,nous nel'aborderons pasi i,etnousnous restreindronsdon à l'étuded'opérateurs linéaires. Revenons don àla formulation du problème. En toute généralité, e dernier est mal posé au sens de Hadamard. De manièreplus pré ise, plusieursfa teurs peuvent entraversa résolution:

(14)

Existen e: enpratique,onn'observejamais

Kf

,maispluttuneversionbruitée

Kf

ξ

. Silafon tionobservéen'appartientpasà

Im

p

K

q,alorsl'inversiondire te ommedans (1.1) est impossible.

Uni ité: si plusieurs anté édents onduisent à la même observation, le hoix de l'un d'entre eux seulement prête à onfusion. Il est don né essaire de disposer d'informationsadditionnellespermettantde dis riminerentre lesdiérentes solu-tions. On supposera dans notre as l'opérateur inje tif.

Stabilité: malgré l'inje tivité supposée, un dernier problème subsiste. Sa hant qu'en pratique, d'une part, la fon tion

g

n'est jamais observée qu'à travers une approximation, et que d'autre part l'inversion de l'opérateur

K

est elle-même sujette à approximation, on voit qu'une notion de ontinuité vis-à-vis des don-nées ainsi qu'une notion de stabilité de l'opérateur sont indispensables. C'est en parti ulier e dernier problème que nous tenterons de résoudre dans ertains as pré is. Le ara tère mal posé se traduira par le fait que l'opérateur

K

est om-pa t. Dans e as,

K



1

n'estpas ontinuetmêmeuneerreur trèsfaible ommise sur l'observation de

g

peut onduire à un résultat radi alement diérent de

f

. Il est don né essaire de régulariser

K

, 'est à dire de trouver

€

K

'pro he' de

K

en un ertain sens, ompatibleave l'inversionde (1.1),mais auxpropriétés plus attrayantes (stabilité,simpli itéet rapidité omputationnelle de l'inversion).

Pour plus de pré isions on ernant es questions,on pourra seréférer à Kirs h[53℄.

1.2 Cadre statistique des problèmes inverses

1.2.1 Diérents modèles statistiques

Nous venons d'exposer le adre générique d'un problème inverse. Dans l'optique de sarésolution, laproblématique déterministe onsiste àmajorerl'erreur(déterministe!) ommisesur

f

enfon tiondel'erreur ommisesur

g

. Enstatistique,l'appro headoptée est diérente, etonsuppose queleterme d'erreur est lerésultatd'un pro édéaléatoire dont on ontrle l'amplitude. Ce type d'appro he re ouvre en réalité plusieurs adres statistiques distin ts (mais onnexes, voir [82, Chap. 1℄), dont nous présentons trois as parti uliers :

(1) Estimationdedensité: Onobservep

Y

1

, ..., Y

n

qun

n

-é hantillondeloi ommune

Z

àdensité

f

Z

,telque

f

Z

estl'imagepar

K

de ladensité ible

f

. Enparti ulier, ilfaut que

K

onserve l'ensemble

f

P

H

,

»

f



1

(

.

Unexempletrès simple d'appli ationest eluide la onvolution de deux densités déniessur

R

: si

X

et

Y

sontdeuxvariablesaléatoiresàvaleursréelles,dedensités

(15)

respe tives

f

et

g

, alors la variable

Z



X

Y

a pour densité

f

Z



g



f

où  est le produit de onvolution sur

R

. L'opérateur

K : f

ÞÑ

g



f

onserve bien l'ensembledes fon tionsmesurables d'intégrale1. La version 'sphérique' de ette exempleest présentée au Chapitre 3.

(2) Modèle de régression: Soit

t

1

, ..., t

n

P

Y

. On observe lesvaleurs

Y

i



Kf

p

t

i

q

ξ

i

, i



1, ..., n ,

oùlesvariables

ξ

i

sonti.i.det

E

r

ξ

1

s

0

. La qualitéde l'estimationde

f

est bien sûr intrinsèquement liéeà elle de la grille

t

1

, .., t

n

.

(3) Modèle de bruit blan : Ce modèle est un modèle idéalisé, mais très utile en théorie: onobserve des réalisations du pro essus

dY

ε

p

s

q

Kf

p

s

q

ds

εdW

p

s

q

,

(1.4) où

W

est un pro essus de Wiener standard. On é rira de manière plus su - in te

Y

ε



Kf

ε

9

W

, eton réfèrera indiéremment à

Y

ε

ou

Y

. L'a quisition d'informations sur

Y

ε

se fait par le biais de fon tions tests. Plus pré isément, pour deux fon tions test

ξ, ξ

1

P

H

, les quantités observables prennent la forme x

Y

ε

, ξ

y

K

x

Kf , ξ

y

K

ε

x 9

W , ξ

y

K

,

oùx 9

W , ξ

y

K



N

p

0,

}

ξ

}

2

q et

E

rx 9

W , ξ

y

K

x 9

W , ξ

1 y

K

s x

ξ, ξ

1 y

K

.

Leparallèleave le modèle de densité etle modèle de régression lorsque

t

i



i

{

n

s'opère en posant

ε



n



1

{

2

.

1.2.2 Critère de performan e et adre minimax

La bonne performan e d'un estimateur est quantiée par un ritère de performan e à minimiser. Nousnousplaçonsdanslemodèlede bruitblan (3),maislesrésultatssont aisément trans riptiblesaux adres (1)et (2) en remplaçant

ε

par

n



1

{

2

. Etant donné

f

etun estimateur r

f

,on peut par exemple onsidérer la perte

L

p

d

p r

f , f

q »

Y

| r

f



f

|

p

dµ, 1

¤

p

¤ 8

.

Demanièregénérale, onpeut onsidérer n'importequelle distan e

d

déniesur

H



H

. Biensûr, ette perte est aléatoireet dépend des observations générées par lesmodèles (1), (2),ou (3). Il est don naturelde onsidérer plus pré isément le risque moyenné

R

ε



E

f



d

p r

f , f

q 

,

que l'on her he à minimiser en r

f

lorsque

f

vit dans un espa e

X

. On voit que deux entités antagonistes interviennent lors de ette minimisation: d'une part, la nature

(16)

prodigue une fon tion in onnue a priori

f

, d'autre part le statisti ien propose un es-timateur

r

f

destiné à l'appro her. Nous adoptons la stratégie dite du minimax, qui onsisteà se parer ontre le pire as possible du hoix de

f

. En d'autres termes,nous her hons un estimateur r

f

telque

sup

f

P

X

E

f

r

d

p r

f , f

qs

inf

r

f

sup

f

P

X

E

f

r

d

p r

f , f

qs

.

(1.5) On note

R



ε



inf

r

f

sup

f

P

X

E

f

r

d

p r

f , f

qs

le risque minimax asso ié au problème. De manière générale, ette notion est trop restri tive si l'espa e

X

est susament vaste. On introduit don la notion relaxée de vitesse de onvergen e optimalepour le adre minimax:

Denition1.2.1. Une fon tionpositive

ψ

ε

estappelée vitessede onvergen eoptimale pour leproblème (3) s'ilexiste deux onstantes

0

 

c, C

  8 tel que

lim sup

ε

Ñ

0

ψ



1

ε

R



ε

¤

C

et

lim inf

ε

Ñ

0

ψ



1

ε

R



ε

¥

c .

Dans la suite, ondira qu'un algorithme est optimal s'ilatteint une vitesse de on-vergen e optimale(au sens minimax) sur l'espa e onsidéré.

Le hoixde l'espa e

X

est ru ial arildi telaformed'unepro édured'estimation(ou ré iproquementle hoixde l'espa e

X

dé oulede laméthode utilisée). Par exemple,la dé omposition(1.21)in iteà hoisirdesespa es dans lesquels

f

est bienappro héepar la base p

u

k

q

k

¥

0

utilisée. De manière générale, l'espa e

X

hoisi sera un ompa t d'un espa emétrique.

1.3 Méthodes de résolution

Larésolutionde (1.1)fait l'objetd'unetrès vaste littératureque nousne pouvons nous permettred'aborderdemanièreexhaustive. Lesméthodes lesplus populairessontsans doute la régularisation de Tikhonov (voir e.g. [73, Chap. 2℄), la dé omposition en valeurssingulières (SVD)ainsi quelesméthodes de proje tion. Nousn'aborderons que lesdeux dernières dans lasuite.

De manièregénérale, leprin ipede es méthodes est d'appro her e problème par une suite de problèmes bien posés

P

h

dont la solution

f

h

onverge vers

f

lorsque

h

Ñ

0

. Dansun adrestatistique,larédu tionduparamètres

h

diminuelebiaismaisaugmente lavarian edu modèle,l'enjeuétantde alibrerde manièreoptimalele ompromisentre les deux. Nous verrons que e i est possible sous ertaines hypothèses on ernant les données du problème.

Nousprodiguonsmaintenantlalistedesméthodesderégularisationquinousintéresseront par la suite, à savoir la méthode SVD (et son orollaire la tron ature spe trale), la généralisationde ette méthode à un adre de SVD par blo s, et enn la méthode de proje tion dite de Galerkin qui englobe en réalité lesdeux pré édentes.

(17)

1.3.1 La méthode SVD

La méthode SVD repose sur le hoix de bases des espa es

H

et

K

, adaptées au om-portementde

K

. Plus pré isément, ona le

Theorem 1.3.1. Soit

H

et

K

deux espa es de Hilbert, et

K : H

Ñ

K

un opérateur ompa t. Alorsilexistep

u

q

¥

0

unebase hilbertiennede

H

, p

v

q

¥

0

unebase hilbertienne de

K

et une suite

λ

Ñ

0

tel que

Ku



λ

v

et

K



v



λ

u

.

(1.6)

Ainsi, par hoix de la base p

v

q

¥

0

omme fon tions tests dans le modèle (3), on obtient,pour tout

¥

0

:

x

Y

ε

, v

yx

Kf , v

y

ε

x 9

W , v

y 

λ

x

f , u

y

εξ

où, grâ e à lapropriété d'orthonormalitéde la base

v

, la suite de variables p

ξ

q

¥

0

est i.i.d

N

p

0, 1

q. On s'est don ramené à un modèle séquentiel à omposantes de bruit normalesi.i.d. Déterminer

f

est équivalent à déterminer la séquen e des px

f , u

yq

¥

0

, dont onpeut désormais aisément proposer un estimateur sans biais:

p

f



λ



1

x

Y

ε

, v

y

.

(1.7)

On applique ensuiteun ltre à ha un des oe ients p

f

, le ltrepouvantêtre: 1. linéaire, ave un estimateur nal de la forme

r

f



γ

p

f

où p

γ

q P r

0, 1

s

N

, adre re ouvrant par exemple: lesltres de Tikhonov (

γ



1

p

{

α

q

β

 

1

),lesltres de Pinsker (

γ

p

1

p

{

α

q

β

q ).

2. nonlinéaire, ommeleseuillagedoux r

f

sgnp p

f

q | p

f

|

S

 ouleseuillagedur r

f

 p

f

1

t | p

f

S

u .

En pratique, on ne al ule bien sûr qu'un nombre ni de oe ients r

f

en stoppant l'expansionavant un niveau maximal de résolution

L

.

1.3.2 La méthode SVD par blo s

Onpeutgénéraliserl'appro hepré édente. LaSVDpermetderéduire

K

àuneséquen e dénombrable d'homothéties. La méthode SVD par blo s (ou 'Blo kwise SVD') réduit

K

à une séquen e dénombrable d'appli ationslinéaires sur des espa es de dimensions nies.

Denition1.3.2. On ditque

K

admetune SVDpar blo ss'ilexistep

H

q

¥

0

etp

K

q

¥

0

une suite d'espa es orthogonaux de

H

(resp.

K

) tel que

H



À

¥

0

H

(resp.

K

 À

¥

0

(18)

Notant

P

V

la proje tion orthogonale sur le sous-espa e ve toriel

V

, on se ramène don àl'inversion séquentielle des problèmes

P

K

KP

H

f



P

K

g .

(1.8)

Par ommodité, on supposera

dim

p

H

q 

dim

p

K

q (on peut toujours se ramener à e asautrement)etonnotera|

Λ

| ettedimension ommune. Notons

u

ℓ,1

, ..., u

ℓ,

|

Λ

| (resp.

v

ℓ,1

, ..., v

ℓ,

|

Λ

|

) unebase de

H

(res.

K

). Enutilisant

v

ℓ,m

ommefon tiontest dans(3), onobtient x

g, v

ℓ,m

yx

Kf , v

ℓ,m

yx

KP

H

f , v

ℓ,m

y |

Λ

| ¸

n



1

x

Ku

ℓ,n

, v

ℓ,m

yx

f , u

ℓ,n

y

,

e qui, en notant

K

 x

Ku

ℓ,n

, v

ℓ,m

y 

n,m



1,...,

|

Λ

|

,

f

 x

f , u

ℓ,n

y 

n



1,...,

|

Λ

|

,

g

 x

Y

ε

, v

ℓ,m

y 

m



1,...,

|

Λ

|

,

setraduitparl'égalitématri ielle

K

f



g

. Si

g

estobservée selonlemodèledebruit blan (3), alorsles oe ients a essibles deviennent

x

Y

ε

, v

ℓ,m

y x

g, v

ℓ,m

y

ε

x 9

W , v

ℓ,m

y ou bien de manière synthétique

Y

ε,ℓ



g

ε

W

9

, où 9

W

P

R

|

Λ

|

est une séquen e de ve teurs gaussiens indépendants dont ha une des omposantes est normale

N

p

0, 1

q. On peut alors adapter les stratégies de la se tion 1.3.1 en adoptant par exemple un seuillagepar blo du type

r

f



K



1

Y

ε,ℓ

1

t}

K



1

Y

ε,ℓ

}

R

|

Λℓ

| ¡

S

u

, ℓ

¤

L

p

ε

q

.

Dé onvolution sphérique

Unexemplenotablededé onvolution parblo sest eluide ladé onvolutionsphérique. Etantdonnéqu'ilinterviententantqu'exempleouquesujetd'étude danslesChapitres 3, 5 et6, attardons nous quelque peu sur son as.

Cette modélisationaété initialementintroduite par Van Rooij and Ruymgaart [83℄ et traitéeparHealyetal.[39℄. L'optimalité(ausensminimax)delapro éduredéveloppée aété établieparKimand Koo[52℄pourlaperte MSE.Plus ré emment,l'extensiondes performan es

L

2

des algorithmes ainsi développés à des performan es

L

p

,

p

¥

1

a été réaliséepar des stratégies de seuillage sur des systèmes de needlets par Kerkya harian etal.[51℄. Nousreviendrons endétailsur edernierpointauChapitre5. Lesdomaines d'appli ations ouvrent par exemple l'imagerie médi ale, l'astrophysique ainsi que les géos ien es. Passons maintenantà laprésentation du adre mathématique.

(19)

Figure 1.1: 'Vue de dessus' de lafon tion

f

(à gau he)et de

Kf

lorsque

K

est un opérateurde Rosenthal de degré

p



1

(au entre) et un opérateur de Lapla e (à droite). Pour tout

ω

P

S

2

de oordonnées sphériquesp

θ, ϕ, 1

q, ona tra élepoint p

θ, ϕ, 1

f

p

θ, ϕ

qq. L'opérateurde Lapla e aun eetrégularisantpluspronon é.

Soit

H



K



L

2

p

S

2

qoù

S

2

estmunidelamesuredeLebesgue. On onsidèrel'opérateur de onvolution sur lasphère dénipar

K : f

ÞÑ »

SO

p

3

q

h

p

r

q

f

p

r



1

.

q

dr ,

(1.9) où

h

P

L

2

p

SO

p

3

qqet

dr

estlamesuredeHaarsur

SO

p

3

q.

K

auneetmoyennantautour de haque point

ω

P

S

2

, quantié par l'étalement de

h

autour de l'élément neutre du groupe

SO

p

3

q. And'illustrer et eet, nous avons représenté en Figure1.1lafon tion

Kf

pour

K

ℓ,m,n



1

p

1

q 



1

δ

m,n

(opérateur de Lapla e),

K

ℓ,m,n



sin

p

1

{

2

q

π



p

2ℓ

1

q

sin

p

π

{

2

q 



1

δ

m,n

(opérateur de Rosenthal) et lorsque

f

est la version tronquée à la résolution



16

de la fon tion

f

0

p

ω

q 

1

{

exp

p

2

}

ω

p

0, 1, 0

q}

1

p

R

3

q q. Pour une illustrationde et eet dans le modèle de l'estimation de densité, onpourra onsulter lesFigures 3.1et3.2.

On ala dé omposition

H

 K à

¥

0

H

H

est l'espa edes harmoniques sphériques de degré

, déniespar

Y

ℓ,m

p

ω

q

Y

ℓ,m

p

θ, ϕ

qp

1

q

m

b

2ℓ 1

p



m

q

!

p

ℓ m

q

!

P

ℓ,m

cos

p

θ

q 

e

imϕ

,

(1.10)

pour

P

N

,



¤

m

¤

et où

P

ℓ,m

sont les fon tions de Legendre dénies par exemple dansVilenkin[84℄. De plus,onpeut montrer (voir [39℄)que pour tout

¥

0

,

K

p

H

H

. L'inversion de (1.9) est don équivalente àl'inversion des équations

P

H

KP

H

f



P

H

(20)

sur

H

. Cha une de es inversions orrespond à la résolution d'un système linéaire de taille |

Λ

| 

2ℓ

1

. Par la suite, on notera, pour toute fon tion

f

P

L

2

p

S

2

q et tout opérateur

K

f



P

H

f

et

K



P

H

KP

H

.

1.4 Généralisation: méthode de Galerkin

Les méthodes de SVD et de SVD par blo s requièrent don la onnaissan e et la ma-nipulationdes bases

u

et

v

. De manièregénérale, es basessontpotentiellement1)soit in onnuesou2)soitdi ilesàmanipulernumériquement,d'oùunbesoindegénéraliser es méthodes àdes hoixde bases quel onques.

Laméthode Galerkin repose sur laproje tion de (1.1) sur une suite roissante de sous espa esve toriels

V

€

H

, W

€

K

. Notons

u

1

, ..., u

unebase de

V

et

v

1

, ..., v

unebase de

W

(on suppose que

dim V



dim W



). Alors l'approximation de Galerkin

f

G

de

f

est dénie ommela solutiondu problème #

f

G

P

V

,

x

Kf

G

, y

yx

g, y

y pour tout

y

P

W

.

(1.12) Ainsi,ona

P

W

KP

V

f

G



P

V

g .

(1.13)

Commepré édemment,en notant

K

px

Ku

m

, v

n

yq

m,n

¤

, f

G

px

f

G

, u

m

yq

m

¤

, g

px

g, v

n

yq

n

¤

,

(1.14)

l'inversion de (1.12)est en réalité l'inversion du système linéaire

K

f

G



g

.

(1.15)

On voit bien désormais que les deux méthodes évoquées auparavant sont deux as parti uliers où 1) la matri e

K

est diagonale et 2) la matri e

K

est diagonale par blo s(ave blo s

K

i

).

Ainsi,une méthode de Galerkin repose sur une double approximation: approximation de

K

par

K

, etapproximation de

g

par

g

. Ladé omposition orthogonale

f



f

G



f



P

V

f



G

f ,

(1.16) ave

G

p

K

q 

1

P

W

KP

V

K

, implique }

f



f

G

}

2

}

f



P

V

f

}

2

}

G

f

}

2

.

Ladé omposition de l'erreur fait apparaître deux termes: lepremier termeest lebiais d'approximation de

f

par sa proje tion sur l'espa e

V

, tandis que le se ond ontrle lesrésidusasso iésau hoixdesespa es

V

, W

. Par onséquent,labonnemar hed'une méthode de Galerkinrequiert que es deux termestendent vers

0

.

(21)

1.4.1 Choix des bases

Lesbasesp

u

qetp

v

qdoiventrépondreàunedoubleexigen e: premièrement,la simpli -itéetlarapidité omputationnelledel'inversiondusystèmelinéaire(1.15),et deuxième-ment, lareprésentation e a e de lafon tion ible

f

dans labase p

u

q. Le hoixd'une basede SVD oubien de SVD par blo sde l'opérateurprivilégie lapremière qualité au détriment potentiel de la se onde. En eet les bases réalisant la SVD ne représentent usuellement

f

de manièree a e quedans un adrehilbertien pour une perte de type

L

2

. Le hoixd'une based'ondelettelorsque l'espa esous-ja entest un espa ede Besov (voirAppendix A)inverse le ompromis,et né essite bien souvent des hypothèses plus restri tives sur l'opérateur

K

. Nous en présentons trois exemples i-dessous.

Ondelettes et méthode de Galerkin

Cohenetal.[17℄onteure oursàuneméthodedeGalerkinutilisantdesbasesd'ondelettes p

u

qp

v

qp

ψ

λ

qsurr

0, 1

s(où

λ

représenteledoubleindi ep

j, k

q). Dans ettese tion, onsupposeradeplusl'opérateursymétrique(maisleraisonnements'adapteau asd'un opérateurnonsymétrique). Pourunindi emaximal

J

,onnotera

Λ

tp

j, k

q

, j

¤

J, k

¤

2

j

u. Pour un bref rappel théorique sur les ondelettes, on pourra onsulter l'Appendix A. Les méthodes d'estimation développées dans es travaux mettent en éviden e une distin tion entre deux typesde méthodes, qui réapparaîtradans leChapitre 2. I i,

K

est un opérateur auto-adjoint,vériant larelation



f

P

L

2

pr

0, 1

sq

,

x

Kf, f

y}

f

}

2

H



ν

{

2

.

(1.17)

Sous ette hypothèse onpeut montrer ([40℄)que la onstante

Q

j



sup

j

¥

0

2



}p

K

j

q 

1

}

op

estnie,etdon que ettenotionrejointla ondition(1.22)dénieplusbas. L'estimation par méthode de Galerkin requiert larésolution de

x

Kf

G

, ψ

j,k

y x

Y

ε

, ψ

j,k

y pour tout p

j, k

qP

Λ .

(1.18)

Laprésen e de bruit sur la fon tion image

g



Kf

est traitée à l'aide d'une méthode de seuillage. Deux hoix distin tsse présentent:

1. Opérer un seuillage sur lesignal image

Y

ε

puis résoudre l'équation i-dessus en remplaçant

Y

ε

par sa version seuillée dans (1.18).

2. Résoudre (1.18) etappliquer leseuillagesur lerésultat.

Cesdeux asmettentnaturellementen jeudespro édures etdeshypothèsesdiérentes. Par exemple, le premier as impose l'e a ité d'un seuillage appliqué sur

Y

ε

, don l'appartenan ede

g

àun ertainespa edeBesov(typiquement

B

s ν

(22)

etpar làla ontinuitéde

K : B

s

p,p

Ñ

B

s ν

p,p

. Leseuillagepratiquésur

Y

ε

prendlaforme naturelle(voir Appendix A)

T

p

.

q ¸

λ

¤

Λ

x

., ψ

λ

y

1

! |x

.,ψ

λ

y|¡

τ ε

? |

log ε

| )

ψ

λ

.

Le deuxième as n'impose au une hypothèse supplémentaire sur

K

. Cependant, la pro édure de seuillage appliquée à

K

Λ

 

1

Y

ε

requiert le ontrle des variables aléa-toires x

K

Λ

 

1

9

W

J

, ψ

j,k

y. Du fait de (1.17), es estimateurs possèdent une varian e roissante en

j

, qui est in orporée au seuillage. Ce dernier, pratiqué sur

K

Λ

 

1

Y

ε

, devient alors

T

p

.

q ¸

λ

¤

Λ

x

., ψ

λ

y

1

! |x

.,ψ

λ

y|¡

τ 2

ε

? |

log ε

| )

ψ

λ

.

Dé omposition WVD

Ilestparfoispossibled'améliorersubstantiellementlapro édure i-dessuspour ertains opérateurs spé iques. L'existen e d'une WVD (pour Wavelet-Vaguelette De omposi-tion, initialement introduite par Donoho [26℄) ou bien d'une VWD (voir Abramovi h andSilverman[2℄)oreun adreintermédiaireentreSVD etondelettesparméthodede Galerkin. Parexemple,laWVDreposesurl'hypothèsequ'ilexisteunebased'ondelettes p

ψ

λ

q,un système de vaguelettes p

ν

λ

q etune suite

β

j

¡

0

tel que,pour tout

λ

p

j, k

q,

K



p

ν

λ

q

β

j

ψ

λ

.

(1.19)

En onséquen e, en dé omposant

f

sur la base p

ψ

λ

q, onobtient x

Y

ε

, ν

λ

y ¸

λ

1 x

λ

1

, ν

λ

yx

f , ψ

λ

1y

ε

x 9

W , ν

λ

y 

β

j

x

f , ψ

λ

y

ε

x 9

W , ν

λ

y

où l'on a su essivement appliqué (1.19) ainsi que l'orthogonalité des ondelettes. Par onséquent, on obtient un estimateur sans biais de x

f , ψ

λ

y en posant x r

f , ψ

λ

y

β



1

j

x

Y

ε

, ν

λ

y

On oupleensuite etestimateuràunseuillagedouxoudurand'obtenirunepro édure optimaleen perte

L

2

sur des espa es de Besov

B

s

π,r

pr

0, 1

sq. Ainsi, les systèmes duaux p

ψ

λ

q et p

ν

λ

q possèdent une stru ture adaptée à la fois à l'analyse du signal

f

et de l'opérateur

K

.

Une diéren e notable ave le adre pré édent est que le système de vaguelettes p

ν

λ

q n'est pas une base (il n'est pas orthonormé). On voit don que la notion de base n'est pasné essaireàlamiseenpla ed'uneméthodedeGalerkin. Enparti ulier,laméthode WVDillustrel'utilisationd'unebasedeRiesz(voir[14℄)adaptéeà

K

. Notonsque ette méthoderestreintinévitablementle hampd'appli ationsauxopérateurspossédantune telle propriété, tels l'intégration, l'intégration fra tionnaire ou bien la transformée de Radon.

(23)

Dé onvolution en régime périodique

La présen e de et exemple i i se justie par le fait que l'utilisationdes needlets pour ladé onvolutionsphérique aveugle, auChapitre 6,repose sur des argumentstrès simi-lairesdans des as plus omplexes. Lesprin ipesde laméthode développée ontpermis d'aborder similairementlesproblèmes inverses telsque l'inversion de latransformée de Radon([50℄)ou bien ladé onvolution de Ja obi ([49℄).

Dans le as spé ique de la dé onvolution sur r

0, 1

s, Johnstone et al. [44℄ ré on ilient l'e a ité de l'étape d'inversion grâ e aux séries de Fourier ave la représentation de lafon tion ible en ondelettes. Pour e faire, ils se basent sur les ondelettes de Meyer périodisées, qui possèdent un support fréquentiel ompa t. En eet, on a, pour tout

j

¥

0

,

C

j

t

P

Z

,

x

ψ

j,k

, e

2iπℓ.

y

0

3

 r

2

j 2

,



2

j

s ¤ r

2

j

, 2

j 2

s

,

(1.20)

de telle sorte que les oe ients d'ondelettes se al ulent e a ement par la formule de Parseval. Plus pré isément, supposons que l'on observe

dY

ε

p

t

q

k



f

p

t

q

dt

εdW

p

t

q

, t

P r

0, 1

s

,

k

P

L

2

pr

0, 1

sq. On notera

e

p

t

q

e

2iπℓt

. Parla formulede Parseval,on a

x

f , ψ

j,k

y ¸

¥

0

x

f , e

yx

ψ

j,k

, e

y ¸

P

C

j

x

f



k, e

y x

k, e

y x

ψ

j,k

, e

y

etla somme i-dessus est nie. Un estimateur de x

f , ψ

j,k

y est don p

β

j,k

 ¸

P

C

j

x

Y

ε

, e

y x

k, e

y x

ψ

j,k

, e

y

.

Ave l'hypothèsede DIP(voirse tion 1.5) suivante:

2



j

2

j

2

¸ |

|

2

j

|x

k, e

y| 

2



1

{

2



2

,

onpeut alibrerleseuillagedes oe ientsobtenusetretrouverlesvitessesd'estimation minimaxsur lesespa es de Besov (voir se tionA.3.2).

1.4.2 Dé omposition biais-varian e

Nousallons maintenant faireune hypothèse supplémentaire, vériée dans le adre des Chapitre 3,4, 5et 6.

Assumption 1.4.1. Pour tout

¥

1

,

KP

V



P

W

(24)

Sous Assumption 1.4.1, ona alors

G

p

K

q 

1

KP

V

P

V

K



0 ,

etpar onséquent

f

G



P

V

f

,quenous assimileronségalementà

f

. Voyons omment s'arti ulele ompromisbiais-varian edans e as: en remplaçant

g

par

Y

ε

dans (1.12), l'erreur ommisese dé ompose de lamanièresuivante:

}

f

p

K

q 

1

p

g

ε

W

9

q}¤}

f



f

}

ε

}p

K

q 

1

9

W

}

.

(1.21) Leterme de biais }

f



f

} dé roît ave

,tandis que, en raison du ara tère mal posé duproblème, leterme(aléatoire)de varian e}p

K

q 

1

9

W

} aluitendan eà roître. Un hoixjudi ieuxde

enfon tionde

ε

réaliseunbon ompromisentre esdeuxquantités.

1.5 Degree of ill-posedness, espa es de régularité et

adaptativité.

A la lumière de (1.21), le ara tère mal posé du problème est ainsi illustré lors de l'appli ation d'un s héma de Galerkin par la roissan e des normes }p

K

q 

1

} op aufur età mesureque

augmente. Parexemple, ette norme peut roître

polynomialement,i.e. }p

K

q 

1

} op ¤

Cℓ

ν

,

(1.22)

auquel as leproblème est ditmoyennementmal posé.

exponentiellement auquel as le problème est dit sévèrement malposé.

Nous nous on entrerons sur le as d'une roissan e polynomiale. Le réel

ν

est ap-pelé DIP (Degree of Ill-Posedness). Comme

9

W

est un ve teur gaussien standard, }p

K

q 

1

9

W

} est une variablegaussienne de varian e }

t

 p

K

q 

1

1

 p

K

q 

1

1

} ¤

}p

K

q 

1

}

2

op

,

1

est le ve teur de taille

donttoutes les omposantes valent 1.

D'autre part, la majoration du premier terme in ite à onsidérer des espa es où la dé roissan ede}

f



f

}estelleaussipolynomiale, 'est-à-direqu'ilexiste

s

¡

0, M

¥

0

tel que }

f



f

}

2

¤

M ℓ



2s

. Dans le as où la base p

u

q est onstituée des fon tions propresde l'opérateurLapla iensurr

0, 1

s,onretrouvelesespa es de Sobolevsur r

0, 1

s, que nous noterons

W

s

. Les espa es de Besov fournissent une généralisation de e prin ipeà une norme

π

¥

1

quel onque(voirAppendix A).

Etant donné

ν

et

s

, le niveau de résolution optimal est

p

ε

q 

ε



1

ν

s

1

{

2

et la perte asso iée sur laboule de Sobolev de rayon

M

,

W

s

p

M

q, est

sup

f

P

W

s

p

M

q

E

 }

f

p

K

q 

1

pp

Kf

q

ε

W

9

q}  ¤

2s

2

p

s

ν

q

1

.

(1.23)

(25)

On peut montrer (à l'aide des arguments présents dans Korostelev and Tsybakov [54, Chapitre 2℄)que ette vitesse est optimaleau sens minimax.

Enpratique,la onnaissan eapriori de

s

(et de

ν

)n'est pas garantie, d'où lané essité de onstruire des pro édures indépendantes de es paramètres, mais qui atteignent asymptotiquement le même ordre de onvergen e que dans le as où ils sont onnus. Souvent, etteadaptativitésepayeauprixd'unfa teur logarithmiquedanslesvitesses de onvergen e. En pratique, e type de pro édure re ouvre par exemple la méthode de Lepski ([57℄, [5℄), les stratégies de seuillage ([44℄), ou de minimisation du risque empirique([13℄).

Remark 1.5.1. On pourrait imaginer des dé roissan es exponentielles pour les deux termes onsidérés i-dessus. Celles- i ont par exemple été étudiées par Tsybakov [81℄.

An d'illustrer la puissan e des pro édures de seuillage (que nous utiliserons de manièreré urrente par la suite), nous rentrons en détail dans leur mise en pla e dans e adre spé ique. Choisissons don pour niveau maximal

p

ε

q

ε

a |

log ε

|  

2

1

.

Ce niveau surestime elui de la pro édure linéaire. Cette surestimationest ompensée paruntraitementadéquatdesrésultatsobtenusparméthodedeGalerkin. Introduisons pour e faire le seuillagedéni pour

x

P

R

T

p

x

q

x1

! |

x

τ ℓ

ν

ε

? |

log ε

| )

,

etsoit r

f

l'estimateur déni par x r

f , u

y

T

 xp

K

q 

1

Y

ε

, u

y

1

t

¤

p

ε

qu

.

Alors on peut montrer que et estimateur atteint la même vitesse que (1.23), à un fa teurlogarithmique près. Plus pré isément, pour

s, M

¡

0

,

sup

f

P

W

s

p

M

q

E

} r

f



f

C ε

a |

log ε

| 

2s

2

p

s

ν

q

1

.

Ainsi, le seuillage permet d'obtenir l'adaptativité. En fait, pour des pertes

L

p

plus générales,etdans ertainsespa es deBesov

B

s

π,r

,onpeutmontrerqu'au unepro édure

linéairen'atteintlavitesseminimax,etdon leseuillage(ouautreméthodenonlinéaire) devient essentiel (voir Theorem A.3.1).

1.6 Né essité de onsidérer des opérateurs bruités

An d'introduire le hapitre suivant, revenons plus en détail sur le as parti ulier de la dé onvolution sphérique introduite en 1.3.2. Supposons que la fon tion

f

vit dans l'espa ede Sobolev

W

s

p

M

qt

f

P

L

2

p

S

2

q

,

¸

¥

0

2s

}

f

}

2

¤

M

2

u

,

(26)

p

s

¡

1

{

2

q,etquelesmatri es

K

vérient la ondition deill-posedness }

K



1

} op ¤

Cℓ

ν

. On introduit lapro édure suivante: soit, pour tout

¥

0

,

p

f



K



1

Y

ε,ℓ

.

On dénit alorsl'estimateur

r

f

 ¸

¤

L

¸ |

m

p

f

ℓ,m

1

! } p

f

κℓ

ν

?

2ℓ 1ε

? |

log ε

| )

Y

ℓ,m

, L



ε

a |

log ε

|  

2

1

.

(1.24)

On peut montrer par des arguments standards que ette pro édure est quasi-optimale au sens minimax sur

W

s

p

M

q. Cependant, en pratique, l'opérateur

K

est in onnu a priori. Cette di ulté est heureusement ontournable ar on sait que les oe ients x

KY

ℓ,m

, Y

ℓ,n

y sont en réalité les oe ients de Fourier de la fon tion

h

P

L

2

p

SO

p

3

qq: x

KY

ℓ,m

, Y

ℓ,n

y

ˆ

h

ℓ,m,n

 »

SO

p

3

q

h

p

r

q

R

ℓ,m,n

p

r

q

dr ,

oùlesfon tions

R

ℓ,m,n

sontlesfon tionspropresdu Lapla iensur

SO

p

3

q (voirVilenkin [84℄).

Danslemodèlede l'estimation de densité(1),

h

est une densitéetonobserve

θ

1

, ..., θ

q

q

réalisations de la variable

θ

à densité

h

sur

SO

p

3

q. Un estimateur naturel de

ˆ

h

ℓ,m,n

est alors

1

q

q

¸

i



1

R

ℓ,m,n

p

θ

i

q

.

Enremplaçant

ˆ

h

ℓ,m,n

par saversion empirique,l'erreur ommisesur

h

(et don sur

K

) ae te la pro édure d'estimation 1.24. De manière similaire, dans un modèle de bruit blan on n'observe non pas

ˆ

h

ℓ,m,n

mais sa version bruitée

ˆ

h

δ,ℓ,m,n



ˆ

h

ℓ,m,n

δ

B

9

ℓ,m,n

,

oùles variables aléatoires 9

B

ℓ,m,n

sont i.i.d

N

p

0, 1

q. On note

K

δ

(resp. 9

B

) l'opérateur onstitué des oe ients de Fourier

ˆ

h

δ,ℓ,m,n

(resp. 9

B

ℓ,m,n

). An de démontrer la nette inuen e de la pré-estimation des oe ients

ˆ

h

ℓ,m,n

sur l'estimation de

f

, nous om-paronsenFigure1.2lesrésultatsobtenusparl'appli ationde(1.24),d'abordenutilisant l'opérateur

K

, puis en le remplaçant par sa version bruitée

K

δ

. Les paramètres sont lessuivants:

L'opérateur

K

est un opérateurde Lapla edontles oe ients deFourier valent

ˆ

h

ℓ,m,n



1

p

1

qq 

1

1

t

m



n

u

.

K

possèdedon un DIPde

ν



2

.

On dénit

f

0

p

ω

q 

exp

p

2

}

ω



ω

1

}

1

p

R

3

q

q où

ω

1

 p

0, 1, 0

q. La fon tion ible

f

est latron ature de

f

0

auniveau



16

:

f

 ¸

¤

16

¸ |

m

x

f

0

, Y

ℓ,m

y

Y

ℓ,m

(1.25)

(27)

Figure1.2: Degau heàdroite: fon tion ible,re onstru tionp

K

δ

q 

1

Y

ε

(

E



0.515

)etrésultatde l'algorithmedeBlo kwiseSVD(

E



0.324

)àunniveaudebruit

δ



5.10



3

, ε



0

.

On ap

δ, ε

qp

5.10



3

, 0

q.

Le hoixde es donnéesn'est pasinno ent. D'une part,unDIPde 2 onduitdéjààdes problèmestrèsmalposésenpratiqueparla roissan erapidedesnormes}

K



1

}

op

( equi signie l'instabilitégrandissante de l'inversion de

K

). D'autre part, la présen e d'un pi aupoint

ω



ω

1

pour

f

0

assureune dé roissan elentedes oe ientsde Fourierde

f

0

. Atitre de omparaison,onaégalementtra élerésultatobtenuparl'algorithmede Blo kwise-SVDintroduit en se tion 2.4, ou plus en détails au Chapitre 3. La perte

E

est la perte

L

2

renormaliséepar }

f

}. Commeon le voit, la présen e d'erreur dans

K

δ

impa tel'estimationde

f

demanièrenotoiredansleshautesfréquen es. Cephénomène n'est pas étonnant étant donné que la matri e

K

15

vaut environ

4.10



3

I

31

, et qu'en vertu d'un argument lassique sur les séries de Neumann, la matri e

K

δ

n'est plus assuréedeposséderdespropriétéssimilairesà

K

si

δ

}

9

B

}

op

¡

4.10



3

,soit} 9

B

}

op

¡

4

{

5

, unévènementréaliséave très forteprobabilité ommeonleverra par lasuite (Lemma 2.1.3).

Cet exemplesoulignelané essité de traiterlanouvelle erreurinduitepar l'observation de

K

δ

au lieude

K

. Ce sera l'objet des hapitressuivants.

(28)

Problèmes inverses à opérateurs

bruités. Prin ipales ontributions.

Dans e hapitre,onintroduitlanotiondeproblèmeinverse àopérateurbruité(se tion 2.1). On étudie ensuite diverses appro hes de résolution en se tion 2.2. La n de e hapitre est dédié à la présentation de quatre exemples parti uliers : la dé onvolution aveuglespar ondelettes (se tion2.3) oùl'on présentede manièresu in te le travailde Homann and Reiÿ [40℄, puis un résumé des travaux originaux ee tués durant ette thèse,àsavoir: ladé onvolutiondans le as d'unopérateurdiagonalpar blo sdansun adre

L

2

en se tion 2.4, l'extension de ette pro édure à un adre

L

p

,

1

¤

p

¤8 dans le as deladé onvolutionsphériqueense tion2.6,etennladé onvolutiondeVolterra en se tion 2.5. Cha une de es trois dernières se tionferont l'objet d'un hapitre plus détaillédans lasuite.

Contents

2.1 Modèle . . . 27

2.2 S hémas génériques de résolution . . . 30

2.3 Retour sur la dé onvolution aveugle par ondelettes . . . 35

2.4 Traitement des opérateurs diagonaux par blo s . . . 37

2.5 Traitement des opérateurs intégraux de Volterra . . . 41

2.6 Opérateurs diagonaux par blo s : as

L

p

. . . 47

2.1 Modèle

Nous avons jusqu'i i onsidéré le as d'opérateurs

K

onnus, et nous étendons main-tenant notre étude au as où

K

n'est pas onnu a priori. Nous nous pla erons durant tout e hapitre dans lemodèlede bruit blan (3), 'est-à-direque l'on observe

(29)

Si

K

est in onnu, il est impossible de retrouver

f

en toute généralité. Il est don né essaire de disposer d'une informationàpriori sur

K

. Dansnotre as, on supposera quenous avons a ès àune version bruitée

K

δ

modéliséepar

K

δ



K

δ

9

B, 0

 

δ

 

1 .

Lepro essus

9

B

estun bruit blan gaussiensurlesopérateurslinéairesde

H

dans

K

, e qui signieque lesquantités observables prennent la formex

9

Bu, v

y pour

u

P

H

, v

P

K

. De plus, es variables sont gaussienneset ona

Cov  x 9

Bu

1

, v

1

y

K

x 9

Bu

2

, v

2

y

K

 x

u

1

, u

2

y

H

x

v

1

, v

2

y

K

(2.1) pour

u

1

, u

2

P

H

,

v

1

, v

2

P

K

. Par exemple, on peut supposer que l'opérateur

K

δ

est le résultat d'une première inféren e pratiquée sur l'opérateur

K

(voir se tion 1.6). Ou bien, un point de vue alternatif est de onsidérer que le 'vrai' opérateur

K

est une perturbation in onnue d'un opérateur onnu

K

δ

. L'ampleur de la perturbation (ou bien la pré ision de l'inféren e dans le premier as) est quantiée par le paramètre

δ

. On synthétise es deux modèles sous laforme suivante

#

Y

ε



Kf

ε

9

W ,

K

δ



K

δ

9

B .

(2.2)

Cette modélisation, due à Efromovi h and Kolt hinskii [30℄, a depuis fait l'objet de plusieurs travaux ([40℄,[63℄,[23℄ par exemple). Avant de s'atteler à son traitement, présentons quelques exemples parti uliers où lamodélisation(2.2)est a tivement util-isée (d'autres exemples sontdisponibles dans [30℄ et[40℄).

Example 2.1.1 (Equation de la haleur). Considérons l'équation d'évolution

B

u

B

t

Lu



0 ,

(2.3) où

L

 

d

¸

i,j



1

B B

x

i

a

ij

p

x

q B B

x

j

(

est un opérateur elliptique sur

G

un ouvert onnexe borné de

R

d

, ave onditions de Diri hlet. La solution de (2.3) ave ondition initiale

u

p

0, x

q

f

p

x

q s'é rit

u

p

t, x

q

e



Lt

f

p

x

q où

e



Lt

est un semi-groupe d'opérateurs ave noyau

h

t

p

x, y

q. Onse poseleproblèmededéterminerla onditioninitiale

f

onnaissant la solution

u

p

t

0

, x

q pour un ertain

t

0

¡

0

. Si

L

est in onnu, en notant

H



e



Lt

0

on peut modéliser e problème omme suit:

dY

ε

p

x

q

Hf

p

x

q

dx

εdW

p

x

q

.

Pour tout

ϕ

P

L

2

p

G

q, on observe alors x

Y

ε

, ϕ

y  x

Hf , ϕ

y

ε

x 9

W , ϕ

y. Si

H

es

in onnu,onpeut onduirel'expérien eave une onditioninitiale

f

1

onnue,quiaboutit aux observations

dY

1

ε

p

x

q

Hf

1 p

x

q

dx

εdW

1 p

x

q

.

(30)

On retrouve don le modèle 2.2 en supposant

Cov

 x 9

W , ϕ

1

yx 9

W

1

, ϕ

2

y  x

f , f

1 yx

ϕ

1

, ϕ

2

y et

ε



δ .

Example 2.1.2 (Equation intégrale du premier type). On onsidère un opérateur in-tégral

Kf

p

x

q »

k

p

x, y

q

f

p

y

q

dy ,

€

R

d

. Un tel type d'opérateur apparaît par exemple en transformant le prob-lème pré édent en une formulation variationnelle équivalente. L'a tion de

K

est

t

-régularisante, 'est-à-dire que

K : H



t

{

2

p

q Ñ

H

t

{

2

p

q. De plus,

k

est typiquement singulier sur sa diagonale (par exemple

k



b

p

x, y

q{|

x



y

|

β

, }

b

} 8

  8,

β

¡

0

pour l'opérateur d'Abel). Cependant, le noyau

k

est in onnu, e qui motive l'introdu tion du modèle

k

δ

p

x, y

q

k

p

x, y

q

δ

9

b

p

x, y

q où 9

b

est un pro essus gaussien et on aboutit au modèle (2.2).

And'obtenir uneestiméede lafon tion

f

,Efromovi handKolt hinskii[30℄eurent re oursà une méthode de Galerkin sur deux bases orthonormalesdes espa es

H

et

K

. Voyons don omment s'arti ule ette méthode ave e nouveau adre : en projetant l'équation(3)sur lesbases p

u

q etp

v

q, onobtientde mêmeque pré édemment:

Y

ε



K

f

G

ε

9

W

.

K

n'est i ipas onnu, mais nous avons a ès à lamatri e

K

δ



P

W

KP

V

δP

W

9

BP

V



K

δ

B

9

,

ave 9

B

px 9

Bu

k

, v

n

yq

k,n

¤

. Une onséquen e immédiatede (2.1) est que ette matri e est onstituée d'entrées normales

N

p

0, 1

qi.i.d.

2.1.1 Conséquen e sur le ompromis biais-varian e

La présen e d'un nouvel alea dé oulant du bruit blan 9

B

altère le ompromis biais-varian e(1.21). Ensupposant l'hypothèse 1.4.1 toujours valide, elui- idevient:

p

K

δ

q 

1

Y

ε



f



f



f



δ

p

K

δ

q 

1

9

B

f

ε

p

K

δ

q 

1

9

W

.

Remarquonsquenousavons utilisél'inversibilitéde

K

δ

,propriétévériéepresque

sûre-ment. Ainsila dé ompositionfait lairementapparaître trois termes :

Unterme de biais

f



f

.

Un terme de varian e dû au bruit du signal

ε

p

K

δ

q



1

9

W

(la présen e de bruit dans p

K

δ

q



1

Figure

Figure 1.1: 'Vue de dessus' de la fon
tion f (à gau
he) et de Kf lorsque K est un opérateur de Rosenthal de degré p  1 (au 
entre) et un opérateur de Lapla
e (à droite)
Figure 1.2: De gau
he à droite : fon
tion 
ible, re
onstru
tion p K δ q  1
Figure 2.1: Stru
ture de la matri
e de Galerkin sur une base d'ondelette (à gau
he), et matri
e bruitée à δ  0.001 (à droite) pour le noyau k p x, y q   log
Figure 2.2: Comparaison graphique de la pro
édure pour les deux opérateurs K
+7

Références

Documents relatifs

Ils vivaient ainsi côte à côte dans des relations de courtoisie naturelle et de franchise réciproque ” (Leroy-Beaulieu). Désormais quartiers bourgeois et quartiers ouvriers

L’idée n’est pas de supprimer ce sport dans les écoles, mais plutôt de repenser l’espace : déplacer le terrain sur le côté pour qu’il ne soit plus

La m´ethode employant un algorithme ECME avec des lin´earisations it´er´ees est performante ici puisque la fonction H correspondant au mod`ele peut ˆetre assez finement

Rais Manon, Problématique du ternissement de l’argent sur des étiquettes métallisées, Le 20 juillet 2015... HE-Arc CR, Master of Arts HES-SO

Pour tous les intervalles temporels d’une même cellule et d’un même intervalle énergétique, nous utilisons en effet le même modèle de bruit de fond, contraint à partir des

Si les conflits de perspective entre les logiques respectives des médecins et des patients trouvent à se résoudre momentanément dans l’élaboration d’une

on peut identifier d’autres intermédiaires ou « entrepreneurs d’art » qui viennent bousculer les catégories existantes et offrir des espaces nouveaux pour l’incubation de la

The task of predicting if a sequence of words in a document is an anchor text linking to another document can be seen as a link prediction task in a network of documents.. To