HAL Id: tel-00957985
https://tel.archives-ouvertes.fr/tel-00957985
Submitted on 11 Mar 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
inverses à opérateur bruité
Thomas Vareschi
To cite this version:
Thomas Vareschi. Estimation non-paramétrique dans les problèmes inverses à opérateur bruité.
Statis-tiques [math.ST]. Université Paris-Diderot - Paris VII, 2013. Français. �tel-00957985�
UFR de Mathématiques
Thèse de do torat
présentée pour obtenir letitre de
Do teur en s ien es de l'université Paris VII
Spé ialité : Mathématiques appliquées
soutenue par
Thomas Vares hi
Estimation Non-paramétrique Dans Les Problèmes
Inverses À Opérateur Bruité
Dire tri e de thèse : Dominique Pi ard
Soutenue publiquementle 6dé embre 2013 devant lejury omposé de:
Mme Cristina Butu ea Université Paris-Est Marne-la-Vallée Rapporteur
M. Markus Reiss Humboldt-Universität zu Berlin Rapporteur
M. Stéphane Bou heron Université Paris Diderot Examinateur
Mme Fabienne Comte Université Paris Des artes Examinatri e
M. Sylvain Delattre Université Paris Diderot Examinateur
M. Mar Hoffmann Université Paris Dauphine Examinateur
Mespremiersremer iementsvontàmadire tri eDominiquePi ard. Dominique,mer i de m'avoirfait dé ouvrirle mondede la re her he dans e domainepassionnant qu'est elui de la statistique (non paramétrique, mais pas que). Mer i pour ton soutien on-stant, pour la patien e dont tu as fait preuve et pour ta gentillesse à mon égard au ours de es trois années.
Je remer ie haleureusement Cristina Butu ea et Markus Reiÿ d'avoir a epté de rapporter mathèse. Je leur en suis très re onnaissant.
Je remer ie Fabienne Comte, Stéphane Bou heron, Sylvain Delattre et Mar Ho-mannd'avoir a epté de parti iperà mon jury de thèse. Leur présen e dans mon jury est un honneur, etleurstravauxontété une sour ed'inspirationpendant es trois ans. Un des travaux de ette thèse est le résultat d'une ollaboration ave plusieurs auteurs. J'en prote don pour remer ier (au risque d'être redondant) Dominique Pi ard,SylvainDelattre,etMar Homannpour etteagréableexpérien e. Jeremer ie parti ulièrementMar pour sonénergie etson initiationpédagogique(et patiente) aux lowers bounds. Certaines parties de ette thèse lui doiventbeau oup.
Cefutun plaisird'assurerlestravauxdirigésdu oursdeKarineTribouleyau ours de es trois ans. Jela remer ie de m'avoirdonné ette opportunité.
Cestroisannéesfurentégalementl'o asionderen ontresagréablesetenri hissantes auseindu laboratoireduLPMA.Jeremer iedon StéphaneBou heron,Sylvain Delat-tre, GérardKerkya harian,Erwan LePenne , MathildeMougeot, etKarine Tribouley pour m'avoira ordé ne serait- e qu'un peu de leur temps en expli ationsou onseils. Un grand mer i également au personnel administratif du laboratoire et de l' U.F.R : Nathalie Bergame, Pas al Chiettini et Valérie Juvé pour leur e a ité et leur sympa-thie.
Enn, e préambule est l'o asion pour moid'exprimer masin èregratitude à mes ompagnons de route thésards qui ont entre autres rendu les moments di iles plus supportablesetmoinssolitaires. Pournevexerpersonne,mer idon parordre alphabé-tiqueàAnna Benhamou,GuillaumeBarraquand, OrianeBlondel, JiatuCai, Sébastien Choukroun, Sophie Coquan, Aser Cortines, Pierre Gruet, Lori k Huang, Ni olas Lan-grené,Vi tor Perez, ChristophePoquet et Maud Thomaspour labonne ambian e que vous avez maintenue lors des pauses afé ou bien des soirées passées ensemble. Qu'ils m'ex usent pour l'absen e de remer iements personnalisés, mais le temps me manque a tuellement! Je porte une attention parti ulière à mes 'frères de thèse' Jean-Baptiste
m'avoirremer ié dans son manus rit de thèse.
Cette thèse n'aurait pas été la même sans le soutien de ma famille qui tient une pla e de premier plan pour moiet que je tiens à remer ier i i. J'ai bien entendu une pensée pour mes amis, qui mepardonneront manon-exhaustivité.
Pournir, mer ià ellequiapatiemmentsupporté, sans(trop)seplaindre, estrois annéesparfois di iles. Amélie, estravauxtedoiventaussibeau oup etlesmotsseuls ne peuvent exprimer toute mare onnaissan e, et plus en ore...
1 Introdu tion aux problèmes inverses 11
1.1 Qu'est- e qu'un problème inverse? . . . 11
1.2 Cadre statistique des problèmes inverses . . . 13
1.2.1 Diérents modèles statistiques . . . 13
1.2.2 Critère de performan e et adre minimax . . . 14
1.3 Méthodes de résolution . . . 15
1.3.1 La méthode SVD . . . 16
1.3.2 La méthode SVD par blo s. . . 16
1.4 Généralisation: méthode de Galerkin . . . 19
1.4.1 Choix des bases . . . 20
1.4.2 Dé omposition biais-varian e . . . 22
1.5 Degree of ill-posedness, espa es de régularité, adaptativité . . . 23
1.6 Né essité de onsidérer des opérateurs bruités . . . 24
2 Problèmes inverses à opérateurs bruités 27 2.1 Modèle . . . 27
2.1.1 Conséquen e sur le ompromis biais-varian e . . . 29
2.2 S hémas génériques de résolution . . . 30
2.2.1 Régularisation de l'opérateur bruité . . . 31
2.2.2 Pro edures IR et RI . . . 33
2.2.3 Détermination de bornes inférieurespour lerisque minimax . . 35
2.3 Retour sur la dé onvolution aveugle par ondelettes. . . 35
2.4 Traitement des opérateurs diagonauxpar blo s. . . 37
2.4.1 Modèle . . . 37
2.4.2 Algorithme . . . 38
2.5 Traitement des opérateurs intégraux de Volterra . . . 41
2.5.1 Hypothèses du modèle . . . 43
2.5.2 Algorithme etvitesse de onvergen e . . . 44
2.5.3 Aspe ts pratiques . . . 45
2.6 Opérateurs diagonaux par blo s : as
L
p
. . . 472.6.1 Needlets . . . 50
3 Blo kwise SVD with error in the operator 55
3.1 Introdu tion . . . 56
3.1.1 Motivation . . . 56
3.1.2 Main results and organisationof the paper . . . 57
3.2 Estimationby blo kwise SVD . . . 58
3.2.1 The blo kwise SVD property. . . 58
3.2.2 Blo kwise SVD re onstru tion with noisy data . . . 60
3.3 Main results . . . 60
3.3.1 Minimax rates of onvergen e . . . 60
3.3.2 Dis ussion . . . 61
3.4 Appli ationto blind de onvolution . . . 64
3.4.1 Spheri al de onvolution . . . 64 3.4.2 Cir ular de onvolution . . . 68 3.5 Proofs . . . 71 3.5.1 Preliminary estimates. . . 71 3.5.2 Proof of Theorem 3.3.1 . . . 73 3.5.3 Proof of Theorem 3.3.2 . . . 80
4 Noisy Lapla e de onvolution with error in the operator 87 4.1 Introdu tion . . . 88
4.2 Dis retization of Lapla e de onvolution . . . 90
4.2.1 Laguerre fun tions . . . 90
4.2.2 Galerkin method . . . 90
4.2.3 Appli ation tothe regression modelwith irregulardesign . . . . 91
4.2.4 Error inthe operator . . . 93
4.3 Features of the target fun tionand the kernel . . . 93
4.3.1 Sobolev spa es asso iated to Laguerrefun tions . . . 93
4.3.2 Banded Toeplitz matri es . . . 94
4.3.3 Degree of illposedness . . . 95
4.3.4 A rst algorithmof estimation . . . 96
4.4 Adaptation tothe standard framework . . . 97
4.5 Pra ti al performan es . . . 99
4.6 Proofs . . . 104
4.6.1 Proof of Proposition 4.4.2 . . . 104
4.6.2 Proofs of theorems 4.3.3 and 4.4.5 . . . 105
4.6.3 Proof of theorem 4.4.6 . . . 114
5 Needlets on
S
2
and the NEED-VD pro edure 119 5.1 A brief introdu tionto frametheory . . . 1195.2 Needlets . . . 121
5.2.1 The needletframework . . . 122
5.2.2 Properties of needlets . . . 124
5.3 The NEED-VD pro edure . . . 126
6 Needlets and blind spheri al de onvolution 129 6.1 Introdu tion . . . 130
6.1.1 Statisti alframework . . . 130
6.1.2 Harmoni analysis on
SO
p3
q andS
2
. . . 132 6.2 Estimationpro edure . . . 135 6.2.1 Main pro edure . . . 136 6.2.2 Pra ti al study . . . 140 6.3 Proofs . . . 142 6.3.1 Proof of Theorem 6.2.2 . . . 148 6.3.2 Proof of Theorem 6.2.3 . . . 151A Wavelets and statisti al estimation 155 A.1 MultiResolution Analysis . . . 155
A.2 Wavelets and approximation theory . . . 157
A.2.1 Besov spa es. . . 157
A.2.2 Besov spa es and Littlewood-Paleyde omposition . . . 157
A.2.3 Chara terization of Besov spa esvia wavelet expansion . . . 158
A.3 Statisti alestimation using wavelets . . . 159
A.3.1 Dire t estimation using wavelets . . . 159
A.3.2 Appli ation of wavelets toinverse problems . . . 160
Cettethèse est onsa réeà l'étudedes problèmesinverses ave opérateurbruité. Nous exposeronsdon dansunpremiertempsauChapitre1,demanièreintrodu tive,le adre mathématiquedesproblèmesinversesainsiquediérentesméthodesderésolution. Nous expliqueronsauChapitre 2 ommentla questionde larésolution ave opérateurbruité se pose naturellement pour ertains opérateurs, avant de passer en revue plusieurs solutionsdans le adre non paramétrique. Nousaborderons ensuite auxChapitres 3, 4 et6lesprin ipales ontributionsde ettethèseaudomainedesproblèmesinverses ave opérateurbruité, àsavoir:
•
AuChapitre 3, letraitement d'opérateurs diagonauxpar blo s dans un asL
2
.
•
Au Chapitre 6, l'adaptation de ette pro édure à une perte de typeL
p
, dans le as pré is de la dé onvolution sphérique.
•
AuChapitre 4, letraitement d'opérateurs de onvolutionde Lapla e/Volterra. Uneversion résumée de es trois hapitres, ayant ha un fait l'objet d'une publi ation ou d'une soumission dans une revue s ientique, se trouve dans le Chapitre 2. Le Chapitre 5sert d'interludeentre les Chapitres 3et 6. On y présente lesneedlets, sorte d'équivalent des ondelettes sur la sphère, mises en oeuvre dans le Chapitre 6.Au oursde emanus rit,nousdénirons leplus souventlesnotationsen jeu. Nous apportons i iquelques pré isions sur ertaines d'entre elles:
•
Lesnotationsa
Àb
,a
Áb
oua
¤Cb
,a
¥Cb
signientinégalitéà une onstante multipli ativeprès. La onstanteC
peut dépendre dedonnées annexes, quenous ne pré iserons pas lorsque le ontexte sera lair.•
Lanormespe trale d'un opérateuroubien d'une matri esera désignée par }.
} op, lanorme de Hilbert-S hmidtd'une matri epar }
A
}HS Trp
t
AA
q.
•
Enn,lorsque enesera paspré isé,lanorme}.
}seralanormeasso iéeàl'espa e de HilbertH
ouK
sous-ja ent.Introdu tion aux problèmes inverses
Ce hapitre est dédié à laprésentation et autraitementdes problèmes inverses (se tion1.1). On s'intéressera en parti ulier au adre statistiquesous-ja entà
l'ensemblede ette thèse en se tion1.2 avant de passer en revue diverses méthodes de résolution (se tion1.3). Nousverrons que l'étudedu ompromis biais varian einduit par une méthode de Galerkin (se tion1.4)introduit naturellementles notions
d'espa e de régularité et de 'degree of ill-posedness' (se tion1.5). Enn, un bref exemplepratique(se tion 1.6)motivera l'introdu tiondu adredes problèmesinverses ave erreur dans l'opérateurau hapitresuivant.
Contents
1.1 Qu'est- e qu'un problème inverse? . . . 11
1.2 Cadre statistique des problèmes inverses . . . 13
1.3 Méthodes de résolution . . . 15
1.4 Généralisation: méthode de Galerkin . . . 19
1.5 Degree of ill-posedness,espa es de régularité, adaptativité 23 1.6 Né essité de onsidérerdes opérateurs bruités . . . 24
1.1 Qu'est- e qu'un problème inverse?
Un problème inverse onsiste en la détermination de l'anté édent d'un état par un pro édé évolutif. Ou bien, formulé de manière plus simpliste, à déterminer des auses onnaissant leurs eets. Bienévidemment, etteformulationest trop générale dans un ontexte mathématique,aussi nous pré isons maintenantnotre adre de travail. Lamodélisationd'untelpro édé sefait par lebiais d'un opérateur
K
,agissant sur un ensembleH
(de auses), à valeurs dans un ensembleK
(d'eets). Un problème inverse onsistedon ,étantdonnéunélémentg
PK
imaged'unélémentf
PH
selonl'équationàdéterminer l'in onnue
f
. Dansnotre as, l'ensembleH
est un ensemble de fon tions, quenoussupposeronsdéniessurun espa emesurablepY, dµ
q. Nousomettronsparfois la mesureµ
lorsque le ontexte sera lair. Avant de poursuivre, donnons-en quelques exemplesan de motiverleur étude:•
Opérateur de onvolution: L'exemple le plus emblématique est sans doute elui de la dé onvolution. I i, la fon tionf
PL
2
pr
0, 1
sq est observée au travers d'un dispositif bruitant quimoyenne lo alement lafon tion, selon l'équationg
px
qKf
px
qk
f
px
q »1
0
f
px
t
qk
pt
qdt ,
(1.2) oùk
est une fon tion deL
2
pr
0, 1
sq. Plus généralement, onobserveg
px
qKf
px
qk
f
px
q »H
f
ph
1
x
qk
ph
qdh ,
oùHestungroupeagissantsur
Y
,etdh
est lamesurede HaarsurH
. Cette mod-élisation très générique re ouvre des domaines très variés, in luant par exemple letraitementd'images, laspe tros opie, oubien l'astrophysique.•
Opérateur de Wi ksell: Supposons que des sphères, dont le rayon suit une loi de probabilité de densitéf
, baignent dans un milieu. On désire retrouverf
à partirde oupes planaires. Ce modèle possède des appli ations en biologieet en stéréologieentreautres. JohnstoneandSilverman[45℄ontmontréqu'il onduisait àl'inversion de l'opérateurK : L
2
r0, 1
s,
p4x
q1
dx
ÑL
2
r0, 1
s, 4π
1
p1
y
2
q1
{2
dy
f
ÞÑKf
py
qπ
4
y
p1
y
2
q1
{2
»1
y
px
2
y
2
q1
{2
f
px
qp4x
q1
dx .
•
Opérateurintégral de Volterra: Soitf
PL
2
pR
q. On observe, pourt
¥0
,g
pt
q »t
0
k
pτ
qf
pt
τ
qdτ .
(1.3) Cetopérateurest l'analoguede l'opérateurde onvolutionpourdes systèmesnon anti ipants, 'est-à-dire queg
pt
q ne dépend que des valeurs dek
et def
prises aux tempsτ
t
. En ore une fois, les appli ations sont nombreuses et in luent par exemple la dynamique des populations et la spe tros opie par uores en e. On pourra par exemple seréférer à [59, Chap. 2℄.Cettelisteestbiensûr hautementnonexhaustive,etonpourra onsulter[53,Chap. 1℄ pour y apporter de nouveaux exemples. De plus, remarquons que nous n'avons mentionné que des opérateurs linéaires. Lathéorie des problèmes inverses à opérateur nonlinéairesétantautrementplus omplexe,nous nel'aborderons pasi i,etnousnous restreindronsdon à l'étuded'opérateurs linéaires. Revenons don àla formulation du problème. En toute généralité, e dernier est mal posé au sens de Hadamard. De manièreplus pré ise, plusieursfa teurs peuvent entraversa résolution:
•
Existen e: enpratique,onn'observejamaisKf
,maispluttuneversionbruitéeKf
ξ
. Silafon tionobservéen'appartientpasàIm
pK
q,alorsl'inversiondire te ommedans (1.1) est impossible.•
Uni ité: si plusieurs anté édents onduisent à la même observation, le hoix de l'un d'entre eux seulement prête à onfusion. Il est don né essaire de disposer d'informationsadditionnellespermettantde dis riminerentre lesdiérentes solu-tions. On supposera dans notre as l'opérateur inje tif.•
Stabilité: malgré l'inje tivité supposée, un dernier problème subsiste. Sa hant qu'en pratique, d'une part, la fon tiong
n'est jamais observée qu'à travers une approximation, et que d'autre part l'inversion de l'opérateurK
est elle-même sujette à approximation, on voit qu'une notion de ontinuité vis-à-vis des don-nées ainsi qu'une notion de stabilité de l'opérateur sont indispensables. C'est en parti ulier e dernier problème que nous tenterons de résoudre dans ertains as pré is. Le ara tère mal posé se traduira par le fait que l'opérateurK
est om-pa t. Dans e as,K
1
n'estpas ontinuetmêmeuneerreur trèsfaible ommise sur l'observation de
g
peut onduire à un résultat radi alement diérent def
. Il est don né essaire de régulariserK
, 'est à dire de trouver
K
'pro he' deK
en un ertain sens, ompatibleave l'inversionde (1.1),mais auxpropriétés plus attrayantes (stabilité,simpli itéet rapidité omputationnelle de l'inversion).Pour plus de pré isions on ernant es questions,on pourra seréférer à Kirs h[53℄.
1.2 Cadre statistique des problèmes inverses
1.2.1 Diérents modèles statistiques
Nous venons d'exposer le adre générique d'un problème inverse. Dans l'optique de sarésolution, laproblématique déterministe onsiste àmajorerl'erreur(déterministe!) ommisesur
f
enfon tiondel'erreur ommisesurg
. Enstatistique,l'appro headoptée est diérente, etonsuppose queleterme d'erreur est lerésultatd'un pro édéaléatoire dont on ontrle l'amplitude. Ce type d'appro he re ouvre en réalité plusieurs adres statistiques distin ts (mais onnexes, voir [82, Chap. 1℄), dont nous présentons trois as parti uliers :(1) Estimationdedensité: Onobservep
Y
1
, ..., Y
n
qunn
-é hantillondeloi ommuneZ
àdensitéf
Z
,telquef
Z
estl'imageparK
de ladensité iblef
. Enparti ulier, ilfaut queK
onserve l'ensemblef
PH
,
»f
1
(.
Unexempletrès simple d'appli ationest eluide la onvolution de deux densités déniessur
R
: siX
etY
sontdeuxvariablesaléatoiresàvaleursréelles,dedensitésrespe tives
f
etg
, alors la variableZ
X
Y
a pour densitéf
Z
g
f
où est le produit de onvolution surR
. L'opérateurK : f
ÞÑg
f
onserve bien l'ensembledes fon tionsmesurables d'intégrale1. La version 'sphérique' de ette exempleest présentée au Chapitre 3.(2) Modèle de régression: Soit
t
1
, ..., t
n
PY
. On observe lesvaleursY
i
Kf
pt
i
qξ
i
, i
1, ..., n ,
oùlesvariables
ξ
i
sonti.i.detE
rξ
1
s0
. La qualitéde l'estimationdef
est bien sûr intrinsèquement liéeà elle de la grillet
1
, .., t
n
.(3) Modèle de bruit blan : Ce modèle est un modèle idéalisé, mais très utile en théorie: onobserve des réalisations du pro essus
dY
ε
ps
qKf
ps
qds
εdW
ps
q,
(1.4) oùW
est un pro essus de Wiener standard. On é rira de manière plus su - in teY
ε
Kf
ε
9
W
, eton réfèrera indiéremment àY
ε
ouY
. L'a quisition d'informations surY
ε
se fait par le biais de fon tions tests. Plus pré isément, pour deux fon tions testξ, ξ
1
P
H
, les quantités observables prennent la forme xY
ε
, ξ
yK
xKf , ξ
yK
ε
x 9W , ξ
yK
,
oùx 9W , ξ
yK
N
p0,
}ξ
}2
q etE
rx 9W , ξ
yK
x 9W , ξ
1 yK
s xξ, ξ
1 yK
.Leparallèleave le modèle de densité etle modèle de régression lorsque
t
i
i
{n
s'opère en posantε
n
1
{2
.1.2.2 Critère de performan e et adre minimax
La bonne performan e d'un estimateur est quantiée par un ritère de performan e à minimiser. Nousnousplaçonsdanslemodèlede bruitblan (3),maislesrésultatssont aisément trans riptiblesaux adres (1)et (2) en remplaçant
ε
parn
1
{2
. Etant donné
f
etun estimateur rf
,on peut par exemple onsidérer la perteL
p
d
p rf , f
q »Y
| rf
f
|p
dµ, 1
¤p
¤ 8.
Demanièregénérale, onpeut onsidérer n'importequelle distan e
d
déniesurH
H
. Biensûr, ette perte est aléatoireet dépend des observations générées par lesmodèles (1), (2),ou (3). Il est don naturelde onsidérer plus pré isément le risque moyennéR
ε
E
f
d
p rf , f
q,
que l'on her he à minimiser en r
f
lorsquef
vit dans un espa eX
. On voit que deux entités antagonistes interviennent lors de ette minimisation: d'une part, la natureprodigue une fon tion in onnue a priori
f
, d'autre part le statisti ien propose un es-timateurr
f
destiné à l'appro her. Nous adoptons la stratégie dite du minimax, qui onsisteà se parer ontre le pire as possible du hoix def
. En d'autres termes,nous her hons un estimateur rf
telquesup
f
PX
E
f
rd
p rf , f
qsinf
rf
sup
f
PX
E
f
rd
p rf , f
qs.
(1.5) On noteR
ε
inf
rf
sup
f
PX
E
f
rd
p rf , f
qsle risque minimax asso ié au problème. De manière générale, ette notion est trop restri tive si l'espa e
X
est susament vaste. On introduit don la notion relaxée de vitesse de onvergen e optimalepour le adre minimax:Denition1.2.1. Une fon tionpositive
ψ
ε
estappelée vitessede onvergen eoptimale pour leproblème (3) s'ilexiste deux onstantes0
c, C
8 tel quelim sup
ε
Ñ0
ψ
1
ε
R
ε
¤C
etlim inf
ε
Ñ0
ψ
1
ε
R
ε
¥c .
Dans la suite, ondira qu'un algorithme est optimal s'ilatteint une vitesse de on-vergen e optimale(au sens minimax) sur l'espa e onsidéré.
Le hoixde l'espa e
X
est ru ial arildi telaformed'unepro édured'estimation(ou ré iproquementle hoixde l'espa eX
dé oulede laméthode utilisée). Par exemple,la dé omposition(1.21)in iteà hoisirdesespa es dans lesquelsf
est bienappro héepar la base pu
k
qk
¥
0
utilisée. De manière générale, l'espa e
X
hoisi sera un ompa t d'un espa emétrique.1.3 Méthodes de résolution
Larésolutionde (1.1)fait l'objetd'unetrès vaste littératureque nousne pouvons nous permettred'aborderdemanièreexhaustive. Lesméthodes lesplus populairessontsans doute la régularisation de Tikhonov (voir e.g. [73, Chap. 2℄), la dé omposition en valeurssingulières (SVD)ainsi quelesméthodes de proje tion. Nousn'aborderons que lesdeux dernières dans lasuite.
De manièregénérale, leprin ipede es méthodes est d'appro her e problème par une suite de problèmes bien posés
P
h
dont la solutionf
h
onverge versf
lorsqueh
Ñ0
. Dansun adrestatistique,larédu tionduparamètresh
diminuelebiaismaisaugmente lavarian edu modèle,l'enjeuétantde alibrerde manièreoptimalele ompromisentre les deux. Nous verrons que e i est possible sous ertaines hypothèses on ernant les données du problème.Nousprodiguonsmaintenantlalistedesméthodesderégularisationquinousintéresseront par la suite, à savoir la méthode SVD (et son orollaire la tron ature spe trale), la généralisationde ette méthode à un adre de SVD par blo s, et enn la méthode de proje tion dite de Galerkin qui englobe en réalité lesdeux pré édentes.
1.3.1 La méthode SVD
La méthode SVD repose sur le hoix de bases des espa es
H
etK
, adaptées au om-portementdeK
. Plus pré isément, ona leTheorem 1.3.1. Soit
H
etK
deux espa es de Hilbert, etK : H
ÑK
un opérateur ompa t. Alorsilexistepu
ℓ
qℓ
¥
0
unebase hilbertiennede
H
, pv
ℓ
qℓ
¥0
unebase hilbertienne de
K
et une suiteλ
ℓ
Ñ0
tel queKu
ℓ
λ
ℓ
v
ℓ
etK
v
ℓ
λ
ℓ
u
ℓ
.
(1.6)Ainsi, par hoix de la base p
v
ℓ
qℓ
¥0
omme fon tions tests dans le modèle (3), on obtient,pour tout
ℓ
¥0
:x
Y
ε
, v
ℓ
yxKf , v
ℓ
yε
x 9W , v
ℓ
yλ
ℓ
xf , u
ℓ
yεξ
ℓ
où, grâ e à lapropriété d'orthonormalitéde la base
v
ℓ
, la suite de variables pξ
ℓ
qℓ
¥0
est i.i.d
N
p0, 1
q. On s'est don ramené à un modèle séquentiel à omposantes de bruit normalesi.i.d. Déterminerf
est équivalent à déterminer la séquen e des pxf , u
ℓ
yqℓ
¥
0
, dont onpeut désormais aisément proposer un estimateur sans biais:p
f
ℓ
λ
1
ℓ
xY
ε
, v
ℓ
y.
(1.7)On applique ensuiteun ltre à ha un des oe ients p
f
ℓ
, le ltrepouvantêtre: 1. linéaire, ave un estimateur nal de la former
f
ℓ
γ
ℓ
pf
ℓ
où pγ
ℓ
q P r0, 1
sN
, adre re ouvrant par exemple: lesltres de Tikhonov (γ
ℓ
1
pℓ
{α
qβ
1
),lesltres de Pinsker (γ
ℓ
p1
pℓ
{α
qβ
q ).2. nonlinéaire, ommeleseuillagedoux r
f
ℓ
sgnp pf
ℓ
q | pf
ℓ
|S
ouleseuillagedur rf
ℓ
pf
ℓ
1
t | pf
ℓ
|¥S
u .En pratique, on ne al ule bien sûr qu'un nombre ni de oe ients r
f
ℓ
en stoppant l'expansionavant un niveau maximal de résolutionL
.1.3.2 La méthode SVD par blo s
Onpeutgénéraliserl'appro hepré édente. LaSVDpermetderéduire
K
àuneséquen e dénombrable d'homothéties. La méthode SVD par blo s (ou 'Blo kwise SVD') réduitK
à une séquen e dénombrable d'appli ationslinéaires sur des espa es de dimensions nies.Denition1.3.2. On ditque
K
admetune SVDpar blo ss'ilexistepH
ℓ
qℓ
¥0
etp
K
ℓ
qℓ
¥0
une suite d'espa es orthogonaux deH
(resp.K
) tel queH
À
ℓ
¥0
H
ℓ
(resp.K
Àℓ
¥0
Notant
P
V
la proje tion orthogonale sur le sous-espa e ve torielV
, on se ramène don àl'inversion séquentielle des problèmesP
K
ℓ
KP
H
ℓ
f
P
K
ℓ
g .
(1.8)Par ommodité, on supposera
dim
pH
ℓ
qdim
pK
ℓ
q (on peut toujours se ramener à e asautrement)etonnotera|Λ
ℓ
| ettedimension ommune. Notonsu
ℓ,1
, ..., u
ℓ,
|
Λ
ℓ
| (resp.v
ℓ,1
, ..., v
ℓ,
|Λ
ℓ
|) unebase de
H
ℓ
(res.K
ℓ
). Enutilisantv
ℓ,m
ommefon tiontest dans(3), onobtient xg, v
ℓ,m
yxKf , v
ℓ,m
yxKP
H
ℓ
f , v
ℓ,m
y |Λ
ℓ
| ¸n
1
xKu
ℓ,n
, v
ℓ,m
yxf , u
ℓ,n
y,
e qui, en notantK
ℓ
xKu
ℓ,n
, v
ℓ,m
yn,m
1,...,
|Λ
ℓ
|,
f
ℓ
xf , u
ℓ,n
yn
1,...,
|Λ
ℓ
|,
g
ℓ
xY
ε
, v
ℓ,m
ym
1,...,
|Λ
ℓ
|,
setraduitparl'égalitématri ielle
K
ℓ
f
ℓ
g
ℓ
. Sig
estobservée selonlemodèledebruit blan (3), alorsles oe ients a essibles deviennentx
Y
ε
, v
ℓ,m
y xg, v
ℓ,m
yε
x 9W , v
ℓ,m
y ou bien de manière synthétiqueY
ε,ℓ
g
ℓ
ε
W
9ℓ
, où 9W
ℓ
PR
|
Λ
ℓ
|est une séquen e de ve teurs gaussiens indépendants dont ha une des omposantes est normale
N
p0, 1
q. On peut alors adapter les stratégies de la se tion 1.3.1 en adoptant par exemple un seuillagepar blo du typer
f
ℓ
K
1
ℓ
Y
ε,ℓ
1
t}K
1
ℓ
Y
ε,ℓ
}R
|Λℓ
| ¡S
u, ℓ
¤L
pε
q.
Dé onvolution sphériqueUnexemplenotablededé onvolution parblo sest eluide ladé onvolutionsphérique. Etantdonnéqu'ilinterviententantqu'exempleouquesujetd'étude danslesChapitres 3, 5 et6, attardons nous quelque peu sur son as.
Cette modélisationaété initialementintroduite par Van Rooij and Ruymgaart [83℄ et traitéeparHealyetal.[39℄. L'optimalité(ausensminimax)delapro éduredéveloppée aété établieparKimand Koo[52℄pourlaperte MSE.Plus ré emment,l'extensiondes performan es
L
2
des algorithmes ainsi développés à des performan es
L
p
,
p
¥1
a été réaliséepar des stratégies de seuillage sur des systèmes de needlets par Kerkya harian etal.[51℄. Nousreviendrons endétailsur edernierpointauChapitre5. Lesdomaines d'appli ations ouvrent par exemple l'imagerie médi ale, l'astrophysique ainsi que les géos ien es. Passons maintenantà laprésentation du adre mathématique.Figure 1.1: 'Vue de dessus' de lafon tion
f
(à gau he)et deKf
lorsqueK
est un opérateurde Rosenthal de degrép
1
(au entre) et un opérateur de Lapla e (à droite). Pour toutω
PS
2
de oordonnées sphériquesp
θ, ϕ, 1
q, ona tra élepoint pθ, ϕ, 1
f
pθ, ϕ
qq. L'opérateurde Lapla e aun eetrégularisantpluspronon é.Soit
H
K
L
2
pS
2
qoùS
2
estmunidelamesuredeLebesgue. On onsidèrel'opérateur de onvolution sur lasphère dénipar
K : f
ÞÑ »SO
p3
qh
pr
qf
pr
1
.
qdr ,
(1.9) oùh
PL
2
p
SO
p3
qqetdr
estlamesuredeHaarsurSO
p3
q.K
auneetmoyennantautour de haque pointω
PS
2
, quantié par l'étalement de
h
autour de l'élément neutre du groupeSO
p3
q. And'illustrer et eet, nous avons représenté en Figure1.1lafon tionKf
pourK
ℓ,m,n
1
ℓ
pℓ
1
q1
δ
m,n
(opérateur de Lapla e),K
ℓ,m,n
sin
pℓ
1
{2
qπ
p
2ℓ
1
qsin
pπ
{2
q1
δ
m,n
(opérateur de Rosenthal) et lorsquef
est la version tronquée à la résolutionℓ
16
de la fon tionf
0
pω
q1
{exp
p2
}ω
p0, 1, 0
q}ℓ
1
pR
3
q q. Pour une illustrationde et eet dans le modèle de l'estimation de densité, onpourra onsulter lesFigures 3.1et3.2.On ala dé omposition
H
K àℓ
¥0
H
ℓ
où
H
ℓ
est l'espa edes harmoniques sphériques de degréℓ
, déniesparY
ℓ,m
pω
qY
ℓ,m
pθ, ϕ
qp1
qm
b2ℓ 1
4π
pℓ
m
q!
pℓ m
q!
P
ℓ,m
cos
pθ
qe
imϕ
,
(1.10)pour
ℓ
PN
,
ℓ
¤m
¤ℓ
et oùP
ℓ,m
sont les fon tions de Legendre dénies par exemple dansVilenkin[84℄. De plus,onpeut montrer (voir [39℄)que pour toutℓ
¥0
,K
pH
ℓ
qH
ℓ
. L'inversion de (1.9) est don équivalente àl'inversion des équationsP
H
ℓ
KP
H
ℓ
f
P
H
sur
H
ℓ
. Cha une de es inversions orrespond à la résolution d'un système linéaire de taille |Λ
ℓ
|2ℓ
1
. Par la suite, on notera, pour toute fon tionf
PL
2
pS
2
q et tout opérateurK
f
ℓ
P
H
ℓ
f
etK
ℓ
P
H
ℓ
KP
H
ℓ
.
1.4 Généralisation: méthode de Galerkin
Les méthodes de SVD et de SVD par blo s requièrent don la onnaissan e et la ma-nipulationdes bases
u
etv
. De manièregénérale, es basessontpotentiellement1)soit in onnuesou2)soitdi ilesàmanipulernumériquement,d'oùunbesoindegénéraliser es méthodes àdes hoixde bases quel onques.Laméthode Galerkin repose sur laproje tion de (1.1) sur une suite roissante de sous espa esve toriels
V
ℓ
H
, W
ℓ
K
. Notonsu
1
, ..., u
ℓ
unebase deV
ℓ
etv
1
, ..., v
ℓ
unebase deW
ℓ
(on suppose quedim V
ℓ
dim W
ℓ
ℓ
). Alors l'approximation de Galerkinf
G
de
f
est dénie ommela solutiondu problème #f
G
PV
ℓ
,
xKf
G
, y
yxg, y
y pour touty
PW
ℓ
.
(1.12) Ainsi,onaP
W
ℓ
KP
V
ℓ
f
G
P
V
ℓ
g .
(1.13)Commepré édemment,en notant
K
ℓ
pxKu
m
, v
n
yqm,n
¤ℓ
, f
ℓ
G
pxf
G
, u
m
yqm
¤ℓ
, g
ℓ
pxg, v
n
yqn
¤ℓ
,
(1.14)l'inversion de (1.12)est en réalité l'inversion du système linéaire
K
ℓ
f
ℓ
G
g
ℓ
.
(1.15)
On voit bien désormais que les deux méthodes évoquées auparavant sont deux as parti uliers où 1) la matri e
K
ℓ
est diagonale et 2) la matri e
K
ℓ
est diagonale par blo s(ave blo s
K
i
).Ainsi,une méthode de Galerkin repose sur une double approximation: approximation de
K
parK
ℓ
, etapproximation deg
parg
ℓ
. Ladé omposition orthogonalef
f
G
f
P
V
ℓ
f
G
ℓ
f ,
(1.16) aveG
ℓ
pK
ℓ
q1
P
W
ℓ
KP
V
Kℓ
, implique }f
f
G
}2
}f
P
V
ℓ
f
}2
}G
ℓ
f
}2
.
Ladé omposition de l'erreur fait apparaître deux termes: lepremier termeest lebiais d'approximation de
f
par sa proje tion sur l'espa eV
ℓ
, tandis que le se ond ontrle lesrésidusasso iésau hoixdesespa esV
ℓ
, W
ℓ
. Par onséquent,labonnemar hed'une méthode de Galerkinrequiert que es deux termestendent vers0
.1.4.1 Choix des bases
Lesbasesp
u
ℓ
qetpv
ℓ
qdoiventrépondreàunedoubleexigen e: premièrement,la simpli -itéetlarapidité omputationnelledel'inversiondusystèmelinéaire(1.15),et deuxième-ment, lareprésentation e a e de lafon tion iblef
dans labase pu
ℓ
q. Le hoixd'une basede SVD oubien de SVD par blo sde l'opérateurprivilégie lapremière qualité au détriment potentiel de la se onde. En eet les bases réalisant la SVD ne représentent usuellementf
de manièree a e quedans un adrehilbertien pour une perte de typeL
2
. Le hoixd'une based'ondelettelorsque l'espa esous-ja entest un espa ede Besov (voirAppendix A)inverse le ompromis,et né essite bien souvent des hypothèses plus restri tives sur l'opérateurK
. Nous en présentons trois exemples i-dessous.Ondelettes et méthode de Galerkin
Cohenetal.[17℄onteure oursàuneméthodedeGalerkinutilisantdesbasesd'ondelettes p
u
ℓ
qpv
ℓ
qpψ
λ
qsurr0, 1
s(oùλ
représenteledoubleindi epj, k
q). Dans ettese tion, onsupposeradeplusl'opérateursymétrique(maisleraisonnements'adapteau asd'un opérateurnonsymétrique). Pourunindi emaximalJ
,onnoteraΛ
tpj, k
q, j
¤J, k
¤2
j
u. Pour un bref rappel théorique sur les ondelettes, on pourra onsulter l'Appendix A. Les méthodes d'estimation développées dans es travaux mettent en éviden e une distin tion entre deux typesde méthodes, qui réapparaîtradans leChapitre 2. I i,
K
est un opérateur auto-adjoint,vériant larelationf
PL
2
pr0, 1
sq,
xKf, f
y}f
}2
H
ν
{2
.
(1.17)Sous ette hypothèse onpeut montrer ([40℄)que la onstante
Q
j
sup
j
¥0
2
jν
}pK
j
q1
}op
estnie,etdon que ettenotionrejointla ondition(1.22)dénieplusbas. L'estimation par méthode de Galerkin requiert larésolution de
x
Kf
G
, ψ
j,k
y xY
ε
, ψ
j,k
y pour tout pj, k
qPΛ .
(1.18)Laprésen e de bruit sur la fon tion image
g
Kf
est traitée à l'aide d'une méthode de seuillage. Deux hoix distin tsse présentent:1. Opérer un seuillage sur lesignal image
Y
ε
puis résoudre l'équation i-dessus en remplaçantY
ε
par sa version seuillée dans (1.18).2. Résoudre (1.18) etappliquer leseuillagesur lerésultat.
Cesdeux asmettentnaturellementen jeudespro édures etdeshypothèsesdiérentes. Par exemple, le premier as impose l'e a ité d'un seuillage appliqué sur
Y
ε
, don l'appartenan edeg
àun ertainespa edeBesov(typiquementB
s ν
etpar làla ontinuitéde
K : B
s
p,p
ÑB
s ν
p,p
. LeseuillagepratiquésurY
ε
prendlaforme naturelle(voir Appendix A)T
p.
q ¸λ
¤Λ
x., ψ
λ
y1
! |x.,ψ
λ
y|¡τ ε
? |log ε
| )ψ
λ
.
Le deuxième as n'impose au une hypothèse supplémentaire sur
K
. Cependant, la pro édure de seuillage appliquée àK
Λ
1
Y
ε
requiert le ontrle des variables aléa-toires xK
Λ
1
9
W
J
, ψ
j,k
y. Du fait de (1.17), es estimateurs possèdent une varian e roissante enj
, qui est in orporée au seuillage. Ce dernier, pratiqué surK
Λ
1
Y
ε
, devient alorsT
p.
q ¸λ
¤Λ
x., ψ
λ
y1
! |x.,ψ
λ
y|¡τ 2
jν
ε
? |log ε
| )ψ
λ
.
Dé omposition WVDIlestparfoispossibled'améliorersubstantiellementlapro édure i-dessuspour ertains opérateurs spé iques. L'existen e d'une WVD (pour Wavelet-Vaguelette De omposi-tion, initialement introduite par Donoho [26℄) ou bien d'une VWD (voir Abramovi h andSilverman[2℄)oreun adreintermédiaireentreSVD etondelettesparméthodede Galerkin. Parexemple,laWVDreposesurl'hypothèsequ'ilexisteunebased'ondelettes p
ψ
λ
q,un système de vaguelettes pν
λ
q etune suiteβ
j
¡0
tel que,pour toutλ
pj, k
q,K
p
ν
λ
qβ
j
ψ
λ
.
(1.19)En onséquen e, en dé omposant
f
sur la base pψ
λ
q, onobtient xY
ε
, ν
λ
y ¸λ
1 xKψ
λ
1, ν
λ
yxf , ψ
λ
1yε
x 9W , ν
λ
yβ
j
xf , ψ
λ
yε
x 9W , ν
λ
yoù l'on a su essivement appliqué (1.19) ainsi que l'orthogonalité des ondelettes. Par onséquent, on obtient un estimateur sans biais de x
f , ψ
λ
y en posant x rf , ψ
λ
yβ
1
j
xY
ε
, ν
λ
yOn oupleensuite etestimateuràunseuillagedouxoudurand'obtenirunepro édure optimaleen perte
L
2
sur des espa es de Besov
B
s
π,r
pr0, 1
sq. Ainsi, les systèmes duaux pψ
λ
q et pν
λ
q possèdent une stru ture adaptée à la fois à l'analyse du signalf
et de l'opérateurK
.Une diéren e notable ave le adre pré édent est que le système de vaguelettes p
ν
λ
q n'est pas une base (il n'est pas orthonormé). On voit don que la notion de base n'est pasné essaireàlamiseenpla ed'uneméthodedeGalerkin. Enparti ulier,laméthode WVDillustrel'utilisationd'unebasedeRiesz(voir[14℄)adaptéeàK
. Notonsque ette méthoderestreintinévitablementle hampd'appli ationsauxopérateurspossédantune telle propriété, tels l'intégration, l'intégration fra tionnaire ou bien la transformée de Radon.Dé onvolution en régime périodique
La présen e de et exemple i i se justie par le fait que l'utilisationdes needlets pour ladé onvolutionsphérique aveugle, auChapitre 6,repose sur des argumentstrès simi-lairesdans des as plus omplexes. Lesprin ipesde laméthode développée ontpermis d'aborder similairementlesproblèmes inverses telsque l'inversion de latransformée de Radon([50℄)ou bien ladé onvolution de Ja obi ([49℄).
Dans le as spé ique de la dé onvolution sur r
0, 1
s, Johnstone et al. [44℄ ré on ilient l'e a ité de l'étape d'inversion grâ e aux séries de Fourier ave la représentation de lafon tion ible en ondelettes. Pour e faire, ils se basent sur les ondelettes de Meyer périodisées, qui possèdent un support fréquentiel ompa t. En eet, on a, pour toutj
¥0
,C
j
∆
tℓ
PZ
,
xψ
j,k
, e
2iπℓ.
y0
u2π
3
r2
j 2
,
2
j
s ¤ r2
j
, 2
j 2
s,
(1.20)de telle sorte que les oe ients d'ondelettes se al ulent e a ement par la formule de Parseval. Plus pré isément, supposons que l'on observe
dY
ε
pt
qk
f
pt
qdt
εdW
pt
q, t
P r0, 1
s,
oùk
PL
2
pr
0, 1
sq. On noterae
ℓ
pt
qe
2iπℓt
. Parla formulede Parseval,on a
x
f , ψ
j,k
y ¸ℓ
¥0
xf , e
ℓ
yxψ
j,k
, e
ℓ
y ¸ℓ
PC
j
xf
k, e
ℓ
y xk, e
ℓ
y xψ
j,k
, e
ℓ
yetla somme i-dessus est nie. Un estimateur de x
f , ψ
j,k
y est don pβ
j,k
¸ℓ
PC
j
xY
ε
, e
ℓ
y xk, e
ℓ
y xψ
j,k
, e
ℓ
y.
Ave l'hypothèsede DIP(voirse tion 1.5) suivante:
2
j
2
j
2
¸ |ℓ
|2
j
|xk, e
ℓ
y|2
1
{2
2
jν
,
onpeut alibrerleseuillagedes oe ientsobtenusetretrouverlesvitessesd'estimation minimaxsur lesespa es de Besov (voir se tionA.3.2).
1.4.2 Dé omposition biais-varian e
Nousallons maintenant faireune hypothèse supplémentaire, vériée dans le adre des Chapitre 3,4, 5et 6.
Assumption 1.4.1. Pour tout
ℓ
¥1
,KP
V
ℓ
P
W
Sous Assumption 1.4.1, ona alors
G
ℓ
pK
ℓ
q1
KP
V
ℓ
P
V
Kℓ
0 ,
etpar onséquentf
G
P
V
ℓ
f
,quenous assimileronségalementàf
ℓ
. Voyons omment s'arti ulele ompromisbiais-varian edans e as: en remplaçant
g
parY
ε
dans (1.12), l'erreur ommisese dé ompose de lamanièresuivante:}
f
pK
ℓ
q1
pg
ℓ
ε
W
9ℓ
q}¤}f
f
ℓ
}ε
}pK
ℓ
q1
9W
ℓ
}.
(1.21) Leterme de biais }f
f
ℓ
} dé roît ave
ℓ
,tandis que, en raison du ara tère mal posé duproblème, leterme(aléatoire)de varian e}pK
ℓ
q
1
9
W
ℓ
} aluitendan eà roître. Un hoixjudi ieuxdeℓ
enfon tiondeε
réaliseunbon ompromisentre esdeuxquantités.1.5 Degree of ill-posedness, espa es de régularité et
adaptativité.
A la lumière de (1.21), le ara tère mal posé du problème est ainsi illustré lors de l'appli ation d'un s héma de Galerkin par la roissan e des normes }p
K
ℓ
q1
} op aufur età mesurequeℓ
augmente. Parexemple, ette norme peut roître•
polynomialement,i.e. }pK
ℓ
q1
} op ¤Cℓ
ν
,
(1.22)auquel as leproblème est ditmoyennementmal posé.
•
exponentiellement auquel as le problème est dit sévèrement malposé.Nous nous on entrerons sur le as d'une roissan e polynomiale. Le réel
ν
est ap-pelé DIP (Degree of Ill-Posedness). Comme9
W
ℓ
est un ve teur gaussien standard, }pK
ℓ
q
1
9
W
} est une variablegaussienne de varian e }t
pK
ℓ
q1
1
pK
ℓ
q1
1
} ¤ℓ
}pK
ℓ
q1
}2
op,
où1
est le ve teur de tailleℓ
donttoutes les omposantes valent 1.D'autre part, la majoration du premier terme in ite à onsidérer des espa es où la dé roissan ede}
f
f
ℓ
}estelleaussipolynomiale, 'est-à-direqu'ilexiste
s
¡0, M
¥0
tel que }f
f
ℓ
}2
¤M ℓ
2s
. Dans le as où la base p
u
ℓ
q est onstituée des fon tions propresde l'opérateurLapla iensurr0, 1
s,onretrouvelesespa es de Sobolevsur r0, 1
s, que nous noteronsW
s
. Les espa es de Besov fournissent une généralisation de e prin ipeà une norme
π
¥1
quel onque(voirAppendix A).Etant donné
ν
ets
, le niveau de résolution optimal estℓ
pε
qε
1
ν
s
1
{2
et la perte asso iée sur laboule de Sobolev de rayon
M
,W
s
pM
q, estsup
f
PW
s
pM
qE
}f
pK
ℓ
q1
ppKf
qℓ
ε
W
9ℓ
q} ¤Cε
2s
2
ps
ν
q1
.
(1.23)On peut montrer (à l'aide des arguments présents dans Korostelev and Tsybakov [54, Chapitre 2℄)que ette vitesse est optimaleau sens minimax.
Enpratique,la onnaissan eapriori de
s
(et deν
)n'est pas garantie, d'où lané essité de onstruire des pro édures indépendantes de es paramètres, mais qui atteignent asymptotiquement le même ordre de onvergen e que dans le as où ils sont onnus. Souvent, etteadaptativitésepayeauprixd'unfa teur logarithmiquedanslesvitesses de onvergen e. En pratique, e type de pro édure re ouvre par exemple la méthode de Lepski ([57℄, [5℄), les stratégies de seuillage ([44℄), ou de minimisation du risque empirique([13℄).Remark 1.5.1. On pourrait imaginer des dé roissan es exponentielles pour les deux termes onsidérés i-dessus. Celles- i ont par exemple été étudiées par Tsybakov [81℄.
An d'illustrer la puissan e des pro édures de seuillage (que nous utiliserons de manièreré urrente par la suite), nous rentrons en détail dans leur mise en pla e dans e adre spé ique. Choisissons don pour niveau maximal
ℓ
pε
qε
a |log ε
|2
2ν
1
.
Ce niveau surestime elui de la pro édure linéaire. Cette surestimationest ompensée paruntraitementadéquatdesrésultatsobtenusparméthodedeGalerkin. Introduisons pour e faire le seuillagedéni pour
x
PR
T
ℓ
px
qx1
! |x
|¡τ ℓ
ν
ε
? |log ε
| ),
etsoit rf
l'estimateur déni par x rf , u
ℓ
yT
ℓ
xpK
ℓ
q1
Y
ℓ
ε
, u
ℓ
y1
tℓ
¤ℓ
pε
qu.
Alors on peut montrer que et estimateur atteint la même vitesse que (1.23), à un fa teurlogarithmique près. Plus pré isément, pour
s, M
¡0
,sup
f
PW
s
pM
qE
} rf
f
}¤C ε
a |log ε
|2s
2
ps
ν
q1
.
Ainsi, le seuillage permet d'obtenir l'adaptativité. En fait, pour des pertes
L
p
plus générales,etdans ertainsespa es deBesov
B
s
π,r
,onpeutmontrerqu'au unepro édurelinéairen'atteintlavitesseminimax,etdon leseuillage(ouautreméthodenonlinéaire) devient essentiel (voir Theorem A.3.1).
1.6 Né essité de onsidérer des opérateurs bruités
An d'introduire le hapitre suivant, revenons plus en détail sur le as parti ulier de la dé onvolution sphérique introduite en 1.3.2. Supposons que la fon tion
f
vit dans l'espa ede SobolevW
s
pM
qtf
PL
2
pS
2
q,
¸ℓ
¥0
ℓ
2s
}f
ℓ
}2
¤M
2
u,
p
s
¡1
{2
q,etquelesmatri esK
ℓ
vérient la ondition deill-posedness }K
1
ℓ
} op ¤Cℓ
ν
. On introduit lapro édure suivante: soit, pour toutℓ
¥0
,p
f
ℓ
K
1
ℓ
Y
ε,ℓ
.
On dénit alorsl'estimateur
r
f
¸ℓ
¤L
¸ |m
|¤ℓ
pf
ℓ,m
1
! } pf
ℓ
}¥κℓ
ν
?2ℓ 1ε
? |log ε
| )Y
ℓ,m
, L
ε
a |log ε
|2
2ν
1
.
(1.24)On peut montrer par des arguments standards que ette pro édure est quasi-optimale au sens minimax sur
W
s
p
M
q. Cependant, en pratique, l'opérateurK
est in onnu a priori. Cette di ulté est heureusement ontournable ar on sait que les oe ients xKY
ℓ,m
, Y
ℓ,n
y sont en réalité les oe ients de Fourier de la fon tionh
PL
2
pSO
p3
qq: xKY
ℓ,m
, Y
ℓ,n
yˆ
h
ℓ,m,n
»SO
p3
qh
pr
qR
ℓ,m,n
pr
qdr ,
oùlesfon tions
R
ℓ,m,n
sontlesfon tionspropresdu Lapla iensurSO
p3
q (voirVilenkin [84℄).Danslemodèlede l'estimation de densité(1),
h
est une densitéetonobserveθ
1
, ..., θ
q
q
réalisations de la variableθ
à densitéh
surSO
p3
q. Un estimateur naturel deˆ
h
ℓ,m,n
est alors1
q
q
¸i
1
R
ℓ,m,n
pθ
i
q.
Enremplaçantˆ
h
ℓ,m,n
par saversion empirique,l'erreur ommisesurh
(et don surK
) ae te la pro édure d'estimation 1.24. De manière similaire, dans un modèle de bruit blan on n'observe non pasˆ
h
ℓ,m,n
mais sa version bruitéeˆ
h
δ,ℓ,m,n
ˆ
h
ℓ,m,n
δ
B
9ℓ,m,n
,
oùles variables aléatoires 9
B
ℓ,m,n
sont i.i.dN
p0, 1
q. On noteK
δ
(resp. 9B
) l'opérateur onstitué des oe ients de Fourierˆ
h
δ,ℓ,m,n
(resp. 9B
ℓ,m,n
). An de démontrer la nette inuen e de la pré-estimation des oe ientsˆ
h
ℓ,m,n
sur l'estimation def
, nous om-paronsenFigure1.2lesrésultatsobtenusparl'appli ationde(1.24),d'abordenutilisant l'opérateurK
, puis en le remplaçant par sa version bruitéeK
δ
. Les paramètres sont lessuivants:•
L'opérateurK
est un opérateurde Lapla edontles oe ients deFourier valentˆ
h
ℓ,m,n
1
ℓ
pℓ
1
qq1
1
tm
n
u.
K
possèdedon un DIPdeν
2
.•
On dénitf
0
pω
qexp
p2
}ω
ω
1
}ℓ
1
pR
3
qq où
ω
1
p0, 1, 0
q. La fon tion iblef
est latron ature def
0
auniveauℓ
16
:f
¸ℓ
¤16
¸ |m
|¤ℓ
xf
0
, Y
ℓ,m
yY
ℓ,m
(1.25)Figure1.2: Degau heàdroite: fon tion ible,re onstru tionp
K
δ
q1
Y
ε
(E
0.515
)etrésultatde l'algorithmedeBlo kwiseSVD(E
0.324
)àunniveaudebruitδ
5.10
3
, ε
0
.•
On apδ, ε
qp5.10
3
, 0
q.Le hoixde es donnéesn'est pasinno ent. D'une part,unDIPde 2 onduitdéjààdes problèmestrèsmalposésenpratiqueparla roissan erapidedesnormes}
K
1
ℓ
}op
( equi signie l'instabilitégrandissante de l'inversion deK
ℓ
). D'autre part, la présen e d'un pi aupointω
ω
1
pourf
0
assureune dé roissan elentedes oe ientsde Fourierdef
0
. Atitre de omparaison,onaégalementtra élerésultatobtenuparl'algorithmede Blo kwise-SVDintroduit en se tion 2.4, ou plus en détails au Chapitre 3. La perteE
est la perteL
2
renormaliséepar }
f
}. Commeon le voit, la présen e d'erreur dansK
δ
impa tel'estimationdef
demanièrenotoiredansleshautesfréquen es. Cephénomène n'est pas étonnant étant donné que la matri eK
15
vaut environ
4.10
3
I
31
, et qu'en vertu d'un argument lassique sur les séries de Neumann, la matri eK
δ
n'est plus assuréedeposséderdespropriétéssimilairesàK
siδ
}9
B
ℓ
}op
¡4.10
3
,soit} 9B
ℓ
}op
¡4
{5
, unévènementréaliséave très forteprobabilité ommeonleverra par lasuite (Lemma 2.1.3).Cet exemplesoulignelané essité de traiterlanouvelle erreurinduitepar l'observation de
K
δ
au lieudeK
. Ce sera l'objet des hapitressuivants.Problèmes inverses à opérateurs
bruités. Prin ipales ontributions.
Dans e hapitre,onintroduitlanotiondeproblèmeinverse àopérateurbruité(se tion 2.1). On étudie ensuite diverses appro hes de résolution en se tion 2.2. La n de e hapitre est dédié à la présentation de quatre exemples parti uliers : la dé onvolution aveuglespar ondelettes (se tion2.3) oùl'on présentede manièresu in te le travailde Homann and Reiÿ [40℄, puis un résumé des travaux originaux ee tués durant ette thèse,àsavoir: ladé onvolutiondans le as d'unopérateurdiagonalpar blo sdansun adre
L
2
en se tion 2.4, l'extension de ette pro édure à un adre
L
p
,
1
¤p
¤8 dans le as deladé onvolutionsphériqueense tion2.6,etennladé onvolutiondeVolterra en se tion 2.5. Cha une de es trois dernières se tionferont l'objet d'un hapitre plus détaillédans lasuite.Contents
2.1 Modèle . . . 27
2.2 S hémas génériques de résolution . . . 30
2.3 Retour sur la dé onvolution aveugle par ondelettes . . . 35
2.4 Traitement des opérateurs diagonaux par blo s . . . 37
2.5 Traitement des opérateurs intégraux de Volterra . . . 41
2.6 Opérateurs diagonaux par blo s : as
L
p
. . . 47
2.1 Modèle
Nous avons jusqu'i i onsidéré le as d'opérateurs
K
onnus, et nous étendons main-tenant notre étude au as oùK
n'est pas onnu a priori. Nous nous pla erons durant tout e hapitre dans lemodèlede bruit blan (3), 'est-à-direque l'on observeSi
K
est in onnu, il est impossible de retrouverf
en toute généralité. Il est don né essaire de disposer d'une informationàpriori surK
. Dansnotre as, on supposera quenous avons a ès àune version bruitéeK
δ
modéliséeparK
δ
K
δ
9
B, 0
δ
1 .
Lepro essus9
B
estun bruit blan gaussiensurlesopérateurslinéairesdeH
dansK
, e qui signieque lesquantités observables prennent la formex9
Bu, v
y pouru
PH
, v
PK
. De plus, es variables sont gaussienneset onaCov x 9
Bu
1
, v
1
yK
x 9Bu
2
, v
2
yK
xu
1
, u
2
yH
xv
1
, v
2
yK
(2.1) pouru
1
, u
2
PH
,v
1
, v
2
PK
. Par exemple, on peut supposer que l'opérateurK
δ
est le résultat d'une première inféren e pratiquée sur l'opérateurK
(voir se tion 1.6). Ou bien, un point de vue alternatif est de onsidérer que le 'vrai' opérateurK
est une perturbation in onnue d'un opérateur onnuK
δ
. L'ampleur de la perturbation (ou bien la pré ision de l'inféren e dans le premier as) est quantiée par le paramètreδ
. On synthétise es deux modèles sous laforme suivante#
Y
ε
Kf
ε
9W ,
K
δ
K
δ
9B .
(2.2)Cette modélisation, due à Efromovi h and Kolt hinskii [30℄, a depuis fait l'objet de plusieurs travaux ([40℄,[63℄,[23℄ par exemple). Avant de s'atteler à son traitement, présentons quelques exemples parti uliers où lamodélisation(2.2)est a tivement util-isée (d'autres exemples sontdisponibles dans [30℄ et[40℄).
Example 2.1.1 (Equation de la haleur). Considérons l'équation d'évolution
B
u
Bt
Lu
0 ,
(2.3) oùL
d
¸i,j
1
B Bx
i
a
ij
px
q B Bx
j
(est un opérateur elliptique sur
G
un ouvert onnexe borné deR
d
, ave onditions de Diri hlet. La solution de (2.3) ave ondition initiale
u
p0, x
qf
px
q s'é ritu
pt, x
qe
Lt
f
px
q oùe
Lt
est un semi-groupe d'opérateurs ave noyau
h
t
px, y
q. Onse poseleproblèmededéterminerla onditioninitialef
onnaissant la solutionu
pt
0
, x
q pour un ertaint
0
¡0
. SiL
est in onnu, en notantH
e
Lt
0
on peut modéliser e problème omme suit:dY
ε
px
qHf
px
qdx
εdW
px
q.
Pour toutϕ
PL
2
pG
q, on observe alors xY
ε
, ϕ
y xHf , ϕ
yε
x 9W , ϕ
y. SiH
esin onnu,onpeut onduirel'expérien eave une onditioninitiale
f
1onnue,quiaboutit aux observations
dY
1ε
px
qHf
1 px
qdx
εdW
1 px
q.
On retrouve don le modèle 2.2 en supposant
Cov
x 9W , ϕ
1
yx 9W
1, ϕ
2
y xf , f
1 yxϕ
1
, ϕ
2
y etε
δ .
Example 2.1.2 (Equation intégrale du premier type). On onsidère un opérateur in-tégral
Kf
px
q »Ω
k
px, y
qf
py
qdy ,
oùΩ
R
d
. Un tel type d'opérateur apparaît par exemple en transformant le prob-lème pré édent en une formulation variationnelle équivalente. L'a tion de
K
estt
-régularisante, 'est-à-dire queK : H
t
{2
p
Ω
q ÑH
t
{2
p
Ω
q. De plus,k
est typiquement singulier sur sa diagonale (par exemplek
b
px, y
q{|x
y
|β
, }
b
} 88,
β
¡0
pour l'opérateur d'Abel). Cependant, le noyauk
est in onnu, e qui motive l'introdu tion du modèlek
δ
px, y
qk
px, y
qδ
9
b
px, y
q où 9b
est un pro essus gaussien et on aboutit au modèle (2.2).And'obtenir uneestiméede lafon tion
f
,Efromovi handKolt hinskii[30℄eurent re oursà une méthode de Galerkin sur deux bases orthonormalesdes espa esH
etK
. Voyons don omment s'arti ule ette méthode ave e nouveau adre : en projetant l'équation(3)sur lesbases pu
ℓ
q etpv
ℓ
q, onobtientde mêmeque pré édemment:Y
ℓ
ε
K
ℓ
f
ℓ
G
ε
9
W
ℓ
.
K
ℓ
n'est i ipas onnu, mais nous avons a ès à lamatri eK
ℓ
δ
P
W
ℓ
KP
V
ℓ
δP
W
ℓ
9BP
V
ℓ
K
ℓ
δ
B
9ℓ
,
ave 9B
ℓ
px 9Bu
k
, v
n
yqk,n
¤ℓ
. Une onséquen e immédiatede (2.1) est que ette matri e est onstituée d'entrées normales
N
p0, 1
qi.i.d.2.1.1 Conséquen e sur le ompromis biais-varian e
La présen e d'un nouvel alea dé oulant du bruit blan 9
B
altère le ompromis biais-varian e(1.21). Ensupposant l'hypothèse 1.4.1 toujours valide, elui- idevient:p
K
ℓ
δ
q1
Y
ℓ
ε
f
f
ℓ
f
δ
pK
ℓ
δ
q1
9B
ℓ
f
ℓ
ε
pK
ℓ
δ
q1
9W
ℓ
.
Remarquonsquenousavons utilisél'inversibilitéde
K
ℓ
δ
,propriétévériéepresquesûre-ment. Ainsila dé ompositionfait lairementapparaître trois termes :