• Aucun résultat trouvé

1.3.3 Bilan sur les approximations parcimonieuses non linéaires

Nous avons vu dans cette section deux façons d’appréhender l’estimation continue des para- mètres non linéaires pour la résolution des problème inverses considérés dans nos travaux (1.1). La première se base sur les dictionnaires infinis A, des espaces de dimension infinie qui re- groupent l’ensemble des atomes continus h(ν) pour ν ∈ Λ ⊂ Rp. Elle permet de définir le problème d’Atomic Soft Thresholding (1.18), équivalent sur dictionnaire infini de la pénalisation `1 sur dictionnaire discret. La seconde se place dans le cadre des approximations parcimonieuses,

où au lieu de fixer les paramètres de localisation sur une grille de J paramètres discret ¨νj, on les relâche dans J intervalles Ij disjoints. Cela permet de définir le problème d’approximation parci- monieuse non linéaire (APNL, (1.20)) sur le dictionnaire continu H(ν) de dimension (N × mJ ), dont les atomes dits atomes continus dépendent de façon non linéaire des νj ∈ Ij. Des reformu- lations du problème d’APNL et des adaptations des méthodes classiques de résolution d’APL ont été proposées pour résoudre ce problème de façon sous-optimale.

Les travaux présentés dans cette section nous ont amenés à nous orienter vers deux axes de recherche présentés en section suivante.

1.4

Conclusion sur les objectifs et les pistes suivies

Nous revenons dans cette section sur l’objectif principal de cette thèse et nous justifions les pistes de recherches qui ont été poursuivies. Le plan général du manuscrit est ensuite décrit, accompagné des principales contributions scientifiques et des publications associées.

1.4.1 Pistes choisies pour répondre aux objectifs

Comme annoncé dès le début de ce chapitre, cette thèse vise à résoudre les problèmes inverses non linéaires avec a priori de parcimonie présentés en §1.1dans un cadre général. Pour répondre à la difficulté de tels problèmes, les résolutions envisagées, qualifiées d’« optimales », doivent répondre aux critères suivants :

1. la parcimonie doit être prise en compte de façon exacte ;

2. les méthodes de résolution employées visent à garantir de trouver la solution optimale des problèmes posés.

Nos recherches ont aussi pour objectif de bénéficier de ces travaux pour l’application à des problèmes d’actualité dans la communauté astrophysique : l’analyse spectrale de signaux irrégu- lièrement échantillonnés et plus particulièrement la détection d’exoplanètes par la méthode des vitesses radiales.

Remarque : À l’opposé de nombreux travaux, nous favorisons donc la recherche de solutions optimales au prix d’un coût de calcul plus élevé. Néanmoins, ce n’est pas un problème pour les applications d’astrophysique qui nous intéressent ; l’acquisition des données se fait généralement sur plusieurs jours, et leur traitement ne nécessite pas une mise en œuvre en temps réel. Bien sûr, nous chercherons à améliorer l’efficacité de nos méthodes, mais l’optimalité des solutions reste la priorité.

Au regard des méthodes existantes pour la résolution des problèmes d’APL vues en §1.2, et des récentes propositions pour l’estimation continue des paramètres non linéaires résumées en §1.3, nous avons décidé de focaliser nos recherches sur la reformulation en problème d’approxima- tion parcimonieuse non linéaire (APNL) utilisant un dictionnaire continu, plutôt que l’exploita-

Chapitre 1. Introduction

tion d’un dictionnaire infini pour la résolution de l’Atomic Soft Thresholding (AST). En effet, comme nous l’avons vu précédemment, le problème d’AST est l’équivalent pour le dictionnaire infini de la relaxation de la pseudo-norme `0par la norme `1sur le dictionnaire discret. Cette for- mulation peut être considérée comme « sous-optimale » car elle ne prend pas en compte de façon exacte de la parcimonie. Elle souffrira des mêmes problèmes de sous-estimation des amplitudes et des fausses détections, préjudiciables pour les problèmes inverses considérés. À cela s’ajoute la difficulté de reformuler le problème d’AST en Semi-Definite Programming (SDP) pour certaines applications, notamment pour celles qui nous intéressent : le cas de l’échantillonnage irrégulier complique la mise en œuvre des algorithmes et l’application à la détection d’exoplanètes semble impossible. Au contraire, les problèmes d’APNL nous semblent plus prometteurs pour ces appli- cations. Nous avons donc décidé d’étudier les possibilités d’adapter aux problèmes d’APNL les méthodes de résolution d’APL répondant aux critères d’optimalité dans les cadres déterministe et stochastique, formant deux axes de recherche que nous décrivons dans les paragraphes suivant. Le premier axe de recherche est donc l’estimation, par une approche déterministe, des am- plitudes x et des paramètres non linéaires ν pour résoudre le problème d’APNL. Dans le cadre des APL, seule la reformulation en MIP du problème `0 permet une résolution « optimale » du problème, tant sur la prise en compte de la parcimonie que sur la méthode de résolution. Dans le cadre des APNL, la non-linéarité induite par les paramètres νj rend cependant les problèmes d’optimisation non convexes et nécessairement sensibles aux minima locaux. Afin de garder un problème linéaire, on utilisera la reformulation du problème d’APNL en pro- blème d’APL sous contraintes par le principe d’interpolation de dictionnaire proposé initiale- ment par [ETS11]. Le premier verrou sera donc d’adapter la reformulation en MIP du problème `0 proposé par [BNCM16] à la présence des contraintes afin d’obtenir une résolution optimale,

puisque les méthodes de résolution actuellement proposées pour ces problèmes d’APLsc sont des méthodes sous-optimales se basant sur les algorithmes gloutons ou la relaxation `1. Par ailleurs, le problème d’APLsc est bien une approximation du problème d’APNL initial, puisqu’il nécessite la linéarisation des atomes h(·). Un deuxième verrou sera donc de minimiser l’erreur d’approximation en étudiant les différentes propositions d’approximation. Enfin, des extensions au cas de la présence de paramètres de forme, ou d’atomes composés de plusieurs colonnes seront envisagées.

Le deuxième axe s’appuie sur une approche stochastique et consiste en la prise en compte des paramètres non linéaires au sein d’un modèle Bernoulli-Gaussien étendu, associé à un échan- tillonnage stochastique de la loi a posteriori pour le calcul de l’estimateur de l’EAP. Le modèle BGE proposé par [BC06] nous semble le plus approprié aux objectifs de cette thèse. L’approche envisagée par [KTHD12], d’un modèle BG classique sur grille très fine associé à une contrainte de distance minimale et à un échantillonnage stochastique, ne permet pas, quant à elle, une véritable estimation continue des paramètres non linéaires, et ne peut pas se généraliser à la présence de paramètres de formes. Nos travaux viseront donc à résoudre les problèmes d’échan- tillonnage relevés par [BC06], notamment au niveau de la convergence de l’échantillonneur, dont les échantillons peuvent rester bloqués dans des modes locaux, mais aussi des incohérences sur le schéma d’échantillonnage.

Notons qu’une étude des algorithmes gloutons avec optimisation locale pour la détection d’exoplanètes a en parallèle été menée au cours de cette thèse. Ce type de méthodes, considé- rées comme sous-optimales, ne rentre pas dans le cadre choisi pour ce manuscrit. Des premières pistes de recherche peuvent cependant être trouvées dans le rapport [Bou14], et nous avons choisi d’illustrer rapidement ces travaux dans le Chapitre 4 sur l’application à la détection des exoplanètes.

1.4. Conclusion sur les objectifs et les pistes suivies

Nous détaillons maintenant le plan de la suite de ce manuscrit, en résumant les contributions apportées dans chaque axe de recherche et en y associant les publications scientifiques relatives. 1.4.2 Plan du manuscrit et contributions

Ce manuscrit sera composé, après ce chapitre introductif, de trois chapitres. Les Chapitres2

et 3 exposent les résultats des recherches menées dans les deux axes de recherche décrits pré- cédemment pour la résolution des problèmes d’APNL. Le Chapitre 4 s’attèle à une application concrète de ces travaux : la détection d’exoplanètes par la méthode des vitesses radiales. Nous décrivons plus en détails le contenu de ces chapitres dans les paragraphes suivants.

Le Chapitre 2, intitulé « Interpolation de dictionnaire et reformulation MIP », s’attaque à la reformulation en problème d’APL sous contraintes du problème d’APNL grâce au principe de l’interpolation de dictionnaire. Nous commençons par étudier les travaux existant, tant sur le plan des approximations permettant d’obtenir le dictionnaire interpolé, que sur les méthodes de résolution du problème d’APL sous contraintes. Cette étude nous a révélé que le principe d’interpolation de dictionnaire n’avait pas de cadre « clair » ; nous avons donc commencé par le clarifier comme un problème d’optimisation convexe sous contraintes. Nos deux contributions majeures consistent en (i) une étude plus aboutie des différentes approximations de la littéra- ture ayant permis à des corrections pour l’interpolation polaire proposée par [ETS11] et étendue par [FDJ15] et à une revalorisation de l’approximation par K-SVD proposée par [KYHP14] grâce à une étude théorique plus poussée ; (ii) la résolution du problème d’APL sous contraintes en prenant en compte de façon exacte la parcimonie, grâce à l’introduction des variables bi- naires permettant une reformulation en Mixed Integer Program. Cette dernière contribution a fait l’objet de l’article de conférence [BC18], comparant la résolution d’APL sous contraintes avec pénalisation `1 et avec contrainte `0, pour des problèmes de déconvolution impulsionnelle. Le Chapitre3, intitulé «Modèle Bernoulli-Gaussien étendu et échantillonnage stochastique», rapporte nos travaux sur l’échantillonnage stochastique de la loi a posteriori du modèle Bernoulli- Gaussien étendu proposé par [BC06]. Après une étude rapide du modèle Bernoulli-Gaussien classique dans un cadre d’échantillonnage stochastique, nous revenons d’abord sur des travaux antérieurs à cette thèse permettant de valider en pratique la démarche d’échantillonnage hy- bride proposée par [BC06]. Les contributions de nos travaux se trouvent à la fois dans le cadre supervisé et non supervisé. Dans le cadre supervisé, nous proposons un échantillonnage de la loi a posteriori p(q, ν | y) marginalisée suivant les amplitudes x, accélérant la convergence de l’échantillonnage et assurant un meilleur « mélange » des échantillons. Dans le cadre non su- pervisé, l’échantillonnage direct des hyperparamètres de variances suivant leur loi a posteriori conditionnelle marginalisée en x n’est plus possible, mais nous montrons qu’un échantillonneur de type Partially Collapsed Gibbs Sampler (PCGS) [vDP08] de la loi jointe p(q, ν, x, θ | y) per- met d’exploiter l’échantillonnage suivant la loi marginale des paramètres d’intérêt : la séquence de Bernoulli q et les paramètres non linéaires ν. Ces contributions ont été publiées dans l’ar- ticle de conférence [BCBB16], où l’échantillonnage du modèle BGE est appliqué à un problème d’analyse spectrale en échantillonnage irrégulier.

Dans un souci d’uniformisation, les méthodes développées dans ces deux chapitres sont tes- tées sur les mêmes données : ce sont des signaux simulés pour des problèmes de déconvolution impulsionnelle (données de [BC18]) et d’analyse spectrale en échantillonnage irrégulier (données de [BCBB16]). Ces données sont décrites dans la section suivante, à laquelle on se référera au cours de ces deux chapitres. Notons que nous avons publié, au début de nos recherches sur

Chapitre 1. Introduction

l’interpolation de dictionnaire, une première comparaison des deux approches dans l’article de conférence [BC17], sur les données d’analyse spectrale en échantillonnage irrégulier. Plus pré- cisément, les résultats obtenus dans [BCBB16] sont comparés à ceux obtenus en appliquant directement la méthode de relaxation `1 pour la résolution du problème d’APL sous contraintes

proposées par [FDJ15]. Le Chapitre 2complète donc cette étude préliminaire, en exploitant nos contributions pour ce problème d’analyse spectrale. Cependant, malgré les améliorations que nous avons apportées au concept de l’interpolation de dictionnaire, le modèle BGE semble plus adapté au problème de la détection des exoplanètes.

Le Chapitre4, intitulé «Application à la détection d’exoplanètes», exploite nos travaux sur l’estimation des paramètres du modèle BGE pour un problème d’actualité en astrophysique : la détection d’exoplanètes par la méthode des vitesses radiales, qui est un cas particulier d’analyse spectrale en échantillonnage irrégulier. Une étude de ce problème nous permettra de mettre en exergue les principaux enjeux visés par les astrophysiciens : l’estimation du nombre d’exopla- nètes et la prise en compte de l’activité stellaire. Nous pourrons alors montrer que notre modèle BGE et l’algorithme d’échantillonnage associé s’adaptent particulièrement bien à ce problème de détection et sont une excellente alternative aux méthodes actuellement utilisées par les astro- physiciens pour répondre à ces enjeux. Nous testerons d’abord notre méthode sur des données simulées sans activité stellaire afin de montrer son efficacité vis-à-vis d’autres méthodes. Elle sera ensuite testée sur des données simulées avec activité stellaire issues de l’article [NFB+18] et enfin sur des données réelles.

Avant d’entrer dans le vif du sujet, nous présentons dans la section suivante les données tests utilisées dans les Chapitres 2 et3.