• Aucun résultat trouvé

Outils d’inpainting local de la sphère

7.2.1 Problématique

Les zones du ciel dans lesquelles le signal n’a pas été observé ou n’a pas pû être estimé, ou celles pour lesquelles la contamination par des composantes astrophysiques autres que la composante étudiée est trop importante, doivent être masquées. Il n’est pas toujours possible de traiter sim-plement l’effet d’un masque dans l’analyse des données. Il existe deux méthodes principales. La première consiste à développer une méthode d’analyse capable de n’utiliser que les pixels valides, la seconde méthode implique de remplir l’ensemble des pixels non valides et faire l’analyse comme si on disposait d’une carte entière. Dans le second cas, il est nécessaire d’estimer l’erreur introduite par le masque, afin d’apporter les corrections nécessaires aux mesures. Suivant la méthode choisie pour remplir les pixels masqués et la géométrie du masque, il est parfois possible d’estimer l’er-reur de façon analytique, dans le cas contraire, il est toujours possible d’utiliser des simulations Monte-Carlo.

Il est souvent difficile d’employer la première méthode, parce qu’il n’existe pas toujours d’algo-rithmes permettant de travailler sur un sous ensemble des pixels d’un part mais également parce que même dans les cas où des méthodes existent, elles sont souvent inapplicables aux cas de Planck, pour des raisons pratiques, à cause de la trop grande résolution des cartes qui nécessite généralement des ressources en terme de puissance de calcul et/ou de mémoire non accessible à l’heure actuelle.

Pour l’estimation de l’effet de lentille gravitationnelle, il existe un estimateur de maximum de vraisemblance développé par Hirata & Seljak (2003a) qu’on peut adapter au travail sur un sous

7.2. OUTILS D’INPAINTING LOCAL DE LA SPHÈRE

ensemble des pixels, ce qui permet de s’affranchir des effets d’un masque. Cependant, comme dans beaucoup de cas, il est difficilement envisageable de l’appliquer aux données de Planck car cela nécessite notamment d’inverser une matrice de 50 millions d’éléments de coté. Des tentatives sont toutefois en cours par des méthodes de gradients conjugués. Il existe une méthode d’estimation du spectre de la déflexion basée sur un estimateur quadratique. Cette méthode n’est pas applicable sur un sous ensemble incomplet de données. Dans la procédure d’estimation de l’effet de lentille gravitationnelle, le traitement du masque fait donc parti des effets majeurs à prendre en compte. De notre coté, nous avons alors choisi d’utiliser l’estimateur quadratique de Okamoto et Hu (voir section 6.6) couplé à une méthode permettant de remplir les pixels à masquer, avec une correction par Monte-Carlo.

Différentes méthodes ont été développées pour remplir un masque. L’opération la plus simple consiste certainement à remplacer les pixels masqués par une valeur nulle. C’est la technique utilisée par exemple par MASTER (Hivon et al. (2002)), pour estimer le spectre de puissance des anisotropies du CMB. Afin de minimiser les erreurs introduites par le masque, il est naturel de chercher à remplir les données manquantes par un signal le plus proche possible de l’original.

Ce n’est que récemment, suite aux travaux pionniers de Masnou & Morel (1998), que des méth-odes efficaces, basées sur des développements innovants en traitement d’image, ont été développées. Ces techniques d’analyse d’image, visent à restaurer des portions manquantes d’un signal à partir des données connues. Elles permettent de répondre au problème précédant en imposant des con-traintes fortes pour s’assurer d’influencer le moins possible les mesures. Le principe de base, consiste, par diverses méthodes, a reconstruire un signal dans le masque en forçant ce signal reconstruit à posséder des propriété statistiques les plus proches possibles de celles du signal observé en dehors du masque, possédant également des propriétés de continuité convenables et ne modifiant pas les valeurs hors du masque. Ces méthodes portent le nom générique d’inpainting (qui signifie littéralement en anglais peindre à l’intérieur), qui est issu du nom utilisé par les conservateurs des musées qui restau-raient des toiles, en peignant les parties abîmées. Ce qualificatif pourrait être employé pour désigner l’ensemble des méthodes permettant de remplir un masque. Cependant pour des raisons historiques, seuls les algorithmes essayant de restaurer le signal à l’intérieur de régions masquées sont dénommés

inpainting. Elles ont été développées dans un premier temps pour le traitement d’images planes, à deux dimensions, puis ont été étendues au cas de l’inpainting d’une sphère (voir 8.1.3).

Toutefois, lorsque le masque couvre une trop grande proportion du ciel, ce qui peut être le cas si on utilise un masque galactique restrictif, par exemple, ou encore si la couverture du ciel n’est pas complète, la convergence vers une solution optimale n’est plus toujours assurée. On peut alors parfois observer un biais pour l’estimation de l’effet de lentille gravitationnelle. De plus, tous les algorithmes d’inpainting de la sphère sont des méthodes globales prenant en compte l’ensemble des informations sur tout le ciel non masqué. Un des avantages de la méthode d’analyse des données par patchs est d’étudier les propriétés du signal localement sur des portions restreintes du ciel afin de pouvoir mettre en évidence d’éventuelles variations avec la position. Dans cette optique, il est intéressant de pouvoir réaliser un inpainting en n’utilisant que les valeurs locales du patch.

Enfin, il a été montré1 que si on ajoute un masque de sources compactes à un large masque galactique, l’inpainting utilisé sur la sphère (voir section 8.1.3) introduit un biais plus important sur la reconstruction de l’effet de lentille gravitationnelle. La morphologie d’un masque de sources compactes qui sont des sources ponctuelles ou quasi-ponctuelles réparties dans tout le ciel, est très différente de celle d’un masque des émissions galactiques qui sont des émissions diffuses couvrant de larges régions du ciel. La proportion de ciel couverte par un masque galactique est également, en général, bien supérieure à celle d’un masque de sources compactes. Ainsi on comprend que la solution au problème d’inpainting est dominée dans un tel cas par les contraintes imposées par les pixels situés dans le plan galactique et n’est pas nécessairement la meilleure solution pour des pixels du masque de sources compactes.

Pour s’affranchir de ces problèmes, nous avons développé une méthode d’inpainting local par patchs. Elle permet d’inpainter une carte de tout le ciel, morceau par morceau, en n’utilisant que les informations locales. Elle est bien adaptée à l’inpainting des sources compactes qui sont présentes sur tout le ciel mais qui ne couvrent que des petites zones du ciel à la fois. Cette méthode possède toutefois ses limites et n’est pas adaptée à l’inpainting de larges zones comme le plan galactique. L’implémentation que nous avons réalisée tient compte de ces contraintes et laisse intactes les zones

CHAPITRE 7. DÉVELOPPEMENT D’UNE MÉTHODE D’ANALYSE PAR PATCH POUR PLANCK

trop fortement masquées. Elle est par ailleurs très bien adaptée à une analyse par patch car dans ce cas, il est déjà possible de sélectionner des zones particulières du ciel uniquement et de ne pas prendre en compte les zones pour lesquelles la proportion de pixels masqués est trop importante. On peut diviser la procédure en trois étapes principales :

– découpe de la carte à inpainter en patchs – inpainting des patchs

– inpainting de la sphère par reprojection des patchs sur la sphère Dans la suite, nous décrivons les détails de chacune des étapes.

7.2.2 Découpe des patchs

La première étape consiste à découper la sphère en patchs. Les codes d’inpainting dans le plan travaillent sur des images à deux dimensions avec une pixelisation régulière. Nous utilisons donc l’outil développé dans la section 7.1 afin d’obtenir des patchs, dont les pixels tombent sur une grille régulière, à partir des pixels de la sphère. Nous utilisons la méthode d’interpolation bilinéaire pour accélérer la procédure. La découpe doit se faire sans apodisation ni soustraction de la moyenne du patch, car les zones masquées devront être inpaintées puis reprojetées sur la sphère et la modu-lation de l’amplitude avec la position introduite par l’apodisation ou la soustraction d’un offset, produiraient alors de fortes discontinuités lors de la reprojection.

Il est important de respecter certaines contraintes particulières pour le choix de la taille des patchs, de leur nombre de pixels et de leurs centres. Dans le cas général, il faut essayer de choisir des patchs suffisamment larges comparés à la taille des zones à inpainter, pour que l’algorithme d’inpainting puisse converger, tout en conservant une taille raisonnable pour que l’approximation plane soit correcte. Dans la pratique cela correspond à se limiter à des patchs de taille inférieure à une vingtaine de degrés de coté. Nous avons également introduit un paramètre qui fixe un seuil, permettant d’éliminer les patchs dont la proportion de pixels masqués est supérieure au seuil. Une fois la taille des patchs choisie, ce paramètre permet donc de façon simple de s’affranchir des régions où l’inpainting risque de ne pas donner des solutions fiables.

Enfin, à partir des images inpaintées les zones reconstruites sont reprojetées sur la sphère. Comme les pixels HEALPIx ne coïncident pas avec ceux d’un patch, il faut interpoler la grille régulière au point correspondant au centre du pixel à inpainter sur la sphère. Pour cette raison, il faut impérativement choisir une grille suffisamment fine afin de ne pas introduire d’effets indésirables lors de la reprojection. L’idéal étant d’obtenir une densité de pixels sur les patchs comparable à celle de la zone de la sphère découpée. Dans le cas ou la sphère va être utilisée dans la suite pour une analyse par patch, il est assez naturel d’utiliser les mêmes centres et la même taille pour l’inpainting que pour l’analyse qui suit mais ce n’est pas impératif et ce choix doit avant tout être motivé par les contraintes précédentes.

7.2.3 Inpainting local

Les patchs découpés sont ensuite inpaintés. Pour cela, nous utilisons le code FASTLens2développé par Pires et al. (2009). Le problème de l’inpainting consiste à reconstruire des régions manquantes d’une image en exploitant au maximum les informations présentes dans les données valides. La méthode utilisées par FASTLens repose sur l’hypothèse qu’il est possible de décomposer le signal sur un dictionnaire dans lequel la représentation du signal possède une grande parcimonie et celle du masque une parcimonie beaucoup plus faible. Cette hypothèse est généralement favorisée par le fait qu’un signal physique et un masque possèdent des structures morphologiques très différentes et ne sont donc pas aussi facilement représentés sur un dictionnaire donné.

Un dictionnaire, Φ, peut être vu comme une collection de fonctions, par exemple des sinusoïdes si on décompose le signal dans l’espace de Fourier, ou des ondelettes, des curvelettes des ridgelettes... ou encore l’union de plusieurs collections de fonctions. À la différence d’une base, un dictionnaire peut être surcomplet, c’est-à-dire que certains éléments du dictionnaire peuvent être décrits par une combinaison d’autres éléments. Une décomposition sur un dictionnaire n’est donc pas nécessairement unique.

2. Voir le site web http://irfu.cea.fr/Ast/fastlens.software.php

7.2. OUTILS D’INPAINTING LOCAL DE LA SPHÈRE

La parcimonie est liée au nombre de coefficients nécessaires à la représentation d’un signal sur un dictionnaire. Plus ce nombre est faible, plus le signal possède une grande parcimonie. Si on note αΦ

X, les coefficients de la décomposition d’un signal X sur le dictionnaire Φ, une mesure de la parcimonie d’un signal X peut donc être donnée par :

Φ

Xk0 (7.7)

où, kzk0 représente la pseudo norme l0, c’est-à-dire le nombre d’éléments non nuls du vecteur z. Cette définition est difficilement applicable au cas de signaux réels, en présence de bruit notamment, car tous les coefficients de la décomposition peuvent être non nuls. Cependant, si la représentation possède une parcimonie suffisamment élevée, il a été montré dans Donoho & Huo (2001), que la pseudo-norme l0 pouvait être remplacée par la norme convexe l1, c’est-à-dire la somme de la valeur absolue des coefficients de la décomposition (soit pour un vecteur z, kzk1= Pk|zk|).

Si on considère un masque M associé au signal X, le problème de l’inpainting se résume à estimer

X connaissant M et le signal masqué Y = MX. En suivant l’hypothèse énoncée précédemment qui suppose que le signal masqué possède un parcimonie plus grande que le signal d’origine, la solution au problème d’inpainting peut alors se poser sous la forme du problème de minimisation suivant :

min

X Φ

Xk1 (7.8)

soumis à la contrainte

kY − M Xk2≤ σ (7.9)

où la norme kk est la norme l2 usuelle (kzk = Piz2

i) et σ représente la variance du bruit qui doit être donnée en paramètre. Si on utilise la norme l1 comme mesure de la parcimonie, le problème précédant peut être résolu par une méthode de seuillage itératif appelé MCA (voir Elad et al. (2005) ou également Pires et al. (2009) pour l’implémentation). Chaque itération n + 1 peut s’écrire en fonction de l’itération précédente, sous la forme :

Xn+1= ∆Φ,λn(Xn+ M(Y − Xn)) (7.10) où l’opération non linéaire ∆Φ,λn(Z) se décompose en trois étapes :

– décomposition de Z sur le dictionnaire Φ pour obtenir les coefficients αΦ

Z

– effectuer un seuillage des coefficients de la façon suivante ˜αΦ

Z = sin(αΦ

Z)max(0, |αΦ

Z|) − λ. Le paramètre λ diminue à chaque itération, jusqu’à devenir nul. Les détails des différentes stratégies envisageables pour diminuer le seuil peuvent être trouvés dans Pires et al. (2009). – reconstruction du signal ˜Z à partir des coefficients après le seuillage

Le nombre d’itération est choisi en paramètre. La valeur initiale de X est choisie à Y . Dans le cas où on a du bruit dans les données, le seuillage peut-être arrêté en fonction du niveau de bruit. Cependant en général on cherche également à reconstruire le bruit dans le masque afin de conserver des propriété statistiques proches de celles en dehors du masque. Le seuil est donc choisi à 0, ce qui équivaut à imposer une stricte égalité pour la contrainte 7.9 (voir Pires et al. (2009) pour plus de détails).

L’efficacité de l’algorithme dépend du choix de la représentation du signal qui doit posséder la plus grande parcimonie. Tous les dictionnaires ne sont donc pas équivalents. La difficulté de la méthode réside donc en partie dans le choix d’un dictionnaire répondant aux meilleures contraintes de parcimonie. La différence de parcimonie entre le signal masqué et non masqué est assurée dans la plus part des cas car le signal et le masque possèdent généralement des morphologies distinctes. En revanche, la parcimonie du signal non masqué peut dépendre elle fortement du dictionnaire et il est nécessaire de réaliser des tests avant de faire un choix. Comme l’estimation du signal reconstruit repose sur un processus itératif qui nécessite à chaque itération de décomposer le signal de l’itération précédente sur le dictionnaire puis d’effectuer la reconstruction dans l’espace direct du signal estimé à l’itération courante, en général, il est pratique de se limiter à des dictionnaires construits à partir de bases de fonctions pour lesquelles il existe des implémentations des décompositions directes et inverses rapides afin d’accélérer le processus itératif.

Il a été montré par Pires et al. (2009) que pour l’étude de l’effet de lentille gravitationnelle une dé-composition sur une base de cosinus (aussi connue sous le nom de DCT pour le terme anglais Discrete Cosine Transform voir par exemple González & Woods (2002)) permet d’obtenir une représentation

CHAPITRE 7. DÉVELOPPEMENT D’UNE MÉTHODE D’ANALYSE PAR PATCH POUR PLANCK

(a) Carte du CMB originale (b) Carte du CMB masquée (c) Carte du CMB inpainté Figure 7.7 – Inpainting par patch d’une carte de CMB. La figure (a) montre une carte du CMB de

10 degrés de coté, possèdant un bruit et un lobe comparables à ceux des cannaux à 217GHz de l’instrument HFI. Les pixels masqués (en noir sur la figure (b)) sont ensuite inpaintés avec le programme FASTLens. Le masque est issue d’un patch de 10 degré de coté, découpé dans le masque de sources ponctuelles à 217GHz. Il n’est pas possible de distinguer la carte inpainté (figure (c)) de l’originale à l’oeil. L’inpainting introduit cependant un faible effet systématique sur le spectre de deflexion qu’il est possible de corriger par Monte-Carlo.

avec une grande parcimonie. C’est donc l’approche que nous avons utilisée. On peut voir sur la figure 7.7 un exemple de carte du CMB lentillée et inpaintée ainsi que le masque correspondant. Sans connaître le masque il n’est pas possible de retrouver les zones masquées. Cependant, l’algo-rithme d’inpainting n’est pas capable de recréer un effet de lentille gravitationnelle dans les zones masquées. Le spectre estimé à partir de cartes inpaintés possède donc un biais lié à un manque global de puissance. Le manque de puissance est directement proportionnel à la surface masquée et peut donc être corrigé facilement.

7.2.4 Reprojection

L’étape finale de l’inpainting local par patch consiste à reconstruire le signal dans les régions masquées de la sphère à partir des patchs inpaintés. Cette procédure peut être résumée de la façon suivante :

– parcourir l’ensemble des pixels de la sphère et déterminer s’ils doivent être inpaintés en testant la valeur des pixels correspondants du masque

– si un pixel doit être inpainté, chercher les patchs dans lequel il tombe – sélectionner le patch le plus adapté

– déterminer la position projetée du centre du pixel à inpainter, sur le patch sélectionné – interpoler le signal sur le plan à cette position et affecter la valeur obtenue au pixel de la

sphère à inpainter

Il faut noter que dans certains cas, suivant la forme et la taille du masque, il n’existe aucun patch remplissant les conditions nécessaires ce qui empêche d’inpainter certains pixels. Par ailleurs les pixels valides sont inchangés, seuls les pixels masqués sont modifiés.

L’étape la plus délicate est la sélection du meilleur patch à utiliser pour estimer le signal à inpainté d’un pixel donné. Pour cela, dans un premier temps nous recherchons l’ensemble des patchs recouvrant le pixel considéré parmi les paths possédant une fraction de pixels masquée inférieure au seuil défini à l’étape précédente. Comme les patchs peuvent se recouvrir, il y en a généralement plusieurs. Si aucun patch ne vérifie cette condition, il n’est pas possible d’inpainter le pixel, dans le cas contraire, il faut choisir le patch le plus adapté à la reconstruction du signal dans le pixel considéré. On pourrait être tenté de déterminer la valeur du pixel comme la moyenne des valeurs estimées avec chaque patch. Cependant, comme chaque patch couvre une zone du ciel différente, la solution vers laquelle converge l’inpainting est différente dans chaque cas. En effet la solution du problème dans chaque cas ne représente pas une solution intrinsèque. Elle peut être vue comme une réalisation particulière satisfaisant les conditions imposées, qui changent pour chaque patch. En