• Aucun résultat trouvé

Retour sur la motivation physique

F. 3.1 –Exemples de spectres de puis- sance CX

ℓ,2 ≤ ℓ ≤ 2000, pour différents

modèles cosmologiques5. [image : Smoot]

Maintenant que nous avons défini le spectre de puissance, revenons sur l’intérêt physique de son estimation, ébau- ché dans le Chapitre 1. Ce sont les progrès dans son es- timation qui ont permis les avancées les plus importantes en cosmologie. La raison en est que le spectre est une fonction des paramètres cosmologiques qui, même si elle n’est pas connue analytiquement, peut être calculée nu- mériquement. De nombreuses méthodes, comme CMB- FAST [130] ou CAMB [101] résolvent numériquement les équations déterminant le spectre avec précision et ra- pidité (permettant leur utilisation dans des procédures de Monte Carlo).

La connaissance du spectre permet tout d’abord de dé-

partager différentes classes de modèles cosmologiques (voir la figure 3.2 – le modèle favorisé par les 4 Pour reprendre quelques exemples déjà évoqués : ℓ

max = 2 dans les années 1970 ; ℓmax = 30 pour COBE (1992) ;

ℓmax=700 pour ARCHEOPS (2002) ; ℓmax=1000 pour WMAP (2003) ; ℓmax=2000 attendu pour PLANCK ; ℓmax=3500

attendu pour QUIET.

5Suivant la tradition, ce sont les fonctions ℓ 7→ ℓ(ℓ+1)

observations actuelles étant le modèle ΛCDM6). Ensuite, pour un modèle donné, le spectre permet

d’en estimer les paramètres.

F. 3.2 –Exemples de spectres de puis- sance CX

ℓ,2 ≤ ℓ ≤ 2000, pour différentes

valeurs de certains paramètres cosmolo- giques5. [image : White]

La figure 3.2 illustre la dépendance du spectre de puis- sance en fonction des paramètres cosmologiques du mo- dèle ΛCDM. La caractéristique principale de ces spectres est la présence de pics, qui représentent, comme expli- qué dans la section 1.2, les échelles spatiales dont les os- cillations ont connu un nombre entier de demi-périodes. Le premier pic correspond à la fréquence spatiale fon- damentale des oscillations (c’est-à-dire à l’échelle pour laquelle une seule compression s’est produite jusqu’au découplage), et les pics suivants aux harmoniques (pour lesquels il y a eu une succession de compressions – dé- compressions).

Intuitivement, la hauteur du premier pic est déterminée, entre autres, par la densité de matière, une plus grande densité augmentant l’amplitude de la compression. Autre exemple, l’évolution de la proportion de matière dans le temps peut rendre les oscillations asymétriques : si par exemple la compression devient plus importante que la décompression, les pics impairs gagnent en hauteur par rapport aux pics pairs.

Données manquantes et bruitées

Comme on le voit, l’estimation du spectre de puissance peut apporter des informations précieuses. Dans le cas

idéal de l’observation de X(ξ), ξ ∈ S2, sous l’hypothèse gaussienne, la Proposition 3.1 justifie l’utili-

sation du simple spectre empirique, basé sur les coefficients de Fourier aX

ℓ,m. Mais les données man-

quantes ou masquées, ainsi que la présence de bruit compliquent l’estimation. Principalement, les données manquantes biaisent tous les coefficients de Fourier et les corrèlent, ce qui rend inutilisable en l’état le spectre empirique eCℓ(Y).

Considérons le modèle bruité et masqué suivant (le masque W et le niveau de bruit σ sont supposés connus) : Yp =Wp  X(ξp) + σpUp  , 1 ≤ p ≤ Npix (3.5)

Deux classes d’estimateurs sont utilisés en pratique pour estimer le spectre CX := CX ℓ



ℓ∈N dans le

modèle (3.5) : le maximum de vraisemblance dans le domaine direct et la déconvolution du spectre empirique (avec au préalable une pondération des données). Notons Y := (Y1, . . . ,YNpix).

Proposition 3.2. Dans le modèle (3.5), si X est gaussien, Up i.i.d.∼ N(0, 1) et Wp = I(p ∈ P), la

6ΛCDM pour “Λ and Cold Dark Matter”, c’est-à-dire avec de la matière noire froide et une constante cosmologique

vraisemblance du spectre est L(CX|Y) =  (2π)Nepix|K|− 1 2 exp 1 2eY TK−1eY ! ,

où Kp,q:= P∞ℓ=0CℓXLℓ(ξp· ξq) + σ2pδp,q, p, q ∈ P, eNpix:= ♯P et eY est le vecteur formé des éléments de

Y dont les indices sont dans P (sans perte de généralité, on peut supposer avoir ordonné les points de sorte que P = {1, . . . , eNpix}).

L’inconvénient pratique est que cette méthode nécessite l’inversion de K, de taille eNpix× eNpix. Ceci

n’est donc réalisable en pratique que jusqu’à des tailles eNpixde quelques milliers, ce qui ne permet que

l’estimation des fréquences spatiales inférieures à quelques dizaines. L’estimation du spectre à partir des données de COBE a pu être réalisée de cette façon, et il est toujours possible, pour des cartes de grande taille, de calculer l’estimateur bCDML(Y) maximisant la vraisemblance de cartes dégradées

(c’est-à-dire projetées sur un moindre nombre de pixels). Les possibilités d’implémentation de telles méthodes, ou de méthodes approchant le maximum de vraisemblance ont été largement débattues (voir par exemple [137, 58]), mais leur complexité reste de l’ordre de eN3

pix. Elles ne permettent donc

pas l’estimation de CX

ℓ au-delà de ℓ ≃ 60 (avec les calculateurs actuels).

Une autre approche consiste à débiaiser et déconvoluer, dans le domaine de Fourier, le spectre empi- rique. Cette approche, appelée dans la littérature astrophysique le “pseudo-Cℓ”, est efficace en pratique

mais n’a reçu que peu de traitement statistique rigoureux.

Hypothèse 3.1. – X est band-limited (en moyenne quadratique), avec∀ℓ > ℓmax, aℓ,mX =0

– (ξp, λp)p∈{1,...,Npix}assure une cubature à l’ordre2ℓmax.

Définition 3.2. Pour un Npix-uplet(x1, . . . ,xNpix), on note – aℓ,m(x) := PNp=1pixλpxpYℓ,m(ξp)

– eCℓ(x) := (2ℓ + 1)−1Pℓm=−ℓ|aℓ,m(x)|2

Remarquons que sous l’Hypothèse 3.1, si xp= X(ξp), alors aℓ,m(x) = aℓ,mX .

Proposition 3.3. Sous l’Hypothèse 3.1, si Y = (Y1, . . . ,YNpix) suit le modèle (3.5), alors E eCℓ(Y) = Xℓmax ℓ′=0Wℓ,ℓ′(W)C X ℓ′+Nℓ(Wσ) (3.6) où Wℓ,ℓ′(W) := Npix X p=1 λpWp ℓ X m,m′=−ℓ Yℓ,m(ξp)Yℓ,m′(ξp) (3.7) et Nℓ(V) := E (2ℓ + 1)−1 ℓ X m=−ℓ Npix X p=1 λpVpUpYℓ,m(ξp) 2 . (3.8)

La matrice W(W) est dite de couplage. Dans le cas où les variables Upsont i.i.d., le biais dû au bruit

s’exprime plus simplement :

Nℓ(Wσ) = (4π)−1 Npix X

p=1

Compte tenu du fait que l’égalité (3.6) reste valable si les observations Yp ont été préalablement

pondérées par des poids Vp (c’est-à-dire en remplaçant Y par VY et W par VW), on déduit de la

proposition 3.3 une classe d’estimateurs non biaisés de CX :

Définition 3.3. Soit, pour une pondération V et un masque W tels que l’inversion matricielle soit possible, l’estimateur b CPCL ℓ (Y, V) :=  [W(VW)]−1C(VY)e  ℓ− Nℓ(VWσ) (3.9)

où W et Nℓsont définis par les équations(3.7) et (3.8) respectivement (“PCL” est mis pour “pseudo-

Cℓ”).

Des choix de V utilisés en pratique (par exemple pour estimer le spectre à partir des données WMAP [87]) sont V(1)p ≡ 1 ; V(2)p =σ−2p ou encore V(3)p =



σ2p+4πPk=1Npixλkσ−2k

−1−1

.

Efstathiou [74] montre, dans le cas gaussien, que bCPCL (Y, V(1)) est asymptotiquement de variance

minimale quand σ → 0 et que bCPCL

ℓ (Y, V(2)) l’est asymptotiquement quand σ → ∞, et il ajoute :

“mais dans le régime intermédiaire il est difficile de trouver la façon de pondérer les données [... En effet] dans le domaine de Fourier, S [la matrice de covariance de X, en l’occurrence de aX

ℓ,m] est creuse alors que N [celle

du bruit] ne l’est pas ; à l’inverse dans le domaine direct on peut supposer que N est creuse mais S ne l’est pas”. L’auteur propose également une stratégie pour réaliser une transition entre bCDML(Y) et bCPCL

ℓ (Y, V(1)).

L’estimateur bCPCL

ℓ (Y, V(3)) est une façon heuristique de réaliser une transition entre les deux régimes

V(1)et V(2). Dans notre cas, CX

ℓ→∞−→ 0 donc l’asymptotique de bruit faible est éventuellement valide

pour les faibles fréquences ℓ tandis que l’asymptotique de bruit fort l’est pour les grandes valeurs de ℓ. En pratique, les fréquences limites auxquelles il vaut mieux passer d’un estimateur à l’autre sont es- timées par des simulations de Monte Carlo. Par exemple, dans le traitement des données WMAP [87], les transitions entre les estimateurs bCDML(Y), bCPCL

ℓ (Y, V(1)), bCℓPCL(Y, V(2)) et bCℓPCL(Y, V(3)) sont res-

pectivement réalisées à ℓ = 30, ℓ = 200 et ℓ = 450.

Bruit de niveau inconnu et inter-spectres

Jusqu’ici les fonctions W et σ ont été supposées connues. Pour W, cela est réaliste car il s’agit d’un masque choisi. Par contre, le bruit n’est d’une part pas réellement i.i.d. et d’autre part pas nécessaire- ment bien spécifié. Une façon de faire face à cette difficulté est d’utiliser, quand cela est possible, la redondance des observations. Pour cela, généralisons la définition 3.1 à l’inter-spectre empirique : Définition 3.4. Soient deux champs sphériques X et X′. L’inter-spectre empirique entre X et X′est la suiteCeℓ(X, X′)  ℓ∈Noù e Cℓ(X, X′) := (2ℓ + 1)−1 Xℓ m=−ℓa X ℓ,m  aXℓ,m′ ∗ . (3.10) Ainsi, eCℓ(X) = eCℓ(X, X).

Considérons alors le modèle suivant, qui généralise celui de l’équation (3.5) : Yp,d=Wp



X(ξp) + σp,dUp,d



où Ndet>1 est le nombre de détecteurs. Définissons l’estimateur suivant qui, contrairement à celui de

la Définition 3.3, ne nécessite pas la connaissance du niveau de bruit.

Définition 3.5. Définissons Yd := (Y1,d, . . . ,YNpix,d) et, pour une pondération V telle que l’inversion matricielle soit possible, l’estimateur

b CCS (Yd,Yd′,V) :=  [W(VW)]−1C(VYe d,VYd′)  ℓ

(où “CS” est mis pour “cross-spectrum”).

Proposition 3.4. Dans le modèle (3.11), si les vecteurs Ud := (U1,d, . . . ,UNpix,d) sont indépendants de X et indépendants 2 à 2 (i.e. les bruits de deux détecteurs différents sont indépendants), alors

b CCS

ℓ (Yd,Yd′,V) est un estimateur non biaisé de CXℓ.

Dans le cas où, dans (3.11) il n’y a pas de masque (W ≡ 1), X et U sont gaussiens et où le bruit est stationnaire, Polenta et al. [122] ont montré que la variance de l’estimateur

2 Ndet(Ndet− 1) X 1≤d<d′≤Ndet b CCS (Yd,Yd′,V(1)) (3.12) est toujours supérieure à celle de l’estimateur

1 Ndet Ndet X d=1 b CPCL(Yd,V(1)) , (3.13)

ce dernier supposant en revanche Nℓconnu. Les auteurs proposent un test de la spécification du bruit,

basé sur la comparaison de ces deux estimateurs, de façon à décider entre l’utilisation de l’estima- teur (3.13), plus efficace si le bruit est connu, et celle de l’estimateur (3.12), robuste.

Remarques

Parmi les autres méthodes d’estimation, citons :

– Des méthodes bayésiennes explorant la loi jointe a posteriori du spectre par des simulations MCMC [77, 92].

– Des méthodes “multitaper” utilisant plusieurs fenêtres de pondérations de Y et moyennant les spectres empiriques correspondant. Dans le cas d’une observation masquée avec un bruit station- naire, on peut [51, 182] ne pas chercher à déconvoluer le spectre empirique comme dans (3.9) mais à rendre les matrices W aussi diagonales que possible en choisissant pour V l’équivalent sphérique des suites de Slepian (“discrete prolate spheroidal functions”). Les suites de spectres empiriques sont ensuite moyennées de façon à minimiser la variance de l’estimateur final.

– Une fois données les valeurs d’un vecteur bCℓ, 1 ≤ ℓ ≤ ℓmax, estimant CX, une régression non-

paramétrique de CX a été proposée [110, 159], selon le modèle bC

ℓ = f(ℓ/ℓmax) + εℓ, 1 ≤ ℓ ≤ ℓmax,

ε ∼ N(0, Σ). Des ensembles de confiance asymptotiques pour des fonctionnelles de f (i.e. de CX) sont calculés pour ℓmax→ ∞.

Terminons cet aperçu des méthodes d’estimation spectrale par deux remarques. Premièrement, la plu- part de ces méthodes reposent sur l’hypothèse de gaussianité de X, ce qui est l’hypothèse physique privilégiée actuellement. Cependant, si celle-ci n’était pas vérifiée, Baldi et Marinucci [153] ont mon- tré que les coefficients aX

F. 3.3 –Exemples de résultats d’estimation spectrale publiés récemment. Les spectres estimés à partir de dif- férentes expériences sont en couleurs différentes, avec des barres d’erreur indiquant les intervalles de confiance à 68%. Le spectre paramétrique résultant de l’estimation des paramètres cosmologiques à partir de ces différents spectres est ajouté en trait plein. La figure de droite correspond au spectre du mode dit E de la polarisation du CMB. [images, de gauche à droite : Hinshaw et al. 2003 [87] ; Reichardt et al. 2008 [124] ; Samtleben 2008]

Deuxièmement, la présentation faite ci-dessus de ces méthodes n’a fait intervenir que des versions très simplifiées du modèle d’observations (3.4). L’utilisation jointe de plusieurs observations, pour- tant intuitivement pertinente, n’a été utilisée qu’à travers les inter-spectres (Définition 3.5). Bien sûr, l’information jointe de plusieurs expériences, via leurs spectres estimés respectifs, est utilisée pour estimer les paramètres cosmologiques, qui en retour fournissent un spectre estimé paramétrique. Mais il semble qu’aucune estimation de CX basée sur plusieurs expériences (avec des niveaux de bruits,

des beams et des masques différents) sans passer par les paramètres cosmologiques n’ait été présentée avant celle du Chapitre 6. De ce fait, les résultats de plusieurs expériences sont systématiquement présentés comme les exemples de la figure 3.3.

Documents relatifs