• Aucun résultat trouvé

param`etre de dilatation introduit dans la section 2.2.5 et B est un param`etre d’amplitude constant dans la fonction de corr´elation.

Ces simulations vont nous permettre d’obtenir une matrice de covariance r´ealiste Cθ pour ˆξ en

fonction de θ. On va d’abord v´erifier l’absence de biais dans l’estimateur de Landy-Szalay et pour diff´erents mod`eles cosmologiques utilis´ees dans les simulations. On va ´egalement v´erifier la validit´e de l’hypoth`ese de Gaussianit´e sur ˆξ. Il ne restera donc qu’`a ´etudier la validit´e de l’approximation de Cθ

par une matrice constante C dans les hypoth`esesH0et H1 de la m´ethode classique.

En consid´erant des hypoth`eses avec une matrice de covariance constante C, on verra que la m´ethode classique du χ2 donne effectivement une bonne approximation de la vraie significativit´e. Toutefois

lorsque l’on va consid´erer des hypoth`eses avec la matrice de covariance Cθ de nos simulations, on

verra que la m´ethode classique du χ2 donne des significativit´es grossi`erement incorrectes. Cela va

notamment montrer que l’approximation de Cθ par une matrice constante C fausse grandement la

proc´edure de d´etection des BAOs.

On proposera une nouvelle m´ethode qui permet d’obtenir des significativit´es rigoureuses, mˆeme dans le cas d’hypoth`eses r´ealistes avec la matrice Cθ, et qui utilise une statistique ∆l donnant de

meilleures significativit´es dans ce cas.

5.2

M´ethode classique pour la d´etection des BAOs

La m´ethode standard pour d´etecter les BAOs est bas´ee sur la statistique du χ2. A la diff´erence

des m´ethodes bas´ees sur les ondelettes, cette m´ethode est tr`es d´ependante du mod`ele, et elle est donc surtout utile quand tous les effets intervenant dans la fonction de corr´elation sont bien compris et mod´elis´es.

5.2.1

La statistique du χ

2

Pour une fonction de corr´elation estim´ee ˆξ ∼N (ξm, C) de dimension n, la statistique du χ2s’´ecrit :

χ2 = D ˆξ− ξm, C−1( ˆξ− ξm) E (5.13) = X 1≤i,j≤n h ˆξ(ri)− ξm(ri)i Ci,j−1h ˆξ(rj)− ξm(rj) i (5.14)

En supposant que le mod`ele est correct (i.e. ˆξ ∼N (ξm, C)), la statistique du χ2 suit une loi χ2n,

i.e. une loi du χ2 `a n degr´es de libert´e. La loi χ2

n peut s’interpr´eter comme celle qui est suivie par

le carr´e de n variables Gaussiennes centr´ees r´eduites. Ainsi si X1, . . ., Xn sont de telles variables

ind´ependantes, alorsPn

k=1Xk2 suit une loi χ2n.

5.2.2

La m´ethode du χ

2

pour la d´etection des BAOs

Montrons comment fonctionne la proc´edure qui est utilis´ee classiquement pour la d´etection des BAOs. On note θ = (θ1, . . . , θk)∈ Θ les param`etres dont d´ependent les fonctions de corr´elation avec

et sans BAOs, ξBAO,θ et ξnoBAO,θ. Les hypoth`eses sont donn´ees par :

H0 : ∃ θ ∈ Θ t.q. ˆξ ∼N (ξnoBAO,θ, C)

H1 : ∃ θ ∈ Θ t.q. ˆξ ∼N (ξBAO,θ, C)

La m´ethode du χ2teste des hypoth`eses avec une matrice de covariance constante C. Les param`etres

de θ ne repr´esentent pas directement les param`etres cosmologiques usuels mais ils leur sont li´es. Par exemple dansEisenstein et al.(2005), ils sont donn´es par un param`etre de dilatation α (pour mod´eliser l’effet d’une cosmologie fiducielle pour convertir les redshift en distances), un param`etre d’amplitude B = b2(pour mod´eliser l’effet du biais des galaxies par rapport `a la mati`ere, des redshift distortions, et

pour le normalisation du spectre de puissance σ8), et le param`etre ωm= Ωmh2(qui d´etermine l’´echelle

de l’horizon `a l’´epoque de l’´egalit´e mati`ere-radiation, l’amplitude du pic BAO et plus mod´er´ement la position du pic). D’autres param`etres ont aussi un impact sur la vraie fonction de corr´elation (ωb = Ωbh2 et l’indice spectral n), mais ils sont mieux contraints pas les mesures sur le CMB et on

de corr´elation est affine (voir annexe B.2) .

Ce r´esultat peut ˆetre utilis´e avec minθχ2BAO,θ pour v´erifier que la mesure est compatible avecH1.

Plus pr´ecis´ement, on peut tester si minθχ2BAO,θ est compatible avec la distribution χ2n−k suivie par

cette variable siH1 est vraie :

min

θ χ

2

BAO,θ∼ χ2n−k siH1est vraie (5.17)

Pour rejeter l’hypoth`ese H0, la proc´edure habituelle est plus complexe. Pour comprendre cette

proc´edure, on doit ajouter un param`etre artificiel dans le fit, afin de r´eunir les 2 classes de mod`eles. Par exemple ce param`etre, que l’on va nommer β, peut ˆetre une pond´eration de ξBAO,θ et ξnoBAO,θ

dans le mod`ele de fonction de corr´elation :

ξβ,θ= β ξBAO,θ+ (1− β) ξnoBAO,θ (5.18)

Sous H0, la vraie fonction de corr´elation (l’esp´erance de la fonction de corr´elation mesur´ee E[ˆξ]

s’il n’y a pas de biais) est de la forme ξnoBAO,θ pour la vrai valeur du param`etre θ = θ0. Mais elle

est ´egalement de la forme ξβ,θ avec β = 0 et θ = θ0. Ainsi le meilleur fit χ2 dans la classe non-BAO

suit une loi χ2

n−k, et le meilleur fit χ2 dans la classe ´etendue suit une loi χ2n−(k+1)(puisque β est un

param`etre additionnel).

On est dans le cas de 2 classes de mod`eles imbriqu´ees, qui contiennent toutes les 2 le vrai mod`ele. Dans ce cas la diff´erence entre les valeurs de meilleur fit suit une loi du chi-carr´e avec un nombre de degr´e de libert´e ´egal `a la diff´erence du nombre de param`etres entre les 2 classes. A nouveau ce r´esultat n’est pas rigoureusement valide dans le cas g´en´eral, mais seulement si les espaces des mod`eles de fonctions de corr´elation sont affines (voir annexe B.2).

Ici il n’y a qu’un param`etre additionnel, β, dans la classe ´etendue. Ainsi la diff´erence des meilleurs fit du χ2suit une loi χ2

1 : ∆χ2global= min θ χ 2 noBAO,θ− min β,θ χ 2 β,θ∼ χ21 (5.19)

Ceci montre qu’ajouter un param`etre additionnel, qui n’est pas requis par le vrai mod`ele, ne fait que d´ecroˆıtre mod´er´ement la valeur du meilleur fit. Pour rejeter H0, on peut regarder la diff´erence

∆χ2

global et calculer la probabilit´e d’obtenir une telle valeur sousH0, i.e. pour une loi χ21.

En pratique, le meilleur fit dans la classe ´etendue est remplac´ee par le meilleur fit dans la classe BAO (i.e. en restreignant `a β = 1) :

∆χ2= min θ χ 2 noBAO,θ− min θ χ 2 BAO,θ (5.20)

Cette diff´erence ∆χ2 est n´ecessairement inf´erieure `a ∆χ2

global de l’´equation (5.19), qui suit une loi

χ2

1 sousH0. En effet on a minθχ2BAO,θ≥ minβ,θχ2β,θet donc ∆χ2≤ ∆χ2global.

Ainsi pour une r´ealisation avec une valeur donn´ee ∆χ2= x, on a :

P (∆χ2> x| H0)≤ P (∆χ2global> x| H0) (5.21)

3. Rappelons que la fonction de corr´elation mesur´ee ˆξ et la fonction de corr´elation th´eorique ξm(θ) sont des vecteurs n-dimensionnels, i.e. sont des versions discr´etis´ees de leur ´equivalent continu. Donc l’ensemble des mod`eles de corr´elation (ξm(θ))θ∈Θconstitue un sous-espace de Rn, qui a doit ˆetre un espace affine de dimension k pour que le r´esultat mentionn´e soit valide.

5.2 M´ethode classique pour la d´etection des BAOs 93

Une loi χ2

1 est simplement la loi suivie par la carr´e d’une variable normale centr´ee r´eduite. Si l’on

note Φ la fonction cumulative d’une fonction Gaussienne centr´ee r´eduite, comme ∆χ2global ∼ χ21, on

obtient pour x≥ 0 :

P (∆χ2> x| H0)≤ P (∆χglobal2 > x| H0) = 2Φ(−√x) (5.22)

ce qui correspond `a un nombre de σ ´egal `a√x pour une loi normale. Ainsi, quand ∆χ2≥ 0, on peut

´evaluer la significativit´e de la d´etection des BAOs commep∆χ2.σ.

Dans Eisenstein et al. (2005) cette statistique est ´egale `a ∆χ2 = 11.7, ce qui correspond `a une

d´etection `a 3.4σ avec cette m´ethode. DansPercival et al. (2010) elle est ´egale `a ∆χ2= 13.1, corres- pondant `a une d´etection `a 3.6σ.

A cause de l’in´egalit´e dans l’´equation (B.12) la m´ethode peut sembler conservatrice. Cependant comme les hypoth`ese de la m´ethode ne sont pas v´erifi´ees, on verra dans la section 5.5.1 que la m´ethode peut en fait surestimer la significativit´e.

5.2.3

Limitations de la m´ethode du χ

2

Le lemme de Neyman-Pearson indique que lorsque l’on effectue un test d’hypoth`eses entre H0 et

H1, le test le plus puissant est bas´e sur le rapport de vraisemblance :

Λ( ˆξ) = LH0( ˆξ)

LH1( ˆξ)

(5.23) Plus pr´ecis´ement, le test le plus puissant de taille α est le suivant :

– si Λ( ˆξ)≤ η alors accepter H1(i.e. rejeterH0)

– si Λ( ˆξ) > η alors accepterH0(i.e. rejeterH1)

avec α la probabilit´e de rejeterH0 siH0 est vraie (risque de premi`ere esp`ece) :

α = PΛ( ˆξ)≤ η | H0



(5.24) La puissance du test est d´efinie comme la probabilit´e d’accepter H1 si cette hypoth`ese est vraie.

Elle est ´egale `a 1−β, avec β la probabilit´e de rejeter H1si cette hypoth`ese est vraie (risque de seconde

esp`ece) :

β = PΛ( ˆξ) > η| H1



(5.25) Comme on l’a vu dans la section 5.1.1, les tests avec des niveaux de seuil pr´ed´efinis sont peu utilis´es en cosmologie, et il est plus commun de citer le niveau de significativit´e correspondant `a la valeur obtenue pour la statistique. Pour une r´ealisation avec une valeur donn´ee Λ(ˆξ) = x, la significativit´e (donn´ee comme une valeur p) est ´egale `a :

α(x) = PΛ( ˆξ)≤ x | H0



(5.26) Comme on le montre en annexe B.3, le lemme de Neyman-Pearson implique que l’esp´erance de la significativit´e obtenue de cette mani`ere sousH1, est meilleure avec Λ( ˆξ) qu’avec n’importe quelle autre

statistique. Plus pr´ecis´ement, sousH1, l’esp´erance de la valeur p de l’´equation (5.26) est plus petite

et l’esp´erance du nombre de σ est plus grand pour Λ( ˆξ) que pour n’importe quelle autre statistique. Il faut noter que la statistique Λ( ˆξ) est optimale dans ce sens, mais on doit connaˆıtre sa distribution sousH0(pour calculer la significativit´e α(x) correspondant `a une r´ealisation Λ( ˆξ) = x). De plus dans

le cas d’hypoth`eses composites, la significativit´e n’est pas bien d´efinie. L’avantage de la statistique

∆χ2global est que sa distribution est identique pour tous les mod`eles inclus dansH0 (une distribution

χ2

1). Dans ce cas on est capable de donner une significativit´e mˆeme pour des hypoth`eses composites.

Toutefois comme on l’a vu plus haut, ce r´esultat n´ecessite que les espaces des mod`eles des fonctions de corr´elation soient affines. Comme cela n’a pas de raison d’ˆetre v´erifi´e en pratique, on verra avec des simulations dans la section 5.5.1 que la loi de ∆χ2

global est tr`es diff´erente d’une loi χ21. Le fait que la

m´ethode du χ2 utilise la statistique ∆χ2 et non ∆χ2

global va toutefois compenser cette erreur comme

en premi`ere approximation d’un facteur multiplicatif B dans la matrice de covariance :

CBAO,θ = CnoBAO,θ ∝ B2C (5.27)

Dans la m´ethode du χ2classique, χ2

BAO,θet χ2noBAO,θ sont calcul´es avec une matrice de covariance

constante C. Ainsi pour une r´ealisation B0ξ avec Aˆ ≥ 0, on obtient le meilleur fit BAO :

min θ χ 2 BAO,θ(B0ξ)ˆ = min θ D B0ξˆ− ξBAO,θ, C−1(B0ξˆ− ξBAO,θ) E = B02min θ  ˆ ξ−B1 0 ξBAO,θ, C−1  ˆ ξ−B1 0 ξBAO,θ  = B02min θ χ 2 BAO,θ( ˆξ) (5.28)

La derni`ere ´egalit´e vient du rˆole de B, qui permet n’importe quelle normalisation positive du mod`ele. Le mˆeme raisonnement peut ˆetre appliqu´e pour minθχ2noBAO,θ qui est multipli´e par B02, et

donc la statistique ∆χ2 est aussi multipli´ee par B2 0.

Avec les hypoth`eses o`u la matrice de covariance varie comme B2, des r´ealisations de

H0 avec

θ = (ωm, α, B2) peuvent ˆetre obtenues `a partir de r´ealisations de H0 avec θ = (ωmh2, α, B1) avec

une multiplication par B2/B1. Ainsi il y a une dilatation d’un facteur (B2/B1)2de la distribution de

∆χ2 entre les 2 mod`eles. Cela cr´ee de grandes diff´erences entre les 2 mod`eles dans H

0, de sorte que

la significativit´e donn´ee par la m´ethode classique du χ2 est fausse. La conclusion est que la m´ethode

classique du χ2ne peut pas ˆetre utilis´ee dans le cas d’une matrice de covariance d´ependant du mod`ele.