Déconvolution des données réelles

7.3 Déconvolution de la résolution en énergie : unfolding

7.3.3 Déconvolution des données réelles

7.3.3.1 Estimation de la matrice de réponse de CREAM

Une condition nécessaire pour une bonne déconvolution des incertitudes sur l’énergie reconstruite

est de bien connaître la réponse du calorimètre. Celle-ci est encodée dans la matrice de

convolu-tion[M]. L’estimation de cette matrice est effectuée à partir de la simulation. Puisque la simulation

GEANT3 reproduit plus fidèlement la réponse du calorimètre que la simulation GEANT4, c’est elle

qu’on utilise. La simulation ne donne pas directement accès aux termesm

qui représentent la

pro-babilité qu’un évènement dont l’énergie réelle se trouve dans le binisoit mesuré dans le binj. Elle

nous donne seulement accès à cette probabilité à l’énergie à laquelle sont simulées les particules.

Ces probabilités sont affichées sur la figure 7.6 en haut. Pour construire la matrice complète, il faut

effectuer une interpolation de cette matrice dans l’espace bi-dimensionnel énergie réelle - énergie

dé-posée. Cependant, dans cet espace, l’interpolation est difficile et on va l’effectuer dans un espace qui

s’y prête mieux par le biais d’un changement de variable. Comme on peut le constater sur la figure 7.6

du haut, le logarithme de l’énergie moyenne déposée dans le calorimètre semble varier linéairement

avec le logarithme de l’énergie de la particule incidente et sa variance semble constante en fonction de

l’énergie. Ceci signifie simplement que la résolution relative du calorimètre dépend peu de l’énergie.

Pour profiter au mieux de cette caractéristique on va donc effectuer le changement de variable :

u= ^E

^dep

^{( MeV)}−E

_real

( GeV)

E

_real

( GeV) ^.

Comme on peut le voir sur la figure 7.6 en bas qui représente la variableuen fonction de

l’éner-gie réelle, ce changement de variable permet une paramétrisation puisque sa distribution à énerl’éner-gie

réelle fixée est gaussienne. On ajuste donc la distributionupour chaque énergie par une gaussienne

puis on récupère ses moments d’ordre 1 et 2. Notons que la statistique pour effectuer ces ajustements

est limitée puisque, pour se placer dans les mêmes conditions que les données réelles, on doit utiliser

seulement les évènements qui passent les coupures : il reste alors∼500évènements à chaque énergie.

Les courbes des moments en fonction de l’énergie sont ensuite ajustées afin d’avoir une

paramétrisa-tion de la variableupour toutes les énergies. La paramétrisation de la probabilité deuexprimée en

fonction du logarithme de l’énergie est affichée sur la figure 7.7 en haut. À partir de cette

paramétrisa-tion, on veut repasser dans le plan initialE

dep

(M eV)−E

real

(GeV). Pour cela on utilise la méthode

de la transformée inverse qui relie les densités de probabilité deuet deE

_dep

:

pdf

_E_dep

(E

_dep

) =

1 f

′

(f

−1

(E

_dep

))

pdf

(f

−1

(E

_dep

)),

où f est l’application f : u 7→ E

_dep

. On intègre ensuite la fonction densité de probabilité sur la

largeur du bin en énergie reconstruit à énergie réelle fixée :

P(E

^inf_dep^j

< E

_dep

< E

_dep^sup^j

|E

_real

) =

∫

E_dep^supj

E^{inf j}_dep

FIGURE 7.6 – Processus de construction de la matrice de réponse du calorimètre (étapes 1/4 et

2/4). En haut : probabilité qu’une particule d’énergie E

real

dépose une énergieE

dep

dans le

calori-mètre à partir des données GEANT3. En bas : distributions des évènements GEANT3 dans le plan

(E

_dep

(M eV)−E

_real

(GeV))/E

_real

(GeV)en fonction deE

_real

. Ce plan permet une interpolation

uni-dimensionnelle (selon l’axe X), plus facile à effectuer qu’une interpolation bi-dimensionnelle.

Il ne reste plus qu’à intégrer sur la largeur du bin en énergie réelle en prenant bien soin de pondérer

par l’intensité du fluxϕ(E

_real

). Un élément de la matrice[M]s’écrit donc :

m

_ij

=

∫

E_real^supi

E_real^{inf i}

∫

E_dep^sup

E^inf_dep

ϕ(E

_real

)

_f′(f−1¹(Edep))

pdf

(f

−1

(E

_dep

)) dE

_real

∫

E_real^supi

E_real^{inf i}

ϕ(E

_real

) dE

_dep

dE

_real

7.3 Déconvolution de la résolution en énergie : unfolding

La matrice finale est donnée sur la figure 7.7 en bas. On peut remarquer que l’énergie déposée semble

saturer légèrement à très haute énergie. On peut attribuer cela au fait que la fraction de la gerbe

conte-nue dans le calorimètre dimiconte-nue au fur et à mesure que l’énergie de la gerbe et sa taille augmentent.

FIGURE7.7 – Processus de construction de la matrice de réponse du calorimètre (étapes 3/4 et 4/4).

En haut : interpolation de la figure 7.6 du bas. L’interpolation est ensuite normalisée par tranche

d’énergie réelle. En bas : retour dans le plan énergie déposée E

_dep

en fonction de l’énergie réelle

E

real

, matrice de réponse finale du détecteur.

7.3.3.2 Test de la déconvolution à l’aide de données simulées

Nous avons vu que le processus de déconvolution pouvait facilement conduire à des résultats

non-physiques ou biaisés. Afin de contrôler et de valider cette procédure, une étude à l’aide de données

simulées est nécessaire. Puisque nous connaissons maintenant la matrice de réponse du détecteur,

nous allons l’utiliser pour simuler les flux observés par le détecteur. La procédure est la suivante :

– On génère des évènements dont l’énergie réelle est distribuée comme le flux multiplié par

l’ac-ceptance du détecteur (estimée dans la section 9.2). Cela correspond à la distribution des énergies

des particules qui déclenchent le détecteur. Pour se placer au plus proche des conditions réelles,

le nombre d’évènements générés est égal au nombre d’évènements présents dans la distribution

déconvoluée des données réelles. Dans cet exemple, on reproduit le processus de déconvolution

des protons, dont la distribution déconvoluée possède∼ 17000évènements répartis sur 15 bins.

L’usage de la méthode de transformation permet d’accélérer la génération des évènements à partir

d’une variable aléatoirexuniforme sur [0,1]. On peut en effet générer un nombrey qui suit une

distribution en loi de puissance grâce à la formule :

y=E

inf

(1−x)

−α¹+1

,

oùE

_inf

est la coupure sur l’énergie minimale que l’on génère. On applique ensuite une coupure

pour simuler l’efficacité de détection.

– Pour simuler l’énergie déposée par la particule incidente, on va générer la matrice cumulative[M

′

]

de la matrice de réponse[M]. Les termes m

′

s’écriventm

′

= ^∑

ⁱ_k₌₁

m

_kj

. On tire ensuite une

variable aléatoirezuniforme sur [0,1] puis, selon sa valeur, on va assigner à l’évènement le bini

d’énergie déposée correspondant. Ce bin doit vérifier la conditionm

′

< z < m

′

i+1,j

.

– Une fois les histogrammes remplis, on applique la procédure de déconvolution. L’intérêt par

rap-port aux données réelles est que l’on connaît la distribution initiale et on peut donc mesurer l’erreur

entre cette distribution et la distribution reconstruite. En réitérant la procédure complète, on peut

faire une estimation statistique des erreurs.

La figure 7.8 montre l’erreur relative moyenne entre le flux reconstruit et le flux réel en fonction

de l’énergie (ligne continue) comparée à l’erreur reliée à la fluctuation statistique du nombre

d’évè-nements dans chaque bin (pointillé). Les erreurs sont moyennées sur 1000 tests de la déconvolution.

Globalement, on constate que l’on est près de la résolution maximale excepté en quelques endroits.

On peut décomposer la figure en trois gammes d’énergies. À basse énergie, l’erreur totale est bien

plus grande que l’erreur statistique. Ceci est dû à l’incorporation d’une éventuelle erreur sur la

ma-trice de réponse de 10 % (le termeσ

ⁱ_convol

de l’équation 7.5). En faisant cela, on rajoute de l’erreur

qui n’existe pas car, dans le cas des données simulées, les processus de convolution et de

déconvo-lution utilisent la même matrice. Si l’on supprime cette condition sur l’erreur, on retrouve bien une

erreur très proche de l’erreur statistique. À moyenne énergie, l’erreur sur les flux observés dépasse

10%du flux théorique et la condition surestimant l’erreur disparaît : l’erreur totale est très proche de

l’erreur systématique. À haute énergie, l’erreur totale est légèrement supérieure à l’erreur statistique

mais comparativement à la valeur absolue, le résultat est très proche.

Dans le document Mesure et phénoménologie du rayonnement cosmique avec l'expérience CREAM (Page 142-145)

7.3 Déconvolution de la résolution en énergie : unfolding

7.3.3 Déconvolution des données réelles

7.3.3.1 Estimation de la matrice de réponse de CREAM

Une condition nécessaire pour une bonne déconvolution des incertitudes sur l’énergie reconstruite

est de bien connaître la réponse du calorimètre. Celle-ci est encodée dans la matrice de

convolu-tion[M]. L’estimation de cette matrice est effectuée à partir de la simulation. Puisque la simulation

GEANT3 reproduit plus fidèlement la réponse du calorimètre que la simulation GEANT4, c’est elle

qu’on utilise. La simulation ne donne pas directement accès aux termesm

qui représentent la

pro-babilité qu’un évènement dont l’énergie réelle se trouve dans le binisoit mesuré dans le binj. Elle

nous donne seulement accès à cette probabilité à l’énergie à laquelle sont simulées les particules.

Ces probabilités sont affichées sur la figure 7.6 en haut. Pour construire la matrice complète, il faut

effectuer une interpolation de cette matrice dans l’espace bi-dimensionnel énergie réelle - énergie

dé-posée. Cependant, dans cet espace, l’interpolation est difficile et on va l’effectuer dans un espace qui

s’y prête mieux par le biais d’un changement de variable. Comme on peut le constater sur la figure 7.6

du haut, le logarithme de l’énergie moyenne déposée dans le calorimètre semble varier linéairement

avec le logarithme de l’énergie de la particule incidente et sa variance semble constante en fonction de

l’énergie. Ceci signifie simplement que la résolution relative du calorimètre dépend peu de l’énergie.

Pour profiter au mieux de cette caractéristique on va donc effectuer le changement de variable :

u= E

( MeV)−E

( GeV)

E

( GeV) .

Comme on peut le voir sur la figure 7.6 en bas qui représente la variableuen fonction de

l’éner-gie réelle, ce changement de variable permet une paramétrisation puisque sa distribution à énerl’éner-gie

réelle fixée est gaussienne. On ajuste donc la distributionupour chaque énergie par une gaussienne

puis on récupère ses moments d’ordre 1 et 2. Notons que la statistique pour effectuer ces ajustements

est limitée puisque, pour se placer dans les mêmes conditions que les données réelles, on doit utiliser

seulement les évènements qui passent les coupures : il reste alors∼500évènements à chaque énergie.

Les courbes des moments en fonction de l’énergie sont ensuite ajustées afin d’avoir une

paramétrisa-tion de la variableupour toutes les énergies. La paramétrisation de la probabilité deuexprimée en

fonction du logarithme de l’énergie est affichée sur la figure 7.7 en haut. À partir de cette

paramétrisa-tion, on veut repasser dans le plan initialE

(M eV)−E

(GeV). Pour cela on utilise la méthode

de la transformée inverse qui relie les densités de probabilité deuet deE

:

pdf

(E

) =

1

f

(f

(E

))

pdf

(f

(E

)),

où f est l’application f : u 7→ E

. On intègre ensuite la fonction densité de probabilité sur la

largeur du bin en énergie reconstruit à énergie réelle fixée :

P(E

< E

< E

|E

) =

∫

FIGURE 7.6 – Processus de construction de la matrice de réponse du calorimètre (étapes 1/4 et

2/4). En haut : probabilité qu’une particule d’énergie E

dépose une énergieE

dans le

calori-mètre à partir des données GEANT3. En bas : distributions des évènements GEANT3 dans le plan

(E

(M eV)−E

(GeV))/E

(GeV)en fonction deE

. Ce plan permet une interpolation

uni-dimensionnelle (selon l’axe X), plus facile à effectuer qu’une interpolation bi-dimensionnelle.

Il ne reste plus qu’à intégrer sur la largeur du bin en énergie réelle en prenant bien soin de pondérer

par l’intensité du fluxϕ(E

). Un élément de la matrice[M]s’écrit donc :

m

=

∫

∫

ϕ(E

)

u= ^E

^{( MeV)}−E

( GeV) ^.

= ^∑