7.3 Déconvolution de la résolution en énergie : unfolding
7.3.3 Déconvolution des données réelles
7.3.3.1 Estimation de la matrice de réponse de CREAM
Une condition nécessaire pour une bonne déconvolution des incertitudes sur l’énergie reconstruite
est de bien connaître la réponse du calorimètre. Celle-ci est encodée dans la matrice de
convolu-tion[M]. L’estimation de cette matrice est effectuée à partir de la simulation. Puisque la simulation
GEANT3 reproduit plus fidèlement la réponse du calorimètre que la simulation GEANT4, c’est elle
qu’on utilise. La simulation ne donne pas directement accès aux termesm
ijqui représentent la
pro-babilité qu’un évènement dont l’énergie réelle se trouve dans le binisoit mesuré dans le binj. Elle
nous donne seulement accès à cette probabilité à l’énergie à laquelle sont simulées les particules.
Ces probabilités sont affichées sur la figure 7.6 en haut. Pour construire la matrice complète, il faut
effectuer une interpolation de cette matrice dans l’espace bi-dimensionnel énergie réelle - énergie
dé-posée. Cependant, dans cet espace, l’interpolation est difficile et on va l’effectuer dans un espace qui
s’y prête mieux par le biais d’un changement de variable. Comme on peut le constater sur la figure 7.6
du haut, le logarithme de l’énergie moyenne déposée dans le calorimètre semble varier linéairement
avec le logarithme de l’énergie de la particule incidente et sa variance semble constante en fonction de
l’énergie. Ceci signifie simplement que la résolution relative du calorimètre dépend peu de l’énergie.
Pour profiter au mieux de cette caractéristique on va donc effectuer le changement de variable :
u= E
dep( MeV)−E
real( GeV)
E
real( GeV) .
Comme on peut le voir sur la figure 7.6 en bas qui représente la variableuen fonction de
l’éner-gie réelle, ce changement de variable permet une paramétrisation puisque sa distribution à énerl’éner-gie
réelle fixée est gaussienne. On ajuste donc la distributionupour chaque énergie par une gaussienne
puis on récupère ses moments d’ordre 1 et 2. Notons que la statistique pour effectuer ces ajustements
est limitée puisque, pour se placer dans les mêmes conditions que les données réelles, on doit utiliser
seulement les évènements qui passent les coupures : il reste alors∼500évènements à chaque énergie.
Les courbes des moments en fonction de l’énergie sont ensuite ajustées afin d’avoir une
paramétrisa-tion de la variableupour toutes les énergies. La paramétrisation de la probabilité deuexprimée en
fonction du logarithme de l’énergie est affichée sur la figure 7.7 en haut. À partir de cette
paramétrisa-tion, on veut repasser dans le plan initialE
dep(M eV)−E
real(GeV). Pour cela on utilise la méthode
de la transformée inverse qui relie les densités de probabilité deuet deE
dep:
(E
dep) =
1
f
′(f
−1(E
dep))
(f
−1(E
dep)),
où f est l’application f : u 7→ E
dep. On intègre ensuite la fonction densité de probabilité sur la
largeur du bin en énergie reconstruit à énergie réelle fixée :
P(E
infdepj< E
dep< E
depsupj|E
real) =
∫
EdepsupjEinf jdep
FIGURE 7.6 – Processus de construction de la matrice de réponse du calorimètre (étapes 1/4 et
2/4). En haut : probabilité qu’une particule d’énergie E
realdépose une énergieE
depdans le
calori-mètre à partir des données GEANT3. En bas : distributions des évènements GEANT3 dans le plan
(E
dep(M eV)−E
real(GeV))/E
real(GeV)en fonction deE
real. Ce plan permet une interpolation
uni-dimensionnelle (selon l’axe X), plus facile à effectuer qu’une interpolation bi-dimensionnelle.
Il ne reste plus qu’à intégrer sur la largeur du bin en énergie réelle en prenant bien soin de pondérer
par l’intensité du fluxϕ(E
real). Un élément de la matrice[M]s’écrit donc :
m
ij=
∫
ErealsupiErealinf i
∫
EdepsupEinfdep
ϕ(E
real)
f′(f−11(Edep))(f
−1(E
dep)) dE
real∫
ErealsupiErealinf i
ϕ(E
real) dE
depdE
real7.3 Déconvolution de la résolution en énergie : unfolding
La matrice finale est donnée sur la figure 7.7 en bas. On peut remarquer que l’énergie déposée semble
saturer légèrement à très haute énergie. On peut attribuer cela au fait que la fraction de la gerbe
conte-nue dans le calorimètre dimiconte-nue au fur et à mesure que l’énergie de la gerbe et sa taille augmentent.
FIGURE7.7 – Processus de construction de la matrice de réponse du calorimètre (étapes 3/4 et 4/4).
En haut : interpolation de la figure 7.6 du bas. L’interpolation est ensuite normalisée par tranche
d’énergie réelle. En bas : retour dans le plan énergie déposée E
depen fonction de l’énergie réelle
E
real, matrice de réponse finale du détecteur.
7.3.3.2 Test de la déconvolution à l’aide de données simulées
Nous avons vu que le processus de déconvolution pouvait facilement conduire à des résultats
non-physiques ou biaisés. Afin de contrôler et de valider cette procédure, une étude à l’aide de données
simulées est nécessaire. Puisque nous connaissons maintenant la matrice de réponse du détecteur,
nous allons l’utiliser pour simuler les flux observés par le détecteur. La procédure est la suivante :
– On génère des évènements dont l’énergie réelle est distribuée comme le flux multiplié par
l’ac-ceptance du détecteur (estimée dans la section 9.2). Cela correspond à la distribution des énergies
des particules qui déclenchent le détecteur. Pour se placer au plus proche des conditions réelles,
le nombre d’évènements générés est égal au nombre d’évènements présents dans la distribution
déconvoluée des données réelles. Dans cet exemple, on reproduit le processus de déconvolution
des protons, dont la distribution déconvoluée possède∼ 17000évènements répartis sur 15 bins.
L’usage de la méthode de transformation permet d’accélérer la génération des évènements à partir
d’une variable aléatoirexuniforme sur [0,1]. On peut en effet générer un nombrey qui suit une
distribution en loi de puissance grâce à la formule :
y=E
inf(1−x)
−α1+1,
oùE
infest la coupure sur l’énergie minimale que l’on génère. On applique ensuite une coupure
pour simuler l’efficacité de détection.
– Pour simuler l’énergie déposée par la particule incidente, on va générer la matrice cumulative[M
′]
de la matrice de réponse[M]. Les termes m
′ij
s’écriventm
′ij
= ∑
ik=1m
kj. On tire ensuite une
variable aléatoirezuniforme sur [0,1] puis, selon sa valeur, on va assigner à l’évènement le bini
d’énergie déposée correspondant. Ce bin doit vérifier la conditionm
′ij
< z < m
′i+1,j
.
– Une fois les histogrammes remplis, on applique la procédure de déconvolution. L’intérêt par
rap-port aux données réelles est que l’on connaît la distribution initiale et on peut donc mesurer l’erreur
entre cette distribution et la distribution reconstruite. En réitérant la procédure complète, on peut
faire une estimation statistique des erreurs.
La figure 7.8 montre l’erreur relative moyenne entre le flux reconstruit et le flux réel en fonction
de l’énergie (ligne continue) comparée à l’erreur reliée à la fluctuation statistique du nombre
d’évè-nements dans chaque bin (pointillé). Les erreurs sont moyennées sur 1000 tests de la déconvolution.
Globalement, on constate que l’on est près de la résolution maximale excepté en quelques endroits.
On peut décomposer la figure en trois gammes d’énergies. À basse énergie, l’erreur totale est bien
plus grande que l’erreur statistique. Ceci est dû à l’incorporation d’une éventuelle erreur sur la
ma-trice de réponse de 10 % (le termeσ
iconvolde l’équation 7.5). En faisant cela, on rajoute de l’erreur
qui n’existe pas car, dans le cas des données simulées, les processus de convolution et de
déconvo-lution utilisent la même matrice. Si l’on supprime cette condition sur l’erreur, on retrouve bien une
erreur très proche de l’erreur statistique. À moyenne énergie, l’erreur sur les flux observés dépasse
10%du flux théorique et la condition surestimant l’erreur disparaît : l’erreur totale est très proche de
l’erreur systématique. À haute énergie, l’erreur totale est légèrement supérieure à l’erreur statistique
mais comparativement à la valeur absolue, le résultat est très proche.
Dans le document
Mesure et phénoménologie du rayonnement cosmique avec l'expérience CREAM
(Page 142-145)