The DART-Europe E-theses Portal

(1)

HAL Id: tel-00713314

https://tel.archives-ouvertes.fr/tel-00713314

Submitted on 29 Jun 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Benoit Clément

To cite this version:

Benoit Clément. Ajustements Bayésiens, application à physique du quark top au LHC. Physique des

Hautes Energies - Expérience [hep-ex]. Université de Grenoble, 2012. �tel-00713314�

(2)

Mémoire

présenté pour obtenir le diplôme d’

HABILITATION À DIRIGER LES RECHERCHES

Spécialité : Physique

Présentée par

Benoit CLEMENT

Docteur de l’Université Louis Pasteur (Strasbourg I)

Maître de conférence à l’Université Joseph Fourier (Grenoble I)

préparée au Laboratoire de Physique Subatomique et de Cosmologie Ecole doctorale de physique

Ajustements bayésiens,

application à la physique du quark top au LHC

HDR soutenue publiquement le 22 juin 2012, devant le jury composé de :

M. Gilles HENRI

Professeur des Universités, IPAG (Grenoble), Président

M. Daniel BLOCH

Directeur de recherche, IPHC (Strasbourg), Rapporteur

M. Mossadek TALBY

Professeur des Universités, CPPM (Marseille), Rapporteur

M. Laurent DEROME

Maître de conférences, LPSC (Grenoble), Rapporteur

M. Julien DONINI

Professeur des Universités, LPC (Clermont-Ferrand), Examinateur

(3)

(4)

Introdution 1

1 Analyse statistique et erreurs systématiques 3

1.1 Mesure et inertitude . . . 3

1.2 Estimationetfontion de vraisemblane . . . 4

1.2.1 Approhe fréquentiste : maximumde vraisemblane . . . 5

1.2.2 Approhe bayésienne : densitéa posteriori . . . 6

1.3 Inertitudes systématiques . . . 7

1.3.1 Approhe fréquentiste : vraisemblane prolée . . . 8

1.3.2 Approhe bayésienne . . . 9

1.4 Vraisemblane de Poisson . . . 10

1.4.1 Comptage d'événements . . . 10

1.4.2 Soures d'erreurs . . . 10

1.4.3 Fontion de vraisemblanedu problème . . . 11

1.4.4 Exemple simple . . . 12

2 Implémentation des méthodes d'analyse 15 2.1 Ajustements monodimensionnels. . . 15

2.1.1 Vraisemblane prolée . . . 15

2.1.2 Intégration bayesienne simple . . . 16

2.2 Ajustement de plusieurs paramètres . . . 17

2.2.1 Grilleet éhantillonnage . . . 17

2.2.2 Méthode approximée . . . 18

2.2.3 Monte-Carlo par haînes de Markov (MCMC) . . . 19

2.2.3.1 Chaînes de Markov . . . 19

2.2.3.2 Appliationau problème étudié . . . 20

3 Physique du top au LHC 23 3.1 Le LHCet ledéteteur ATLAS . . . 23

3.2 Le Modèle Standard et lequark top . . . 24

3.2.1 Le modèle standard et ses limites . . . 24

3.2.2 Le quarktop . . . 25

3.3 Produtionassoiée

tW

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ²⁸

3.3.1 Motivation. . . 28

3.3.2 Bruits de fond etséletions. . . 29

3.3.3 Estimationdes fonds et de l'aeptane . . . 31

3.3.4 Erreurs systématiques . . . 33

3.3.5 Résultat nal . . . 34

(5)

4.1 Extrationdes résultatsATLAS . . . 37

4.2 Validationà une dimension. . . 39

4.3 Analyse bayésienne multidimensionnelle. . . 41

5 Perspetives : analyse ombinée des 3 voies single top 45 5.1 Single top etnouvellephysique. . . 45

5.1.1 Proessus

benchmark

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁴⁵

5.1.2 Paramétrisation générique . . . 47

5.2 Analyses

CSC

^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ⁴⁸

5.2.1 Séletions . . . 48

5.2.2 Analyse ombinée . . . 49

5.3 Conlusions . . . 54

Conlusion 57

Bibliographie 59

(6)

Depuis une dizaine d'années, les méthodes statistiquesjouent un rle de plus en plus

important en physique des partiules. L'amélioration des apaités de alul des ordina-

teurs y est pour beauoup. Elles trouvent de nombreuses appliations en théorie (aluls

sur réseau, sondage d'espaes de paramètres de modèles, ...), dans lasimulation de pro-

essusphysiques(générateurs Monte-Carlo,simulationde déteteur)etdansl'analysedes

données (méthodes multivariées pour la séletion d'événements, intégration de soures

d'erreurs systématiques etalul de limites).

A partir de 2004, les physiiens du Tevatron ont été parmi les premiers à mettre en

÷uvre, dans le adre de la reherhe des proessus de prodution életrofaible du quark

top,unegrandevariétédeméthodesmultivariées(arbresdedéision,réseauxdeneurones)

oupléesàuneanalysebayésiennesophistiquéepourinlurelesinertitudessystématiques.

Ces analyses ont permis la mise en évidene de ette prodution életrofaible ave un

volume de données bien inférieurà e quiavaitété estimé préédemment.

Les expérienes du LHC ont naturellement adopté es tehniques et en proposent de

nouvelles. Danse mémoire, nous allons nous onentrer sur l'ajustement de paramètres

physiques ave estimation de l'inertitude de mesure, soit pour déterminer et optimiser

la sensibilité d'une analyse, soit pour extraire le résultat nal. Les diérentes méthodes

disutées, en partiulier une approhe originale d'intégration bayésienne par haînes de

Markov, font l'objet d'une implémentation dans un programme. Nous utiliserons alors

les reherhes de prodution életrofaible du quark top dans les premières données du

LHC pour illustrer et valider es diérents outils. Enn, le dernier hapitre prospetif

sera onsaré à l'utilisation future de es mêmes outils pour ontraindre des modèles de

physique au-delàdu modèle standard.

(7)

(8)

oÎlomènhn,£mur> >AqaioØlge>êjhke,

polld>Êfjmouyuq^Aðdiproòayen

r¸wn,aÎtoÌdà ál¸riateÜqekÔnessin

oÊwnoØste psi,Diäd>âteleetoboul ,

âx oÝdtprÀtadiast thnârsante

>AtreòdhtenaxndrÀnkaÈdØo>AqilleÔ.

Homère,Iliade I.1

1

Analyse statistique et erreurs systématiques

1.1 Mesure et inertitude

Lerésultatd'unemesure,qu'ilsoitobtenudiretementd'uneexpérieneoudérivéd'un

ouplusieursrésultatsexpérimentaux,onsisteen uneouplusieursvaleursnumériquesqui

onstitue la valeur entralede lamesure utiliséepour estimerlavaleur vraie d'une

grandeur physique.

L'une des prinipales problématiques onerne alors la onane ou la rédibilité que

l'on aorde à e résultat. Pour une valeur numérique unique, la présentation la plus

lassique pour ette informationest la barred'erreur oud'inertitude 1

de laforme :

x = X ± ∆X

^où

x = X _−∆X1 ^+∆X2

^(1.1)

L'inertitudedénitdon un intervalleontenant probablementlavaleur vraiede lagran-

deurmesurée.Dansettereprésentationlabarred'erreurontientlavaleurentrale.Dans

le premier as labarre d'erreur est symétrique autour de ette valeur entrale, alors que

le seond traduit une plus forte probabilité de utuation d'un oté que de l'autre de

la valeur entrale. Enn dans ertains as, on souhaite séparer ertaines ontributions

à l'inertitude, par exemple les eets statistiques et systématiques. Cette séparation est

partiulièrement pertinente pour disuter des possibilités d'amélioration du résultat par

de futures expérienes (rédutionde l'erreurstatistique)oude nouvelles analyses (rédu-

tions des eets systématiques). Par exemple, les eets statistiques se réduisent par une

aumulationplus grandede données ave,sil'appareillagereste identique, uneévolution

de l'erreuren

∼ 1/ √

t

^,

t

^étant ^la ^durée ^de ^la ^mesure. ^La ^rédution ^d'eets systématiques passe par une meilleure ompréhension de l'appareillage de mesure (qui peut néessiter

une statistique arue) et/ou un hangement de tehniques de mesure et d'analyse. On

1

Certainsassoientlanotiond'erreuràelledebiais,equisous-entendunepossibilitédeorretion,

alors quel'inertitude est purement aléatoire.Dans lesdiérentes situations que nousallons parourir,

leserreursneserontpasestimablesautrementqueparunintervalledeonaneetseronttraitéesomme

des utuations aléatoires : si auune valeur de l'erreurne peut être préisément estimée alors toutes

les valeurs possibles (i.e. dans la barre d'erreur) doivent être onsidérées.Ainsi les termes d'erreur ou

d'inertitudeserontutilisésindiéremmentpourdésignerlemêmeonept.

(9)

x = X ± ∆X stat ± ∆X syst

^(1.2)

En reliantl'inertitudeà une mesure de dispersion proportionnelleà lavariane,l'erreur

totale s'obtient en sommant les diérentes omposantes (supposées indépendantes) en

quadrature.

L'intervalle de onane permet de donner une dénition plus rigoureuse du onept

d'inertitude, le niveau de onane quantiant la probabilité de trouver la valeur vraie

dans la barre d'erreur. Un intervallede onane est un intervalle

[a, b]

^tel ^que^:

P (a < X < b) =

Z b a

f X (x)dx = α,

^(1.3)

α

^étant^le^niveau^de^onane^del'intervalle.L'éart-type

σ

^permet^de^dénirûnîntervâlle

de onane autour de la valeur moyenne

µ

^, ^de ^la ^forme

[µ − σ; µ + σ]

^. ^Dans ^le ^as

d'une densité normale, et intervalleorrespond à un niveau de onane de

68.3%

^. ^Par

extension, 'est la valeur du niveau de onane que l'on assoiegénéralement(mais pas

néessairement) à une barred'erreur.

1.2 Estimation et fontion de vraisemblane

Unemesure brutese ompose d'un éhantillon d'une ouplusieurs valeurs numériques

~

m = { m 1 , m 2 , . . . , m n }

^, réalisationd'une variable aléatoire

X ~ = { X 1 , X 2 , . . . , X n }

^. ^L'en-

semble de es variables aléatoires est dérit par une densité de probabilité

f X ~ (~x)

^où

~x

désigne une réalisationquelonque.

Parailleursonvautiliseres données pour déterminerouontraindreun ouplusieurs

paramètres physiques

~θ

^(masses, ^setion êae, ^.^.^.) ^que ^l'on ^souhaiteêstimer, ^soitâve

une valeur numérique, soit par un intervalle de onane ou une limite. Les données

mesurées sontsensiblesaux paramètres

~θ

^,^si^le^résultat^attendu ^de ^la^mesure^est ^diérent

pour des valeurs diérentes de

~ θ

^. ^Ainsi, ^la ^densité

f X ~ (~x)

^doit ^dépendre ^des ^paramètres

~θ

^. ^D'un ^point ^de ^vue ^purement mathématique, on peut onsidérer une fontion générale dont les variables seraient à la fois les variables aléatoires et les paramètres à estimer.

Notons ette fontion

k(~x, ~θ)

^. Â ^partir^de êtte ^fontion ônônstruit ² ôbjets ^:

•

^La^densité^de probabilitéde

X ~

^,^qui^est^une^fontion^du^seul^veteur

~x

^,réalisation de

X ~

^,^les^paramètres

~θ

^étant ^xés ^à^une ^valeur

~θ = ~θ 0

^unique.^Cette ^valeur

~ θ 0

^est ^la

valeur vraie des paramètres :

f X ~ (~x) = k(~x, ~θ 0 )

^et

Z

f X ~ (~x)d~x = 1.

^(1.4)

•

^La^fontion ^de vraisemblanedesparamètres

~θ

ôùôn^ne ônsidère^que^la^dépen-

dane en

~θ

^, ^en ^xant

~x

^à^la ^mesure

m ~

^:

L (~θ) = k( m, ~θ). ~

^(1.5)

La diérene fondamentale entre les approhes fréquentiste et bayésienne, que nous

allons disuterdans lesprohains paragraphes,tientdans lestatutdonnéauxparamètres

~θ

^. ^Dans^l'approhe fréquentiste,

~θ

^possède ûne ûnique ^valeur, ^que^l'on ^tente ^d'estimer âu

mieux : les données permettent de onstruire des estimateurs de la valeur entrale etdes

(10)

Dans l'approhe bayésienne, les paramètres sont eux-mêmes traités omme des variables

aléatoires, dérites par une densité de probabilité : au vu des données, on aorde une

plus grande rédibilité à ertaines valeurs des paramètres qu'à d'autres, 'est la densité

de probabilitéa posteriori. Cettedensitédes paramètrespermetàson tourde dénirune

valeurentrale et des intervalles de onane.

1.2.1 Approhe fréquentiste : maximum de vraisemblane

La fontion de vraisemblane n'est pas une densité de probabilité. Elle mesure néan-

moinslarédibilitéassoiéeàhaquevaleurpossibledesparamètres.

L (~θ 0 )

^quantie ^don

la ompatibilité des données ave l'hypothèse

~ θ = ~θ 0

^. L'estimateur naturel qui en dé- oule pour

~ θ

^est ^la ^valeur

~θ ˆ

^telle ^que ^la ^fontion ^de vraisemblane soit maximale : 'est l'estimateur du maximum de vraisemblane.

Un estimateur

~θ ˆ

^(par ^exemple ^le ^maximum ^de vraisemblane) est une variable aléa- toire. Dans le as d'un unique paramètre, un intervalle déni par deux fontions de

θ ˆ

^,

h

ξ(ˆ θ), ω(ˆ θ) i

,est également une variablealéatoire.Sionrépète l'expériene plusieurs fois,

onvaobtenirdiérentes valeursdel'estimateuretdel'intervalle,quipeut ontenirounon

lavaleurvraie

θ 0

^:^on^peut^don ^dénir^au^sens fréquentiste laprobabilitéque l'intervalle ontiennelavaleur vraie.L'intervalle

h

ξ(ˆ θ), ω(ˆ θ) i

est unintervallede onanede niveau

α

^si ^:

P θ ₀ ∈ h

ξ(ˆ θ), ω(ˆ θ) i

= α.

^(1.6)

quelle que soit la valeur de

θ

^. ^La ônstrution êxate ^de ^l'intervâlle ^de ônane, ^dite

onstrution de Neyman [1℄, peut se révéler très oûteuse en temps de alul.

On aleplus souvent reoursà des propriétésasymptotiques (valablesrigoureusement

dans lalimite d'un éhantillon inni) de l'estimateur de maximum de vraisemblane. La

loi de probabilité de l'estimateuronverge vers la loimultinormale.L'estimateur est non

biaisé asymptotiquement, lamoyenne de la loimultinormale orrespond don à lavaleur

vraie

~θ 0

^. ^Le ^maximum ^de vraisemblane est également de variane minimale. Il atteint asymptotiquementlaborne deRao-Cramer-Fréhetetsamatriede ovarianeest alors:

Σ = L ⁻¹

^ave

L ij = − E

"

∂ ² ln L (~θ)

∂θ _i ∂θ _j _~

θ= ~ θ ˆ

#

,

^(1.7)

la valeur moyenne portant sur la variable aléatoire

X ~

^. ^Dans ^la ^pratique, ^on ^ne ^dispose

que d'une réalisationde

L

^.^Finalementôn ônstruit ûn êstimateur ^de ^la ôvariane ^par ^:

Σ = ˆ ˆ L ⁻¹

^ave

L ij = − ∂ ² ln L (~θ)

∂θ i ∂θ j

_~

θ= ~ θ ˆ

(1.8)

Onpeutdéterminerplusorretementlamatriedeovarianepardespseudo-expérienes

Monte-Carlo.

On utilise enn le rapport de vraisemblane

λ = L (~θ)/ L ( ~θ) ˆ

^dont ^le ^logarithme ^suit

(toujoursasymptotiquement)uneloide

χ ²

^à

n θ

^(nombre^de paramètres)degrésdelibertés pouronstruire des intervalles de onane.Lesbornesd'un intervallepour un niveau de

onane

α

^satisfont ^l'équation^:

− 2 ln λ(~θ) = β(n θ , α)

^où

β

^est ^déni ^par

α =

Z β(n θ ,α) 0

f χ ² (x; n θ )dx.

^(1.9)

(11)

− ln λ(θ) = n ²

2 ,

^(1.10)

qui dénitlesbornesd'un intervalleà

nσ

^(i.e. ^dont^le^niveau ^de ônane êst ^égal^àêlui

de l'intervalle

µ ± nσ

^d'une ^loi^normale,^soit ^68.3%^pour

n = 1

^,^95.4% ^pour

n = 2

^, ^.^.^.).

1.2.2 Approhe bayésienne : densité a posteriori

L'approhebayésienneestaprioriplussimple.Laprobabilitéest simplementinterpré-

tée omme un degré de onane. On peut alors assoier une densité de probabilité aux

paramètres

~θ

^. Âprès ûn ênsemble ^de ^mesures

~x

^, ^la ^densité ^de probabilité des paramètres du modèleontraintepares mesures estladensitéonditionnelle

f(~θ | ~x)

^,^appelée ^densité

a posteriori. Enutilisantle théorème de Bayes, on a:

f (~θ | ~x) = f(~x | ~θ)f (~θ)

f(~x)

^soit

f (

^modèle

|

^mesure

) = f(

^mesure

|

^modèle

)f(

^modèle

)

f (

^mesure

) .

^(1.11)

Cette expression faitapparaître trois fateurs :

f (~x | ~θ)

^est ^la probabilité des mesures pour une valeur déterminée de

~θ

^. ^C'est ^la

fontion de vraisemblane

L (~θ)

^dénie préédemment.

f (θ) = π(~θ)

^est ^la ^densité ^de probabilité des paramètres avant la mesure nommée densité a priorides paramètres.Cette densité est souvent xée arbitrairement.

f (~x)

^est^la^densitéprobabilitédelamesure

~x

^.^C'est^une^grandeur^numérique^onstante

qui joueun simple rle de normalisationde ladensité a posteriori.

Laprobabilité a posteriori peut se réérire:

f (~θ | ~x) = L (~θ)π(~θ)

R f (~x | ~θ)π(~θ)d~θ

^(1.12)

Le hoix le plus fréquent pour la densité a priori est une densité uniforme sur un

intervalle

[a, b]

^. ^Cette ^densité ^traduit ^l'absene ^d'a ^priori ^sur ^la ^valeur ^des paramètres.

Si lafontion de vraisemblane tombegénéralementà 0pour des valeurs des paramètres

loindu maximum de vraisemblane,on peut hoisir

[a, b]

^tel ^que^:

f(~θ | ~x) ∝ L (~θ).

^(1.13)

Si e n'est pas le as, elà indique que la mesure n'est pas ou peu sensible au paramètre

estimé.

Cette densité a priori permet également de borner les paramètres en imposant un a

priorinuldanslesrégionsnon-physiques. Dansleas d'unemesuredesetioneae, on

oupera la partienégative de lafontion de vraisemblane.

Si la partie de fontion de vraisemblane oupée par l'a priori n'est pas négligeable,

l'approximationpréédente devient fausse etilfautrealuler lanormalisationde laden-

sité a posteriori. Un autre hoix pour la densité a priori serait de prendre la densité du

paramètre estimée par une mesure préédente. Le hoix arbitraire de ette densité est le

point faible de ette approhe. En partiulier, le résultat nal ne sera pas invariant par

hangement de variable: hoisir

θ

^ou

log(θ)

^uniforme^ne ^onduira ^pas ^à ^la^même ^densité

(12)

de es hoix. Le hoix de la densité a priori reste subjetif et pour plusieurs a priori

raisonnables (enore de lasubjetivité!), lerésultat a posterioridoit être similaire.

Leonept de l'analyse bayésienne est don de partird'une onnaissane a priorides

paramètres du modèle et de onstruire la densité a posteriori inluant l'informationap-

portéparlamesure.Lamesurefavoriseertaines valeursdes paramètres,laplusprobable

étantlemaximumdelafontiondevraisemblanesielle-in'estpastronquéeparladen-

sité a priori. Lamesuremodiedon ledegréde rédibilitéassoiée auxvaleurspossibles

des paramètres (densité a posteriori). Contrairement au as fréquentiste, il n'y a plus

d'estimateur et onobtient diretementune densitéde probabilité pour les paramètres, à

partir de laquelle onpeut dénir une valeur entrale (moyenne, médianeouplus souvent

lemode quiorrespond aumaximumde vraisemblanepour un a prioriuniforme)etune

barre d'erreur via un intervallede onane

[a, b]

^pour ^un ^niveau ^de ^onane

α

^tel^que ^:

Z b

a

f(~θ | ~x)d~θ = α

^(1.14)

Pour dénir l'intervallede manière unique, on doit xer des ritères supplémentaires. A

une dimensionon peut hoisir par exemple :

un intervalle symétriqueautour de la valeur entrale

c

^:

[c − k, c + k]

^.

un intervalle entré en probabilité autour de la valeur entrale

c

^:

[a, b]

^tel ^que

R c

a f (θ | ~x)dθ = R b

c f(θ | ~x)dθ = α/2

^.

un intervalle

[a, b]

^tel ^que

f(a | ~x) = f (b | ~x)

^et

f (u | ~x) > f(b | ~x)

^pour ^tout

u ∈ [a, b]

^.

Cette dénition orrespond à l'intervalleHPD (Highest ProbabilityDensity) etor-

respond à l'intervalle fréquentiste déni par le rapport de vraisemblane. Ce type

d'intervallesegénéralise simplementàdes ontours multidimensionnelsetest indé-

pendant du hoix d'unevaleur entrale.

Ces trois type d'intervallesontillustrés sur la gure 1.1.

x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ

Fig. 1.1: Exemples d'intervalle de onane à 68% : entré sur la moyenne (à gauhe), entré

sur lamoyenne en probabilité (au entre),intervalleHPD (à droite).

1.3 Inertitudes systématiques

La prinipale diulté, que nous allons disuter maintenant, est l'inlusion d'iner-

titudes systématiques dans l'estimation par intervalle. Ce point est relativement simple

dans le as bayésien mais peut se révéler très déliat dans le ontexte fréquentiste. Il

serait même possible d'argumenter que le onept même d'inertitude systématique n'a

pas de sens dans une interprétation purement fréquentiste. Nous nous ontenterons de

dérire une approhe possible parmi les diérentes solutions de e problème qui ont pu

(13)

onpeutdistinguerlesparamètres

~θ

^que^l'on^souhaite^réellementôntraindreêtêux

~ν

^dont

ononnaît lavaleur

~ν est

âve ûne înertitude

∆~ν est

^(ette ^notation^pouvantorrespondre à une matrie de ovariane, par exemple). Ces derniers onstituent les paramètres de

nuisane.

1.3.1 Approhe fréquentiste : vraisemblane prolée

L'éartentre lavaleuronnue etlavaleurvraied'unparamètredenuisanereprésente

un biais, que l'on doit pouvoir estimer.La valeur onnue des paramètres de nuisane re-

présenteainsiuneréalisationd'unestimateur,etl'inertitudesurleparamètres'interprète

ommesavariane.Apartirde ledensitéde probabilitédeet estimateur,onassoieune

fontiondevraisemblane

L ^nuisance (~ν; ~ν est ; ∆~ν est )

^aux^paramètres^de^nuisane.^La^fontion

de vraisemblane totale du problème s'érit alors :

L (~θ, ~ν ) = L

^modèle

(~θ, ~ν) × L nuisance (~ν)

^(1.15)

où

L

^modèle ^est ^la vraisemblane du modèle seul. Si les paramètres

~ν

^sont parfaitement onnus,

L ^nuisance (~ν) = δ(~ν − ~ν est )

êt ôn^se ^retrouve ^dans ^leâs ^disuté préédemment. A partir de ette fontion de vraisemblane, on onstruit [2℄ la fontion de vraisemblane

prolée (prole likelihood):

L pr (~θ) = max

~

ν L (~θ, ~ν)

^(1.16)

en maximisant la fontion de vraisemblane relativement aux paramètres

~ν

^pour ^haque

valeur des paramètres

~θ

^. L'estimateur paramètres de nuisane, à

θ

^xé, ^est ^souvent ^noté

~ν ˆˆ

^. ^Le^rapport ^:

λ(~θ) = L ^pr (~θ)/ L ( ~θ), ˆ

^(1.17)

où

~ ˆ

θ

^est l'estimateurde maximum de vraisemblane,possèdelesmêmespropriétés statistiques que lerapport de vraisemblanelassique [3℄. Laonstrution de ettefontion de

vraisemblane est illustréesur lagure 1.2 :

θ paramètre d’intérêt

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

ν paramètre de nuisance

-1 -0.5 0 0.5 1 1.5 2 2.5

3 ) ν, θ ( λ -log

1 2 3 4 5 Vraisemblance

θ paramètre d’intérêt -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 ν

paramètre de nuisance

-0.5 -1 0 0.5 1.5 1 2.5 2 3

) ν, θ ( λ -log

0 1 2 3 4 5 6

θ paramètre d’intérêt

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

) θ ( λ -log

0 1 2 3 4 5 6

Vraisemblance profilée Vraisemblance profilée

Fig. 1.2: Desription shématique da lavraisemblane prolée.

Agauhe :logarithmede lafontiondevraisemblane dansleplan

(θ, ν)

^;^la^ligne ^rouge^indique

leminimum relativement à

ν

^à

θ

^xé.

Au entre: logarithme delafontion de vraisemblane en fontiondes paramètres

(θ, ν)

^.

A droite : logarithmede lafontion devraisemblane proléeen fontion duparamètre

θ

^.

(14)

Ilest importantdenoterque,silenombredeparamètresdenuisaneexèdelenombre

de degrés de liberté du problème, il existe une dégénéresene sur les valeurs

~ν(~θ) ˆ

^qui

maximise

L (~θ, ~ν)

^. ^Dans ê âs, ôn ^détermine ^la ^valeur ^de ^la ^fontion ^de vraisemblane prolée sans réellement ontraindre les paramètres de nuisane : on ne dispose pas de

mesure du biais.

1.3.2 Approhe bayésienne

La méthode bayésienne permet d'inlure les eets d'inertitudes systématiques via

des paramètres de nuisane. En séparant expliitement les paramètres à ajuster et les

paramètres de nuisane, la densitéa posterioripeut s'érire :

f (~θ, ~ν | ~x) = f(~x | ~θ, ~ν)f (~θ, ~ν)

RR f (~x | ~θ, ~ν)f(~θ, ~ν)d~θd~ν = L (~θ, ~ν)f (~θ, ~ν )

RR L (~θ, ~ν )f(~θ, ~ν)d~θd~ν

^(1.18)

et la densité a posteriori des paramètres

~θ

^n'est ^que ^la ^densité ^marginale ^obtenue ^en

intégrantsur lesparamètres de nuisane

~ν

^:

f (~θ | ~x) =

R L (~θ, ~ν)f (~θ, ~ν)d~ν

RR L (~θ, ~ν)f(~θ, ~ν)d~θd~ν

^(1.19)

Généralement, les inertitudes sur les paramètres de nuisane sont indépendantes de

la densité a priori des paramètres

~θ

^. ^La ^densité ^a ^priori ^est fatorisable sous la forme

f (~θ, ~ν) = π(~θ)k (~ν )

^:

π(θ)

^est ^la ^densité ^a ^priori ^pour ^les ^paramètres

~ θ

^et

k(~ν)

^elle ^des

paramètres de nuisane. Cette densité a priorides paramètres de nuisane est identique

à la fontionde vraisemblane

L ^nuisance

^introduite ^dans ^la ^onstrution^de ^la^fontion ^de

vraisemblaneprolée.Onpourraparexemplehoisirpour

k (~ν)

^une^densitémultinormale dénie parles valeursattendues etlamatriede ovarianedes paramètres de nuisane

2

.

Cette fatorisation permet également de sortir la densité a priori des paramètres de

l'intégrale. Conrètement, ei reviendra à intégrer la fontion de vraisemblane puis à

multiplierpar la densité a priori, la première étape étant généralement la plus oûteuse

en tempsde alul (intégration numérique). Finalementonobtient:

f (~θ | ~x) = π(~θ) R

L (~θ, ~ν)k (~ν) d~ν RR L (~θ, ~ν)π(~θ)k (~ν) d~θd~ν

(1.20)

Dansla pratique,ladensitéa priorides paramètresde nuisanen'est onnue qu'approxi-

mativement.Si es paramètres sont orretement estimés,ils ne doivent que peu aeter

la qualité de l'ajustement. Cettequalité peut se quantier par laprobabilité d'obtenir la

valeurlaplusprobableduparamètre,soitlavaleurmaximaledeladensitéaposteriori.On

peut don valider la valeur des paramètres de nuisane en étudiant ladispersion relative

de la valeur maximale de la densité a posteriori pour diérentes valeurs des paramètres

de nuisane. Laonstrutiond'un intervallede onane inluantleseets systématiques

se fait ommepréédemment en intégrant la densitéa posteriori :

Z b a

f (~θ | ~x)d~θ = α.

^(1.21)

2

Un paramètreonnu exatement aura pour a priori une distribution de Diraet l'intégrale sur e

(15)

densité a posteriori sont également oûteux en temps de alul et néessitent la mise en

plae de méthodes numériques appropriées quiseront disutées auhapitre 2.

1.4 Vraisemblane de Poisson

1.4.1 Comptage d'événements

Une expériene de physique des partiules se ramène généralement à un omptage

d'événementspassantdes oupuresdeséletion.Onsouhaiteensuiteonfronterlenombre

d'événements observé à un modèle permettant de aluler e nombre d'événements. Le

nombre d'événements observé est la réalisation d'une variable aléatoire distribuée selon

une loi de Poisson, dont le paramètre est le nombre d'événements attendu moyen. Pour

améliorerla sensitivité d'une analyse,on va ombiner plusieurs mesures orrespondant à

des séletions diérentes, voire àun déoupage selonune variable spéique(lassesd'un

histogramme). Chaque ensemble d'événements ainsi déni forme un anal d'analyse. Le

modèlepermetde alulerlenombre d'événementsmoyen attendu dans haque anal,en

fontiondesparamètresphysiqueàmesurer(setioneae,ouplage,...)etdediérents

paramètres onnusave une préision nie (paramètres de nuisane).

Dansla suite nous adopterons lesnotations suivantes :

~ θ

^, ^les

n θ

^paramètres ^à ^ajuster.

~ν

^, ^les

n _ν

^paramètres ^de ^nuisane. ^Les ^paramètres ^de ^nuisane ^pouvant ^avoir ^des

valeurs diérentes dans lesdiérents anaux,on aura

n ν = kn c

^où

n c

^est ^le ^nombre

de anaux d'analyse et

k

^le ^nombre ^de ^paramètres ^de ^nuisane ^néessaire ^à ^la ^des-

riptiond'un unique anal.

M ~ (~θ, ~ν)

^: ^le^nombre d'événements attendu moyen dans haque anal. C'est un veteur de dimension

n c

^.

D ~

^: ^le ^nombre d'événements observés dans haque anal (veteur de dimension

n _c

également).

1.4.2 Soures d'erreurs

Pour prendre en ompte les paramètres de nuisane, il faut formuler analytiquement

la fontionde vraisemblanede es paramètres.

Dansleasgénéral,ilvaexisterdemultiplesorrélationspossiblesentrelesparamètres

qui peuvent mener à une densité diilement formulable. En eet l'inertitude globale

peut se omposer de plusieurs soures d'inertitude indépendantes les unes des autres,

mais qui peuvent aeter simultanément plusieurs paramètres de nuisane. On pourra

don ne onsidérer quedes souresd'erreur aratériséespar :

les ontributions d'une même soure, entièrement orrélées (ou antiorrélées) entre

les diérents paramètres etd'un anal àl'autre.

les ontributions de deux soures d'inertitudediérentes, entièrement déorrélées.

Les paramètres de nuisane seront aratérisés par une valeur entrale onnue

~ν 0

^et

deux matries d'erreurs

∆ ⁺

^et

∆ ⁻

^omme ^la ^matrie ^des ^utuations ^à

± 1σ

^. ^Ce ^sont

deux matries

n ν × n s

^,

n s

^étant ^le ^nombre ^de ^soures d'inertitude onsidérées.

∆ ⁺ _ij

^est

la utuation à

1σ

^du ^paramètre ^de ^nuisane

ν i

^produit ^par ^la ^soure ^d'erreur

j

^. ^Les

termes de

∆ ^±

^peuvent ^être ^négatifs ^pour ^traduire ^des antiorrélationsentre inertitudes.

L'existene de deux matriespermet de traiter des erreurs asymétriques.

(16)

Laorrélationentretouteslesutuationsliéesàunesoured'erreurpermetdedérire

l'ensemble de es utuations ave un unique paramètre. Il sut dès lorsde redénir les

paramètres de nuisane:aulieudetraiter

~ν

^omme^des ^variablesaléatoires,ononsidère un veteur

Ω ~

^,^de ^dimension

n _s

^.^En^général

Ω ~

^sera ^distribué ^selon^une ^loimultinormalede moyenne

~µ = ~ 0

^et^matrie ^de ^ovariane

Σ = 1

^.

Pour une réalisation

~ω

^de

Ω ~

^, ^les^paramètres ^de ^nuisane^peuvent ^alors ^s'érire ^:

~ν = ~ν 0 + f(~ω, ~ ∆ ⁺ , ∆ ⁻ )

^(1.22)

Plusieurs presriptions sont possibles pour dénir la fontion de utuation

f ~

^. ^Le ^trai-

tement orret des orrélations totales impose que la valeur entrale

~ν 0

^des ^paramètres

orresponde àla médianede la densité de probabilité assoiée, 'est-à dire que la proba-

bilité de utuer vers lehaut ouvers lebas soitla même.Cei impose omme ontrainte

que les omposante

ω i

^et

f i

^aient ^le ^même ^signe. ^Si ^une ^soure ^d'erreur ^n'aete ^qu'un

unique paramètre,laquestiondes orrélationsne sepose plusetlehoixde ladensitéest

plus libre.

Latransformation

f(~ω, ~ ∆ ⁺ , ∆ ⁻ )

^la^plus ^ourante^sera ^de ^la^forme^:

f(~ω, ~ ∆ ⁺ , ∆ ⁻ ) = ~ω

^T

∆

^ave

∆ ij = ∆ ^sgn(ω _ij ⁱ ⁾ =

∆ ⁺ _ij

^si

ω i > 0

∆ ⁻ _ij

^si

ω _i < 0

^(1.23)

En prenant une erreur moyenne

∆ m = ¹ ₂ (∆ ⁺ + ∆ ⁻ )

^, ^on ^peut ^également ^symétriser ^le

problème et :

f(~ω, ~ ∆ ⁺ , ∆ ⁻ ) = ~ω

^T

∆ _m

^(1.24)

Ceiorrespondàdeuxasextrêmes:lepremierprésenteunedisontinuitédansladensité

du paramètreauniveau de lavaleurentrale,leseondgommeleseetsd'asymétrie qu'il

peutêtre importantde prendre enonsidération.Il s'agitde deuxas limitesd'une lasse

de transformationde laforme:

f(~ω, ~ ∆ ⁺ , ∆ ⁻ ) = ~ω

^T

×

∆ ⁻ + ∆ ⁺ − ∆ ⁻ U(~ω)

(1.25)

ave

U

^une ^matrie ^diagonale

n _s × n _s

^telle ^que

U _ii = u(ω _i )

^où

u(r)

^désigne ^n'importe

quelle fontionéhelon, 'est à dire une fontion monotone, roissante, telle que :

u(0) = 1

2

^,

lim

u→−∞ = 0

^,

lim

u→+∞ = 1.

^(1.26)

Plusieurs famillesde fontions omme:

Ar tangente :

2 tan ⁻ ¹ (κr)+π

2π

^,

Fontion d'erreur :

erf(κr)+1

2

^,

Sigmoïde:

1 1+e ⁻ ^κr

^,

où leparamètre

κ

êst ^libre, ^satisfont ês ônditions.L'asymétrie est maximalepour

κ → + ∞

^alors ^que

κ → 0

^orrespond ^à ^l'erreur ^moyenne. ^Le ^leteur ^souhaitant approfondir es questions pourra onsulter laréférene [4℄. L'eet d'une telle fontion est illustré sur

la gure 1.3.

1.4.3 Fontion de vraisemblane du problème

Pour une expériene de omptage, le nombre d'événements

D i

^dans ^le ^anal

i

^est ^la

réalisation d'une variable aléatoire qui suit une loi de Poisson de moyenne

M i

~θ, ~ν

. Si

(17)

x

-2 0 2 4 6 8

0 10000 20000 30000 40000 50000

-2.0

x = 3 +1.0

∞ κ = κ = 2 κ = 0

y

-4 -2 0 2 4 6 8

0 5000 10000 15000 20000 25000 30000 35000 40000 45000

+1.1

y = 2 -1.5

∞ κ = κ = 2 κ = 0

x

-2 0 2 4 6

y

-4 -2 0 2 4 6

Fig. 1.3: Distributions obtenues par utuation aléatoire d'un ouple de paramètres

x y

, ave

une soure de nuisane asymétrique

∆ ⁺ = _−1.5 ¹

et

∆ ⁻ = _−1.1 ²

pour trois valeurs de

κ

^: ^les

deuxaslimites(

κ = 0

^en^rouge^et

κ = + ∞

ên^bleu)êtûnâsintermédiaire(

κ = 2

^,^en^vert).^Les

gure dedroite représente

y

^en^fontion ^de

x

^et ^montrel'anti-orrélation entre lesutuations.

les anaux sontstatistiquement indépendants, 'est-à-dire qu'un événement ne ontribue

qu'à un unique anal, la fontionde vraisemblane des paramètres seuls est :

L

~θ, ~ν

=

n ^c

Y

c=1

e ^−M ^c ( ^~ ^θ,~ ^ν ) M _c

~θ, ~ν D ^c

D _c !

^(1.27)

Enajoutantlesparamètresde nuisane,queesoitpourun traitementfréquentisteou

bayésien,lafontiondevraisemblanedoitêtremultipliéeparlafontiondevraisemblane

(ou ladensitéa priori)des paramètresde nuisane, déritsparlesparamètres

~ω

^introduit

au paragraphepréédent. On obtient ainsi :

L

~θ, ~ω

=

n ^c

Y

c=1

e ^−M ^c ( ^θ,~ ^~ ^ν(~ ^ω,∆ ⁺ ^,∆ ⁻ ⁾ ) M c

~θ, ~ν(~ω, ∆ ⁺ , ∆ ⁻ ) D ^c

D c !

n ^s

Y

s=1

√ 1 2π e ⁻

ω 2 s 2

(1.28)

Pour des raisons pratiques, il sera parfois utile de travailler ave le logarithme de la

fontion de vraisemblane pluttqu'ave lafontion elle-même, soit:

− ln L (~θ, ~ω) =

n ^c

X

c=1

M c

~θ, ~ν(~ω, ∆ ⁺ , ∆ ⁻ )

−

n ^c

X

c=1

D c ln M c

~θ, ~ν(~ω, ∆ ⁺ , ∆ ⁻ )

+

n ^c

X

c=1

ln(D c !) +

n ^s

X

s=1

ω _s ² 2 + n s

2 ln(2π)

^(1.29)

1.4.4 Exemple simple

Pour terminer e hapitre, illustrons e qui a été disuté par un exemple simple. La

mesure d'unesetioneae

σ

^ombinant^deux ^anaux ^d'analyse^(que ^l'on^désignera ^par

e

^et

µ

ên ^référene ^à ^l'état ^nal ^étudié, ^par êxemple). ^Dans ^haque ânal, ^le ^nombre

d'événements attendu seompose du signaletde bruit de fond.Lenombre d'événements

de signal est relié à la setioneae de produtionpar le produit de ette dernière par

(18)

la luminosité

ℓ

êt ^l'eaité ^de ^séletion ôu âeptane

ξ _i=e,µ

^. ^Le ^nombre d'événements de bruit fond est estimé à partir de la luminosité

ℓ

^et ^de ^l'eaité ^de ^séletion

β i

^(qui

inlutlasetioneaethéorique,supposéeonnue).Lesnotationsgénériques introduites

préédemment deviennent :

~θ = (σ)

^,

~ν =





 β e

ξ _e β µ

ξ µ

ℓ







(1.30)

et pour le modèle :

M i

~θ, ~ν

= ℓ × (β i + ξ i × σ)

^(1.31)

On onsidère trois soures d'inertitude indépendantes : une erreur sur la mesure

de luminosité (

∆ℓ

^), ûne êrreur ^sur ^la âlibration ^de ^la ^simulation ⁽

∆ ^cal ν

⁾ êt ûne êrreur

théorique sur la setion eae du fond (

∆ ^th ν

^). ^Les ^matries ^d'erreur ^sont ^don ^des

matries

3 × 5

^. ^En^supposant^les ^erreurs symétriques,elles s'érivent :

∆ ^± = ∆ =







0 ∆ ^cal β _e ∆ ^th β _e 0 ∆ ^cal ξ e 0 0 ∆ ^cal β µ ∆ ^th β µ

0 ∆ ^cal ξ _µ 0

∆ℓ 0 0







(1.32)

Siles erreursentre

β _e

^et

ξ _e

^dues^à ^la^alibration^de ^la ^simulation^sontantiorrélées,'est- à-dire qu'une modiationde laalibration augmente

β e

^en ^diminuant

ξ e

^etinversement, ette antiorrélation pourra setraduire en prenant

∆ ^cal β e > 0

^et

∆ ^cal ξ e < 0

^.

Il y aura trois paramètres de nuisane indépendants

~ω

^, ^distribués normalement. Les paramètres de nuisaneen fontionde

~ω

^sont ^alors ^:

~ν = ~ν 0 + ~ω

^T

∆ =







β e0 +0 +ω 2 ∆ ^cal β e +ω 3 ∆ ^th β e

ξ e0 +0 +ω 2 ∆ ^cal ξ e +0

β _µ0 +0 +ω ₂ ∆ ^cal β _µ +ω ₃ ∆ ^th β _µ ξ µ0 +0 +ω 2 ∆ ^cal ξ µ +0

ℓ 0 +ω 1 ∆ℓ +0 +0







(1.33)

et nalement la fontionde vraisemblane devient :

L (σ, ~ω) = (2π) ⁻ ² ³ e ⁻

ω 2 1 + ω 2

2 + ω 2 3 2

Y

i=e,µ

e ^−ℓ×(β ⁱ ^+ξ ⁱ ^×σ) (ℓ × (β _i + ξ _i × σ)) ^D ⁱ

D i !

^(1.34)

Toutes lesappliations disutées dans lasuite de e mémoire reposeront sur la même

struture ave quelques omplexiations (augmentationdu nombre de paramètres ajus-

tés, de soures d'inertitudes, de anaux, diérentiationdes bruitsde fond,...).

(19)

(20)

olimpulherexstiteram,

dumignusegofueram.

Miser, miser!

modoniger

et ustusfortiter!

Cignusustus antat,CarminaBurana130

2

Implémentation des méthodes d'analyse

Dans e hapitre, nous allons dérire l'implémentation eetive des outils présentés

au hapitre préédent. La première étape onsiste à onstruire la fontion de vraisem-

blane 1.28, en fournissant le modèle, les données observées et les paramètres de nui-

sane (valeurnominaleetmatriesd'erreur) :

L = L (~θ, ~ω) = L

M(~θ, ~ω, ~ν ~ 0 , ∆ ⁺ , ∆ ⁻ ), ~ D

.

Ensuite, ette fontion sera utilisée pour onstruire numériquement soit la fontion de

vraisemblaneprolée, soitune densitébayesiennea posteriori. L'ensemble de es implé-

mentations formeleode Mefisto (Monte-CarloErrors Fit with Statistial Tools).

2.1 Ajustements monodimensionnels

2.1.1 Vraisemblane prolée

Lealulde lafontionde vraisemblaneprolée, passeparlaminimisationde

L

^rela-

tivementà

~ω

^pour^diérente^valeurs^de

θ ~

^.^Pourê ^faireôn^doit^xerûnênsemble^de^valeur

de

~ θ

^, ^et ^don ^xer ^des ^bornes ^de ^variations ^de

θ

^. Îl êst ^don împortant ^d'avoir ûne îdée

du résultatnal, pour xer e domaine(pour ouvrir larégion oùlerapport de vraisem-

blane

λ

^est^inférieur^à^12.5^soit

5σ

⁾^et^le^nombre^de^points^de^alul(typiquementquelque entaines pour un temps de alul raisonnable, de quelque minutes à quelques heures).

Ces pointsde aluls peuvent soit être hoisis aléatoirement(distribution uniforme),soit

former une grille à pas xe. Cette dernière solution est utilisé par le programme Hist-

Fatory basé sur Roofit [5℄ qui est utilisée par défaut dans les analyses de physique

du top dans l'expériene ATLAS. La grillealéatoireest utilisée dans Mefisto. Dans les

deux programmes,laminimisationde lafontion de vraisemblaneen haque pointde la

grille utilise le logiiel Minuit [6℄. La similaritédes deux implémentations va permettre

de valider,auhapite4,l'implémentationde lafontionde vraisemblanedans Mefisto

en omparant aux résultatsde HistFatory.

Unefois lafontion de vraisemblane proléeestimée,on en déduit

λ

^en ^divisant^par

leminimumglobal.On dispose,àlan, durapportde vraisemblaneévalué surune grille

disrète.Eninterpolantlaourbeobtenue,onpeutrésoudrenumériquementl'équation1.9

(21)

l'inertitude de mesure totale (statistique+systématique). L'inertitude statistique seule

peut s'évaluer en étudiant la fontionde vraisemblanedes paramètres

~θ

^seuls, ^en ^xant

les paramètresde nuisane àleur valeur nominale

~ν = ~ν ₀

^.

2.1.2 Intégration bayesienne simple

Le alul d'une intégrale de la forme

I = R b

a f (x)g(x)dx

^, ^où

g(x)

^est ^une ^densité ^de

probabilitésurl'intervalle

[a; b]

^,^revient^au^alul^de ^la^valeur^moyenne^de^la^fontion

f(x)

^.

Cette moyenne peut être approximée par l'estimateur de moyenne empirique:

I ˆ = b − a n

n

X

i=1

f (x i )

où les

x _i

^onstituent ^un ^éhantillon ^de

n

réalisations d'une variable aléatoire distribuée selon

g(x)

^.^Cet ^estimateur ^onverge ^vers

I

^quand ^la^taille^de l'éhantillon devient grande ave unéart-type

σ I ˆ = σ g / √

n

^,

σ g

^étantl'éart-typedeladistribution

g

^.^C'est^le^prinipe

de l'intégration Monte-Carlo.

En utilisant la méthode préédente pour générer aléatoirement des réalisations des

paramètres de nuisanedistribués selon ladensité a priori, le alul de l'intégrale sur les

paramètres de nuisanedevient :

f(~θ) ∝ Z

L (~θ, ~ν)π(θ)k (~ν) d~ν ≈ π(θ) n

n

X

i=1

L (~θ, ~ν i )

La taille

n

^de l'éhantillon à moyenner doit être susamment grande pour parourir l'ensembledel'espaedesparamètresdenuisane.Engénéralquelquesdizainesàquelques

entainesdemilliersd'itérationssusent.Deplus,lorsd'uneévaluationnumérique,ilfaut

eetuerealulpourunensemblede valeursde

~θ

^et^alulerl'intégralesur

~θ

^en^inluant

la densitéa prioride

~θ

^pour ^déterminer ^la normalisationde la densitéa priori.

Iienore erreurssystématiques et statistiquessontentièrement intégréesdans lalar-

geur de la densité a posteriori. Cei est illustré sur la gure 2.1. La partie gauhe de

la gure montre la fontion de vraisemblane pour plusieurs réalisations des paramètres

de nuisane tirées aléatoirement suivant la densité a priori appropriée, omme dérit au

paragraphe 1.4.2. Laourbe violette (

~ν 0

⁾ ^orrespond ^à ^la ^valeur ^entrale ^des ^paramètres

de nuisane. Lesparamètres utilisésorrespondent àunemesure desetion eae single

top en voie

s

^dans l'expériene DØ [7℄.

La somme des es ourbes (en utilisant beauoup plus de utuations) permet de

aluler l'intégralequi orrespond exatement, dans leas d'un a priori uniforme sur un

intervallesusammentlarge, à ladensité a posteriori (ourbe de droite).

L'inertitude statistique est quantiée par la largeur moyenne des fontions de vrai-

semblane pour

~ν

^xé.

Dans le programme Mefisto, à la n de l'intégration, on dispose ette fois de la

densité a posteriori évaluée sur une grille aléatoire, à un fateur de normalisation près.

Parinterpolation,ilestalorsaisédealulerl'intégraledenormalisation,dedéterminerla

valeurlaplus probable etnalementd'obtenir des intervalles de onane oudes limites.

(22)

-20 -15 -10 -5 0 5 10 θ 15 i )

ν θ , L(

ν 0

ν 1

ν 2

ν 3

ν 4

ν 5

ν 6

ν 7

ν 8

...

-20 -15 -10 -5 0 5 10 θ 15

θ ) L(

⇒ Σ

stat ⇒

∆

∆ syst

<<L max

δ

syst

⊕

∆ stat

Fig.2.1: Desription shématique del'intégration surles paramètres de nuisane.

2.2 Ajustement de plusieurs paramètres

Pour un problème unidimensionnel, quelques entaines de points de alul susent.

Lorsqu'on souhaiteétendre àun ajustement de plusieurs paramètres,la taillede la grille

d'évaluationaugmente exponentiellementave lenombre de paramètres.Elle devient ra-

pidement trop grande pour être alulée en un temps raisonnable. De même, lors du

développement d'uneanalyse, notammentpour optimiserertaines oupures, ilpeut être

souhaitable de reproduire un grand nombre de fois le alul de la densité a posteriori,

mêmeunidimensionnelle,etdonde pouvoirfairelealulrapidement,auprixd'approxi-

mations supplémentaires.

2.2.1 Grille et éhantillonnage

Il est utile, à e stade, de disuter la présentation onrète des résultats numériques.

Unedensitédeprobabilitépeutêtreobtenuesousdeuxformes :uneexpression analytique

ouun ensemble de pointsdistribués selonette probabilité.Pour desproblèmes susam-

ment omplexes, un alulanalytique tel l'intégration sur les paramètres de nuisane est

exlu. Si on est apable de déterminer la valeur de la densité a posteriori

f (~θ)

^en ^un

point donné de l'espae des paramètres, on peut substituer à la fontion analytique une

évaluation de la densité sur une grille uniforme (aléatoire ou à pas xe). On disposera

don de deux représentations possibles du résultatde lamesure :

•

^Une ^fontion ^:^des ^ouples

n

~θ i , f (~θ i ) o

i=1..n

ave

~ θ i

^distribués uniformément.

•

^Un ^éhantillon ^: ^des ^valeurs

n

~θ i

o

i=1..n

distribuées selon la densité

f (~θ)

^.

La première approhe autorise le alul d'intégrales et d'intervalles de onane. La

seonde approhe permet très simplement d'obtenir la distribution marginale de haque

variable (dans le as d'un problème multidimensionnel) et d'eetuer un hangement de

variable.Il pourra s'avérer utile de passerd'une représentation àl'autre.

Dans le as le plus général on utilisera des événements pondérés, soit des ouples

n (~θ i , w i ) o

.Danse as ladistribution(histogramme)des

~θ i

^pondérés ^par

ω i

^permet^d'es-

(23)

-20 -15 -10 -5 0 5 10 15 θ 20 0

2 4 6 8

θ ) f(

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1

0 20 40 60 80 100

-20 -15 -10 -5 0 5 10 15 θ 20

) θ f(

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

Fig. 2.2:Représentation deladensitépar200 ouples

n ~θ _i , f (~θ _i ) o

. Agauhe: ladistribution

uniforme des

θ _i

^(en ^haut) ^et ^la distribution des poids (en bas). A droite : la densité pondérée (histogramme ave inertitudes) et legraphe

n ~ θ i , f ( ~ θ i ) o

(pointsnoirs).

timer la densitéa posteriori.

Dans le as limite où tous les poids valent 1, l'information est omplètement ontenue

dans la distribution des

~θ i

^.

A l'inverse la représentation

n ~θ i , f(~θ i ) o

orrespond à l'autre as limite où toute l'in-

formation est ontenue dans les poids

ω i = f (~θ i )

^et ^les

θ i

^uniformes n'apportent auune information.Danse seul as,ilexiste deux façons de visualiserladensité

f (θ)

^:^traer^le

graphe des ouples

n ~ θ _i , f (~θ i ) o

(e qui permet une estimation analytique par interpo-

lation) oula distributionpondérée de

~θ i

^. ^La^première ^solution^est ^néanmoins^plus ^préise

et permet d'utiliserun éhantillon de tailleplus modesteomme l'illustrela gure 2.2.

2.2.2 Méthode approximée

An de dénir une proédure simpliée et plus rapide, ommençons par approfondir

le prinipe de l'intégration sur les paramètres de nuisane à partirde lagure 2.1.

Les paramètres de nuisane modient la position de haque distribution, qui peut

être évaluée par lemode

θ max

(estimateur du maximumde vraisemblane): ladispersion de l'estimateur du maximum de vraisemblane mesure l'erreur systématique. Lors de

l'intégrationsur lesparamètresde nuisane,onombinees deuxeets etlalargeurnale

de ladistribution a posteriori donneune erreur ombinée.

Deplus,lavaleurdu maximumde lavraisemblane

L ^max = L (θ max )

^mesure^la^qualité

de l'ajustement.Unparamètrede nuisanen'estpas ajustable etdonhaque utuation

doit menerà un ajustementde qualité similaire.

L ^max

^étant^une ^variable ^aléatoire,^sa ^va-

leurpeututuerd'unjeudeparamètresàl'autremaisons'attend àe quelautuation

relative reste faible.

A partir de ette analyse, on onstate que, pour estimer l'eet des inertitudes sys-

tématiques, on peut se ontenter de mesurer, pour haque utuation, la fontion de

vraisemblane en un seul point, son maximum. Pour haque utuation on détermine la

(24)

valeurdes paramètres

~ θ

^qui^maximisent^lavraisemblane.On obtientainsi un éhantillon de valeurs

~θ

^, ^qu'il ^faut ^pondérer ^le ^as ^éhéant ^par ^la ^valeur ^de ^la ^densité ^a ^priori ^pour

~θ

^. ^Pour ûn â ^priori ûniforme ^borné êi ^revient ^à ^rejeter ^les ^points ^hors ^de ^l'intervâlle

onsidéré. Rigoureusement, il faudrait également pondérer haque valeur par sa proba-

bilité, soitla valeur maximale de la fontion de vraisemblane. On peut néanmoins s'en

dispenser pour peu que ladispersion relativede

L ^max

^soit^faible^(f.

δ

^sur ^la ^gure^2.1).

La diulté prinipale onsiste à intégrer l'erreur statistique à ette approhe. Pour

elailfaudraitnonpasprendrelemaximumdelafontiondevraisemblanemaisl'éhan-

tillonner en tirant un ou plusieurs points aléatoirement selon ette distribution. Cette

approhe sera traitéeexatement auparagraphe suivant.

Dansle as de l'estimation du résultat attendu (mesure de sensibilitéd'une analyse),

onxelesparamètresàajusteràunevaleurattenduee quipermetde alulerlenombre

d'événements attendu :

D ~ = M ~ (~θ 0 , ~ν)

^. Ôn ^peut âlors âpproximer ^l'erreur statistique en utilisant une propriété de la loi de Poisson :

P (λ, n) ≈ P (n, λ)

^. Âinsi ên ^faisant ûtuer

le nombre d'événements

D c

^dans ^haque ^anal

c

^selon ^une ^loi ^de ^Poisson ^de ^paramètre

λ = D c

^, ^et ^en ^herhant ^le ^maximum ^de ^la ^fontion vraisemblane on obtient un ré- sultat similaire à elui onsistant à tirer aléatoirement des points selon la fontion de

vraisemblane.Cetteméthoden'est plus appliablelorsd'unemesureréelle oùlenombre

d'événements mesuré est une grandeur xe.

2.2.3 Monte-Carlo par haînes de Markov (MCMC)

L'approhe préédente résoutleproblèmedu alulrapide,maisest, en touterigueur,

fausse, autant d'un point de vue fréquentiste que bayesien. Pour traiter exatement le

problèmebayesien,nousallonsonserverl'idéed'éhantillonnerladensitéaposteriorimais

de manièreexate. On a pour ela reours à un Monte-Carlopar haînes de Markov [8℄.

2.2.3.1 Chaînes de Markov

Unehaîne de Markov est une série

~θ n

^de réalisations de variables aléatoires

Θ ~ n

^telle

que laprobabilitéde la réalisation

i + 1

^ne ^dépend ^que^de ^laréalisationpréédente, soit:

P ( Θ ~ _i+1 = ~θ i+1 ) = P ( Θ ~ _i+1 = ~θ i+1 | Θ ~ _i = ~θ i )

^(2.1)

Une telle haîne peut être utilisée, sous ertaines onditions, pour éhantillonner une

densité de probabilité

f(~θ)

^.^La ^haîne ^est ^dite ^ergodique ^si,indépendamment du premier élément de la haîne, la densité

f Θ ~ ⁱ (~θ i )

^de

Θ ~ i

^onverge ^vers ^elle ^de

f(~θ)

^. ^Ainsi, ^à ^partir

d'une ertaine itération

n

^, ^la ^haîne ^fournit ^une ^bonne approximation d'un éhantillon distribué selon

f(~θ)

^.^En^revanhe ^un ^tel^éhantillon ^n'est ^pas ^simple^puisque ^les^variables

aléatoires ne sont pas indépendantes.

L'algorithmeMetropolis-Hastings[8℄permetderéerunehaîneergodique.Ilonsiste

à onstruire l'élément

i + 1

^à^partir ^de ^l'élément

i

^de ^la ^manière^suivante ^:

•

^On ^tirealéatoirementune valeur

~θ ^⋆

^selon^une ^densité

q(~θ ^⋆ | ~θ i )

^,^dite^fontion^d'éhan-

tillonnage.

•

^On ^détermine ^laprobabilité

α(~θ i , ~θ ^⋆ )

^de ^transition^de

~ θ _i

^vers

~θ ^⋆

^selon ^:

α(~θ i , ~θ ^⋆ ) = min

(

1, f(~θ ^⋆ ) f (~θ i )

q(~θ i | ~θ ^⋆ ) q(~θ ^⋆ | ~θ i )

)

(2.2)

où

f(~θ)

^est ^la^densité ^àéhantillonner.

The DART-Europe E-theses Portal

HAL Id: tel-00713314

https://tel.archives-ouvertes.fr/tel-00713314

Submitted on 29 Jun 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Benoit Clément

To cite this version:

Benoit Clément. Ajustements Bayésiens, application à physique du quark top au LHC. Physique des

Hautes Energies - Expérience [hep-ex]. Université de Grenoble, 2012. �tel-00713314�

Mémoire

présenté pour obtenir le diplôme d’

HABILITATION À DIRIGER LES RECHERCHES

Spécialité : Physique

Présentée par

Benoit CLEMENT

Docteur de l’Université Louis Pasteur (Strasbourg I)

Maître de conférence à l’Université Joseph Fourier (Grenoble I)

préparée au Laboratoire de Physique Subatomique et de Cosmologie Ecole doctorale de physique

Ajustements bayésiens,

application à la physique du quark top au LHC

HDR soutenue publiquement le 22 juin 2012, devant le jury composé de :

M. Gilles HENRI

Professeur des Universités, IPAG (Grenoble), Président

M. Daniel BLOCH

Directeur de recherche, IPHC (Strasbourg), Rapporteur

M. Mossadek TALBY

Professeur des Universités, CPPM (Marseille), Rapporteur

M. Laurent DEROME

Maître de conférences, LPSC (Grenoble), Rapporteur

M. Julien DONINI

Professeur des Universités, LPC (Clermont-Ferrand), Examinateur

tW

benchmark

CSC

1

x = X ± ∆X

x = X −∆X1 +∆X2

∼ 1/ √

t

t

x = X ± ∆X stat ± ∆X syst

[a, b]

P (a < X < b) =

Z b a

f X (x)dx = α,

α

σ

µ

[µ − σ; µ + σ]

68.3%

~

m = { m 1 , m 2 , . . . , m n }

X ~ = { X 1 , X 2 , . . . , X n }

f X ~ (~x)

~x

~θ

~θ

~ θ

f X ~ (~x)

~θ

k(~x, ~θ)

•

X ~

~x

X ~

~θ

~θ = ~θ 0

~ θ 0

f X ~ (~x) = k(~x, ~θ 0 )

Z

f X ~ (~x)d~x = 1.

•

~θ

~θ

~x

m ~

L (~θ) = k( m, ~θ). ~

~θ

~θ

x = X _−∆X1 ^+∆X2

P θ ₀ ∈ h

Σ = L ⁻¹

∂ ² ln L (~θ)

∂θ _i ∂θ _j _~

Σ = ˆ ˆ L ⁻¹

L ij = − ∂ ² ln L (~θ)

_~

χ ²

f χ ² (x; n θ )dx.

− ln λ(θ) = n ²