HAL Id: tel-00713314
https://tel.archives-ouvertes.fr/tel-00713314
Submitted on 29 Jun 2012
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Benoit Clément
To cite this version:
Benoit Clément. Ajustements Bayésiens, application à physique du quark top au LHC. Physique des
Hautes Energies - Expérience [hep-ex]. Université de Grenoble, 2012. �tel-00713314�
Mémoire
présenté pour obtenir le diplôme d’
HABILITATION À DIRIGER LES RECHERCHES
Spécialité : Physique
Présentée par
Benoit CLEMENT
Docteur de l’Université Louis Pasteur (Strasbourg I)
Maître de conférence à l’Université Joseph Fourier (Grenoble I)
préparée au Laboratoire de Physique Subatomique et de Cosmologie Ecole doctorale de physique
Ajustements bayésiens,
application à la physique du quark top au LHC
HDR soutenue publiquement le 22 juin 2012, devant le jury composé de :
M. Gilles HENRI
Professeur des Universités, IPAG (Grenoble), Président
M. Daniel BLOCH
Directeur de recherche, IPHC (Strasbourg), Rapporteur
M. Mossadek TALBY
Professeur des Universités, CPPM (Marseille), Rapporteur
M. Laurent DEROME
Maître de conférences, LPSC (Grenoble), Rapporteur
M. Julien DONINI
Professeur des Universités, LPC (Clermont-Ferrand), Examinateur
Introdution 1
1 Analyse statistique et erreurs systématiques 3
1.1 Mesure et inertitude . . . 3
1.2 Estimationetfontion de vraisemblane . . . 4
1.2.1 Approhe fréquentiste : maximumde vraisemblane . . . 5
1.2.2 Approhe bayésienne : densitéa posteriori . . . 6
1.3 Inertitudes systématiques . . . 7
1.3.1 Approhe fréquentiste : vraisemblane prolée . . . 8
1.3.2 Approhe bayésienne . . . 9
1.4 Vraisemblane de Poisson . . . 10
1.4.1 Comptage d'événements . . . 10
1.4.2 Soures d'erreurs . . . 10
1.4.3 Fontion de vraisemblanedu problème . . . 11
1.4.4 Exemple simple . . . 12
2 Implémentation des méthodes d'analyse 15 2.1 Ajustements monodimensionnels. . . 15
2.1.1 Vraisemblane prolée . . . 15
2.1.2 Intégration bayesienne simple . . . 16
2.2 Ajustement de plusieurs paramètres . . . 17
2.2.1 Grilleet éhantillonnage . . . 17
2.2.2 Méthode approximée . . . 18
2.2.3 Monte-Carlo par haînes de Markov (MCMC) . . . 19
2.2.3.1 Chaînes de Markov . . . 19
2.2.3.2 Appliationau problème étudié . . . 20
3 Physique du top au LHC 23 3.1 Le LHCet ledéteteur ATLAS . . . 23
3.2 Le Modèle Standard et lequark top . . . 24
3.2.1 Le modèle standard et ses limites . . . 24
3.2.2 Le quarktop . . . 25
3.3 Produtionassoiée
tW
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 283.3.1 Motivation. . . 28
3.3.2 Bruits de fond etséletions. . . 29
3.3.3 Estimationdes fonds et de l'aeptane . . . 31
3.3.4 Erreurs systématiques . . . 33
3.3.5 Résultat nal . . . 34
4.1 Extrationdes résultatsATLAS . . . 37
4.2 Validationà une dimension. . . 39
4.3 Analyse bayésienne multidimensionnelle. . . 41
5 Perspetives : analyse ombinée des 3 voies single top 45 5.1 Single top etnouvellephysique. . . 45
5.1.1 Proessus
benchmark
. . . . . . . . . . . . . . . . . . . . . . . . . . 455.1.2 Paramétrisation générique . . . 47
5.2 Analyses
CSC
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485.2.1 Séletions . . . 48
5.2.2 Analyse ombinée . . . 49
5.3 Conlusions . . . 54
Conlusion 57
Bibliographie 59
Depuis une dizaine d'années, les méthodes statistiquesjouent un rle de plus en plus
important en physique des partiules. L'amélioration des apaités de alul des ordina-
teurs y est pour beauoup. Elles trouvent de nombreuses appliations en théorie (aluls
sur réseau, sondage d'espaes de paramètres de modèles, ...), dans lasimulation de pro-
essusphysiques(générateurs Monte-Carlo,simulationde déteteur)etdansl'analysedes
données (méthodes multivariées pour la séletion d'événements, intégration de soures
d'erreurs systématiques etalul de limites).
A partir de 2004, les physiiens du Tevatron ont été parmi les premiers à mettre en
÷uvre, dans le adre de la reherhe des proessus de prodution életrofaible du quark
top,unegrandevariétédeméthodesmultivariées(arbresdedéision,réseauxdeneurones)
oupléesàuneanalysebayésiennesophistiquéepourinlurelesinertitudessystématiques.
Ces analyses ont permis la mise en évidene de ette prodution életrofaible ave un
volume de données bien inférieurà e quiavaitété estimé préédemment.
Les expérienes du LHC ont naturellement adopté es tehniques et en proposent de
nouvelles. Danse mémoire, nous allons nous onentrer sur l'ajustement de paramètres
physiques ave estimation de l'inertitude de mesure, soit pour déterminer et optimiser
la sensibilité d'une analyse, soit pour extraire le résultat nal. Les diérentes méthodes
disutées, en partiulier une approhe originale d'intégration bayésienne par haînes de
Markov, font l'objet d'une implémentation dans un programme. Nous utiliserons alors
les reherhes de prodution életrofaible du quark top dans les premières données du
LHC pour illustrer et valider es diérents outils. Enn, le dernier hapitre prospetif
sera onsaré à l'utilisation future de es mêmes outils pour ontraindre des modèles de
physique au-delàdu modèle standard.
oÎlomènhn,£mur> >AqaioØlge>êjhke,
polld>Êfjmouyuq^Aðdiproòayen
r¸wn,aÎtoÌdà ál¸riateÜqekÔnessin
oÊwnoØste psi,Diäd>âteleetoboul ,
âx oÝdtprÀtadiast thnârsante
>AtreòdhtenaxndrÀnkaÈdØo>AqilleÔ.
Homère,Iliade I.1
1
Analyse statistique et erreurs systématiques
1.1 Mesure et inertitude
Lerésultatd'unemesure,qu'ilsoitobtenudiretementd'uneexpérieneoudérivéd'un
ouplusieursrésultatsexpérimentaux,onsisteen uneouplusieursvaleursnumériquesqui
onstitue la valeur entralede lamesure utiliséepour estimerlavaleur vraie d'une
grandeur physique.
L'une des prinipales problématiques onerne alors la onane ou la rédibilité que
l'on aorde à e résultat. Pour une valeur numérique unique, la présentation la plus
lassique pour ette informationest la barred'erreur oud'inertitude 1
de laforme :
x = X ± ∆X
oùx = X −∆X1 +∆X2
(1.1)L'inertitudedénitdon un intervalleontenant probablementlavaleur vraiede lagran-
deurmesurée.Dansettereprésentationlabarred'erreurontientlavaleurentrale.Dans
le premier as labarre d'erreur est symétrique autour de ette valeur entrale, alors que
le seond traduit une plus forte probabilité de utuation d'un oté que de l'autre de
la valeur entrale. Enn dans ertains as, on souhaite séparer ertaines ontributions
à l'inertitude, par exemple les eets statistiques et systématiques. Cette séparation est
partiulièrement pertinente pour disuter des possibilités d'amélioration du résultat par
de futures expérienes (rédutionde l'erreurstatistique)oude nouvelles analyses (rédu-
tions des eets systématiques). Par exemple, les eets statistiques se réduisent par une
aumulationplus grandede données ave,sil'appareillagereste identique, uneévolution
de l'erreuren
∼ 1/ √
t
,t
étant la durée de la mesure. La rédution d'eets systématiques passe par une meilleure ompréhension de l'appareillage de mesure (qui peut néessiterune statistique arue) et/ou un hangement de tehniques de mesure et d'analyse. On
1
Certainsassoientlanotiond'erreuràelledebiais,equisous-entendunepossibilitédeorretion,
alors quel'inertitude est purement aléatoire.Dans lesdiérentes situations que nousallons parourir,
leserreursneserontpasestimablesautrementqueparunintervalledeonaneetseronttraitéesomme
des utuations aléatoires : si auune valeur de l'erreurne peut être préisément estimée alors toutes
les valeurs possibles (i.e. dans la barre d'erreur) doivent être onsidérées.Ainsi les termes d'erreur ou
d'inertitudeserontutilisésindiéremmentpourdésignerlemêmeonept.
x = X ± ∆X stat ± ∆X syst
(1.2)En reliantl'inertitudeà une mesure de dispersion proportionnelleà lavariane,l'erreur
totale s'obtient en sommant les diérentes omposantes (supposées indépendantes) en
quadrature.
L'intervalle de onane permet de donner une dénition plus rigoureuse du onept
d'inertitude, le niveau de onane quantiant la probabilité de trouver la valeur vraie
dans la barre d'erreur. Un intervallede onane est un intervalle
[a, b]
tel que:P (a < X < b) =
Z b a
f X (x)dx = α,
(1.3)α
étantleniveaudeonanedel'intervalle.L'éart-typeσ
permetdedénirunintervallede onane autour de la valeur moyenne
µ
, de la forme[µ − σ; µ + σ]
. Dans le asd'une densité normale, et intervalleorrespond à un niveau de onane de
68.3%
. Parextension, 'est la valeur du niveau de onane que l'on assoiegénéralement(mais pas
néessairement) à une barred'erreur.
1.2 Estimation et fontion de vraisemblane
Unemesure brutese ompose d'un éhantillon d'une ouplusieurs valeurs numériques
~
m = { m 1 , m 2 , . . . , m n }
, réalisationd'une variable aléatoireX ~ = { X 1 , X 2 , . . . , X n }
. L'en-semble de es variables aléatoires est dérit par une densité de probabilité
f X ~ (~x)
où~x
désigne une réalisationquelonque.
Parailleursonvautiliseres données pour déterminerouontraindreun ouplusieurs
paramètres physiques
~θ
(masses, setion eae, ...) que l'on souhaiteestimer, soitaveune valeur numérique, soit par un intervalle de onane ou une limite. Les données
mesurées sontsensiblesaux paramètres
~θ
,silerésultatattendu de lamesureest diérentpour des valeurs diérentes de
~ θ
. Ainsi, la densitéf X ~ (~x)
doit dépendre des paramètres~θ
. D'un point de vue purement mathématique, on peut onsidérer une fontion générale dont les variables seraient à la fois les variables aléatoires et les paramètres à estimer.Notons ette fontion
k(~x, ~θ)
. A partirde ette fontion ononstruit 2 objets :•
Ladensitéde probabilitédeX ~
,quiestunefontionduseulveteur~x
,réalisation deX ~
,lesparamètres~θ
étant xés àune valeur~θ = ~θ 0
unique.Cette valeur~ θ 0
est lavaleur vraie des paramètres :
f X ~ (~x) = k(~x, ~θ 0 )
etZ
f X ~ (~x)d~x = 1.
(1.4)•
Lafontion de vraisemblanedesparamètres~θ
oùonne onsidèrequeladépen-dane en
~θ
, en xant~x
àla mesurem ~
:L (~θ) = k( m, ~θ). ~
(1.5)La diérene fondamentale entre les approhes fréquentiste et bayésienne, que nous
allons disuterdans lesprohains paragraphes,tientdans lestatutdonnéauxparamètres
~θ
. Dansl'approhe fréquentiste,~θ
possède une unique valeur, quel'on tente d'estimer aumieux : les données permettent de onstruire des estimateurs de la valeur entrale etdes
Dans l'approhe bayésienne, les paramètres sont eux-mêmes traités omme des variables
aléatoires, dérites par une densité de probabilité : au vu des données, on aorde une
plus grande rédibilité à ertaines valeurs des paramètres qu'à d'autres, 'est la densité
de probabilitéa posteriori. Cettedensitédes paramètrespermetàson tourde dénirune
valeurentrale et des intervalles de onane.
1.2.1 Approhe fréquentiste : maximum de vraisemblane
La fontion de vraisemblane n'est pas une densité de probabilité. Elle mesure néan-
moinslarédibilitéassoiéeàhaquevaleurpossibledesparamètres.
L (~θ 0 )
quantie donla ompatibilité des données ave l'hypothèse
~ θ = ~θ 0
. L'estimateur naturel qui en dé- oule pour~ θ
est la valeur~θ ˆ
telle que la fontion de vraisemblane soit maximale : 'est l'estimateur du maximum de vraisemblane.Un estimateur
~θ ˆ
(par exemple le maximum de vraisemblane) est une variable aléa- toire. Dans le as d'un unique paramètre, un intervalle déni par deux fontions deθ ˆ
,h
ξ(ˆ θ), ω(ˆ θ) i
,est également une variablealéatoire.Sionrépète l'expériene plusieurs fois,
onvaobtenirdiérentes valeursdel'estimateuretdel'intervalle,quipeut ontenirounon
lavaleurvraie
θ 0
:onpeutdon dénirausens fréquentiste laprobabilitéque l'intervalle ontiennelavaleur vraie.L'intervalleh
ξ(ˆ θ), ω(ˆ θ) i
est unintervallede onanede niveau
α
si :P θ 0 ∈ h
ξ(ˆ θ), ω(ˆ θ) i
= α.
(1.6)quelle que soit la valeur de
θ
. La onstrution exate de l'intervalle de onane, diteonstrution de Neyman [1℄, peut se révéler très oûteuse en temps de alul.
On aleplus souvent reoursà des propriétésasymptotiques (valablesrigoureusement
dans lalimite d'un éhantillon inni) de l'estimateur de maximum de vraisemblane. La
loi de probabilité de l'estimateuronverge vers la loimultinormale.L'estimateur est non
biaisé asymptotiquement, lamoyenne de la loimultinormale orrespond don à lavaleur
vraie
~θ 0
. Le maximum de vraisemblane est également de variane minimale. Il atteint asymptotiquementlaborne deRao-Cramer-Fréhetetsamatriede ovarianeest alors:Σ = L −1
aveL ij = − E
"
∂ 2 ln L (~θ)
∂θ i ∂θ j ~
θ= ~ θ ˆ
#
,
(1.7)la valeur moyenne portant sur la variable aléatoire
X ~
. Dans la pratique, on ne disposeque d'une réalisationde
L
.Finalementon onstruit un estimateur de la ovariane par :Σ = ˆ ˆ L −1
aveL ij = − ∂ 2 ln L (~θ)
∂θ i ∂θ j
~
θ= ~ θ ˆ
(1.8)
Onpeutdéterminerplusorretementlamatriedeovarianepardespseudo-expérienes
Monte-Carlo.
On utilise enn le rapport de vraisemblane
λ = L (~θ)/ L ( ~θ) ˆ
dont le logarithme suit(toujoursasymptotiquement)uneloide
χ 2
àn θ
(nombrede paramètres)degrésdelibertés pouronstruire des intervalles de onane.Lesbornesd'un intervallepour un niveau deonane
α
satisfont l'équation:− 2 ln λ(~θ) = β(n θ , α)
oùβ
est déni parα =
Z β(n θ ,α) 0
f χ 2 (x; n θ )dx.
(1.9)− ln λ(θ) = n 2
2 ,
(1.10)qui dénitlesbornesd'un intervalleà
nσ
(i.e. dontleniveau de onane est égalàeluide l'intervalle
µ ± nσ
d'une loinormale,soit 68.3%pourn = 1
,95.4% pourn = 2
, ...).1.2.2 Approhe bayésienne : densité a posteriori
L'approhebayésienneestaprioriplussimple.Laprobabilitéest simplementinterpré-
tée omme un degré de onane. On peut alors assoier une densité de probabilité aux
paramètres
~θ
. Après un ensemble de mesures~x
, la densité de probabilité des paramètres du modèleontraintepares mesures estladensitéonditionnellef(~θ | ~x)
,appelée densitéa posteriori. Enutilisantle théorème de Bayes, on a:
f (~θ | ~x) = f(~x | ~θ)f (~θ)
f(~x)
soitf (
modèle|
mesure) = f(
mesure|
modèle)f(
modèle)
f (
mesure) .
(1.11)Cette expression faitapparaître trois fateurs :
f (~x | ~θ)
est la probabilité des mesures pour une valeur déterminée de~θ
. C'est lafontion de vraisemblane
L (~θ)
dénie préédemment.
f (θ) = π(~θ)
est la densité de probabilité des paramètres avant la mesure nommée densité a priorides paramètres.Cette densité est souvent xée arbitrairement.
f (~x)
estladensitéprobabilitédelamesure~x
.C'estunegrandeurnumériqueonstantequi joueun simple rle de normalisationde ladensité a posteriori.
Laprobabilité a posteriori peut se réérire:
f (~θ | ~x) = L (~θ)π(~θ)
R f (~x | ~θ)π(~θ)d~θ
(1.12)Le hoix le plus fréquent pour la densité a priori est une densité uniforme sur un
intervalle
[a, b]
. Cette densité traduit l'absene d'a priori sur la valeur des paramètres.Si lafontion de vraisemblane tombegénéralementà 0pour des valeurs des paramètres
loindu maximum de vraisemblane,on peut hoisir
[a, b]
tel que:f(~θ | ~x) ∝ L (~θ).
(1.13)Si e n'est pas le as, elà indique que la mesure n'est pas ou peu sensible au paramètre
estimé.
Cette densité a priori permet également de borner les paramètres en imposant un a
priorinuldanslesrégionsnon-physiques. Dansleas d'unemesuredesetioneae, on
oupera la partienégative de lafontion de vraisemblane.
Si la partie de fontion de vraisemblane oupée par l'a priori n'est pas négligeable,
l'approximationpréédente devient fausse etilfautrealuler lanormalisationde laden-
sité a posteriori. Un autre hoix pour la densité a priori serait de prendre la densité du
paramètre estimée par une mesure préédente. Le hoix arbitraire de ette densité est le
point faible de ette approhe. En partiulier, le résultat nal ne sera pas invariant par
hangement de variable: hoisir
θ
oulog(θ)
uniformene onduira pas à lamême densitéde es hoix. Le hoix de la densité a priori reste subjetif et pour plusieurs a priori
raisonnables (enore de lasubjetivité!), lerésultat a posterioridoit être similaire.
Leonept de l'analyse bayésienne est don de partird'une onnaissane a priorides
paramètres du modèle et de onstruire la densité a posteriori inluant l'informationap-
portéparlamesure.Lamesurefavoriseertaines valeursdes paramètres,laplusprobable
étantlemaximumdelafontiondevraisemblanesielle-in'estpastronquéeparladen-
sité a priori. Lamesuremodiedon ledegréde rédibilitéassoiée auxvaleurspossibles
des paramètres (densité a posteriori). Contrairement au as fréquentiste, il n'y a plus
d'estimateur et onobtient diretementune densitéde probabilité pour les paramètres, à
partir de laquelle onpeut dénir une valeur entrale (moyenne, médianeouplus souvent
lemode quiorrespond aumaximumde vraisemblanepour un a prioriuniforme)etune
barre d'erreur via un intervallede onane
[a, b]
pour un niveau de onaneα
telque :Z b
a
f(~θ | ~x)d~θ = α
(1.14)Pour dénir l'intervallede manière unique, on doit xer des ritères supplémentaires. A
une dimensionon peut hoisir par exemple :
un intervalle symétriqueautour de la valeur entrale
c
:[c − k, c + k]
.un intervalle entré en probabilité autour de la valeur entrale
c
:[a, b]
tel queR c
a f (θ | ~x)dθ = R b
c f(θ | ~x)dθ = α/2
.un intervalle
[a, b]
tel quef(a | ~x) = f (b | ~x)
etf (u | ~x) > f(b | ~x)
pour toutu ∈ [a, b]
.Cette dénition orrespond à l'intervalleHPD (Highest ProbabilityDensity) etor-
respond à l'intervalle fréquentiste déni par le rapport de vraisemblane. Ce type
d'intervallesegénéralise simplementàdes ontours multidimensionnelsetest indé-
pendant du hoix d'unevaleur entrale.
Ces trois type d'intervallesontillustrés sur la gure 1.1.
x
0 2 4 6 8 10 12 14
densite de probabilite f(x)
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22
µ x
0 2 4 6 8 10 12 14
densite de probabilite f(x)
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22
µ x
0 2 4 6 8 10 12 14
densite de probabilite f(x)
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22
µ
Fig. 1.1: Exemples d'intervalle de onane à 68% : entré sur la moyenne (à gauhe), entré
sur lamoyenne en probabilité (au entre),intervalleHPD (à droite).
1.3 Inertitudes systématiques
La prinipale diulté, que nous allons disuter maintenant, est l'inlusion d'iner-
titudes systématiques dans l'estimation par intervalle. Ce point est relativement simple
dans le as bayésien mais peut se révéler très déliat dans le ontexte fréquentiste. Il
serait même possible d'argumenter que le onept même d'inertitude systématique n'a
pas de sens dans une interprétation purement fréquentiste. Nous nous ontenterons de
dérire une approhe possible parmi les diérentes solutions de e problème qui ont pu
onpeutdistinguerlesparamètres
~θ
quel'onsouhaiteréellementontraindreeteux~ν
dontononnaît lavaleur
~ν est
ave une inertitude∆~ν est
(ette notationpouvantorrespondre à une matrie de ovariane, par exemple). Ces derniers onstituent les paramètres denuisane.
1.3.1 Approhe fréquentiste : vraisemblane prolée
L'éartentre lavaleuronnue etlavaleurvraied'unparamètredenuisanereprésente
un biais, que l'on doit pouvoir estimer.La valeur onnue des paramètres de nuisane re-
présenteainsiuneréalisationd'unestimateur,etl'inertitudesurleparamètres'interprète
ommesavariane.Apartirde ledensitéde probabilitédeet estimateur,onassoieune
fontiondevraisemblane
L nuisance (~ν; ~ν est ; ∆~ν est )
auxparamètresdenuisane.Lafontionde vraisemblane totale du problème s'érit alors :
L (~θ, ~ν ) = L
modèle(~θ, ~ν) × L nuisance (~ν)
(1.15)où
L
modèle est la vraisemblane du modèle seul. Si les paramètres~ν
sont parfaitement onnus,L nuisance (~ν) = δ(~ν − ~ν est )
et onse retrouve dans leas disuté préédemment. A partir de ette fontion de vraisemblane, on onstruit [2℄ la fontion de vraisemblaneprolée (prole likelihood):
L pr (~θ) = max
~
ν L (~θ, ~ν)
(1.16)en maximisant la fontion de vraisemblane relativement aux paramètres
~ν
pour haquevaleur des paramètres
~θ
. L'estimateur paramètres de nuisane, àθ
xé, est souvent noté~ν ˆˆ
. Lerapport :λ(~θ) = L pr (~θ)/ L ( ~θ), ˆ
(1.17)où
~ ˆ
θ
est l'estimateurde maximum de vraisemblane,possèdelesmêmespropriétés statis- tiques que lerapport de vraisemblanelassique [3℄. Laonstrution de ettefontion devraisemblane est illustréesur lagure 1.2 :
θ paramètre d’intérêt
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
ν paramètre de nuisance
-1 -0.5 0 0.5 1 1.5 2 2.5
3 ) ν, θ ( λ -log
1 2 3 4 5 Vraisemblance
θ paramètre d’intérêt -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 ν
paramètre de nuisance
-0.5 -1 0 0.5 1.5 1 2.5 2 3
) ν, θ ( λ -log
0 1 2 3 4 5 6
θ paramètre d’intérêt
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
) θ ( λ -log
0 1 2 3 4 5 6
Vraisemblance profilée Vraisemblance profilée
Fig. 1.2: Desription shématique da lavraisemblane prolée.
Agauhe :logarithmede lafontiondevraisemblane dansleplan
(θ, ν)
;laligne rougeindiqueleminimum relativement à
ν
àθ
xé.Au entre: logarithme delafontion de vraisemblane en fontiondes paramètres
(θ, ν)
.A droite : logarithmede lafontion devraisemblane proléeen fontion duparamètre
θ
.Ilest importantdenoterque,silenombredeparamètresdenuisaneexèdelenombre
de degrés de liberté du problème, il existe une dégénéresene sur les valeurs
~ν(~θ) ˆ
quimaximise
L (~θ, ~ν)
. Dans e as, on détermine la valeur de la fontion de vraisemblane prolée sans réellement ontraindre les paramètres de nuisane : on ne dispose pas demesure du biais.
1.3.2 Approhe bayésienne
La méthode bayésienne permet d'inlure les eets d'inertitudes systématiques via
des paramètres de nuisane. En séparant expliitement les paramètres à ajuster et les
paramètres de nuisane, la densitéa posterioripeut s'érire :
f (~θ, ~ν | ~x) = f(~x | ~θ, ~ν)f (~θ, ~ν)
RR f (~x | ~θ, ~ν)f(~θ, ~ν)d~θd~ν = L (~θ, ~ν)f (~θ, ~ν )
RR L (~θ, ~ν )f(~θ, ~ν)d~θd~ν
(1.18)et la densité a posteriori des paramètres
~θ
n'est que la densité marginale obtenue enintégrantsur lesparamètres de nuisane
~ν
:f (~θ | ~x) =
R L (~θ, ~ν)f (~θ, ~ν)d~ν
RR L (~θ, ~ν)f(~θ, ~ν)d~θd~ν
(1.19)Généralement, les inertitudes sur les paramètres de nuisane sont indépendantes de
la densité a priori des paramètres
~θ
. La densité a priori est fatorisable sous la formef (~θ, ~ν) = π(~θ)k (~ν )
:π(θ)
est la densité a priori pour les paramètres~ θ
etk(~ν)
elle desparamètres de nuisane. Cette densité a priorides paramètres de nuisane est identique
à la fontionde vraisemblane
L nuisance
introduite dans la onstrutionde lafontion devraisemblaneprolée.Onpourraparexemplehoisirpour
k (~ν)
unedensitémultinormale dénie parles valeursattendues etlamatriede ovarianedes paramètres de nuisane2
.
Cette fatorisation permet également de sortir la densité a priori des paramètres de
l'intégrale. Conrètement, ei reviendra à intégrer la fontion de vraisemblane puis à
multiplierpar la densité a priori, la première étape étant généralement la plus oûteuse
en tempsde alul (intégration numérique). Finalementonobtient:
f (~θ | ~x) = π(~θ) R
L (~θ, ~ν)k (~ν) d~ν RR L (~θ, ~ν)π(~θ)k (~ν) d~θd~ν
(1.20)
Dansla pratique,ladensitéa priorides paramètresde nuisanen'est onnue qu'approxi-
mativement.Si es paramètres sont orretement estimés,ils ne doivent que peu aeter
la qualité de l'ajustement. Cettequalité peut se quantier par laprobabilité d'obtenir la
valeurlaplusprobableduparamètre,soitlavaleurmaximaledeladensitéaposteriori.On
peut don valider la valeur des paramètres de nuisane en étudiant ladispersion relative
de la valeur maximale de la densité a posteriori pour diérentes valeurs des paramètres
de nuisane. Laonstrutiond'un intervallede onane inluantleseets systématiques
se fait ommepréédemment en intégrant la densitéa posteriori :
Z b a
f (~θ | ~x)d~θ = α.
(1.21)2
Un paramètreonnu exatement aura pour a priori une distribution de Diraet l'intégrale sur e
densité a posteriori sont également oûteux en temps de alul et néessitent la mise en
plae de méthodes numériques appropriées quiseront disutées auhapitre 2.
1.4 Vraisemblane de Poisson
1.4.1 Comptage d'événements
Une expériene de physique des partiules se ramène généralement à un omptage
d'événementspassantdes oupuresdeséletion.Onsouhaiteensuiteonfronterlenombre
d'événements observé à un modèle permettant de aluler e nombre d'événements. Le
nombre d'événements observé est la réalisation d'une variable aléatoire distribuée selon
une loi de Poisson, dont le paramètre est le nombre d'événements attendu moyen. Pour
améliorerla sensitivité d'une analyse,on va ombiner plusieurs mesures orrespondant à
des séletions diérentes, voire àun déoupage selonune variable spéique(lassesd'un
histogramme). Chaque ensemble d'événements ainsi déni forme un anal d'analyse. Le
modèlepermetde alulerlenombre d'événementsmoyen attendu dans haque anal,en
fontiondesparamètresphysiqueàmesurer(setioneae,ouplage,...)etdediérents
paramètres onnusave une préision nie (paramètres de nuisane).
Dansla suite nous adopterons lesnotations suivantes :
~ θ
, lesn θ
paramètres à ajuster.
~ν
, lesn ν
paramètres de nuisane. Les paramètres de nuisane pouvant avoir desvaleurs diérentes dans lesdiérents anaux,on aura
n ν = kn c
oùn c
est le nombrede anaux d'analyse et
k
le nombre de paramètres de nuisane néessaire à la des-riptiond'un unique anal.
M ~ (~θ, ~ν)
: lenombre d'événements attendu moyen dans haque anal. C'est un ve- teur de dimensionn c
.
D ~
: le nombre d'événements observés dans haque anal (veteur de dimensionn c
également).
1.4.2 Soures d'erreurs
Pour prendre en ompte les paramètres de nuisane, il faut formuler analytiquement
la fontionde vraisemblanede es paramètres.
Dansleasgénéral,ilvaexisterdemultiplesorrélationspossiblesentrelesparamètres
qui peuvent mener à une densité diilement formulable. En eet l'inertitude globale
peut se omposer de plusieurs soures d'inertitude indépendantes les unes des autres,
mais qui peuvent aeter simultanément plusieurs paramètres de nuisane. On pourra
don ne onsidérer quedes souresd'erreur aratériséespar :
les ontributions d'une même soure, entièrement orrélées (ou antiorrélées) entre
les diérents paramètres etd'un anal àl'autre.
les ontributions de deux soures d'inertitudediérentes, entièrement déorrélées.
Les paramètres de nuisane seront aratérisés par une valeur entrale onnue
~ν 0
etdeux matries d'erreurs
∆ +
et∆ −
omme la matrie des utuations à± 1σ
. Ce sontdeux matries
n ν × n s
,n s
étant le nombre de soures d'inertitude onsidérées.∆ + ij
estla utuation à
1σ
du paramètre de nuisaneν i
produit par la soure d'erreurj
. Lestermes de
∆ ±
peuvent être négatifs pour traduire des antiorrélationsentre inertitudes.L'existene de deux matriespermet de traiter des erreurs asymétriques.
Laorrélationentretouteslesutuationsliéesàunesoured'erreurpermetdedérire
l'ensemble de es utuations ave un unique paramètre. Il sut dès lorsde redénir les
paramètres de nuisane:aulieudetraiter
~ν
ommedes variablesaléatoires,ononsidère un veteurΩ ~
,de dimensionn s
.EngénéralΩ ~
sera distribué selonune loimultinormalede moyenne~µ = ~ 0
etmatrie de ovarianeΣ = 1
.Pour une réalisation
~ω
deΩ ~
, lesparamètres de nuisanepeuvent alors s'érire :~ν = ~ν 0 + f(~ω, ~ ∆ + , ∆ − )
(1.22)Plusieurs presriptions sont possibles pour dénir la fontion de utuation
f ~
. Le trai-tement orret des orrélations totales impose que la valeur entrale
~ν 0
des paramètresorresponde àla médianede la densité de probabilité assoiée, 'est-à dire que la proba-
bilité de utuer vers lehaut ouvers lebas soitla même.Cei impose omme ontrainte
que les omposante
ω i
etf i
aient le même signe. Si une soure d'erreur n'aete qu'ununique paramètre,laquestiondes orrélationsne sepose plusetlehoixde ladensitéest
plus libre.
Latransformation
f(~ω, ~ ∆ + , ∆ − )
laplus ourantesera de laforme:f(~ω, ~ ∆ + , ∆ − ) = ~ω
T∆
ave∆ ij = ∆ sgn(ω ij i ) =
∆ + ij
siω i > 0
∆ − ij
siω i < 0
(1.23)En prenant une erreur moyenne
∆ m = 1 2 (∆ + + ∆ − )
, on peut également symétriser leproblème et :
f(~ω, ~ ∆ + , ∆ − ) = ~ω
T∆ m
(1.24)Ceiorrespondàdeuxasextrêmes:lepremierprésenteunedisontinuitédansladensité
du paramètreauniveau de lavaleurentrale,leseondgommeleseetsd'asymétrie qu'il
peutêtre importantde prendre enonsidération.Il s'agitde deuxas limitesd'une lasse
de transformationde laforme:
f(~ω, ~ ∆ + , ∆ − ) = ~ω
T×
∆ − + ∆ + − ∆ − U(~ω)
(1.25)
ave
U
une matrie diagonalen s × n s
telle queU ii = u(ω i )
oùu(r)
désigne n'importequelle fontionéhelon, 'est à dire une fontion monotone, roissante, telle que :
u(0) = 1
2
,lim
u→−∞ = 0
,lim
u→+∞ = 1.
(1.26)Plusieurs famillesde fontions omme:
Ar tangente :
2 tan − 1 (κr)+π
2π
,Fontion d'erreur :
erf(κr)+1
2
,Sigmoïde:
1 1+e − κr
,où leparamètre
κ
est libre, satisfont es onditions.L'asymétrie est maximalepourκ → + ∞
alors queκ → 0
orrespond à l'erreur moyenne. Le leteur souhaitant approfondir es questions pourra onsulter laréférene [4℄. L'eet d'une telle fontion est illustré surla gure 1.3.
1.4.3 Fontion de vraisemblane du problème
Pour une expériene de omptage, le nombre d'événements
D i
dans le anali
est laréalisation d'une variable aléatoire qui suit une loi de Poisson de moyenne
M i
~θ, ~ν
. Si
x
-2 0 2 4 6 8
0 10000 20000 30000 40000 50000
-2.0
x = 3 +1.0
∞ κ = κ = 2 κ = 0
y
-4 -2 0 2 4 6 8
0 5000 10000 15000 20000 25000 30000 35000 40000 45000
+1.1
y = 2 -1.5
∞ κ = κ = 2 κ = 0
x
-2 0 2 4 6
y
-4 -2 0 2 4 6
Fig. 1.3: Distributions obtenues par utuation aléatoire d'un ouple de paramètres
x y
, ave
une soure de nuisane asymétrique
∆ + = −1.5 1
et
∆ − = −1.1 2
pour trois valeurs de
κ
: lesdeuxaslimites(
κ = 0
enrougeetκ = + ∞
enbleu)etunasintermédiaire(κ = 2
,envert).Lesgure dedroite représente
y
enfontion dex
et montrel'anti-orrélation entre lesutuations.les anaux sontstatistiquement indépendants, 'est-à-dire qu'un événement ne ontribue
qu'à un unique anal, la fontionde vraisemblane des paramètres seuls est :
L
~θ, ~ν
=
n c
Y
c=1
e −M c ( ~ θ,~ ν ) M c
~θ, ~ν D c
D c !
(1.27)Enajoutantlesparamètresde nuisane,queesoitpourun traitementfréquentisteou
bayésien,lafontiondevraisemblanedoitêtremultipliéeparlafontiondevraisemblane
(ou ladensitéa priori)des paramètresde nuisane, déritsparlesparamètres
~ω
introduitau paragraphepréédent. On obtient ainsi :
L
~θ, ~ω
=
n c
Y
c=1
e −M c ( θ,~ ~ ν(~ ω,∆ + ,∆ − ) ) M c
~θ, ~ν(~ω, ∆ + , ∆ − ) D c
D c !
n s
Y
s=1
√ 1 2π e −
ω 2 s 2
(1.28)
Pour des raisons pratiques, il sera parfois utile de travailler ave le logarithme de la
fontion de vraisemblane pluttqu'ave lafontion elle-même, soit:
− ln L (~θ, ~ω) =
n c
X
c=1
M c
~θ, ~ν(~ω, ∆ + , ∆ − )
−
n c
X
c=1
D c ln M c
~θ, ~ν(~ω, ∆ + , ∆ − )
+
n c
X
c=1
ln(D c !) +
n s
X
s=1
ω s 2 2 + n s
2 ln(2π)
(1.29)1.4.4 Exemple simple
Pour terminer e hapitre, illustrons e qui a été disuté par un exemple simple. La
mesure d'unesetioneae
σ
ombinantdeux anaux d'analyse(que l'ondésignera pare
etµ
en référene à l'état nal étudié, par exemple). Dans haque anal, le nombred'événements attendu seompose du signaletde bruit de fond.Lenombre d'événements
de signal est relié à la setioneae de produtionpar le produit de ette dernière par
la luminosité
ℓ
et l'eaité de séletion ou aeptaneξ i=e,µ
. Le nombre d'événements de bruit fond est estimé à partir de la luminositéℓ
et de l'eaité de séletionβ i
(quiinlutlasetioneaethéorique,supposéeonnue).Lesnotationsgénériques introduites
préédemment deviennent :
~θ = (σ)
,~ν =
β e
ξ e β µ
ξ µ
ℓ
(1.30)
et pour le modèle :
M i
~θ, ~ν
= ℓ × (β i + ξ i × σ)
(1.31)On onsidère trois soures d'inertitude indépendantes : une erreur sur la mesure
de luminosité (
∆ℓ
), une erreur sur la alibration de la simulation (∆ cal ν
) et une erreurthéorique sur la setion eae du fond (
∆ th ν
). Les matries d'erreur sont don desmatries
3 × 5
. Ensupposantles erreurs symétriques,elles s'érivent :∆ ± = ∆ =
0 ∆ cal β e ∆ th β e 0 ∆ cal ξ e 0 0 ∆ cal β µ ∆ th β µ
0 ∆ cal ξ µ 0
∆ℓ 0 0
(1.32)
Siles erreursentre
β e
etξ e
duesà laalibrationde la simulationsontantiorrélées,'est- à-dire qu'une modiationde laalibration augmenteβ e
en diminuantξ e
etinversement, ette antiorrélation pourra setraduire en prenant∆ cal β e > 0
et∆ cal ξ e < 0
.Il y aura trois paramètres de nuisane indépendants
~ω
, distribués normalement. Les paramètres de nuisaneen fontionde~ω
sont alors :~ν = ~ν 0 + ~ω
T∆ =
β e0 +0 +ω 2 ∆ cal β e +ω 3 ∆ th β e
ξ e0 +0 +ω 2 ∆ cal ξ e +0
β µ0 +0 +ω 2 ∆ cal β µ +ω 3 ∆ th β µ ξ µ0 +0 +ω 2 ∆ cal ξ µ +0
ℓ 0 +ω 1 ∆ℓ +0 +0
(1.33)
et nalement la fontionde vraisemblane devient :
L (σ, ~ω) = (2π) − 2 3 e −
ω 2 1 + ω 2
2 + ω 2 3 2
Y
i=e,µ
e −ℓ×(β i +ξ i ×σ) (ℓ × (β i + ξ i × σ)) D i
D i !
(1.34)Toutes lesappliations disutées dans lasuite de e mémoire reposeront sur la même
struture ave quelques omplexiations (augmentationdu nombre de paramètres ajus-
tés, de soures d'inertitudes, de anaux, diérentiationdes bruitsde fond,...).
olimpulherexstiteram,
dumignusegofueram.
Miser, miser!
modoniger
et ustusfortiter!
Cignusustus antat,CarminaBurana130
2
Implémentation des méthodes d'analyse
Dans e hapitre, nous allons dérire l'implémentation eetive des outils présentés
au hapitre préédent. La première étape onsiste à onstruire la fontion de vraisem-
blane 1.28, en fournissant le modèle, les données observées et les paramètres de nui-
sane (valeurnominaleetmatriesd'erreur) :
L = L (~θ, ~ω) = L
M(~θ, ~ω, ~ν ~ 0 , ∆ + , ∆ − ), ~ D
.
Ensuite, ette fontion sera utilisée pour onstruire numériquement soit la fontion de
vraisemblaneprolée, soitune densitébayesiennea posteriori. L'ensemble de es implé-
mentations formeleode Mefisto (Monte-CarloErrors Fit with Statistial Tools).
2.1 Ajustements monodimensionnels
2.1.1 Vraisemblane prolée
Lealulde lafontionde vraisemblaneprolée, passeparlaminimisationde
L
rela-tivementà
~ω
pourdiérentevaleursdeθ ~
.Poure faireondoitxerunensembledevaleurde
~ θ
, et don xer des bornes de variations deθ
. Il est don important d'avoir une idéedu résultatnal, pour xer e domaine(pour ouvrir larégion oùlerapport de vraisem-
blane
λ
estinférieurà12.5soit5σ
)etlenombredepointsdealul(typiquementquelque entaines pour un temps de alul raisonnable, de quelque minutes à quelques heures).Ces pointsde aluls peuvent soit être hoisis aléatoirement(distribution uniforme),soit
former une grille à pas xe. Cette dernière solution est utilisé par le programme Hist-
Fatory basé sur Roofit [5℄ qui est utilisée par défaut dans les analyses de physique
du top dans l'expériene ATLAS. La grillealéatoireest utilisée dans Mefisto. Dans les
deux programmes,laminimisationde lafontion de vraisemblaneen haque pointde la
grille utilise le logiiel Minuit [6℄. La similaritédes deux implémentations va permettre
de valider,auhapite4,l'implémentationde lafontionde vraisemblanedans Mefisto
en omparant aux résultatsde HistFatory.
Unefois lafontion de vraisemblane proléeestimée,on en déduit
λ
en divisantparleminimumglobal.On dispose,àlan, durapportde vraisemblaneévalué surune grille
disrète.Eninterpolantlaourbeobtenue,onpeutrésoudrenumériquementl'équation1.9
l'inertitude de mesure totale (statistique+systématique). L'inertitude statistique seule
peut s'évaluer en étudiant la fontionde vraisemblanedes paramètres
~θ
seuls, en xantles paramètresde nuisane àleur valeur nominale
~ν = ~ν 0
.2.1.2 Intégration bayesienne simple
Le alul d'une intégrale de la forme
I = R b
a f (x)g(x)dx
, oùg(x)
est une densité deprobabilitésurl'intervalle
[a; b]
,revientaualulde lavaleurmoyennedelafontionf(x)
.Cette moyenne peut être approximée par l'estimateur de moyenne empirique:
I ˆ = b − a n
n
X
i=1
f (x i )
où les
x i
onstituent un éhantillon den
réalisations d'une variable aléatoire distribuée selong(x)
.Cet estimateur onverge versI
quand lataillede l'éhantillon devient grande ave unéart-typeσ I ˆ = σ g / √
n
,σ g
étantl'éart-typedeladistributiong
.C'estleprinipede l'intégration Monte-Carlo.
En utilisant la méthode préédente pour générer aléatoirement des réalisations des
paramètres de nuisanedistribués selon ladensité a priori, le alul de l'intégrale sur les
paramètres de nuisanedevient :
f(~θ) ∝ Z
L (~θ, ~ν)π(θ)k (~ν) d~ν ≈ π(θ) n
n
X
i=1
L (~θ, ~ν i )
La taille
n
de l'éhantillon à moyenner doit être susamment grande pour parourir l'ensembledel'espaedesparamètresdenuisane.Engénéralquelquesdizainesàquelquesentainesdemilliersd'itérationssusent.Deplus,lorsd'uneévaluationnumérique,ilfaut
eetuerealulpourunensemblede valeursde
~θ
etalulerl'intégralesur~θ
eninluantla densitéa prioride
~θ
pour déterminer la normalisationde la densitéa priori.Iienore erreurssystématiques et statistiquessontentièrement intégréesdans lalar-
geur de la densité a posteriori. Cei est illustré sur la gure 2.1. La partie gauhe de
la gure montre la fontion de vraisemblane pour plusieurs réalisations des paramètres
de nuisane tirées aléatoirement suivant la densité a priori appropriée, omme dérit au
paragraphe 1.4.2. Laourbe violette (
~ν 0
) orrespond à la valeur entrale des paramètresde nuisane. Lesparamètres utilisésorrespondent àunemesure desetion eae single
top en voie
s
dans l'expériene DØ [7℄.La somme des es ourbes (en utilisant beauoup plus de utuations) permet de
aluler l'intégralequi orrespond exatement, dans leas d'un a priori uniforme sur un
intervallesusammentlarge, à ladensité a posteriori (ourbe de droite).
L'inertitude statistique est quantiée par la largeur moyenne des fontions de vrai-
semblane pour
~ν
xé.Dans le programme Mefisto, à la n de l'intégration, on dispose ette fois de la
densité a posteriori évaluée sur une grille aléatoire, à un fateur de normalisation près.
Parinterpolation,ilestalorsaisédealulerl'intégraledenormalisation,dedéterminerla
valeurlaplus probable etnalementd'obtenir des intervalles de onane oudes limites.
-20 -15 -10 -5 0 5 10 θ 15 i )
ν θ , L(
ν 0
ν 1
ν 2
ν 3
ν 4
ν 5
ν 6
ν 7
ν 8
...
-20 -15 -10 -5 0 5 10 θ 15
θ ) L(
⇒ Σ
stat ⇒
∆
∆ syst
<<L max
δ
syst
⊕
∆ stat
Fig.2.1: Desription shématique del'intégration surles paramètres de nuisane.
2.2 Ajustement de plusieurs paramètres
Pour un problème unidimensionnel, quelques entaines de points de alul susent.
Lorsqu'on souhaiteétendre àun ajustement de plusieurs paramètres,la taillede la grille
d'évaluationaugmente exponentiellementave lenombre de paramètres.Elle devient ra-
pidement trop grande pour être alulée en un temps raisonnable. De même, lors du
développement d'uneanalyse, notammentpour optimiserertaines oupures, ilpeut être
souhaitable de reproduire un grand nombre de fois le alul de la densité a posteriori,
mêmeunidimensionnelle,etdonde pouvoirfairelealulrapidement,auprixd'approxi-
mations supplémentaires.
2.2.1 Grille et éhantillonnage
Il est utile, à e stade, de disuter la présentation onrète des résultats numériques.
Unedensitédeprobabilitépeutêtreobtenuesousdeuxformes :uneexpression analytique
ouun ensemble de pointsdistribués selonette probabilité.Pour desproblèmes susam-
ment omplexes, un alulanalytique tel l'intégration sur les paramètres de nuisane est
exlu. Si on est apable de déterminer la valeur de la densité a posteriori
f (~θ)
en unpoint donné de l'espae des paramètres, on peut substituer à la fontion analytique une
évaluation de la densité sur une grille uniforme (aléatoire ou à pas xe). On disposera
don de deux représentations possibles du résultatde lamesure :
•
Une fontion :des ouplesn
~θ i , f (~θ i ) o
i=1..n
ave
~ θ i
distribués uniformément.•
Un éhantillon : des valeursn
~θ i
o
i=1..n
distribuées selon la densité
f (~θ)
.La première approhe autorise le alul d'intégrales et d'intervalles de onane. La
seonde approhe permet très simplement d'obtenir la distribution marginale de haque
variable (dans le as d'un problème multidimensionnel) et d'eetuer un hangement de
variable.Il pourra s'avérer utile de passerd'une représentation àl'autre.
Dans le as le plus général on utilisera des événements pondérés, soit des ouples
n (~θ i , w i ) o
.Danse as ladistribution(histogramme)des
~θ i
pondérés parω i
permetd'es--20 -15 -10 -5 0 5 10 15 θ 20 0
2 4 6 8
θ ) f(
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
0 20 40 60 80 100
-20 -15 -10 -5 0 5 10 15 θ 20
) θ f(
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14
Fig. 2.2:Représentation deladensitépar200 ouples
n ~θ i , f (~θ i ) o
. Agauhe: ladistribution
uniforme des
θ i
(en haut) et la distribution des poids (en bas). A droite : la densité pondérée (histogramme ave inertitudes) et legraphen ~ θ i , f ( ~ θ i ) o
(pointsnoirs).
timer la densitéa posteriori.
Dans le as limite où tous les poids valent 1, l'information est omplètement ontenue
dans la distribution des
~θ i
.A l'inverse la représentation
n ~θ i , f(~θ i ) o
orrespond à l'autre as limite où toute l'in-
formation est ontenue dans les poids
ω i = f (~θ i )
et lesθ i
uniformes n'apportent auune information.Danse seul as,ilexiste deux façons de visualiserladensitéf (θ)
:traerlegraphe des ouples
n ~ θ i , f (~θ i ) o
(e qui permet une estimation analytique par interpo-
lation) oula distributionpondérée de
~θ i
. Lapremière solutionest néanmoinsplus préiseet permet d'utiliserun éhantillon de tailleplus modesteomme l'illustrela gure 2.2.
2.2.2 Méthode approximée
An de dénir une proédure simpliée et plus rapide, ommençons par approfondir
le prinipe de l'intégration sur les paramètres de nuisane à partirde lagure 2.1.
Les paramètres de nuisane modient la position de haque distribution, qui peut
être évaluée par lemode
θ max
(estimateur du maximumde vraisemblane): ladispersion de l'estimateur du maximum de vraisemblane mesure l'erreur systématique. Lors del'intégrationsur lesparamètresde nuisane,onombinees deuxeets etlalargeurnale
de ladistribution a posteriori donneune erreur ombinée.
Deplus,lavaleurdu maximumde lavraisemblane
L max = L (θ max )
mesurelaqualitéde l'ajustement.Unparamètrede nuisanen'estpas ajustable etdonhaque utuation
doit menerà un ajustementde qualité similaire.
L max
étantune variable aléatoire,sa va-leurpeututuerd'unjeudeparamètresàl'autremaisons'attend àe quelautuation
relative reste faible.
A partir de ette analyse, on onstate que, pour estimer l'eet des inertitudes sys-
tématiques, on peut se ontenter de mesurer, pour haque utuation, la fontion de
vraisemblane en un seul point, son maximum. Pour haque utuation on détermine la
valeurdes paramètres
~ θ
quimaximisentlavraisemblane.On obtientainsi un éhantillon de valeurs~θ
, qu'il faut pondérer le as éhéant par la valeur de la densité a priori pour~θ
. Pour un a priori uniforme borné ei revient à rejeter les points hors de l'intervalleonsidéré. Rigoureusement, il faudrait également pondérer haque valeur par sa proba-
bilité, soitla valeur maximale de la fontion de vraisemblane. On peut néanmoins s'en
dispenser pour peu que ladispersion relativede
L max
soitfaible(f.δ
sur la gure2.1).La diulté prinipale onsiste à intégrer l'erreur statistique à ette approhe. Pour
elailfaudraitnonpasprendrelemaximumdelafontiondevraisemblanemaisl'éhan-
tillonner en tirant un ou plusieurs points aléatoirement selon ette distribution. Cette
approhe sera traitéeexatement auparagraphe suivant.
Dansle as de l'estimation du résultat attendu (mesure de sensibilitéd'une analyse),
onxelesparamètresàajusteràunevaleurattenduee quipermetde alulerlenombre
d'événements attendu :
D ~ = M ~ (~θ 0 , ~ν)
. On peut alors approximer l'erreur statistique en utilisant une propriété de la loi de Poisson :P (λ, n) ≈ P (n, λ)
. Ainsi en faisant utuerle nombre d'événements
D c
dans haque analc
selon une loi de Poisson de paramètreλ = D c
, et en herhant le maximum de la fontion vraisemblane on obtient un ré- sultat similaire à elui onsistant à tirer aléatoirement des points selon la fontion devraisemblane.Cetteméthoden'est plus appliablelorsd'unemesureréelle oùlenombre
d'événements mesuré est une grandeur xe.
2.2.3 Monte-Carlo par haînes de Markov (MCMC)
L'approhe préédente résoutleproblèmedu alulrapide,maisest, en touterigueur,
fausse, autant d'un point de vue fréquentiste que bayesien. Pour traiter exatement le
problèmebayesien,nousallonsonserverl'idéed'éhantillonnerladensitéaposteriorimais
de manièreexate. On a pour ela reours à un Monte-Carlopar haînes de Markov [8℄.
2.2.3.1 Chaînes de Markov
Unehaîne de Markov est une série
~θ n
de réalisations de variables aléatoiresΘ ~ n
telleque laprobabilitéde la réalisation
i + 1
ne dépend quede laréalisationpréédente, soit:P ( Θ ~ i+1 = ~θ i+1 ) = P ( Θ ~ i+1 = ~θ i+1 | Θ ~ i = ~θ i )
(2.1)Une telle haîne peut être utilisée, sous ertaines onditions, pour éhantillonner une
densité de probabilité
f(~θ)
.La haîne est dite ergodique si,indépendamment du premier élément de la haîne, la densitéf Θ ~ i (~θ i )
deΘ ~ i
onverge vers elle def(~θ)
. Ainsi, à partird'une ertaine itération
n
, la haîne fournit une bonne approximation d'un éhantillon distribué selonf(~θ)
.Enrevanhe un teléhantillon n'est pas simplepuisque lesvariablesaléatoires ne sont pas indépendantes.
L'algorithmeMetropolis-Hastings[8℄permetderéerunehaîneergodique.Ilonsiste
à onstruire l'élément
i + 1
àpartir de l'élémenti
de la manièresuivante :•
On tirealéatoirementune valeur~θ ⋆
selonune densitéq(~θ ⋆ | ~θ i )
,ditefontiond'éhan-tillonnage.
•
On détermine laprobabilitéα(~θ i , ~θ ⋆ )
de transitionde~ θ i
vers~θ ⋆
selon :α(~θ i , ~θ ⋆ ) = min
(
1, f(~θ ⋆ ) f (~θ i )
q(~θ i | ~θ ⋆ ) q(~θ ⋆ | ~θ i )
)
(2.2)
où