• Aucun résultat trouvé

The DART-Europe E-theses Portal

N/A
N/A
Protected

Academic year: 2022

Partager "The DART-Europe E-theses Portal"

Copied!
67
0
0

Texte intégral

(1)

HAL Id: tel-00713314

https://tel.archives-ouvertes.fr/tel-00713314

Submitted on 29 Jun 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Benoit Clément

To cite this version:

Benoit Clément. Ajustements Bayésiens, application à physique du quark top au LHC. Physique des

Hautes Energies - Expérience [hep-ex]. Université de Grenoble, 2012. �tel-00713314�

(2)

Mémoire

présenté pour obtenir le diplôme d’

HABILITATION À DIRIGER LES RECHERCHES

Spécialité : Physique

Présentée par

Benoit CLEMENT

Docteur de l’Université Louis Pasteur (Strasbourg I)

Maître de conférence à l’Université Joseph Fourier (Grenoble I)

préparée au Laboratoire de Physique Subatomique et de Cosmologie Ecole doctorale de physique

Ajustements bayésiens,

application à la physique du quark top au LHC

HDR soutenue publiquement le 22 juin 2012, devant le jury composé de :

M. Gilles HENRI

Professeur des Universités, IPAG (Grenoble), Président

M. Daniel BLOCH

Directeur de recherche, IPHC (Strasbourg), Rapporteur

M. Mossadek TALBY

Professeur des Universités, CPPM (Marseille), Rapporteur

M. Laurent DEROME

Maître de conférences, LPSC (Grenoble), Rapporteur

M. Julien DONINI

Professeur des Universités, LPC (Clermont-Ferrand), Examinateur

(3)
(4)

Introdution 1

1 Analyse statistique et erreurs systématiques 3

1.1 Mesure et inertitude . . . 3

1.2 Estimationetfontion de vraisemblane . . . 4

1.2.1 Approhe fréquentiste : maximumde vraisemblane . . . 5

1.2.2 Approhe bayésienne : densitéa posteriori . . . 6

1.3 Inertitudes systématiques . . . 7

1.3.1 Approhe fréquentiste : vraisemblane prolée . . . 8

1.3.2 Approhe bayésienne . . . 9

1.4 Vraisemblane de Poisson . . . 10

1.4.1 Comptage d'événements . . . 10

1.4.2 Soures d'erreurs . . . 10

1.4.3 Fontion de vraisemblanedu problème . . . 11

1.4.4 Exemple simple . . . 12

2 Implémentation des méthodes d'analyse 15 2.1 Ajustements monodimensionnels. . . 15

2.1.1 Vraisemblane prolée . . . 15

2.1.2 Intégration bayesienne simple . . . 16

2.2 Ajustement de plusieurs paramètres . . . 17

2.2.1 Grilleet éhantillonnage . . . 17

2.2.2 Méthode approximée . . . 18

2.2.3 Monte-Carlo par haînes de Markov (MCMC) . . . 19

2.2.3.1 Chaînes de Markov . . . 19

2.2.3.2 Appliationau problème étudié . . . 20

3 Physique du top au LHC 23 3.1 Le LHCet ledéteteur ATLAS . . . 23

3.2 Le Modèle Standard et lequark top . . . 24

3.2.1 Le modèle standard et ses limites . . . 24

3.2.2 Le quarktop . . . 25

3.3 Produtionassoiée

tW

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3.1 Motivation. . . 28

3.3.2 Bruits de fond etséletions. . . 29

3.3.3 Estimationdes fonds et de l'aeptane . . . 31

3.3.4 Erreurs systématiques . . . 33

3.3.5 Résultat nal . . . 34

(5)

4.1 Extrationdes résultatsATLAS . . . 37

4.2 Validationà une dimension. . . 39

4.3 Analyse bayésienne multidimensionnelle. . . 41

5 Perspetives : analyse ombinée des 3 voies single top 45 5.1 Single top etnouvellephysique. . . 45

5.1.1 Proessus

benchmark

. . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1.2 Paramétrisation générique . . . 47

5.2 Analyses

CSC

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.2.1 Séletions . . . 48

5.2.2 Analyse ombinée . . . 49

5.3 Conlusions . . . 54

Conlusion 57

Bibliographie 59

(6)

Depuis une dizaine d'années, les méthodes statistiquesjouent un rle de plus en plus

important en physique des partiules. L'amélioration des apaités de alul des ordina-

teurs y est pour beauoup. Elles trouvent de nombreuses appliations en théorie (aluls

sur réseau, sondage d'espaes de paramètres de modèles, ...), dans lasimulation de pro-

essusphysiques(générateurs Monte-Carlo,simulationde déteteur)etdansl'analysedes

données (méthodes multivariées pour la séletion d'événements, intégration de soures

d'erreurs systématiques etalul de limites).

A partir de 2004, les physiiens du Tevatron ont été parmi les premiers à mettre en

÷uvre, dans le adre de la reherhe des proessus de prodution életrofaible du quark

top,unegrandevariétédeméthodesmultivariées(arbresdedéision,réseauxdeneurones)

oupléesàuneanalysebayésiennesophistiquéepourinlurelesinertitudessystématiques.

Ces analyses ont permis la mise en évidene de ette prodution életrofaible ave un

volume de données bien inférieurà e quiavaitété estimé préédemment.

Les expérienes du LHC ont naturellement adopté es tehniques et en proposent de

nouvelles. Danse mémoire, nous allons nous onentrer sur l'ajustement de paramètres

physiques ave estimation de l'inertitude de mesure, soit pour déterminer et optimiser

la sensibilité d'une analyse, soit pour extraire le résultat nal. Les diérentes méthodes

disutées, en partiulier une approhe originale d'intégration bayésienne par haînes de

Markov, font l'objet d'une implémentation dans un programme. Nous utiliserons alors

les reherhes de prodution életrofaible du quark top dans les premières données du

LHC pour illustrer et valider es diérents outils. Enn, le dernier hapitre prospetif

sera onsaré à l'utilisation future de es mêmes outils pour ontraindre des modèles de

physique au-delàdu modèle standard.

(7)
(8)

oÎlomènhn,£mur> >Aqaio؊lge>êjhke,

poll€d>Êfjmouyuq€^Aðdiproòayen

™r¸wn,aÎtoÌdà ál¸riateÜqekÔnessin

oÊwnoØste psi,Diäd>âteleetoboul ,

âx oÝd˜t€prÀtadiast thnârsante

>AtreòdhteŠnax‚ndrÀnkaÈdØo>AqilleÔ.

Homère,Iliade I.1

1

Analyse statistique et erreurs systématiques

1.1 Mesure et inertitude

Lerésultatd'unemesure,qu'ilsoitobtenudiretementd'uneexpérieneoudérivéd'un

ouplusieursrésultatsexpérimentaux,onsisteen uneouplusieursvaleursnumériquesqui

onstitue la valeur entralede lamesure utiliséepour estimerlavaleur vraie d'une

grandeur physique.

L'une des prinipales problématiques onerne alors la onane ou la rédibilité que

l'on aorde à e résultat. Pour une valeur numérique unique, la présentation la plus

lassique pour ette informationest la barred'erreur oud'inertitude 1

de laforme :

x = X ± ∆X

x = X −∆X1 +∆X2

(1.1)

L'inertitudedénitdon un intervalleontenant probablementlavaleur vraiede lagran-

deurmesurée.Dansettereprésentationlabarred'erreurontientlavaleurentrale.Dans

le premier as labarre d'erreur est symétrique autour de ette valeur entrale, alors que

le seond traduit une plus forte probabilité de utuation d'un oté que de l'autre de

la valeur entrale. Enn dans ertains as, on souhaite séparer ertaines ontributions

à l'inertitude, par exemple les eets statistiques et systématiques. Cette séparation est

partiulièrement pertinente pour disuter des possibilités d'amélioration du résultat par

de futures expérienes (rédutionde l'erreurstatistique)oude nouvelles analyses (rédu-

tions des eets systématiques). Par exemple, les eets statistiques se réduisent par une

aumulationplus grandede données ave,sil'appareillagereste identique, uneévolution

de l'erreuren

∼ 1/ √

t

,

t

étant la durée de la mesure. La rédution d'eets systématiques passe par une meilleure ompréhension de l'appareillage de mesure (qui peut néessiter

une statistique arue) et/ou un hangement de tehniques de mesure et d'analyse. On

1

Certainsassoientlanotiond'erreuràelledebiais,equisous-entendunepossibilitédeorretion,

alors quel'inertitude est purement aléatoire.Dans lesdiérentes situations que nousallons parourir,

leserreursneserontpasestimablesautrementqueparunintervalledeonaneetseronttraitéesomme

des utuations aléatoires : si auune valeur de l'erreurne peut être préisément estimée alors toutes

les valeurs possibles (i.e. dans la barre d'erreur) doivent être onsidérées.Ainsi les termes d'erreur ou

d'inertitudeserontutilisésindiéremmentpourdésignerlemêmeonept.

(9)

x = X ± ∆X stat ± ∆X syst

(1.2)

En reliantl'inertitudeà une mesure de dispersion proportionnelleà lavariane,l'erreur

totale s'obtient en sommant les diérentes omposantes (supposées indépendantes) en

quadrature.

L'intervalle de onane permet de donner une dénition plus rigoureuse du onept

d'inertitude, le niveau de onane quantiant la probabilité de trouver la valeur vraie

dans la barre d'erreur. Un intervallede onane est un intervalle

[a, b]

tel que:

P (a < X < b) =

Z b a

f X (x)dx = α,

(1.3)

α

étantleniveaudeonanedel'intervalle.L'éart-type

σ

permetdedénirunintervalle

de onane autour de la valeur moyenne

µ

, de la forme

[µ − σ; µ + σ]

. Dans le as

d'une densité normale, et intervalleorrespond à un niveau de onane de

68.3%

. Par

extension, 'est la valeur du niveau de onane que l'on assoiegénéralement(mais pas

néessairement) à une barred'erreur.

1.2 Estimation et fontion de vraisemblane

Unemesure brutese ompose d'un éhantillon d'une ouplusieurs valeurs numériques

~

m = { m 1 , m 2 , . . . , m n }

, réalisationd'une variable aléatoire

X ~ = { X 1 , X 2 , . . . , X n }

. L'en-

semble de es variables aléatoires est dérit par une densité de probabilité

f X ~ (~x)

~x

désigne une réalisationquelonque.

Parailleursonvautiliseres données pour déterminerouontraindreun ouplusieurs

paramètres physiques

(masses, setion eae, ...) que l'on souhaiteestimer, soitave

une valeur numérique, soit par un intervalle de onane ou une limite. Les données

mesurées sontsensiblesaux paramètres

,silerésultatattendu de lamesureest diérent

pour des valeurs diérentes de

~ θ

. Ainsi, la densité

f X ~ (~x)

doit dépendre des paramètres

. D'un point de vue purement mathématique, on peut onsidérer une fontion générale dont les variables seraient à la fois les variables aléatoires et les paramètres à estimer.

Notons ette fontion

k(~x, ~θ)

. A partirde ette fontion ononstruit 2 objets :

Ladensitéde probabilitéde

X ~

,quiestunefontionduseulveteur

~x

,réalisation de

X ~

,lesparamètres

étant xés àune valeur

~θ = ~θ 0

unique.Cette valeur

~ θ 0

est la

valeur vraie des paramètres :

f X ~ (~x) = k(~x, ~θ 0 )

et

Z

f X ~ (~x)d~x = 1.

(1.4)

Lafontion de vraisemblanedesparamètres

onne onsidèrequeladépen-

dane en

, en xant

~x

àla mesure

m ~

:

L (~θ) = k( m, ~θ). ~

(1.5)

La diérene fondamentale entre les approhes fréquentiste et bayésienne, que nous

allons disuterdans lesprohains paragraphes,tientdans lestatutdonnéauxparamètres

. Dansl'approhe fréquentiste,

possède une unique valeur, quel'on tente d'estimer au

mieux : les données permettent de onstruire des estimateurs de la valeur entrale etdes

(10)

Dans l'approhe bayésienne, les paramètres sont eux-mêmes traités omme des variables

aléatoires, dérites par une densité de probabilité : au vu des données, on aorde une

plus grande rédibilité à ertaines valeurs des paramètres qu'à d'autres, 'est la densité

de probabilitéa posteriori. Cettedensitédes paramètrespermetàson tourde dénirune

valeurentrale et des intervalles de onane.

1.2.1 Approhe fréquentiste : maximum de vraisemblane

La fontion de vraisemblane n'est pas une densité de probabilité. Elle mesure néan-

moinslarédibilitéassoiéeàhaquevaleurpossibledesparamètres.

L (~θ 0 )

quantie don

la ompatibilité des données ave l'hypothèse

~ θ = ~θ 0

. L'estimateur naturel qui en dé- oule pour

~ θ

est la valeur

~θ ˆ

telle que la fontion de vraisemblane soit maximale : 'est l'estimateur du maximum de vraisemblane.

Un estimateur

~θ ˆ

(par exemple le maximum de vraisemblane) est une variable aléa- toire. Dans le as d'un unique paramètre, un intervalle déni par deux fontions de

θ ˆ

,

h

ξ(ˆ θ), ω(ˆ θ) i

,est également une variablealéatoire.Sionrépète l'expériene plusieurs fois,

onvaobtenirdiérentes valeursdel'estimateuretdel'intervalle,quipeut ontenirounon

lavaleurvraie

θ 0

:onpeutdon dénirausens fréquentiste laprobabilitéque l'intervalle ontiennelavaleur vraie.L'intervalle

h

ξ(ˆ θ), ω(ˆ θ) i

est unintervallede onanede niveau

α

si :

P θ 0 ∈ h

ξ(ˆ θ), ω(ˆ θ) i

= α.

(1.6)

quelle que soit la valeur de

θ

. La onstrution exate de l'intervalle de onane, dite

onstrution de Neyman [1℄, peut se révéler très oûteuse en temps de alul.

On aleplus souvent reoursà des propriétésasymptotiques (valablesrigoureusement

dans lalimite d'un éhantillon inni) de l'estimateur de maximum de vraisemblane. La

loi de probabilité de l'estimateuronverge vers la loimultinormale.L'estimateur est non

biaisé asymptotiquement, lamoyenne de la loimultinormale orrespond don à lavaleur

vraie

~θ 0

. Le maximum de vraisemblane est également de variane minimale. Il atteint asymptotiquementlaborne deRao-Cramer-Fréhetetsamatriede ovarianeest alors:

Σ = L −1

ave

L ij = − E

"

2 ln L (~θ)

∂θ i ∂θ j ~

θ= ~ θ ˆ

#

,

(1.7)

la valeur moyenne portant sur la variable aléatoire

X ~

. Dans la pratique, on ne dispose

que d'une réalisationde

L

.Finalementon onstruit un estimateur de la ovariane par :

Σ = ˆ ˆ L −1

ave

L ij = − ∂ 2 ln L (~θ)

∂θ i ∂θ j

~

θ= ~ θ ˆ

(1.8)

Onpeutdéterminerplusorretementlamatriedeovarianepardespseudo-expérienes

Monte-Carlo.

On utilise enn le rapport de vraisemblane

λ = L (~θ)/ L ( ~θ) ˆ

dont le logarithme suit

(toujoursasymptotiquement)uneloide

χ 2

à

n θ

(nombrede paramètres)degrésdelibertés pouronstruire des intervalles de onane.Lesbornesd'un intervallepour un niveau de

onane

α

satisfont l'équation:

− 2 ln λ(~θ) = β(n θ , α)

β

est déni par

α =

Z β(n θ ,α) 0

f χ 2 (x; n θ )dx.

(1.9)

(11)

− ln λ(θ) = n 2

2 ,

(1.10)

qui dénitlesbornesd'un intervalleà

(i.e. dontleniveau de onane est égalàelui

de l'intervalle

µ ± nσ

d'une loinormale,soit 68.3%pour

n = 1

,95.4% pour

n = 2

, ...).

1.2.2 Approhe bayésienne : densité a posteriori

L'approhebayésienneestaprioriplussimple.Laprobabilitéest simplementinterpré-

tée omme un degré de onane. On peut alors assoier une densité de probabilité aux

paramètres

. Après un ensemble de mesures

~x

, la densité de probabilité des paramètres du modèleontraintepares mesures estladensitéonditionnelle

f(~θ | ~x)

,appelée densité

a posteriori. Enutilisantle théorème de Bayes, on a:

f (~θ | ~x) = f(~x | ~θ)f (~θ)

f(~x)

soit

f (

modèle

|

mesure

) = f(

mesure

|

modèle

)f(

modèle

)

f (

mesure

) .

(1.11)

Cette expression faitapparaître trois fateurs :

f (~x | ~θ)

est la probabilité des mesures pour une valeur déterminée de

. C'est la

fontion de vraisemblane

L (~θ)

dénie préédemment.

f (θ) = π(~θ)

est la densité de probabilité des paramètres avant la mesure nommée densité a priorides paramètres.Cette densité est souvent xée arbitrairement.

f (~x)

estladensitéprobabilitédelamesure

~x

.C'estunegrandeurnumériqueonstante

qui joueun simple rle de normalisationde ladensité a posteriori.

Laprobabilité a posteriori peut se réérire:

f (~θ | ~x) = L (~θ)π(~θ)

R f (~x | ~θ)π(~θ)d~θ

(1.12)

Le hoix le plus fréquent pour la densité a priori est une densité uniforme sur un

intervalle

[a, b]

. Cette densité traduit l'absene d'a priori sur la valeur des paramètres.

Si lafontion de vraisemblane tombegénéralementà 0pour des valeurs des paramètres

loindu maximum de vraisemblane,on peut hoisir

[a, b]

tel que:

f(~θ | ~x) ∝ L (~θ).

(1.13)

Si e n'est pas le as, elà indique que la mesure n'est pas ou peu sensible au paramètre

estimé.

Cette densité a priori permet également de borner les paramètres en imposant un a

priorinuldanslesrégionsnon-physiques. Dansleas d'unemesuredesetioneae, on

oupera la partienégative de lafontion de vraisemblane.

Si la partie de fontion de vraisemblane oupée par l'a priori n'est pas négligeable,

l'approximationpréédente devient fausse etilfautrealuler lanormalisationde laden-

sité a posteriori. Un autre hoix pour la densité a priori serait de prendre la densité du

paramètre estimée par une mesure préédente. Le hoix arbitraire de ette densité est le

point faible de ette approhe. En partiulier, le résultat nal ne sera pas invariant par

hangement de variable: hoisir

θ

ou

log(θ)

uniformene onduira pas à lamême densité

(12)

de es hoix. Le hoix de la densité a priori reste subjetif et pour plusieurs a priori

raisonnables (enore de lasubjetivité!), lerésultat a posterioridoit être similaire.

Leonept de l'analyse bayésienne est don de partird'une onnaissane a priorides

paramètres du modèle et de onstruire la densité a posteriori inluant l'informationap-

portéparlamesure.Lamesurefavoriseertaines valeursdes paramètres,laplusprobable

étantlemaximumdelafontiondevraisemblanesielle-in'estpastronquéeparladen-

sité a priori. Lamesuremodiedon ledegréde rédibilitéassoiée auxvaleurspossibles

des paramètres (densité a posteriori). Contrairement au as fréquentiste, il n'y a plus

d'estimateur et onobtient diretementune densitéde probabilité pour les paramètres, à

partir de laquelle onpeut dénir une valeur entrale (moyenne, médianeouplus souvent

lemode quiorrespond aumaximumde vraisemblanepour un a prioriuniforme)etune

barre d'erreur via un intervallede onane

[a, b]

pour un niveau de onane

α

telque :

Z b

a

f(~θ | ~x)d~θ = α

(1.14)

Pour dénir l'intervallede manière unique, on doit xer des ritères supplémentaires. A

une dimensionon peut hoisir par exemple :

un intervalle symétriqueautour de la valeur entrale

c

:

[c − k, c + k]

.

un intervalle entré en probabilité autour de la valeur entrale

c

:

[a, b]

tel que

R c

a f (θ | ~x)dθ = R b

c f(θ | ~x)dθ = α/2

.

un intervalle

[a, b]

tel que

f(a | ~x) = f (b | ~x)

et

f (u | ~x) > f(b | ~x)

pour tout

u ∈ [a, b]

.

Cette dénition orrespond à l'intervalleHPD (Highest ProbabilityDensity) etor-

respond à l'intervalle fréquentiste déni par le rapport de vraisemblane. Ce type

d'intervallesegénéralise simplementàdes ontours multidimensionnelsetest indé-

pendant du hoix d'unevaleur entrale.

Ces trois type d'intervallesontillustrés sur la gure 1.1.

x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ x

0 2 4 6 8 10 12 14

densite de probabilite f(x)

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

µ

Fig. 1.1: Exemples d'intervalle de onane à 68% : entré sur la moyenne (à gauhe), entré

sur lamoyenne en probabilité (au entre),intervalleHPD (à droite).

1.3 Inertitudes systématiques

La prinipale diulté, que nous allons disuter maintenant, est l'inlusion d'iner-

titudes systématiques dans l'estimation par intervalle. Ce point est relativement simple

dans le as bayésien mais peut se révéler très déliat dans le ontexte fréquentiste. Il

serait même possible d'argumenter que le onept même d'inertitude systématique n'a

pas de sens dans une interprétation purement fréquentiste. Nous nous ontenterons de

dérire une approhe possible parmi les diérentes solutions de e problème qui ont pu

(13)

onpeutdistinguerlesparamètres

quel'onsouhaiteréellementontraindreeteux

dont

ononnaît lavaleur

~ν est

ave une inertitude

∆~ν est

(ette notationpouvantorrespondre à une matrie de ovariane, par exemple). Ces derniers onstituent les paramètres de

nuisane.

1.3.1 Approhe fréquentiste : vraisemblane prolée

L'éartentre lavaleuronnue etlavaleurvraied'unparamètredenuisanereprésente

un biais, que l'on doit pouvoir estimer.La valeur onnue des paramètres de nuisane re-

présenteainsiuneréalisationd'unestimateur,etl'inertitudesurleparamètres'interprète

ommesavariane.Apartirde ledensitéde probabilitédeet estimateur,onassoieune

fontiondevraisemblane

L nuisance (~ν; ~ν est ; ∆~ν est )

auxparamètresdenuisane.Lafontion

de vraisemblane totale du problème s'érit alors :

L (~θ, ~ν ) = L

modèle

(~θ, ~ν) × L nuisance (~ν)

(1.15)

L

modèle est la vraisemblane du modèle seul. Si les paramètres

sont parfaitement onnus,

L nuisance (~ν) = δ(~ν − ~ν est )

et onse retrouve dans leas disuté préédemment. A partir de ette fontion de vraisemblane, on onstruit [2℄ la fontion de vraisemblane

prolée (prole likelihood):

L pr (~θ) = max

~

ν L (~θ, ~ν)

(1.16)

en maximisant la fontion de vraisemblane relativement aux paramètres

pour haque

valeur des paramètres

. L'estimateur paramètres de nuisane, à

θ

xé, est souvent noté

~ν ˆˆ

. Lerapport :

λ(~θ) = L pr (~θ)/ L ( ~θ), ˆ

(1.17)

~ ˆ

θ

est l'estimateurde maximum de vraisemblane,possèdelesmêmespropriétés statis- tiques que lerapport de vraisemblanelassique [3℄. Laonstrution de ettefontion de

vraisemblane est illustréesur lagure 1.2 :

θ paramètre d’intérêt

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

ν paramètre de nuisance

-1 -0.5 0 0.5 1 1.5 2 2.5

3 ) ν, θ ( λ -log

1 2 3 4 5 Vraisemblance

θ paramètre d’intérêt -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 ν

paramètre de nuisance

-0.5 -1 0 0.5 1.5 1 2.5 2 3

) ν, θ ( λ -log

0 1 2 3 4 5 6

θ paramètre d’intérêt

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

) θ ( λ -log

0 1 2 3 4 5 6

Vraisemblance profilée Vraisemblance profilée

Fig. 1.2: Desription shématique da lavraisemblane prolée.

Agauhe :logarithmede lafontiondevraisemblane dansleplan

(θ, ν)

;laligne rougeindique

leminimum relativement à

ν

à

θ

xé.

Au entre: logarithme delafontion de vraisemblane en fontiondes paramètres

(θ, ν)

.

A droite : logarithmede lafontion devraisemblane proléeen fontion duparamètre

θ

.

(14)

Ilest importantdenoterque,silenombredeparamètresdenuisaneexèdelenombre

de degrés de liberté du problème, il existe une dégénéresene sur les valeurs

~ν(~θ) ˆ

qui

maximise

L (~θ, ~ν)

. Dans e as, on détermine la valeur de la fontion de vraisemblane prolée sans réellement ontraindre les paramètres de nuisane : on ne dispose pas de

mesure du biais.

1.3.2 Approhe bayésienne

La méthode bayésienne permet d'inlure les eets d'inertitudes systématiques via

des paramètres de nuisane. En séparant expliitement les paramètres à ajuster et les

paramètres de nuisane, la densitéa posterioripeut s'érire :

f (~θ, ~ν | ~x) = f(~x | ~θ, ~ν)f (~θ, ~ν)

RR f (~x | ~θ, ~ν)f(~θ, ~ν)d~θd~ν = L (~θ, ~ν)f (~θ, ~ν )

RR L (~θ, ~ν )f(~θ, ~ν)d~θd~ν

(1.18)

et la densité a posteriori des paramètres

n'est que la densité marginale obtenue en

intégrantsur lesparamètres de nuisane

:

f (~θ | ~x) =

R L (~θ, ~ν)f (~θ, ~ν)d~ν

RR L (~θ, ~ν)f(~θ, ~ν)d~θd~ν

(1.19)

Généralement, les inertitudes sur les paramètres de nuisane sont indépendantes de

la densité a priori des paramètres

. La densité a priori est fatorisable sous la forme

f (~θ, ~ν) = π(~θ)k (~ν )

:

π(θ)

est la densité a priori pour les paramètres

~ θ

et

k(~ν)

elle des

paramètres de nuisane. Cette densité a priorides paramètres de nuisane est identique

à la fontionde vraisemblane

L nuisance

introduite dans la onstrutionde lafontion de

vraisemblaneprolée.Onpourraparexemplehoisirpour

k (~ν)

unedensitémultinormale dénie parles valeursattendues etlamatriede ovarianedes paramètres de nuisane

2

.

Cette fatorisation permet également de sortir la densité a priori des paramètres de

l'intégrale. Conrètement, ei reviendra à intégrer la fontion de vraisemblane puis à

multiplierpar la densité a priori, la première étape étant généralement la plus oûteuse

en tempsde alul (intégration numérique). Finalementonobtient:

f (~θ | ~x) = π(~θ) R

L (~θ, ~ν)k (~ν) d~ν RR L (~θ, ~ν)π(~θ)k (~ν) d~θd~ν

(1.20)

Dansla pratique,ladensitéa priorides paramètresde nuisanen'est onnue qu'approxi-

mativement.Si es paramètres sont orretement estimés,ils ne doivent que peu aeter

la qualité de l'ajustement. Cettequalité peut se quantier par laprobabilité d'obtenir la

valeurlaplusprobableduparamètre,soitlavaleurmaximaledeladensitéaposteriori.On

peut don valider la valeur des paramètres de nuisane en étudiant ladispersion relative

de la valeur maximale de la densité a posteriori pour diérentes valeurs des paramètres

de nuisane. Laonstrutiond'un intervallede onane inluantleseets systématiques

se fait ommepréédemment en intégrant la densitéa posteriori :

Z b a

f (~θ | ~x)d~θ = α.

(1.21)

2

Un paramètreonnu exatement aura pour a priori une distribution de Diraet l'intégrale sur e

(15)

densité a posteriori sont également oûteux en temps de alul et néessitent la mise en

plae de méthodes numériques appropriées quiseront disutées auhapitre 2.

1.4 Vraisemblane de Poisson

1.4.1 Comptage d'événements

Une expériene de physique des partiules se ramène généralement à un omptage

d'événementspassantdes oupuresdeséletion.Onsouhaiteensuiteonfronterlenombre

d'événements observé à un modèle permettant de aluler e nombre d'événements. Le

nombre d'événements observé est la réalisation d'une variable aléatoire distribuée selon

une loi de Poisson, dont le paramètre est le nombre d'événements attendu moyen. Pour

améliorerla sensitivité d'une analyse,on va ombiner plusieurs mesures orrespondant à

des séletions diérentes, voire àun déoupage selonune variable spéique(lassesd'un

histogramme). Chaque ensemble d'événements ainsi déni forme un anal d'analyse. Le

modèlepermetde alulerlenombre d'événementsmoyen attendu dans haque anal,en

fontiondesparamètresphysiqueàmesurer(setioneae,ouplage,...)etdediérents

paramètres onnusave une préision nie (paramètres de nuisane).

Dansla suite nous adopterons lesnotations suivantes :

~ θ

, les

n θ

paramètres à ajuster.

, les

n ν

paramètres de nuisane. Les paramètres de nuisane pouvant avoir des

valeurs diérentes dans lesdiérents anaux,on aura

n ν = kn c

n c

est le nombre

de anaux d'analyse et

k

le nombre de paramètres de nuisane néessaire à la des-

riptiond'un unique anal.

M ~ (~θ, ~ν)

: lenombre d'événements attendu moyen dans haque anal. C'est un ve- teur de dimension

n c

.

D ~

: le nombre d'événements observés dans haque anal (veteur de dimension

n c

également).

1.4.2 Soures d'erreurs

Pour prendre en ompte les paramètres de nuisane, il faut formuler analytiquement

la fontionde vraisemblanede es paramètres.

Dansleasgénéral,ilvaexisterdemultiplesorrélationspossiblesentrelesparamètres

qui peuvent mener à une densité diilement formulable. En eet l'inertitude globale

peut se omposer de plusieurs soures d'inertitude indépendantes les unes des autres,

mais qui peuvent aeter simultanément plusieurs paramètres de nuisane. On pourra

don ne onsidérer quedes souresd'erreur aratériséespar :

les ontributions d'une même soure, entièrement orrélées (ou antiorrélées) entre

les diérents paramètres etd'un anal àl'autre.

les ontributions de deux soures d'inertitudediérentes, entièrement déorrélées.

Les paramètres de nuisane seront aratérisés par une valeur entrale onnue

~ν 0

et

deux matries d'erreurs

+

et

omme la matrie des utuations à

± 1σ

. Ce sont

deux matries

n ν × n s

,

n s

étant le nombre de soures d'inertitude onsidérées.

+ ij

est

la utuation à

du paramètre de nuisane

ν i

produit par la soure d'erreur

j

. Les

termes de

±

peuvent être négatifs pour traduire des antiorrélationsentre inertitudes.

L'existene de deux matriespermet de traiter des erreurs asymétriques.

(16)

Laorrélationentretouteslesutuationsliéesàunesoured'erreurpermetdedérire

l'ensemble de es utuations ave un unique paramètre. Il sut dès lorsde redénir les

paramètres de nuisane:aulieudetraiter

ommedes variablesaléatoires,ononsidère un veteur

Ω ~

,de dimension

n s

.Engénéral

Ω ~

sera distribué selonune loimultinormalede moyenne

~µ = ~ 0

etmatrie de ovariane

Σ = 1

.

Pour une réalisation

de

Ω ~

, lesparamètres de nuisanepeuvent alors s'érire :

~ν = ~ν 0 + f(~ω, ~ ∆ + , ∆ )

(1.22)

Plusieurs presriptions sont possibles pour dénir la fontion de utuation

f ~

. Le trai-

tement orret des orrélations totales impose que la valeur entrale

~ν 0

des paramètres

orresponde àla médianede la densité de probabilité assoiée, 'est-à dire que la proba-

bilité de utuer vers lehaut ouvers lebas soitla même.Cei impose omme ontrainte

que les omposante

ω i

et

f i

aient le même signe. Si une soure d'erreur n'aete qu'un

unique paramètre,laquestiondes orrélationsne sepose plusetlehoixde ladensitéest

plus libre.

Latransformation

f(~ω, ~ ∆ + , ∆ )

laplus ourantesera de laforme:

f(~ω, ~ ∆ + , ∆ ) = ~ω

T

ave

∆ ij = ∆ sgn(ω ij i ) =

+ ij

si

ω i > 0

ij

si

ω i < 0

(1.23)

En prenant une erreur moyenne

∆ m = 1 2 (∆ + + ∆ )

, on peut également symétriser le

problème et :

f(~ω, ~ ∆ + , ∆ ) = ~ω

T

m

(1.24)

Ceiorrespondàdeuxasextrêmes:lepremierprésenteunedisontinuitédansladensité

du paramètreauniveau de lavaleurentrale,leseondgommeleseetsd'asymétrie qu'il

peutêtre importantde prendre enonsidération.Il s'agitde deuxas limitesd'une lasse

de transformationde laforme:

f(~ω, ~ ∆ + , ∆ ) = ~ω

T

×

+ ∆ + − ∆ U(~ω)

(1.25)

ave

U

une matrie diagonale

n s × n s

telle que

U ii = u(ω i )

u(r)

désigne n'importe

quelle fontionéhelon, 'est à dire une fontion monotone, roissante, telle que :

u(0) = 1

2

,

lim

u→−∞ = 0

,

lim

u→+∞ = 1.

(1.26)

Plusieurs famillesde fontions omme:

Ar tangente :

2 tan 1 (κr)+π

,

Fontion d'erreur :

erf(κr)+1

2

,

Sigmoïde:

1 1+e κr

,

où leparamètre

κ

est libre, satisfont es onditions.L'asymétrie est maximalepour

κ → + ∞

alors que

κ → 0

orrespond à l'erreur moyenne. Le leteur souhaitant approfondir es questions pourra onsulter laréférene [4℄. L'eet d'une telle fontion est illustré sur

la gure 1.3.

1.4.3 Fontion de vraisemblane du problème

Pour une expériene de omptage, le nombre d'événements

D i

dans le anal

i

est la

réalisation d'une variable aléatoire qui suit une loi de Poisson de moyenne

M i

~θ, ~ν

. Si

(17)

x

-2 0 2 4 6 8

0 10000 20000 30000 40000 50000

-2.0

x = 3 +1.0

∞ κ = κ = 2 κ = 0

y

-4 -2 0 2 4 6 8

0 5000 10000 15000 20000 25000 30000 35000 40000 45000

+1.1

y = 2 -1.5

∞ κ = κ = 2 κ = 0

x

-2 0 2 4 6

y

-4 -2 0 2 4 6

Fig. 1.3: Distributions obtenues par utuation aléatoire d'un ouple de paramètres

x y

, ave

une soure de nuisane asymétrique

+ = −1.5 1

et

= −1.1 2

pour trois valeurs de

κ

: les

deuxaslimites(

κ = 0

enrougeet

κ = + ∞

enbleu)etunasintermédiaire(

κ = 2

,envert).Les

gure dedroite représente

y

enfontion de

x

et montrel'anti-orrélation entre lesutuations.

les anaux sontstatistiquement indépendants, 'est-à-dire qu'un événement ne ontribue

qu'à un unique anal, la fontionde vraisemblane des paramètres seuls est :

L

~θ, ~ν

=

n c

Y

c=1

e −M c ( ~ θ,~ ν ) M c

~θ, ~ν D c

D c !

(1.27)

Enajoutantlesparamètresde nuisane,queesoitpourun traitementfréquentisteou

bayésien,lafontiondevraisemblanedoitêtremultipliéeparlafontiondevraisemblane

(ou ladensitéa priori)des paramètresde nuisane, déritsparlesparamètres

introduit

au paragraphepréédent. On obtient ainsi :

L

~θ, ~ω

=

n c

Y

c=1

e −M c ( θ,~ ~ ν(~ ω,∆ + ,∆ ) ) M c

~θ, ~ν(~ω, ∆ + , ∆ ) D c

D c !

n s

Y

s=1

√ 1 2π e

ω 2 s 2

(1.28)

Pour des raisons pratiques, il sera parfois utile de travailler ave le logarithme de la

fontion de vraisemblane pluttqu'ave lafontion elle-même, soit:

− ln L (~θ, ~ω) =

n c

X

c=1

M c

~θ, ~ν(~ω, ∆ + , ∆ )

n c

X

c=1

D c ln M c

~θ, ~ν(~ω, ∆ + , ∆ )

+

n c

X

c=1

ln(D c !) +

n s

X

s=1

ω s 2 2 + n s

2 ln(2π)

(1.29)

1.4.4 Exemple simple

Pour terminer e hapitre, illustrons e qui a été disuté par un exemple simple. La

mesure d'unesetioneae

σ

ombinantdeux anaux d'analyse(que l'ondésignera par

e

et

µ

en référene à l'état nal étudié, par exemple). Dans haque anal, le nombre

d'événements attendu seompose du signaletde bruit de fond.Lenombre d'événements

de signal est relié à la setioneae de produtionpar le produit de ette dernière par

(18)

la luminosité

et l'eaité de séletion ou aeptane

ξ i=e,µ

. Le nombre d'événements de bruit fond est estimé à partir de la luminosité

et de l'eaité de séletion

β i

(qui

inlutlasetioneaethéorique,supposéeonnue).Lesnotationsgénériques introduites

préédemment deviennent :

~θ = (σ)

,

~ν =

 β e

ξ e β µ

ξ µ

(1.30)

et pour le modèle :

M i

~θ, ~ν

= ℓ × (β i + ξ i × σ)

(1.31)

On onsidère trois soures d'inertitude indépendantes : une erreur sur la mesure

de luminosité (

∆ℓ

), une erreur sur la alibration de la simulation (

cal ν

) et une erreur

théorique sur la setion eae du fond (

th ν

). Les matries d'erreur sont don des

matries

3 × 5

. Ensupposantles erreurs symétriques,elles s'érivent :

± = ∆ =

0 ∆ cal β eth β e 0 ∆ cal ξ e 0 0 ∆ cal β µ ∆ th β µ

0 ∆ cal ξ µ 0

∆ℓ 0 0

(1.32)

Siles erreursentre

β e

et

ξ e

duesà laalibrationde la simulationsontantiorrélées,'est- à-dire qu'une modiationde laalibration augmente

β e

en diminuant

ξ e

etinversement, ette antiorrélation pourra setraduire en prenant

cal β e > 0

et

cal ξ e < 0

.

Il y aura trois paramètres de nuisane indépendants

, distribués normalement. Les paramètres de nuisaneen fontionde

sont alors :

~ν = ~ν 0 + ~ω

T

∆ =

β e0 +0 +ω 2 ∆ cal β e +ω 3 ∆ th β e

ξ e0 +0 +ω 2 ∆ cal ξ e +0

β µ0 +0 +ω 2cal β µ3th β µ ξ µ0 +0 +ω 2 ∆ cal ξ µ +0

ℓ 0 +ω 1 ∆ℓ +0 +0

(1.33)

et nalement la fontionde vraisemblane devient :

L (σ, ~ω) = (2π) 2 3 e

ω 2 1 + ω 2

2 + ω 2 3 2

Y

i=e,µ

e −ℓ×(β i i ×σ) (ℓ × (β i + ξ i × σ)) D i

D i !

(1.34)

Toutes lesappliations disutées dans lasuite de e mémoire reposeront sur la même

struture ave quelques omplexiations (augmentationdu nombre de paramètres ajus-

tés, de soures d'inertitudes, de anaux, diérentiationdes bruitsde fond,...).

(19)
(20)

olimpulherexstiteram,

dumignusegofueram.

Miser, miser!

modoniger

et ustusfortiter!

Cignusustus antat,CarminaBurana130

2

Implémentation des méthodes d'analyse

Dans e hapitre, nous allons dérire l'implémentation eetive des outils présentés

au hapitre préédent. La première étape onsiste à onstruire la fontion de vraisem-

blane 1.28, en fournissant le modèle, les données observées et les paramètres de nui-

sane (valeurnominaleetmatriesd'erreur) :

L = L (~θ, ~ω) = L

M(~θ, ~ω, ~ν ~ 0 , ∆ + , ∆ ), ~ D

.

Ensuite, ette fontion sera utilisée pour onstruire numériquement soit la fontion de

vraisemblaneprolée, soitune densitébayesiennea posteriori. L'ensemble de es implé-

mentations formeleode Mefisto (Monte-CarloErrors Fit with Statistial Tools).

2.1 Ajustements monodimensionnels

2.1.1 Vraisemblane prolée

Lealulde lafontionde vraisemblaneprolée, passeparlaminimisationde

L

rela-

tivementà

pourdiérentevaleursde

θ ~

.Poure faireondoitxerunensembledevaleur

de

~ θ

, et don xer des bornes de variations de

θ

. Il est don important d'avoir une idée

du résultatnal, pour xer e domaine(pour ouvrir larégion oùlerapport de vraisem-

blane

λ

estinférieurà12.5soit

)etlenombredepointsdealul(typiquementquelque entaines pour un temps de alul raisonnable, de quelque minutes à quelques heures).

Ces pointsde aluls peuvent soit être hoisis aléatoirement(distribution uniforme),soit

former une grille à pas xe. Cette dernière solution est utilisé par le programme Hist-

Fatory basé sur Roofit [5℄ qui est utilisée par défaut dans les analyses de physique

du top dans l'expériene ATLAS. La grillealéatoireest utilisée dans Mefisto. Dans les

deux programmes,laminimisationde lafontion de vraisemblaneen haque pointde la

grille utilise le logiiel Minuit [6℄. La similaritédes deux implémentations va permettre

de valider,auhapite4,l'implémentationde lafontionde vraisemblanedans Mefisto

en omparant aux résultatsde HistFatory.

Unefois lafontion de vraisemblane proléeestimée,on en déduit

λ

en divisantpar

leminimumglobal.On dispose,àlan, durapportde vraisemblaneévalué surune grille

disrète.Eninterpolantlaourbeobtenue,onpeutrésoudrenumériquementl'équation1.9

(21)

l'inertitude de mesure totale (statistique+systématique). L'inertitude statistique seule

peut s'évaluer en étudiant la fontionde vraisemblanedes paramètres

seuls, en xant

les paramètresde nuisane àleur valeur nominale

~ν = ~ν 0

.

2.1.2 Intégration bayesienne simple

Le alul d'une intégrale de la forme

I = R b

a f (x)g(x)dx

,

g(x)

est une densité de

probabilitésurl'intervalle

[a; b]

,revientaualulde lavaleurmoyennedelafontion

f(x)

.

Cette moyenne peut être approximée par l'estimateur de moyenne empirique:

I ˆ = b − a n

n

X

i=1

f (x i )

où les

x i

onstituent un éhantillon de

n

réalisations d'une variable aléatoire distribuée selon

g(x)

.Cet estimateur onverge vers

I

quand lataillede l'éhantillon devient grande ave unéart-type

σ I ˆ = σ g / √

n

,

σ g

étantl'éart-typedeladistribution

g

.C'estleprinipe

de l'intégration Monte-Carlo.

En utilisant la méthode préédente pour générer aléatoirement des réalisations des

paramètres de nuisanedistribués selon ladensité a priori, le alul de l'intégrale sur les

paramètres de nuisanedevient :

f(~θ) ∝ Z

L (~θ, ~ν)π(θ)k (~ν) d~ν ≈ π(θ) n

n

X

i=1

L (~θ, ~ν i )

La taille

n

de l'éhantillon à moyenner doit être susamment grande pour parourir l'ensembledel'espaedesparamètresdenuisane.Engénéralquelquesdizainesàquelques

entainesdemilliersd'itérationssusent.Deplus,lorsd'uneévaluationnumérique,ilfaut

eetuerealulpourunensemblede valeursde

etalulerl'intégralesur

eninluant

la densitéa prioride

pour déterminer la normalisationde la densitéa priori.

Iienore erreurssystématiques et statistiquessontentièrement intégréesdans lalar-

geur de la densité a posteriori. Cei est illustré sur la gure 2.1. La partie gauhe de

la gure montre la fontion de vraisemblane pour plusieurs réalisations des paramètres

de nuisane tirées aléatoirement suivant la densité a priori appropriée, omme dérit au

paragraphe 1.4.2. Laourbe violette (

~ν 0

) orrespond à la valeur entrale des paramètres

de nuisane. Lesparamètres utilisésorrespondent àunemesure desetion eae single

top en voie

s

dans l'expériene DØ [7℄.

La somme des es ourbes (en utilisant beauoup plus de utuations) permet de

aluler l'intégralequi orrespond exatement, dans leas d'un a priori uniforme sur un

intervallesusammentlarge, à ladensité a posteriori (ourbe de droite).

L'inertitude statistique est quantiée par la largeur moyenne des fontions de vrai-

semblane pour

xé.

Dans le programme Mefisto, à la n de l'intégration, on dispose ette fois de la

densité a posteriori évaluée sur une grille aléatoire, à un fateur de normalisation près.

Parinterpolation,ilestalorsaisédealulerl'intégraledenormalisation,dedéterminerla

valeurlaplus probable etnalementd'obtenir des intervalles de onane oudes limites.

(22)

-20 -15 -10 -5 0 5 10 θ 15 i )

ν θ , L(

ν 0

ν 1

ν 2

ν 3

ν 4

ν 5

ν 6

ν 7

ν 8

...

-20 -15 -10 -5 0 5 10 θ 15

θ ) L(

⇒ Σ

stat

syst

<<L max

δ

syst

stat

Fig.2.1: Desription shématique del'intégration surles paramètres de nuisane.

2.2 Ajustement de plusieurs paramètres

Pour un problème unidimensionnel, quelques entaines de points de alul susent.

Lorsqu'on souhaiteétendre àun ajustement de plusieurs paramètres,la taillede la grille

d'évaluationaugmente exponentiellementave lenombre de paramètres.Elle devient ra-

pidement trop grande pour être alulée en un temps raisonnable. De même, lors du

développement d'uneanalyse, notammentpour optimiserertaines oupures, ilpeut être

souhaitable de reproduire un grand nombre de fois le alul de la densité a posteriori,

mêmeunidimensionnelle,etdonde pouvoirfairelealulrapidement,auprixd'approxi-

mations supplémentaires.

2.2.1 Grille et éhantillonnage

Il est utile, à e stade, de disuter la présentation onrète des résultats numériques.

Unedensitédeprobabilitépeutêtreobtenuesousdeuxformes :uneexpression analytique

ouun ensemble de pointsdistribués selonette probabilité.Pour desproblèmes susam-

ment omplexes, un alulanalytique tel l'intégration sur les paramètres de nuisane est

exlu. Si on est apable de déterminer la valeur de la densité a posteriori

f (~θ)

en un

point donné de l'espae des paramètres, on peut substituer à la fontion analytique une

évaluation de la densité sur une grille uniforme (aléatoire ou à pas xe). On disposera

don de deux représentations possibles du résultatde lamesure :

Une fontion :des ouples

n

~θ i , f (~θ i ) o

i=1..n

ave

~ θ i

distribués uniformément.

Un éhantillon : des valeurs

n

~θ i

o

i=1..n

distribuées selon la densité

f (~θ)

.

La première approhe autorise le alul d'intégrales et d'intervalles de onane. La

seonde approhe permet très simplement d'obtenir la distribution marginale de haque

variable (dans le as d'un problème multidimensionnel) et d'eetuer un hangement de

variable.Il pourra s'avérer utile de passerd'une représentation àl'autre.

Dans le as le plus général on utilisera des événements pondérés, soit des ouples

n (~θ i , w i ) o

.Danse as ladistribution(histogramme)des

~θ i

pondérés par

ω i

permetd'es-

(23)

-20 -15 -10 -5 0 5 10 15 θ 20 0

2 4 6 8

θ ) f(

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1

0 20 40 60 80 100

-20 -15 -10 -5 0 5 10 15 θ 20

) θ f(

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

Fig. 2.2:Représentation deladensitépar200 ouples

n ~θ i , f (~θ i ) o

. Agauhe: ladistribution

uniforme des

θ i

(en haut) et la distribution des poids (en bas). A droite : la densité pondérée (histogramme ave inertitudes) et legraphe

n ~ θ i , f ( ~ θ i ) o

(pointsnoirs).

timer la densitéa posteriori.

Dans le as limite où tous les poids valent 1, l'information est omplètement ontenue

dans la distribution des

~θ i

.

A l'inverse la représentation

n ~θ i , f(~θ i ) o

orrespond à l'autre as limite où toute l'in-

formation est ontenue dans les poids

ω i = f (~θ i )

et les

θ i

uniformes n'apportent auune information.Danse seul as,ilexiste deux façons de visualiserladensité

f (θ)

:traerle

graphe des ouples

n ~ θ i , f (~θ i ) o

(e qui permet une estimation analytique par interpo-

lation) oula distributionpondérée de

~θ i

. Lapremière solutionest néanmoinsplus préise

et permet d'utiliserun éhantillon de tailleplus modesteomme l'illustrela gure 2.2.

2.2.2 Méthode approximée

An de dénir une proédure simpliée et plus rapide, ommençons par approfondir

le prinipe de l'intégration sur les paramètres de nuisane à partirde lagure 2.1.

Les paramètres de nuisane modient la position de haque distribution, qui peut

être évaluée par lemode

θ max

(estimateur du maximumde vraisemblane): ladispersion de l'estimateur du maximum de vraisemblane mesure l'erreur systématique. Lors de

l'intégrationsur lesparamètresde nuisane,onombinees deuxeets etlalargeurnale

de ladistribution a posteriori donneune erreur ombinée.

Deplus,lavaleurdu maximumde lavraisemblane

L max = L (θ max )

mesurelaqualité

de l'ajustement.Unparamètrede nuisanen'estpas ajustable etdonhaque utuation

doit menerà un ajustementde qualité similaire.

L max

étantune variable aléatoire,sa va-

leurpeututuerd'unjeudeparamètresàl'autremaisons'attend àe quelautuation

relative reste faible.

A partir de ette analyse, on onstate que, pour estimer l'eet des inertitudes sys-

tématiques, on peut se ontenter de mesurer, pour haque utuation, la fontion de

vraisemblane en un seul point, son maximum. Pour haque utuation on détermine la

(24)

valeurdes paramètres

~ θ

quimaximisentlavraisemblane.On obtientainsi un éhantillon de valeurs

, qu'il faut pondérer le as éhéant par la valeur de la densité a priori pour

. Pour un a priori uniforme borné ei revient à rejeter les points hors de l'intervalle

onsidéré. Rigoureusement, il faudrait également pondérer haque valeur par sa proba-

bilité, soitla valeur maximale de la fontion de vraisemblane. On peut néanmoins s'en

dispenser pour peu que ladispersion relativede

L max

soitfaible(f.

δ

sur la gure2.1).

La diulté prinipale onsiste à intégrer l'erreur statistique à ette approhe. Pour

elailfaudraitnonpasprendrelemaximumdelafontiondevraisemblanemaisl'éhan-

tillonner en tirant un ou plusieurs points aléatoirement selon ette distribution. Cette

approhe sera traitéeexatement auparagraphe suivant.

Dansle as de l'estimation du résultat attendu (mesure de sensibilitéd'une analyse),

onxelesparamètresàajusteràunevaleurattenduee quipermetde alulerlenombre

d'événements attendu :

D ~ = M ~ (~θ 0 , ~ν)

. On peut alors approximer l'erreur statistique en utilisant une propriété de la loi de Poisson :

P (λ, n) ≈ P (n, λ)

. Ainsi en faisant utuer

le nombre d'événements

D c

dans haque anal

c

selon une loi de Poisson de paramètre

λ = D c

, et en herhant le maximum de la fontion vraisemblane on obtient un ré- sultat similaire à elui onsistant à tirer aléatoirement des points selon la fontion de

vraisemblane.Cetteméthoden'est plus appliablelorsd'unemesureréelle oùlenombre

d'événements mesuré est une grandeur xe.

2.2.3 Monte-Carlo par haînes de Markov (MCMC)

L'approhe préédente résoutleproblèmedu alulrapide,maisest, en touterigueur,

fausse, autant d'un point de vue fréquentiste que bayesien. Pour traiter exatement le

problèmebayesien,nousallonsonserverl'idéed'éhantillonnerladensitéaposteriorimais

de manièreexate. On a pour ela reours à un Monte-Carlopar haînes de Markov [8℄.

2.2.3.1 Chaînes de Markov

Unehaîne de Markov est une série

~θ n

de réalisations de variables aléatoires

Θ ~ n

telle

que laprobabilitéde la réalisation

i + 1

ne dépend quede laréalisationpréédente, soit:

P ( Θ ~ i+1 = ~θ i+1 ) = P ( Θ ~ i+1 = ~θ i+1 | Θ ~ i = ~θ i )

(2.1)

Une telle haîne peut être utilisée, sous ertaines onditions, pour éhantillonner une

densité de probabilité

f(~θ)

.La haîne est dite ergodique si,indépendamment du premier élément de la haîne, la densité

f Θ ~ i (~θ i )

de

Θ ~ i

onverge vers elle de

f(~θ)

. Ainsi, à partir

d'une ertaine itération

n

, la haîne fournit une bonne approximation d'un éhantillon distribué selon

f(~θ)

.Enrevanhe un teléhantillon n'est pas simplepuisque lesvariables

aléatoires ne sont pas indépendantes.

L'algorithmeMetropolis-Hastings[8℄permetderéerunehaîneergodique.Ilonsiste

à onstruire l'élément

i + 1

àpartir de l'élément

i

de la manièresuivante :

On tirealéatoirementune valeur

selonune densité

q(~θ | ~θ i )

,ditefontiond'éhan-

tillonnage.

On détermine laprobabilité

α(~θ i , ~θ )

de transitionde

~ θ i

vers

selon :

α(~θ i , ~θ ) = min

(

1, f(~θ ) f (~θ i )

q(~θ i | ~θ ) q(~θ | ~θ i )

)

(2.2)

f(~θ)

est ladensité àéhantillonner.

Références

Documents relatifs

L’iconique se présente aussi comme un commentaire postérieur à l’œuvre, comme sa paraphrase ou son contresens parfois, sous forme d’illustrations, couvertures illustrées

On peut lancer assez de rayons afin d’obtenir une discr´etisation de la surface ´eclair´ee du mˆeme ordre que dans le cadre d’un calcul en m´ethode int´egrale.. Lors de calculs

Pour répondre à cette problématique, la solution proposée dans le cadre de cette thèse consiste à mettre en place un système interactif proposant à l'utilisateur diérents

Figure 5-5 : Comparaison des EISF déduits de l’analyse phénoménologique des spectres à 100µeV moyenné sur les trois températures (croix) à ceux attendus en

A titre d’illustration, nous allons exposer la r´ ` eponse de l’atome unique pour l’harmonique 35 g´ en´ er´ ee dans le n´ eon (calcul´ ee dans le cadre de l’approximation

Dans le cas o` u G est un groupe de Baire ab´ elien et A une alg` ebre de Banach, nous obtenons ` a l’aide du th´ eor` eme du graphe ferm´ e et du th´ eor` eme de Gelfand un r´

Proceedings of the American Mathematical Society, to appear. Linear forms in the logarithms of algebraic numbers I. Linear forms in the logarithms of algebraic numbers II. Linear

On considère à nouveau ici une particule métallique de constante diélectrique ε dans un milieu de constante diélectrique ε m soumise à une onde plane monochromatique