L’analyse des chaînes de Markov

0 100 200 300 400 500

−0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 B^g

0 0.5 1 1.5 2 2.5 3 3.5 t(× 10−4) -6.5 -6.0 -5.5 -5.0 -4.5 -4.0 B^g (× 10 2)

-8 -7 -6 -5 -4 -3 -2 -1 B_g(× 102) 0 50 100 150 200 250

Chapitre 3

Implémentation de l’algorithme MCH

dans le code public HERAFitter,

validation et premiers résultats

L’estimation des erreurs statistiques sur des observables issues des simulations Monte

Carlo est une tâche subtile et nécessite un traitement minutieux de la chaîne de Markov.

La procédure d’analyse d’une chaîne de Markov se compose de plusieurs étapes. En

par-ticulier, il est nécessaire d’enlever la région de thermalisation, d’examiner correctement

les corrélations entre les états voisins de la chaîne et in-fine de vérifier la convergence de

la chaîne.

2.5.1 La thermalisation

Le temps de thermalisation de la chaîne souvent notébcorrespond au nombre d’états

ou de points { ˆqt}t=1,...,bà enlever en début afin que la chaîne ne soit plus sensible à son état

de départ. Ce temps peut être estimé par rapport à l’indicebdu premier état de la chaîne

atteignant la valeur médiane de la densité de probabilité à posteriori P( ˆqt|D) notée P1/2

tel que : P( ˆqb|D)>P1/2.

Pour illustrer la thermalisation, nous avons représenté sur la figure 2.5 l’historique

Monte Carlo du paramètre Bg considéré dans la sous-section1.5.1.2pour trois chaînes

in-dépendantes, chacune partant d’un point différent. Nous remplaçons la procédure

stan-dard par la procédure Monte Carlo basée sur l’algorithme de la figure2.4que nous avons

implémenté dans le code public HERAFitter2.

t

Chain 1

Chain 2

Chain 3

FIGURE2.5 – Valeur du paramètre B

en fonction du temps Monte Carlo t pour trois chaînes de

Markov indépendantes. Les valeurs initiales de

pour chacune des trois chaînes de Markov 1,

2 et 3 correspondent respectivement à

= 67.44 ,

= 0.87 et

= 81.58 . Nous identifions

clairement sur ce graphe la région de thermalisation, qui est limitée aux∼100−210 premières

itérations.

Nous pouvons identifier sur la figure2.5la région de thermalisation, dont l’étendue

dépend des points de départ. La chaîne représentée en trait plein de couleur verte a pour

valeur de départ celle de l’équation(1.89) et est donc termalisée très rapidement,

spécia-lement après une seule itération, tandis que les autres chaînes, dont les points de départ

sont loin de la valeur duχ2minimal, présentent une thermalisation d’environ 153

itéra-tions pour la chaîne représentée par la couleur rouge et 209 itéraitéra-tions pour celle

repré-sentée par la couleur bleue ; comme prévu, plus le point de départ est éloigné de la valeur

minimale duχ2, plus la thermalisation est longue.

2.5.2 Le traitement des corrélations

En construisant une chaîne de Markov, l’état ˆqt dépend fortement de l’état ˆqt−1et les

quantités calculées à partir de cette chaîne forment elles-mêmes une chaîne de Markov

avec des corrélations inhérentes d’un membre à l’autre. Ces types de corrélations sont

souvent appelés « autocorrélations » dans le temps de simulation. Considérons que nous

aimerions extraire un observable O d’une simulation de chaîne de Markov avec N points.

Pour cette estimation, nous utilisons les N estimations successives Monte Carlo Ot (nous

supposons dans ce qui suit que la région de burn-in a déjà été écartée, c’est-à-dire que

la chaîne a atteinte l’équilibre avant l’enregistrement des données) et nous calculons la

moyenne usuelle〈O〉où〈.〉signifie la moyenne sur les N points de données. L’estimation

habituelle de l’écart quadratique moyen de cette moyenne peut être calculée

σ2

naïve=¡Ot− 〈O〉¢2. (2.11)

Cette erreur “naïve” repose sur l’hypothèse que les mesures effectuées sur la chaîne de

Markov ne sont pas corrélées, ce qui n’est généralement pas vrai. Afin de tenir compte des

corrélations, on peut introduire pour l’observable donnée O, le temps d’autocorrélation

intégréτint, qui peut être défini comme suit :

τint= 1

2

+∞

X

s=−∞

ρ(s), (2.12)

oùρ(s) est la fonction d’autocorrélation normalisée définie par :

ρ(s) =

¡

Ot− 〈O〉¢¡

Ot+s− 〈O〉¢

¡

Ot− 〈O〉¢2

. (2.13)

La dépendance deρ(s) sur le temps de séparation s seulement est une conséquence de

la chaîne d’être en équilibre. Le temps d’autocorrélation intégré contrôle l’erreur

statis-tique dans la mesure Monte Carlo de O et il y a surtout deux possibilités d’incorporer

ce temps d’autocorrélation dans l’évaluation des erreurs statistiques. Le premier consiste

à écarter 2τintpoints entre deux points effectifs, ou en d’autres termes, à créer un sous

échantillonnage en rejetant tous les états qui sont plus proches que 2τintl’un de l’autre,

afin d’obtenir des états indépendants. Cette approche présente l’inconvénient d’exiger

la connaissancea priori de τint. La deuxième approche consiste à conserver toutes les

mesures, mais en tenant compte du temps d’autocorrélation pour estimer les erreurs

ou de points { ˆq_t}_t_=1,...,_bà enlever en début afin que la chaîne ne soit plus sensible à son état

tel que : P( ˆq_b|D)>P_1/2.

Monte Carlo du paramètre B_g considéré dans la sous-section1.5.1.2pour trois chaînes

implémenté dans le code public HERAFitter².

En construisant une chaîne de Markov, l’état ˆq_t dépend fortement de l’état ˆq_t₋₁et les

naïve=^¡Ot− 〈O〉^¢². (2.11)

τint= ¹

O_t− 〈O〉¢¡

O_t₊_s− 〈O〉¢

Ot− 〈O〉^¢²

τ⁼

〈O〉B= ¹

O_t+

O_t

〈O〉Jack.= ¹

Jack.=^N−1

(〈O〉B− 〈O〉Jack.)² (2.16)

sur la figure2.6pour le cas d’un seul paramètre variable, à savoir le paramètre B_g (tous