• Aucun résultat trouvé

Les tests de calibration sont des tests empiriques qui visent à déterminer si une suite de prédictions est faite par un expert ou par un prédicteur aveugle. Ils ne mesurent pas a priori la précision asymptotique d'une théorie µ par rapport à µ0.

Dans ce cadre  on parle d'apprentissage Bayésien  un prédicteur annonce une théorie µ (on emploie aussi le terme de croyance) et l'inspecteur vérie comment, conditionnellement à l'histoire hn, les deux mesures µ(·|hn)et µ

0(·|hn)se comportent

asymptotiquement. Blackwell et Dubins [19] ont déni une notion de convergence entre mesures, appelé fusion (merging dans la littérature anglaise). On appelle B la tribu engendrée sur H par l'ensemble des histoires nies et (Bn)n∈N la ltration de

(H, B) dénie par les ensembles mesurables à la date n. Dénition 3.5

Une mesure µ fusionne avec µ0 si pour µ0-presque toute histoire h∞ :

lim

n→∞supA∈B|µ(A|h n) − µ

0(A|hn)| = 0.

Intuitivement, si la croyance d'un prédicteur µ fusionne avec µ0 alors, après avoir

observé une histoire nie susamment longue hn, la mise-à-jour de sa croyance (i.e.

µ(·|hn)) est très proche de la loi réelle µ

0(·|hn). L'observation de hn permet bien de

prédire µ0.

Blackwell et Dubins [19] ont montré que si µ0 est absolument continue par rapport

à µ (i.e. si pour tout B ∈ F, µ(B) = 0 implique que µ0(B) = 0, ce que l'on note

µ  µ0), alors µ fusionne vers µ0. Réciproquement, Kalai et Lehrer [64] ont montré

que si µ fusionne avec µ0 (le long de toute ltration) alors µ0  µ. Absolue continuité

et fusion sont donc deux notions équivalentes.

La condition de fusion est, dans certains cas, trop forte pour déterminer s'il y a apprentissage ou non de µ0, comme l'illustrent les exemples 5 et 6 de Lehrer et

Smorodinsky [72]. Considérons le processus stochastique déterminé par une succession d'experiences de Bernouilli de paramètre p. On note µ0(p) la loi des suites de {0, 1}N

3.2. Apprentissage Bayésien - Fusion 33 générées ainsi. Supposons que le prédicteur sache que p est rationnel mais qu'il n'en connaisse pas la valeur exacte. En énumérant Q ∩ [0, 1] = {pn, n ∈ N}, la théorie µ

dénie par µ = Pn∈Nµ0(pn)2−(n+1) fusionne avec µ0 puisque µ0  µ.

Par contre, supposons que le paramètre p soit choisi uniformément sur [0, 1]. Après un grand nombre d'étapes, p sera presque connu, au sens où il appartient avec une probabilité arbitrairement grande à un intervalle [p − ε, p + ε] arbitraire- ment petit, mais µ n fusionne pas avec µ0. En eet l'événement déni par A =

h∞ : lim n→∞n1

Pn

m=1sm = p

est tel que µ0(A) = 1et µ(A) = 0. Le problème vient

du fait que A est un événement asymptotique. C'est pourquoi la notion de fusion faible a été introduite par Kalai et Lehrer [64].

Dénition 3.6

Une mesure µ fusionne faiblement avec µ0 si pour µ0-presque toute histoire h∞:

lim

n→∞A∈Bsup

n+1

|µ(A|hn) − µ

0(A|hn)| = 0. (3.3)

La dénition, qui dépend de la ltration choisie, est équivalente si au lieu de prendre le supremum sur les événements mesurables dans dans un futur immédiat, i.e. à la date n + 1, mais il est pris sur ceux mesurables dans un futur proche, i.e. à une date n + k avec k xé. Kalai et Lehrer [64] ont montré qu'une mesure µ fusionnant faiblement le long de n'importe quelle ltration vers µ0, fusionne vers µ0.

Un ensemble Nε ⊂ N est plein si sa densité supérieure notée UD(Nε) vérie

UD(Nε) := lim sup n→∞

|Nε∩ {0, . . . , n}|

n = 1. Dénition 3.7

Une mesure µ fusionne presque-faiblement avec µ0 si pour tout ε > 0, et pour

µ0-presque toute histoire h∞, il existe Nε un sous-ensemble plein de N tel que :

|µ0(A|hn) − µ(A|hn)| < ε, ∀n ∈ Nε, ∀A ∈ Bn+1.

Là encore, la dénition dépend de la ltration choisie. Lehrer et Smorodinsky [71] ont montré que si µ est telle que pour µ0-presque toutes les histoires, il existe un

ensemble plein N0 tel que :

lim inf n∈N0  µ(hn+1) µ0(hn+1) 1/n ≥ 1 (3.4)

alors µ fusionne presque-faiblement vers µ0. La condition (3.4) n'est pas nécessaire,

34 3. Tests de Théories et Calibration encore plus de notations (voir Lehrer et Smorodinsky [72] pour une étude poussée de ces convergences et des exemples illustratifs).

Kalai, Lehrer et Smorodinsky [65] ont relié les notions de fusion aux tests de calibration où les règles d'inspection appartiennent aux ensembles suivants :

1. RIiuest l'ensemble des règles d'inspection indépendantes des prédictions et sans

univers d'activation ;

2. RIiuc ⊂ RIiu est l'ensemble des règles d'inspection de RIiu à court terme ;

3. RIiuca ⊂ RIiuc est l'ensemble des règles d'inspection de RIiuc telles que pour

presque toute partie h∞, lim inf n→∞n1

Pn

m=11{h

∈ U (hn+1)} > 0.

Théorème 3.8 (Kalai, Lehrer et Smorodinsky [65])

1. Une mesure µ fusionne avec µ0 si et seulement si µ est RI-calibrée pour

toute règle d'inspection RI ∈ RIiu, µ0-ps.

2. Une mesure µ fusionne faiblement avec µ0 si et seulement µ est RI-calibrée

pour toute règle d'inspection RI ∈ RIiuc, µ0-ps.

3. Une mesure µ fusionne presque-faiblement avec µ0 si et seulement µ est

RI-calibrée pour toute règle d'inspection RI ∈ RIiuca, µ0-ps.

Jeu entre l'inspecteur et un prédicteur

Les deux sections précédentes présentent des résultats à première vue contradic- toires. En eet, d'un côté on a armé que, étant donnée une distribution de règles d'inspection à court terme, on peut construire une théorie de comportement µ cali- brée de manière aveugle, i.e. sans information sur µ0. D'un autre côté, une théorie

ne peut réussir tous ces tests qu'à la condition que µ fusionne-faiblement vers µ0, et

donc il est nécessaire que µ et µ0 soient très proches (car la notion de fusion-faible

est plus faible que la fusion et plus forte que la fusion-presque faible).

Une réponse à ce paradoxe peut être trouvée si l'on considère le jeu entre l'ins- pecteur et le prédicteur (introduit par Lehrer [68], section 4) où l'espace d'actions de l'inspecteur est ∆(RIiuc)  l'ensemble des probabilités sur les règles d'inspection

indépendantes des prédictions sans univers d'activation et à court terme, munie de la tribu produit  et celui du prédicteur est Tc. Étant données une partie h∞choisie

par la nature, une théorie µ et une règle d'inspection RI, le paiement du prédicteur, noté V (µ, RI, h∞), est égal à 1 si µ est RI-calibrée le long de het 0 sinon.

D'après le théorème 3.3, pour toute stratégie λ de l'inspecteur, il existe une straté- gie µ du prédicteur aveugle telle que pour toute histoire innie h∞, V (µ, RI, h) = 1

soit : min λ∈∆(RIiuc) max µ∈Tc E µ0,λ[V (µ, RI, h ∞ )] = 1.

Notons Mf(µ0) l'ensemble des mesures qui ne fusionnent pas faiblement avec µ0.

3.3. Calibration par rapport à une grille et ε-calibration 35

Documents relatifs