• Aucun résultat trouvé

1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ

N/A
N/A
Protected

Academic year: 2022

Partager "1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ"

Copied!
2
0
0

Texte intégral

(1)

M´ethode de Monte Carlo par chaˆınes de Markov - II

TD5-MAPI3 2016-2017

1 Gradient stochastique

1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ

0

= −∇V (θ) converge vers le minimum θ

de V .

2) Rappeler la m´ ethode du gradient, version discr´ etis´ ee du flot de gradient, qui permet de minimiser une fonction V par un algorithme d´ eterministe.

Supposons maintenant que nous n’avons pas acc` es directement au gradient mais ` a ∇V (θ) + ξ

n

, o` u ξ

n

sont des variables al´ eatoires de moyennes nulles et de valeurs absolues born´ ees |ξ

n

| ≤ K. On utilise alors l’algorithme de gradient stochastique suivant pour approcher le minimum θ

de V :

θ b

n+1

= θ b

n

− γ

n

(∇V (b θ

n

) + ξ

n+1

),

o` u θ b

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable.

3) Montrer que si ∇V ≤ C et V (θ) − V (θ

) ≥ c(θ − θ

)

2

(pour deux constantes c, C ≥ 0), alors

E [(b θ

n+1

− θ

)

2

|b θ

n

] ≤ (1 − 2γ

n

c)(b θ

n

− θ

)

2

+ γ

n

(C + K)

2

. 4) Montrer que Q

n

k=0

(1 − 2γ

k

c) converge vers 0.

5) Montrer par r´ ecurrence que, pour tout k

0

≤ n, on a

E [(b θ

n

− θ

)

2

] ≤

n

Y

k=k0

(1 − 2γ

k

c)

!

· E [(b θ

k0

− θ

)

2

] +

n

X

k=k0

γ

k2

!

· (C + K)

2

.

6) En d´ eduire la convergence en moyenne quadratique de l’algorithme : E [(b θ

n

− θ

)

2

] converge vers 0 quand n tend vers l’infini.

2 Estimation r´ ecursive d’un quantile

Soit (X

n

) une suite de variables al´ eatoires i.i.d. de fonction de r´ epartition F r´ eguli` ere et de densit´ e F

0

> 0.

Pour α ∈]0, 1[, on note θ

α

le quantile d’ordre α de la loi F : F(θ

α

) = 1 − α. Afin d’estimer r´ ecursivement θ

α

on utilise l’algorithme stochastique r´ ecursif :

θ b

n+1

= θ b

n

− γ

n

(1I

{X

n+1≤bθn}

− 1 + α),

o` u θ b

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable.

1) Calculer le champ moyen de l’algorithme E [(b θ

n+1

− θ b

n

)|b θ

n

].

2) Montrer que l’algorithme est un algorithme de gradient stochastique pour une fonction strictement convexe de minimum θ

α

.

3) On se place dans le cas o` u F est la loi normale standard. Etudier empiriquement la convergence et la loi de fluctuation de la suite (b θ

n

) dans le cas des trois quartiles.

4) Reprendre la question pr´ ec´ edente en rempla¸ cant la loi normale par une loi exponentielle puis par la loi de Cauchy.

1

(2)

3 Bandit ` a deux bras

Une machine ` a sous a deux leviers. La probabilit´ e de gagner avec le levier A (respectivement B ) est inconnue et vaut p

A

(resp. p

B

). Un joueur va chercher ` a optimiser son gain moyen, par un choix judicieux des leviers.

Voil` a sa premi` ere strat´ egie : ` a l’instant n + 1, il choisit le levier A si le taux de r´ eussite du levier A (calcul´ e sur les fois pr´ ec´ edentes o` u le joueur a choisi le levier A) est sup´ erieur ou ´ egal au taux de r´ eussite du levier B (calcul´ e sur les fois pr´ ec´ edentes o` u le joueur a choisi le levier B). Dans le cas contraire, il choisit le levier B.

1) Simuler cette strat´ egie.

2) On suppose que p

A

> p

B

. Expliquer pourquoi la situation suivante repr´ esente un pi` ege susceptible d’arriver avec une probabilit´ e non nulle : le joueur perd d’abord avec le levier A puis gagne avec le levier B.

Voil` a sa seconde strat´ egie : ` a l’instant n + 1, il choisit la machine A (resp. B) avec probabilit´ e θ

n

(resp.

1 − θ

n

) et

θ

n+1

=

θ

n

s’il a perdu θ

n

+ γ

n

(1 − θ

n

) s’il a gagn´ e avec A

θ

n

− γ

n

θ

n

s’il a gagn´ e avec B.

θ

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable. Il est possible de montrer que θ

n

converge vers 1 (resp. 0) si A (resp. B) est la meilleure machine.

3) Calculer le champ moyen E [(θ

n+1

− θ

n

)|θ

n

].

4) Montrer que si p

A

> p

B

(resp. p

A

< p

B

) alors E [θ

n

] est croissant (resp. d´ ecroissant).

5) Illustrer cette strat´ egie par des simulations. En particulier, mettre en ´ evidence la convergence du taux de r´ eussite global vers max(p

A

, p

B

), et v´ erifier si il y a un th´ eor` eme limite central.

4 Mod` ele autor´ egressif ` a indices al´ eatoires

On consid` ere ici le mod` ele autor´ egressif ` a indices al´ eatoires suivant : X

n+1

= A

εn

X

n

+ B

εn

.

• La suite observ´ ee est X = (X

n

)

n≥0

(on choisit X

0

arbitrairement).

• Le bruit ε = (ε

n

)

n≥0

est une suite de variables al´ eatoires i.i.d. ` a valeurs dans {1, 2}.

1) Simuler ce mod` ele et repr´ esenter graphiquement les trajectoires obtenues. On pourra essayer plusieurs valeurs pour les matrices A

1

, A

2

et les vecteurs B

1

, B

2

. Par exemple, la trajectoire du Dragon de Heigh- ways, donn´ ee par

A

1

=

1/2 −1/2 1/2 1/2

, A

2

=

−1/2 −1/2 1/2 −1/2

, B

1

=

0 0

, B

2

=

1 0

.

2) Etudier empiriquement la loi des grands nombres et le th´ eor` eme de la limite centrale pour les suites (A

εn

) et (B

εn

).

2

Références

Documents relatifs

La fonction de Möbius est une fonction qui possède diverses propriétés et qui est utilisée dans différentes branches des mathématiques.. Nous montrons ici deux de ses propriétés

[r]

[r]

On a alors ∆g ε = 2ε &gt; 0 sur D, la fonction g ε ne peut alors admettre de maximum local en aucun point de D (en un tel point, les d´ eriv´ ees secondes partielles de g ε

4. On choisit cinq animaux au hasard. La taille de ce troupeau permet de consid´erer les ´epreuves comme ind´ependantes et d’assimiler les tirages ` a des tirages avec remise. On note

• Si on suppose le tube initialement vide (rempli d'air), la rotation du tourniquet (initialement immobile) pourrait commencer dès que du liquide entre à l'extrémité ; si

On consid` ere une tige inextensible de longueur `, suspendue par une extr´ emit´ e et portant.. a son autre extr´ emit´ e un point de

En déduire l’expression du champ électrostatique en M dans la base choisie.. On rappelle que dans cette