• Aucun résultat trouvé

1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ

N/A
N/A
Protected

Academic year: 2022

Partager "1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ"

Copied!
2
0
0

Texte intégral

(1)

M´ethode de Monte Carlo par chaˆınes de Markov - II

TD5-MAPI3 2016-2017

1 Gradient stochastique

1) Montrer que si V : R → R est strictement convexe et tend vers l’infini, alors la solution θ de l’´ equation diff´ erentielle θ

0

= −∇V (θ) converge vers le minimum θ

de V .

2) Rappeler la m´ ethode du gradient, version discr´ etis´ ee du flot de gradient, qui permet de minimiser une fonction V par un algorithme d´ eterministe.

Supposons maintenant que nous n’avons pas acc` es directement au gradient mais ` a ∇V (θ) + ξ

n

, o` u ξ

n

sont des variables al´ eatoires de moyennes nulles et de valeurs absolues born´ ees |ξ

n

| ≤ K. On utilise alors l’algorithme de gradient stochastique suivant pour approcher le minimum θ

de V :

θ b

n+1

= θ b

n

− γ

n

(∇V (b θ

n

) + ξ

n+1

),

o` u θ b

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable.

3) Montrer que si ∇V ≤ C et V (θ) − V (θ

) ≥ c(θ − θ

)

2

(pour deux constantes c, C ≥ 0), alors

E [(b θ

n+1

− θ

)

2

|b θ

n

] ≤ (1 − 2γ

n

c)(b θ

n

− θ

)

2

+ γ

n

(C + K)

2

. 4) Montrer que Q

n

k=0

(1 − 2γ

k

c) converge vers 0.

5) Montrer par r´ ecurrence que, pour tout k

0

≤ n, on a

E [(b θ

n

− θ

)

2

] ≤

n

Y

k=k0

(1 − 2γ

k

c)

!

· E [(b θ

k0

− θ

)

2

] +

n

X

k=k0

γ

k2

!

· (C + K)

2

.

6) En d´ eduire la convergence en moyenne quadratique de l’algorithme : E [(b θ

n

− θ

)

2

] converge vers 0 quand n tend vers l’infini.

2 Estimation r´ ecursive d’un quantile

Soit (X

n

) une suite de variables al´ eatoires i.i.d. de fonction de r´ epartition F r´ eguli` ere et de densit´ e F

0

> 0.

Pour α ∈]0, 1[, on note θ

α

le quantile d’ordre α de la loi F : F(θ

α

) = 1 − α. Afin d’estimer r´ ecursivement θ

α

on utilise l’algorithme stochastique r´ ecursif :

θ b

n+1

= θ b

n

− γ

n

(1I

{X

n+1≤bθn}

− 1 + α),

o` u θ b

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable.

1) Calculer le champ moyen de l’algorithme E [(b θ

n+1

− θ b

n

)|b θ

n

].

2) Montrer que l’algorithme est un algorithme de gradient stochastique pour une fonction strictement convexe de minimum θ

α

.

3) On se place dans le cas o` u F est la loi normale standard. Etudier empiriquement la convergence et la loi de fluctuation de la suite (b θ

n

) dans le cas des trois quartiles.

4) Reprendre la question pr´ ec´ edente en rempla¸ cant la loi normale par une loi exponentielle puis par la loi de Cauchy.

1

(2)

3 Bandit ` a deux bras

Une machine ` a sous a deux leviers. La probabilit´ e de gagner avec le levier A (respectivement B ) est inconnue et vaut p

A

(resp. p

B

). Un joueur va chercher ` a optimiser son gain moyen, par un choix judicieux des leviers.

Voil` a sa premi` ere strat´ egie : ` a l’instant n + 1, il choisit le levier A si le taux de r´ eussite du levier A (calcul´ e sur les fois pr´ ec´ edentes o` u le joueur a choisi le levier A) est sup´ erieur ou ´ egal au taux de r´ eussite du levier B (calcul´ e sur les fois pr´ ec´ edentes o` u le joueur a choisi le levier B). Dans le cas contraire, il choisit le levier B.

1) Simuler cette strat´ egie.

2) On suppose que p

A

> p

B

. Expliquer pourquoi la situation suivante repr´ esente un pi` ege susceptible d’arriver avec une probabilit´ e non nulle : le joueur perd d’abord avec le levier A puis gagne avec le levier B.

Voil` a sa seconde strat´ egie : ` a l’instant n + 1, il choisit la machine A (resp. B) avec probabilit´ e θ

n

(resp.

1 − θ

n

) et

θ

n+1

=

θ

n

s’il a perdu θ

n

+ γ

n

(1 − θ

n

) s’il a gagn´ e avec A

θ

n

− γ

n

θ

n

s’il a gagn´ e avec B.

θ

0

est arbitraire et (γ

n

) est une suite d´ ecroissante positive non sommable et de carr´ e sommable. Il est possible de montrer que θ

n

converge vers 1 (resp. 0) si A (resp. B) est la meilleure machine.

3) Calculer le champ moyen E [(θ

n+1

− θ

n

)|θ

n

].

4) Montrer que si p

A

> p

B

(resp. p

A

< p

B

) alors E [θ

n

] est croissant (resp. d´ ecroissant).

5) Illustrer cette strat´ egie par des simulations. En particulier, mettre en ´ evidence la convergence du taux de r´ eussite global vers max(p

A

, p

B

), et v´ erifier si il y a un th´ eor` eme limite central.

4 Mod` ele autor´ egressif ` a indices al´ eatoires

On consid` ere ici le mod` ele autor´ egressif ` a indices al´ eatoires suivant : X

n+1

= A

εn

X

n

+ B

εn

.

• La suite observ´ ee est X = (X

n

)

n≥0

(on choisit X

0

arbitrairement).

• Le bruit ε = (ε

n

)

n≥0

est une suite de variables al´ eatoires i.i.d. ` a valeurs dans {1, 2}.

1) Simuler ce mod` ele et repr´ esenter graphiquement les trajectoires obtenues. On pourra essayer plusieurs valeurs pour les matrices A

1

, A

2

et les vecteurs B

1

, B

2

. Par exemple, la trajectoire du Dragon de Heigh- ways, donn´ ee par

A

1

=

1/2 −1/2 1/2 1/2

, A

2

=

−1/2 −1/2 1/2 −1/2

, B

1

=

0 0

, B

2

=

1 0

.

2) Etudier empiriquement la loi des grands nombres et le th´ eor` eme de la limite centrale pour les suites (A

εn

) et (B

εn

).

2

Références

Documents relatifs

On a alors ∆g ε = 2ε &gt; 0 sur D, la fonction g ε ne peut alors admettre de maximum local en aucun point de D (en un tel point, les d´ eriv´ ees secondes partielles de g ε

[r]

[r]

4. On choisit cinq animaux au hasard. La taille de ce troupeau permet de consid´erer les ´epreuves comme ind´ependantes et d’assimiler les tirages ` a des tirages avec remise. On note

• Si on suppose le tube initialement vide (rempli d'air), la rotation du tourniquet (initialement immobile) pourrait commencer dès que du liquide entre à l'extrémité ; si

On consid` ere une tige inextensible de longueur `, suspendue par une extr´ emit´ e et portant.. a son autre extr´ emit´ e un point de

En déduire l’expression du champ électrostatique en M dans la base choisie.. On rappelle que dans cette

La fonction de Möbius est une fonction qui possède diverses propriétés et qui est utilisée dans différentes branches des mathématiques.. Nous montrons ici deux de ses propriétés