• Aucun résultat trouvé

Ruine du joueur

N/A
N/A
Protected

Academic year: 2022

Partager "Ruine du joueur"

Copied!
2
0
0

Texte intégral

(1)

DÉVELOPPEMENTS POUR L’AGRÉGATION EXTERNE

Ruine du joueur

Leçons :223,226,249,264

[GS], partie 3.9 Théorème

Soit (Yn)nN une suite de variables aléatoires indépendantes et identiquement distribuées de loi pδ1+ (1−p)δ1; on noteSn= a+

n i=1

Yi, oùa∈N.

Soitb∈N, on noteT=inf{n∈N|Sn ∈ {0,a+b}}etρ=P(ST =a+b).1 On a deux cas (on noteq=1−p) :

– Soitp 6= 1

2, dans ce casρ=

1−qpa 1−qpa+b

etE[T] = (a+b)ρ−a p−q ; – Soitp = 1

2, dans ce casρ= a

a+b etE[T] =ab.

Démonstration :

Étape 1 : On va commencer par obtenir une formule de récurrence.

On notePk=P(.|S0=k)etA={ST=a+b}. On calculePk(A). Par la formule des probabilités totales :

Pk(A) =Pk(A|Y1=1)Pk(Y1=1) +Pk(A|Y1=−1)Pk(Y1=−1) =Pk+1(A)p+Pk−1(A)q.

On notepkpour désignerPk(A), et on obtient la récurrence linéaire : pk= ppk+1+qpk−1, pour 16k6a+b1

p0=1 etpa+b=0 .

Étape 2 : Déterminons la valeur deρ.

– Dans le cas oùp6= 1

2, alors l’équation caractéristique de cette récurrence linéaire est :x= px2+q, dont les solutions sont 1 et q

p.

On en déduit alors :α,βR,k∈[[0,a+b]],pk =α+β q

p k

.

Mais on dispose des valeurs dep0et depa+b; cela nous fournit : 0=α+βet 1=α+β q

p a+b

. Ainsi,α=−βetβ= −1+

q p

a+b!−1

.

Par conséquent,ρ= pa= 1

qpa

1qpa+b .

– Dans le cas où p = 1

2, alors l’équation caractéristique devient : x = 1 2x2+1

2, dont 1 est l’unique solution.

On en déduit alors :α,βR,k∈[[0,a+b]],pk =α+βk.

Mais on dispose des valeurs dep0et depa+b; cela nous fournit : 0=αet 1=α+β(a+b).

1. Un point sur l’interprétation de l’énoncé. Les variablesYndésignent le résultat d’un jeu qui peut se solder par le gain ou la perte d’un euro pour le joueur ; la probabilité de gagner un euro valantp. La valeurSndésigne la fortune du joueur aprèsn répétitions du jeu ; ainsiS0=aest l’argent que possède le joueur avant de commencer à jouer. La banque, quant à elle, possède beuros ; quand le joueur gagne, elle perd, et réciproquement. Ainsi, le jeu doit s’arrêter quand l’un ou l’autre des acteurs (le joueur ou la banque) fait faillite : cela se produit à l’instantT. La probabilité que le joueur gagne finalement contre la banque est doncρ. On veut connaître cette probabilité, ainsi que le temps moyen de jeu, en fonction des valeurs dea,betp.

Florian LEMONNIER 1

Diffusion à titre gratuit uniquement. ENS Rennes – Université Rennes 1

(2)

DÉVELOPPEMENTS POUR L’AGRÉGATION EXTERNE

Ainsi,α=0 etβ= 1 a+b. Par conséquent,ρ= pa= a

a+b.

Étape 3 : On va suivre la même tactique pour calculer l’espérance deT: d’abord obtenir une formule de récurrence, puis en profiter, en distinguant les cas selon la valeur dep.

– La formule des probabilités totales nous donne :

Ek[T] =Ek[T|Y1=1]P(Y1=1) +Ek[T|Y1=−1]P(Y1=−1) = (1+Ek+1[T])p+ (1+Ek−1[T])q.

On noteekpour désignerEk[T], et on obtient la récurrence linéaire : ek=1+pek+1+qek−1, pour 16k6a+b1

e0=0 etea+b =0 .

On note, pourk>1,dk =ekek−1; la relation de récurrence devient : 0=1+pdk+1qdk. – Dans le cas oùp6= 1

2, on poselle réel vérifiant : 0=1+plql, c’est-à-dire quel= 1 qp. La relation de conséquence devient donc : 0= p(dk+1l)−q(dkl).

Par conséquent,dk+1l= q

p(dkl), et doncdkl= q

p k−1

(d1l). Donc, pourn>1, on a :

en=

n k=1

dk+e0=

n k=1

l+ q

p k−1

(d1l)

!

=nl+ (d1l)

n−1

k=0

q p

k

=nl+ (d1l)

1qpn 1qp .

Orea+b =0= (a+b)l+ (d1l)

1qpa+b

1qp , ce qui nous donne : d1l

1qp =− (a+b)l 1qpa+b

.

DoncE[T] =ea =al

1q

p a

(a+b)l 1qpa+b

= 1 qp

a−(a+b) 1

qpa

1qpa+b

= (a+b)ρa pq . – Dans le cas oùp= 1

2, alors1

2dk+1= 1

2dk1, doncdk+1=dk2, d’oùdk=d12(k1). Alors, pourn>1,en =

n k=1

dk =nd12

n−1

k=0

k=nd12n(n1)

2 =n(d1−(n1)). Orea+b =0= (a+b) (d1+ (a+b1)), d’oùd1=a+b1.

DoncE[T] =ea =a(a+b1−(a1)) =ab.

Références

[GS] G. R. GRIMMETT et D. R. STIRZAKER – Probability and Random Processes, 3e éd., Oxford Univer- sity Press, 2001.

Florian LEMONNIER 2

Diffusion à titre gratuit uniquement. ENS Rennes – Université Rennes 1

Références

Documents relatifs

On considère le problème suivant : un joueur compulsif joue à pile où face avec une pièce tru- quée.. S’il obtient pile, la banque lui donne un euro et s’il obtient face il donne

On pourra penser à simuler cette expérience sur tableur et pour cela utiliser la commande :. =SI( Test_logique ; Valeur_si_Vraie ;

Les autres joueurs entourent sur leur carte la classe grammaticale du mot et effectuent une mise allant de 1 à 5 pièces d’or. Ils posent leur carte joueur face

Les autres joueurs entourent sur leur carte la classe grammaticale du déterminant et. effectuent une mise allant de 1 à 5

trois parties qu'il doit jouer contre Hippolyte (H) et Théophile (T) selon l'une des deux séquences H- T-H ou T-H-T. Hippolyte est de loin le plus fort des trois joueurs. Que

Exception faite pour quelques résultats simples de base, l’application générale de cette méthode nécessite des calculs pouvant être considérables.. II - EXPOSE

L’ITF est signataire des dispositions et principes de la Convention des Nations Unies portant sur les Droits de l’Enfant, texte qui fut ratifié en 2002 par la quasi totalité des

On constate donc aujourd’hui que les joueurs et les joueuses de haut niveau consacrent à la préparation physique une part importante de leur temps