IV. Étude de la valeur critique

(1)

Exercice : temps d’attente à un guichet

1) X1֒→ G(p) donc

X1(Ω) =N^∗,P (X1 =k) =q^k⁻¹p,E(X1) = 1

p etV (X1) = q p². 2) (∆ = 0) = (X1 =X2) =⁺

∞

k=1

(X1 =k)∩(X2=k) (incompatibles) donc P (∆ = 0) =⁺

∞

k=1

P (X1 =k) P (X2 =k) (indépendance)

=

+∞ k=1

q^2(k⁻¹⁾p² en réindexant

=p²⁺

∞

k=0

q^2h avec q² <1

= p²

1−q² = p² (1−q) (1 +q) En conclusion :

P (∆ = 0) = p 1 +q. 3) Soit n∈N^∗.

a)(X1−X2 =n) =

k

(X2=k)∩(X1 =n+k) avec comme contraintesk∈N^∗ etn+k∈N^∗, soit (X1−X2=n) =⁺

∞

k=1

(X2 =k)∩(X1 =n+k) donc (incompatibilité et indépendance)

P (X1−X2 =n) =⁺

∞

k=1

P (X2=k) P (X1 =n+k).

b)Somme que l’on calcule :

P (X1−X2 =n) =⁺

∞

k=1

q^k⁻¹pq^n+k⁻¹p=p²qⁿ⁺

∞

k=1

q^2(k⁻¹⁾

=p²qⁿ 1

1−q² car q² <1

= p²qⁿ

(1−q) (1 +q) = pqⁿ 1 +q

Or |X1−X2|=n⇐⇒X1−X2=n ou X1−X2=−n (incompatibles car n∈N^∗)

avec X1−X2 =−n⇐⇒X2−X1 =nqui, par symétrie des rôles de X1 etX2, aura donc la même probabilité

FinalementP (|X1−X2|=n) = P (X1−X2 =n) + P (X1−X2 =−n), d’où P (∆ =n) = 2 pqⁿ

1 +q.

4) a)La série nP (∆ =n) est à termes positifs donc l’absolue convergence équivaut à la convergence.

N

n=0nP (∆ =n) = 0 +

N

n=1

2n pqⁿ

1 +q = 2 p 1 +q

N

n=1

nqⁿ

N−→→∞2 p 1 +q

q

(1−q)² = 2 1 1 +q

q (1−q) Donc

∆a une espérance ﬁnie etE(∆) = 2q 1−q².

(2)

b)J’ai :

E (X1−X2)² =E X₁²−2X1X2+X₂²

=E X₁² −2E(X1X2) +E X₂² (indépendance)

=E X₁² −2E(X1)E(X2) +E X₂² et comme X1 et X2 ont même loi, elles ont même espérance, donc

E (X1−X2)² = 2 E X₁² −E(X1)

= 2V (X1)

de plus ∆² =|X1−X2|² = (X1−X2)² donc∆² a une espérance ﬁnie etE ∆² = 2V (X1)

∆ a donc une variance ﬁnie et

V (∆) =E ∆² −E(∆)²

= 2q

p² − 2 q 1−q²

2

= 2q

p² −4 q² p²(1 +q)²

= 2q(1 +q)²−2q

p²(1 +q)² = 2q1 + 2q+q²−2q p²(1 +q)²

= 2q 1 +q² p²(1 +q)² Finalement

V (∆) = 2q 1 +q² (1−q²)² .

5) Je remarque que : A= min (X1, X2) +X3 >max (X1, X2) = X3>max (X1, X2)−min (X1, X2) . SiX1 ≥X2 alorsmax (X1, X2)−min (X1, X2) =X1−X2 =|X1−X2|= ∆

et si X1≤X2 alorsmax (X1, X2)−min (X1, X2) =X2−X1=|X1−X2|= ∆ En conclusion

A= (X3 >∆).

6) a)Je décompose : [X3 >∆] =

∞

k=0

(∆ =k)∩(X3 > k) incompatibles donc P (X3 >∆) =

+∞ k=0

P (∆ =k) P (X3 > k) car ∆fonction deX1 et X2 est indépendante de X3.

b)Avec, pour tout k∈N: P (X3 > k) =q^k (on n’a que des échecs jusqu’àk) ; on a donc

P (A) = P (∆ = 0) P (X3>0) +⁺

∞

k=1

P (∆ =k) P (X3> k)

= p

1 +q ·1 +⁺

∞

k=1

2 pq^k

1 +qq^k = p

1 +q + 2 p 1 +q

+∞ k=1

q² ^k

= p

1 +q 1 + 2q² 1

1−q² car q² <1

= p

1 +q

1−q²+ 2q² 1−q² Finalement

P (A) = 1 +q² (1 +q)².

(3)

Problème : le critère de Kelly I. Quitte ou double

1) J’ai deux conditions à vériﬁer : pour Xn+1 = 0 je dois avoir Cn+1 =Cn−Mn+1 et pour Xn+1 = 1 je dois avoir Cn+1 =Cn+Mn+1. Je souhaite donc(a, b) tel que :

Cn+bMn+1 =Cn−Mn+1

Cn+ (a+b)Mn+1 =Cn+Mn+1 ; il suﬃt de choisir b=−1 eta= 2. En conclusion

Cn+1=Cn+ (2Xn+1−1)Mn+1. 2) Je cherche une relation de récurrence surE(Cn):

E(Cn+1) =E(Cn) + 2E(Xn+1)−1 E(Mn+1) (car Xn+1 etMn+1 indépendants) et

E(Cn+1) =E(Cn) + (2p−1)E(Mn+1) d’où par récurrence :

• pour n= 1 :C0+ (2p−1) ¹

k=1

E(Mk) =C0+ (2p−1)E(M1) =E(C1) d’après le1).

• soit n∈N^∗ tel queE(Cn) =C0+ (2p−1) ⁿ_k=1E(Mk) alors E(Cn+1) = E(Cn) + (2p−1)E(Mn+1)

= C0+ (2p−1) ⁿ

k=1

E(M_k) +E(Mn+1)

= C0+ (2p−1)ⁿ⁺¹

k=1

E(Mk) En conclusion

∀n∈N^∗ E(Cn) =C0+ (2p−1)

n k=1

E(Mk). Comme (2p−1)> 0, plus ⁿ

k=1

E(Mk) est grande, plus E(Cn) est grande. et comme Mk+1 ≤ Ck, on aura E(Cn)≤C0+ (2p−1) ⁿ

k=1

E(Ck−1) ce majorant étant atteint si et seulement siMk+1=Ck pour tout k. Donc

Pour maximiserE(Cn) il faut miser tout son capital à chaque pari.

3) Si l’on mise la totalité de son capital à chaque pari, on est ruiné si Xn= 0.

Donc “ne pas être ruiné” est l’événement

∞

n=1

(Xn= 1)de probabilité lim

N→+∞P ^N

n=1

(Xn= 1) (conti- nuité décroissante). OrP ^N

n=1

(Xn= 1) =p^N car lesXn sont indépendants, on a donc

N→lim+∞P ^N

n=1

(Xn= 1) = 0 par conséquent la probabilité de ne jamais être ruiné est nulle.

Si le joueur mise tout son capital, la ruine est quasi certaine.

Notons T le “temps d’attente” de la ruine, c’est-à-dire le rang de la partie se soldant par la ruine du joueur. T suit la loi géométrique de paramètre1−p, donc

Le nombre moyen de parties conduisant à la ruine estE(T) = 1 1−p.

(4)

II. Stratégie à mises proportionnelles

1) J’ai Cn+1=Cn+ (2Xn+1−1)Mn+1=Cn+ (2Xn+1−1)αCn donc

• si Xn+1 = 1alors(1 +α)^Xⁿ⁺¹(1−α)¹⁻^Xⁿ⁺¹Cn= (1 +α)Cn=Cn+1

• si Xn+1 = 0alors(1 +α)^Xⁿ⁺¹(1−α)¹⁻^Xⁿ⁺¹Cn= (1−α)Cn=Cn+1

Soit :

∀n∈N Cn+1= (1 +α)^Xⁿ⁺¹(1−α)¹⁻^Xⁿ⁺¹Cn. 2) Je pose Sn= ⁿ

k=1

Xk. Sn représente le nombre de succès pendant lesn premières épreuves.

Ces épreuves étant indépendantes et ayant la même probabilitép de succès, Sn֒→ B(n, p) etE(Sn) =np.

3) J’ai par récurrence :

• pour n= 1 : (1 +α)^S¹(1−α)¹⁻^S¹C0= (1 +α)^X¹(1−α)¹⁻^X¹C0.=C1

• Soit n∈N^∗ tel que Cn= (1 +α)^Sⁿ(1−α)ⁿ⁻^SⁿC0, alors

Cn+1 = (1 +α)^Xⁿ⁺¹(1−α)¹⁻^Xⁿ⁺¹Cn

= (1 +α)^Sⁿ⁺^Xn+1(1−α)ⁿ⁻^Sⁿ⁻^Xⁿ⁺¹C0

= (1 +α)^Sⁿ⁺¹(1−α)ⁿ⁻^Sⁿ⁺¹C0

En conclusion

∀n∈N^∗ Cn= (1 +α)^Sⁿ(1−α)ⁿ⁻^SⁿC0. 4) J’ai

Cn

C0 = (1 +α)^Sⁿ(1−α)ⁿ⁻^Sⁿ donc ln Cn

C0 = Snln (1 +α) + (n−Sn) ln (1−α) car >0 1

nln Cn

C0 = Sn

n ln (1 +α) + 1−Sn

n ln (1−α) et donc E 1

nln Cn

C0 = E Sn

n ln (1 +α) + 1−E Sn

n ln (1−α)

= pln (1 +α) + (1−p) ln (1−α) Ainsi

E 1

nln Cn

C0 =pln (1 +α) + (1−p) ln (1−α).

III. Optimisation : le critère de Kelly

1) Étude de f

a)f estC² sur]0,1[(car 1 +x >0 et1−x >0) et f^′(x) = p

1 +x − 1−p

1−x = 2p−1−x 1−x² f^′′(x) = x²−1 + 2x(2p−1−x)

(1−x²)² = −x²+ 2 (2p−1)x−1 (1−x²)² Soit g(x) =−x²+ 2 (2p−1)x−1. g est dérivable sur[0,1]et

g^′(x) =−2x+ 2 (2p−1) =−2 (x−(2p−1)) et comme 1> p >1/2 alors2p−1∈]0,1[.

g(2p−1) =−(2p−1)²+ 2 (2p−1)²−1 = (2p−1)²−1<0 car2p−1∈]0,1[

(5)

x 0 2p−1 1

g^′ + 0 −

g ր − g(2p−1)<0 ց −

f^′′ − −

2p−1−x + 0 −

f^′ + 0 −

f 0 ր ց −∞

Ainsi

f^′ est décroissante (f^′′ <0) etf atteint son maximum enα_K= 2p−1.

b)J’ai lim

x→1f(x) =−∞. Quand la proportion misée (α) tend vers 1, le taux moyen de croissance du capital tend vers −∞(on court à la ruine !).

c)Comme f(0) = 0 et quef est strictement croissante sur[0, αK]alorsf(αK)>0.

Comme f est continue et strictement décroissante sur [αk,1[ elle est bijective de [αk,1[ dans lim1 f, f(αk) = ]−∞, f(αK)].

Et comme 0< f(αK) alors0∈]−∞, f(αK)].

Donc f(x) = 0a une unique solutionαc dans[αk,1[qui n’est pas αK. En conclusion

f s’annule deux fois exactement sur[0,1[: en 0 et en un réel αc vériﬁantαK < αc. d)Asymptote verticale en 1. Tangente au point (0,0)de coeﬃcient directeurf^′(0) = 2p−1>0.

Maximum en 2p−1, annulation en αc. Ci-dessous le graphe pour p= 0,72:

2) Pour p= 1/2, on aαK = 0 donc quand on a autant de chances de gagner que de perdre, pour gagner en moyenne, il vaut mieux ne rien miser.

Pourp= 1, on aαK= 1donc, quand on est sûr de gagner, on peut tout miser à chaque fois.

IV. Étude de la valeur critique

^α^c

1) a)ϕ estC^∞ sur]0,1[ en vertu des théorèmes opératoires classiques.

De plus ϕ(x) ∼

x→0

x

−x =−1,ln (1 +x) −→

x→1⁻ ln 2etln (1−x) −→

x→1⁻−∞ donc ϕest prolongeable en 0 par ϕ(0) =−1 et en 1 parϕ(1) = 0.

(6)

b)J’ai, pour tout x de]0,1[ :

ϕ^′(x) = 1

1 +xln (1−x) + 1

1−xln (1 +x) [ln (1−x)]²

= (1−x) ln (1−x) + (1 +x) ln (1 +x) (1−x²) [ln (1−x)]²

Soit

ϕ^′(x) = h(x)

(1−x²) [ln (1−x)]² avech(x) = (1−x) ln (1−x) + (1 +x) ln (1 +x).

c)hest dérivable sur]0,1[ et

h^′(x) = −ln (1−x)−1 + ln (1 +x) + 1

= ln 1 +x 1−x Pourx∈]0,1[on a 0<1−x <1 +x donc 1 +x

1−x >1 eth^′(x)>0 : hest strictement croissante sur]0,1[.

Or en 0 : (1−x) ln (1−x) + (1 +x) ln (1 +x)−→

x→00, donchest strictement positive sur]0,1[.

En 1 : avec t= 1−x→0⁺ j’ai (1−x) ln (1−x) =tln (t) −→

t→0⁺0 donch(x) −→

x→1⁻2 ln (2).

d)D’après b) et c), ϕ est continue et strictement croissante sur [0,1] et donc bijective de [0,1] dans [ϕ(0), ϕ(1)] = [−1,0].

2) J’ai

h(x) =

x→0⁺(1−x) −x−x²

2 +o x² + (1 +x) x−x²

2 +o x²

x→=0⁺x²+o x² d’où, comme [ln (1−x)]² ∼

x→0⁺ x², ϕ^′(x) −→

x→0⁺ 1. Or ϕ est continue sur [0,1] et dérivable sur ]0,1[, donc, grâce au théorème de la limite de la dérivée,

ϕest dérivable en 0 et ϕ^′(0) = 1.

3) a)Pourp∈]1/2,1[on a f(αc) = 0donc pln (1 +αc) + (1−p) ln (1−αc) = 0 donc ln (1 +αc)

ln (1−αc) = p−1

p = 1−1/p soit ϕ(αc) = 1−1 p Et comme αc∈[0,1]

∀p∈]1/2,1[, αc(p) =ϕ⁻¹(1−1/p).

b)Quand p→1/2⁺ j’ai1−1/p→ −1⁺ et comme ϕ(x)−→

x→0−1 alorsϕ⁻¹(t) −→

t→−10 donc ϕ⁻¹(1−1/p) −→

p→1/20.

En conclusion

αc est prolongeable par continuité en1/2par αc(1/2) = 0.

La fonction prolongée est alors donnée par αc(p) =ϕ⁻¹(1−1/p).

ϕ est dérivable sur[0,1[etϕ^′ >0 doncϕ⁻¹ est dérivable sur[−1,0[et ϕ⁻¹ ^′(x) = 1

ϕ^′(ϕ⁻¹(x))

(7)

donc αc est dérivable en toutp tel quep= 0et1−1/p∈[−1,0[, donc sur [1/2,1[ et α^′_c(p) = ϕ⁻¹ ^′(1−1/p) 1

p² α^′_c(1/2) = 4 ϕ⁻¹ ^′(−1) = 4

ϕ^′(0) = 4 Ce prolongement est dérivable en1/2etα^′_c(1/2) = 4.

c)La dérivée en 1/2est la limite du taux d’accroissement : αc(p)−αc(1/2)

p−1/2 −→

p→1/24donc αc(p)−0 2 (2p−1) −→

p→1/21 αc ∼

p→1/22αK.

V. Simulation informatique

1) On rejoue tant que le capitalcible n’est pas atteint, d’où la première condition ligne 5.

Comme le joueur ne mise qu’une fraction de son capital (on a supposé α ∈ ]0,1[), ce dernier restera toujours positif, il n’est donc pas utile d’ajouter la condition cap > 0.

En revanche, il vaut mieux tenir compte des cas où le capital ne dépasserait pas la valeur cible au bout d’un temps “raisonnable” (même si c’est peu probable), d’où la seconde condition sur le nombre de parties en ligne5.

Le capital suit la relation :

• si Xn+1 = 1alorsCn+1 = (1 +α)Cn

• si Xn+1 = 0alorsCn+1 = (1−α)Cn

Le cas u < p correspond au gain, d’où les mises à jour decap aux lignes8et10.

ncompte le nombre de parties jouées, d’où l’incrémentation ligne 11.

1 from random import random

2 def kelly1(p, alpha, cible) :

3 cap = 100

4 n = 0

5 while cap < cible and n < 10000 :

6 u = random()

7 if u < p :

8 cap += alpha*cap

9 else :

10 cap -= alpha*cap

11 n += 1

12 return n, cap

(8)

2) J’ajoute un second capitalcapKque je fais évoluer en parallèle decapen utilisant la proportion optimale alphaK:

1 from random import random

2 def kelly2(p, alpha, cible) :

3 cap = 100

4 n = 0

5 capK = 100

6 alphaK = 2*p - 1

7 while cap < cible and n < 10000 :

8 u = random()

9 if u < p :

10 cap += alpha*cap

11 capK += alphaK*capK

12 else :

13 cap -= alpha*cap

14 capK -= alphaK*capK

15 n += 1

16 return n, cap, capK

Les résultats sont édiﬁants, voici le résultat d’une simulation : une moyenne de 1 000 appels de kelly2(0.54, 0.04, 1000) (alors queαK= 0.08) renvoie(959.2, 1018.8, 2868.4).