Exercice : temps d’attente à un guichet
1) X1֒→ G(p) donc
X1(Ω) =N∗,P (X1 =k) =qk−1p,E(X1) = 1
p etV (X1) = q p2. 2) (∆ = 0) = (X1 =X2) =+
∞
k=1
(X1 =k)∩(X2=k) (incompatibles) donc P (∆ = 0) =+
∞
k=1
P (X1 =k) P (X2 =k) (indépendance)
=
+∞ k=1
q2(k−1)p2 en réindexant
=p2+
∞
k=0
q2h avec q2 <1
= p2
1−q2 = p2 (1−q) (1 +q) En conclusion :
P (∆ = 0) = p 1 +q. 3) Soit n∈N∗.
a)(X1−X2 =n) =
k
(X2=k)∩(X1 =n+k) avec comme contraintesk∈N∗ etn+k∈N∗, soit (X1−X2=n) =+
∞
k=1
(X2 =k)∩(X1 =n+k) donc (incompatibilité et indépendance)
P (X1−X2 =n) =+
∞
k=1
P (X2=k) P (X1 =n+k).
b)Somme que l’on calcule :
P (X1−X2 =n) =+
∞
k=1
qk−1pqn+k−1p=p2qn+
∞
k=1
q2(k−1)
=p2qn 1
1−q2 car q2 <1
= p2qn
(1−q) (1 +q) = pqn 1 +q
Or |X1−X2|=n⇐⇒X1−X2=n ou X1−X2=−n (incompatibles car n∈N∗)
avec X1−X2 =−n⇐⇒X2−X1 =nqui, par symétrie des rôles de X1 etX2, aura donc la même probabilité
FinalementP (|X1−X2|=n) = P (X1−X2 =n) + P (X1−X2 =−n), d’où P (∆ =n) = 2 pqn
1 +q.
4) a)La série nP (∆ =n) est à termes positifs donc l’absolue convergence équivaut à la convergence.
N
n=0nP (∆ =n) = 0 +
N
n=1
2n pqn
1 +q = 2 p 1 +q
N
n=1
nqn
N−→→∞2 p 1 +q
q
(1−q)2 = 2 1 1 +q
q (1−q) Donc
∆a une espérance finie etE(∆) = 2q 1−q2.
b)J’ai :
E (X1−X2)2 =E X12−2X1X2+X22
=E X12 −2E(X1X2) +E X22 (indépendance)
=E X12 −2E(X1)E(X2) +E X22 et comme X1 et X2 ont même loi, elles ont même espérance, donc
E (X1−X2)2 = 2 E X12 −E(X1)
= 2V (X1)
de plus ∆2 =|X1−X2|2 = (X1−X2)2 donc∆2 a une espérance finie etE ∆2 = 2V (X1)
∆ a donc une variance finie et
V (∆) =E ∆2 −E(∆)2
= 2q
p2 − 2 q 1−q2
2
= 2q
p2 −4 q2 p2(1 +q)2
= 2q(1 +q)2−2q
p2(1 +q)2 = 2q1 + 2q+q2−2q p2(1 +q)2
= 2q 1 +q2 p2(1 +q)2 Finalement
V (∆) = 2q 1 +q2 (1−q2)2 .
5) Je remarque que : A= min (X1, X2) +X3 >max (X1, X2) = X3>max (X1, X2)−min (X1, X2) . SiX1 ≥X2 alorsmax (X1, X2)−min (X1, X2) =X1−X2 =|X1−X2|= ∆
et si X1≤X2 alorsmax (X1, X2)−min (X1, X2) =X2−X1=|X1−X2|= ∆ En conclusion
A= (X3 >∆).
6) a)Je décompose : [X3 >∆] =
∞
k=0
(∆ =k)∩(X3 > k) incompatibles donc P (X3 >∆) =
+∞ k=0
P (∆ =k) P (X3 > k) car ∆fonction deX1 et X2 est indépendante de X3.
b)Avec, pour tout k∈N: P (X3 > k) =qk (on n’a que des échecs jusqu’àk) ; on a donc
P (A) = P (∆ = 0) P (X3>0) ++
∞
k=1
P (∆ =k) P (X3> k)
= p
1 +q ·1 ++
∞
k=1
2 pqk
1 +qqk = p
1 +q + 2 p 1 +q
+∞ k=1
q2 k
= p
1 +q 1 + 2q2 1
1−q2 car q2 <1
= p
1 +q
1−q2+ 2q2 1−q2 Finalement
P (A) = 1 +q2 (1 +q)2.
Problème : le critère de Kelly I. Quitte ou double
1) J’ai deux conditions à vérifier : pour Xn+1 = 0 je dois avoir Cn+1 =Cn−Mn+1 et pour Xn+1 = 1 je dois avoir Cn+1 =Cn+Mn+1. Je souhaite donc(a, b) tel que :
Cn+bMn+1 =Cn−Mn+1
Cn+ (a+b)Mn+1 =Cn+Mn+1 ; il suffit de choisir b=−1 eta= 2. En conclusion
Cn+1=Cn+ (2Xn+1−1)Mn+1. 2) Je cherche une relation de récurrence surE(Cn):
E(Cn+1) =E(Cn) + 2E(Xn+1)−1 E(Mn+1) (car Xn+1 etMn+1 indépendants) et
E(Cn+1) =E(Cn) + (2p−1)E(Mn+1) d’où par récurrence :
• pour n= 1 :C0+ (2p−1) 1
k=1
E(Mk) =C0+ (2p−1)E(M1) =E(C1) d’après le1).
• soit n∈N∗ tel queE(Cn) =C0+ (2p−1) nk=1E(Mk) alors E(Cn+1) = E(Cn) + (2p−1)E(Mn+1)
= C0+ (2p−1) n
k=1
E(Mk) +E(Mn+1)
= C0+ (2p−1)n+1
k=1
E(Mk) En conclusion
∀n∈N∗ E(Cn) =C0+ (2p−1)
n k=1
E(Mk). Comme (2p−1)> 0, plus n
k=1
E(Mk) est grande, plus E(Cn) est grande. et comme Mk+1 ≤ Ck, on aura E(Cn)≤C0+ (2p−1) n
k=1
E(Ck−1) ce majorant étant atteint si et seulement siMk+1=Ck pour tout k. Donc
Pour maximiserE(Cn) il faut miser tout son capital à chaque pari.
3) Si l’on mise la totalité de son capital à chaque pari, on est ruiné si Xn= 0.
Donc “ne pas être ruiné” est l’événement
∞
n=1
(Xn= 1)de probabilité lim
N→+∞P N
n=1
(Xn= 1) (conti- nuité décroissante). OrP N
n=1
(Xn= 1) =pN car lesXn sont indépendants, on a donc
N→lim+∞P N
n=1
(Xn= 1) = 0 par conséquent la probabilité de ne jamais être ruiné est nulle.
Si le joueur mise tout son capital, la ruine est quasi certaine.
Notons T le “temps d’attente” de la ruine, c’est-à-dire le rang de la partie se soldant par la ruine du joueur. T suit la loi géométrique de paramètre1−p, donc
Le nombre moyen de parties conduisant à la ruine estE(T) = 1 1−p.
II. Stratégie à mises proportionnelles
1) J’ai Cn+1=Cn+ (2Xn+1−1)Mn+1=Cn+ (2Xn+1−1)αCn donc
• si Xn+1 = 1alors(1 +α)Xn+1(1−α)1−Xn+1Cn= (1 +α)Cn=Cn+1
• si Xn+1 = 0alors(1 +α)Xn+1(1−α)1−Xn+1Cn= (1−α)Cn=Cn+1
Soit :
∀n∈N Cn+1= (1 +α)Xn+1(1−α)1−Xn+1Cn. 2) Je pose Sn= n
k=1
Xk. Sn représente le nombre de succès pendant lesn premières épreuves.
Ces épreuves étant indépendantes et ayant la même probabilitép de succès, Sn֒→ B(n, p) etE(Sn) =np.
3) J’ai par récurrence :
• pour n= 1 : (1 +α)S1(1−α)1−S1C0= (1 +α)X1(1−α)1−X1C0.=C1
• Soit n∈N∗ tel que Cn= (1 +α)Sn(1−α)n−SnC0, alors
Cn+1 = (1 +α)Xn+1(1−α)1−Xn+1Cn
= (1 +α)Sn+Xn+1(1−α)n−Sn−Xn+1C0
= (1 +α)Sn+1(1−α)n−Sn+1C0
En conclusion
∀n∈N∗ Cn= (1 +α)Sn(1−α)n−SnC0. 4) J’ai
Cn
C0 = (1 +α)Sn(1−α)n−Sn donc ln Cn
C0 = Snln (1 +α) + (n−Sn) ln (1−α) car >0 1
nln Cn
C0 = Sn
n ln (1 +α) + 1−Sn
n ln (1−α) et donc E 1
nln Cn
C0 = E Sn
n ln (1 +α) + 1−E Sn
n ln (1−α)
= pln (1 +α) + (1−p) ln (1−α) Ainsi
E 1
nln Cn
C0 =pln (1 +α) + (1−p) ln (1−α).
III. Optimisation : le critère de Kelly
1) Étude de f
a)f estC2 sur]0,1[(car 1 +x >0 et1−x >0) et f′(x) = p
1 +x − 1−p
1−x = 2p−1−x 1−x2 f′′(x) = x2−1 + 2x(2p−1−x)
(1−x2)2 = −x2+ 2 (2p−1)x−1 (1−x2)2 Soit g(x) =−x2+ 2 (2p−1)x−1. g est dérivable sur[0,1]et
g′(x) =−2x+ 2 (2p−1) =−2 (x−(2p−1)) et comme 1> p >1/2 alors2p−1∈]0,1[.
g(2p−1) =−(2p−1)2+ 2 (2p−1)2−1 = (2p−1)2−1<0 car2p−1∈]0,1[
x 0 2p−1 1
g′ + 0 −
g ր − g(2p−1)<0 ց −
f′′ − −
2p−1−x + 0 −
f′ + 0 −
f 0 ր ց −∞
Ainsi
f′ est décroissante (f′′ <0) etf atteint son maximum enαK= 2p−1.
b)J’ai lim
x→1f(x) =−∞. Quand la proportion misée (α) tend vers 1, le taux moyen de croissance du capital tend vers −∞(on court à la ruine !).
c)Comme f(0) = 0 et quef est strictement croissante sur[0, αK]alorsf(αK)>0.
Comme f est continue et strictement décroissante sur [αk,1[ elle est bijective de [αk,1[ dans lim1 f, f(αk) = ]−∞, f(αK)].
Et comme 0< f(αK) alors0∈]−∞, f(αK)].
Donc f(x) = 0a une unique solutionαc dans[αk,1[qui n’est pas αK. En conclusion
f s’annule deux fois exactement sur[0,1[: en 0 et en un réel αc vérifiantαK < αc. d)Asymptote verticale en 1. Tangente au point (0,0)de coefficient directeurf′(0) = 2p−1>0.
Maximum en 2p−1, annulation en αc. Ci-dessous le graphe pour p= 0,72:
2) Pour p= 1/2, on aαK = 0 donc quand on a autant de chances de gagner que de perdre, pour gagner en moyenne, il vaut mieux ne rien miser.
Pourp= 1, on aαK= 1donc, quand on est sûr de gagner, on peut tout miser à chaque fois.
IV. Étude de la valeur critique
αc1) a)ϕ estC∞ sur]0,1[ en vertu des théorèmes opératoires classiques.
De plus ϕ(x) ∼
x→0
x
−x =−1,ln (1 +x) −→
x→1− ln 2etln (1−x) −→
x→1−−∞ donc ϕest prolongeable en 0 par ϕ(0) =−1 et en 1 parϕ(1) = 0.
b)J’ai, pour tout x de]0,1[ :
ϕ′(x) = 1
1 +xln (1−x) + 1
1−xln (1 +x) [ln (1−x)]2
= (1−x) ln (1−x) + (1 +x) ln (1 +x) (1−x2) [ln (1−x)]2
Soit
ϕ′(x) = h(x)
(1−x2) [ln (1−x)]2 avech(x) = (1−x) ln (1−x) + (1 +x) ln (1 +x).
c)hest dérivable sur]0,1[ et
h′(x) = −ln (1−x)−1 + ln (1 +x) + 1
= ln 1 +x 1−x Pourx∈]0,1[on a 0<1−x <1 +x donc 1 +x
1−x >1 eth′(x)>0 : hest strictement croissante sur]0,1[.
Or en 0 : (1−x) ln (1−x) + (1 +x) ln (1 +x)−→
x→00, donchest strictement positive sur]0,1[.
En 1 : avec t= 1−x→0+ j’ai (1−x) ln (1−x) =tln (t) −→
t→0+0 donch(x) −→
x→1−2 ln (2).
d)D’après b) et c), ϕ est continue et strictement croissante sur [0,1] et donc bijective de [0,1] dans [ϕ(0), ϕ(1)] = [−1,0].
2) J’ai
h(x) =
x→0+(1−x) −x−x2
2 +o x2 + (1 +x) x−x2
2 +o x2
x→=0+x2+o x2 d’où, comme [ln (1−x)]2 ∼
x→0+ x2, ϕ′(x) −→
x→0+ 1. Or ϕ est continue sur [0,1] et dérivable sur ]0,1[, donc, grâce au théorème de la limite de la dérivée,
ϕest dérivable en 0 et ϕ′(0) = 1.
3) a)Pourp∈]1/2,1[on a f(αc) = 0donc pln (1 +αc) + (1−p) ln (1−αc) = 0 donc ln (1 +αc)
ln (1−αc) = p−1
p = 1−1/p soit ϕ(αc) = 1−1 p Et comme αc∈[0,1]
∀p∈]1/2,1[, αc(p) =ϕ−1(1−1/p).
b)Quand p→1/2+ j’ai1−1/p→ −1+ et comme ϕ(x)−→
x→0−1 alorsϕ−1(t) −→
t→−10 donc ϕ−1(1−1/p) −→
p→1/20.
En conclusion
αc est prolongeable par continuité en1/2par αc(1/2) = 0.
La fonction prolongée est alors donnée par αc(p) =ϕ−1(1−1/p).
ϕ est dérivable sur[0,1[etϕ′ >0 doncϕ−1 est dérivable sur[−1,0[et ϕ−1 ′(x) = 1
ϕ′(ϕ−1(x))
donc αc est dérivable en toutp tel quep= 0et1−1/p∈[−1,0[, donc sur [1/2,1[ et α′c(p) = ϕ−1 ′(1−1/p) 1
p2 α′c(1/2) = 4 ϕ−1 ′(−1) = 4
ϕ′(0) = 4 Ce prolongement est dérivable en1/2etα′c(1/2) = 4.
c)La dérivée en 1/2est la limite du taux d’accroissement : αc(p)−αc(1/2)
p−1/2 −→
p→1/24donc αc(p)−0 2 (2p−1) −→
p→1/21 αc ∼
p→1/22αK.
V. Simulation informatique
1) On rejoue tant que le capitalcible n’est pas atteint, d’où la première condition ligne 5.
Comme le joueur ne mise qu’une fraction de son capital (on a supposé α ∈ ]0,1[), ce dernier restera toujours positif, il n’est donc pas utile d’ajouter la condition cap > 0.
En revanche, il vaut mieux tenir compte des cas où le capital ne dépasserait pas la valeur cible au bout d’un temps “raisonnable” (même si c’est peu probable), d’où la seconde condition sur le nombre de parties en ligne5.
Le capital suit la relation :
• si Xn+1 = 1alorsCn+1 = (1 +α)Cn
• si Xn+1 = 0alorsCn+1 = (1−α)Cn
Le cas u < p correspond au gain, d’où les mises à jour decap aux lignes8et10.
ncompte le nombre de parties jouées, d’où l’incrémentation ligne 11.
1 from random import random
2 def kelly1(p, alpha, cible) :
3 cap = 100
4 n = 0
5 while cap < cible and n < 10000 :
6 u = random()
7 if u < p :
8 cap += alpha*cap
9 else :
10 cap -= alpha*cap
11 n += 1
12 return n, cap
2) J’ajoute un second capitalcapKque je fais évoluer en parallèle decapen utilisant la proportion optimale alphaK:
1 from random import random
2 def kelly2(p, alpha, cible) :
3 cap = 100
4 n = 0
5 capK = 100
6 alphaK = 2*p - 1
7 while cap < cible and n < 10000 :
8 u = random()
9 if u < p :
10 cap += alpha*cap
11 capK += alphaK*capK
12 else :
13 cap -= alpha*cap
14 capK -= alphaK*capK
15 n += 1
16 return n, cap, capK
Les résultats sont édifiants, voici le résultat d’une simulation : une moyenne de 1 000 appels de kelly2(0.54, 0.04, 1000) (alors queαK= 0.08) renvoie(959.2, 1018.8, 2868.4).