R EVUE DE STATISTIQUE APPLIQUÉE
G ÉRARD P ILÉ
Sur l’application de la théorie des ensembles à la solution du problème « la ruine du joueur »
Revue de statistique appliquée, tome 9, n
o1 (1961), p. 63-74
<
http://www.numdam.org/item?id=RSA_1961__9_1_63_0>
© Société française de statistique, 1961, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
63
SUR L’APPLICATION DE LA THÉORIE DES ENSEMBLES A LA SOLUTION DU PROBLÈME "LA RUINE DU JOUEUR"
par
Gérard PILÉ
Ancien élève
de l’École Polytechnique
Dans une "Note sur la
descrtptton
del’évolution
de certatns processus de Markovhomogènes" publiée
dans leN°
14 de la RevueFrançaise
de RechercheOpérationnelle,
1 ’auteurproposatt
uneméthode
nouvelle de calcul des
"probabilités
depassage" attachées à
certatnssystèmes classtques
d’attente. Ilsignalait, tnctdemment,
laposst- bilité d’appltquer
cetteméthode à
larésolution
duproblème
dit"rutne du
joueur".
Ce dernter
problème, posé
dans seshypothèses
lesplus stmples,
est tct
repris
etapprofondt à
la lumtère de cesobservattons;
lesdéveloppements qut
sutventabouttssentbune
soluttoncomplète d’ap- pltcatton facile.
Inversement,
laprésente
noteprécise nombre de potnts
deprtn- ctpe
etfourntt
desdémonstrattons, qut, faute de place,
avaientété
omtses dans le texte tntttal
ctté
ct-dessus.I INTRODUCTION
Rappelons
le processus étudié :’ deuxjoueurs
A et Bengagent
unepartie
constituée par une suite de coupsindépendants,
laprobabilité
degain
de A à
chaque
coup est une constante p, celle de Best
q = 1 - p.A et B
disposent
d’avoirs initiaux h et h’. Lapartie
s’arrête au boutde n coups dès que l’avoir de l’un des
joueurs
tombe à 0(ou
devientnégatif
selon les
conventions).
Si A a la faculté de réaliser son bénéfice en coursde
partie
dèsqu’il
atteint un montantqu’il
se fixe àl’avance,
celaéquivaut
à ramener l’avoir initial de B à ce montant.
Désignons
par A ou B levainqueur
dechaque é preuve :
unepa rtie
estreprésentée
par une suitedichotomique
ordonnée telle que :B B A B A A B B B
les totaux
progressifs
i desB, j
des A étant astreints uniformément auxconditions :
Le
problème
se posegénéralement
dans les termes suivants :Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
64
Quelles
sont au bout de n coups, lesprobabilités
que s’achève lapartie
sur le succès de A ou de B ? La
probabilité complémentaire
étant celle depoursuite
dujeu.
Le
problème
est évidemmentsimplifié
si l’on faitl’hypothèse
que B parexemple,
est infinimentriche,
cequi supprime
la seconde contrainte : laprobabilité
de ruine dujoueur A,
considérée comme une fonction de n et duparamètre
p, devient alors la seule inconnue duproblème.
Si l’évolution de la
partie
estreprésentée
par undiagramme
où sontportés :
en
abscisse,
le nombre x de coupsjoués
en
ordonnée,
l’avoir y deA.
Nous voyons que le
point M, image
de l’état dusystème
étudié effectue dans leplan considéré,
une suite de sauts : Ax = +1Ay =
±1,
à l’intérieur d’une bande horizontale limitée par lespaliers
0 et h +h’,
lejeu
s’arrêtantpar
absorption
à l’un de ces niveaux.La solution du
problème : "la
ruine dujoueur"
telqu’il
vient d’êtreposé
est ancienne remontant àLagrange.
Depuis Lagrange,
nombre de mémoires lui ont été consacrésproposant
des solutions diverses. La méthode devenue la
plus classique,
tellequ’elle
se trouve
exposée
dansl’ouvrage général
de Feller :"An
initiation to Proba-bility theory"
est celle des fonctionsgénératrices.
Exception
faite pourquelques
résultatssimples
debase, l’application générale
de cette méthode nécessite des calculspouvant
être considérables .II - EXPOSE GENERAL DE LA METHODE SUIVIE
Le
problème
est icirepris,
avec le souci dedégager,
pour en tirer par la suite leparti optimum,
lespropriétés mathématiques
essentiellessous-jacentes
du processus,propriétés
desemi-groupes
enparticulier.
La résolution
pratique peut
être ainsi ramenée à desrègles opératoires simples consistant,
comme nous le verrons,- soit à
développer
par itération le tableau dont les éléments dé- nombrent les évolutionséquiprobables
satisfaisant à des condi- tionsdonnées;
- soit à calculer les éléments
particuliers
au moyen de tablesnumériques d’application
tout à faitgénérales.
Le
problème
est en outre abordé dans sa formulation laplus large qui
est la détermination des
probabilités
de passage en n coups d’un état initial h à un état finalcompatible quelconque
k.Nous utiliserons une méthode de
contraction, inspirée
de celle utilisée dans la théorie des évènementsrécurrents,
consistant à transformer la suitedichotomique
initiale en une nouvelle suiteayant
pouréléments,
les sé-quences
complètes
des s succès consécutifs àchaque perte (ou
laprécédant).
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
65
L’ordre
BAs
est icipréféré
à l’ordreAs B,
du faitqu’il
estpréférable
dans la théorie actuelle que la dernière
séquence
soittoujours "complète",
c’est-à-dire contienne un
"B"
et s"A" (s > 0)
alorsqu’il peut
être nécessaired’ajouter
un B fictif pourcompléter
lapremière séquence.
Chaque séquence
de rang x étant caractérisée par un entierpositif
ounul,
s.,, la suite initiale a pourimage
unensemble { sj
x~ 1,
..., i satis-faisant à la condition E
sx - j.
La suite donnée
plus
haut parexemple
a pourimage :
constituée de 3 unités
(succès)
distribuées dans 6 intervalles(pertes).
Nous dirons des
suites {sx} x ~ qu’elles
sontenchaînées
depuis
un état initial h si lejeu correspondant
ne s’arrête pas au cours des iséquences (sinon
à ladernière)
en se limitant dans unepremière analyse
à une seule cause d’arrêt : le franchissement de la barrière 0.
Une suite
quelconque {sx}
neremplit
cette condition que si ellepossède
certaines
caractéristiques qui
vont être mises en évidence :Observons’ à des instants
réguliers,
l’état d’unsystème ponctuel "en- trées-sorties" ci-après(1) :
-
input :
arrivées distribuées dans les i intervalles selon l’en- semble{s.1,
-
output :
une sortie par intervalle sous la réserve d’existence d’unitésengagées
dans lesystème
au début de cet intervalle.Si k est l’état final d’un tel
système,
la condition nécessaire et suffi- santed’enchaînement depuis
h d’unensemble {sx}
de caractèresi, j,
k n’estautre que
l’inégalité
L’application
à un état initial h d’une suiteparticulière {sx} (véritable opérateur
à droite surh)
fait passer cet état à un état final k’ tel queNous utiliserons désormais les notations suivantes :
La famille des
distributions { s.1
de caractèrei, j,
k sera notée(i, j k).
Sonordre,
c’est-à-dire le nombrecorrespondant
de distributionstopologi- quement distinctes,
sera noté[ i , j, k].
On observera la
condition j
i + k.(1) Un tel schéma caractérise
également
lessystèmes
d’attente à un poste dont la théorieest
cependant
plusgénérale.
En effet
l’hypothèse
d’une loigéométrique
des arrivées dans chaque intervalle est propre seulement aux deux cas particuliers suivants :- arrivées
poissonniennes,
loi exponentiellenégative
du temps de service;- arrivées à raison d’une grappe d’effectif
géométrique
par temps de service .Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
66
(Il
nepeut
y avoir de sortie dans lepremier
intervallelorsque
la suite{sx}
estappliquée
à un état initial0).
Toutes les distributions de mêmes
i, j
ont une mêmeprobabilité
deréalisation
q’ pj
et si n est le nombre de coupsjoués
on doit avoir :La
probabilité
de passage de l’état h à l’état(compatible)
k au bout den coups est alors
exprimée
par la formule fondamentale :où : k - h y k ; (ce qui
revient à considérerà partir
de y = k inclus unnombre d’éléments
égal
auplus petit
des entiers k + 1 ouh,
selon que h > k et viceversa).
Le
problème
actuel se trouve donc ramené au calcul des[ i, j, y]
etnous devons chercher tout d’abord à
connaître plus
intimement la structure des(i, j, y).
(La
notation k serapréférée
par la suite ày).
Observons que les
(i, j, k) peuvent
d’une seule manière êtredécomposées
eu deux distributions
contigües :
a)
Une distributionenchaînée
de 0 à k sur xintervalles
compre- nant donc J = k +(x - 1)
entrées.b)
Une distribution d’état final 0de j -J
entrées sur i -x intervalles.L’application
du théorème desprobabilités
totales conduit ainsi à la re-la tion de
composition
où x = J - k + 1.
Nous allons montrer
qu’outre
cette relation du second ordre et defaçon plus simple,
onpeut
associerbiunivoquement
à toute famille(i, j, k)
unefamille de
types (a)
ou(b).
Nous utiliserons pour cela diverses transforma- tionsbiunivoques
sur les distributions{sx},
notamment :1/
L’addition ou la soustraction de constantes telles que intervallesvides,
tout oupartie
du contenu d’un intervalle.2/
Substitutions diverses deséquences
enparticulier
celles dedegré
n(permutations circulaires)
telles que l’inversion :3/ "Symétrie"
consistant à écrire la suite ordonné initiale sous la forme d’une suite deséquences AB",
cequi
revient àenvisager
le déroulement du processus dupoint
de vuesymétrique
dujoueur
B.Faisons subir aux distributions d’une famille donnée
(i
+1, j, k)
les transformationsbiunivoques
schématiséesci-après.
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
67
La différence
[i, j, k] - [i
+1, j - 1,
k -1]
estdonc,
pour iet j donnés, indépendante
dek,
elle est nulle en vertu de la secondeégalité.
D’où,
parrécurrence,
la relationgénérale
Ce résultat
entraîne
diversesconséquences théoriques
etpratiques
essentielles.
1/
On asupposé implicitement j
i + k.Appliquons
le résultatprécédent
à la valeur maximale J = i + k -1 ,
c’est-à-dire au cas d’une distributionenchaînée depuis
0.Dans la relation
(2),
les familles dénombrées au secondmembre,
seramènent donc
simplement
les unes aux autres.L’égalité (4)
ne fait que traduire une biunivocitéprévisible
apriori :
on montre en effet aisément que le passage de la famille du
premier
membreà celle du deuxième
peut être opéré
par une série de trois transformationsbiunivoques.
- une
symétrie
fournit des distributions(J,
i -1)
dont les inver-ses sont caractérisées par un état final 0 ou
1,
l’addition d’un intervalle vide à droite fournit les distributions(J
+1,
i -1, 0).
Chaque
famille(i, j, k) j
J a ainsi sonimage
dans lecomplexe
des(i, j, 0)
ou dans celui des(i, J).
Cette unicité est liée aux
propriétés
de semi groupes propres aux dis- tributions étudiées. Prévisibles par diversesconsidérations,
cespropriétés peuvent
être établies àpartir
des résultatsdéjà
obtenus.Le
complexe
des distributions étudiéespeut
êtredécomposé
en ensem-bles
principaux
dont les éléments sont indicés par la différence g =i - j :
nom-bre d’intervalles sans sortie des distributions
images (i, j, 0) correspondantes .
Dressons le tableau suivant :
Distributions
images
Valeur de gcorrespondante
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
68
On en déduit :Les éléments
"g" peuvent
ainsi êtrecomposés
deux à deux ou avec eux-mêmes suivant une certaine loi fournissant un élément du même
complexe
de telle sorte
qu’à
toutcouple g g2 corresponde
l’élémentg1
+g2.
Cette
opération
est commutative et associative. Il n’existe pas d’élé- ment neutre ni d’inverses. Enrevanche,
l’élément 1 fournit parauto-compo-
sition tous les éléments du
complexe.
Les éléments g
jouissent
donc despropriétés
dessemi-groupes
abéliens(commutativité
del’opération
decomposition)
etpériodiques.
Cette observation est essentielle pour
comprendre
les structures étu-diées,
elle fournit par ailleurs les idées directrices degénéralisations
dontl’exposé
s ortira it de ce cadre.2/
Nous sommes en mesured’expliciter
les dénombrements cherchés . La sommation des[ i, j, k]
étendue à toutes les valeurspossibles
kn’est autre que le nombre de distributions distinctes
de j objets
semblablesdans i cases
ordonnées,
autrement dit le nombre0393ij = CJi+J-1
de combinaisonsavec
répétition
de iobjets j à j
La borne inférieure de l’indice k est 0
si j
i etJ = j - (i - 1)
sij
i.La borne
supérieure
esttoujours j (j
entrées dans le dernier intervalle conduisant à l’état finalj,
cette distribution estunique).
Considérons le ler cas, on
peut
aussi écrire :On en déduit :
Si j
i des calculsanalogues
donnent :(résultat pouvant
aussiêtre
obtenu en utilisant :[ iJ [ = [J
+1,
i -1, 0] ).
Nous avons vu que le nombre de distributions
enchaînées depuis
un étatinitial h
jusqu’à
un état final k à la fin de l’intervalle i étaitégal
à la sommeoùk+J=i+k.
Supposons
d’abord k > h(ce qui
revient à supposer J >i).
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
69
Nous avons à sommer h éléments à
partir
de :On trouve pour total
qui
s’écrit aussiplus simplement : 0393iJ
-0393i-h,
J+hSi
h 9 k,
on a à sommer k + 1 éléments seulement.On trouve :
résultat
identique
auprécédent puisque
J + h - k = i.On
peut
donc écrire defaçon générale :
où i et J ont la
signification
habituelle :Appliquons
cette formule enparticulier
au cas k = 0(ruine
dujoueur)
on retrouve
simplement
un résultat d’ailleursclassique :
En effet i - J = h et :
III - CONSTRUCTION DES TABLEAUX
Celle-ci est basée sur la relation de récurrence
générale
valable aussi bien dans le cas enchaîné
(J
au lieu dej).
Les conditions limites sont les suivantes :
1 / (Cas enchaîné depuis
un état initial0) : [ i,
i -2]
=0(rupture
de[i, J]
=1chaîne) 2 / (Cas
nonenchaîné depuis
l’étatinitial 0)[i,
i -1]
= 0(formation
[i, 0]
= 1 dechaîne)
On obtient deux tableaux
"triangulaires"
d’éléments aiJet aiJ, qui,
parsuperposition,
donnent un troisième tableausymétrique
parrapport
à la dia-gonale principale.
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
70
Les aij sont lus sur la
diagonale principale
et sur lesdiagonales supé-
rieures ou
"surdiagonales".
Les
ai
sont lus sur ladiagonale principale
et sur lesdiagonales
in-férieures,
ou"sousdiagonales".
Tableau des
a,j
etaij(1)
(1)
Donné pour les valeursi 20 j
9(avec
5 chiffresexacts,
le nombre de chiffres omis étant noté enexposant;
un tableau
plus développé
est donné dans la note citée enréférence).
Nous avons vu que les éléments de ce tableau étaient
susceptibles
d’unedéfinition
explicite simple
On déduit immédiatement de la relation de récurrence liant les
a
lapropriété
suivante :La somme
des j premiers
éléments d’uneligne
i est lejème
élément(indicé j -
1 sur letableau)
de laligne
i + 1.Une relation
équivalente
existe entre les colonnes des demi tableaux constituée par :- la
diagonale principale
et lessurdiagonales;
- les
sous-diagonales
2 et suivantes.Notons
dk j
= ak+j. j(un
élément est défini par le rang k de sasous-diagonale
etcelui j
de sacolonne).
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
71
On a la relation
générale
decomposition
(le signe
*désigne l’opération
decomposition
des deuxensembles). Exemple :
Nous avons vu
précédemment
les raisons de cettepropriété
dont une démonstrationpurement
formelle est donné par ailleurs dans la note citéeen
référence.
L’utilisation de ce tableau pour le calcul
de Pn (h, k)
estsimple,
ellerésulte d’ailleurs directement des considérations
déjà développées.
L’état initial h est transformé en k au bout de i intervalles par les distributions :
(i, J, k)
où h + J = i + k
(i, J,
k -1)
(i, .J, 0)
si k h ou(i, J,
k - h +1)
sik
h Il y a donc lieu de sommer l’élément ai+k, J-k et les h - 1 ou k suivantsa
diagonale A (perpendiculaire
à ladiagonale principale).
Il est à noter que le dernier élément a pour indices
d’où la
règle pratique suivante, plus simple
àappliquer :
Ajouter
à celui des élémentsai
ouaJ+1,i-1
situés en-dessous de ladiagonale principale
les éléments suivants àgauche
sursa
sous-diagonale 0394, jusqu’à
et ycompris
l’élément de la(10) ligne
i + k = J + h.Si l’on a un
grand
nombre d’éléments àcalculer,
il estcependant plus rapide
de calculer leur tableau en utilisant la relationgénérale
derécurrence.
Si
i
h toute distribution des J entrées dans l’intervalle considéré aboutit à l’état finalk,
il y a identité entre le s[ i, J]
etles 0393i,j.
Si i > h le
développement
des termes est restreint par la condition limite :[i, J]
= 0 pour i > J + h(sinon
k seraitnégatif)
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
72
La construction du tableau des
[ i, J]
est ainsi la suivante :Exemple :
h = 5.N.B. - k constant : éléments de la
diagonale
k.Exemple :
k =2; 15, 55, 200, ...
(On
note que les éléments de ladiagonale
0 doiventêtre
trouvés iden-tiques
auxdg).
IV - DEVELOPPEMENT DE LA THEORIE : ETUDE DU CAS GENERAL OU UN NIVEAU INTERMEDIAIRE MAXIMUM EST IMPOSE
Soit à dénombrer les distributions
enchaînées ayant
les caractéristi- ques suivantes :Etats initial h
Etats intermédiaires y M
(M
= h + h’ : somme des avoirs initiaux desjoueurs)
J arrivées dans i intervalles
i - h J i - h + M
y, état final à l’instant
(i - 0)
est donné par : h + J = i -1 + y;
i et J étant
pris
comme variablesindépendantes
pour hdonné,
on s’assureque la relation
générale
de récurrence reste vérifiée avec les conditions li- mites suivantes :Eléments nuls pour :
h + J i
(absorption
au niveau0)
et
h + J i + M -
1(absorption
au niveauM)
Par
ailleurs,
pour J M -h,
toute distributionenchaînée depuis
l’étatinitial h satisfait à la restriction maximale.
La
première
colonne est donc constituée d’éléments que nous avonsappris
à obtenir.Exemple :
h = 2 M = 5Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
73
N.B. - Les éléments de la
diagonale
1correspondent
à l’état final 4 à l’ins- tant i -0,
ceux de ladiagonale
2 à l’état final3,
de ladiagonale
3 à l’état final2,
de ladiagonale
4 à l’état final 1(ou 0).
Formes
explicites
L’analyse précise
des conditions de construction de ce tableaupermet
d’obtenir des définitions
explicites
des élémentsprécédents :
Le second membre
peut
alorsêtre exprimé
en fonction des éléments rgrâce
à la relation(8).
L’élément
ri
j étantpris
pour élémentd’origine
et numéroté(0),
oncompte,
à droite sur sadiagonale
A les élémentsréguliers
de M en M àpartir
des éléments suivants :Exemple :
(On
notera que :2+7=(7 - 1)+k,
d’où : k =3, M-k=2eth+M-k=4).
Pour obtenir une formule
explicite
en fonction desa,j
il y a lieu de serappeler
que :On obtient des résultats
particulièrement simples
en cequi
concerneles éléments
extrêmes,
c’est-à-dire :Revue de Statistique Appliquée. 1961 - Vol. IX - N 1
74
(rappelons
que les nombres de distributions amenant lesystème
à l’état Mpour la
première
fois ou à l’étatplafond
M -1,
non nécessairement pour lapremière fois,
sontégaux).
ler cas : ruine du
joueur
L’élément
a,j
estpris
pour base(élément 0),
oncompte
sur sa
diagonale 0394
àgauche :
Exemple :
2ème cas : succès du
joueur
L’élément
aJ+1, i-1
estpris
pour base(élément 0),
oncompte
sur sadiagonale
6 àgauche :
Exemple :
CONCLUSION
Comme on
peut
s’en assurer, ces divers calculs(construction
des ta-bleaux ou éléments
particuliers)
sontsimples
etrapides.
Pour les valeurs élevées de i etJ,
le recours à desexpressions asymptotiques
estpréférable.
La littérature consacrée au
problème
actuel propose à cetégard
diversesformules valables.
On sait que
l’intérêt
essentiel duproblème "la
ruine dejoueur"
estson caractère connexe avec
l’analyse séquentielle
àlaquelle
il fournit unsupport
debase.
Or la théorie
générale,
tellequ’elle
a étédéveloppée
parWald,
néces-site des
hypothèses plus larges
que celles admises ici : l’état dusystème
n’évolue
plus
nécessairement par sautsd’amplitude ±1,
legain
dujoueur
àchaque
couppouvant être réglé
par une distributionarbitraire.
L’extension au cas
général
des méthodesprécédentes
soulève de trèssérieuses
difficultés.
Il estindispensable
d’introduire d’autresnotions.
Les recherchesentreprises
par l’auteur dans ce sens n’ont encore pu aboutir àune solution
générale satisfaisante.
Divers résultatspartiels
nouveaux d’in-térêt pratique
ont pu toutefoisêtre
obtenus ils ferontl’objet
d’uncompte-
rendu
ultérieur.
Revue de Statistique Appliquée. 1961 - Vol. IX - N 1