R ENDICONTI
del
S EMINARIO M ATEMATICO
della
U NIVERSITÀ DI P ADOVA
P AOLO M ALESANI
Tecniche per risolvere problemi di Testa e Croce
Rendiconti del Seminario Matematico della Università di Padova, tome 63 (1980), p. 247-267
<http://www.numdam.org/item?id=RSMUP_1980__63__247_0>
© Rendiconti del Seminario Matematico della Università di Padova, 1980, tous droits réservés.
L’accès aux archives de la revue « Rendiconti del Seminario Matematico della Università di Padova » (http://rendiconti.math.unipd.it/) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions).
Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
per problemi
PAOLO MAIFSANI
(*)
Nel
capitolo
14 del volume[1]
F. S. Hillier-G. J. Lieberman con-siderano un
gioco
di Testa e Croce arricchendo dipagamenti
monetariil processo stocastico.
Anche B. de Finetti nel
capitolo
7 del volume[2] prende
in esamemolte
questioni legate
aprocessi
stocastici di lanciripetuti
di moneteperfette.
Nel
presente lavoro, partendo
dalle considerazioni diquesti Autori,
studio due classi di
giochi
cos definiti:si lancia
più
volte una monetaperfetta.
Prima diogni
lanciobisogna
pagare 1 unità monetaria perpartecipare
algioco.
Nonè permesso ritirarsi
prima
che termini unapartita. Quando
unapartita
termina si ricevono a unità monetarie.Le due classi di
giochi
aiquali
farò riferimento nelseguito
sonodefinite dalla
regola
secondo laquale
termina unapartita; più preci-
samente indicherò con
~ m quel gioco
nelquale
unapartita
terminaquando
m è il valoreassoluto della differenza tra il numero di Teste e il numero di
Croci ; quel gioco
nelquale
unapartita
terminaquando
m risultati con-secutivi sono
uguali (tutte
Teste oppure tutteCroci).
~ 3
è ilgioco
di cui trattanoHillier-Lieberman,
iquali
lo propongono per introdurre la simulazione. Inquesto
lavoro ilgioco ~3
sarà studiato (*) Indirizzo dell’A.: Seminario Matematico dell’Università, via Belzoni 7, 35100 Padova.secondo
molteplici metodologie
e tale studio servirà per introdurre le successive considerazioni.Invece De Finetti ha affrontato
questioni
relative aprocessi
sto- castici simili aigiochi t~m, però distinguendo
Testa(chiamata
ancheSuccesso)
da Croce(chiamata Insuccesso).
Affronterò due
tipi
diquestioni:
1)
perquale
valore di a ungioco Pm
o èequo
2) indagare quale
sia laprobabilità
che la durata di ungioco S_
o
Qm
sia n, cioè che unapartita
terminidopo n
lanci della moneta.1. -
Equità di ~ 3 .
Se il
gioco P3
viene reiterato indefinitamente per un numero illi- mitato dipartite,
un modello matematico atto a descriverlo è una.catena finita di Markov con
gli
statiSo, 81, ~2, ~’3.
Il sistema si trova in8k quando,
nel corso di unapartita, k
è il valore assoluto della dif- ferenza fra il numero di Teste equello
di Croci. Si ha una transizioneogni
volta che viene lanciata la moneta.So
è lo statoiniziale, prima
dell’inizio dellaprima partita.
La matrice di transizioneP3 =
eil
digrafo
dellepossibili
transizioni sono:Il
digrafo Sg
è fortemente connesso : ne consegue chegli
stati sono tutticomunicanti e la catena è irriducibile. In
~3
il massimo comun divi-sore delle
lunghezze
dei circuiti è 1:dunque
la catena èaperiodica.
Pertanto la catena è
regolare
eperciò completamente ergodica.
Postoil
vettore-riga
delleprobabilità asintotiche, queste
costituiscono al- lora l’unica distribuzione stazionaria diprobabilità sugli
stati edunque
le y~ possono essere calcolate risolvendo il sistema
con la condizione
(3)
Si trova
Ad
ogni
transizione è associato unguadagno,
che è -1 per tutte le transizioni fuorchè per la~ -~~3
allaquale compete
ilguadagno
a -1. Associamo il
guadagno -1
anche alle transizioniimpossibili (oppure qualunque
altrovalore;
la cosa è irrilevante come si vedrà dalle formule cheseguiranno);
costruiamo cos la matrice dei gua-dagni
associati a tutte le transizioni:Diciamo qk il
guadagno
atteso dallaprossima transizione, posto
cheprima
di essa il sistema si trovi in Allorada cui
e di
qui
immediatamente si calcola ilguadagno medio g
perogni
transizione
concludendo che il
gioco ~3
è equo se e solo se « = 9. Si intuisce che 9è la durata media di una
partita,
visto che ilgioco
risulta equo se alla fine di unapartita
ci siaspetta
di riceverequanto
versato in prece- denzaprima
diogni
lancio della moneta.2. - Una
partita
studio analitico.Per esaminare una
singola partita di P3
convieneatteggiarla
acatena di Markov con
gli
stati81, 82, S, (definiti
come a para-grafo
1)
edS4: questo
ultimo è uno statofittizio,
definito comequello
a cui il sistema
perviene
e in cui rimane indefinitamentedopo
esserepervenuto
inSa,
cioèdopo
la fine dellapartita.
La matrice di transizione e il
digrafo
delle transizionipossi
bili sono:
Ci serviranno le
potenze p;
della matrice di transizione. Notoriamente(I
- è la Z-trasformata diP"
e con calcoli elementari si trovaGli elementi di
(I
-zP3)-1
sono funzioni razionali in z i cui denomi- natori si possono scrivere comeprodotti
dipolinomi
diprimo grado
a coefficienti reali. Pertanto
ogni
elemento dipuò
essere scritto come somma di un
polinomio
in z(a
coefficientirazionali)
e di funzioni
razionali,
ciascuna dellequali
ha un numero realecome numeratore e un
polinomio
diprimo grado (a
coefficientireali)
come denominatore.
Si ottiene cos :
cone le matrici
A, B, C, D,
E definite come segue:Invertendo la trasformazione Z e utilizzando
gli
indició~~
di Kro-necker si ha
.Poichè
So
è lo statoiniziale,
laprobabilità
che n sia la durata della~partita
è-e si conclude allora che P~ = 0 e
Abbiamo cos
provato
che lepossibili
durate di unapartita
delgioco 3’3
.sono 2r + 1
[r
=1, 2, 3, ...]
e che la durata di unapartita
è una va-riabile aleatoria a distribuzione
geometrica
conparametro 1/4.
Notoriamente, allora,
9 è la media di tale variabile aleatoria. Souna
partita
dura 2r + 1lanci,
a -(2r
+1)
è ilguadagno;
anch’esso.è una variabile aleatoria a distribuzione
geometrica
con media a - 9.~~i conferma cos che
(a
-9)/9
è ilguadagno
medio perogni
transizione..3. - Una
partita di S:
studio mediantegrafi.
Poichè ad
ogni
lancio di moneta sonopossibili
duerisultati,
cos-truiamo un
multidigrafo ~3 , analogo
a93
tranne chegli
archi a cuiin
9,
era associata laprobabilità
1 verranno orarappresentati
da una~coppia
di archi. La matrice associata a19*
e lo stesso9*
sono:Indichiamo
con xki
il numero dei cammini di9,,*
che hannolunghezza k, origine
in~’o
e termine in8i
Posto .è evidentemente
cioè in forma scalare
In n lanci della moneta sono
possibili
2n sequenze dirisultati,
a ciascunadelle
quali corrisponde
in9*
un cammino diorigine So
elunghezza
n.Ma anche viceversa:
ogni
siffatto cammino identifica una ben deter- minata sequenza di risultati di n lanci.La
partita
termina in n lanci se e solo sequel
cammino di lun-ghezza n
ha termine inS3.
Risultadunque,
indicando anche conAn
il numero dei cammini di
lunghezza n
conorigine
in,So e
termine inS3,
Applicando ripetutamente
le(15)
e le loro inverse si ottienecioè
La
(18)
insieme con le ovvie condizioni inizialipermette
di calcolare la successione~An~
dacui,
per la(16),
leproba-
bilità delle
possibili
durate dellapartita,
riottenendo i risultati diparagrafo
2.4. -
Equità
dit23.
Analogamente
aquanto
fatto aparagrafo 1,
ci riferiamo alla catena di Markov con la matrice di transizioneQ3
e ildigrafo
delle pos- sibili transizioni:Il
digrafo
non è fortemente connesso, ma i suoi nodiS2, 8s
costituiscono una classe fortemente connessa che è l’unica classe finale:
dunque
la catena di Markov è irriducibile con i tre stati nominati chesono
persistenti mentre So
è transitorio. In3C.,
il massimo comune divi-sore delle
lunghezze
dei circuiti è 1:dunque
la catena èaperiodica.
Essa è allora
regolare
eperciò completamente ergodica.
Proce-dendo come a
paragrafo
1 si trovano leprobabilità
asintotichee, definita esattamente come un
paragrafo
1 la matrice I~ deiguadagni,
ysi trovano anche i
guadagni
attesi dallaprossima
transizione che sonogli
stessi della(6).
Ne consegue, dallaprima uguaglianza
contenutanella
(7)
e dalla(20),
cheDunque ~3
è equo se e solo se « = 7.5. - Una
partita
diB2a:
studio analitico.Procedendo come
a paragrafo 2,
ma per ilgioco Q3,
si hanno la matrice di transizione ildigrafo ~3:
Si calcola
quindi,
senzadifficoltà,
con le matrici
A, B, C, D,
E ora definite:Di
qui,
invertendo la trasformazioneZ,
e,
infine,
laprobabilità
p n che n sia la durata dellapartita:
In
particolare
si ottieneSi intuisce che le
probabilità
pn sonorapporti
con denominatori le successivepotenze
di 2 e i cui numeratori sonogli
elementi di una suc-cessione di Fibonacci:
dove
appunto
Questa
intuizione è facilmenteverificabile,
attese le(24),
y inquanto
sussiste la
ma
può
essere messameglio
in evidenza mediante considerazioni sulla numerosità di certi cammini in unmultigrafo,
come vedremo al suc-cessivo
paragrafo.
6. - Una
partita
diQ3:
studio mediantegrafi.
Analogamente
aquanto esposto
aparagrafo 3,
la matrice associata almultidigrafo ~3
e ilmultidigrafo
stesso sono:Sia
ancora x,
il numero dei cammini che inRÌ
hannolunghezza k;, origine
inSo
e termine inSi;
allora sussistono le(14)
che in forma scalare si scrivonoApplicando ripetutamente
le(28)
e le loro inverse si ottienecioè, posto
ancoraAn
=e,,
La
(30)
con le ovvie condizioni inizialipermette
di calcolare la successione dacui,
essendosi conclude come a
paragrafo precedente.
7. -
Equità
La matrice di transizione
Pm =
ha nulli tuttigli
elementi ad eccezione diquelli qui
sottoindicati,
e ildigrafo gm
hal’aspetto qui
raffigurato:
Il
digrafo
è fortemente connesso: la catena è irriducibile e i suoi statisono tutti
persistenti.
Però il massimo comun divisore dellelunghezze
dei circuiti di gm è 1 se e solo se m è
dispari,
altrimenti è2 ;
nelprimo
caso la catena è
aperiodica
edunque regolare,
nel secondo caso è pe- riodica diperiodo
2.Il sistema
con la condizione
ammette sempre l’unica soluzione
che
dunque è,
per la(33),
l’unica distribuzione stazionaria diproba-
bilità
sugli stati,
ma essa è anche la distribuzione asintotica solo se mè
dispari.
Inquesto
ultimo caso,dopo
aver osservato che la matriceR = ha tutti
gli
elementiuguali
a -1 fuorchè che ha ilvalore
(a/2 ) -1,
e chepertanto
iguadagni
qk attesi dallaprossima
transizione se essa avviene a
partire
dallo statoSk
sono definiti dalleè certamente corretto calcolare il
guadagno
medio perogni
transi-zione con la
e tale risultato è valido anche se invece m è
pari,
come vedremotra breve.
Anche in
questo
caso èpossibile
assegnare unsignificato proba-
bilistico alle in modo da
giustificare
la(37).
Ma èpreferibile sfug- gire
aquestioni
unpo’ delicate,
affidandosi alprocedimento
indicatoda Howard che
abbisogna (ma
non è nemmenoindispensabile)
solodell’irriducibilità della catena di Markov. Si consideri
dunque
ilsistema
nelle
incognite
g, vi . Posto Vrn = 0 è immediato verificare che la so-luzione si ha con
da
cui,
per l’ultima delle(38)
come avevamo asserito.
Dunque
ilgioco
è equo se e solo se a = M2.Inoltre m2 è la durata media di una
partita.
8. - Una
partita
A meno che non sia m = 2 oppure m = 3 non è
possibile (o
almenonon è
facile)
studiare unapartita di Sm
con lametodologia
utilizzata aparagrafo
2. Infatti per una talemetodologia
occorre scomporre in fattori i denominatori di(I
-zPm)-1,
cioè il determinante di I -zP m;
e
quando
m > 3 non è sufficiente sapere che esso si annulla per z = 1.Ci rifaremo
dunque
allametodologia
che utilizza nozioni di teoria deigrafi,
come l’abbiamoesposta
aparagrafo
3 ma con i ritocchi e lecomplicazioni
che si renderanno necessari.La matrice M =
[mj]
associata almultidigrafo 9§t
ha tuttigli
elementi
nulli,
ad eccezione diquelli
oraspecificati:
Risulta
allora,
con le notazioni diparagrafo 3,
e da
queste
conseguono leSupponiamo
ora che m siadispari
Allora dalle
(43)
segue subito cheD’altronde dalle
(43)
si haAllora,
essendoposto
se n è
abbastanza grande
la(45)
tramite le(46)
diventa una relazionelineare fra
con i coefficienti tutti diversi da zero;
poichè
1 è il coefhciente diA"
risulta
dunque
dove i
combinatori ~,.
sono facilmente determinabili e risulta che m è il coefhciente diAn-2’
che i lorosegni
sono alterni e che il coefficiente di è m.La
(47)
è una formula ricorrenteche,
dato m,permette
di calcolareogni An quando
sianogià
state calcolate le A con indice minore. Poichè evidentementeAn
= 0 se n m, mentreAm
=2,
consegue subito chesono nulle tutte le A con indice
pari.
Perquelle
con indicedispari
risulta,
adesempio
da
cui,
sempre comeesempio,
ecco alcuni dei valori delleAn :
Calcolate le
~ n
risultapoi
moltoagevole
la determinazione della pro- babilitàAn/2n
che n sia la durata dellapartita.
Se,
invece della(44)
sussiste lae
dunque
se m èpari,
dalle(43)
segue subito laMa per le
(43)
Allora, posto
se n è abbastanza
grande
si ottienee si
conclude, analogamente
all’altro caso, che leA~
sono nulle se n èdispari,
mentre se n èpari,
adesempio:
da cui seguono alcuni valori delle
e risulta
poi
facile calcolare leprobabilità
pn che n sia la durata diuna
partita.
9. -
Equità
diLa matrice di transizione ha nulli tutti
gli
elementi adeccezione di
e il
diagrafo Hm
hal’aspetto qui raffigurato:
Nel
digrafo
i nodi82,
...,Sm
generano unacomponente
fortementeconnessa mentre un’altra è
generata
dal solo80.
Nellaprima
il mas-simo comun divisore delle
lunghezze
dei circuiti è 1.Dunque
la catenadi Markov è
regolare
e leprobabilità
asintotiche possono venire de-terminate risolvendo il sistema .
con la condizione
Si trova l’unica soluzione
I
guadagni
q, attesi dallaprossima
transizione apartire da 8k
sonoancora dati dalle
(36),
y edunque
ilguadagno
medio perogni
tran-sizione è
Dunque
ilgioco
è equo se e solo se a = 2m -1. Inoltre 2~ -1 è la durata media di unapartita.
10. - Una
partita
diProcedendo come a
paragrafo 8,
la matrice M _[miiJ
associataal
multigrafo JC*.
è tale chementre sono nulli tutti
gli
altri elementi.Risulta allora dalla
(14)
e da
queste
seguono subito lae le
per le
quali
la(58)
diventaavendo
posto
ancora Con riferimento alla successione la(60)
dice cheogni A.
è sommadegli
m - 1Ai
che laprecedono, pertanto
la è una successione di Fibonacci di ordine m -2,
con ivalori iniziali
Risulta allora facile calcolare la
probabilità
p n = che n sia la durata di unapartita.
BIBLIOGRAFIA
[1] F. S. HILLIER - G. J. LIEBERMAN, Introduzione alla Ricerca Operativa,
F.
Angeli,
Milano 1973.[2] B. DE FINETTI, Teoria delle Probabilità, Einaudi, Torino 1970.
[3] R. A. HOWARD, Dynamic Programming and Markov Processes, MIT Press,
1960.
Manoscritto pervenuto in redazione il 30 novembre 1979.