R EVUE DE STATISTIQUE APPLIQUÉE
G UY D ’H ERBEMONT
Aspects de la théorie statistique des décisions
Revue de statistique appliquée, tome 11, n
o3 (1963), p. 41-82
<
http://www.numdam.org/item?id=RSA_1963__11_3_41_0>
© Société française de statistique, 1963, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
41
ASPECTS DE LA THÉORIE STATISTIQUE DES DÉCISIONS (1)
Guy D’HERBEMONT
Conseiller
enStatistique
àla Compagnie des Machines
BullSOMMAIRE
l - JEUX ET DECISIONS
STATISTIQUES.
II - STRATEGIES PURES DU STATSTICIEN.
III - STRATEGIES ADMISSIBLES ET STRATEGIES MIXTES.
IV - STRATEGIES DE BAYES.
V - LES REGLES DE SCORE.
VI - DETERMINATION DES STRATEGIES DE BAYES.
VII - STRATEGIES MINIMAX.
VIII - CRITERES DE CHOIX.
IX - CONCLUSION.
BIBLIOGRAPHIE.
ANNEXE : Probabilités a
priori
et aposteriori.
---
(1) Etude élaborée pour le numéro 4
Informations Scientifiques
BULL" et éditéeavec l’accord du Comité de Rédaction.
Revue de Statistique Apptiqxee. 1963 - Vol. XI - N’ 3
La
théorie statistique
desdécisions
aété créée
en 1939 par AbrahamWald, professeur
destatistique mathématique à l’Dniversité
deColumbia.
Les
résultats obtenus par
Waldà
cesujet
sontrestés
assezlongtemps
des secrets militaires. Ils n’ont~uère été publiés qu’après
laf in
de ladeuxième guerre
mondiale.L’ouvrage fondamental
de Wald "Statistical Decision Func- tions" est paru en 1950. A 1 ’heure actuelle laplupart
des sta- tisticiens estiment que lesméthodes utilisées
enthéorie
desdécisions
doivent servir de baseà
tous les travauxfondamentaux
de
statistique mathématique.
Ces
méthodes
sont d’ailleursbasées
sur le m~meprincipe
que celui sur
lequel
1 ontinsisté,
lespremiers, Neyman
et Pear-son,
créateurs
de lathéorie
des testsd’hypothèses qui porte
leur nom. Ceprincipe peut
êtreénoncé
de lafaçon
suivante :toute
méthode statistique
doit êtrerigoureusement évaluée
par lesconséquences
que sonapplication implique face
aux diver-ses circonstances dans
lesquelles
on l’utilise.Le texte
qui
sui t ne donnequ’une image élémentaire
ettrès incomplète
de lathéorie
deWald,
mais ils’efforce,
sansfaire appel à
des êtresmathématiques trop compliqués, d’évoquer
cer-taines des notions
fondamentales qui mériteraient
d’être mieuxconnues et
plus
souventappliquées.
I - JEUX ET DECISIONS
STATISTIQUES - Décisions, états,
et tableau deperte.
Lorsqu’on
a à faire face à unesituation, plus
ou moins bien connue, enprenant
unedécision,
onpeut
souventanalyser
leproblème
ainsiposé
endistinguant
diverses modalités que la situation enquestion
estsusceptible
de revêtir. Nous dirons que ces modalités sont les divers"états" possibles.
La situation réellecorrespond
donc à l’un de cesétats,
mais onignore lequel.
Quant
à la décision àprendre
elle résultegénéralement
d’un choix entreplusieurs
décisionséventuelles,
dont certaines sont mieuxadaptées
que d’autres à tel ou
tel "état".
Poussant
l’analyse plus
loin il arrive que l’onpuisse
chiffrer laperte
ou le
gain qui
résulterait del’application
dechaque
décision face àchaque
état
possible.
Ceci détermine alors ce que l’onappelle
le tableau deperte qui
caractérise leproblème (les gains
sont considérés comme despertes négatives).
43
Premier
exemple
deproblème
de décision.Imaginons
parexemple
un fabricant dont lacapacité
deproduction
est
déterminée,
maisqui puisse
modifier laproportion
de l’un de sesmodèles
(le
modèlerouge)
parrapport
à un autre(le
modèlejaune).
Lechoix de cette
proportion
p constitue la décision àprendre.
La situation face àlaquelle
se trouveplacé
le fabricant est caractérisée par la pro-portion
q des clientsqui préfèrent
le modèle rouge.Chaque proportion
q constitue un"état"
et le tableau deperte
est une certaine fonctionf (p, q) qui peut
être calculée en tenantcompte
des invendus et du coûtqu’impli-
que une modification des programmes de fabrication actuels.
Pour
simplifier l’exposé
nous limiterons à deux le nombre des"états" possibles :
- état R :
2/3
de la clientèlepréfère
leproduit
rouge q =2/3
- état J :
1/3
de la clientèlepréfère
leproduit
rouge q =1/3
Pour la même
raison,
nous limiterons à trois les décisions en-visagées :
- la
première
décision(décision R)
est bienadaptée
à l’étatrouge
- la deuxième décision
(décision J)
est bienadaptée
à l’étatjaune
- la troisième décision résulte d’un
compromis
que nous ne décrirons pas.Les six valeurs
correspondantes
de la fonction f(p, q)
serontprises égales
à celles déterminées par le tableau suivant :Analogie
avec la théorie desjeux
à deux personnes.Ce tableau de
perte
du fabricant en fonction des états et des déci- sionspourrait
être considéré commedéfinissant,
sousforme normale,
un
jeu
à deuxjoueurs,
le 1erjoueur
étant la clientèle et le second le fabricant.C’est en effet un résultat
important
de la théoriedes jeux,
que toutjeu
depaiement
à somme nulle(perte
d’unjoueur - gain
del’autre) peut
être
mis,
au moinsthéoriquement
sous la forme d’un tableau deperte
semblable auprécédent.
Ainsi,
parexemple,
dans lejeu
deBridge, imaginons
quel’équipe
Nord-Sud
(joueur 1)
décrive à desremplaçants
sans initiative le compor- Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3tement exact
qu’ils
doivent avoir face à toutes les circonstancesqui peuvent
seprésenter.
Dans ces conditions lesremplaçants
connaissant les annoncesdéjà
faites et leurs cartes, savent exactement cequ’ils
doivent annoncer eux-mêmes ou ce
qu’ils
doiventjouer
dans toutes lesphases
du déroulement dujeu.
Définition des
stratégies
pures d’unjoueur.
Une telle définition de la manière de
jouer
dans tous les caspossi-
bles sans incertitude ni doute
porte
le nom destratégie
pure.(Nous
verrons
plus
loin que cesstratégies pures
servent à définir encore d’autresstratégies, comportant
cette fois unepart
d’incertitude : Lesstratégies mixtes).
-
Ce sont toutes les
stratégies
pures dujoueur
1qui
constitueraient les intitulés deslignes
du tableau deperte -
Demême,
lesstratégies
pures du
joueur
2(équipe Est-Ouest)
intituleraient les colonnes.Forme normale.
Ceci
posé,
si lejoueur
1 choisit unestratégie
SIparmi
leslignes
du tableau et le
joueur
2 unestratégie
S2parmi
lescolonnes,
le dérou- lement dujeu
est entièrement déterminé dès que les cartes sont distri- buées.’
A
chaque donne,
lecouple
SI s2 fait donccorrespondre
uneperte particulière.
Considérons alors les diverses donnes
possibles ; celles-ci, compte
tenu de leurs
probabilités respectives,
font fluctuer lespertes
d’une cer-taine
façon
autour d’uneperte
moyenne relative à toutes les donnes. C’est cetteperte moyenne( 1)
que l’onpourrait théoriquement
mentionner dans la case SI’ s2 du tableau deperte.
En ce
qui
concerne lespertes
moyennes, lejeu
deBridge
est alorséquivalent
au suivant(forme normale) :
Chaque joueur choisit, indépendamment,
lepremier
uneligne
et lesecond une colonne ; la case
correspondante
définit laperte
dujoueur
2donc le
gain du joueur
1.Exemple
de mise sous forme normale d’unjeu.
Pour montrer sur un
exemple simple
comment se définissent lesstratégies
et s’établit le tableau deperte,
considérons lejeu
de"bluff"
basé sur la
règle
dejeu
suivante :"Dans
unjeu
de 32 cartes bien mé-langées,
lejoueur
1 tire une carte. C’est une basse carte(7 - 8 - 9 - 10)
ou une haute carte avec
probabilité 1/2
pourchaque
cas.---
(1) Il
s’agit
ici d’une moyenne au sensstatistique
du terme. C’est-à-dire qu’àchaque
pertepossible
on attribue saprobabilité
et que la perte moyenne estégale
à la somme desproduits
des pertespossibles
par laprobabilité
cor-respondante.
Cettegrandeur
est aussiappelée "espérance mathématique"
par opposition à la moyennearithmétique
usuellequi
porte le nom de"moyenne empirique".
Cette dernière serait parexemple
la moyennearithmétique
de pertes réelles résultant d’un nombre de parties déterminées. On montre que la moyenneempirique
tend enprobabilité
versl’espérance mathématique
lors-que le nombre de
parties
est assezgrand.
45
Si le
joueur
1 tire une haute carte il doit annoncer 200 - S’il tireune basse carte il doit soit payer 100 au
joueur 2,
soit annoncer 200(bluff).
Le
joueur
2peut,
soit admettre sans contrôle l’annonce dujoueur
1 et lui payer
100,
soit demander à contrôler et il gagne alors 200 si lejoueur
1 abluffé,
mais lui paye 200 dans le cascontraire".
Le
joueur
1 a deuxstratégies
pures(il
annonce nécessairement 200 si la carte esthaute) :
a - si la carte est basse : payer 100 b - si la carte est basse : annoncer 200
Le
joueur
2 a deuxstratégies
pureségalement (si
lejoueur
1 luipaye 100 il n’a rien à
décider) :
A - si le
joueur
1 annonce 200 : payer 100 B - si lejoueur
1 annonce 200 : contrôlerOn a donc 4 combinaisons de
stratégies
pures à étudier.Calcul du tableau de
perte.
Le calcul du tableau de
perte
s’effectue de lafaçon
suivante pour chacune de cesquatre
combinaisons :aA - le
joueur
1 ne bluffe pas et lejoueur
2 ne contrôle pas. Alors:. si la carte est haute
(probabilité 1/2)
lejoueur
1 annonce200 et le
joueur
2 paye 100 laperte
est donc 100 avecprobabilité 1/2
. si la carte est basse
(probabilité 1/2)
lejoueur
1 paye 100 lejoueur
2reçoit
100 laperte
est donc - 100 avecprobabilité 1/2
La
perte
moyenne de la combinaison a A est donc :aB - le
joueur
1 ne bluffe pas et lejoueur
2 contrôle. Alors : -.. si la carte est haute
(probabilité 1/2)
lejoueur
1 annonce 200le
joueur
2contrôle ;
comme iln’y
a pasbluff,
il paye 200 laperte
est donc 200 avecprobabilité 1/2
. si la carte est basse
(probabilité 1/2)
lejoueur
1 paye 100 lejoueur
2reçoit
100 laperte
est donc - 100 avecprobabilité 1/2
La
perte
moyenne de la combinaison a B est donc :bA - le
joueur
1 bluffe et lejoueur
2 ne contrôle pas. Alors :. si la carte est haute
(probabilité 1/2)
lejoueur
1 annonce200 et le
joueur
2 ne contrôle pas et paye donc 100la
perte
est donc 100 avecprobabilité 1/2
. si la carte est basse
(probabilité 1/2)
lejoueur
1 annonce200 et le
joueur
2 ne contrôletoujours
pas il paye donc 100 laperte
est 100 avecprobabilité 1/2
Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
La
perte
moyenne de la combinaison b A est donc :1/2
x(100)
+1/2
x(100) =
100On constate d’ailleurs que dans ce cas la
perte
de 100 est certaine.b B - le
joueur
1 bluffe et lejoueur
2 contrôle. Alors :. si la carte est haute
(probabilité 1/2)
lejoueur
1 annonce200 et le
joueur
2 contrôle etperd
200la
perte
est200
avecprobabilité 1/2
. si la carte est basse
(probabilité 1/2)
lejoueur
1 annonce200 et le
joueur
2 contrôle et gagne 200 -la
perte
est - 200 avecprobabilité 1/2
La
perte
moyenne de la combinaison b B est donc :Résultats du calcul.
M
1 )
o
On voit donc que le tableau de
perte
de cejeu
de bluff est le suivant :Ce tableau est
identique,
en cequi
concerneles deux
premières
colonnes au tableauposé
initialement. On voit que desproblèmes
trèsdifférents
peuvent
conduire au même tableaude
perte.
Il
peut
ne pas exister destratégie
purejudicieuse
contre unjoueur intelligent.
Supposons
que lejoueur
1adopte
lastratégie
a à tous les coups - Lejoueur
2 s’en apercevra etjouera
A à tous les coups - Jouer"a"
à tous les coups n’est donc pas
judicieux
pour lejoueur
1.Supposons
que le
joueur
1 choisisse alors dejouer
b à tous les coups ; bluffant àchaque fois,
lejoueur
2 s’en apercevra etjouera
B à tous les coups.Si
"1"
se borne àjouer
àchaque
coup unestratégie
pure déter- minée ilpeut
seulement s’attendre à gagner 0 à tous les coups. Nousverrons
qu’il
y a mieux à faire pour cejoueur,
en rendant son attitudeimprévisible
pour lejoueur 2, grâce
à unestratégie
mixtequi
lui ferajouer
tantôt a tantôt b sans aucunsystématisme qui puisse
êtreexploité
par
"2". (Les
mêmes remarquess’appliqueraient
aussi aujoueur 2).
Différences
entre jeu
à deux personnes etproblème
de décision face à une nature indifférente.Revenant au
problème initial,
onpeut
dire que la clientèle a le choix entre deuxstratégies
pures et le fabricant entre troisstratégies
pures. Toutefois il
n’apparait guère possible
de considérer que les états R et Jpuissent
être desstratégies
conscientes des clients. Ceux-cipourraient
d’ailleurs ne subir nigain
niperte
du fait des décisions du fabricant.47
Dans les
problèmes
de décisionstatistique
cetype
dejoueur
indif-férent est habituellement
désigné
sous le nom de"la nature",
entitéabstraite
qui joue
lesstratégies
etreçoit
lespaiements.
L’autre
joueur
est"le statisticien".
Il a lapossibilité
de sonder lanature, par
échantillonnage
et deprendre
ses décisionsd’après
les résul-tats obtenus. Cette
possibilité transforme
lejeu
initial en unjeu
avecespionnage
unilatéral au détriment dujoueur
1. Autrement dit lejoueur
2
peut
obtenir par despaiements supplémentaires
desrenseignements
sur la
stratégie
choisie par lejoueur 1, après
que celui-ci aitpris
po- sition.Les
stratégies
avecéchantillonnage.
Les
stratégies
pures dujoueur
2 sont constituées alors par l’ensem- ble des manières(fonctions
dedécision)
dont cejoueur peut
attribueraux résultats
d’échantillonnage
l’une ou l’autre des décisions finalesqu’il
doit
prendre.
Lespertes
totales de ces nouvellesstratégies
pures sont obtenues enajoutant
auxpertes
du tableau cellesqui
résultent du coût del’échantillonnage.
Ces nouvelles
stratégies
sont bien desstratégies pures
car les incertitudesqui
résultent del’échantillonnage
ne sont pas le fait du sta- tisticien et celui-ci estsupposé
se baser sur desrègles
de décision déter- ministes telles que les résultats obtenus lors dessondages
fixent à euxseuls sa conduite.
Exemple
de transformation duproblème
de décisionsimple
en unproblème
de décisionstatistique.
Dans notre
problème l’échantillonnage
consiste à faire une étude demarché,
c’est-à-dire àinterroger
des clients éventuels sur leurspréférences.
Si l’état est R il y a uneprobabilité 2/3
pourqu’un
clientinterrogé préfère
le modèle rouge mais il y a uneprobabilité 1/3
pourque le client
préfère
le modèlejaune. Si,
aucontraire,
l’état est J cesprobabilités
deviennent1/3
en faveur de modèle rouge et2/3
en faveurdu
modèle jaune.
Tout se passe donc comme si l’état de la nature était déterminé par la couleur des boules contenues dans un sac :
- 2 boules rouges et une
jaune
si l’état est R- 2 boules
jaunes
et une rouge si l’état estJ,
car, à condition de tirer des boules à
l’aveugle
une à une en les remet-tant à
chaque
fois et enmélangeant
entrechaque tirage,
lesprobabilités
de :tirer R si l’état est R tirer J si l’état est R tirer R si l’état est J tirer J si l’état est J
sont les mêmes que pour les
réponses correspondantes
du client.Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
La situation
peut
donc être schématisée de lafaçon
suivante.Le statisticien a, à
portée
de lamain,
le sac considéré. Ilignore
son contenu exact mais
peut
serenseigner
s’il le désire enextrayant
des boules dans les conditionsindiquées,
pour les observer avant deprendre
sa décision.Le nombre de
tirages
n’est pas fixé apriori ;
c’est une inconnuedu
problème, qui
contribue à ladescription
desstratégies
pures du statisticien. Mais les études de marché dont cestirages
sontl’image,
ne sont pas
gratuites.
Nous poserons donc que pour tirer une boule dusac il faut payer une certaine somme que nous
prendrons
comme unité monétaire.Le
problème
de décisionstatistique
du fabricant est maintenantcomplètement posé
en termesmathématiques :
- on
dispose
d’un tableau deperte
relatif aux décisions finales.- on connait les
probabilités
relatives aux résultats d’échan-tillonnage
pourchaque
état de la nature(2/3
et1/3
ou1/3
et2/3)
- on connait le coût de
l’échantillonnage (ici
1 unité monétairepar
tirage( 1 ) ).
Autres
exemples
deproblèmes
de décisionstatistique.
Avant de montrer comment se construit la solution d’un tel pro- blème remarquons que, mis sous cette forme
schématique,
il a la mêmestructure que l’un
quelconque
des suivants :-
Accepter (décision R)
ou refuser(décision J)
un lot depièces qui peut
être satisfaisant(état R)
ou non(état J),
connaissant lespré- judices
causés par la recette d’un mauvais lot ou le refus d’un lot sa-tisfaisant et le coût du contrôle des
pièces
- Etudier un
phénomène physique
dont on se demande s’il suitune certaine loi
(état R)
ou une autre loi(état J)
connaissant le coût de conclusionserronées,
celui des essaisplus
ou moins nombreux que l’onpeut entreprendre
pour en décider(décision
R ou décisionJ)
et l’ordre degrandeur
des erreursexpérimentales (incertitudes
detirage).
- Mesurer une
grandeur
inconnue m(au
lieu de deux états R et J on a une infinité d’états : ml, m2, et au lieu de trois décisionspossibles
il y en a aussi une infinité : décider m = ml, m = m2,... )
connaissant le coût d’une décision erronée
(par exemple :
coût propor- tionnel au carré de l’écart entre lagrandeur
vraie et lagrandeur
déci-dée)
et laprécision
del’appareil
de mesure(chaque
mesurepeut,
parexemple
être considérée comme untirage
au sort dans unepopulation
demoyenne inconnue
m).
---
(1)
La théoriestatistique
des décisions étudieégalement
des cas où le coût d’échan-tillonnage
n’est pasproportionnel
au nombre de tirages.49
Rapports
entre théorie des décisions etstatistique classique:
D’une
façon générale,
la théoriestatistique
des décisionscomporte
comme cas
particulier d’application possible, pratiquement
toute la sta-tistique classique :
Théorie des testsd’hypothèse,
Théorie de l’estimation et des intervalles deconfiance,
Théorie desplans d’expérimentation
etc.,à condition d’affecter à
chaque
cas un tableau deperte
convenable.Mais la
statistique classique
conservecependant
toute sa valeur neserait-ce que parce que dans de nombreux
problèmes
l’introduction d’un tableau deperte
estimpossible
ou même n’a aucun sens(peut-on
chiffrerle coût d’une erreur de détermination sur la masse d’une
particule
élé-mentaire de la
physique
moderne ou le coût d’admettre une théorie erronéesur le
champ magnétique terrestre ? ).
Mentionner toutefois que l’on s’est efforcé de tourner cette diffi- culté en définissant une notion
mathématique
d’Utilitéqui,
tout au moinsdans certains cas,
peut remplacer
la notion deperte
monétaire.II - STRATEGIES PURES DU STATISTICIEN - Un
exemple
destratégie
du statisticien.Revenant à notre
exemple, pris
sous la formeschématique
quenous lui avons
donnée,
voici unestratégie
pure quepeut envisager
le statisticien :stratégie
n° 4 : tirer une boule du sacsi celle-ci est rouge décider R si celle-ci est
jaune
décider JCalcul des
pertes
de cettestratégie.
Quelles
sont lespertes qui
résulteraient d’une tellestratégie ?
Pour cela il faut examiner le cas de l’état R
puis
celui de l’état J. Danschaque
cas onajoutera
laperte
due à la décisionfinale,
tellequ’elle
résulte du tableau de
perte,
au coût del’échantillonnage.
Si l’état est R :
. avec une
probabilité 2/3
on tirera une boule rouge et ondécidera R ce
qui correspond
à uneperte :
0puisque
l’état est R. avec une
probabilité 1/3
on tirera une boulejaune
et ondécidera donc J ce
qui correspond
à uneperte :
50puisque
l’état est RLa
perte
moyennequi
résulte de ladécision finale est donc :Le coût de
l’échantillonnage (1
seultirage)
est 1 si bien que laperte
totale est :Si l’état est J :
on verrait de la même manière que la
perte
due à la décision fina- le est :Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
à
laquelle
il fautajouter
le coût del’échantillonnage qui
esttoujours
1pour la
perte
totale.Les deux
pertes
totales ainsi obtenues sont àporter
dans une colonne 4 du tableau deperte.
Un
exemple
destratégie séquentielle.
Une
stratégie
pureplus
élaboréepourrait
être basée sur larègle (ou fonction)
de décision suivante :stratégie
n°5 ;
ne rien décider avant d’avoir tiré au moins deuxboules ;
si elles sont toutes rouges décider R si elles sont toutes deuxjaunes
décider J.Restent les cas où l’on trouverait une boule de
chaque
couleur(R
J ou JR) ;
étant donnéqu’on
se trouve alors dans une situationd’igno-
rance aussi
grande qu’au
début ilpourrait paraitre logique d’opérer
demême. On tirera donc à nouveau deux boules et on se ne décidera que si les deux boules sont de même couleur et ainsi de suite...
Une telle
stratégie
pourlaquelle
le nombre detirages
à effectuer n’est pas fixé apriori porte
le nom destratégie séquentielle.
C’est le
plus
souventparmi
lesstratégies séquentielles
que se, trouvent les meilleuresstratégies possibles.
Calcul des
pertes
de cettestratégies séquentielle.
Nous n’effectuerons le calcul des
pertes
de lastratégie
n° 5 quedans le cas de l’état R
(Le
raisonnement à faire dans le cas de l’état J serait tout à faitanalogue).
Pour cela nous déterminerons d’abord la
perte
due à la décision finalepuis
laperte
due àl’échantillonnage,
obtenant ainsi laperte
totalequi
estégale
à la somme de ces deux nombres.Probabilités de décider R ou J au
premier
coup et au deu- xième coup.Puisque
l’état estR,
laprobabilité
de :tirer R R est
2/3
x2/3 = 4/9
tirer J J est
1/3
x1/3 = 1/9
tirer R J ou J R
2 (2/3
x1/3) = 4/9
(On
vérifie que tous les cas sont bienenvisagés puisque
le totalde ces trois
probabilités
estégal
à1).
Donc,
laprobabilité
de :- décider R du 1er coup est
4/9
- décider J du 1er coup est
1/9
- de faire un second
prélèvement
est4/9
51
Cette fraction
4/9
des cas indécis se subdivise à son tour en 3 éventualités dont lesprobabilités
sont :- décider R au 2è coup - décider
J au 2è coup
- faire un 3è
prélèvement
totalProbabilités de décider R ou J au n ième
coup.
De
proche
enproche,
de la mêmefaçon,
on trouverait lesproba-
bilités de :
- décider R au n ième coup
- décider J au n ième coup
- être indécis au n ième coup total
(probabilité
d’indécision au
(n-1)ième
coupProbabilité de décider R ou J à un moment
quelconque.
La
probabilité
de décider R à un momentquelconque
est donc lasomme de la
progression géométrique :
La
probabilité
de décider J à un momentquelconque
est de même :Quant
à laprobabilité
de ne rien décider c’est la limite de(4/9)"
pour n tendant vers
l’infini,
soit zéro.Pratiquement
on se décidera doncen un
nombre
fini de coups.Ainsi,
laprobabilité
de n’avoir pas encorepris
de décision aul0ième coup par
exemple
n’est que(4/9)10 # 0,0003,
si bienqu’un
telévénement ne se
produit
que 3 fois sur 10. 000 enmoyenne
1 Pertescorrespondantes.
La
perte
due à la décisionfinale,
l’état étantR,
est donc :0,
avec laprobabilité 0, 8
et
50,
avec laprobabilité 0,
2soit,
en moyenne :Pertes dues à
l’échantillonnage.
A ceci il faut
ajouter
le coût del’échantillonnage.
Or si la décision finale(R
ouJ)
estprise
au nième coup le nombre deprélèvements
est2 n avec une
probabilité :
Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
(qui
est la somme desprobabilités
des deux évènements exclusifs : décider R ou décider J ou n ièmecoup).
Le coût de l’échantillon est donc la somme de la série :
Pertes totales.
La
perte
totale est donc : 10 +3,
6 =13,
6 dans le cas ou l’état est R.On verrait de même que si l’état est J la
perte
totale de la stra-tégie
n° 5 est :23, 6.
Introduction des
stratégies
du statisticien dans le tableau deperte.
En notant par
WR (5)
laperte
totale de lastratégie 5,
si l’état est R et parW-J (5)
laperte
totale de cette mêmestratégie
si l’état estJ,
on a :si bien que le tableau de
perte peut
êtrecomplété
de lafaçon
suivanteen ce
qui
concerne lescinq stratégies envisagées (trois stratégies
puressans
tirage
et deuxstratégies
avectirage) :
On ne
peut
énumérer toutes lesstratégies
du statisticien.On
conçoit qu’en opérant
defaçon analogue
onpourrait
pour toutestratégie
s dustatisticien,
déterminer lespertes WR (s)
etW, (s)
corres-pondantes.
Mais on
imagine
facilement quel’entreprise
consistant à énumérer toutes lesstratégies
pures du statisticien avant de choisir entre elles est absolument sansespoir.
On se trouve dans une situationanalogue
àcelle du
joueur
deBridge évoqué plus haut,
saufqu’au
lieu d’être sim-plement
trèsgrand,
le nombre desstratégies possibles
est ici infini...Il est donc nécessaire d’établir d’abord un critère de
comparaison
entre les
stratégies, qui permette
d’écarter d’emblée cellesqui
ne sontpas à considérer comme
acceptables.
53
III - STRATEGIES ADMISSIBLES - STRATEGIES MIXTES -
Stratégies
admissibles.On dit
qu’une stratégie
est admissible s’il n’existe pas destratégie qui
ladomine,
c’est-à-direqu’il
n’existe pasparmi
toutes lesstratégies,
de
stratégie
dont lespertes
soient inférieures pour tous les états de la nature.Ainsi la
stratégie
n° 3 n’est pas admissible car il existe la stra-tégie
2 pourlaquelle
0 60 et 50 60. Enjouant (3)
on serait sûr deperdre plus qu’avec (2).
De même la
stratégie (4)
n’est pasadmissible,
elle est dominée par lastratégie (5).
Mais dans certains
jeux
iln’y
a pas destratégie
admissible.Ainsi,
dans
l’exemple étudié,
iln’y
aurait pas destratégie
admissible avectirage,
si ceux-ci étaientgratuits ;
à toutestratégie
onpourrait
en op- poser une meilleurecomportant
desprélèvements plus
nombreux.Classes
complètes.
On dit
qu’une
classe destratégies
estcomplète si,
à toutestratégie
située hors de la classe on
peut
opposer au moins unestratégie
de laclasse
qui
la domine.Il y a
toujours
au moins une classecomplète :
celle de toutes lesstratégies.
Toute classecomplète
contient nécessairement lesstratégies
admissibles si elles existent.
Nous allons maintenant définir la notion de
stratégie
mixte en utili-sant
l’exemple
dujeu
de bluff cité dans lepremier paragraphe.
Stratégies
mixtes etpertes correspondantes.
Nous avons vu que si le
joueur
1 s’en tient à l’une de ses straté-gies
pures, parexemple
en bluffant en permanence et enespérant
gagner100,
cette attituderisque
assez tôt d’être décelée par lejoueur
2qui
luiopposera B de sorte que le
joueur 1, qui peut cependant
trèslégitimement espérer
ungain,
ne gagnera très viteplus
rien.Mais si le
joueur
1 ne craint pas de faireappel
auxprobabilités
il
peut
alorsimaginer d’adopter
tantôt sastratégie
a, tantôt sastratégie
b et cela tout à fait au hasard de
façon
àdéjouer
toute tentative dujoueur
2 pour deviner ses coups.
Revue de Statistique Appliquée. 1963 - Vol. Xf - N’ 3
Il
peut
lefaire,
parexemple,
en tirant àpile
ou face à l’insu deson
adversaire,
entre ses deuxstratégies
pures(il
blufferait alors"au hasard"
mais"en moyenne"
une fois surdeux).
Supposons
maintenant que lejoueur
2 oppose à cela sastratégie A ;
alorsle joueur
1 gagne :0 avec
probabilité 1/2
100 avec
probabilité 1/2,
soit,
en moyenne :Si,
aucontraire,
lejoueur
2 lui oppose sastratégie B,
on voit de même que letirage
àpile
ou facepermet
aujoueur
1 de gagner en moyenne :Si bien
qu’en
faisant intervenir sciemment le hasard lejoueur
1est sûr de gagner en moyenne au moins
25, quelle
que soit la conduite de B.Le
joueur
1peut
même s’assurerdavantage
si au lieu de tirer àpile
ou face il tire à l’aide d’un dé à 6 faces et ne bluffe pas si le dé montre3, 4,
5 ou 6(probabilité 2/3).
Eneffet,
quele joueur
2adopte
alors sa
stratégie
A ou sastratégie B, le. joueur
gagne en moyenne :De telles
stratégies,
obtenues partirage
au sort entre deux ouplus
de deux
stratégies
pures, avec affectation deprobabilités
à chacuned’elles,
sontdésignées
sous le nom destratégies mixtes(l).
Stratégies
mixtes dansles problèmes
de décision.Dans les
problèmes
de décision iln’y
a souvent aucune raison pour que le statisticien s’interdised’envisager
de tellesstratégies mixtes,
dont on a vu legrand parti
que l’onpouvait
tirer.Considérons par
exemple
lastratégie
n°6, mixte,
obtenue en donnantune
probabilité
de1/5
à lastratégie
2 et de4/5
à lastratégie
5. Lespertes
de cette nouvellestratégie
sont donc :Nous verrons que de telles
stratégies
mixtes du statisticienjouent
un rôle fondamental pour obtenir des classes
complètes
destratégies.
Représentation géométrique remplaçant
le tableau deperte.
L’ensemble des
stratégies
mixtes que l’onpeut engendrer
à l’aidedes
stratégies
pures n’est pas commodémentreprésentable
par un tableau---
(1) On dit aussi
"stratégies
combinées".55
de
perte.
C’estpourquoi chaque
fois que les états de la nature sont ennombre fini il est souhaitable de
représenter
lejeu
par undiagramme géométrique.
S’il y
a N états de la nature, on faitcorrespondre
à chacun d’euxun axe dans un
système
de coordonnéesrectangulaires.
Toutestratégie
du
joueur
2 est alorsreprésentable
par unpoint
dont la coordonnée surl’axe i est la
perte Wi correspondant
à l’état i de la nature.Ici N = 2. Soient donc deux axes
rectangulaires
R et J.La
stratégie
si a pour coordonnées :Sur la
figure
ci-dessus on areprésenté
les 6stratégies envisagées jusqu’à présent.
On remarquera que la
stratégie
mixte s6 estreprésentée
par le centre degravité
des deuxpoints
s2 et s5 affectés des masses respec- tives1/5
et4/5.
Toutes les
stratégies
mixtes obtenues parmélange
de deux stra-tégies
pures sontfigurées
par lesegment
défini par les deuxpoints repré-
sentatifs de ces deux
stratégies
pures.D’une
façon plus générale
l’ensemble desstratégies
mixtes que l’onpeut
obtenir àpartir
d’un ensemble destratégies
pures estreprésentable
par la surface
(frontière comprise)
dupolygone
de sustentationengendré
par les
points figuratifs
desstratégies
pures.Les
stratégies
mixtes que l’onpeut
obtenir à l’aide desstratégies
1 à 6 sont
représentées
sur lafigure ci-après.
Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
On voit immédiatement sur la
figure
que toutestratégie
située hors de lapartie
de frontière s 1 s 5’ S 2,marquée
en traits gras n’est pas admissible etqu’à
chacune d’entreelles,
telle que s, onpeut
en opposerune
qui
la domine etqui
soit située sur laligne
considérée(une
stra-tégie
s’ domine unestratégie
s si lesegment
allant de s’ vers s estdirigé
dans le 1erquadrant
des axes, limitescomprises).
La
ligne
s 1, s 5, S 2, ne constitue pas à elle seule une classe com-plète,
mais il suffiraitd’y ajouter
lesstratégies (encore inconnues)
situées du côté de
l’origine
parrapport
à elle pour en constituer une.Stratégies
mixtes de la nature.Le
joueur
1peut également
utiliser desstratégies
mixtes(il pleut
p
jours
sur q, les lotsprésentés
au contrôle sont mauvais 3 fois sur centetc. ).
Dans notre
exemple
la naturepeut présenter
tantôt l’état R tantôtl’état J avec des
probabilités respectives PR
etPu : PR
+PJ =
1. Peut-être n’est-il pas réaliste de faire une telle
hypothèse
sur l’évolution desgoûts,
des couleurs. Peuimporte,
tant que nous ne choisissons pas arbitrairement une valeur dePR -
En effet onpeut toujours
considérerPR
comme unparamètre permettant
dereprésenter
notamment l’état R(PR =
1 certitude de l’étatR)
ou l’état J(PR =
0 certitude de l’étatJ)
aussi bien que des cas intermédiaires.
On
peut représenter graphiquement
une tellestratégie
mixte de la nature par une droite Dpassant
par 0 et depente :
Cette droite
peut
venir se confondre avec l’un oul’autre
des axes ,représentant
ainsi l’Etat R ou l’Etat J purs.57
Le
jeu
est alors transformé de lafaçon
suivante.Indépendamment
la nature choisit une droite D de
pente
r et le statisticien unpoint
sparmi
l’ensemblefiguratif
de sesstratégies.
La
perte qui
résulte de lacombinaison s,
D :WD (s) peut
êtreobtenue en abaissant la
perpendiculaire
de s surD,
et enprenant
son intersection avec ladiagonale
des axes(point I)
de coordonnées W ; ona alors :
Cette
règle s’applique évidemment,
enparticulier,
si D est con-fondu avec l’un des axes.
En
effet,
si s a pour coordonnéesWR (perte
contre l’étatR)
etW, (perte
contre l’étatJ),
laperte
moyenne contre D s’obtient enpondérant
ces deux
pertes
par leurprobabilité :
Cette
expression
est leproduit
scalaire du vecteuros
par le vec-teur p
de coordonnéesPR , PJ porté
par D. Or :Cette construction met en évidence que toutes les
stratégies
squi
seraient situées sur une même droite
sH,
ont mêmeperte
contre D.Cette
perte
est d’autantplus
faible que lepoint
H est situéplus
bas surla droite D.
Revue de Statistique Appliquée. 1963 - Vol. XI - N’ 3
IV - STRATEGIES DE BAYES - Thomas
Bayes.
Thomas
Bayes
est unécclésiastique britannique
du 18ème siècle dont l’oeuvreposthume : "An Essay
towardsolving
aproblem
in thedoctrine of
chance"
parue en 1763 introduisit pour lapremière
fois lesnotions de
probabilité
apriori
et deprobabilité
aposteriori.
A cette
époque
évidemment il nepouvait guère
êtrequestion
dethéorie des
jeux,
mais nous verronsplus
loinpourquoi
le nom deBayes
est
particulièrement justifié
pourdésigner
toute une classe destratégies jouant
ici un rôle central.L’ensemble convexe des
stratégies.
Supposons
leproblème
résolu et considérons l’ensemble des stra-tégies
dujoueur
2(y compris
lesstratégies mixtes).
Lespoints repré-
sentatifs de ces
stratégies
forment un ensemble convexe, c’est-à-dire unensemble
qui,
s’il contient deuxpoints si
et s 2 contient tous lespoints
du
segment
si, s 2 Toutpoint
de cesegment peut
en effet être obtenu par unestratégie
mixte déduite de si et s2 comme il a été constatéplus
haut.
Nous admettrons ici que cet ensemble convexe contient sa frontière.
Considérons alors la
partie
de cette frontièrequi
est constituée par ceuxde ses
points qui
sont à la fois lesplus
bas et lesplus
àgauche (par-
tie J’R’ en trait
gras).
On constate alorsqu’à
toutestratégie
s situéeen dehors de J’R’ on
peut
opposer unestratégie
de J’R’qui
la domine(par exemple s’).
Par ailleurs il n’existe pas de
stratégie qui
domine unestratégie
de la
ligne
J’R’.La
ligne
en trait grasreprésente
donc une classecomplète
destratégies
admissibles.Les
stratégies
deBayes.
Soit maintenant une droite D
représentative
d’unestratégie
mixtede la nature et