M. E YTAN
Les diverses écoles de statisticiens (d’après une conférence de M. Raiffa)
Mathématiques et sciences humaines, tome 4 (1963), p. 34-40
<http://www.numdam.org/item?id=MSH_1963__4__34_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1963, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LES DIVERSES ECOLES DE STATISTICIENS
(d’aprés
uneconférence
deM. RAIFFA)
M.
EYTAN
Nous allons
indiquer,
sur unexemple schématique,
la démarched’esprit
sui-vie par certaines écoles de Statisticiens.
Soit A un attribut que
peuvent posséder
des individus d’une certaine popu-lation,
et soit p laprobabilité qu’un
individupQssède
effectivement A. Commuents’y prendra-t-on
pour calculerp?
1 )
R.A. FISHER: se pose laquestion
fondamentale "telphénomène peut-il
être dûau seul hasard ? "
_
Considérons par
exemple
laproposition
On tire de la
population
un échantillon de n individus(n
= 20 parexemple);
le nombre d’individus
possèdant
l’attribut A estr(r
= 9 parexemple).
La propor- tion des succès est donc de0,45. Quelle
est laprobabilité
d’un tel évènement sieffectivement p
po ?
Or
Pr(r > 9 1
n =20,
p =0~3) ~ 0,113 (schéma
d’urne avecremplacement);
cette
probabilité
n’est pas trèspetite,
l’événement n’est pas extrêmement rare, il y a lieu deprocéder
à des essaissupplémentaires.
2) NEYMAN-PEARSON:
ils considèrent que tester unehypothèse
est unproblème
dedécision. Il faut donc se
préoccuper
de laprobabilité
d’une erreur au cas oùl’hypothèse
serait vraie et au cas où elle serait fausse. Nous devons donc poserl’hypothèse
nulleHo : p ~ po
contrel’hypothèse
alternative p > po. On aimeraitrejeter H..
Pour cela ondécide
d’unestratégie
pouraccepter
ourejeter Ho (avant
de connaître
r),
dela
manièresuivant, :
on choisira un nombre-limite c tel que : sir
c alorsHo
seraaccepté;
si r > c alors
Ho sera rejeté
et l’alternativeacceptée.
, Ceci est une
"règle (n, c)"
où n est le nombre destirages.
On devra donc :1)
Evaluer lesrègles (na c) .
’
2)
Choisir un coptimal,
n étant donné.3)
Choisir un napproprié.
Supposons
donnée unerègle (n, c) ,
p. ex.(20,8) .
La
"puissance"
est la fonctionPr(H-0 1 (n, c)
etp)
c’est-à-dire :puissance
pour les p ~0,3
et lacaractéristique d’opération,
c’est-à-dire la fonctionPr(Ho 1 (n, c) et p)
pour les p >0, 3.
Le "niveau de
signification"
dl’unerègle (n,c)
est le nombre:Pr(Ho 1 (n, c)
et
0,3).
°
Dans le cas
pratique,
le choix de(n, c)
devradépendre
de toute la courbed’erreur,
et le choix de c durisque
encouru, nous disentNeyman
et Pearson. Orceci est difficile à
appliquer,
ils’agit
d’unjugement personnel.
Eneffet,
fixons n et
faisons
varier c.Lorsque
ccroît,
lerisque
d’erreur surHo
dé-croît,
mais lerisque
d’une erreur surHo
croît. C’est ce dilemmequi
est à l’o-rigine
de certaines conventionsqui
se sontétablies,
à l’encontre des considé- rationsexplicites
deNeyman
etPearson,
etqui stipulent qu’il
faut choisira cde manière que le niveau de
signification
soit0,05
ou0 01 ...
Or une telle "re-cette" est inadmissible : le choix du niveau de
signification
doitdépendre
deHo
et deHo (que
nous voulonsvérifier),
et certainement aussi de n.Soient par
exemple (dans
lafigure ci-après)
deux courbes depuissance, d’aspects
très différents et pourlesquels
on a un même niveau designification, Q, 05 .
Il est manifeste que l’on ne choisira pas
(n~ c)
de la même manière dans lesdeux cas, bien que le niveau de
signification
soit le même pour la courbe I etla courbe II.
Une autre difficulté de la
procédure
est quelorsqu’on
a fixé n, on nepeut
diminuer le
risque
d’erreur àla
fois surHo
etsur Ho.
Si donc nous avons unesituation où la
probabilité Pr(Ho 1 (n,c)
etp)
est voisinè de1/2,
alors quenous avons décidé
d’accepter Ho,
la situation devient intolérable(çf. fig.).
Ondoit alors
augmenter
la taille de l’échantillon n. Cecis’ajoute
à la listé desproblèmes
du statisticien. >Par
ailleurs,
comment choisir n ?Neyman
et Pearsonproposent
alors la so- lution suivante: soitp
unpoint
voisin de po =0,3 (pl po)’
et a l’erreur to-lérable en
p. :
de même soit p2 un autre
point
voisin de po(p P2 ) et p
l’erreur tolérable engle (n, c) qui justement garantisse
une erreur inférieure à a enpl
et inférieureà p
en p2. Si n esttrop grand,
recommencer tout en modifiant a et~.
On voitqu’il s’agit
encore d’uncompromis.
Remarquons qu’ici
ils’agit d’un problème
à un seulparamètre:
unproblème
à deux
paramètres exigerait
une discussion bienplus complexe, puisque
les fonc-tions
d’erreur,
depuissance
.... seraientreprésentées
par des surfaces. Indi- quons toutefois que laprocédure
recommandée dans ce cas est de vérifier enquel-
ques
points
choisisl’aspect
de lapuissance.
Quant
aux domaines où interviennent une foule devariables,
y laprocédure
dé-crite ci-dessus devient manifestement
inapplicable.
Dans ce casl’hypothèse nulle,
Ho
est parexemple :
Neyman
et Pearson recommandent deremplacer
ceci par l’ "indicateur" :(d’après H ~ 8~
doit êtrenul),
et de considérer la courbe depuissance
de cet in-dicateur.
Les
objections que
l’onpeut
faire à cette Ecolesont,
depoids:
le niveaude
signification, érigé
en méthodestandard,
n’a pas de sens. Les facteurs nesont
jamais
totalementindépendants;
sil’échantillon
est assezgrand
on obtientune bonne vérification de
l’hypothèse
et le niveau0~ 05
est atteint.Répétons
que le sens du "niveau designification" dépend
del’aspect global
de la courbe.3)
A. WALD: introduit lesconcepts
de décision et deperte.
Supposons
que p soitplus grand que 0,3,
etqu’au point
x(si
la vraie va-leur est x, cf.
fig. ci-dessous)
nous convenions deprendre
la décisiona~ .
Ceciest moins grave que de
prendre
ladécision a,
aupoint
y(si
la vraie valeur esty).
..Il est donc naturel de
postuler
l’existence d’une fonction de"perte
con-ditionnelle", l (a. ,p),
croissante avec p; de même pour la fonction deperte
con-ditionnelle de l’autre côté de la valeur
po
=Une
stratégie
est le choix dl uhcouple (n, c) -
La théorie deNeymann
et Pear-son est
valable,
mais il faut considérer non seulement laprobabilité
d’une er-reur, mais aussi la
perte
conditionnelle subie.Il
faut
donc superposer la courbe deperte
conditionnllo et la courbe dler- reur,puis
calculer lapert’ probable
ua faisant leproduit
de laprobabilité
d’ wieerreur par la
perte
due à cette erreur.4
On obtient finalement la courbe de
perte probable
d’unerègle ~n, c ~
donnée.v!r 8
Lorsque
cdécroit,
laperte probable
décroit sip £ Po,
et croit si p >po.
n étant
fixé,
comment faut-il choisir c? Cecidépend
del’aspect global de
la courbe deperte probable.
Le conseil de Wald est: si vous pensez que palors faites décrottre c. On doit obtenir un bon contr8le de l’erreur du côté où l’on pense que se trouve p; si l’on ne sait
rien,
il faut se servir du critèreminimaa4
mais ce critère n’estjustifié
que dans le cas d’uneignorance
absolue.Reste que le minimum
peut
être atteint en unpoint
sensiblementéloigné
depo.
Nous pouvons diminuer la
perte probable
enaugmentant
n, mais ce,ci est col1-teux,
au fond c’est uneperte. Ajoutons
donc le coût del’expérimentation
à laperte probable
d’où laperte globale. Supposons
que cette dernière nedépende
que de n(et
non pas durésultat)
et considérons les trois courbes deperte
schéma-tisées ci-dessous:
1 est
préférable
à 2 par leprincipe
de dominance stricte.Mais comment décider entre 1 et 3?
On
pourrait appliquer
lecritère
minimax,
mais on estconduit à des résultats
qui
con-tredisent la
plus
élémentaire intuition.4)
SAVAGrE: se propose de résoudre la difficulté rencontrée parWald,
enpondé-
rant les p, et cherchent à rendre la somme de la
perte probable
et du coût del’expérimentation,
minimum.La
perte probable
est doncremplacée
par l’utilité(ou plutôt
ladésutilité,
puisqu’il s’agit
depertes).
Mais dupoint
de vuemathématique,
y onpeut
effectuerla
pondération
dès ledépart,
on obtient uneprobabilité subjective.
Puis on lamodifie pour obtenir une
probabilité
aposteriori.
En cequi
concerne le choixde n, il faut considérer la forme
extensive,
calculer les diverses utilités ...etc.. Cette dernière
procédure
est extrêmementsimple.
La réalisation
pratique
de ces considérations estexposée
dans le livre deRaiffa et Schlaiffer: Stat. Decision
Theory.
Indiquons
pour terminer commentgénéraliser
au cas de trois décisions àprendre: a2, a3’
- La théorie de
Neymann -
Pearson se heurte à des difficultésinsunnontables,
y onne sait
plus quelle espèce
d’erreur on comment.- La théorie de Wald n’est pas
modifiée,
laperte
conditionnelle 1 étant fonction,
des
ai
et de p.- La méthode de
Savage
nonplus
ne rencontre pas dedifficultés,
et deplus pré-
sente