R EVUE DE STATISTIQUE APPLIQUÉE
A. V ESSEREAU
Sur l’intervalle de confiance d’une proportion logique
« classique » et logique « bayesienne »
Revue de statistique appliquée, tome 26, n
o2 (1978), p. 5-31
<http://www.numdam.org/item?id=RSA_1978__26_2_5_0>
© Société française de statistique, 1978, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
5
SUR L’INTERVALLE DE CONFIANCE D’UNE PROPORTION : LOGIQUE « CLASSIQUE » ET LOGIQUE « BAYESIENNE »
A. VESSEREAU
L’origine
de cet article est une conversation avec MonsieurGuy Rouzet, Ingénieur
à ENERTEC. Monsieur Rouzet avait attiré mon attention sur certainespropriétés,
souventméconnues,
de l’intervalle de confiance d’uneproportion :
ila donc été l’incitateur de mon
étude,
etje
lui enexprime
ici ma reconnaissance.Monsieur
Morlat, qui
a bien voulu lire et approuver monmanuscrit,
m’asignalé
que laquestion
dont il traite avait faitl’objet
d’une étude moinsdétaillée,
et
d’approche apparemment différente,
de W.L. Stevens : "Fiducial limits of theparameter
of a discontinuousdistribution", Biometrika,
vol.37,
1950.Quelque temps après
il m’a étérappelé
que H.C. Hamaker avaitégalement
abordé cettequestion
dans"Average
confidence limits for binomialprobabilities",
Revue del’Institut International de
Statistique,
vol.21, n° 1/2,1953.
Fallait-il donc se borner à constater que "tout est
dit,
et l’on vienttrop
tard..." ? Monsieur Morlat a estimé que non. Je suisparticulièrement
heureux quemon étude l’ait incité à écrire le texte
qui paraît
à la suite : ilcontribuera, je
le sou-haite,
à mettre fin à une faussequerelle qui
divise lesstatisticiens,
tel l’ensemble desfrançais
enpériode
électorale.A.V.
Selon la "définition officielle"
(AFNOR, ISO) :
"Un intervalle de confiance 1
(pour
leparamètre 0
d’une loi dedistribution)
est un intervalle
aléatoire,
calculé àpartir
d’unestatistique
t(fonction
des obser-vations)
et tel que laprobabilité
que cet intervalle contienne 6 soitégale
à un ni-veau de confiance 1 - a choisi à l’avance".
(a
est le"risque"
que l’intervalle necontienne pas
8).
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 2
Le commentaire suivant accompagne cette définition :
"Si l’on effectue un très
grand
nombred’échantillonnages (de
même effectifn)
au sein de la mêmepopulation,
laproportion
des intervalles contenant 0 seraégale
à 1 - a ".La définition et son
interprétation supposent implicitement
que :à la fois le
paramètre
(J et lastatistique
tpeuvent prendre
des valeursquelconques,
dans un intervalle donné
(qui
n’est pasforcément - 00 ,
+00) ;
c’est le cas de l’in-tervalle de confiance de la moyenne m d’une distribution normale
( - 00 m + 00,
- 00 x
+ 00)
ou de sa variance(0 a 2 00,
0s2 00).
Lorsqu’on
veut déterminer l’intervalle de confiance d’uneproportion
p(loi binomiale),
on admet que leparamètre
p peutprendre
des valeursquelconques
dans l’intervalle
(0, 1),
mais lastatistique
k(nombre
de"succès" dans uneépreuve
constituée de n
tirages indépendants)
ne peutprendre
que les valeurs discrètes(0, 1,..., n) :
l’intervalle 1 nepeut prendre
lui-même que des valeurs discrètes1(0), @ 1(l)
...tek)
....I(n).
La conditon(1)
nepeut
être satisfaitequelle
que soit la vraie valeur(inconnue)
p ; le niveau deconfiance, interprété
en terme de fré-quence, n’est pas
égal
à 1 - a : il est fonction de p. Demême ,
le"risque" -
com-plément
à l’unité du niveau de confiance - n’est paségal
à a, mais à :Le texte
ci-après
se propose depréciser
cette relation.On admettra
(quitte
à revenirplus
loin sur cepoint)
que ppeut
effective-ment être
quelconque
dans l’intervalle(0, 1),
limitescomprises,
cequi
nepeut
arriver que si les échantillons sont
prélevés
dans unepopulation
infinie. La variable aléatoire X : nombre de "succès" dans uneépreuve,
est alors la variable binomiale(n , p).
On fera aussi la convention que la ou les bornes
(suivant qu’on envisage
le casunilatéral ou
bilatéral)
de l’intervalle deconfiance, appartiennent
à l’intervalle(on pourrait
tout aussi bienadopter
la conventioncontraire).
Dans la section 1 de cette note, on montrera que,
lorsqu’on
calcule de la fa- çon"classique"
l’intervalle de confiance d’uneproportion,
lerisque a’
est auplus égal
à a(le
niveau de confiance est au moinségal
à 1 -a).
Dans la section 2 on
adoptera,
pour le calcul de l’intervalle deconfiance,
une
position "bayesienne"
et on en étudiera lesconséquences.
La section 3 sera consacrée à des commentaires sur le
point
de vue "classi-que"
et lepoint
de vue"bayesien".
1 - INTERVALLE DE CONFIANCE D’UNE PROPORTION SUIVANT LA METHODE
"CLASSIQUE"
1.1.
Risque
associé à un intervalle unilatéral "à droite"Pour éviter toute
ambiguité d’interprétation, précisons
que "à droite"signi-
fie que l’intervalle est borné à
gauche
par un nombrepi (i
=inférieur) compris
entre 0 et 1
(0 compris, 1
noncompris)
et à droite par 1.Une
épreuve particulière
donne un nombre de "succès" k : k est l’une desn + 1 réalisations
possibles (0, 1, 2, .... , n)
de la variable aléatoire X.On fait
correspondre
à k la valeurparticulière pu
de la variable aléatoirepi pu
est déterminé parl’équation
enpu
1Cette
équation
définitp(k)i
si k > 0. Si k =0,
onadopte
la conventionlogique
p(0)i
= 0 : l’intervalle deconfiance
est l’intervalle(0, 1).
Remarquons
immédiatement que si p =0,
on auratoujours
k =0 ;
l’interval- le de confiance sera l’intervalle certain(0, 1)
et contiendratoujours
p : lerisque a’
ne sera pas
égal
à a mais à 0.D’une
façon générale, l’équation (2 - a)
faitcorrespondre
aux valeurs dis- crètessusceptibles
d’êtreprises
par la variable aléatoire X :les valeurs discrètes suivantes de la borne aléatoire
pi
de l’intervalle de confiance :a)
Petites valeurs de pSi p =
0,
comme on l’adéjà remarqué, a’ =
0.Si 0 p
p(1)i,
seulel’épreuve
donnant X = 0 donnera un intervalle de confiance contenant1 p.
Lerisque a 1 est :
Il augmente avec p. Pour p = p(1)i -
e(e
arbitrairementpetit)
Si p =
p(1)i,
seules lesépreuves
donnant X===OetX== 1 donneront un intervalle de confiance contenant p. Lerisque a’
devient :Il s’abaisse donc
brusquement
à la valeura’
a définie par la relationprécédente.
Lorsque
paugmente
de p =pi 1 )
à p =p(2)i -
e, lerisque augmente
ànouveau
jusqu’à la valeurs,
atteinte pourp =p(2)i - .
b J
Casgénéral
Si p =
p(k)i,
seules lesépreuves ayant
pour résultat l’une des valeurs X =0, 1, 2, .. ,
k conduiront à des intervalles contenant p ; lesépreuves ayant
p our résultat X = k +
1,....,
n, conduiront pourpsi
i aux valeursp(k + 1)i,...
p 1 n)
et les intervallescorrespondants
ne contiendront pas p. Lerisque a’
est laprobabilité
que X =(k
+1)
U(k
+2)
U .... U(n), lorsque
p =pik) :
Le deuxième membre de cette
inégalité
étant - par définition -égal
à o:,a’
a.Lorsque
p varie dans l’intervalle[p(k)i, p(k + 1)i - e]
est fonction croissante de p.
Lorsque
Lorsque
p =p(k + 1)i,
laprobabilité
que l’intervalle de confiance ne contienne pas p est laprobabilité
que X =(k + 2) U (k + 3) U
....U (n)
Le
risque
s’abaissebrusquement
à la valeura’
définie par la relationprécédente.
Et ainsi de suite.
e)
Valeurs dep > p(n)i
Si p =
pin) -
E, lerisque a’
est laprobabilité
que X = n :Pour toute valeur
p > p(n)i,
lerisque
devient :Résultat évident :
lorsque
p atteint oudépasse
laplus grande pu
des valeurs pos- sibles pour lespi,
tous les résultatsd’épreuve
X =0, 1, ....
n donneront des inter-valles de confiance contenant p.
En
définitive,
la variation du"risque 0153.’’’,
en fonction de p, seprésente
sous la forme d’une "courbe en dents de scie" schématisée
ci-après.
En toute ri-gueur, le
risque
n’atteintjamais
la valeur a, il est arbitrairement voisin dea(mais a)
pour les valeurs de p arbitrairement voisines depfk) (mais
inférieures àcelles-ci).
1.2.
Risque
associé à un intervalle unilatéral "agauche"
L’intervalle est borné à droite par un nombre
compris
entre 0 et 1(0
noncompris,
1compris)
et àgauche
par 0.Les valeurs discrètes
susceptibles
d’êtreprises
par la bornesupérieure
ps(s
=supérieur)
de l’intervalle sontdésignées
parp ( 0)
,p ( 1)
...P (k)
....p s (n)
- 1.Elles sont définies par
l’équation
enp(k)s:
Si k = n, on
prend pu
= 1 : l’intervalle de confiance est l’intervalle0, 1).
Si p =1,
on aura
toujours
k = n ; l’intervalle de confiance contiendratoujours
p : lerisque a1est égal
à 0.La "courbe en dents de scie"
représentant
la variation durisque a en
fonc- tion de p se déduit de cellequi correspond
à l’intervalle "à droite" parsymétrie
par
rapport
à la verticale p = 50% ;
son alluregénérale
est la suivante :1.3.
Risque
associé à un intervalle bilatéralLes bornes
[p(k)i , 1 PS (k) ]
de l’intervalle de confiancelorsque
X = k sontdéfinies par les deux
équations :
Si k = 0
p(0)s
est défini par la2è équation
et l’on convientp «» i
= 0Si k = n
pins
est défini par la1 ère équation
et l’on convientpin)
=1Si p = 0 on aura
toujours
k =0 ;
si p = 1 on auratoujours
k = n.Dans les deux cas l’intervalle de confiance
(intervalle [ 0 , p(0)s],
ou interval-le
[p(n)i , 1])
contiendratoujours
p : lerisque a’
sera nul.Pour toute autre valeur de p, la relation entre le
risquer
et p estbeaucoup plus complexe
que dans le cas unilatéral. On va montrer que,quel
que soit p,03B1’
a.Pour p
donné, soient,
conformément au schémaci-après (où
les droiteshorizontales
représentent
des intervalles de confiancebilatéraux) :
pski)
laplus grande
des valeursPs
p(elle correspond
à X =ki)
p(ks)i
laplus petite
des valeurspi
> p(elle correspond
à X =ks)
Le
risque a’
est :Puisque
Puisque
D’où
Lorsque
p varie de 0(où
a’ =0)
à 1(ou
a’ =0),
il franchit des bornesp
oup(k)i,
et, àchaque franchissement, a’
subit une variationbrusque ;
la cour-be ci’
=f(p)
est encore une courbediscontinue,
maisbeaucoup plus compliquée
que dans le cas unilatéral et ce n’est
qu’exceptionnellement
quea sera
"arbitrai- rement voisin" de a(en
restanta).
1.4.
Quelques
remarquesgénérales
a)
On écrit souvent "Si n n’est pastrop petit"
lerisque a’
est voisin de lavaleur a
choisie, (niveau
de confiance 1 -a),
sanspréciser
cequ’il
faut entendre par"pas trop petit". L’exemple
duparagraphe
1.6.1 montre que, pour un inter- valle unilatéral "à droite"(n
=20,
a = 5%) -
et en laissant de côté les valeurs de pégales
aux(ou
voisinesdes)
valeurs limites(0 %,
100%) - a’ peut
s’abaisser à moins de2,5 %.
b) Lorsque
n devient "trèsgrand"
l’ensemble des"points
de discontinui- té"correspondant
aux valeurs despi (k)
et(ou) p(k)s
tend à recouvrir defaçon
quasi-continue
l’intervalle(0 %, 100 %)
des valeurspossibles
pour p. On auraalors
"presque toujours" a’ #
a - sauf auvoisinage
immédiat des valeurs ex- trêmes p =0 %
et(ou)
100%.
C’est le cas où devient valablel’approximation
dela loi binomiale
(discrète)
par une loi continue(loi
normale). Les conditionsgé-
néralement admises pour cette
approximation
sont n >100, k/n > 0,10 (ce qui
nedispense
pas pour autant denégliger
la "correction decontinuité,
+0,5/n
et
(ou) - 0,5/n).
c)
On s’estplacé
dans les§ précédents
dans le cas idéal del’échantillonnage
dans une
"population
infinie" : toutes les valeurs de p sontpossibles.
Une limita-tion évidente des résultats obtenus se
présente
si l’onéchantillonne,
defaçon
nonexhaustive ou
pratiquement
nonexhaustive,
dans unepopulation
finie d’effectifN : les valeurs
possibles
pour p sont elles-mêmes des valeurs discrètes0, 1/N, 2/N,... 1.
Parexemple,
si N =200,
et n =20,
il seraitabsurde,
si l’on trouvek =
10,
d’annoncer que l’intervalle de confiance unilatéral àdroite,
pour a = 5%,
est l’intervalle
[30,2 %,100 %]. (cf.
TableauTC).
d)
Une dernière limitation seprésente
si l’on échantillonne d’unefaçon
que l’on ne
peut
pas considérer comme"pratiquement
non exhaustive" dansune
population
finie(par exemple
N =200,
n =50,
lestirages
étant "sansremise").
La loi de référence ne seraitplus
une loibinomiale,
mais une loihyper - géométrique.
1.5. Intervalle de confiance et test
d’hypothèse
1.5.1.
Correspondance
entre les deuxproblèmes
L’exposé
des§
1.1 à 1.3 met en lumière lacorrespondance
entre les deuxproblèmes.
a)
Apartir
du résultat observé sur un échantillon(d’effectif
ndonné),
détermination d’un intervalle
aléatoire,
au niveau deconfiance
1 - a, pour laproportion
p dans lapopulation.
b)
Unehypothèse
étant formulée sur la valeur de p dans lapopulation,
test de cette
hypothèse
au niveau designification
a, sur la base du résultat aléa- toire que l’on trouvera sur un échantillon(également
d’effectifn).
Si l’on connaît le résultat d’une
épreuve (valeur particulière
k du résultataléatoire),
onpeut
résoudre leproblème (b)
en déterminant l’intervalle de con-fiance de p :
l’hypothèse
serarejetée
si elleporte
sur une valeur de p non conte-nue dans l’intervalle de confiance.
Considérons par
exemple
le cas unilatéral. Pour k donné l’intervalle de con-fiance
à droite est borné àgauche
par la valeurp(k )
définie par :La
région
derejet
d’unehypothèse p p0
est l’ensemble des entiersks, ks
-r 1... n,ks
étant leplus petit
entier tel que :La
comparaison
de ces deux relations montre que :1)
SiPo
=p(k)i
on aks
=k ;
l’intervalle deconfiance (qui
contient saborne p(k)i)
contientpo,
alors quel’hypothèse p po
estrejetée (la région
derejet
contient sa borne k,).
2)
En dehors de ce casexceptionnel -
et irréaliste - aucunehypothèse portant
sur une valeurpo
intérieure à l’intervalle de confiance n’estrejetée,
ettoute
hypothèse
telle quepo
est extérieure à l’intervalle de confiance estrejetée.
Les cas extrêmes sont k = 0 : l’intervalle de confiance est
(0,1) ;
aucunehypothèse
de la formep po
n’estrejetée -
et k = n : l’intervalle de confiance est[p(n)i, 1
seules sontrejetées
leshypothèses p po
oùPo p(n)i.
Remarque.
Pour n,
po
et adonnés,
larégion
derejet
d’unehypothèse,
et larégion complémentaire d’acceptation
existentpréalablement
à la réalisation de touteépreuve ;
uneépreuve permet
de situer son résultat(k)
dans l’une ou l’autre de cesrégions.
De
même,
pour n et adonnés,
les n + 1 intervalles de confiance existentpréalablement
à la réalisation de touteépreuve ;
uneépreuve
détermine celui de ces intervalles que l’onadoptera
comme intervalle de confiance.1.5.2. Non
équivalence
des deuxproblèmes
Les
problèmes
"intervalle de confiance" et "testd’hypothèse"
ne se cor-respondent qu’à l’égard
du"risque
a".Existe-t-il un
"risque
de2è espèce j8"
dans unproblème
d’intervalle de con-fiance ? La
réponse
est évidemmentnégative.
Dans un test
d’hypothèse,
unehypothèse
nulle estspécifiée (concernant
la valeur de
p).
Si le test ne conduit pas aurejet
del’hypothèse nulle,
on a ledroit
(sinon
ledevoir !)
de voir àquelle
conclusion on arrive si la situation réelleest différente de celle
envisagée
parl’hypothèse
nulle : d’où lerisque 0
associé àune "situation réelle" définie par une alternative
fixée.
Dans le cas de l’intervalle de
confiance,
on se contente de porter unjuge-
ment sur la valeur inconnue p
(c’est-à-dire
sur la situationréelle).
Lejugement
estvrai ou faux : il
n’y
a pas d’alternative. Onpeut simplement
afirmer que,quelle
que soit la situation réelle
(p), lorsqu’on
a choisi un niveau de confiance 1 - a, laprobabilité
que lejugement
soit faux est a.1.5.3. Deux
points de terminologie
a)
Dans unproblème
de testd’hypothèse,
on se donne un"risque" -
oula valeur maximale d’un
risque :
c’est le niveau designification.
Dans un
problème
d’intervalle deconfiance,
on se donne un "niveau deconfiance", qui
est en fait(dans
le cas d’uneproportion)
la valeur minimale dudegré
de confiance : il luicorrespond
encore la valeur maximale d’unrisque.
L’emploi
de termes tels que"risque
maximal attaché àl’hypothèse
nulle"et
"risque
maximal attaché à l’intervalle de confiance" seraitpréférable.
b) Lorsque
leparamètre auquel
on s’intéresse est uneproportion (c’est
lecas de cette
note)
il estincorrect,
dans un casbilatéral, d’ajouter : "symétrique
en
probabilité".
Pour définir les limites de l’intervalle deconfiance,
ou les bornesde la
région critique,
on divise bien oz en deuxparties égales : a/2
et«/2.
Maisle
risque
réel sesépare
en deuxparties ci (d’un côté), «s (de l’autre) -
toutes lesdeux au
plus égales
àa/2 - qui
n’ont aucune raison d’êtreégales.
1.6.
Exemples.
n = 20La table des fractiles de la loi de F donne aisément les limites
p(k)i
etp(k)
des intervalles de confiance "à droite" et "à
gauche",
pour n =20,
a = 5% (k
=0, 1, 2,..., 20),
ainsi que les limites des intervalles bilatéraux[p(k)i, p(k)s]
pour n =
20,
a = 10% (Tableau TC,
limitesexprimées
en p%).
Legraphique
GC 1 matérialise les intervalles de confiance "à droite" et les intervalles bilatéraux.
1.6.1.
Risque a’,
enfonction
de p, pour l’intervalle unilatéral à droite(a
= 5%)
On l’obtient facilement à l’aide du tableau TC et d’une table de la loi bino- miale. La
représentation graphique
est donnée sur legraphique (GC 2).
1.6.2.
Risque a1en fonction
de p pour l’intervalle bilatéral(a
= 10%)
De la même
façon
la variation dea’
en fonction de p estreproduite
sur legraphique
GC 3.TABLEAU TC
Limites
(en %)
des intervalles de confianceclassiques
n = 20
2. INTERVALLE DE CONFIANCE D’UNE PROPORTION SUIVANT UNE METHODE BAYESIENNE
Dans une méthode
bayesienne,
p n’est pas considéré comme unparamètre
de valeur
inconnue,
mais comme une variable aléatoire dont on se donne la loi de distribution apriori.
En l’absence d’autreinformation,
on admet que cette loi estuniforme sur
(0, 1).
Nous ne discuterons pas ici de cette"hypothèse
apriori",
renvoyant pour cela à la section 3 de cette note ; nous nous bornerons à en tirer les
conséquences.
Lorsqu’on
à tiré un échantillon d’effectif n, ondispose
d’une information : le nombre k de "succès". L’intervalle de confiance est défini sur la base de la loi de distribution aposteriori
de p.Pour éviter les
confusions, désignons
par 7r la variable aléatoire dont les réalisations sont p(0 p c 1).
La loi apriori
est définie par :La loi a
posteriori -
sachant que dans un échantillon de n on a obtenu k succès - est(X désigne
la variable binomiale(n , p)).
On se donne un nombre 1 - a voisin de
1,
que l’onappellera "degre de confiance" (afin
de ledistinguer
du "niveau de confiance" de la théorieclassique).
L’intervalle de
confiance
"à droite" est l’intervalle[p’(k)i, 1],
oùp’(k)i est
lefractile d’ordre a de la loi conditionnelle
(4),
défini par :relation
qui
s’écrit encore, endésignant
parBx
la fonction bêtaincomplète (inté- gration jusqu’à x) :
L’intervalle de
confiance
"àgauche"
est l’intervalle[0, p’(k)s],
oùpi(k)- est
le fractile d’ordre 1 - a de la loi conditionnelle
(4),
défini par :L’intervalle de
confiance
bilatéral est l’intervalle[p’(k)i, p’(k)s]
défini parEntre la fonction bêta
incomplète
et la fonction cumulative de la loibinomiale,
on a la relation :
ce
qui permet
d’écrire les relations(5)
sous la forme suivante :(unilatéral
"àdroite") (6-a)
(unilatéral
"àgauche")(6-b)
(bilatéral) (6-c)
Le
rapprochement
entre les formules(6)(bornes p’(k)
par la méthodebaye- sienne)
et les formules(2)
de la section 1(bornes p (k)
par la méthodeclassique)
montre que :
A
p’(k)i
dans un échantillon de n ~p(k+1)i
dans un échantillon de(n
+1)
A
p’(k)s
dans un échantillon de n -p(k)s
dans un échantillon de(n
+1 ) Peut-on,
comme dans la "méthodeclassique",
associer à un intervalle de confiancebayesien
unrisque a’(p),
défini commeétant,
dans ungrand
nombred’échantillonnages indépendants
effectués dans la mêmepopulation,
laproportion
des intervalles ne contenant pasp ?
Cela pose un
problème
d’ordrelogique
que nous discuterons dans la section 3.Pour
l’instant,
nous remarquerons que les bornes"bayesiennes" p’(k)i
et(ou) p’(k)s
étant - comme les bornes
"classiques" - préexistantes
à touteépreuve,
il est pos-sible
de lescalculer,
pour n et a donnés, au moyen des formules(6), puis
de calculerpour toute valeur
p(0 p 1)
laprobabilité a’ (p)
que l’intervalle de confiancene contienne pas p ;
a’ (p)
sera le"risque classique"
associé à un "intervallebaye-
sien".
2.1.
Risque classique
associé à un intervallebayesien
unilatéral "à droite"Les bornes
p’(k)i (k
=0, 1, 2, ... , n)
sont données par la relation(6-a) a)Pour
k =0, p’i(0)
est défini par :p’(0)i
estpetit,
mais non nul. Si i p =0,
auratoujours
k =0,
l’intervalle de con-fiance sera
toujours
l’intervalle[p’(0)i, 1]
et necomprendra
pas p ; lerisque a’
sera
égal
a 1(100%).
b) Reprenons
le raisonnementgénéral exposé
à propos de la méthode "classi-que" (§ 1.1)
Si p =
p’(k)i -
e,l’intervalle
de confiance ne contient pas p si Lerisque a’
est :En
rapprochant
cette relation de la relation(6 -a)
on constate quea >
a.Si p =
p’i (k)
l’intervalle de confiance ne contiendra pas p siPar
rapp roche m ent
avec la relation(6 - a)
on voit que03B1’
a.D’une
façon générale, lorsque
p franchit l’une des bornesp’i,
lerisque a’
s’abaisse
brusquement
d’une valeur > a à une valeur a.c) Lorsque
p franchit la bornep’(n)i
lerisque
s’abaisse de la valeur03B1’ = [p’(n)i]n
supérieure
à a(selon 6-a, a
=[p’(n)i]n +1)
à la valeur 0qu’il
conservedans
l’in- tervallep p’(n)i.
En
définitive,
la variation du"risque c/"en
fonction de p seprésente
encoresous la forme d’une "courbe en dents de
scie",
mais elle est trè s différente de la courbe"classique".
Les bornes
p’(k)i
se situent à droite des bornesp(k)i :
les intervalles de confiance s o n tplu s o, ou rts
que d ans la méthodec lassique.
M ais lerisque cl
aulieu d’être borné
supérieurement
par a, oscille autour de a, etpeut
trèslargement dépasser
a pour lespetites
valeurs de p(pour
p =0, a’
= 100%).
2.2.
Risque classique
associé à un intervallebayesien
unilatéral "àgauche"
Les bornes
p’(k)s
sont données par la relation(6-b).
Pour k = n,
p’(n)s
est défini par :[p’(n)s]n+1 =
1 ap’(n)s = (1 - a)l/n+l
p’(n)s
est voisin de1,
mais 1. Si p= 1,
on auratoujours
k = n ; l’intervalle deconfiance sera toujours
l’intervalle[0, p’(n)s ]e t
ne contiendra pas p ; lerisque a’
sera
égal
à 1(100%).
Il est inutile de
reprendre
le raisonnementdu § 2.1.
La "courbe en dents de scie" se déduit de cellequi correspond
à un intervalle "à droite" au moyend’une
symétrie
parrapport
à p =0,50.
2.3.
Risque classique
associé à un intervallebayesien
bilatéralLes bornes
[p’(k)i, p’(k)s]
sont définies par les relations(6-c).
La relation entre
a’
etp est -
comme pour l’intervalleclassique -
beau-coup
plus complexe
que dans le cas unilatéral. Là encore(cf. § 1.3) a’est
lasomme d’un
"risque
àgauche" cl
et d’un"risque
à droite"03B1’s.
Mais ni i03B1’i
nias
ne sont b ornés
supérieurement
para/2,
eta
n’est pas borné para.Lorsque
p varie de 0(où a’
=100%)
à 1(où a’ = 100%),
il franchit des bornesp’, p’i,
et, àchaque franchissement, a’
subit une variationbrusque ;
la courbea’
=f(p)
est unecourbe discontinue
qui
oscille depart
et d’autre de la droite d’ordonnée a.2.4.
Quelques
remarquesgénérales
Se reporter au
§
1.4alinéa
a) -
il est ici sansobjet
alinéa
b) -
il est encore valable : pour n suffisammentgrand,
intervalleclassique
et intervallebayesien
sontpratiquement identiques.
alinéa
c)
etd) -
La méthodebayesienne
estinapplicable
à unepopulation
finie
(à
moins que son effectif ne soit trèsimportant) : l’hypothèse d’équiprobabi-
lité a
priori
de toute valeur 0p
1 est "apriori"
exclue.2.5. Intervalle de confiance et test
d’hypothèse
Se
reporter au §
1. 5.Il
n’y
aplus correspondance
entre un intervalle deconfiance bayesien
etun test
d’hypothèse
selonNeymann
et Pearson basé sur lerisque
de1è espèce.
Le résultat
(k)
d’uneépreuve peut
être telqu’une hypothèse p
Po n’est pasrejetée,
alors que l’intervalle de confiancebayesien
unilatéral "à droite" exclut la valeurpo.
Unexemple
sera donné auparagraphe
3.1 de la section 3.2.6.
Exemples
Ce sont les
exemples
duparagraphe
1.6(n
=20, a
= 5%
pour un intervalleunilatéral,
a =10 %
pour l’intervallebilatéral)
traités selon la méthodebayesien-
ne.
Le tableau TB donne les valeurs des bornes
p’ 1 (k)
et(ou) p’(k)s.
Legraphique
GB 1 matérialise les intervalles unilatéraux "à droite" et les intervalles bilatéraux.
2.6.1.
Risque classique a’ en fonction
de p pour l’intervalle unilatéral "à droite "(03B1 = 5 %)
La
représentation graphique
est donnée en GB22.6.2.
Risque classique a’
enfonction
de p pour l’intervalle bilatéral(a
=10%)
La
représentation graphique
est donnée en GB3TABLEAU TB
Limites
(en %)
des intervalles de confiancebayesiens
n = 20
3
QUE
CHOISIR ?To
Bayes
or not toBayes ?
3 1. Le pour et le contre
L’intervalle
bayesien
est moins étendu que l’intervalleclassique ;
on a enfermédans des limites
plus
étroites cettepropriété
inaccessible sur un échantillon : la"vraie valeur de la
proportion
dans lapopulation"
... maisquel
est leprix payé
pour cet
avantage apparent ?
On est
parti
del’hypothèse d’équiprobabilité
apriori
de toute valeur p dans l’intervalle(0 - 1).
Enréalité,
dans toutproblème
concret, etquelque
soit le de-gré
de connaissance que l’on aitdéjà
duphénomène étudié,
la seule certitude que l’on a "apriori"
est que toutes les valeurs de p ne sont paséquiprobables.
Sij’ai
la
charge
de contrôler laqualité (proportion
dedéfectueux)
d’un lotqui
m’estprésenté
en recette,je
miserai uneplus
grosse somme sur l’intervalle(0 - 10%)
que sur l’intervalle
(90 % - 100 %).
Sid’autre-part -
et c’estgénéralement
le cas -k
le lot a un effectif fini
N,
toutes les valeurs de p autres que -(k
=0, 1, .... N)
sontà exclure. N
Laissons de côté cette deuxième
objection (qui
n’a pasgrande
valeur si Nest
grand) -
écartons aussi certaines difficultés d’ordrelogique
surlesquelles
onreviendra au
§
3.2 - etpoursuivons l’exemple
du contrôle de laqualité
d’un lot.Supposons
que le "contrôleur"dispose,
pour un effectif d’échantillon n et un ni-veau de confiance
(1 - 03B1)
donnés à la fois d’une table des bornes de l’intervalle de confiance"classique"
et d’une table des bornes de l’intervalle"bayesien" (inter-
valle unilatéral ou
bilatéral,
peuimporte) :
parexemple,
pour n =20,
les tableauxTC et TB.
Si,
dans le mêmelot,
le contrôleur effectue ungrand
nombre d’échantil-lonnages indépendants,
s’ilprend
notechaque
fois de l’intervalleclassique,
et si finalement il contrôle le lot à 100% -
cequi
lui donne la vraie valeur p - il cons-tatera que la
proportion
des intervalles contenant effectivement p est au moinségale
à 1 - a ;si,
dans les mêmesconditions,
il utilise la table des intervallesbayesiens,
cetteproportion
pourra être nettement inférieure à 1 -03B1.Il
s’agit là,
bien évidemmentd’opérations imaginaires : qui
serait assez sotde ne pas cumuler les résultats des
échantillonnages successifs,
defaçon
à obtenirdes intervalles de confiance de
plus
enplus
étroits ? Mais cesopérations
"ima-ginaires"
sont"imaginables" ;
elles constituent l’un des fondements de la théorieclassique
des intervalles de confiance et des testsd’hypothèse,
théorie danslaquelle
"probabilité"
a lasignification
de "valeur limite d’unefréquence".
Imaginons
enfin unéchantillonnage
contradictoire entre unreprésentant
du "fournisseur" et un
représentant
du"client’; qui
sont d’accord pour considérerqu’une proportion
donnéepo
de défectueux est la limiteacceptable.
Ils convien-nent que le fournisseur doit être
protégé
par unrisque
auplus égal
à ex de se voirrefuser un lot
acceptable (c’est-à-dire
tel que ppo)
et que la décision seraprise
sur la base d’un échantillon d’effectif n. Le fournisseur a l’habitude des tests
d’hy-
pothèse,
et est moins familier avec les intervalles deconfiance, :
il propose de faire le testclassique
del’hypothèse
nullep po,
aurisque
de1 e espèce
a. Le clientpréfère
les intervalles deconfiance,
et déclarequ’il rejettera
le lot si l’intervalle de confiance unilatéral "à droite" pour p, au niveau de confiance 1 - a, obtenu àpartir
del’échantillon,
ne contient paspo .
L’accord estconclu,
les deuxpoints
de vue
paraissant identiques,
avecpo
=8 %,
a =5% (1 -
a =95 %)
et n = 20.On trouve k = 4 défectueux dans l’échantillon. Conclusion du fournisseur : le lot doit être
accepté,
car larégion
derejet
del’hypothèse
est larégion
définie par k > 5. Conclusion du client :je rejette
lelot,
car l’intervalle de confiance pour p est l’intervalle(9,9 % -
100%) qui
ne contient paspo
= 8%.
Le client avait omis de direqu’il
étaitbayesien ! Qui
arbitrera ? Un arbitre"classique",
s’il arrive àpersuader
le client d’utiliser un intervalle de confianceclassique (soit
ici(7,1 % - 100 %)) ?
Un arbitre"bayesien’!
s’il convainc le fournisseur de modifier la théorieclassique
des testsd’hypothèse ?
3.2.
Logique classique
etlogique bayesienne
L’exemple précédent
montre que, dans certains cas aumoins,
il y aincompa-
tibilité entre la
"logique classique"
et la"logique bayesienne".
Sur cette
querelle
des anciens et des modernes(si
l’onpeut
dire !Bayes
n’estmoderne que si on le fait
précéder
denéo.. )
il a étébeaucoup écrit,
et on hésite àl’évoquer
à propos de cesproblèmes
"triviaux" que sont les testsd’hypothèse
et ladétermination des intervalles de
confiance ;
maisl’adjectif
"trivial" est bienambigu :
un même
problème peut
être considéré comme trivial par un théoricienqui
n’a decomptes
à rendrequ’à
saprobité scientifique,
et ne pas l’être par unpraticien qui présente
à sonemployeur
des conclusions àpartir desquelles
ce dernierprendra
des
décisions.(1)
La
logique classique
est fondée sur leconcept "probabilité =
limite d’unefréquence".
Toute conclusion estempiriquement
ou intellectuellement vérifiable en terme defréquence ;
attacher un"risque"
donné à une conclusionparticulière, signifie qu’en répétant
un trèsgrand
nombre de fois les circonstancesayant
conduit à celle-ci(c’est
facile à écrire - souvent bien difficile àréaliser),
laproportion
desconclusions inexactes sera
égale,
ou auplus égale
aurisque.
Ceciimplique qu’on dispose
d’un critèreobjectif
pour classer les conclusions en "exactes" ou"ine-xactes" ;
cecritère,
s’ilpeut
se concevoir pour ungrand
nombre de conclusions n’existe évidemment pas pour une conclusion isolée : la vérificationempirique consiste,
telAsmodée,
à découvrir le toit pour connaître le secret des individus.Il
s’agit là,
il faut bien lereconnaître,
d’uneopération
de natureplus
intellectuelle que matériellement concevable.La
logique bayesienne
est d’une autre nature. Pour une raisonqui peut
êtreobjective
ousubjective,
on attache une"probabilité"
apriori
à chacune des causes(hypothèses)
d’unphénomène ;
muni d’une informationsupplémentaire (évène-
ment
réalisé),
laprobabilité
apriori
est transformée en"probabilité
apostériori".
Dans l’estimation du
paramètre
p d’une loibinomiale,
c’est la loi apriori
de p que l’on se donne(ou
que l’on supposeconnue) ;
en l’absenced’information,
on(1) Voir H.C. Hamaker : "Bayesianism ; a threat to the statistical profession" - Revue In-
ternationale de Statistique - Vol. 45 -- N° 2 - Août 1977