R EVUE DE STATISTIQUE APPLIQUÉE
G. C ALOT
Significatif ou non significatif ? Réflexions à propos de la théorie et de la pratique des tests statistiques
Revue de statistique appliquée, tome 15, n
o1 (1967), p. 5-69
<
http://www.numdam.org/item?id=RSA_1967__15_1_5_0>
© Société française de statistique, 1967, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
SIGNIFICATIF OU NON SIGNIFICATIF ?
RÉFLEXIONS A PROPOS DE LA THÉORIE
ET DE LA PRATIQUE DES TESTS STATISTIQUES
G. CALOT
ancien
élève de l’École Polytechnique, administrateur de l’I.N.S.E.E
La théorie des tests de NEYMAN et PEARSON
présentée
à laRoyal
Statistical
Society
en 1942 est trèsgénéralement
admise comme fondementthéorique
des testsclassiques.
Cette théorie
envisage
d’abord les tests d’unehypothèse simple
contre une
hypothèse simple.
Ainsi dans le casuniparamétrique,
on com-pare, sur la base d’un échantillon d’observations
indépendantes,
deux valeursparticulières
duparamètre : 81
et9g, ayant
admis apriori
que lavraie valeur 8. du
paramètre
nepeut
êtreégale qu’à
l’une de ces deux valeurs. Dans ce cadresimplifié,
et assez peu réaliste dupoint
de vuepratique,
la théorie de NEYMAN et PEARSON conduit à ladétermination,
non pas d’une
règle unique optimum,
mais d’une famille derègles opti-
mum :
chaque règle
de la famille est caractérisée par l’un ou l’autre de troisnombres,
lerisque
depremière espèce
a, lerisque
de seconde es-pèce (3,
lerapport
de vraisemblance k sur la frontière de larégion
cri-tique.
La sélectiond’une règle unique parmi
la familleoptimum
est souvent effectuée en choisissant arbitrairement la valeur durisque
depremière espèce
a, cequi
revient à fairejouer
un rôleprivilégié
àl’hypothèse
alternative.
Lorsqu’on
passe ensuite à l’étude des tests d’unehypothèse simple
contre une
hypothèse composite,
on examine le cas où il existe un test uniformément leplus puissant (uniformly
mostpowerful
ouUMP).
Ce casexceptionnel
seprésente lorsqu’on
compare une valeurparticulière 03B80
d’unparamètre
contre un ensemble de valeurs01
soituniquement supérieures,
soit
uniquement
inférieures à80 (paramètre
p d’une loibinomiale,
m d’uneloi normale
d’écart-type
connu, (7 d’une loi normale de moyenne connue,m d’une loi de
Poisson, ... ).
Il existe alors non pas un test UMP maisune famille de tests UMP :
chaque règle
de la famille des tests UMPpeut
être identifiée soit par lerisque
a depremière espèce,
soit par la valeurPi
durisque
de secondeespèce correspondant
à une valeurparticulière 81
del’hypothèse alternative,
soit encore par lerapport k
des vraisem-blances
correspondant
à8¡-
Engénéral,
onprocède
à lasélection
d’unerègle particulière parmi
lafamille,
en se fixant arbitrairement la valeur adu
risque
depremière espèce.
Lorsqu’il
n’existe pas de testUMP,
leproblème
secomplique
et ilfaut faire choix d’un critère
supplémentaire
pour aboutir à la sélection d’unerègle unique (tests
detype
B ou detype y),
une foisqu’on
a fixéla valeur du
risque
a depremière espèce.
C’est la situationqu’on
ren-contre
lorsqu’on
considère le casuniparamètrique
oùl’hypothèse
alterna-tive
comporte
des valeurs duparamètre,
les unessupérieures,
les autresinférieures à
80.
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
6
Enfin,
le cas des tests où leshypothèses
testée et alternative sont l’une et l’autrecomposites présente
des difficultés encore accrues. La notion derégions
semblables a été introduite parcequ’on privilégie l’hy- pothèse
testée(la
fonction derisque
depremière espèce
est alors unifor- mément bornéesupérieurement,
éventuellement constante etégale
à unevaleur
fixée).
Toutefois,
il y a lieu de se demander - et c’est là unepréoccupation
que doit avoir constamment le
praticien -
si la solution que donne le théo- ricien à unproblème
donnérépond
bien auproblème
concretqui
estposé.
Le
praticien
est en effettoujours exposé
aurisque
d’une erreur de troi-E=;ième
espèce
consistant à résoudreparfaitement...
unproblème différent
de celui
qu’il
voudrait traiter. C’est laquestion
fondamentale àlaquelle
M. CALOT essaied’apporter
uneréponse
à la foiscritique
et construc-tive,
d’ailleurs fondée sur les résultatsgénéraux
de la théorie des testsclassiques.
N. D. L. R.
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
7
SIGNIFICATIF OU NON SIGNIFICATIF ?
RÉFLEXIONS A PROPOS DE LA THÉORIE
ET DE LA PRATIQUE DES TESTS STATISTIQUES
G. CALOT
ancien
élève de l’École Polytechnique, administrateur de l’I.N.S.E.E
Le statisticien use abondamment du terme
significatif :
telle
différence
est hautementsignificative,
tel test estef- fectué
avec unniveau
designification
de 95%,
de 99%,
etc.Dans cet
article,
nous nousinterrogeons
sur le sensqu’il
con-vient
d’ a t tacher à
cesexpressions.
Il nousappara i t
eneffet
que la not i on met de
significatif
es tambiéiqe
e t donne lieuà
malentendus entre lestatisticien chargé d’analyser des données chiffrées
etd’en dédu i re
des conclusionssynthétiques
etl’homme
del’art(*), pris
au senstrès large
du terme : in-dustriet, médecin, agronome, administrateur,... qui
utilise cesconclusions pour passer au
plan
de fadécision pratique.
Lepremier attache à l’adjectif significatif
un sensprobabiliste précis qu’on peut résumer approximativement
de lafacon
sui-vante: l’écart constaté
entrel’hypothèse prise
pourréférence
et lereflet
de laréalité fourni
par les .observations estsignificatif
s’il estsupérieur à
cequ’on peut raisonnablement
a t tend re duhasard, lorsqu’il y
acoïncidence parfaite
entrela
réalité
etl’ hypothèse de référence.
Aucontraire,
pourl’homme
del’art, l’adjectif significatif
serapporte à l’écart qui sépare
laréalité
e tl’hypothèse
deréférence
e tn’a
ri enà
voir
fondamentalement
avec lecaractère aléatoire
duflou qui
environne
1 1 information disponible :
unécart siaenificati f
estun
écart substantiel, conséquent, décisif,
entreréalité
ethypothèse
deréférence,
dupoint
de vue duproblème
par-ticulier envisagé.
D ans
quelle
mesure ces deuxacceptions
del’adjectif
si-gnificatif
serejoijnent-elles ?
Defaçon plus précise,
dansquelle
mesure la solution du statisticien est-elle une solution convenable auproblème posé
par l’homme de l’art( *)
Nousdistinguons
le statisticien de l’homme de l’art pour la com- modité del’exposé.
Les malentendusévoqués
ici seront d’autantmieux dissipés
que statisticien et homme de l’art se confondront dans la même personne.Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
8
SOMMAIRE
Pages
1 - LE PROBLEME DU TEST DANS LE DOMAINE NON ALE-
ATOIRE ... 10
1. 1 - Les
performances
de l’instrument ... 101. 2 - Les
spécifications
duproblème posé
... 111. 3 -
L’adéquation
de l’instrument auxspécifications
duproblème posé...
121.4 - Conclusions ... 13
2 - LE PROBLEME DU TEST DANS LE DOMAINE ALEA- TOIRE ... 15
2. 1 - Test de
signification
d’une moyenne : test " contre>", l’écart-type
étant connu ... 182.1.1 - La théorie de
Neyman
et Pearson ... 182.1.2 - Sélection d’une
règle
de test ... 192.1.3 - Conclusions ... 23
2.1.4 -
Application numérique ...
242.1.5 -
Remarques ... 252. 2 - Test de
signification
d’une moyenne :test "= contre / 11, l’écart-type
étant connu ... 272.2.1 - La t héo ri e de
Neyman
et Pea rson ... 282.2.2 - Sélection d’une
règle
de test ... 292.2.3 - Conclusions ... 34
2.2.4. -
Application numérique ...
362. 3 - Tests de
comparaison
entre moyennes, les écarts-types
étant connus ... 372.3.1 - Test de
hypothèse :
la moyenne mi est subs- tantiellementplus faible
que la moyenne m2 ... 382.3.2 - Test de
l’hypothèse :
la moyenne ml nediffère
pas substantiellement de la moyenne M2 ... 422.4 - Tests relatifs à des moyennes de variables nor- males
lorsque
lesécarts-types
sont inconnus ... 462. 4.1 - L es lois du
X 2,
de Studen t e t de Snedecor noncentrées ...
462.4.2 - Test de
signification
d’une moyenne : test " contre > "... 482. 4 . 3 - Test de
comparaison entre moyennes :
mi i es t su bs- tantiellement plusfaible
que m2’ les écarts-types cri et cr 2
inconnus étantsupposés égaux ...
51Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
9
Pages
2.4.4 - Test de
signification
d’une moyenne : test11, contre
~"
... 53 2.4.5 - Testd’homogénéité
entre moyennes ... 55 2.4.6 - Pland’ expérience factoriel
avecécales
ré-pétitions ...
60 3 -CONCLUSIONS ...
65 3. 1 - Lesspécifications particulières
duproblème
étudié 653. 2 -
Comparaison
avec la méthode consistant à se ré-férer au seul
risque
depremière espèce ...
67Revue de Statistique Appliquée, 1967 - Vol. XV - N 1
10
1. LE PROBLÈME DU TEST DANS LE DOMAINE NON ALÉATOIRE
Avant
d’envisager
leproblème
du teststatistique,
c’est-à-dire leproblème
de la décision fondée sur des observations de naturealéatoire,
il convient d’examiner le
problème analogue, posé
dans un contexte pu- rementdéterministe.
On nepeut
en effetespérer
résoudre convenablement leproblème aléatoire,
si on nedispose
pas d’une solution satisfaisanteau
problème
déterministe. D’unepart,
cette solution servirade repère
à
l’analyse
duproblème déterministe ;
d’autrepart,
supposer les obser- vationsexemptes
de flou aléatoire ne modifie pasfondamentalement
l’énoncédu
problème posé
par l’homme de l’art.Effectuer un test
statistique,
c’est réaliser uneépreuve
dont l’issueprendra
l’une de deuxformes exclusives, qu’on peut symboliser
par OUI et par NON. Un teststatistique
est ainsianalogue
à un réactifchimique qui
virera ouqui
ne virera pas, à un indicateurélectrique
dont lalampe
s’allumera ou ne s’allumera pas.D’une
façon générale,
leproblème
du test est celui de la décision à deux niveaux,c’est-à-dire,
en définitive etmalgré
toute sacomplexité ,
le
problème
de décision leplus simple qui
soit.Pour décrire une méthode de test, nous conviendrons dans la suite
d’adopter
lelangage
des instruments de mesure : une méthode de test(plan d’échantillonnage
+règle
detest)
est un instrument de mesure surlequel
nefigurent
que deux draduations : OUI et NON.1. 1 - LES PERFORMANCES DE L’INSTRUMENT
Portons notre attention sur une classe
particulière
d’instruments de mesure : ceuxqu’on peut
caractériser par un seuil Z desensibilité.
C’est par
exemple
tel réactifchimique qui
ne vire que si l’acidité de la solutiondépasse
un certain seuil.En nous
plaçant
dans un contextedéterministe,
nous supposerons que laréponse
de l’instrument est ent ièrement condi t ionnée par la mesure m de lagrandeur
faisantl’objet
del’expérience.
Lesperformances
de l’instrument sont alors entièrementrésumées
par le seuil s de sensibilité :(m s) (l’instrument répond OUI) ; (m
>s) (l’instrument répond NON).
Nous convenons ainsi que la
réponse
OUIs’applique
aux valeursrelativement
faibles
de m, NON aux valeurs relativementfortes.
Appelons
courbed’efficacité
de l’instrument la courbereprésentative
de la fonction
P(m) :
P(m) = probabilité
que l’instrumentréponde
OUI si la valeur vraie de lagrandeur
considérée est m.P(m)
vaut 1,lorsque
m est inférieure à s ;P(m)
vaut 0,lorsque
m est
supérieure
à s(Fig. 1).
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
11 Figure 1
1. 2 - LES SPECIFICATIONS DU PROBLEME POSE.
Le
type particulier
d’instrumentsqui
vient d’être décritpermet
derépondre
à desquestions
du genre :la vraie valeur m* de la
grandeur
considérée est-elle rela-tivement faibleou relativement forte ?
Il convient évidemment de
préciser
cequ’on
entend par relativementfaible
et relativementforte:
pour cefaire, il faut définir
à l’avancelaquelle
des deuxréponses
OUI et NON on souhai terai t que l’instrumentfournisse, lorsque
la vraie valeur m* esté,ale
à m. L’utilisateur de l’instrument doit ainsi se livrer à uneanalyse préalable des spécifications
duproblème
par- ticulierconsidéré. Désignons
par(0)
l’ensemble des valeurs m tel que, si m*appartient
à(0),
l’utilisateur souhaiterait laréponse OUI ;
par(N),
l’ensemble des valeurs m tel que, si m*
appartient
à(N),
l’utilisateur souhaiterait laréponse
NON.Si on
admet,
pour letype
deproblème envisagé,
que lesspéci-
fications satisfont aux deux conditions
générales :
les ensembles
(0)
et(N)
sont de la forme(Fig. 2) :
L’intervalle
(mi , m2)
définit un ensemble(I)
de valeurs m tel que, si la vraie valeur m*,supposée
connue del’utilisateur,
étaitcomprise
entre mi et m2, celui-ci ne sauraittrop quelle réponse
il aimerait recevoir de l’instrument : sans être substanttellexentfatble,une
telle valeur m* n’estpas non
plus
substanttellementforte.
Nousappellerons
l’ensemble(I)
en-semble
d’indéciston : lorsque
m*appartient
à l’ensembled’indécision,
ilest indifférent à l’utilisateur que la
réponse
soit OUI ou NON.En
résumé,
lesspécifications
duproblème envisagé peuvent
s’énoncerde la
façon
suivante :m*
ml : alors l’utilisateur voudrait recevoir laréponse OUI ;
Revue de Statistique Appliquée, 1967 - Vol. XV - N 1
12
ma
m2 : alors l’utilisateur voudrait recevoir laréponse NON ;
ou encore, de
façon équivalente :
m*
ml : alors l’utilisateur ne voudrait pas recevoir laréponse NON ;
m* m2 : alors l’utilisateur ne voudrait pas recevoir la
réponse
OUI.
Figure
21. 3 -
L’ADEQUATION
DE L’INSTRUMENT AUX SPECIFICATIONS DU PROBLEME POSE.Les
performances
d’un instrumentappartenant
à la classeenvisagée
sont résumées par le seuil t de sensi bi t i té s. Par
ailleurs,
lesspéci- fi cat tons
duproblème
étudié sont résumées par lecouple (mi , m2),
limites de 1 intervalle d’ indécision
(I).
Dansquelle
mesure un instrument donné est-iladapté
à unproblème
donné ?Peut-on,
sous certaines con-ditions,
utiliser un instrumentinadapté ?
Nous conviendrons de donner les
réponses
suivantes à ces deuxquestions
fondamentales :a. Un instrument caractérisé par le seuil de sensibilité s est
adapté
à unproblème,
dont lesspécifications correspondent
à(nit , m2),
si s est
compris
entre ml et m 2 :En
effet,
l’instrument satisfait alors aux deuxspécifications simultanément
duproblème
considéré :c’est-à-dire encore, de
façon équivalente :
Un instrument
inadapté
auproblème
considérécorrespond
à :- ou bien : s > m 2 ;
- ou bien : s m 1 .
Dans le
premier
cas, l’instrument estinsuffisamment sensible ;
dans le second cas, il est trop sensible.b. Un instrument
inadapté peut
toutefois fournir des résultats in- téressants. Eneffet, quel
que soit le défautd’adaptation,
l’une des deuxspécifications
est satisfaite :Revue de Statistique Appliquée, 1967 - Vol. XV - N" 1
13
- instrument
insuf f isamment
sensible: s > m2 ; donc s > ml ; ;- instrument trop sensible : s ml ; donc s m2 . En
conséquence :
Ainsi la
réponse
NON d’un instrument insuffisamment sensible comme laréponse
OUI d’un instrumenttrop
sensible sont desréponses
valables.En
revanche,
laréponse
OUI d’un instrument insuffisamment sen-sible comme la
réponse
NON d’un instrumenttrop
sensible sont des ré- ponses inutilisables.c. La
question qui
se pose,lorsqu’on
se trouve dans l’une desdeux dernières
situations,
est de savoirquelle
attitudeadopter.
Il nous semble raisonnabled’envisager
l’une des trois attitudes suivantes :- ou bien changer d’instrument et en retenir un
qui
soitadapté
au
problème considéré ;
- ou bien s’abstenir de
formuler
uneconclusion,
faute de dis- poser d’informationvalable ;
- ou bien encore, conclure conformément à la
réponse
fourniepar l’instrument
inadapté,
en attirant l’attention de l’homme de l’art surl’incertitude de la conclusion.
1.4 - CONCLUSIONS.
Cette
analyse
sommaire d’un casparticulier
de test(que
nous ap-pellerons
test de la forme "contre >"), posé
dans un contexte déter-ministe,
met en lumière lespoints
suivants :a La solution d’un
problème
donné est conditionnée par lesspéci- f i
cat ions propres duproblème envisagé.
Tel instrumentadapté
à un certainproblème peut
êtreinadapté
à la résolution d’un autreproblème.
Enconséquence,
il ne saurait exister d’instrument"passe-partout", adapté
à toutes sortes de
problèmes
dont lesspécifications
seraient différentes.. Faute de connaître les
performances
de l’instrumentqu’on utilise ,
on est dans
l’ignorance
de cequ’on
fait. Il en est de même si on ne connaît pas lesspécifications particulières
duproblème envisagé.
a Un instrument trop sensible est tout aussi
inadapté qu’un
instrumenti nsu f f i sammen t
sensible.. Si l’instrument dont on
dispose
estinadapté
auxspécifications
du
problème posé
et si on décide de maintenir lesspécifications
sanspouvoir
recourir à un instrumentadapté,
il est raisonnabled’adopter
unerègle
à trois niveaux de conclusion et non à deux-
Réponse OUI ,
-
Réponse NON ;
-
Réponse
ABSTENTION.Il nous semble en effet
préférable
de s’ absteni r au moins pro-visoirement, plutôt
que de donner uneréponse
incertaine. Cette démarcheRevue de Statistique Appliquée, 1967 - Vol. XV - N* 1
14
relève tout
simplement
de l’honnêtetéintellectuelle ;
elle devraitfigurer
en bonne
place
dans un code dedéontologie
du statisticien.. De
façon analogue
à la remarqueprécédente,
si l’instrument donton
dispose
estinadapté
auxspécifications
duproblème posé
tandis que le recours à un instrumentadapté
estimpossible
et si l’homme de l’artveut absolument une
réponse
par OUI ouNON,
il convient d’attirer sonattention sur les
performances précises
de l’instrumentinadapté
utilisé.Revue de Statistique Appliquée. 1967 - Vol. XV - N’ 1
15
II. LE PROBLÈME DU TEST DANS LE DOMAINE ALÉATOIRE
Le
problème
du testposé
dans un contexte aléatoire sedistingue
de celui
posé
dans un contexte déterministe à troispoints
de vue : -.. le statisticien doit construire son instrument : en
général,
il aà sa
disposition
non pas un instrument mais une aeamme d’instrumentsparmi laquelle
il lui faut en sélectionner un ;. la courbe d’efficacité de
chaque
instrument ne varie pas de 0 à 1 avec un seulpoint
de discontinuité : engénéral même,
elle est con-t i nue ;
. l’homme de l’art doit
exprimer
lesspécifications
de son pro- blème en termes à la foisdéterministes (ensemble d’indécision)
et aléa-toi res
(risque encouru).
D’une
façon générale,
leproblème
du teststatistique comporte
deuxétapes :
. la
première
consiste à définir letype
d’instruments le mieuxadapté
à un type deproblèmes
donné. Cettepremière étape
nécessitel’adoption
d’un critère de comparaison entrerègles
de test(c’est
à direentre
instruments),
critèrequi permette
d’affirmer que tellerègle
estpréférable
à telle autre, du moins dans certains cas, c’est à direlorsque
deux
règles
sontcomparables.
e la seconde
étape
consiste en lasélection, parmi
la classe desrègles optimales
auregard
du critère decomparaison adopté,
d’unerègle
uniquequi
satisfasse non seulement aa mieux mais encore defaçon
con-venable aux
spécifications
duproblème envisagé.
La
première étape correspond
à la démarcheproposée
parNeyman
et Pearson. Nous en étudierons de
façon
détaillée les modalités sur unexemple
dans leparagraphe
2. 1. Il convient d’insister sur lespoints
suivants :
. la théorie de
Neyman
et Pearson ne conduit pas à la détermi- nation d’unerègle
de test unique mais au contraire à la détermination d’une classe derègles, chaque règle
de la classe étant identifiée par unou
plusieurs paramètres ;
. dans le cas
fréquent
où la classe desrègles optimales
au sensde
Neyman
et Pearson estuni paramé tri que ,
onpeut
identifierchaque règle
de la classe par le risque de
première espèce, désigné
habituellement par a. Ceci est le caslorsque l’hypothèse
testée est simple ouencore lorsque, l’hypothèse
testée étantcomposite,
la classe desrégions critiques optimales
constitue une famille de
régions
semblables.Néanmoins,
la sélection d’unerègle unique parmi
la classe desrègles optimales
doit être ef- fectuée sur la base de la courbed’efficacité
attachée àchaque règle
etnon par choix
plus
ou moins arbi traire durisque
ex depremière espèce.
Neyman
a fortement insisté sur cepoint qui
semble souventperdu
devue par les statisticiens.
Revue de Statistique Appliquée, 1967 - Vol. XV - N* 1
16
2022 la théorie de
Neyman
et Pearson nepeut
êtreappliquée
que sion admet certaines
hypothèses précises
sur la natureanalytique
des loisde
probabilité
mises enjeu. Néanmoins,
dans certains cas où de telleshypothèses
ne sont pasadmises,
il estpossible -
en se référant ou non,par
analogie,
à la théorie deNeyman
et Pearson - dedéfinira priori
une classe de
règles parmi lesquelles
on en sélectionnera une, sur la base de la courbe d’efficacité : l’instrumentqu’on
construira ainsi nepré-
sentera pas des
qualités d’optimalité
relativement à un critère de com-paraison explicite
mais il aura au moinsl’avantage
d’être un instrumentdont on connatt les
performances.
Cepoint
nousparaît
fondamental : mieux vaut utiliser un i nst rumen t dont onconnaît
les limites, même s’il t n’ es t pas le meilleurqui
soit,plutôt
que recourir à un instrumentoptimal
dont onignore
lesperformances.
D’unepart
eneffet, lorsque
laquantité
d’infor-mation
disponible
estinsuffisante,
le meilleur instrument est un instrumentmédiocre,
sinon mauvais. D’autrepart,
il ne faut pasperdre
de vuequ’un
instrumenttrop
sensible est tout aussiinadapté qu’un
instrumentinsuffisamment sensible.
En ce
qui
concerne la sélection de larègle unique parmi
une classedonnée de
règles,
nous conviendronsd’adopter
la méthode suivante ins-pirée
de la notion de minimax etgénéralement employée
dans le domainedu contrôle industriel de la
qualité (en particulier
dans le contrôle qua- litatif deréception) :
. nous caractériserons les
performances
d’unerègle
par laplus grande probabilité d’erreur,
enappelant
erreur le fait derépondre
OUIalors
qu’on
désirerait laréponse
NON ou derépondre
NON alorsqu’on
désirerait la
réponse
OUI. Enreprenant
les notations duparagraphe
1 ,on aboutit à : :
2022 nous considèrerons comme convenable une
règle
dont lerisque
maximum
03B4*
estin férieur ou ééal
à03B4,
seuil donné à l’avance :2022 nous sélectionnerons comme
règle unique
unerègle
convenable - s’il en existe une - : suivant le cas, ce sera ou bien larègle
convenablela plus
économique (lorsque
l’avis du statisticien est demandé avant échan-tillonnage
etqu’il peut
recommander unplan
desondage)
ou bien larègle
convenable quipossède
le risque maximum leplus faible lorsque le
statisticien est consulté
après échantillonnage).
. s’il n’existe aucune
règle convenable,
nous considérerons que laquantité d’information disponible
estinsuffisante
pour construire unerègle
à deux niveaux satisfaisant aux
spécifications
duproblème envisagé.
Enreprenant
lesarguments présentés plus
haut en1. 3. ,
nous conviendronsd’adopter
alors l’une des trois attitudes suivantes :- accrottre le nombre des observations pour se ramener au cas
où il existe une
règle convenable ;
-
adopter
unerègle
à trois niveaux(OUI, NON, ABSTENTION);
-
adopter
larègle
à deux ni veaux dont lerisque
maximum est le plusfaible, en indiquant
à l’homme de l’art la valeur(supérieure b 8)
de ce risque maximum.Revue de Statistique Appliquée, 1967 - Vol. XV - N 1
17
Cette méthode de sélection
peut
êtrejustifiée
de lafaçon
suivante :soit 03B4 un niveau de
risque qu’on accepte
de courir : tout événement deprobabilité
inférieure à 03B4 estconsidéré
commeimpossible
et enconséquence négligé.
03B4 esten quelque
sorte l’échelon minimum en te tmes de risqueaccepté.
Supposons
que laréponse
du test est OUI. En vertu de la con-vention
précédente
et enreprenant
les notations duparagraphe 1,
on déduit que la vraie valeur m* est telle que laprobabilité
attachée à laréponse
OUIdépasse 03B4.
Dans le cas contraire eneffet,
l’instrument n’aurait pu fournir laréponse
OUI. Enconséquence,
si la condition :est
satisfaite,
m* nepeut appartenir
à(N) ;
m*appartient
donc à(0)
ou à
(I)
et laréponse
fournie par le test est correcte.Inversement,
si laréponse
du test estNON,
la vraie valeur m*ne
peut appartenir
à(0)
si la condition :est satisfaite et en
conséquence
laréponse
fournie par le test est correcte.L’argument
essentiel à la base de la méthode de sélection est ainsi le suivant : la vrai e valeur m* doit attacher à laréponse fournie par
le test une
probabilité supé ri eure
àÔ
car, si ce n’était pas le cas, ilfaudrait admettre qu’un évènement de probabilité qu plus égale à
6 s’est pro- dui t, ce qui par convention estrejeté.
Cette démarche est ainsianalogue
à celle
qu’on emprunte, lorsqu’on
construit un intervalle de confiance :une
règle
de test convenable - au sens où nous avons défini ce terme - est unerègle qui
fournit laréponse
correcte avec uneprobabilité
aumoins
égale
à1-6, quelle
que soit laréponse
correcte. De même, unerègle
de construction d’un intervalle de confiance au niveau 1-a est unerègle qui
fournit un intervalle recouvrant la vraie valeur duparamètre
avec une
probabilité égale
à1-a, quelle
que soit cette vraie valeur.On
pourrait objecter
que les erreurs depremière
et de secondeespèce
étant de nature différente et parconséquent
assorties de coûtsdifférents ,
il seraitpréférable
de retenir deux seuils61
1 et03B42,
non nécessairementégaux,
et d’assurer les deux conditions :En
réalité,
toutdépend
de lafaçon
dont on a choisi les ensembles(0)
et(N)
pour caractériser lesspécifications
duproblème posé.
Nousadmettons
implicitement
dans la méthode décrite ci-dessus que les en- sembles(0)
et(N)
ont été définis de manièreéquivalente.
Ainsi dans lecas du
test "
contre>",
mlreprésente parmi
les valeurs relativementfaibles
de m une situation aussi extr2me que m2parmi
des valeurs re-l atiuement
fortes
de m.Avant de
juger plus
en détail desavantages
et inconvénients de la méthodeproposée, envisageons
sonapplication pratique
dans lesexemples simples
suivants : tests designification,
decomparaison
etd’homogénéité
de moyennes
(dans
le cas depopulations
normalesd’écarts-types
connusou
non).
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
18
2. 1 - TEST DE SIGNIFICATION D’UNE MOYENNE :
TEST " CONTRE>",
L’ECART-TYPE ETANT CONNU.
Considérons le
problème
suivant : sur la base de n observationsindépendantes
d’une loi normaleN(m, 03C3o),
où03C3o
estsupposé
connu, test del’hypothèse :
a est relativementfaible
contrel’hypothèse : m
est relativementforte-
Supposons
que lesspécifications
duproblème peuvent
être résumées par letriplet (Ml
, M2 ,6) :
Du
point
de vuegéométrique,
cetriplet
despécifications signifie
que la courbe d’efficacité doit passer dans la zone hachurée de lafigure
3.Figure 3 2.1.1 - La théorie de
Neyzan
et Pearson.La théorie de
Neyman
et Pearson repose sur le critère de com-paraison
suivant entrerègles
de test : Soit T un testcorrespondant
à larégion critique
W(domaine
del’espace
des observations où laréponse
du test est
NON).
SoitP.(m)
laprobabilité
que laréponse
du test soitOUI, lorsque
la vraie valeur de la moyenne estégale
àm[1-PW(m)
estla
probabilité
que laréponse
du test soitNON,
c’est à dire la pro- babilité attachée à larégion critique W, lorsque
la valeur vraie de la moyenne estégale
àm].
Soit de même T’ un testcorrespondant
à larégion critique
W’ etPI (m),
laprobabilité
que laréponse
du test soitOUI, lorsque
la vraie valeur de la moyenne estégale
à m. Le test Test
préférable
ouéquivalent
au test T’ si à la fois :Le test T est strictement
préférable
au test T’(ou
encore : le testT domine le test
T’ )
s’il existe au moins une valeur de mappartenant
soità
(0),
soit à(N)
telle quel’inégalité correspondante
soit stricte.L’application
de ce critèrepermet
d’éliminer touterègle
dominéepar une autre et conduit à la classe des
règles optimales
auregard
duRevue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
19
critère considéré : c’est l’ensemble des
règles
dominées par aucune autre ; onpeut
dire encorequ’à
touterègle n’appartenant
pas à laclasse,
on
peut
associer au moins unerègle
de la classequi
la domine. Engénéral, l’application
de ce critère conduit à la définition d’une classe derègles optimales
tellement riche que la sélectionpratique
d’unerègle
s’avère
impossible.
Dans le
problème particulier envisagé,
on ne rencontre pas cettedifficulté. En
effet,
la théorie deNeyman
et Pearson nous.apprend
que si mo, MI,mN sont
trois valeurs de mappartenant respectivement
à(0) , (I)
et(N),
lesrégions critiques
W satisfaisant à :P (mI )
= valeur fixée et rendant :-
problème (1) : PW(m0)
= maximumou
-
problème (2) : P,(mN)
= minimumsont de la forme :
où c est une constante
dépendant
de la valeur fixée deP, (mI)
mais nedépendant
pas :-
problème (1) :
demo E (0) ;
-
problème (2) :
de mN E(N) ;
- du
problème (1)
ou(2) envisagé.
Il en résulte que dans le
problème particulier étudié,
la classe desrégions critiques optimales
auregard
du critère decomparaison
considéré est de la forme :
ce
qui correspond
à la classe desrègles optimales :
-
Réponse
OUI six
c ,-
Réponse
NON si x > c .2.1.2 - Sélection d’une
règle
de test.Il
convient,
maintenantqu’on
a défini la classe desrègles optimales,
de sélectionner la
règle
uniquequ’on appliquera,
c’est à dire la valeur de c retenue.Considérons une valeur c donnée. La
probabilité Pc(m)
derépondre
OUI, lorsque
la moyenne estégale
à m, est :Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
20
où Il
désigne
la fonction cumulative de la variable normale centrée ré- duite :En
effet,
sous leshypothèses envisagées,
la loi deprobabilité
suivie par la moyenne x est normale :
La fonction
Pc (m)
est strictement dé cro i ssan t e parrapport
à mpuisque
Il est une fonction strictement croissante. Enconséquence,
letriplet
despécifications (m1, m 21 6)
sera assuré si crépond
simultanémentaux deux conditions :
c’est-à-dire encore, en
désignant
par us lequantile
d’ordre 6 delà va- riable normale centrée réduite :Ces deux conditions sont
compatibles
dans le seul cas où :c’est à dire encore, si n
dépasse
le seuil no :On est amené ainsi à
distinguer
deux cas :a. ou bien n no : la
quantité d’information disponible
estsuffisante pour résoudre
leproblème posé.
Eneffet,
lerisque
maximum encouru estle
plus grand
des deux nombres :81(c)
est une fonctiondécroissante
de c,03B42(c)
une fonction croissante dec. Le
plus grand
de ces deux nombres est minimumlorsqu’ils
sontégaux,
c’est à direlorsque
c est la moyennearithmétique
de ml et m 2 :Revue de Statistique Appliquée, 1967 - Vol. XV - N 1
21
Le
risque
maximum encouru est alors :D’où la
régle
de test àadopter lorsque
ndépasse
no :-
Réponse
OUI si x est inférieure à l’abscisse du milieu de 11 interuat ted’indécision
-
Réponse
NON dans le cas contraire.b. ou bien n no : la
quantité d’in(ormatlon 4tspontble
estinsuf- fisante
pour résoudre leproblème posé,
à l’aide d’unerègle
à deuxniveaux-.Dans ce cas, on
peut adopter
l’une des trois attitudes suivantes :b 1.
ou bienactroître la
taille del’échantillon,
enprélevant
An = no- n observations
supplémentaires
et se ramener au cas a.b 2.
ou bien réduire laspécification du problème
relati veau risque03B4,
en
acceptant
de courir unrisque qui peut
atteindre :La
règle
àadopter
est alors celle obtenueplus
haut :-
Réponse
OUI si-
Réponse
NON dans le cas contraire.b3 .
ou bien adopterune règle de
décision à trois niveaux :OUI, NON,
ABSTENTION.En
effet,
si n est inférieur à no, on a :On satisfait à la
première spécification
duproblème :
en convenant de ne
répondre
NON que dans le cas où xdépasse c 2’
avec :On a bien alors :
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
22
De la même
façon,
on satisfait à la secondespécification
du pro- blème :en convenant de ne
répondre
OUI que dans le cas où x estinférieur
àc 1, avec :
On a alors :
En
conséquence,
larègle
suivante à trois niveaux satisfait simul- tanément aux deuxspécifications
duproblème :
-
Réponse
OUI six
c 1 ;-
Réponse
NON six
c 2 ;-
Réponse
ABSTENTION si ci x C2 .La
probabilité
de laréponse
ABSTENTION est minimum pour tout ntlorsque
l’intervalle(cl, c2)
est aussi court quepossible,
c’est àdire, compte
tenu des contraintesprécédentes, lorsque
simultanément :D’où en définitive la
règle
à trois niveaux assortie d’unrisque
auplus égal
à 6 :-
Réponse
OUI si-
Réponse
NON si-
Réponse
ABSTENTION siLa
probabilité
attachée à laréponse
ABSTENTION est une fonction de m dont lemaximum, correspondant
à m =m1+m2 2,
estégal
à :Revue de Statistique Appliquée. 1967 - Vol. XV - N’ 1
23 2.1.3 - Conclusions.
A la suite de cette
étude,
il estpossible
de résoudre leproblème posé
par l’homme de l’art sous la forme(ml,
m 2 ,8) :
a. Si l’avis du statisticien est demandé avant
échantillonnage :
. Recommander de
prélever
un échantillon de no observations :2022 Recommander
d’appliquer
larègle
à deux niveaux :-
Réponse
OUI si-
Réponse
NON dans le cas contraire.b. Si l’avis du statisticien est demandé
après échanttllonnaie : bi.
la taille n de l’échantillon se trouve être au moinségale
à no :. Recommander
d’appliquer
larègle
à deux niveaux :-
R éponse
OUI si-
Réponse
NON dans le cas contraire.2022
Indiquer
à l’homme de l’art lerisque
maximum encouru6*,
J inférieur ouégal
à03B4.
b2. la taille nde 1 ’échantillon
estinférieure
à n o. Dans ce cas, trois attitudes sontpossibles :
Première attitude: Recommander de
prélever An =
n o - n o bservationscomplémentaires
et se ramener au cas a.Seconde attitude : Recommander
d’appliquer
larègle
à troisn i veaux :
-
Réponse
OUI si-
Réponse
NON si-
Réponse
ABSTENTION si :Troisième attitude : Recommander
d’appliquer
larègle
à deuxnt ueoMX ;
-
Réponse
OUI si-
Réponse
NON dans le cas contraire.Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1
24
en
précisant
à l’homme de l’art que lerisque
maximum encouru at-teint :
2.1.4 - Application numérique.
Considérons le
problème numérique
suivant :mi=5,00,
m2=5,20, Oo=0,50.
03B4
= 5 %.
Il vient :
D’où :
a. Si l’avis du statisticien est demandé avant
échantillonnage :
. Recommander de
prélever
n o = 68 observationset d’appliquer
la
règle
à deux niveaux :-
Réponse
OUI six 5, 10 ;
-
Réponse
NON dans le cas contraire.b. Si l’avis du statisticien est demandé
après échantillonnage : b 1. Si,
parexemple,
l’échantilloncomporte
100 observations :2022 Recommander
d’appliquer
larègle
à deux niveauxprécédente ;
2022
Indiquer
à l’homme de l’art que lerisque
maximum en-couru est
égal
à :b2. Si,
parexemple,
l’échantillon comDorte 25 observations : 2022 ou bien recommander deprélever
43 observationscomplé-
mentaires et se ramener au cas a. ;
2022 ou bien recommander
d’appliquer
larègle
à trois niveaux :-
Réponse
OUI six 5, 0355 ;
-
Réponse
NON six 5, 1645 ;
-
Réponse
ABSTENTION si5,0355
x5,1645.
2022 ou bien recommander
d’appliquer
larègle
à deux niveauxindiquée plus
haut :-
Réponse
OUIsi x
5, 10 ;-
Réponse
NON dans le cascontraire,
Revue de Statistique Appliquée, 1967 - Vol. XV - N’ 1