R EVUE DE STATISTIQUE APPLIQUÉE
J. L ELLOUCH
L’application de l’analyse séquentielle aux essais thérapeutiques
Revue de statistique appliquée, tome 17, n
o1 (1969), p. 41-68
<http://www.numdam.org/item?id=RSA_1969__17_1_41_0>
© Société française de statistique, 1969, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’APPLICATION DE L’ANALYSE SÉQUENTIELLE
AUX ESSAIS THÉRAPEUTIQUES
J. LELLOUCH
Unité de
Recherches Statistiques de
l’INSERMINTRODUCTION
Dès la
parution
des travaux deWALD,
on apensé
àadapter
les mé- thodesséquentielles
auproblème
de lacomparaison
de deux traitements A et B dans un essaithérapeutique (E.T.).
Eneffet, quand
on décide de réa- liser un E. T. sur un nombre N demalades,
il estexceptionnel
dedisposer
d’emblée de la totalité de ces
sujets
et de les traiter simultanément. Les malades entrent dans l’essai l’unaprès l’autre, pendant
untemps
Tqui peut
durerplusieurs
mois. Si le critère utilisé pour comparer les deux théra-peutiques
estdisponible après
untemps depuis
le début du traitementqui
estpetit
parrapport
àT,
on commence à avoir desréponses
à un moment oùpeu de malades sont encore entrés dans l’essai. Si les différences entre les traitements à comparer sont
importantes,
ou au contraire tout à faitnégli- geable
ilparaît
souhaitable de s’enapercevoir
et d’arrêter l’essai leplus
tôt
possible.
On réalisera ainsi ungain
sur les deuxparamètres
limitantles E. T. : le nombre de
sujets
et soncorollaire,
la durée de l’essai.Si
quelques
E . T. ont effectivement étéplanifiés
selon le schémapri-
mitif deWALD,
celui-ci a été assezrapidement
abandonné pour deux rai-sons
essentielles ;
lapremière
estqu’il
est "ouvert" : si le nombre moyen desujets
nécessaire est inférieur à celui d’uneanalyse
à effectiffixé,
il sepeut
que dans un essaidéterminé,
il soit très nettementsupérieur ;
ladeuxième est
qu’il correspond
à desproblèmes
à deuxréponses.
Aussi ARMI- TAGE[5]
etquelques
autres ont-ilsproposé
des schémas fermés et à trois conclusions(A B ;
A =B ;
A >B).
La démarcheadoptée
dans tous cestests est la démarche
classique
de NEYMAN etPEARSON ;
elle estdepuis
peu sévèrement
critiquée
parquelques théoriciens,
dont COLTON[7] ,
ANSCOMBE
[3],
CORNFIELD[8], qui préfèrent
unpoint
de vueBayesien.
On s’est d’autre
part
renducompte
que la formulation"Comparaison
de deux traitements A et
B",
est absolumentinsuffisante,
en ce sensqu’elle
recouvre divers
problèmes, qu’on peut
engénéral
grouper autour de deux attitudes extrêmesqualifiées d"’explicative"
et de"pragmatique" (19, 20) .
L’ATTITUDE EXPLICATIVE ET L’ATTITUDE
PRAGMATIQUE
En attitude
explicative,
il est intéressant dupoint
de vuebiologique,
par
exemple
pour vérifier unehypothèse,
de savoir si une différence existeou non entre les deux traitements ; il est grave de la
proclamer
alorsqu’en
réalité elle est nulle
(risque
a depremière espèce);
il est, de même ennuyeux42
de ne pas déceler une différence
qui
existe réellement(risque 03B2
de deuxièmeespèce).
C’est l’attitude du chercheur delaboratoire,
pourqui
lerisque
depremière espèce
est l’élémentprépondérant ;
c’est celleexposée
dans lescours élémentaires de
méthodologie statistique.
Deux éventualités sont
cependant
à considérer en attitudeexplicative :
dans la situationbilatérale,
on teste que la différence B-A estnulle,
contrel’hypothèse
alternativequ’elle
est soitpositive,
soitnégative ;
cette situationse rencontre
quand
onignore
dequel signe
est ladifférence,
si elle existe ; trois conclusions sontpossibles (A B ;
A non différentsignificativement
de
B ; A
>B).
Dans la situationunilatérale, l’hypothèse
alternative est que la différence est d’unsigne déterminé,
parexemple positive,
laréponse
B-A 0 étant soit inintéressante, soit
exclue ;
deux conclusions sont alorspossibles (B
>A,
B nonsupérieur significativement
àA).
Nous pensons , toutefois que cette situation unilatérale est rare en attitudeexplicative ;
nous reviendrons
plus longuement
sur cepoint
auparagraphe
III.En attitude
pragmatique,
la situation est toutedifférente ;
ils’agit
de choisir le meilleur des deuxtraitements ;
il n’est aucunementgênant d’adop-
ter A ou B si A = B
(étant
entendu quel’appréciation
des résultats reposesur un bilan
global).
Par contre, il estparticulièrement
ennuyeuxd’adopter
un traitement, si c’est le moins bon
(risque
y de troisièmeespèce).
C’estl’attitude de celui
qui
doitprendre
une décision. Deux conclusions sont pos- sibles(adopter
A ouadopter B).
La distinction entre les deux attitudes est en fait bien
plus
fondamen-tale
qu’elle
neparait
aupremier abord,
car elle intervient defaçon
essen-tielle dans la définition
précise
des traitements à comparer, des malades à faire entrer dansl’essai,
des critères dejugement permettant
lacomparai-
son. Ces
points
sontcomplètement
étudiés par SCHWARTZ et FLAMANT(18).
Disons seulement ici, en ce
qui
concerne les critères dejugement, qu’en
attitudeexplicative,
on considère habituellement unpetit
nombre de critères(voire
unseul) ayant
unesignification biologique, qu’on
étudie sé-parément.
Il sepeut
donc que des différences existent pour certains critères et pas pour d’autres.En attitude
pragmatique
les critères sontgénéralement nombreux,
mais ils ne peuvent être considérésisolément, puisqu’à
la fin del’essai,
une seule décision doit êtreprise (ou
A ouB).
Onpeut
les combiner en un cri- tèreunique
par unecomparaison pondérée,
lespoids
étant fonction de l’im- portancepratique
attribuée à chacund’eux,
ce critère final étant soit quan-titatif,
soit transformé en critèrequalitatif
à deux classes que nous appe- lerons + et -.Les deux traitements sont alors
"équivalents"
ou"symétriques" (on
n’apas de raison de choisir l’un
plutôt
quel’autre)
si les moyennes ou les pour-centages
de + de ce critèreunique
sontégaux.
Il se
peut cependant qu’un
des critèresjoue
un rôle tellementimpor-
tant
qu’il
est difficile de le combiner aux autres(c’est,
parexemple
le casdu critère
survie).
Onpeut
alors axer lacomparaison
sur ce seul critèreprivilégié,
mais décider que B estéquivalent
à A s’il le surpasse d’une certainequantité h,
résumant sesavantages
et inconvénients relatifs pour la totalité des critères accessoires. Onpeut aussi,
ne pas chercher à dé- finir exactement le"point d’équivalence",
maisexprimer
ladissymétrie
desRevue de Statistique Appliquée, 1969 - vol. XVII - N° 1
deux
traitements,
par un choix convenable desrisques
d’erreur consentispar le médecin pour différentes valeurs de la différence B-A.
ORGANISATION DE L’ESSAI
Que
le critère soitquantitatif
ouqualitatif,
lessujets
sont associés parpaires,
l’un recevant A et l’autreB,
de telle manièrequ’on puisse
faire lepoint après chaque paire (voir plus loin,
la constitution de cespaires) .
Si le critère de
jugement
estquantitatif,
soit x, on considère pourchaque paire
la différence d =xB -xA.
La
statistique
intervenant dans les tests est Zd(ou
unequantité
voi-sine) ;
onpeut
doncreprésenter graphiquement
les résultats observés endessinant le "chemin" donnant la variation de M en fonction de n, nombre de
paires
entrées dans l’essai. On arrête celui-ci dès que le chemin ren-contre certaines frontières
appropriées.
Si le critère est
qualitatif
à deuxclasses,
onélimine,
comme dans le test decomparaison
depourcentages
de deux sériesappariées,
lespaires
++et -- ; pour les
paires
restantes, dites"utiles",
lacomparaison
estexpri-
mée par la différenced,
côtée + 1 si laréponse positive
a été obtenue avecB, -
1 si elle a été obtenue avec A. Lastatistique
intervenant dans les tests est encoreEd.
et le "chemin" est constitué desegments
orientés à 45°vers le haut ou vers le bas.
Si
PA
etPB désignent
lespourcentages
de + avec A et B, d estégale
à + 1 avec la
probabilité
et -1 avec la
probabilité 8A = 1 - 03B8B.
Sa moyenne est 28 B- 1,
et sa variance40B 8 A.
On voit que E d est le nombre de
paires
où le résultat avec B s’est révélé meilleur que celui avec A diminué du nombre depaires ayant
la pro-priété
inverse ; cepoint
de vue est très utile dans les cas où il est diffi- cile de classerobjectivement
les résultats en + ou -, mais où il estplus
facile de les comparer
qualitativement :
parexemple
les deux traitements étant administrés au mêmesujet (méthode
dusujet pris
comme son propretémoin),
celui-ci pourra direqu’il
apréféré
A à B. Bien entendu avec cette notion depréférence,
on nepeut plus parler
dePA
etPg.
Reste à dire un mot sur la constitution des
paires :
dansl’analyse
àeffectif
fixé, l’appariement
a pour butl’augmentation
de lapuissance
des tests ; enanalyse séquentielle,
il est nécessaire pour que la théorie reste aisée. Il est bien entenduavantageux
deprendre
comme éléments de lapaire
deuxsujets
aussi semblables quepossible
et enparticulier
de choisir le su-jet
comme son propretémoin,
si c’estpossible.
Sinon, onpeut
se baser sur des critèresjugés importants,
tels que le sexe,l’âge,
lagravité
de la ma-ladie.
Cependant
onrisque
alors de ne pasdisposer
du deuxième élément de lapaire
avant unlong temps.
Aussi laplupart
dutemps,
construit-on lespaires uniquement
selon l’ordre d’entrée dans l’essai.44
Dans les pages
qui
suivent on décrira une gamme assezlarge
de testsséquentiels qui
ont étéproposés
pour les E. T.. Certains ont essentiellementun intérêt
théorique,
d’autres ont été effectivement utilisés lors de la con-duite de tels essais, ou au moins dans le domaine industriel. ils sont tous basés sur la théorie des tests de NEYMAN et PEARSON. Les
procédés (Bayesiens
ouautres) qui
dérivent de la théorie de la décision sont actuelle- ment enplein développement.
Ils serontexposés
ultérieurement.I - PROBLEMES A DEUX CONCLUSIONS
(Attitude Pragmatique.
AttitudeExplicative,
situation
unilatérale).
A. Critère
quantitatif (1),
la variance03C32 de
la différenced = xB - xA est
connueLes
exigences
del’expérimentateur peuvent
êtreconsignées
dans le ta-bleau
général
ci-dessous :En attitude
pragmatique,
cassymétrique,
onchoisira 6. 1 et 6.0 symé-
trique
parrapport
à 0, et desrisques yo
ety1 égaux.
Si lepoint d’équiva-
lence est
h,
on choisiraDo
= h+ 6., 6. 0 = h Y 1 et Yo égaux.
En attitudeexplicative,
onprend 6. 0 = 0 ; A 1 = 0394 , Yo
= cx,risque
depremière espèce , y,
=03B2 , risque
de deuxièmeespèce,
les conclusions souhaitées étant dansce cas, B non
significativement supérieur
à A et Bsupérieur
à A.1. Test ouvert de WALD
[23]
On sait que si
L et Lo
sont les vraisemblances de l’échantillon sous6. et 03940,
on continuel’échantillonnage
tant queet on termine par la conclusion
appropriée
dèsqu’il
n’en estplus ainsi,!
et li
étant des constantesqui
donnent auxrisques
les valeurs souhaitées. Des valeursapprochées
pourlo
et1
sontCes valeurs
peuvent
s’obtenir deplusieurs
manières. Lafaçon
laplus
inté-ressante est
d’approcher
le chemin discret où les accroissements de Ed ne seproduisent
que pour des valeurs entières des abscisses par un chemin continu,représentant
un processus de WIENER.(1) dans la suite d est supposée distribuée normalement.
Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
(On rappelle
que si la variable Xdépendant
dutemps
t, suit un pro- cessus de WIENER de moyenne 4 et devariance 03C32, l’accroissement
dX pen- dant letemps
dt est une variable normale de moyenne03BC dt
et de variance03C32dt,
les accroissementspendant
des intervalles successifs étantindépendants
en
probabilité).
Ceci conduit à deux frontières
qui
sont les droitesparallèles (le
schémaest donc
"ouvert")
depente
et d’ordonnées à
l’origine
Un cas
particulier
intéressant est celui où les 2 traitementsjouent
un rôlesymétrique :
les droites sont alors horizontales etLes
propriétés
du test de WALD sontclassiques :
- la
probabilité
est un quel’échantillonnage
se termine.- le nombre de
paires nécessaire,
n, pour aboutir à une conclusion est une variablealéatoire,
dont il est facile de calculer la moyenne E(n)
en fonction de la différence03BCB - 03BCB = 03BC. E (n)
passe par un maximum pour unevaleur située entre
03940 et 03941.
Dans le caspragmatique symétrique,
le maxi-mum est atteint pour une différence
nulle ;
s’il y a unhandicap h,
le maxi-mum à lieu pour h. Ceci est tout à fait satisfaisant du
point
de vueethique (il
faut d’autant moins desujets
que les traitements différentplus).
E(n)
est trèsgénéralement
inférieur au nombre nécessaire dans uneanalyse
à effec-tif
fixé ;
- le test de WALD est celui
qui
minimise E(n)
pour des valeurs des différenceségales
à03940
et A 1.- on
peut également
déterminer la courbe d’efficacité du test ; on vé- rifie immédiatement dans le caspragmatique,
que laprobabilité d’accepter
B ou A est bien
1/2 quand
les deux traitements sont"équivalents".
Du
point
de vue de la moyenne E(n),
le test de WALDparaît
satisfai-sant : mais la variance de n étant relativement
importante,
il sepeut
que dans un essaiparticulier,
on ait besoin d’un nombre très élevé depaires.
Il y a donc une très
grande
difficulté àprévoir,
mêmeapproximativement,
combien de
temps
durera un essai. Cet inconvénientqui
est dû au caractèreouvert du test, est évidemment une
gêne pratique considérable, qui
a fait abandonner presquecomplètement
en médecine cetype
de schéma.46 2. Tests fermés
Une
façon
de remédier à l’inconvénient des tests ouverts(possibilité
d’essais très
longs)
est de décider que de toutesfaçons,
on neprendra
pasplus
de Npaires,
N étant un nombre fixé à l’avance.(a)
avec unsystème
de droitesparallèles
on obtiendrait un schéma tel que celuireprésenté
sur lafigure
1. Larègle
de décision étant la suivante :accepter
B dès que le chemin rencontre la frontièreDl
1M
1M ; accepter
A dès que le chemin rencontre la frontièreDo Mo
M. Bien entendu les droitesD o
etDo
ne sontplus
celles deWALD,
et il y a une infinité desystèmes
(Dl , Do
,M)
satisfaisant auxexigences
del’expérimentateur, parmi
les-quels
il est bien entendu extrêmement difficile de choisir.Fig. 1 Fig. 2
ANDERSON
[l]en
assimilant le processus discret à un processus con- tinu, calcule pour unsystème (Dl, Do, M, N),
laprobabilité d’accepter
letraitement B
(ou A)
et le nombre moyen depaires
nécessaire à une conclu- sion, en fonction de la différence réelle 03BCB - 03BCA. Son travail a un intérêtthéorique considérable,
mais les formulesqu’il
donne sont extraordinaire- mentcompliquées,
et pour l’instant de peu d’intérêtpratique.
Un seul cas a été étudié du
point
de vuenumérique
par GENIZI[12 ] :
c’est le cas
symétrique représenté
sur lafigure
2.On voit que le test de WALD et la méthode à effectif fixé sont des cas
particuliers
de ce modèletronqué :
la méthodeséquentielle correspond
à Ninfini et
tandis que la méthode
classique correspond
àoù
E2 Y
est la valeur de l’écart réduit relatif à unrisque
y, et c infini.Pour un N
donné,
il existe un c et unseul, qui
donne auxrisques
d’erreur les valeursfixées ;
mais onpeut prendre
pour N toute une série devaleurs ;
autrement dit il existe toute une famille de modèlespossibles , compris
entre les 2 extrêmes : méthodeséquentielle,
méthodeclassique.
La table donne pour différentes valeurs de
N,
les ccorrespondants .
Elle a été construite pour
0’2=1,
et la "limite de sécurité"(0 = 0,1 ;
y =0.05).
Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
Les valeurs sont
approximatives.
La
plus petite
valeur de N est bien celle donnée par( 2 ) 2 03C32 03942;
N estdonc
supérieur
au nombre nécessaire pour uneanalyse classique.
Dans unessai
particulier
onpeut perdre
en nombre desujets
parrapport
à la mé- thodeclassique,
mais cetteperte
est nécessairementlimitée,
contrairement à cequi
peut se passer avec les modèles"ouverts" ;
d’autrepart,
on atoutes chances
d’y
gagner.Il reste
qu’en
face d’unproblème déterminé,
il faut choisir la combi- naison’(c, N)
àutiliser ;
onpeut prendre
pour N le nombre maximum depaires qu’il
estpossible
de faire entrer dans l’essai et en déduire le c cor-respondant.
Il convient de remarquer
qu’ANDERSON
considèreégalement
des sys- tèmes de droites nonparallèles,
enparticulier
dessystèmes
de droites con-courantes, conduisant donc à un test nécessairement fermé. Ces tests pa- raissent très
intéressants,
en cequi
concerne les valeurs de E(n),
pour des différencescomprises
entreDo
et/11’
maisbeaucoup
reste à faire dupoint
de vuenumérique.
b)
Une autrefaçon
deprocéder
est due a ARMITAGE[4].
On conserve la frontière
supérieure
du test de WALD(E d
= bn +c+)
et on
remplace
la frontière inférieure par une verticale d’abscisse N,(d’où
le nom de tests "limités"
qu’on
donne à cesprocédés),
N étant déterminé de tellefaçon
que lesrisques
fixés soientpréservés (Fig. 3).
Fig. 3
La
probabilité
P(03BC, N)
que le chemin coupeD
1 avant la Npaire,
lorsque
la différenceest 03BC,
est donnée par la formule(toujours
par assimi- lation à un processuscontinu):
48
où 03A6 est
l’intégrale
de la loi normale réduite.On
peut
obtenir cetteformule,
comme casparticulier
d’une formulegénérale
d’ANDERSON(Do repoussée
àl’infini, Ml
et Mconfondus) ;
onpeut également
la démontrer directement deplusieurs façons ;
laplus
élémen-taire est sans doute celle
indiquée
par FELLER(11, chap. XIV).
On
exige
d’où deux
équations
pour calculer N. Il estcependant
facile de voir que ces 2équations
sontcompatibles (ceci
résultant du fait que lerapport
des vrai- semblancesL1/L0
vautjustement 1 - 03B31 03B30
surD1).
On
peut
donc tirer N de l’unequelconque
des deuxéquations.
ARMITAGE
[4 ]
donne une tablepermettant
de calculer Npour
diffé-rentes combinaisons des
risques y 0
etY1.
Du fait que ce test fait
jouer
un rôle tout à faitdissymétrique
aux deuxconclusions il ne
parait
intéressantqu’en
attitudeexplicative
où on conclutà la différence si
Dl
est traversée avant N, à lanon-signification
dans lecas contraire.
c)
Si dans le testprécédent,
un chemin est encore loin de la frontièresupérieure
pour un n assezproche
deN,
il n’a que très peu de chance de la rencontrer, d’où l’idée de SCHNEIDERMAN et ARMITAGE[16]
de le mo-difier pour obtenir des frontières telles que celles
représentées
sur la fi-gure
4,
conduisant à des tests dits "en coin" à cause de la forme des frontières.Fig. 4
La droite
Dl
est encore la droitesupérieure
du test deWALD,
oucelle du test
précédent,
la courbe D étant déterminée pour que lesrisques
fixés soient
(au
moinsapproximativement) préservés.
Leprocédé
décrit dans(16)
est le suivant :Supposons
que dans le test limitéprécédent
la troncature ait lieu àN 1 > N.
Alors lesrisques
d’erreur ne sontplus
évidemmentY
etYi
maisRevue de Statistique Appliquée, -1969 - vol. XVII - N° 1
deviennent
03B30’
et03B31’. y’
est bien entendusupérieur
ày ,
disonsy’
=y
+e
(e
>0),
et on a,d’après
une remarque duparagraphe précédent :
Définissons D comme le lieu des
points
m tels quesous A o
un cheminpartant
de m ait uneprobabilité
03B5’ de traverserDl
avantNi .
Alors la pro-babilité
qu’un
cheminpartant
del’origine
traverseDl
avant D est sousHo :
Comme on désire que p soit
égal
àon tire :
On
peut
donc choisir une valeurquelconque
de e’ : on en déduit e,03B3’0 =
Y
+ 03B5, etN1
par P(03940’ N1) = 03B3’0. Quand
à D, on la détermineégalement
àpartir
de la formule donnantP (03BC, N),
en ramenantl’origine
des coordonnées à m.Il est difficile de calculer exactement le deuxième
risque,
mais onpeut espérer qu’il
est très voisin de la valeur03B31 désirée.
On remarque
qu’on
a toute une famille deplans possibles
correspon- dant à des valeurs différentes de e’. Onpeut
facilement voir que la valeur minimum de e’ est 0, donnant le schéma duparagraphe b,
et que sa valeur minimum estdonnant le schéma de WALD à 2
parallèles. (Les plans
détaillésnumérique-
ment en
(16) correspondent
à 03B5’ =03B1/100).
On remarque
également
que ceplan
ressemblebeaucoup
à celui d’AN- DERSON[1]
constitué de deux droites concourantes. Sonintérêt,
par rap-port
au test limité est que E(n)
est bienentendu,
nettementplus
faible pour B-A voisin de 0. Il ne semblecependant
pas avoir étéjamais
utilisé.B. Le critère est
quantitatif,
la variance de la différence étant inconnue.Ce cas, le
plus fréquent
enpratique,
pose unproblème
nouveau, leshypothèses
testées étant en faitcomposites.
Il existe deux méthodesgéné-
rales de construction de tests
séquentiels
pour de telles situations : la pre- mière due à WALD[23]
est connue sous le nom de "théorie desWeight Functions" ;
la seconde consiste à travailler sur des fonctions convenables des observations.Tous les tests
"t-séquentiels"
concernent deshypothèses
sur les valeurs ,non des différences
absolues,
mais des différencesrapportées
à leur écart- type o.50
Exprimer
les différences en termes de o,peut
ne pasparaître toujours
satisfaisant dans lesproblèmes pragmatiques,
où ce sont leurs valeurs réellesqui
ont un sens concret.Cependant,
comme on agénéralement
avantle début de l’essai une idée de a, on
peut
àpartir
de Aintéressants,
obte-nir les 0 à faire intervenir dans la définition du schéma.
1. Tests ouverts
a. Méthode de WALD
[23]
Soit le
plan
cartésien(a, 4),
8 lepoint
courant de ceplan (fig. 5).
Si03B803B503C90,
on veutaccepter A,
si OsW1
on veutaccepter
B avec les conditions :Soient maintenant
Wo (8)
etW,
1(e)
deux distributions de0,
telles queLes w, (8)
sont donc nuls en dehors de Wi(i
=0,1).
Onpeut
les con-sidérer comme des distributions a
priori
de 0.Supposons
que nousremplacions
leproblème
du test del’hypothèse composite Ho
contrel’hypothèse composite Hl,
par leproblème
de testerque la loi a
priori
de 8 estWo
contre l’alternativequ’elle
estW1, qui
sont2
hypothèses simples (H’0
etHi).
Après
la n observation les distributions de l’échantillon sont :ou f
(d , 0)
est la loi de la variable d.Le test de
Wl
contreW. peut
donc s’obtenir àpartir
d’un test de WALD avec desrisques y’ et y’,
c’est-à-dire encomparant
lerapport L Il
aux deux limites
1 e 1 - 03B3’1 03B3’0
Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
On a
Pour
n’importe quelles
fonctionsWo (8)
etW, (8),max. y (0)
et max .Y1
(0)
sont fonctiondey’
ety’.
Onpeut donc, théoriquement,
choisir’yô
etY
de telle sorte que ces deuxmaxima
nedépassent
pas les valeursfixées.
Dans le cas
qui
nous occupe ici(test
t-séquentiel)
WALD choisit les fonctionsWu
i de lafaçon
suivante :Wo
est concentrée uniformément sur ladroite 03BC
=so6,
de mêmeW1
sur la
droite 03BC = ô o.
De
façon plus précise,
en termes de 6La distribution de l’échantillon sous
H’i
est alors :de sorte que le test cherché s’obtient en considérant le
rapport L’1/L’0
oùL’i
vautWALD montre que
y (03B8)
ety (03B8)
sont constants sur lesdroites 03BC = di6
de sorte que
03B3’ -
03B31.Finalement le test revient à comparer
L’1/L’0
aux 2 limites habituellesUne transformation
simple
del’intégrale
conduit àl’expression équivalente
où u
désigne
laquantité Ed
etHhn (x) représente l’intégrale
52 On voit donc que
RUSHTON
[14] donne
unprocédé permettant
de calculer lelogarithme
de ce
rapport.
On
peut
soit le calculer pourchaque
n et voir s’il sort deslimites ,
soit tracer les
frontières,
dans unplan où
le cheminreprésente
la variation de u = Zd/Vfd2 en
fonction de n.On obtient la
figure
6.Fig. 6
b)
Transformation des observations.(RUSHTON [14],BARNARD) Après chaque
nouvelle observationdk’
on calcule laquantité t = d sd,
où
s-
est l’estimation de la variance à n - 1degrés
deliberté ;
et onapplique
le
test
de WALD aux observations transformées t , c’est-à-direqu’à chaque étape
on compare aux deux limites :le
rapport
des fonctions de vraisemblancefi (t2, t3 ... tn/03B4i)
de l’échantillont 2, t3 ...
Cependant
lestk
n’étant passtatistiquement indépendants, (ce qui
d’ailleursn’empêche
pasl’application
du test deWALD),
ces fonctions de vraisemblanceapparaissent
comme trèscompliquées
à calculer.L’application
d’un théorèmegénéral
de COX[9] permet
unesimplifi-
cation
importante,
car ilindique
que fi
(t2, t3 ... tn/03B4i) peut
se factorisersous la forme suivante
où g est
indépendant
de[) i’
et où f est la distribution det n
sousHi,
c’est-à-dire une loi de t à n -1
d.d.l,
noncentrée,
deparamètre
de décentre-ment 03B4i.
Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
Finalement tant que
On continue
l’échantillonnage ;
on cesse avec la conclusionappropriée
dans le cas contraire.
On
peut
facilement calculerf (tn, 6)
et vérifier que lerapport
des vrai-semblances est
On voit donc que cette méthode donne un résultat
quasi-identique
à laméthode des
"Weight
Functions" deWALD,
la seule différence étant dans le suffixe de la fonction Hh(n -
1 au lieu de n -2).
DAVIES
[10]
donnequelques
tablespermettant
de tracer les frontières dans leplan (n , u). (Ces
tablespeuvent également servir,
avec les modi- ficationsappropriées
au test décrit ena).
Lepoint
leplus
intéressant est que ces frontières nepartent
pas de n =1,
mais de valeurs n o et nisupé-
rieures à 1. Autrement
dit,
il faut au moins min(no , n 1) paires
pour pou-voir
conclure, quelle
que soit la valeur des différences observées sur lespremières paires.
2. Tests fermés
Les seuls travaux concernant les tests fermés
t-séquentiels
sont ceuxde SCHNEIDERMAN et ARMITAGE
[16].
L’équivalent
fermé des tests ouvertsprécédents
s’obtient engardant
la frontière
supérieure,
et enramplaçant
la frontière inférieure par uneverticale d’abscisse
N*. Il n’y
a pas deprocédé
pour déterminerthéorique-
ment
N*.
On utilise leprocédé approximatif
suivant du à ARMITAGE.Si
No
etN
1 sont les effectifsrequis
par uneanalyse classique
d’unepart quant
la variance est connue, et d’autrepart quand
elle ne l’est pas , si N est la limite dans le test ferméquand
la variance est connue, on admet quequi
permet d’obtenirN*.
C. Le critère est
qualitatif
Nous
rappelons
que nous travaillons alors sur les"préférences".
Les
exigences
del’expérimentateur peuvent
être résumées dans le ta- bleaugénéral
suivant54
En attitude
explicative,
onprendra 03B80 = 1 2,
0 2 0 i 8 ; y o = arisque
depremière espèce, 03B31 = 03B2 risque
de 2èmeespèce,
les conclusions souhaitées étant dans ce cas, B nonsignificativement supérieur
àA,
et Bsupérieur
à A.En attitude
pragmatique,
cassymétrique,on prendra 03B80
et0, symétriques
par
rapport à 1/2 (03B80 = 1 - 03B8, 03B81 = 1
+8), 03B30 = 03B31 = 03B3.
Si le
point d’équivalence
est h =1/2,
on pourraprendre
80 =
h + 03B8,03B80 = h - 03B8 ;
mais on remarquera alors que la situation n’est pas exactementsymétrique
parrapport
à h. Enparticulier
laprobabilité d’accepter
A ou Bpour
h,
n’est pas exactement1/2. Cependant
comme elle en diffère assezpeu, on pourra se contenter de cette
approximation.
Le choix de
80
et01
pour un essai déterminé n’est pas sans poser de réelles difficultés. Nous nous contentons de renvoyer à(18)
où ceproblème
est discuté.
1. Test ouvert de WALD
On sait que les frontières sont des droites
parallèles
depente
com-mune
et d’ordonnées à
l’origine
2. Tests fermés
On pourra
appliquer
les tests vus à propos des critèresquantitatifs
de variance connue, en assimilant la distribution du nombre de
préférences E d,
à une variable normale. Onrappelle
que si e est lepourcentage
despréférences
en faveur deB,
d à pour moyenne 203B8 - 1 et pour variance48(1-8).
Par
exemple l’équivalent
du testreprésenté figure
2 est celui de lafigure
7. On voit immédiatement sur lafigure qu’on peut remplacer
lessegments M N et MoN
par NR1 et NRo,
car si le chemin coupe parexemple RIN, quelques
que soient les observationsultérieures,
il coupera nécessaire- mentR 1M
ouMN.
De
même, l’équivalent
du test I-A-2b estreprésenté figure
8. La mêmeremarque que
précédemment
conduit à un testqui
estautomatiquement
en"coin",
et très voisin des tests à deux droites concourantes d’ANDERSON.Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
Fig. 7
Fig. 8 N se. calcule à
partir
de la formuledans
laquelle
II - PROBLEMES A TROIS CONCLUSIONS
(Attitude Explicative,
situationbilatérale)
Cette attitude
correspond,
on s’en souvient, au cas où il est grave de conclure à une différencequi
n’existerait pas. D’autrepart,
il estgênant
de ne pas déceler une différence
qui
existerait dans un sens ou dans l’autre.A. Critère
quantitatif,
la variance03C32 de
d = xB - XA est connue.Les
exigences
sont résumées dans le tableau ci-dessous.1. Tests ouverts
Deux
procédés
sontpossibles :
a)
lepremier
du à SOBEL et WALD[21]
consiste à effectuer si- multanément deux testsT+
etT_
à deux conclusionschacun ; T+
testantHo
contre
H+
avec lesrisques a/2
et03B2,
etT_
testantH o
contreH-
avec lesmêmes
risques, puis
de combiner les conclusions de ces deux tests.56
b)
le deuxième consiste à testerHo
contrel’hypothèse
H :|03BCB - 03BCA|
= A. SiHo
estrejetée,
le choix entre(A B)
et(A
>B)
se faitpar
inspection
dusigne
de Z d.Nous allons maintenant
expliciter
ces deuxprocédés.
1. a. Le test
T+
conduit aux deux droitesparallèles D+
etDI,
depente 0394/2
et d’ordonnées àl’origine.
Le test
T-
conduit aux 2 droitesD-
etD’ symétriques
desprécédentes . (Fig. 9).
an
Fig. 9
On effectue les 2 tests
T +
etT-
simultanément et on arrête chacund’eux, indépendamment
de l’autre, dès que l’une de ses frontières est ren-contrée.
Considérant un chemin
quelconque,
ceci revient à combiner en un testTunique,
les deux tests de lafaçon
suivante :- on conclut A = B
(différence
nonsignificative)
dès que le che-min a rencontré les deux droites
D’+
etD’..
C’est le cas notamment des che-mins
représentés
sur lafigure.
- on conclut B > A dès que le chemin a rencontré
D +
et D- on conclut A > B dès que le chemin a rencontré
D’+ et D_ .
Il
s’agit
maintenant de montrer que le test T ainsi construitrépond
bienaux
exigences
fixées.Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
Appelons P+ (s/T+)
etPo (6/T+)
lesprobabilités
de conclureH + et Ho
avec le test
T+, quand
la moyenne de la différence à la valeur6; P_ (8/T
1et
Po (8/T_)
d’unepart, P+ (,5/T), Po (Ô/T), P (Ô/T)
del’autre,
ont desdéfinitions
analogues.
On a
d’abord, puisque
T à laprobabilité
1 de se terminerP+ (8/T)
+Po (Ô/T)
+P_ (Ô/T) =
1.Ensuite il est clair
d’après
la définition du test T, queP+ (8/T) P+ (s/T+)
et que de même P(6/T) =
P-(8/T_),
de sorte queP+ (8/T.,)
+Po (8/T)
+P_ (03B4/T) =
1.Pour ô = 0,
soit
Le
risque
depremière espèce
du test T est donc bien a.soit
la
première
de cesquantités
est laprobabilité
de conclure A =B,
si B >A ,
la deuxième est laprobabilité
de conclureA > B, quand
B > A.La
quantité 03B2
est donc la somme desrisques
de deuxième et troisièmeespèce
du test T.1. b. Pour tester
H
contreH : |03BCB - 03BCA| = 0394 ,
ondispose
apriori
dedeux méthodes.
(i). Assigner,
laprobabilité
apriori 1/2
à chacune deshypothèses H +
etH- (méthode
des"Weight
Functions" deWALD,
décrite en I-B-1a).
La vraisemblance sous H est alors L =
1/2 (L_
+L+)
dont lerapport
àL doit
êtrecomparé
àchaque étape
aux deux constantes(L_, LOI L+ désignent
la vraisemblance sousH_, Ho’ H+).
On vérifie immédiatement que
On obtient des frontières du
type représenté
sur lafigure
10.On continue l’essai tant que le
point (n, E d)
tombe à l’intérieur de lazone définie par les frontières. En
particulier,
il n’est pasimpossible (bien
que très peu
probable)
que le chemin saute d’un couloir àl’autre,
cequi
n’entraîne pas un arrêt de l’essai.58
(ii). Travailler,
nonplus
en termes deE d,
mais en termes dec’est-à-dire
remplacer
les observationsdi , d 2 ...
par les observations transforméesy1, Y2 ... auxquelles
onapplique
la théoriegénérale
de WALD .Les yi ne sont pas
indépendants,
mais il est facile de montrer que la distribution f des ypeut
s’écrire.où h est
indépendant
duparamètre
6.Le test revient donc à comparer à
le
rapport
y
étant le carré d’une variable normale de variance n62 et
de moyennenô,
n
nCr2
est sousHo
unX 2
à 1degré
deliberté,
et sous H unx2 non
centré avec leparamètre
de décentrementn0394 03C3.
Il est alors facile de vérifier que g
(yn/0394)/g (y
estégal
à la quan-tité
L/L 0du paragraphe (i) précédent.
Ainsi donc les
procédés (i)
et(ii)
conduisent exactement au même test : le deuxièmeparaît
toutefois d’uneprésentation plus intéressante,
les"Weight
Functions"
ayant toujours
unaspect
un peu arbitraire.Dans ce
test,?
est laprobabilité
de conclureH0 quand |03BCB - 03BCA| = 0394 ,
c’est donc strictement le
risque
de deuxièmeespèce,
et il a unesignifica-
tion
légèrement
différentedu j3
du test(a).
Revue de Statistique Appliquée, 1969 - vol. XVII - N° 1
1.c.
Comparaison
des tests(a)
et(b).
Les frontières extérieures sont extrêmement voisines : en effet la su-
périeure
est définie paret par
Comme au
voisinage
de cettefrontière, L-
estnégligeable
devantL+ ,
les deux définitions se confondent.
La différence est
plus importante
pour les frontières intérieures.Quant
auxpropriétés
des deux tests, enparticulier,
le nombre moyend’observations,
elles semblent trèsproches :
aussi utilise-t-on presque exclu- sivement lepremier,
car il al’avantage pratique
considérable de conduire à des frontièreslinéaires,
immédiatement calculables.2. Tests fermés
Seules ont été considérées les variantes fermées du test II-A-la.
a)
Tests "limités" d’ARMITAGE[4].
On conserve les frontières linéaires extérieures D + et D-, et on rem-
place
les droites intérieures par une verticale d’abscisse N, calculée pour que lesrisques
voulus soientpréservés (fig. 11).
Fig. 11
Ceci revient à combiner par le
procédé
de WALD - SOBEL 2 tests à deuxréponses,
définis en I-A-2b. Il suffit donc d’utiliser les formulesqui
sont données à ce
paragraphe,
en faisantLe