R EVUE DE STATISTIQUE APPLIQUÉE
W. G. C OCHRAN
Analyse des classifications d’ordre
Revue de statistique appliquée, tome 14, n
o2 (1966), p. 5-17
<
http://www.numdam.org/item?id=RSA_1966__14_2_5_0>
© Société française de statistique, 1966, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
ANALYSE DES CLASSIFICATIONS D’ORDRE
W. G. COCHRAN
Professeur de Statistique, Harvard University, U.S.A.
Quand
lesdonnées
ont laforme d’une classification
pardegrés,
il est souventraisonnable
deconsidérer que
la clas-si f icat ion représente
uneespèce
degroupement
d’uneéchelle
demesurage
continue. Onpeut
doncassténer à chaque
classeun numéro, qui exprime
notreconcept
de laposition
de la classe dansl’échelle.
Cesnuméros créent
une variablequi
suit unedistribution discrète,
etpermet
1 ’anal yse desdonnées
au moyen desméthodes développées
pour les distributionsdiscrètes et,
comme
approximation,
par lesméthodes
communes pour les di s-tri but ions
continues.L’avantage
de ceprocédé
est que lesméthodes d’anaLyse
des variables
discrètes
et continues sontplus flexibles
etpui ssan tes que lesméthodes qu’on apourlesdonnées qualitatives.
L’exposé
enprésente plusieurs
illustrations.Undésavantaéeest
que le
procédé
estplus
ou moinssubjectif.
Mais on trouve que desdifférences modérées
entre les variablesassignées par deux
investigateurs font généralement
peu dedifférence
dans lesconclusions.
L’étude décrit plusieurs méthodes
moinssubjectives qui ont été ut t 1 t sés
pour construi re lesnuméros :
comparaison avec une mesure cont inuequ’on considère plus précise, usage
d’unepopulation
standard danslaquelle
la variableassociée
a unedistribution normale,
et construct iond’uneéchelle qui
aura cer- tainespropriétés désirées
et raisonnables.Enfin, il y
a deuxmé thodes object i ves - laméthode
mnxim inde Abelson et
Tukey,
et unX2
test de Bartholomew en utili- sant le test durapport
des vraisemblances. Cettedernière
me- thode ne construit pas une variablediscrète,
mais sembleêtre puissante
s i le bu t del’analyse
est un test designification.
1 - INTRODUCTION
Les méthodes
statistiques
sont bienadaptées
pourl’analyse
de deuxespèces
d’observations. Enpremier lieu,
on trouve les méthodes fondéessur la distribution
binomiale, qui
servent pour les observations classées dans l’une ou l’autre de deuxcatégories,
comme parexemple
lesobjets approuvés
ourejetés
dans uneinspection.
Pour les caractèresquantita- tifs,
comme la résistanceélectrique
d’unfil,
il y a les méthodes déve-loppées d’après
la loi normale deGauss-Laplace - l’analyse
devariance ,
larégression,
etc.Revue de Statistique Appliquée 1966 - Vol. XIV - N° 2
6
Quelquefois, cependant,
les données ont la forme d’une classifica- tion pardegrés, peut-être
pardegrés
degravité
ou depréférence.
Parexemple,
onpourrait
décrire les défauts trouvés dans un article comme :mineur, majeur
oucritique.
Il est évident que dans cetteclassification,
un défaut
critique
estplus
gravequ’un
défautmajeur,
et un défaut ma-jeur
estplus
gravequ’un
défaut mineur. Demême,
dans uneenquête
sur les accidents
industriels,
onpourrait
décrire ledegré
depréjudice
subi par un individu comme
léger, modéré,
sévère ou fatal. Dans uneenquête
demarché,
une maison de commerce donne deux articles de toilette A et B àchaque ménagère prise
dans un échantillon.Après
unepériode d’usage, chaque ménagère exprime
sapréférence
en choisissantune des
cinq
classes :préfère
nettementA, préfère A, indifférente , préfère B, préfère
nettement B.Jusqu’à présent,
les méthodes lesplus
efficaces pourl’analyse
desobservations de cette
espèce
n’ont pas été étudiées à fond. Je veux d’abord exposer uneméthode, simple
et assezancienne, qui
suffit enpratique
pour
beaucoup
deproblèmes.
Dans les sections 5 et6, je
décrisplu-
sieurs
approches
alternatives.Ma
première
illustrationprovient
d’uneexpérience
surl’usage
desmédicaments dans le traitement des
lépreux.
Au débutde. l’ expérience ,
il y avait deux
types
demalades,
A et B. Au cours del’expérience, qui
dura
presqu’un
an, les deuxtypes reçevaient
le même traitement médical.A la
fin,
unexpert
de lalèpre
a examinésoigneusement chaque
malade.Il a noté le
progrès
du maladependant l’année,
et l’a classé dans unedes
cinq catégories
montrées dans la Table 1. La classe laplus
favo-rable est
"Amélioration importante",
tandis que"Aggravation" représente
la situation la moins favorable.
Table 1
Deux groupes de
lépreux,
classés suivant ledegré
d’améliorationConclusion : Pas de différence entre les deux groupes.
La Table 1 à
gauche
donne les résultats. Le but del’analyse
estde déterminer s’il y a une différence entre les
degrés
moyens d’amé- lioration montrés par les deuxtypes
de malades.2 - L’EMPLOI DE
X2
Le
procédé
leplus
connu pour testerl’hypothèse
que les deux dis-Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
7
tributions A et B sont les
mêmes,
àl’exception
des erreurs d’échantil-lonnage,
est le testX2,
@ ou :La somme s’étend sur les 10 cellules de la Table 1
(5 lignes
et2
colonnes).
Les nombresthéoriques
sont les nombres de maladesqu’on
trouverait si les deux distributions étaient réellement les mêmes. Par
exemple,
on attendrait(18) (144)/196 =
13. 0 malades detype
A avecamélioration
importante.
La valeur de
X2
est6. 88,
avec 4 d.d.l. Sil’hypothèse
nulle estvraie,
laprobabilité
d’obtenir une valeur deX2
aussigrande
est 0. 16.Selon le test
X 2,
on dirait que lesdistributions,
et parconséquent
lesdegrés
moyensd’amélioration,
ne sont pas différents entre A et B.Mais le
X2
test n’est pasapproprié
dans ce cas, car le test nespécifie
pas unehypothèse
alternativeparticulière,
et ne tient pascompte
du fait que nous avons une classification par
degrés
degravité.
Si onchange
l’ordre des classes dans Table1,
la valeur deX2
reste la même.La classification
représente
une tentative de mesure de laquantité
d’amé- lioration dechaque
malade. Notrehypothèse
alternative est que, enmoyenne, le
degré
deprogrès
diffère entre les deuxtypes
A et B. Sicette
hypothèse
alternative est vraie, nous nous attendons à trouver que les malades d’untype
montrent uneplus grande proportion
de cas classés"Amélioration importante"
ou"Amélioration moyenne"
et uneplus petite proportion
classée"Amélioration nulle"
ou"Aggravation".
La Table
1,
àdroite,
donne cesproportions.
Notez que letype
Bcontient 43
%
de malades dans les deux meilleuresclasses,
contre 27%
pour le
type
A. Dans les deux classesqui
neprésentent
pas d’amélio-ration,
letype
B contient 27%
demalades,
et letype
A 45%.
Ces ré- sultatssuggèrent
que les malades detype
B ont faitplus
deprogrès
que ceux
de type
A.3 - VARIABLES ASSOCIEES
La méthode que
je
veux exposer se base sur lepoint
de vue que1/
si les instruments de mesure étaient assezbons,
onpourrait
mesurer le
progrès
dechaque
malade sur une échellecontinue,
2/
la classification faite parl’expert représente
uneespèce
degroupement
de cette échelle continue en 5 classes.De ce
point
de vue, il semble raisonnabled’assigner
àchaque
classe un
numéro, qui exprime
notreconcept
de laposition
de la classe dans l’échelle. Ces numéros créent unevariable,
associée à la classi-fication,
etqui
suit une distribution discrète.Ayant
construit la variableassociée,
onpeut analyser
les données au moyen des méthodesdévelop- pées
pour les distributions discrètes. Il n’est pas nécessaire de faireune
hypothèse,
peuréaliste,
quel’expert
agroupé
sans erreurs. Enpratique,
il y aura des cas où la mesure idéaleplacerait
le malade dans la deuxièmecatégorie,
mais oùl’expert
l’aplacé
dans lapremière.
Enanglais,
les numérosqui produisent
lavariable
associées’appellent gé-
néralement
"scores".
Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
8
Comment
assigner
les numéros ? Cecidépend
de l’informationqu’on
a concernant la construction desclasses,
etégalement
des butsde
l’enquête.
Cettequestion
sera discutéeplus
tard. Dansl’exemple
étudié
actuellement, j’ai
affecté le numéro 0 à la classe"Amélioration nulle",
et les numéros 1 et 2 aux classes"Amélioration faible"
et"Amélioration moyenne", puisque l’expert
semblait considérer ces classescomme
également séparées.
Mapremière
idée étaitd’assigner
le nu-méro
4
à la classe"Amélioration importante"
et le numéro-2
à laclasse
"Aggravation",
parce quel’expert
a examiné un maladeplus
soi-gneusement
etplus longtemps
avant de laplacer
dans une de ces deuxclasses extrêmes. Mais
j’ai
décidé que,peut-être,
ceci n’étaitqu’une impression subjective,
etj’ai
donné les numéros 3 et -1.Lorsque
les numéros sontassignés,
on a deux échantillons de la variable associée. On teste lasignification
de la différence entre les moyennes des deux échantillons par le test t de Student. La Table 2 contient lecalcul,
lesymbole
xreprésentant
la variable associée. La méthode est la méthode élémentaired’application
du test t. La valeur de t est2, 616,
avec uneprobabilité
un peu moindrequ’une
chance surcent. On
peut
donc en conclure que les malades detype
B ontfait,
en moyenne,plus
deprogrès
que ceux detype
A.Table 2
Analyse
avec variables associéesConclusion : le
Groupe
B montreplus d’amélioration,
en moyenne, que leGroupe
A.Ce calcul s’étend facilement à la
comparaison
deplus
de deuxgroupes
A, B, C, D,
... On fait d’abord un test F(test
deSnedecor)
de
l’hypothèse
nulle que les moyennes de tous les groupes sontégales..
Si le test montre
qu’il
y a desdifférences,
onpeut
ensuite faire des tests tplus
détaillés. Si les groupesreprésentent
des niveaux croissantsRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
9
de
quelque ingrédient,
onpeut
obtenir la courbe derégression
de lamoyenne de
chaque
groupe sur les niveaux. Parexemple,
onpourrait préparer quatre plats
de pommes de terre, contenantquatre quantités
différentes de sel.Chaque sujet goûte
tous lesplats
et les classe :"Beaucoup trop
desel", "Trop
desel", "Assez
desel"
etc. Le but est d’obtenir la relation entre laquantité
de sel et laréponse
dusujet.
On
peut
avoir une double classificationrangée
pardegrés.
Si onétudie la relation entre les conditions de travail des ouvriers dans une
usine et la
qualité
de leurproduction,
les conditions sont classées parexemple
commesupérieure, satisfaisante, mauvaise,
et laqualité
commeexcellente, bonne,
pauvre. Dans ce cas onassigne
deux variables as-sociées,
y et x.L’analyse
de données de cetteespèce
a étéprésentée
par Yates
(1948) [8].
Dans certains cas il y aplus
d’intérêt à comparer la variabilité des groupesqu’à
comparer leurs moyennes.L’exemple
dans la Table 3 est tiré des résultats d’une ancienne
enquête
conduitedans les écoles de Londres. On a
essayé
de classer selon leur intelli- gence cent garçons et cent fillespris
dans les mêmes écoles.Table 3
Intelligence
des élèves à LondresLa table ne
suggère
pas une différence entre ledegré
moyen d’in-telligence
des garçons et celui des filles. Mais il semble que les filles sont moins variables entre elles que les garçons. Notez que 58%
des filles ontl’intelligence
moyenne, contre 48%
des garçons.Si on
peut assigner
une variable associée aux classesd’intelligence ,
on
peut
calculer la variance de la mesured’intelligence
pour les garçons et pour les filles. Avec les numéros quej’ai donnés,
on trouves; =
76. 9(garçons) : sf =
62. 4(filles).
La valeur de F est76. 9/62. = 1, 23,
avec 99 et 99 d.d.l.
Puisque
cette valeur n’est passignificative
auniveau 5
%
deprobabilité,
la variabilitésupérieure qu’on
constate pour les garçonspeut
êtreexpliquée
par les erreursd’échantillonnage.
4 -
CRITIQUE
DE LA METHODEComme nous venons de le
voir,
la construction d’une variable as-sociée a
plusieurs avantages.
Ellepermet l’emploi
de testsqui
sontplus puissants
que le testX2,
parcequ’on peut
les utiliser pour tester letype particulier d’hypothèse
alternativequ’on
attend dans les observa- tions. En outre, onpeut,
parexemple,
examiner si la différence moyenneRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
10
entre le groupe A et le groupe B vaut deux fois la différence moyenne entre le groupe B et le groupe
C,
cequi
n’est paspossible
avec uneanalyse qualitative.
Plusgénéralement,
la méthode est une tentative d’ob- tenir laplupart
desavantages
d’une échelle continue de mesure.La
critique principale
est, bienentendu,
que leprocédé
est arbi-traire. Deux
investigateurs peuvent assigner
des numéros différents à la même classification. Mais on trouve que dans lamajorité
des cas, des différences modérées entre les numérosassignés produisent
peu de dif- férence entre les conclusionsqu’on
tire del’analyse.
Parexemple,
dansla Table 1
j’ai
calculé le test t avec la série de numéros4, 2, 1,
0, -2 quej’avais
d’abord considérée. La valeur det
devient2.46,
avecP =
0. 015,
contre t =2, 62,
P = 0. 009produit
par la série alternative3, 2, 1, 0,
-1. Les deuxanalyses
mènent à la même conclusion.Néanmoins,
il y aquelquefois
degrandes
difficultés avec les classes extrêmes. Aux Etats-Unis on a menébeaucoup d’enquêtes
sur ledegré
dedommage
souffert par les personnes dans les accidents d’au- tomobiles. Les classes dedommage
sont, parexemple, mineur, modéré , sévère,
rendantincapable,
et fatal. Commentassigner
des numéros auxclasses : rendant
incapable
etfatal,
afin de lesplacer
dans la mêmeéchelle que les autres classes ? De même, un défaut dans une
pièce mécanique,
tel que la machine ne marche pas, semble être d’un autredegré
que celui du défautqui, quoique gênant, permet
à la machine de fonctionner. Dans ces cas, la difficultépeut provenir
du fait que la clas- sification nereprésente
pas une seule échelle. Il fautpeut-être
deux outrois variables pour décrire assez exactement la classification.
La variable associée a une distribution discrète non normale : en
effet,
elle estquelquefois
assezdissymétrique.
Peut-on vraimentemployer
les méthodes standard fondées sur la distribution
normale,
comme le test t et le test F ? Pour examiner cettequestion
dans des cassimples,
on
peut
calculer la distribution exacte det
et deF
par la méthode de"randomization"
de Fisher. A monavis,
enpratique,
les méthodes nor-males suffisent
généralement,
étant entendu que le niveau 5pour-cent
det
ou de F trouvé par ces méthodes n’a pas uneprobabilité
exactementégale
à 5%.
Ilcorrespond, peut-être,
à un niveau entre 4 et 7pour-cent.
Il faut noter aussi deux
points :
1/
Les variancespeuvent
différer d’un groupe àl’autre, spéciale-
ment
quand
les distributions sont biaisées. Si onprépare
des pommes de terre avecbeaucoup
desel,
ilpeut
arriver que tous lessujets
les classifient comme"Beaucoup trop
desel",
et la variance estnulle,
tandis
qu’un plat
contenant moins de selpeut
recevoir tous lesdegrés
de la classification.
Aussi,
avant de combiner les variances pour obtenirune seule
estimation,
il est sage de vérifier que les variances ne dif- fèrent pas, et il fautfréquemment
utiliser des méthodesd’analyse qui
n’assument pas
l’égalité
des variances.2/
Avec des échantillons trèspetits,
c’est-à-dire contenant moins de 20unités, je suggère l’emploi
d’une correction de continuité dans le testt,
afin de tenircompte
du fait que nous avons une distribution dis- crète.5 - AUTRES METHODES POUR CONSTRUIRE LES VARIABLES ASSOCIEES
Jusqu’à présent j’ai
donné une seuleméthode, principalement
sub-Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
11
jective,
pourassigner
les numéros. Enfait,
différentsinvestigateurs
ont utiliséplusieurs méthodes,
moinssubjectives,
pour construire les va- riables associées. Il n’existe pasbeaucoup
decomparaisons
entre lesméthodes,
de manièrequ’on
nepeut juger
de leursavantages
et dé-savantages
relatifs.Mais, puisque
lechamp d’application
diffère d’une méthode àl’autre,
le manque decomparaison
n’est pastrop gênant.
Jevais décrire brièvement
quelques-unes
de ces méthodes.5. 1 -
Comparaison
au moyen de mesuresplus précises.
Quelquefois
il estpossible
de comparer la classification pardegrés
de
gravité
avec une autre mesure du même caractèrequ’on
considèrecomme étant
plus
exacte. Cettepossibilité
existequand
la classificationreprésente
une méthode de mesurerapide
et bonmarché,
tandis que la méthodeplus
exacte est coûteuse. Parexemple,
un observateurqui
marche autour d’un arbre
peut rapidement
classer ledommage
causé auxfruits par les
insectes,
commenul, léger, modéré,
sévère. D’autrepart,
onpeut
cueillir le fruit dans un échantillon d’arbres et mesurerle
pourcentage
de fruits"gâtés
outouchés"
surchaque
arbre de l’échan- tillon parl’inspection
des fruits individuels. Onpeut
donc examiner si la classificationcorrespond
à ungroupement
des arbres selon le pour-centage
de fruits touchés. Sioui,
onpeut assigner
àchaque classe,
comme variable
associée,
la moyenne despourcentages
pour les arbresqui
tombent dans cette classe. S’il y aplusieurs observateurs,
il estpossible :
1/
de comparer laprécision
de différentsobservateurs,
2/
d’examiner si onpeut
utiliser la même variable associée pour tous les observateurs.5. 2 -
Usage
d’unepopulation
standard.Quand
on étudie des échantillonsqui proviennent
depopulations
dif-férentes,
ilpeut
exister unepopulation
standard àlaquelle
on désirecomparer les autres
populations.
Lapopulation
standardpeut repré-
senter la méthode habituelle utilisée pour
fabriquer
unarticle,
les autrespopulations représentant
deschangements
de méthode.Supposons :
1/
que nous avons ungrand
échantillon tiré de lapopulation
stan-dard,
2/ qu’il
est raisonnable d’admettre que si le caractèrepouvait
êtremesuré exactement, il aurait
approximativement
une distribution nor-male dans la
population
standard.Dès
lors,
dans lapopulation
standard onregarde
la classificationcomme un
groupement
de la distribution normale avec moyenne zéro etécart-type
1. Onpeut
facilement déterminer les bornes dechaque
classedans l’échelle normale. La variable associée est la moyenne de la dis- tribution normale entre ces bornes. Cette méthode est ancienne : le sta- tisticien Karl Pearson
l’employait beaucoup.
Pour illustrer les
calculs j’ai
utilisé les données de la Table1,
en combinant les deux groupes de malades pour construire une"population
standard"
artificielle. La Table 4 donne les détails.Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
12
Table 4
Illustration de la méthode de K. Pearson
On cumule d’abord les
pourcentages
dans les classes.Ensuite,
on trouveles
bornes,
en usant la table de la distribution normale cumulative. Parexemple,
la table normale montre que 9%
de la distribution reste entre u = - etu - -1, 34.
La moyenne de u entre les bornes a etb
est[Z(a) - Z(b)]/P,
ouZ(a)
etZ(b)
sont les ordonnées de ladistribution
pour u = a et u = b.
Enfin, j’ai ajouté
0. 9 àchaque
valeur de la varia- bleassociée,
de manière que la valeur devienne zéro pour la classe"Amélioration nulle".
Dans cetexemple,
la variable associée diffère peu de la variable initialement utilisée dans la Table 1.Dans une version alternative de cette
méthode,
due à Bross(1958), [5] la
variable associée est laprobabilité
cumulativejusqu’au
milieu dela classe. Les
propriétés
de la méthode de Bross,qui
évite toute sup-position
denormalité,
sont décrites dans la référence donnée[5] .
5. 3 - Construction d’une échelle
qui
aura certainespropriétés
dé-sirées.
Plusieurs
investigateurs
ontsuggéré
cetteapproche.
Dansl’appli-
cation décrite par
Ipsen (1955) [6]
une série de niveauxZi , Z2
1Z3 - - -
d’un certain traitement ont été
appliqués
auxsujets, chaque sujet
rece-vant un seul niveau. Plus
tard,
lessujets
sont classés dans des caté-gories
ordonnéesqui expriment
ledegré
de succès du traitement.Ayant assigné
une variable associée x à laclassification,
onpeut
calculer la moyenneXi
pour tous lessujets qui
ont reçu le niveauZi.
Onpeut
pen-ser que la variable
Xi
doit avoir une relation linéaire avec la variableZj.
Ipsen
détermine la valeur xjqu’on
donne à laclasse j
de manière que le variance due à larégression
linéaire entre lesXi
et lesZi
contiennela
proportion
maximum de la variance totale de x entre lessujets.
La solution est très
simple.
La valeur de xassignée
à laclasse j
est la moyenne des valeurs de
Zi
pour lessujets qui
tombent dans cette classe. Donc, la méthode est presque la même que celle décrite dans la section 5.1,
si on considère le variable Z comme la mesure laplus
exacte. La Table 5
présente
unexemple
donné parIpsen.
La variable Zreprésente
le niveau d’immunisation contre letyphus,
et lesclasses
A, B, C, D,
F sont lesdegrés
degravité
dethyphus.
Les moyennesZ,
dans la
partie
inférieure de latable,
sont les valeurs de la variable as-sociée. Dans la dernière
ligne, Ipsen
a transformé les valeurs de ma-nière que leurs bornes soient 0 et 100.
Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
13
Table 5Degré
degravité
de la maladie de 71 malades atteints detyphus,
classésselon le niveau d’immunisation
Niveau d’immunisation Nombre de malades
(z) Degré
degravité
dutyphus
Fisher
(1947) [7]
a décrit une autreapplication
du mêmetype.
Chacun des douze serums a été
injecté
dans le sang de chacun des douzesujets.
On amarqué
les réàctions dessujets
par lessymboles
-,?, faible,
J(+), et ++(1 ), qui
forment une classificationrangée
pardegré
deforce ou de
puissance.
On sait que la force de réaction doit différer entre les sérums et aussi entre lessujets.
Dèslors,
Fisher aassigné
lesvaleurs
0,
x2, X3, x4, et 1 aux différentesclasses,
et a déterminé les valeurs de x2, X3, et x4qui
rendent maximum lerapport
de la sommedes carrés entre séra et
sujets
à la somme totale des carrés dans l’ana-lyse
de la variance. Ici, le calcul n’est pas sisimple :
il faut trouverles racines
caractéristiques
d’un déterminant.6 - DEUX METHODES OBJECTIVES 6 . 1 - La méthode
"maximin".
Toutes les méthodes
précédentes supposent,
eneffet,
que le cher- cheur connaît un peuplus
que l’ordresimple
des classes. Parexemple,
avec les
lépreux, j’ai jugé
que la distance entre les classes"Amélioration
nulle" et"Amélioration faible"
estapproximativement
la même que la distance entre"Amélioration faible"
et"Amélioration moyenne".
Au contraire, la méthode maximin de Abelson et
Tukey (1963, 1959) [ 2] [1]
est une méthodeobjective qui
suppose seulement cequ’on
connaît réellement concernant l’ordre des classes. Ces auteurs suppo- sent
qu’il
y a une variable associée xj, vraie mais inconnue’, pour la-quelle xi x2 ,
X3 ... Ils excluent le cas X = x2 = X3 ... ; c’est-à-direqu’il
y a au moins uneinégalité.
Si y est la variablequ’on analyse (par exemple, proportion
delépreux
dans le groupeA),
la relation laplus simple
entreYj
et Xj esty = a +
03B2x
+ e---
(1) Le symbole (?) indique une réaction probablement faible.
Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
14
où la
variable e
est une variable de moyennenulle,
de varianceCY 2
@ lacovariance entre ei et ej
(i F j)
étant nulle. Pour examiner siyj change
d’une
façon
monotonequand Xj change,
il fautestimer p.
Puisque xj
est inconnu, on construit une variable associéeci .
Onpeut
avoir la conventionZCj =
0. Le numérateur du coefficient de ré-gression
dey.
parrapport
à Cj est c = ECj Yj.
On en déduit :Si on veut tester la
quantité
c, pour découvrirsi 03B2 ~ 0,
lapuissance
du test est déterminée par
E(c)/V(c).
Le
premier
terme del’expression
à droite nedépend
pas du choix desci,
Le second terme est le coefficient de corrélation r entreCj
etXj.
On. veut donc rendre r maximum.
Il y a une infinité de valeurs de xj satisfaisant les relations x1 X2 1 x3 , , . Pour
chaque
choix des ci , onpeut
déterminer les xiqui rendent r
minimum. Abelson etTukey
recommandent l’utilisation des cj pourlesquelles
leminimum r
est maximum. Ainsi le nom"maximin".
Pour 2
jusqu’à
8classes,
la Table 6 donne les valeurs des"maximin" cj (ajustées
pour que les valeurs centrales soient-1,
0, et 1.Table 6
Valeurs des maximins
ci
et de r2L’échelle
cj
n’est pas une fonction linéaire dej.
Elle diffère d’une échelle linéaire en ce que les valeursextrême sont beaucoup plus grandes.
Pour n =8,
parexemple,
une échellelinéaire
aurait lesvaleurs -7,
-5, -3, -1, 1,3,
5, 7, tandis que lesCj sont -20. 8, -6.4, -3. 2,
-1,1, 3. 2, 6. 4,
20. 8. Eneffet,
les auteurs notentqu’une
échelleRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
15
qu’ils appellent "linéaire-2 -4"
est une bonneapproximation
des maximin c .Pour construire le
"linéaire-2 -4",
on commence avec une échelle li-néaire,
et onmultiplie
les valeurs extrêmes par4,
et les valeurs voi- sines par 2. Pour n =8,
ceci donne-28, -10, -3, 1, 1, 3, 10,
28.La valeur du maximin r2 est
0,510,
et pour le linéaire-2 -4 la valeur minimum de r2 est0, 493, (valeurs
données en dessous de la Table6).
Si le lecteur n’a pas la table des
cj,
les auteursremarquent qu’il peut employer
l’échelle linéaire-2-4.Les auteurs ont montré que les valeurs les
plus
défavorables de la vraie échelleXj (les
valeursqui
donnent les minimar2)
sont del’espèce 0, 1, 1, 1, ...
ou0, 0, 1, 1,
1 : c’est-à-dire les valeursqui
ont une seuleinégalité.
En dessous de la Table 6 on trouveégalement
les r2minimum donnés par une variable associée
qui
est linéaire enj.
Pourn
5,
ces r2 sont notablementplus petits
que les r2 maximin. Si uneéchelle comme la linéaire-2-4 semble un peu bizarre au
lecteur,
il fautremarquer que la méthode de Abelson et
Tukey
fûtdéveloppée
pour le chercheurqui
ne connaît rien deplus
que x1,X2 X3 ...
La méthode s’étend à d’autres
types
d’information initiale. Parexemple,
les auteurs construisent les cj dans unexemple
avec 6classes,
où on sait quemais où on ne connaît pas la relation entre x4 et x 21 X3. On
peut éga-
lement utiliser la méthode
quand
on saitquelque
chose sur les distancesentre les
xj,
mais les détails pour ce cas n’ont pas encore étépubliés.
6. 2 - Un
X2
test alternatif.Dans cette
méthode,
due à Bartholomew(1961, 1959) [4], [3],
lesconditions sont les mêmes que pour la méthode maximin. Pour les membres de l’échantillon
qui
tombent dans la classej,
la variablequ’on analyse peut
être ou uneproportion p
ou la moyenneYj
d’une variablecontinue. On suppose que
E(pJ = x
j(ou E(yj) = x ),
les xjreprésen-
tant l’échelle vraie mais inconnue. Le
problème posé
par Bartholomew est de testerl’hypothèse
nulle xl =x2 - x3 -
... contre l’alternative Xix2 x3
...Il construit un test par le critère du
rapport
des vraisemblances . Pour illustrer cetteméthode,
dans le casle plus simple
où’7 Yi
est lamoyenne de nj observations
normales,
avec a2 connu, nous avons :où L
représente
la vraisemblance. Pourl’hypothèse
nulle(H.
N.), Xj =
x,et L est maximum
lorsque
x =y = 03A3 njyj /Zn .
Donc :Pour l’alternative
(H.A.),
il faut choisir lesxj qui
rendent Lmaximum, compte
tenu des relationsLa solution
dépend
de l’ordre desyj.
SiRevue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
16
en accord avec
l’alternative,
la solution est clairementXj = yj,
de ma-nière que
Dans ce cas, le critère pour tester est,
ignorant
le2 a2,
Mais supposons, avec 3
classes,
queBartholomew montre que la solution pour maximiser la H. A. est
Ainsi
Dans les cas
plus compliqués,
il donne lesrègles simples
pour trouver la solution et ensuite le critère. Engénéral,
on combine les valeurs desyj
voisins pourproduire
une série de valeursqui
s’accordent avecl’hy- pothèse
alternative. Le testexige
des tablesspéciales,
décrites dans la référence 1959[3].
Bartholomew
(1961) [4]
acomparé
lapuissance
de son test aveccelle due à la méthode maximin. Bien
entendu,
sapuissance
relative dé-pend
des valeurs des vraisXj.
Ni l’une ni l’autre des méthodes n’estsupérieure
sur toute l’étendue des alternatives. Mais dans les cas lesplus
défavorables aux maximin cj, le test de Bartholomew gagne maté- riellement s’il y aplus
dequatre
classes. La raison semble êtrequi
lecritère du
rapport
des vraisemblancess’adapte
à la nature vraie del’alternative,
tandis que les cj restent fixes pour un nombre donné de clas-ses. La conclusion
pratique
est que :1/
si on sait seulement que x1 x2 x3 ... et2/
si le but est un test designification,
le test de Bartholomew semble êtrepréférable.
Comme la méthode
maximin,
ce test s’étend :1/
aux cas danslesquels
l’information sur l’ordre estincomplète ;
par
exemple,
si on sait que x4 est leplus grand,
mais l’ordre des X1, x2, X3, estinconnu,
2/
aux cas où l’on a une certaine informationimprécise
sur lesdistances entre les
Xj (ces
résultats ne sont pas encorepubliés).
J’ai
préparé
cetarticle,
à la demande du ProfesseurVessereau,
pour une des Réunions d’Etudes sur les
applications
de lastatistique
dansles
entreprises,
autemps
ouj’étais
Professeur à l’Institute de Statis-tique
sur invitation du ProfesseurDugué
de l’Institut. Je désire remer-cier le Professeur
Dugué,
le Professeur Vessereau et leurscollègues
pour la
généreuse hospitalité
aveclaquelle
ils m’ont accueilli.Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2
17
REFERENCES[1]
ABELSON R. P. and TUKEY J. W.(1959) -
Efficient conversion of nonmetric information into metric information. Proc. Social Statist.Section,
Amer. Statist.Assoc.,
226-230.[2]
ABELSON R. P. and TUKEY J. W.(1963) -
Efficient utilization of non- numerical information inquantitative analysis.
Ann. Math.Statist., 34,
1347-1369.[3]
BARTHOLOMEW D. J.(1959) -
A test ofhomogeneity for ordered
al- ternatives.Biometrika, 46,
36-48 and 328-335.[4]
BARTHOLOMEW D. J.(1961) -
A test ofhomogeneity
of means underrestricted alternatives. Jour.
Roy.
Statist. Soc.B, 23,
239-281.[5]
BROSS I. D.(1958) -
How to use Riditanalysis. Biometrics, 13,
18-38.[6]
IPSEN J.(1955) - Appropriate
scores inbio-assays using
death times and survivorsymptoms.
[7]
FISHER R. A.(1947) -
Les MéthodesStatistiques.
Presses Universi- taires de France. Sections 49.2 et 49.3.[8]
YATES F.(1948) -
Theanalysis
ofcontingency
tables withgroupings
based on
quantitative
characters.Revue de Statistique Appliquée 1966 - Vol. XIV - N’ 2