M ATHÉMATIQUES ET SCIENCES HUMAINES
A. A STIÉ
Comparaisons par paires et problèmes de classement.
Estimation et tests statistiques
Mathématiques et sciences humaines, tome 32 (1970), p. 17-44
<http://www.numdam.org/item?id=MSH_1970__32__17_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1970, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
COMPARAISONS PAR PAIRES ET PROBLÈMES DE CLASSEMENT
ESTIMATION ET TESTS STATISTIQUES
par A.
ASTIÉ
*Cet article
traite,
dupoint
de vue des testsstatistiques,
de l’un des modèlesclassiques
de lacomparaison
par
paires.
Pour unpoint
de vue trèsdifférent,
maiscomplémentaire,
on pourra lire J.Marschak, « Binary
choice constraints », in
Arrow,
Karlin etSuppes (eds.),
Mathematical methods in socialsciences, Stanford University Press,
1960.G. Th. G.
I. INTRODUCTION
Dans la méthode des
comparaisons
parpaires,
desobjets
sontprésentés
parpaire
à un ouplusieurs juges.
Quand
une «paire » d’objets
estprésentée
à unjuge
il doit choisir celui des deuxqu’il préfère;
nous supposerons ici
qu’il
ne lui est paspermis
de les déclarerégaux (mais
cette éventualité peut êtreenvisagée,
cf. parexemple, Singh
etThompson (1968)
et Rao etKupper ( 1967)).
A
partir
d’un ensemble de nobjets,
on peut comparer certaines ou toutes les n(n - 1) paires
possibles (ceci
seral’expérience
de base dont on fera éventuellement desrépétitions).
L’ensemble decomparaisons
ainsi obtenu nous donne une relation binaire sur l’ensemble desobjets:
nousl’appellerons
relation de
comparaison.
Une relation de
comparaison
estplus générale qu’un
classement(car l’objet
a peut êtrepréféré
à
b,
bpréféré
à c et cpréféré
àa).
L’existence de ces incohérences peut être due à différentesraisons,
parexemple
au faitqu’il
existeplusieurs
critères de classement.Le
problème
sera donc: àpartir
d’un ensemble decomparaison
parpaires,
peut-on en déduire que la relation decomparaison sous-jacente
est une relation d’ordre ?(y
a-t-il « assez peu » d’incohé-rences pour cela
?).
En dehors de son intérêt
pratique (il
estparfois impossible
de comparer autrement lesobjets),
l’intérêt
théorique
de la méthode descomparaisons
parpaires
par rapport à une méthode de classement* Laboratoire de Statistique, Faculté des Sciences, Toulouse.
direct des
objets
par lejuge
sera donc de faireapparaître
éventuellement des incohérences permettant ainsi de contester l’existence d’un classement(ou plus
exactement de contester que lejuge
a fait sonchoix en accord avec un
classement).
Nous ne
présenterons
pas ici unexposé
exhaustif sur les méthodes decomparaisons
parpaires.
Les idées fondamentales
proviennent
de Kendall et Smith(1940),
Slater(1961), Thompson
etRemage (1964), Bradley
etTerry (1952);
on trouvera ici unesynthèse
de ces diverspoints
de vueprésentée
demanière à former un ensemble cohérent.
Nous essaierons essentiellement de faire
apparaître
les rapportsqui
relient entre elles cesméthodes,
ainsi que leur différences et éventuellement leurs faiblesses.Notons que ce
problème
peut êtrerapproché
desproblèmes d’agrégation
despréférences
indivi-duelles
(effet Condorcet)
essentiellement étudiés parGuilbaud,
et dontMonjardet (1968)
a fait unebibliographie
récente. Si ces deux sortes deproblèmes
diffèrent dans leurs fondements(il
nes’agit
pas du même type dedonnées),
il est toutefois intéressant de lesrapprocher
au niveau destechniques
derésolution
(nous
en verrons unexemple
avecl’algorithme
de E.Jacquet-Lagrèze).
II.
GÉNÉRALITÉS 1) Définitions
et notationsSoit: X = xi, ..., xn un ensemble de n
objets.
Nous définissons une relation de
comparaison
comme étant une relation binaire Rpossédant
lespropriétés :
(i)
non-réflexivité:(x, x) e R;
(ii) anti-symétrie: (x, y)
e R P(y, x) e
R.Cette relation est
complète
si ellepossède
en outre lapropriété:
Une relation de
comparaison
est une relation d’ordre strictRo
si ellepossède
enplus
la transitivité:Si la relation de
comparaison
estcomplète,
l’ordre strict est total.Nous
représenterons
la relation binaire R sur X par legraphe simple
G =(X, R)
dont R estl’ensemble des arcs.
Si R est une relation de
comparaison,
G =(X, R)
est ungraphe simple
orienté(anti-symétrie)
etsans boucle
(non-réflexivité) ;
si deplus
il estcomplet,
il serafréquemment appelé graphe
de tournoi.Nous noterons : Su = { _
(X, R) 1
R est une relation decomparaison complète
surX },
c’est-à-dire Q est l’ensemble des
graphes
de tournoi à n sommets.2 (121)
nNous avons:
S2o
est l’ensemble desgraphes
sans circuit de Q.Nous dirons que = 1, ...,
n ; j
=1,
..., n est la matrice associée à G =(X, R)
si:on a donc: au = 0
quel
que soit i =1,
..., n.Les définitions et
propriétés
de théorie desgraphes
sontempruntées
àBerge (1958).
2)
Modèleprobabiliste
Soit: n
(n - 1)
variables aléatoiresAij (i, j
=1,
...,n ; i
=~j)
a deux valeurspossibles
0 et 1:Les v.a.
Aij (i j)
sontsupposées indépendantes
etAil
+Ali
= 1.On pose:
Soit G =
(X, R)
legraphe
aléatoire à valeurs dans S~ de matrice associée A= 11 Aij
La loi de
probabilité
de G(c.a.d.
la loiconjointe
des v.a.dépend
desparamètres
1Cii:en
notant ! ! 1
la matrice associée à G.Remarquons
que G* E S~(de
matrice associéea ~)
sera tel que, pour tout G EQ, Pr (G*) > Pr (G)
si,
et seulement si :a)
= 1 dès que > 1tjl,.Soit:
nous noterons aussi Q*
(7t),
- si 7ril
:01pour
2 P tout~ ~ J)~ i ’
G* est déterminé de manièreunique
c.a.d.1 fi* 1
- 1 ;- s’il existe
i ’ )
tel que 1ttj q ~~ ~~ =- I 2
on eut P Prendre
indifféremmentaij
il = 0 oua~.
il = 1 ;~.a.d.,
s’ily a k couples
non ordonnés(i, j),
tels queNous nous intéresserons aux
graphes
G* commereprésentant
la relation decomparaison
sous-jacente
auxcomparaisons
observées.En
particulier
si:0* n S~4 ~ ~ (c.a.d.
3G*
ES~* ~
relation decomparaison sous-jacente
est une relation d’ordre strict total
R*
donnée parG*
=(X, Rô).
Le
problème
sera donc de déterminerG~
et de savoirquelle
confiance on pourra accorder auclassement ainsi obtenu.
Dans certains cas, on sera amené à introduire des
hypothèses supplémentaires,
c’est le cas desmodèles à valeurs
intrinsèques:
on suppose quechaque objet xi
a une valeurintrinsèque
1tt, 1ttj étantune fonction de 7ri et n f.
Les modèles usuels sont de la forme:
où H est une fonction non décroissante variant de 0 à 1 et telle que : .H
(- x)
-f - H(x)
= 1 pour tout x, 1est
équivalent
à 7tt > 7ti.2
Donc la relation d’ordre
RÓ
définieprécédemment, correspond
bien au classement desobjets
par ordre décroissant de leurs valeurs 7t1.
Il est clair que ---. H - est une
hypothèse plus
forte que celle selonlaquelle
la relation decomparaison
est une relation d’ordre.3)
Tests designification
On peut considérer le
problème
de test comme sedécomposant
en deuxétapes:
Test I
Éprouver
l’existence d’une relation d’ordre surX,
c’est-à-dire testerHA
contreHi
avec:Test II
c.a.d. tester
Hg
contreHl 2 (nous
sommes dans le cas: Q* n0) :
Montrons que les deux écritures de
Hô
sontéquivalentes:
Prenons pour
Go
l’ordre inverse deGo (c.a.d. Ro n Rô
=0) ; Go E
Q*donc, :
donc:
et ceci
quel
que soit i etj.
La
réciproque
est évidente.Mais en
pratique,
on ne fera que le test II carl’hypothèse
est unehypothèse composite
peumaniable,
alors queH5
est unehypothèse simple.
Cela
signifie qu’on
admet apriori, qu’il n’y
a que deux éventualités : lescomparaisons
sonteffectuées « au hasard », ou en accord avec un classement.
A titre
d’exemple, précisons
la structure deshypothèses
pour n = 3 :l’espace paramétrique
est le cube de côté 1: II 7t --(~1~,
Les
plans
Notons :
divisent le cube C en 8 cubes de côté
Nous noterons :
Il y a
correspondance biunivoque
entreCk
et G définie par:où:
si
H° acceptée :
III. COMPARAISONS
COMPLÈTES (sans répétition)
Le
résultat d’uneexpérience
est ungraphe
observéG, appartenant
àS2 ,
de matrice associée:On se propose de tester
(test
II del’introduction) H5
contreHi .
Nous pouvons
interpréter
ceshypothèses
de la manière suivante :H5:
legraphe
aléatoire G est uniformémentréparti
dans Q :Hi :
G n’est pas uniformémentréparti
dans n et une de ses valeurs modalesappartient
à.00:
On doit choisir une
région critique
contenue dans Q. Si legraphe
observé Gappartient
àRe,
on
rejettera H3,
c’est-à-direqu’on
acceptera l’existence d’une relation d’ordre sur X.Le
problème
est de choisirRc.
Il semble naturel de
prendre Do
contenu dansRe:
eneffet,
iln’y
a pas de raison de favorisera
priori
certains classements.Ensuite on
complétera Re
par les éléments de S2 « lesplus proches
» de0, (en
un sensqui
seraprécisé ultérieurement)
de manière à avoirPr (Rc H~)
= oc(oc
étant le seuil designification
choisi pour letest).
On voit
apparaître
ici unedifficulté
duproblème.
Alors que, pour le choix de la
région critique,
tous les éléments deQo jouent
le mêmerôle, lorsque
nous accepterons
.H’i
nous conclurons à l’existence d’une relation d’ordre sur X:R*,
non nécessairementunique, correspondant
àG*
E0* n ~o.
R~
étant une relation d’ordre surX,
notons(xi,,
..., le classementqui
luicorrespond.
Puisque G* appartient
à, le
graphe
de00
telque
-. le classementqui
luicorrespond
est :donc:
or,
GQ
etGo jouent
le même rôle au niveau du choix deRc.
La
puissance
du test étant :et le seuil étant:
nous voyons que si:
par contre:
et pour certaines valeurs de 7t, il sera
possible
d’avoir:c’est-à-dire que le test sera biaisé.
On obtient des
régions critiques
différentes suivant lafaçon
dont on définira la « distance » d’ungraphe
G à00.
1)
Test de Kendall et SmithOn définira l’écart d’incohérence de G =
(X, R)
et G’ ----(X, R’)
appartenant à S~ par:où: o
tijk
est défini de manièreanalogue
pour R’.L’écart de G à une
partie
(ù de Q sera:en
particulier:
est le nombre de circuits de
longueurs
3 de G(en effet,
si G’ EQo,
= 0 pour tout(i, j, k)). Remarquions
que pour cet
écart,
ungraphe
G appartenant à 0 est «équidistant »
de toutGo
appartenant à00.
On vérifie que:
Posons:
Nous
prendrons
donc commerégion critique no
et lesgraphes
lesplus proches
deQo (au
sens del’écart
ci-dessus),
u étant le
plus grand
entierpositif
ou nul vérifiant :Si
En
est la variable aléatoireégale
au nombre de circuits delongueur
3 dugraphe
aléatoire Gsur n sommets, ceci s’écrit:
Des tables donnant la distribution de
En
sousH5
ont été établies par Kendall et Smith(1940)
pour 3 _ n _ 7 et par
Alway (1962)
pour8 n
10.On montre de
plus
que sousH5:
et ’
converge en loi vers une variable normale réduitelorsque
n tend vers l’infini.Soit G le
graphe observé,
de matriceassociée 11
Posons si sera le score observé de xi.
si n est
impair
si n est
pair
e
(G, 00)
est donc aisémentcalculable, puisque
c’est une fonction des si, doncsi,
pour legraphe
observé
G,
on a e(G, 00) ~
u, onrejettera H2
et on admettraqu’il
existe une relation d’ordre sur X.2)
Test de SlaterOn définira la distance 1 entre deux
graphes
G et G’ E 0 par:où
et la distance d’un
graphe
G E il à unepartie
6) c Q.en
particulier
nous aurons :On a:
Posons:
Nous
prendrons
larégion critique:
où v est le
plus grand
entierpositif
ou nul vérifiant :Au
graphe
aléatoire(à n sommets) G,
nous associerons la variable aléatoireD~
= d(G, Do)
etnous écrirons:
Avec les résultats de Reid
(1969),
on voit que, pour tout n >__ 2 on a:si n est
pair
si n est
impair
Si n >
8,
on a même:si n est
pair
si n est
impair
Slater donne des tables de la distribution de
Dn
pour2 n
8 et0 __
8.Remage
etThompson (1966)
donnent unalgorithme
deprogrammation dynamique qui
permet de déterminer l’ensemble desgraphes Go
ES2o
telsque d (G, Go)
= d(G,
on en déduit immédia-tement la valeur observée de
Un,
c’est-à-dire d(G,
Si d
(G, Qo) x
v, onrejettera Hô
et on admettra l’existence d’une relation d’ordre surX,
donnéepar:
- -
elle n’est pas
unique puisqu’il
peut y avoirplusieurs graphes Go qui
vérifient cela.3)
Conclusion sur les méthodes de Kendall et de Slater-
Lorsque
nousrejettons H2,
nous admettons l’existence d’une relation d’ordre sur X.- Dans le cas du test de
Slater,
nous obtenons directement la relation d’ordre(Go
tel que:d
(G, Go)
== d(G, qui
n’est pas nécessairementunique.
- Par contre, pour le test de
Kendall,
le test neparticularise
aucun élément deS2a (e (G, Go)
=e
(G,
VGo E (0).
Il semble
cependant logique d’adopter
un classement par ordre décroissant des scoresSi :
Posons:
T est d’autant
plus grand
que les scoresSi
sontplus éloignés
de cette valeur moyenne Or il est facile de montrer queLa
région critique
du test de Kendallcorrespond
auxpetites
valeurs deEn,
donc auxgrandes
valeurs de T. Cela montre que le test de Kendall conduit à
rejeter H2
si les scores sont suffisammentdispersés
autour de la moyenneExemples
Pour
Gl :
t123 = 1 et = 0 pour tout(i, j, k)
~(1, 2, 3),
donc:(il
suffit de renverser unquelconque
des 3 arcsx2); (x2, x3); (x3, xi)
pour obtenir ungraphe
sanscircuit).
(il
suffit de renverser l’arc(x5, x1)
pour avoir ungraphe
sanscircuit).
On a d
(Gl, 00)
= d(G2, Qo),
doncG,
etG2
seront traités de manièreanalogue
par le test deSlater.
Par contre, e
(G2, S2o)
> e(Gl, S2o) donc,
suivant le seuilchoisi,
nous pouvons être amené àrejeter H2 lorsque G1
est observé alorsqu’on
accepteH2
avecG,.
Remarquons
que dans les deux cas, le classement(xi,
x2, X3, X4,X.)
est un classement par ordre décroissant des scoresqui
est en désaccord avec:tel que tel que
En notant
si(J),
i = 1, ...,n ~ j
=1, 2 ?
le score de xicorrespondant
àGi.
Alors que la méthode de Slater ne considère que le nombre d’arcs à intervertir pour arriver à
un
graphe transitif,
la méthode de Kendallpondère
les arcs à intervertir d’autantplus
lourdementque les extrémités de ces arcs ont des scores
plus
différents.Remarquons
que, d’une manièregénérale,
si legraphe
observé G est tel que:(x2, Xj)
E R etsl > SI, le fait de
remplacer
l’arc(xi, Xj)
par (xi,xi)
diminuede sj
- si -E- 1 le nombre de circuits delongueur
3 dugraphe.
4)
Unegénéralisation
de la méthode de Slater au cas decomparaisons complètes
avecrépétitions
Soient
G1, G2,
..., lesgraphes
fournis par mjuges,
ce sont les valeurs observées de mgraphes
aléatoires
indépendants
et distribués comme G.Soit I atjle Illa
matrice associée àGk (k
= 1,2,
...,m).
Dans le cas d’une observation
(m
=1),
la méthode de Slater conduisait à déterminerGo
E00
Ici il faudra déterminer
Go
EQo qui
soit leplus proche
simultanément de Parexemple,
nous pouvonsprendre
legraphe Go e S2o qui
minimise:en notant
Il
aijoIl ]
la matriceassociée"à
idonc :
donc
Go
=(X, Ro)
défini de cette manière minimise le nombre depréférences
observéesqui
sont endésaccord avec l’ordre
Ro.
Remarque.
Pour la détermination
pratique
deRo,
on pourra utiliserl’algorithme proposé
par E.Jacquet- Lagrèze, algorithme
permettantd’échanger
lesobjets i et j
dans une matrice carrée en suivant le critèremaximum
(puisque
si, -f - sj, .- m, maximum estéquivalent
àminimum).
IV. CAS
GÉNÉRAL
mij
répétitions
de lacomparaison
de lapaire (xi, Xj) (mi1
>0).
Pour
chaque couple (i, j)
on a un échantillon de m~~ v.a.indépendantes
et distribuées commeA~~.
On les notera: k =
1, 2,
..., mij.La vraisemblance de l’échantillon
global
sera:posons:
Remarquons
que:1)
Estimation d’un classementSi nous estimons les
paramètres
par la méthode du maximum devraisemblance,
sans aucunehypothèse
sur leursvaleurs,
nous trouvons:Ceci nous définit
0* (1t) () = G
{ E01 1 7tH > 1
a -1
et toutgraphe
de S2 *(7t)
est une2 g p
()
estimation du maximum de vraisemblance de la relation de
comparaison représentée
par G* E Q*.Mais il est évident que les
graphes
de Q*(n)
ainsi obtenusn’appartiennent
pas nécessairement àQo (ils
peuvent comporter descircuits).
Nous allons donc
admettre,
apriori, l’hypothèse
que nous avons notéHÔ: 0* n 00 =f:. 0 (en
faiton a
déjà
vuqu’on
admettoujours
cettehypothèse
apriori
car elle n’est pas facile àtester).
Et sous
l’hypothèse H01
nous allons estimer lesparamètres
7tH par la méthode du maximum devraisemblance,
nous noterons1rij
leurs estimations.Parmi les
graphes
de Q* il y en aura au moins un appartenant à00 (puisque S2o ~ ~ )
Notons II
l’espace paramétrique
de dimensionL’estimation 1r de 7r est définie par:
où: o
S~~
S~a
est alors l’ensemble des classements estimés par la méthode du maximum de vraisemblance.où: O
est maximum pour = Montrons que:
- si ~c E il est évident que
1c:ij
_Tcij
pour tout(i, j) ;
- si fc EE
lY~,
puisque
etG
ef2,,
il existe(i, j)
tel que(Xi,
eR
et(xi, R,
c’est-à-dire il existe(i, j) :
Nous pouvons
représenter
sur untableau,
les variations de la fonction uij1 Il est clair que si >__
-,
on a :2
donc:
-7r est défini par:
ceci
équivaut
à:Or:
les termes de la somme tels que
nij
=1tij
vontdisparaître,
il va rester:Or: o
en
remplaçant sij
par et ui f 1 Donc:1
or:
I1 Log à,;
+hj; Log £j,
est pourà,j
=£j;
=§,
donc laquantité
u;;or:
Log 1cti
-f -TeJi Log 1tji
est mmmum pour ----7’rji
== 2, 2 donc laquantité
uijd’autant
plus petite
que mij estpetit
et1r:ij
voisin deCette méthode nous conduira donc à inverser en
priorité,
des arcs deG
E .0* pourlesquels
un
petit
nombre decomparaisons
avaient été faites ou pourlesquels:
Cas
particulier :
mil = 1 pour tout(i, j).
On a:
et Q*
(ft)
_ {G } graphe
observé.On a alors:
Or 1t est défini par:
donc: O
Donc ici l’estimation du
classement, qui
est donnée par l’ensemble desgraphes
de Q*(7£’) n Qo
est :On retrouve donc les classements obtenus par la méthode de Slater.
Remarque
Dans le cas où mi, = m pour tout
(i, j),
De Cani(1969)
utilise des méthodes deprogrammation
linéaire pour déterminer l’estimation du maximum de vraisemblance des classements.
2)
Test basé sur le rapport de vraisemblanceComme nous l’avons vu dans
l’introduction,
nous admettons apriori l’hypothèse Hô:
Q* nQo =F 0
et nous effectuons le test de
H5
contreHi :
1
Le rapport de vraisemblance est:
donc:
notons:
c’est-à-dire pour tout :
Cela
permet
desimplifier X :
La
région critique Re correspond
auxpetites
valeurs de À:Si mii = m: la
région critique correspond
à:La méthode de De Cani
(1969)
permettant de déterminern,
nous donneraJ,
donc cettequantité
est calculable.
C devra être déterminé en fonction du seuil oc de manière à avoir:
Ceci n’est pas facile à
manier, cependant
il seratoujours possible d’approcher
C par des méthodes de simulation.Si mij = 1 :
on retrouve le test de Slater.
V.
MODÈLES
A VALEURSINTRINSÈQUES
Nous supposerons a
priori
quechaque objet
xi a une valeurintrinsèque
7ri(1 ~
in).
Les seront alors définis en fonction
des 7ri
suivant les modèles choisis.Il est difficile de
justifier
apriori
une formeparticulière
de mais le minimum que doit vérifierun modèle est que =
f(1ti,
soit une fonction non décroissante en 7Ci et non croissante en n~.Les modèles
qui
ont été considérés sont engénéral
de la forme : = H-1ti)
où H est unefonction non décroissante variant de 0 à 1 et telle que H
(- x)
-f - H(x)
=1, quel
que soit x.Ce modèle vérifie les conditions minima ci-dessus.
a)
Modèle de Scheffé :qui
nous donne:b)
Modèle de Thurstone-Mosteller(ou
distributionnormale):
c)
Modèle deBradley-Terry.
Il est basé surl’idée,
intuitivementséduisante,
que le rapport:comme + = 1, cela revient à poser:
Remarquons
que ceci se ramène à la formegénérale
ci-dessus en posant:on a:
en posant:
Nous allons étudier ce dernier modèle.
1)
Le modèle deBradley-Terry
On a mij
répétitions
de lacomparaison x~).
On
impose
les conditions :La vraisemblance s’écrit à
présent:
où:
où:
constitue une
statistique
exhaustive pour(’7tl’
..., 9»n).
Les
équations
du maximum de vraisemblance sont:Ces
équations
ne se résolvent passimplement,
on trouvera dans Ford(1957)
un processus itératif pour le calcul des1tï.
2) Étude
du classement par les scoresOn a vu que, dans le cas du modèle de
Bradley-Terry,
le vecteur score(Si, S,,
...,Sn)
constitueune
statistique
exhaustive pour lesparamètres
du modèle.Limitons-nous au cas: mij = m pour tout
(i, j).
-En
pratique,
on utilisefréquemment
dans ce cas un classement par les scores. Classer par les scores, c’est admettreimplicitement
que les scores contiennent toutel’information,
c’est-à-direqu’ils
constituent une
statistique
exhaustive pour lesparamètres
Montrons que: la condition nécessaire et suffisante pour que
(Sl, ..., S~)
constitue unestatistique
exhaustive pour les
paramètres
estqu’il
existe des valeurs 1tl’ ..., 1tn telles que:Seule,
la condition nécessaire reste à démontrer.Démontrons d’abord que si
(S,,
..., est unestatistique exhaustive,
la vraisemblance nedépend
que des scores:
(S,,
...,S.)
étant unestatistique
exhaustive: L(a, 1t)
= y(s, 7t)
,~(a) (où
y est une fonctionqui
ne
dépend
de a que par le vecteur score s =(s,,..., sn)
et k est une fonction de aqui
nedépend
pas de7r).
Donc la vraisemblance ne
dépend
de a que par l’intermédiaire des scores.Soient
Gi, G2,
...,Gm
lesgraphes
observés et supposons que(xl,
xk, soit un circuit deGl,
c’est-à-dire :
Soit
&~
legraphe
obtenu enchangeant
l’orientation de ce circuit:Nous noterons L
(a,7t)
la vraisemblance deGi, G2,
...,Gm
et L(a’, 1t),
la vraisemblance deIl est évident que les scores n’ont pas été altérés par le
changement
d’orientation du circuit delongueur
3 Xk,xr).
posons:
donc:
On a donc démontré que si les scores constituent une
statistique exhaustive,
il existe 7rll 7r2l ...1 1tn tels que se mette sous la forme:Remarque
Il est facile de se ramener à E 7tl == 1 en posant:
on aura:
Remarquons
que le classement obtenu en estimant les 7ri par le maximum devraisemblance,
est le même que le classement par les scores.
En
effet,
leséquations
du maximum de vraisemblance donnent:d’où:
est strictement
positif.
Cela montre que:
Buhlmann et Huber
(1963)
démontrent que le modèle deBradley-Terry
est le seulqui
soit telque le
procédé
de classement par les scores minimise uniformément lerisque (parmi
lesprocédés
declassement invariants par
permutation)
pour toute fonction de perte « raisonnable ».En
conclusion,
dans le cas où mij = m pour tout(i, j) :
a)
le modèle deBradley-Terry
donne un classementidentique
au classement par les scores;b)
les scores contiennent toute l’information sur les 1tij(c’est-à-dire
constituent unestatistique exhaustive)
si et seulement si le modèle deBradley-Terry
est vrai:Il semble donc
qu’adopter
un classement par les scores comme étant un bonclassement,
enparticulier
dans ce sensqu’il
tient compte de toute l’informationdisponible,
est enquelque
sorteéqui-
valent à admettre que les 1’Cij
s’expriment
selon leshypothèses
deBradley-Terry.
3)
Tests designification
pour le modèle deBradley-Terry
L’hypothèse
de base du modèle deBradley-Terry
est que, pour tout(i, j),
1’Cij peut s’écrire sous la forme :C’est donc cette
hypothèse
que nouséprouverons
enpremier
lieu:Nous pouvons
rapprocher
ce test du test I. Eneffet,
nous avons vu dans l’introduction queH3
cH’;
donc si ce test nous conduit à accepter nous auronsaccepté H~,
mais lerejet
de n’im-plique
pas derejet
deHô.
Le test sera basé sur le rapport de vraisemblance:
où:
La
région critique,
de la forme~,1 CI
s’écrira donc:On montre que, si pour tout
(i, j)
mij = m, - 2Log À1
converge enloi, lorsque
m tend versl’infini,
vers unZ2 àn) - n + 1 degrés
de liberté.
2
Test II
L’hypothèse
ypot eseH2
0: 7rij ?1
== - v V(1, j) s’écrit à présent: (i, j )
S ecrt a present. . ni 1ti1 ,
== -- V L.2 n
Test basé sur le rapport de vraisemblance:
on
rejette H’
siÀ2 C2
c’est-à-dire BI~2
avec:Dans le cas mij == m pour tout
~i, j), Bradley
etTerry (1952)
donnent des tables de la distribution de B sousH5
et montrent quelorsque m
tend versl’infini,
- 2Log À2
converge en loi versun x2
àn - 1
degrés
de liberté.Remarque
On peut aussi utiliser tout test
équivalent
dutype x2
à laplace
du rapport des vraisemblances.VI. CONCLUSION
Nous avons laissé de côté le
problème posé
par le test 1 del’hypothèse HA
contreHl.
Il est facile de montrer
qu’un
test basé sur le rapport de vraisemblanceconduit,
dans le casparticulier
den
2comparaisons
sansrépétition,
à unerégion critique
de la forme : D > C(où
D estla
statistique
utilisée dans le test de Slater: D = d(G, £20».
Si oc est le seuil de
signification
choisi pour le test, C doit être déterminé par:Pr [D
>C 1
a.La difficulté
provient
du fait queHA
est unehypothèse composite.
Dans les méthodes d’estimation et de test
exposées
nous avonstoujours admis,
faute de savoirfacilement la tester,
l’hypothèse Jf~.
Que signifie l’hypothèse H~ ?
Cette
hypothèse qui,
dans le cas decomparaisons complètes
sansrépétition,
seraitacceptée
pour les
grandes
valeurs de D = d(G, (0), signifie
que toute relation decomparaison
R* définie par(xc,
E R* dès que> 1
n’est pas une relationd’ordre, puisqu’elle
n’est pas transitive(tout graphe
2
de ~2* contient au moins un circuit de
longueur
3: x~,xk).).
Nous pouvons alors essayer
d’expliquer
l’existence de ces circuits par le fait que la relation decomparaison
peut être le résultat de la combinaison deplusieurs
relations d’ordre surX,
corres-pondant
aux différents critères de choixemployés
par lejuge.
Prenons un
exemple :
X x2, x~,x4 }.
Supposons qu’il
existe trois relations d’ordre surX, correspondant
à trois critères différents:Si on admet que le
juge,
comparant lapaire (xi,
fait son choix de manière à être en accordavec la
majorité
des critères(c’est-à-dire qu’il préférera xi à xl
si xifigure
avant xj dans au moins deux des troisclassements):
Le
graphe
observé G =(X, R)
ci-dessus contient des circuits bien que les choix dujuge
soientparfaitement logiques. (Il s’agit
de l’effet Condorcet dont on trouvera une étude détaillée dans Guilbaud(1968).)
Les
problèmes qui
se poseront seront alors: si la relation decomparaison
observée contient« trop » de circuits pour être assimilable à une relation
d’ordre,
peut-on en déduirequ’elle
est le résultatde la combinaison de
plusieurs
relations d’ordre ? Comment les déterminer ?Notons enfin que
Hayashi (1964)
aenvisagé
desproblèmes
de ce genre: àpartir
d’un ensemble decomparaisons
parpaires,
il étudie larépartition
desobjets
dans un espace, dont il détermine la dimen-sion,
de manière à ce que les coordonnées despoints
sur chacun des axesreprésentent
le classement desobjets
selon un des critères.BIBLIOGRAPHIE
BARBUT
M.,
"Note sur les ordres totaux à distance minimum d’une relation binairedonnée",
Math.Sci.
hum.,
n°17,
1966.BARBUT
M.,
et MONJARDETB.,
Ordre etclassification,
tomes 1 et2, Paris, Hachette,
1970.BERGE
C.,
Théorie desgraphes
et sesapplications, Dunod,
1958.BRADLEY and
TERRY,
"The rankanalysis
ofincomplete
blocksdesigns, I,
the method ofpaired comparisons", Biometrika, 39,
pp.324-45,
1952.BRADLEY, "Incomplete
block rankanalysis :
On theappropriateness
of the model for a method ofpaired comparisons", Biometrics, 10,
n°3,
1954.BRUNK,
"Mathematical models forranking
frompaired comparisons",
J. am. statist.Ass., 55,
pp. 50320,
1960.BUHLMANN and
HUBER,
"Pairwisecomparison
andranking
intournaments",
Ann. math.Statist., 34,
n°
2,
p.501,
1963.DAVID,
The methodof paired comparisons,
Griffin’s statisticalmonographs,
1963.DE CANI
J. S.,
"Maximum likelihoodpaired comparison ranking by
linearpxogramming", Biometrika, 56, 3,
pp.537-545,
1969.FORD,
"Solution of aranking problem
frombinary comparisons",
Amer. math.Month., 64,
pp.28-33,
1957.GUILBAUD G.
Th., Éléments
de la théoriemathématique
desjeux, (Monographies
de rechercheopéra-
tionnelle n°
9), Dunod,
1968.HAYASHI,
"Multidimensionalquantification
of the data obtainedby
the method ofpaired comparison",
Ann. Inst. statist.
Math., 16,
pp.231-245,
1964.JACQUET-LAGRÈZE E., "L’agrégation
desopinions individuelles", Informatique
en Scienceshumaines,
n°
4,
1969.KADANE,
"Someequivalence
classes inpaired comparisons",
Ann. math.Statist., 37,
n°2,
1966.KENDALL M. G. and BABINGTON
SMITH,
"On the method ofpaired comparisons", Biometrika, 31,
pp.
324-345,
1940.KENDALL M.
G.,
"Further contributions to thetheory
ofpaired comparisons", Biometrics, 11,
n°1,
pp.
43-62,
1955.MONJARDET
B.,
"Probabilité de l’effetCondorcet",
Math. Sci.hum.,
n°23,
1968.MOON, Tropics
on tournaments,Holt,
NewYork,
1968.RAO and
KUPPER,
"Ties inpaired comparisons experiments :
Ageneralization
of theBradley-Terry model",
J. amer. statist.Ass., 62,
n°317,
1967.REID,
"On sets of arcscontaining
nocycles
in atournament",
Bull. canad.Math., 12,
n°3,
pp.261-264,
1969.
RUSSEL REMAGE and
THOMPSON,
"Maximum likelihoodpaired comparisons ranking", Biometrika, 53,
nos 1 et2,
p.143,
1966.SINGH J. and
THOMPSON,
"A treatment of ties inpaired comparisons",
Ann. math.Statist., 39,
pp. 2002-15,
1968.SLATER,
"Inconsistencies in a schedule ofpaired comparisons", Biometrika, 48,
nos 3 et4,
p.303,
1961.THOMPSON and RUSSEL
REMAGE, "Rankings
frompaired comparisons",
Ann. math.Statist., 35,
n°2,
p.