M ATHÉMATIQUES ET SCIENCES HUMAINES
B. M ONJARDET
Quelques problèmes relatifs à la méthode des comparaisons par paires
Mathématiques et sciences humaines, tome 37 (1972), p. 69-71
<http://www.numdam.org/item?id=MSH_1972__37__69_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1972, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
69
QUELQUES PROBLÈMES RELATIFS A LA MÉTHODE
DES COMPARAISONS PAR PAIRES
par
B.
MONJARDET1
La méthode des
comparaisons
parpaires
est utilisée au niveau individuel comme au niveau collectif.Dans le
premier
cas elle consiste à faireexprimer
lespréférences
d’unsujet
sur un ensembled’objets
en lui demandant de choisir pour
chaque paire d’objets
celuiqu’il préfère.
On obtient ainsi une relationtotale, antisymétrique (si
on refuse lesex-aequo),
mais non transitive engénéral ;
legraphe
ainsi obtenus’appelle
un tournoi. Au niveaucollectif,
on a un ensemble de tournoisexprimant
lespréférences
indi-viduelles de différents
sujets ;
on définit alors unepréférence
collective en choisissant pourchaque paire d’objets
celuipréféré
par unemajorité
desujets ;
on obtient encore un tournoi.Un cas
particulier important
est celui où tous les tournois individuels sonttransitifs,
ce sont alorsdes ordres totaux et on retrouve le
problème
bien connud’agrégation
des votes ; on sait que même dansce cas, la
préférence
collective n’est pas engénéral
transitive : c’est l’ « Effet Condorcet »(cf.
GuilbaudG.
Th.,
et RosenstiehlP., « L’analyse algébrique
d’unscrutin»,
Math. Sci.hum.,
n°4,
ou dans Ordrestotaux
finis, Paris, Gauthier- Villars, 1971).
Les
problèmes
liés à la méthode decomparaisons
parpaires
sont nombreux et ont étéplusieurs
fois abordés dans cette revue ; nous les classerons en deux thèmes
principaux,
évidemment reliés :description
etajustement.
Commençons
par ladescription
d’un tournoi ou d’un ensemble de tournois. Un tournoi sera décrit par sespropriétés,
parexemple,
de connexité ou detransitivité ; ainsi,
on définira des indices de transi- tivité basés sur le nombre de circuits delongueur
trois ou sur la distance à un ordretotal ;
la définitionde ces indices
requiert
la connaissance del’amplitude
maximum de cescaractéristiques,
cequi,
dans lesecond cas, pose des
problèmes
combinatoires difficiles(cf.
l’article de J. C. Bermond dans cenuméro).
La
description
d’un ensemble de tournois suit la même démarchequ’en statistique descriptive classique ;
on cherche à résumer un ensemble d’éléments en donnant un élément central
(moyenne,
médiane ... enstatistique)
et un indice dedispersion
par rapport à cet élément(variance, étendue...). Habituellement,
l’élément central est calculé comme l’élément à « distance minimum » des éléments
donnés,
l’indice dedispersion
étant alors une fonction de cette distanceminimum ;
parexemple,
si les éléments sont denature
vectorielle,
on cherche l’élément minimisant le moment d’inertie(somme
des carrés desdistances)
des
points
donnés par rapport à unpoint quelconque :
on obtient le centre degravité
et la variance n’est autre, à un coefficientprès,
que le moment d’inertie par rapport au centre degravité.
Dans tous lescas, l’élément central et l’indice de
dispersion dépendent
des distances choisies et de la définition de la« distance minimum ».
1. CNRS, Centre de Mathématique Sociale.
70
Dans le cas des
tournois,
on peutprendre
comme distance celle de la différencesymétrique
entredeux
relations ;
elle estégale
au double du nombre d’arcs à inverser pour passer dupremier
tournoi ausecond,
c’est-à-dire au double de la « distance de Kendall ». Si on définit alors la distance minimum d’un tournoi à un ensemble de tournois comme la somme des distances de ce tournoi à chacun des tournoisdonnés,
le tournoi à distance minimum estprécisément
celui obtenu en utilisant la méthode des compa- raisons parpaires ;
c’est aussi le tournoi médian au sensalgébrique
du terme(cf.
BarbutM.,
et Mon-jardet B.,
Ordre etclassification, Paris, Hachette, 1970, chap. IV).
On peut aussiplonger
l’ensemble des tournois dans un vectoriel et utiliser une distance euclidienne. Enparticulier,
si on considère seulement les n t tournois transitifs comparant nobjets,
on peut lesplonger
dans un espace euclidien à n - 1 dimensions et en donner unereprésentation géométrique polyédrique :
lepermutoèdre (c f. chap.
IIId’Ordres totaux
finis).
A un ensemble d’ordres totauxcorrespond
alors un nuage depoints
sur le permu-toèdre ;
l’élément à distance euclidienne minimum des ordres totauxcorrespond
au centre degravité
de ce nuage ; le moment d’inertie du nuage par rapport à son centre de
gravité,
convenablementnormé,
redonne le coefficient de concordanceappelé
W par Kendall(cf. Degenne A., L’ajustement
des modèles ordonnés enanalyse
dequestionnaires,
thèse 3ecycle Lettres, Paris, 1969).
On trouvera dans cette mêmeréférence, l’interprétation
des coefficients de corrélationclassiques
entre deux ordres totaux(i
deKendall,
p de
Spearman)
ou de leurs moyennes sur lescouples possibles,
au moyen des deux distances définies ci-dessus.Les résumés étudiés ci-dessus se limitent à un élément central et un indice de
dispersion ;
on peut allerplus
loin enadaptant
la démarche del’analyse
factorielle.L’analyse
despréférences
a été introduite par Benzécri dans le cas où cespréférences
sont des ordres totaux(cf. chap.
V d’Ordres totauxfinis).
On considère le nuage de
points
formé sur lepermutoèdre
par un ensemble d’ordres totaux ; on calcule l’inertie du nuage par rapport à un sous-espace, et le sous-espace minimisant cette inertie ; cette inertie minimum estdécomposée
suivant les axesprincipaux
de ce sous-espace ; on obtient ainsi uneexpression pondérée
desprincipales
tendances del’opinion (représentées
par les axesprincipaux).
D’autre part,on
peut
obtenir unereprésentation globale
visuelle desproximités
entre lespréférences
et éventuellement lespréférences
et lesobjets comparés ; ceci,
en ne retenantqu’un
sous-espace de faible dimension surlequel
onprojette
le nuage. A cetteapproche
on peut relier l’article deJacquet-Lagrèze (« Analyse d’opinions
valuées etgraphes
depréférence
», Math. Sci.hum.,
nO33)
conduisant à unereprésentation plane
simultanée despréférences
et desobjets comparés ;
les axes sont ici déterminés à l’aided’algo-
rithmes
d’agrégation ;
àsignaler
aussi que ce même article définit des indices de cohésion pour despréférences
valuées.Un des résultats de
l’analyse descriptive
d’un ensemble depréférences
est de définir des indices de cohérence oud’homogénéité
de cespréférences.
Si ces indices sont suffisamment élevés on peut chercher àajuster
à cespréférences
un modèle appartenant à une classedéterminée ;
la méthode usuelle est de définir une distance et de chercher le modèle de la classe à distance minimum despréférences
données.Plusieurs classes de modèles sont
envisageables : préordres,
ordrespartiels,
fuseauxd’ordres,
ordrestotaux... ; nous ne considérons ici que la classe la
plus
courammentutilisée,
celle des ordres totaux.Ainsi,
dans le cas d’unepréférence
traduite par untournoi,
on cherchera les ordres totaux à distance minimum de cetournoi ;
il en est de même pour un ensemble de tournoislorsque
ceux-ci ont été résumés par leur tournoi médian.Là encore, on peut
prendre
la distance de la différencesymétrique
ou une distance euclidienne.Dans le
premier
cas la recherche des ordresoptimaux
conduit à unproblème combinatoire ;
M. Barbutavait
déjà remarqué ( « Note
sur les ordres totaux à distance minimum d’une relation binaire donnée », Math. Sci.hum.,
n°20)
que ceproblème
estéquivalent
à unproblème
de recouvrement minimum donc de « transversale» minimum. D’autre part, desalgorithmes
pour obtenir les ordresoptimaux
ont étéprésentés
par B. Durand(«
A propos du nombre minimum d’arcs poursupprimer
les circuits d’ungraphe »,
Math. Sci.hum.,
nO20)
et C. Heuchenne pour un casplus général («
Unalgorithme général
71
pour trouver un sous-ensemble d’un certain
type
à distance minimum d’unepartie
donnée », Math. Sci.hum.,
nO30).
Cesproblèmes
sont étudiés dans l’article de J. C.Bermond,
dans cenuméro ;
ilprésente
lasynthèse
des résultats obtenus en utilisant souvent des démonstrationsoriginales
et unifiantes et il apporte des résultats nouveaux.Pour obtenir les ordres totaux à distance minimum d’un ensemble de tournois on peut
également
utiliser la distance
euclidienne ;
dans le cas où ces tournois sont transitifs cela revient à chercher les ordres lesplus proches
du centre degravité
du nuagequ’ils
forment sur lepermutoèdre ;
on peut montrer que ceci estéquivalent
à choisir les ordres obtenus par la « méthode de Borda », c’est-à-dire en attri- buant àchaque objet
la somme de ses rangs(cf. Degenne,
op.cit.).
Il existe d’autres méthodes pour
ajuster
un ordre total à un tournoi ou un ensemble detournois ;
par
exemple,
dans lepremier
cas, celles basées sur les scores ou desprocédés
d’itération des scores. Ilreste à situer ce genre de méthodes par rapport à celles fondées sur la minimisation d’une distance et
aussi à comparer l’ensemble de ces méthodes. Par
exemple,
àquelles conditions,
distance de la diffé-rence
symétrique
et distance euclidienne donnent-elles les mêmes résultats ?Signalons
aussiquelques problèmes
connexes à cesquestions :
la détermination des ensembles depréférences
dont le résumé à distance minimum pour la distance de la différencesymétrique
est unordre ;
enparticulier,
la caractérisation des ensembles d’ordres totaux stables pourl’opération médiane,
tels que par
exemple,
les ordres Blackiens(cf.
KrewerasG., «
Les décisionscollectives »,
Math. Sci.hum.,
nO 2 etFrey L., «
Parties distributives du treillis despermutations
», dans Ordres totauxfinis) ;
l’inversion de la relation de
Condorcet,
c’est-à-dire la détermination du nombre minimum d’ordrestotaux dont la médiane est un tournoi donné.
Aucun modèle
probabiliste
n’était introduit dans les méthodesd’ajustement précédentes ;
si on introduit un tel modèle on rencontre des
problèmes
d’estimation et de décisionstatistique,
étudiésdans l’article de A. Astié
(« Comparaisons
parpaires
etproblèmes
declassement,
estimation et testsstatistiques
», Math. Sci.hum.,
nO 32 et aussi dans celui de G. Th. Guilbaud(«Préférences
et ochas-tiques », ibid.).
Cette
rapide
revue desproblèmes
soulevés par la méthode descomparaisons
parpaires
aura montréau lecteur
qu’ils
sont nombreux et quemalgré
les contributionsapportées,
bien desquestions
restentouvertes. Nous souhaitons donc
pouvoir
accueillirprochainement
d’autres articles sur ce thème dansMathématiques
et Sciences humaines.N. B. - Nous avons surtout cité dans cette revue, les articles parus dans Math. Sci.
hum. ;
le lecteurtrouvera des références