C LAUDE F LAMENT
Le traitement des ex æquo en analyse de similitude : la réunion des arbres maximaux ou RAM
Mathématiques et sciences humaines, tome 114 (1991), p. 35-40
<http://www.numdam.org/item?id=MSH_1991__114__35_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1991, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LE
TRAITEMENT
DES EXÆQUO
EN ANALYSE DE SIMILITUDE : LARÉUNION
DES ARBRES MAXIMAUX OU RAMClaude
FLAMENT1
RÉSUMÉ -
On considère ungraphe complet
dont les arêtes sont totalementpréordonnées.
En analyse de similitude,plutôt
que deprocéder
à un ordonnancement des arêtes ex oequo par une méthodelexicographique
surleurs intitulés, l’auteur propose de rechercher la réunion des arbres maximaux (RAM).
ABSTRACT - Tied
Edges
inSimilarity Analysis :
The Union of the MaximumSpanning
Trees.The
complete graph
endowed with acomplete preorder
on itsedges
is considered. Insimilarity analysis,
oneoften
researches all the maximum spanning trees (MSTs)by
using alexicographic
method on the labelsof
thetied
edges.
Insteadof
that, the author suggests todirectly
determine the unionof
the MSTs (the RAM in the text).L’analyse
desimilitude,
tellequ’elle
estclassiquement pratiquée (cf.
DEGENNE etVERGES, 1973),
recherche l’arbre maximum de similitude - cequi
suppose que la similitude constitue un ordre strict sur les arêtes. C’est rarement le cas dans lesapplications
à des donnéesréelles. La
plupart
desalgorithmes
transforment lepréordre
de similitude en ordre strict par ordonnancement des ex aequo par une méthodelexicographique
sur les intitulés desarêtes,
cequi
esttoujours artificiel,
etparfois
artéfactuel(les
intituléspouvant
être liés à lasignification
desvariables).
Rappelons
unalgorithme
de recherche de l’arbre maximum(lorsque
l’ordre eststrict).
Uncocycle
d’ungraphe
est l’ensemble des arêtes associées à unebipartition
desvariables,
c’est-à-dire,
l’ensemble des arêtes allant d’unepartie
de labipartition
à l’autre. Un résultat de Rosenstiehl(1967)
montre que l’arbre maximum n’est autre que l’ensemble des arêtes maximums dans au moins uncocycle.
D’où la méthode dite desplus proches
voisins : onconsidère les
cocycles
associés àchaque
variableséparément ;
l’arête maximum se lit comme lavaleur maximum dans la
ligne
du tableau de similitude.1 C.A.M.S., Vieille Charité - MARSEILLE.
Tableau 1
On obtient alors le
graphe
desplus proches voisins, qui, ici,
n’est pas convexe(figure 1).
Figure
1On va alors définir de nouveaux
cocycles
en tenantcompte
descomposants
connexes ; parexemple { A,F }
contre l’ensemble des autrecomposantes { B,C,D,E } :
Tableau 2 d’où:
Figure
2On recommence
jusqu’à
cequ’on
obtienne l’arbre maximum :Tableau 3
Figure
3Remarque :
La similitude du tableau 1 n’est pas un ordrestrict, puisque
deux arêtes ont pour valeur. 45. Mais cecouple
d’ex aequo n’intervientjamais
dans lesmanipulations
ultérieures.Il n’en va pas
toujours ainsi,
et alors il n’existe pas d’arbremaximum, malgré
unepratique
abusive.
Exemple :
Tableau 4
Figure
4Tableau 5
Au tableau
5,
on a deux arêtesmaximales ;
onpeut privilégier (AB)
au titre de l’ordrelexicographique,
mais c’estarbitraire ;
et si on retient les deux arêtesmaximales,
cequ’on
obtient n’est pas un arbre
(figure 5).
Figure
5De
quoi s’agit-il ? Reprenons
lepréordre
desimilitude,
affiné par l’ordrelexicographique ;
pour cet ordre
strict,
lafigure
6représente
l’arbre maximum :Figure
6Mais on
peut
tout aussi bienprendre
l’ordrelexicographique inverse,
et l’arbre maximumest alors celui de la
figure
7 :Figure
7En
fait,
ces deux arbres(figures
6 et7)
sontéquivalents
parrapport
aupréordre
desimilitude ;
ce sont deux arbresmaximaux,
et lafigure
5présente
leur réunion : la réunion des arbresmaximaux,
ou RAM(cf. FLAMENT, 1975).
Nous proposons de modifier
l’analyse
de similitudehabituelle, qui
recherche un arbremaximum
qui
n’existepeut-être
pas, enprocédant
à la recherchesystématique
de la RAM(qui
seréduit bien évidemment à l’arbre
maximum,
s’ilexiste).
Des
précautions
sont àprendre
pourl’algorithme
de recherche de la RAM.Exemple :
Tableau 6 Les
plus proches
voisins sont(figure 8)
Figure
8On va opposer la
première composante
connexe{ A,E }
à l’ensemble des autres{ B,C,D,E } :
Tableau 7
Le tableau 7 fait
apparaître
deux arêtesmaximales,
d’où l’arbre de lafigure
9 :Figure
9Mais cet arbre n’est ni maximum ni
maximal ;
eneffet,
l’examen du tableau 6 montrel’existence d’une arête
(C,D)
à.70, supérieure
aux arêtes maximales du tableau 7.Cette arête serait apparue
si,
au lieud’opposer
lapremière composante (première lexicographiquement)
au reste desvariables,
on avait parexemple opposé
la composante(B,C)
au reste :
Tableau 8
D’où,
legraphe
non connexe de lafigure
10 :Figure
10En
opposant {A,E}
au reste, comme dans le tableau 7 et lafigure 9,
on obtient ungraphe qui
n’est pas un arbre
(figure 11),
maisqui
est la RAM de notreexemple.
Figure
11Pour être sûr
qu’on
a rienoublié,
on opposera lacomposante { D,F, }
au reste.L’algorithme
est alorssimple :
Première
phase :
lesplus proches
voisinsDeuxième
phase (si nécessaire),
on considère tous lescocycles
définis parl’opposition
dechaque composante
connexe avec le reste desvariables,
et àchaque
fois on retient la ou les arêtes maximales.(FLAMENT, 1975).
Il convient donc de ne
plus parler
d’arbre maximum desimilitude,
mais de la RAM de similitude,.BIBLIOGRAPHIE
DEGENNE, A, VERGES, P., 1973,
"Introduction àl’analyse
desimilitude",
RevueFrançaise
de
Sociologie, 14, 1973,
471-512.FLAMENT, C., 1975,
"Arêtes maximales descocycles
d’ungraphe préordonné", Mathématiques
et Scienceshumaines, 51, 1975,
5-12.ROSENSTIEHL, P, 1967,
"L’arbre minimum d’ungraphe",
in P. Rosenstiehl(Ed.),
Théoriedes