M ATHÉMATIQUES ET SCIENCES HUMAINES
C. H EUCHENNE
Un algorithme général pour trouver un sous-ensemble d’un certain type à distance minimum d’une partie donnée
Mathématiques et sciences humaines, tome 30 (1970), p. 23-33
<http://www.numdam.org/item?id=MSH_1970__30__23_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1970, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme
UN ALGORITHME GENERAL POUR TROUVER UN SOUS-ENSEMBLE
D’UN CERTAIN TYPE À DISTANCE MINIMUM D’UNE PARTIE DONNÉE
par
C. HEUCHENNE 1
RÉSUMÉ
Soit w un ensemble
fini,
muni d’une valuationpositive
v, et p, a des sous-ensembles de w.est une distance entre p et a.
On décrit ici un
algorithme fournissant
les sous-ensembles 6 minimisantd(P,6), lorsque
p etune classe
~P
arbitraire de sous-ensembles de w sont donnés.L’algorithme
sesimplifie lorsque ~
est crois-sante, ou
décroissante,
ou un demi-treillis.***
La recherche des relations a d’un certain type les
plus proches
d’une relationdonnée p
est à l’ordredu
jour.
Ainsi Zahn[6]
donne une solution dans le cas où p estsymétrique,
irréflexive et satisfait unetroisième condition très
restrictive,
les a cherchés étant deséquivalences ;
Barbut[1] présente
uneméthode
quand
letype
considéré est celui des ordres totaux.Je
me propose ici de traiter leproblème
le
plus général.
Un sous-ensemble p est fixé dans un ensemble fini w et on s’intéresse à certaines
parties
de wformant une classe
le
nonvide;
leproblème
est de déterminer la meilleureapproximation
de p au sein dele.
Pour donner un sensmathématique
à cettequestion,
on doitpouvoir
mesurer l’écart entre deuxsous-ensembles de (ù. Dans le contexte le
plus large,
(ù nepossède
que sa structureensembliste;
on estconduit assez naturellement à
adopter
comme écart de p et 6 le cardinal de leur différencesymé- trique pàa
=(p--6)
U(y2013p).
C’est cequi
est fait par Zahn etBarbut,
et dans d’autres domaines : distance deHamming
entre motsbooléens,
distance entreopinions,
distance entresociogrammes,
etc.Si
l’importance
dechaque
élément x de w est mesurée par le nombre réelpositif v(x),
une discri-mination
plus
fine entre p et a est donnée par :1. Institut de Mathématique, Université de Liège.
d est une distance de 2w induite par la valuation v
([4],
pp.68-70).
Si l’on notev(a)
la valeur cumuléele cas
précédent
est obtenu pour la valuation constanteégale
à 1 danslaquelle v(a)
_jal.
Sans
précisions
sur la classe~, on
nepeut espérer
unalgorithme
très efficace de recherche dua E
e
minimisantd(p,a).
Celui queje présente n’est,
aufond, qu’une exploration systématique
et bienconduite de toutes les solutions
possibles.
Je
noterai a un élémentquelconque
deF,
c l’inclusionstricte,
xl, x2, ..., 9 x~ les éléments de parrangés
de telle manière que :y,, y2, ..., ym les éléments de w-p ordonnés de telle
façon
queCela
étant,
soitYk(Y,Gt)
l’ensemble des 0". E~
tels quePuisque
Les nombres pour a E sont donc bornés inférieurement par :
Les distances
d(p,a)
pour a E sont donc bornées inférieurement par-r- v(xk+i).
1/algorithme
est amorcé par laquestion
p E~ ?
Sioui,
p est évidemment la solutionoptimum puisque d(p,p)
= 0.Sinon,
la classe~ est séparée
en bornée parv(yi) (quand
a:Dp)
et_Wo(O)
bornée par
v(xi) (quand c z p).
Il reste maintenant à voir comment onpeut
progresser àpartir
des deuxcas où k m et où k n ; on notera que 0.
Pour on se demande d’abord si
appartient
à~.
Sioui,
cet ensemble est lameilleure solution au sein de car sa distance à p,
égale à V(P-Y) -~- V( -~- V(Yk 1)
estmin
d(p,a). Sinon,
onenvisage
deuxpossibilités
exclusives pour 6 Eon sait en outre que i ; par
conséquent
cest ainsi
partagée
en deux sous-classes dont les bornes infé- rieures améliorent celles de91’ k(Y,tX).
Pour on pose
préliminairement
laquestion
EQ7 ? Quand
laréponse
est
affirmative,
cet ensemble estoptimum
au sein de car sa distance à p réalise la borne inférieure -~-V(Xk+,)
de cette classe.Sinon,
on considère troispropriétés
exclusives pour 6 EDans le
premier
cas, apuisque
comme pna c il vient pna =puis
a E classe bornée par-~- v(xk+1) + V(YI).
Dans le second cas,jxi,
..., estencore g ;
parconséquent,
a E classe bornée par+ v(x~+2).
Dans leest ainsi
séparée
en troissous-classes j
les bornes inférieures améliorent celle
de 6
De
proche
enproche, ~
estpartagée
en classes deplus
enplus petites ;
pour chacuned’elles,
on connaît une borne inférieure de
d(p,a).
Leprincipe
de la méthode S.E.P.([5],X.B)
est de traiter à tout moment,parmi
les cas encorelibres,
celuiqui possède
la borne laplus
basse.Si,
dans la classeexaminée,
laréponse
à laquestion «To
E?»
est affirmative(QO
est dansJI/’ k(Y,a.)
etdans le sous-ensemble ao minimise
d(p,a)
car il réalise la borne inférieure de son cas,laquelle
ne
dépasse
aucune autre borne inférieure à ce moment.*
**
Pour mettre en évidence le
principe
del’algorithme, je
traitel’exemple
ridiculementsimple
deet la valuation :
Pour
alléger
letableau,
on a écrit ?» pour « ao Ele ?
non, « E o pour « Qet Xt+l E ao, « G», etc.
A, B, C,..., indique
l’ordretemporel
de traitement des cas.{x1,
..., et sont les trois éléments dee
à distance minimum 4 de p ; si l’on ne désiraitqu’une solution,
on aurait pu s’arrêter dès le stade 0.Cette
illustration,
pourtantélémentaire,
montre que laprocédure
est très lourde. Enfait,
elle estencore fictive parce que,
pratiquement,
la classefl7
n’estjamais
donnée par énumération de ses élé- ments, mais bien par unepropriété caractéristique ;
le test « ao E~ ?»,
à effectuer àchaque
stadede
l’algorithme, peut
être lui-même tout un programme. D’autrepart,
si la famillee
ne se compose que d’éléments fortéloignés
de p, il faudraparcourir
tous les sous-ensembles intermédiaires avantd’aboutir;
aupire,
si le seul élément de~
était m-p,l’algorithme
conduirait à examiner les2 1 (a)
1parties
de w.Ajoutons
encore que leprocédé
est d’autantplus
efficace que les valeurs de v sontlarge-
ment
distribuées ;
le cas de la valuation uniforme pourlaquelle
les bornes neprogressent
que de 0 et 1est évidemment le
plus
mauvais.En
conclusion,
on n’utilisera cetalgorithme
que si l’on nedispose
pas d’une méthodespéci- fique
à la classee
donnée. Si cette dernière est assez vaste, il estprobable qu’il
existebeaucoup
dea E
e qui
ne diffèrent de p que de peud"ëlëments ;
on peutespérer
alors obtenir la solution à brefdélai,
pourvu que le contrôle « ao e~
?o soit facile.Pour la
suite,
il est utile de noter que les classes sontengendrées
en dernier ressort parlaquelle
résulte elle-même de laséparation
de_ek(p)
avec y =La
procédure proposée
ne devient vraiment intéressante quelorsque le jouit
de certaines pro-priétés ;
le reste del’exposé
est consacré aux améliorationsqui apparaissent
alors.Si
West décroissante,
les éléments deW qui
minimisentd(p,a)
sont lesparties
de pqui
maximisentv(a) ; inversement, si, quels
que soient le sous-ensemble p de (ù et la valuationpositive
v, la solution est contenue dans p,West
décroissante.Soit ao E
e
unepartie de
pqui
maximisev(a) ;
un tel sous-ensemble existepuisque West
nonvide et décroissante.
Réciproquement,
siQ7
n’est pasdécroissante,
on peut trouver 61 et a~ tels que ai Ele minimum de
d(a2,a).
Du
point
de vuealgorithmique,
la décroissance vide toutes les classes car, avantest donc vide. Le schéma de
séparation
seprésente
alors comme suit :Quand
la famille est nonvide,
onpeut
considérer l’ensemblePourvu que à
existe,
on a lespropriétés classiques :
a c: c a entraîne l’existencede e
et l’inclusion’ et
seulementalors, l’opérateur
estpartout
défini et devientune fermeture
([4],
p.35)
ou une saturationgonflante ([3],
p.419).
Si
F est
unn-demi-treillis,
les éléments deW qui
minimisentd(p,a)
sont les rx où oc est unepartie
de p
qui
maximise2v(oc)
-v(&.) ; inversement, si, quels
que soient le sous-ensemble p et la valuationpositive
vde ~0, la solution est un « où a c p,
West
unn-demi-treillis.
Soit a une
partie
de pqui
maximise2v(a)
-v(«) ;
«appartient
àtentant qu’intersection
finied’éléments de
~.
Un tel sous-ensemble a existepuisque 0
E c petWa :f:. 0}.
En
effet,
comme pn0153 est unepartie
de p,on en déduit :
puisque
Réciproquement,
si~
n’est pas unn-demi-treillis,
on peut trouver di, a2 EF
tels queOF.
Prenons p = alna2l
il s’ensuit que
Or,
si 0153 c p,comme p ~
FI
ensupposant
Un â E
le
avec oc c P ne peut donc provoquer le minimum ded(P,a).
Remarques : 1)
Un 6 EF
et inclus dans p n’est pas nécessairement de la forme â avec oc c p ;oc c p n’entraîne pas
généralement
oc =pna.
Pour levoir,
prenons la classeQ7
des relations transitives de E et w =2 ;
p est :
p est :
fI égal à :
contredit la
première proposition ;
ce
égal à :
met la seconde en défaut.
2)
Une classe décroissante est unn-denù.treilhs ;
les résultats donnés à propos des classes décroissantes sont des casparticuliers
de ceux relatifs auxn’demi-treillis,
obtenus enprenant
0153 = a.3)
Dans lesréciproques
des deuxénoncés,
il estindispensable
de demander cc pour toute valua- tion v». Voicil’exemple
d’une classe~ qui
n’est pas unn-demi-treillis (donc
n’est pasdécroissante)
et
qui cependant,
pour un certains v, est telle que le a E~
à distance minimum d’unepartie quelconque
pest
toujours
inclus dans p(donc
de la forme 0153 où a cp).
~
n’est pas unn-demi-treillis puisque {a,c}
={a}.
Le a e~
à distance minimum dep ~ {a}
est p
lui-même ;
le a e~
à distance minimum de{a}
est 0.Au
point
de vuealgorithmique,
le fait que~
soit unn-demi-treillis supprime
l’examen des*
* *
Le
problème
étudié iciapparaît
souvent à propos des relations binaires(ou graphes orientés)
d’un ensemble
E,
considérées commeparties
de ce = E X E. Dans ce contexte, des classes~
décrois-santes sont constituées des relations
acycliques,
des relations sanscircuits,
descouplages,
des relationsantisymétriques,
etc. La relation dutype
demandé à distance minimum de p est alors la sous-relation de p de valeur totalemaximum ;
cecijustifie
les diversprocédés
connus pour chercher une forêt maxi-mum
([5], VII,A, 2, c),
unsous-graphe
sans circuits maximum[2],
uncouplage
maximum([5], IX, D, 1, b)
au sein d’un
graphe donné ;
le cas où~
est la classe des relationsantisymétriques
est trop trivial pournécessiter la
description
d’unalgorithme.
Comme
exemples
den-demi-treillis,
onpeut
citer les classes des relationssymétriques,
desrelations
transitives,
deséquivalences,
des ordres. Trouver une relationsymétrique
à distance mini-mum de p ne pose aucun
problème ;
pour la classe des relationstransitives,
à est la fermeture transitivede a ;
pour la classe deséquivalences,
à est la fermetureréCexivo-symétrico-transitive.
Pour la classeF
desordres, Wa= {a :
a est un ordre et a ~ oc} est non vide si et seulement si a nepossède
d’autrescircuits que des
boucles ;
dans ce casfavorable,
a est la fermeture transitive de oc([5], V, C, 1, a). À
titred’illustration,
recherchons l’ordre à distance minimum dugraphe
p valué suivant.Les
couples
en dehors de p recevront la valeur 1.A, B,
...,Z,
oc.)~3,
y, 8indique
l’ordretemporel
des stades. Aux conventions de
l’algorithme général,
il fautajouter
la notation oo pourdésigner
la nonexistence de 0"0’
plus petit
ordre contenant ao,quand
6opossède
un circuit au moins.On trouve trois ordres à distance minimum 6 de p :
Si l’on ne cherchait pas toutes les
solutions,
onpourrait
s’arrêteraprès
le traitement du stadeT, quand
on a constaté que toutes les bornes restantes étaient ~ 6.
*
**
Les
algorithmes
et résultatsprécédents peuvent
être dualisés.Ainsi,
soient~k(S,~)
l’ensembleBien que les classes soient
différentes,
lesquestions posées
et les bornes inférieures sont les mêmes que dansl’algorithme primal.
(X. est défini par :
quand
= {a E~ :
a c ce) est non vide. Pourvu que (X*existe, implique
l’exis-tence de
~3*
et l’inclusionP* 13 ce* ;
ce** =ce* ;
x* = oclorsque
oc EF.
Si 0 Ee
et seulementalors,
cet
opérateur
estpartout
défini et devient une saturation contractante([3],
p.419).
Les énoncés suivantsont une preuve
identique
à leurduale,
donnéeprécédemment.
Si un
U-demi-treillis,
les éléments a deW qui
minimisentd(p,a)
sont les et. où et est un sur-ensemble de p
qui
minimise2v(ot)
-v(et.) ; inversement, si, quels
que soient p et v, la solution est un et.où p, un U-demi-treillis.
L’algorithme
duals’adapte
au cas oùWest
un U-demi-treillis enpartageant
une classeest
vide ; sinon, d’après
lelemme,
est une borne inférieure des distances à p des éléments de enconséquence,
le traitement des classesdisparaît.
Si
~ est croissante,
les éléments deW qui
minimisentd(p,a)
sont les sur-ensembles de pqui
mini-misent
v(a) ; réciproquement si, quels
que soient le sous-ensemble p et la valuationpositive
v de co, la solutioninclut p,
le
est croissante.Dans
l’algorithme dual,
les classesdisparaissent puisque
est vide
quand
on a contrôlé que~.
·BIBLIOGRAPHIE
[1]
BARBUT M. - « Note sur les ordres totaux à distance minimum d’une relation binairedonnée»,
Math. et sc.
hum.,
n°17,
p.47,
1966.[2]
DURAND B. 2014 « A propos duproblème
du nombre minimum d’arcs à enlever poursupprimer
lescircuits d’un