J. L. G UIGUES
V. D UQUENNE
Familles minimales d’implications informatives résultant d’un tableau de données binaires
Mathématiques et sciences humaines, tome 95 (1986), p. 5-18
<http://www.numdam.org/item?id=MSH_1986__95__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1986, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
FAMILLES MINIMALES
D’IMPLICATIONS
INFORMATIVES RESULTANTD’UN
TABLEAU DE DONNEES BINAIRESJ.L.
GUIGUES*
et V.DUQUENNE**
INTRODUCTION
Dans de nombreux
domaines
de lapsychologie, psychopédagogie, médecine,
taxi-nomie... etc, on
dispose
de tables de donnéesbinaires
décrivant dessujets
-ou dans
d’autres situations,
desévénements,
desobjets...-
par un ensemblede traits
dichotomiques. D’un point
de vuemathématique
de telles tables dé- finissent une relationbinaire
Rd’un
ensembleS(sujets)
vers un ensembleT(traits).
Dans cequi suit,
letriplet (S, T, R)
sera,après Wille(1982), appelé
un contexte. Il est naturel de rechercher toutes lesimplications
entre sous-ensembles de T et
même
une sous-familleéquivalente(en
éliminantla
redondance).
Parexemple
un médecinpeut souhaiter
savoirsi,
dans uncertain contexte, un
patient présente
tel groupe desymptômes
ilprésentera
aussi nécessairement tel autre groupe de
symptômes.
La
réponse
estclaire
dans le casd’une
échelle de Guttmannpuisque
l’ordre
est total.Flament
(1976)
aproposé d’utiliser
les méthodes desimplification
defonctions
booléennes;
cequi
permet de déterminer une telle famille enfaisant
jouer
unrôle symétrique
à laprésence
ou àl’absence d’un
trait.Quand
lenombre de
traits n’est
pastrop grand
on obtient aisément de telles familles.X
Groupe Mathématiques
etPsychologie,
C.N.R.S. etUniversité
RenéDescartes,
Paris.XX Centre
d’Analyse
et deMathématiques Sociales, E.H.E.S.S.,
Paris.Pour notre
part
nousexaminons
desimplications qui
ne fontintervenir
que la
présence
de traits. Pourtenir compte
de la non-occurrence de traitson
pourrait
certesdupliquer
le tableau en yintroduisant
les traits contrai- res, mais ilapparaît
alors une redondance liée à lacontraposition.
Dans cet
article,
nous nousplaçons
dans le cadre des ensembles ordon-nés,
enrappelant d’abord
la notion decorrespondance
deGalois
pourlaquelle
il existe une littérature abondante
depuis
les travaux de Ore(1944), Riguet (1948)
etBirkoff (1948).
Puis nous définissons la famille de toutes les
implications
entre par- ties de T liées au contexte(S, T, R)
et nous cherchons àfabriquer
des sous-familles minimales
équivalentes c’est-à-dire
résumant le contexte sansperte d’information.
Lesconcepts d’implication informative
maximale et de noeuds de non-redondancepermettent d’établir
le résultat fondamental: toutes cessous-familles ont même cardinal et sont indexées par un sous-ensemble de noeuds que nous
appelons
les noeuds minimaux.Ces
aspects théoriques
mettent en évidence uneprocédure algorithmi-
que de recherche de telles sous-familles. Des programmes
informatiques
exis-tent
(Duquenne, 1984; Ganter, 1984); d’autres pourront être
mis aupoint
enutilisant
des méthodes récursives dedétermination
des noeuds et du treillis de Galois(Guigues, 1984).
NOTATIONS
Outre les notations
classiques
en théorie des ensemblesU ~, ...)
nous
utiliserons
lessymboles 9-:
pourl’inclusion
au senslarge
et C pourl’inclusion
au sens strict.Pour la réunion
d’une
famille de sous-ensembles(Bk)k E K
nousutilise-
rons la
notation U ~Bk; k6.K~ plutôt
quek~K Bk
~A~ désignera
le cardinal de A2A plutôt que q (A) désignera l’ensemble
desparties
del’ensemble
A.Pour deux
parties
A et B avec A c BCORRESPONDANCES
DE GALOISEtant donnée une
relation binaire
Rd’un
ensemble S vers un ensemble T -nousdirons un contexte
(S, T, R)-
onpeut
définir deuxapplications
duales:en
posant
et de
même
Ces deux
implications (f et 4’
forment unecorrespondance
de Galoisentre les ensembles ordonnés
(2 ; ~ )
et(2T; ~ ), c’est-à-dire:
- elles sont décroissantes.
- leurs
composées
sont des fermetures dans(2S, ~ )
et(2T, 4-- ) (Birkoff,
1940; Ore, 1944; Riguet, 1948).
Si
l’on
noteA" = (A’)’ - 4’0 c..p (A),
lespropriétés précédentes s’écrivent:
(et
dualement dans2T)
TOn
appelle
fermé dans2S
tout sous-ensemble A de S tel que A =A" (dua-
lement dans
2T).
Il est clair que pour tout élément A de
2S, A"
est fermé et quel’inter-
section de 2 fermés est fermée.
Si l’on note C T(resp £ S) l’ensemble
des fermés de2T(resp 2s),
les ensembles ordonnées
( ° , )
T et( !S’ 2)
S sont deuxtreillis
iso-morphes,
dénommés treillis de Galois par Barbut etMonjardet (1970)
ettreillis de
concepts
par Wille(1982).
Par
exemple,
pour larelation
binaireprésentée
par le tableauci-dessous,
on a leségalités suivantes:
Le
treillis peut
êtrereprésenté
par lediagramme suivant:
Fig.
1 .Treillis
de GaloisIMPLICATIONS INFORMATIVES RESULTANT
D’UN
CONTEXTE(S, T, R)
Nous nous
plaçons maintenant
dans lasituation
suivanteoù,
pour fixer lesidées,
nous pouvons considérerl’ensemble
S comme un ensemble desujets
etl’ensemble
T comme un ensemble detraits dichotomiques
décrivant lessujets
moyennant
la relation R.Pour tout
couple (s, t)
deSxT,
onpeut interpréter
larelation
sRtcomme:
"le sujet
ssatisfait
le traitt"
et définir une notiond’implica-
tion
entre deuxparties
A et B de T. On dira que Aimplique
B(on
noteraA
-+B) lorsqu’un sujet satisfaisant
tous les traits de Asatisfait
néces- sairement tous les traits de B.Autrement
dit: zoo
s E S(s
eA’)
~(s E B’ ) D’où
ladéfinition:
(1) (A -+ B)
si et seulementsi A’ B’
Comme
(A’ Ç B’ ) équivaut
à(B" CI A")
et deplus B c. B",
nous avons leséquivalences:
Lorsque
B est inclus dansA,
on atoujours
A ~B;
parconséquent
nousdirons que
l’implication
A - B estinformative
si Bn’est
pas inclus dans A.Si A - B est
informative,
An’est
pas fermé dans2T;
eneffet,
B ç B" ~ A"
etB ~ A impliquant A ~ A".
Dans toute la suite on
appellera
lacune tout élément non fermé de2T
et donc tel que A P
A"
estinformative.
Dans
l’exemple précédent,
lesimplications suivantes
sontinformatives:
(On
a noté parsimple concaténation
les sous-ensembles detraits).
IMPLICATIONS INFORMATIVES MAXIMALES
(IIM)
Nous avons vu que
l’implication A ~ B
estinformative
si et seulement si:(B
ceA")
et(B ~ A) .
Nous
dirons
doncqu’une implication informative
estmaximale
si etseulement si:
et
Exemple
Les
implications
acd - abcde et be - bde ne sont pasmaximales,
eneffet on a aussi ad 2013~ abcde et be-+ abcde. Par contre abc p abcde est
maximale.
Il est
clair d’après (2)
que si A p B est maximale alors B =A";
ona alors la
PROPOSITION 1:
Soit
A unepartie
deT, l’implication
A -+A"
estmaximale
siet seulement si:
ou de
façon équivalente
Preuve:
Si (3) n’est
passatisfaite 3 X ~ T :
XcAc. X"
et parconséquent
X"
s-A" ~ X".
Donc X ~A"
et A --~A"
neserait
pasmaximale.
Réciproquement,
supposons(3) vérifiée;
les conditions X~A; A"Y;
etX 2013~ Y
prouvent
queA 9 A" ~ Y £:-: X"
et donc X = A par(3).
Deplus A1’
=X"
et par
conséquent
Y =A" C.Q.F.D.
Par
définition,
une lacunesatisfaisant (3)
seraappelée
une lacuneirréductible.
Remarquons
que(3)
donne un critèred’élimination rapide
des lacunesréductibles puisque
toutepartie
del’intervalle 1 X, X" C
est une lacuneréductible.
Dans
l’exemple précédent
la lacune abc estirréductible,
par contre acdn’est
pasirréductible.
Fig.
2. la lacuneirréductible
adSoit
Il’ensemble
des lacunes irréductibles de2T et J l’ensemble
de toutes lesIIM;
ces deux ensembles sont encorrespondance biunivoque:
Dans la
suite,
noustravaillerons
doncindifféremment
dans I ouc~ .
Dans le schéma
ci-dessous,
les lacunesirréductibles
sontreprésentées
par des
petits
carrés et les IIM par des flèches.Fig.
3.Implications informatives maximales
SOUS-FAMILLE INFERANT UNE
AUTRE;
REDONDANCEEtant donné
l’ensemble
desimplications informatives
résultantd’un
contexte(S, T, R),
on se proposed’extraire
unesous-famille minimale d’implications
telle que toute autre
implication puisse être inférée
par lesimplications
de cette
sous-famille.
Considérons
donc les deuxrègles d’inférence suivantes; A, B,
C et D étant des sous-ensembles de T:Règle
1 :Règle
2:et et
(20132013
estutilisé
commesymbole d’inférence)
Remarques:
-Commel’implication
C - C esttoujours vraie,
de larègle
1 .on déduit la
règle (A -? B)~ (A u
ClB v C).
-On vérifie de même que toute
implication
non maximale estinférée
par une IIM.Soit /
unefamille d’implications informatives (non nécessairement maximales)
ou cequi revient
aumême
une famille J de lacunes:et
V
! ’ ’ -
t
y
Nous nous proposons
d’extraire de
unesous-famille minimale )
telleque
d’t- ’(
Par
définition
uneimplication
ide )
seradite §/
-redondantesi
~~’2013
i. ’Exemples:
et et
Ainsi
e - de cd
cd .- bcd
---- ( c e
--T )
be2013T
De même
e
-+ de
bd - bcd
i---- (be - T)
ce
ce-Tbcd } t-- (be T)
be ~ T
(resp.
ce -T)
est donc redondante parrapport à cl (ensem-
ble de toutes les
IIM). Mais
cesimplications
ne sont pas redondantes parrapport T;
ce ~T D’une certaine façon
elles sontéqui-
valentes en ce
qui
concerne la redondance~
SATURATION
Nous nous proposons, dans la
suite,
dedéfinir
unopérateur
dit depré-satu-
ration qui permettra d’éliminer
la redondance.Pour toute
partie
A deT,
onconsidère son pré-saturé
Adéfini
par:et
J étant un ensemble de lacunes
correspondant
à la familled’implica-
tions considérée.
Remarquons
que lacondition B" A"
estintroduite
pour éviter que-
A =
A"
dans le casd’une
lacuneréductible.
Exemple:
abc =abcd;
abc = T(ici 1= Ô ensemble
de toutes lesIIM).
-
Il est
clair
quel’implication
A ~ Aest}
-redondantepuisque
On vérifie que
l’opération
depré-saturation satisfait
auxpropriétés
suivantes:
(I désigne l’ensemble
des lacunesirréductibles) (6’)
Si J estl’ensemble
de toutes les lacunes:et
(7) L’application :
A E2T t2013~
A ~2T est
croissante.(8) (A = A") ~ (A ~ A") est
-redondante(9) (A e 1)
et(A = A)
~(A
-7A") est
non-redondante.Remarquons
toutefois que laréciproque
de(8)
est fausse. Cela tientau fait que
l’application
A ~A n’est
pas une fermeture dans2T.
Exemple:
Si A =abc, A =
abcd et A = T(on
apris
J =I);
parconséquent
abc 2013~ T est redondante.Si nous
définissons,
pour toutepartie
A deT,
la suiteA = A, A + = A,
k il résulte de(5)
que cettesuite
estcroissante
etK+1
1 -kmajorée
parA".
Nousappellerons
alors -saturé de A lapartie
Adéfinie
par:
On
vérifie
sanspeine
quel’application
A )2013)A E. 2T
est unefermeture dans
l’ensemble
ordonné(2T, )
et nous obtenons alors:~
(11)
Si A =A"
alors(A- A") est -redondante; mais
laréciproque
est fausse.
NOEUDS DE NON-REDONDANCE
(NNR)
Remarquons qu’un
ferméde l T vérifie
A =A = A",
nous sommes alors con-duits à
définir
leconcept
de noeud denon-redondance
par:(12)
A est un noeud de non-redondance si et seulement si A = 1B./A etA A".
N
Ainsi
pour toutA,
A estsoit
un fermésoit
un NNR..IV . ,
Par
construction, A peut dépendre
de lacunesirréductibles
non conte-nues dans
A, cependant
nous avons la:PROPOSITION 2: Soit A c-T
(13)
A est un NNR si et seulementsi
A = A etA # A"
La preuve est
immédiate:
_.
N ~~~ -
Si A est un NNR A = A et par
définition
deA(A = A)
on a A =A;
Réciproquement
sid’où
NOEUDS MINIMAUX
Remarquons qu’il
existe deux sortes de NNR selonqu’ils
sontirréductibles
ou non .
Si A est à la fois un NNR et une lacune
irréductible,
alorsl’implica-
tion A 2013~
A"
est non-redondantequelle
quesoit
lafamille
et fera doncpartie
de toutefamille minimale inférant 1 -
Si A est un NNR et une
partie
réductible(.3
BeA tel que B" =A")
alors:
i)
A --1A"
est inf érée par B -~B"
ii) B ç A -
A etsi B = A alors
et AA" infèrent
B2013~-B".
On est donc conduit à
introduire
leconcept
de noeudminimal;
nous dironsqu’un
NNR A est minimal si et seulement si:( 14) b
CÇA (C"
=A")
et(C = ~ (C = A)
Etant donné un noeud
minimal
A et un sous-ensemble B de A nous avons:(15) (A - B)
Notons N
l’ensemble
des NNR et Nol’ensemble
des noeudsminimaux
pourune
famille
d’implications 1
donnée. Nous obtenons alors la:PROPOSITION 3:
Soit
B une lacuneet
une familled’implications,
on a:(1) (B
-~B") est
-redondantesi B, B"~ N 0
(2)
Soit A e. No etB a 2T;
=2T; B = A
alorsB e J A
B ~B" est
BA
non-redondante.Preuve:
Si car et on aurait alors
donc
2) S’il existe
A éNo ~ [B, B" } T ÇA
=A ; d’après (14)
B = A etl’im-
plication est 1
-redondante.L’implication
B -B"
sera redondantesi
A =B -+ B" l’est. S’il
existe C J avecC ~ B,
pardéfinition
deiA
J’ nous et doncA"
=B"
=C". Ainsi (C
--->C")
infère(A
-A")
et(B
~B") est "L
-redondante.Il est clair de
plus
que, pardéfinition
deB, l’implication (B
PB")
ne
peut
êtreinférée
que par uneimplication
dutype
C ~C"
avec C cequi
prouve laproposition.
Le cas
2)
de laproposition
est illustré par lediagramme
ci-dessous:Fig. 4.
le noeud de non-redondance ACeci explique
la situation rencontrée dansl’exemple précédent
pour lesimplications
be 9 T et ce ~ T: le noeud minimal étantici
bcde.Remarquons
que cette
situation
ne seprésente
que si le noeudminimal n’est
pas une lacu-ne
irréductible
etsi
deplus
il est la fermeture deplusieurs
lacunes irré-ductibles.
La
famille
departie JA
est une classed’équivalence
pour la relationd’équivalence définie
par:La
proposition
3conduit
donc au:THEOREME: .
Etant donnée une
famille d’implications informatives liées
au contexte(S, T, R),
toutesous-famille minimale de inférant
est de la forme~’ = l A ~ A";
A E9L ~
où~
est unsystème
dereprésentants
des classesd’équivalences
des noeudsminimaux.
Lecardinal de
estégal
aucardinal
de No.
Dans
l’exemple,
lafamille
No =te, ad, bc, bd, cd, bcde .
abcd estun noeud non minimal
(il contient ad);
bcden’est
pasirréductible:
les lacunes irréductibles de sa ~ -classed’équivalence
sont be et ce.Le contexte est donc entièrement
décrit
par 6implications informatives,
5
obligatoires
et unechoisie parmi
2possibles:
e 2013~
de;
ad 2013~T;
bc 2013~bcd;
cd ~bcd;
bd - bcd et be ~ T(ou
ce ~-~T)
Considérons
l’ensemble
L des lacunesirréductibles
dont la fermeture /~/est un noeud minimal
On
peut représenter économiquement (cf fig. 5)
les familles minimalesd’implications
àpartir
del’ensemble
L structuré de lafaçon
suivante:a)
Les éléments de L sontregroupés
par classesd’équivalence
pour les rela- tionsd’équivalence associées
aux fermetures -v et 11(la première parti-
tion étant
plus fine).
Les ce -classes sontcerclées, les li
-classes sontreprésentées
par unrectangle.
b)
La relationd’implication
entre éléments de L est une relation depréordre qui
induit unerelation
depréordre
sur les w -classes et une relationd’or-
dre sur
les 1’
-classes(car
A ~ B et B - Aéquivaut
àA"
=B").
Ces rela-tions
sontreprésentées
par des flèches entre classes(en
traitspleins
sielles sont
informatives, discontinus sinon).
c)
Si pourA e L, A" n’est
pas réuniond’éléments
deL,
onintroduit
dans lediagramme
fléché le sous-ensemblecomplémentaire
detraits. C’est
parexemple
le cas du trait e dans la
figure
5. On peut alorslire
sur lediagramme
lesimplications
en suivant les flèches. On remarquera que le fermé A"d’une
lacune A
n’est
pasnécessairement
réduit à laréunion
des éléments de laboîte rectangulaire qui
le contient.Fig.
5.Graphe d’implications
BIBLIOGRAPHIE
BARBUT
M.,
MONJARDETB.,
Ordre etclassification,
T.II, Paris, Hachette,
1970.BIRKOFF
G., Lattice theory (1ère
ed.1940). Providence,
Amer. Math.Soc.,
1967.DUQUENNE V., Programme
dedétermination
des noeudsminimaux, Groupe
Mathé-matiques
etPsychologie,
1984.FLAMENT
C., L’analyse booléene des questionnaires, Paris, Mouton,
1976GANTER
B.,
Twobasic algorithms
inconcept analysis,
THDPreprint n° 831, Darmstadt,
1984.GUIGUES
J.L., Construction
récursive desimplications informatives, rapport
technique, Groupe Mathématiques
etPsychologie,
1984.GUIGUES
J.L., DUQUENNE V., Informative implications
derived from a table ofbinary data, rapport technique, Groupe Mathématiques
etPsychologie, Paris,
1984.ORE
0., "Theory
ofequivalence relations",
Duke Math.J., 9(1942),
573-627.RIGUET
J., "Relations binaires, fermetures, correspondances
deGalois",
Bull. Soc. Math. de
France, 76(1948),
114-155.WILLE
R.,
"Restructuring
latticetheory:
anapproach
based onhiérarchies
of