3.4 Conlusion
4.2.2 Cas général
Nousavons vu quedans le as général, ilest impossiblede aluleren temps
polyno-mialune base d'impliationsde laborne supérieure de systèmesde fermeturereprésentés
sous leur forme impliationnellemême si nous ne onsidérons que deux systèmes de
fer-meture. Kautz and Selman ont donné dans [91℄ un algorithme qui résout le problème
équivalent dans sa formulation logique. Nous dérivons ainsi et algorithme retransrit
sur lessystèmes de fermeture.
Remarque : Kautz et Selman ont proposé et algorithme dans le adre de la
gé-nération d'une enveloppe de Horn assoiée à une fontion booléenne en forme normale
onjontive quelonque quiest un as plus général du problème que nous étudions.
Notation 1 Soit
Σ 1 , Σ 2 , ..., Σ k
des basesd'impliations respetives pourF 1 , F 2 , ..., F k
.On note :
R = {X 1 X 2 ...X k → x 1 ∨ x 2 ∨ ... ∨ x k |X i → x i ∈ Σ F i , i ∈ {1..k}}
Nous pouvons voir que toutes les règles de
R
sont satisfaites par tous les ensembles appartenant àF Σ 1 ∪ F Σ 2 ∪ ...∪ F Σ k
.Nous déomposons ainsi
R
en deux ensembles de règles. Le premier ensemble ontientainsilesrèglesd'impliationstandisqueledeuxièmeontienttoutesellesquine sontpas
desrèglesimpliatives'estàdirequiontiennentunoulogique (
∨
)dansleuronlusion.
R H
={X 1 X 2 ...X k →
x| X i → x i ∈ Σ i i ∈ {1..k}
}
R H ¯
={X 1 X 2 ...X k → x 1 ∨
...∨ x k | X i → x i ∈ Σ i i ∈ {1..k}
}Théorème 14 [91℄ L'algorithme 4aluleune base d'impliationspour
F 1 ∨ F 2 ∨ ... ∨ F k
.Exemple 17 Considérons les basesde Guigues Duquenne des systèmes de fermeture de
l'exemple 10 et appliquons l'algorithme 4. Nous obtenons ainsi l'ensemble de règles
R H
and
R H ¯
suivants :R H
= {ade→
, be→
d}R H ¯
= {ab→
∨
d, de→
∨
d}Après appliation de l'algorithme , nous obtenons :
Σ
={ade→
,be→
d, abe→
, abe→
d}Algorithme 4 :Borne supérieure:base d'impliations
Données :
R H
,R H ¯
ensemblede règlesdéduites deR
Résultat :
Σ
une base d'impliationsdeF 1 ∨ F 2 ∨ ... ∨ F k
début
tant que un tel hoix est possible faire
Essayer de trouverun ouple(
r 1 , r 2
),r 1 ∈ R H
etr 2 ∈ R H ¯
telquer 1
=(xX
→ a
) etr 2
= (Y → W l
i =1 x i ∨ x
)qui n'ai pas été onsidérési un tel ouple existe alors
r
=XY → a ∨ W l
i=1 x i ∨ x
si
r
est une règle d'impliation alorsR H
=R H ∪ XY → a
Dans ette setion,lebut est de dénir un opérateurde fermetureorrespondantà la
borne supérieurede systèmesde fermeturen'ayantpour informationsur eux-iqueleurs
éléments inf-irrédutiblesrespetifs.
Nousdénissonsainsi un opérateur
φ
()quenous démontronsêtre unopérateurdeferme-ture. Nous déduisons ensuite que
φ
() dénit l'ensemble des éléments fermés de la bornesupérieure des systèmes de fermeture onsidérés.
Dénition 34 Soit
φ
(A) =T
{B
∈ S k
i =1 M
(F i
))|
A⊆
B}Proposition 11
φ
est un opérateur de fermeture.Preuve.Soit A
⊆
G.Théorème 15 Soit
F 1
,F 2
, ...,F k
des systèmes defermeture sur G.AlorsW k
i =1 F i
={F∈ 2 G |
F =φ
(F)}.Preuve. Il nous fautmontrer que
W k
i =1 F i ⊆
{F∈ 2 G |
F=φ
(F)}. Soit F∈ W k i =1 F i
.Deux as sont alors possibles :
Soit F
∈ S k
i =1 F i
. Alors F appartient au moins à l'un des systèmes de fermeture.Or
φ
(F) =T
Exemple 18 Si nous onsidérons l'exemple 10, nous voulons obtenir l'ensemble fermé
assoié à l'ensemble {ab} dans
F 1 ∨ F 2
. Nous appliquons alors l'opérateur de fermeture obtenu sur et ensemble :φ
(ab) =T
{B
∈ M
(F 1
)∪ M
(F 2
)|
ab⊆
B} = abd∩
ab∩
abd=ab.L'opérateur de fermeture déni pour la borne supèrieure de systèmes de fermeture
onsidère l'uniondes ensembles d'élémentsinf-irrédutibles de haque système de
ferme-ture. Le aul de la fermeture d'un ensemble donné se fait don en temps polynomial
parrapportauxensembles des élémentsinf-irrédutiblesde haquesystème de fermeture
onsidéré.
4.4 Conlusion
Nousavons vupour l'opérationde borneinférieure sur les systèmesde fermetureque
ladiulté de alul dière selon la représentation prise en ompte. Si nous onsidérons
la représentation par les ensembles d'éléments inf-irrédutibles, l'opération de borne
in-férieure est une opération diile. A l'inverse, si nous onsidérons l'opération de borne
de l'entrée qui permet de la réaliser.
De manière duale, si nous onsidérons la représentation des systèmes de fermeture par
lesbases d'impliations,l'opérationde borne inférieuresefait en temps polynomialalors
que l'opération de borne supérieure peut engendrer, dans le as général, une explosion
ombinatoire. Nous nous sommesainsi intéressés àune lasse partiulière de bases
d'im-pliations quesont les bases d'impliationsdiretes. Nous proposons, dans e as préis,
un algorithmeen temps polynomial permettant de résoudre l'opération de borne
supé-rieure de systèmes de fermeturereprésentés sous formeimpliationnelle.
Le problème de génération d'une base d'impliations de laborne supérieure de systèmes
de fermeture représentés sous forme impliationnelle a été réemment lassé [45℄. Il a
ainsi été montrer qu'il n'existe pas d'algorithme polynomial pour résoudre e problème
en temps total polynomial hormissi P = NP.
Il existe des algorithmes permettant de générer une base d'impliations direte à partir
d'unebase d'impliationsquelonque. Cesalgorithmesrestentexponentielsenla taillede
l'entrée etde lasortie mais ont de bonnes propriétés en pratique.
Nous pouvons ainsi adapter l'algorithme sur les bases d'impliations diretes au as
gé-néral. Il sut pour ela d'appliquer un algorithme de génération de bases d'impliations
diretes à partir de bases d'impliations quelonques et d'appliquer l'algorithme 2 pour
répondre au problème 5. Il serait ainsi intéressant de tester, de manière pratique,
l'algo-rithmeainsiobtenuestdeomparersesperformanesavelesautresalgorithmesexistants.
Diérene de deux systèmes de
fermeture
Sommaire
5.1 Eléments inf-irrédutibles . . . 61
5.2 Base d'impliations . . . 64
5.3 Opérateur de fermeture . . . 65
5.4 Conlusion . . . 66
Nous allons voir dans ette setion l'opérationde diérene de deux systèmes de
fer-metureselonlareprésentationquenousonsidéronsendonnée dedépart.Cetteopération
n'estpasdénieformellementsur lessystèmes defermeture. Ladiéreneentre deux
sys-tèmesde fermeture
F 1
etF 2
, notéeF 1 \F 2
,onsiste àonstruire la familledes ensemblesappartenant à
F 1
qui n'appartiennent pas àF 2
. Il est lair ii que la diérene de deuxsystèmes de fermeture n'est pas toujours un système de fermeture. Nous onsidérerons
donii leplus petit système de fermeture quiontient lesensembles de ladiérenedes
deuxsystèmes defermeture. Ce problèmeorrespond aualulde l'enveloppede Hornde
ladiérene de deux théories de Horn en logique. La gure 5 montre ainsi le système de
fermetureobtenuen faisantladiérenedes systèmesde fermeture
F 1
etF 2
de l'exemple10.
5.1 Eléments inf-irrédutibles
Nous voulons voir ii omment aluler les éléments inf-irrédutibles de la fermeture
de la diérene de deux systèmes de fermeture à partir de leurs ensembles d'éléments
inf-irrédutiblesrespetifs.
00
Fig. 5.1 a)Famille d'ensembles
F 1 \F 2
,b) Systèmede fermetureassoiéàla fermeturede
F 1 \F 2
.Problème 6 :DIFFERENCE :INF
Données : Ensembles d'éléments inf-irrédutibles
M(F 1 )
etM(F 2 )
des système defer-meture
F 1
etF 2
.Résultats : L'ensembledes éléments inf-irrédutibles de la fermeture de
F
=F 1 \F 2
.Leproblème6aété étudiédans saformulationlogiquedans[44℄.Lesauteursontainsi
montré quee problème peut être résolu en temps polynomial.Nousretransrivons ainsi
e résultatsous saformulationbasée sur les systèmes de fermeture.
Dénition 35 Soit
M(F 1 )
etM(F 2 )
les ensemblesd'éléments inf-irrédutibles respeti-vement aux systèmes de fermetureF 1
etF 2
. On dénit :S
=M(F 1 ) ∪
{M∩
M'|
M, M'∈ M(F 1 )
}et
S 1
={S∈ S |
S6∈ F 2
}S 2
=S\S 1
Théorème 16 [44℄ Soient
M(F 1 )
etM(F 2 )
les ensembles d'éléments inf-irrédutibles respetivement aux systèmes de fermetureF 1
etF 2
. AlorsS 1
est un sur-ensemble des inf-irrédutibles de la fermeture de la diérene deF 1
etF 2
.Corollaire 2 [44℄Soient
M(F 1 )
etM(F 2 )
lesensemblesd'élémentsinf-irrédutibles res-petivementaux systèmes de fermetureF 1
etF 2
. Alors l'ensemble des inf-irrédutiblesde lafermeturede ladiérenedeF 1
etF 2
peut être aluléen temps polynomialen lataillede
M(F 1 )
etM(F 2 )
.Preuve. Lespreuves de es théorèmes sont donnés dans [44℄.
L'algorithme5présentelaméthodepouralulerl'ensembledesélémentsinf-irrédutibles
delafermeturede ladiérenededeuxsystèmesdefermetureétantdonnésleurséléments
inf-irrédutibles respetifs. La fontion Réduire() supprime les ensembles pouvant être
obtenus par intersetion d'autres ensembles.
Exemple 19 Considérons l'exemple 10. En appliquant l'algorithme 5 nous obtenons les
ensembles
S
etS 1
suivants :S = {abcd, acde, bcde, abc, bde, be, bcd, acd, cde, bc, ac, b, e}
S 1 = {abc, bde, be, bc, b}
L'appliationdelaproédureRéduire() supprimeii l'élément
b
deS 1
puisqueb = {bc}∩
{be}
. Nous obtenons ainsi l'ensemble d' éléments inf-irrédutibles suivants pourF 1 \F 2
:M(F 1 \F 2 ) = {abc, bde, be, bc}
.Algorithme 5 :Diérene :représentation par les inf-irrédutibles
Données :
M(F 1 )
etM(F 2 )
lesensembles d'élémentsinf-irrédutiblesdeF 1
etF 2
Résultat :
M(F 1 \F 2 )
l'ensembledes éléments inf-irrédutiblesdeF 1 \F 2
.
début
S
=M(F 1 ) ∪
{M∩
M'|
M, M'∈ M(F 1 )
}S 1
={S∈ S |
S6∈ F 2
}M(F 1 \F 2 )
= Réduire(S 1
)retourner
M(F 1 \F 2 )
n
5.2 Base d'impliations
Dans ettesetion,nous voyons ommentsetraduitladierenede deux systèmes de
fermeture sinous onsidérons leurs représentations sous formede bases d'impliations.
Problème 7 DIFFERENCE :IMPLICATION
Données :
Σ 1
,Σ 2
deux bases d'impliations respetives par rapport aux système de fer-metureF 1
etF 2
.Résultats :
Σ
une base d'impliations pour lafermeture de la diérene entreF 1
etF 2
.Il a été montré dans [44℄, que le problème équivalent en logique 'est à dire le alul
de l'enveloppe de Horn de la diérene de deux théories de Horn, est o-NP diile.
Par e résultat, il parait don évident qu'il y a peu de hane qu'il existe un algorithme
polynomial permettantde résoudre e problème.
Cei est dû au fait que la taille de la nouvelle base peut être exponentielle en la taille
des deux bases d'impliations prises en entrée. De plus, le problème de déision assoié
est lui mêmeo-NP-omplet.
Problème 8 DECISION DIFFERENCE :IMPLICATION
Données :
Σ 1
,Σ 2
, des basesd'impliations respetives par rapport aux systèmes de fer-metureF 1
etF 2
.Σ
une base d'impliationsRésultats :
F Σ
= fermeture deF Σ 1 \ F Σ 2
.Théorème 17 [44℄Etantdonnées
Σ 1
,Σ 2
,desbasesd'impliationsrespetivesparrapport aux systèmes de fermetureF 1
etF 2
etΣ
une base d'impliations,déider siΣ
représenteune base d'impliations pourla fermeture de ladiérene de
F 1
etF 2
est o-NP-omplet.Lethéorème suivant en est ainsi déduit:
Théorème 18 [44℄ Etant donné
Σ 1
,Σ 2
deux bases d'impliations, il n'existe pas d'al-gorithme en temps total polynomial permettant de aluler une base d'impliations de lafermeture de la diérene des systèmes de fermeture hormis si P = NP.
Ce théorèmeaété prouvédans [44℄ sur leproblèmeéquivalenten logique
proposition-nellepour l'enveloppe de Hornde ladiérene de deux théoriesde Horn.
5.3 Opérateur de fermeture
Nous allons voir à présent l'opérateur de fermeture que l'on peut dénir à partir des
éléments inf-irrédutibles des deux systèmes de fermeture pris en onsidération pour la
fermeturede la diérene.
Nous dénissons ainsi un opérateur
ψ
et nous démontrons qu'il représente un opérateurdefermeture. Nousmontronsensuitel'équivaleneentre lafamilled'ensemblesferméspar
ψ
etlesensembles fermésde ladiérenedes deux systèmesde fermeturepris enompte.Pour ei nous nous servons des ensembles
S
etS 1
dénis dans la setion5.1 onernantla représentation par les éléments inf-irrédutibles. L'opérateur de fermeture ainsi déni
permet un alul en temps polynomialde lafermeture d'un ensemble donné par rapport
auxéléments inf-irrédutiblesde haque système de fermeture.
Dénition 36 Soit
ψ
(A) =T
{B
∈ S 1 |
A⊆
B}.Proposition 12
ψ()
est un opérateur de fermeture.Preuve. Soit A
⊆
G.A
⊆ ψ(A)
par dénition deψ
().SoitA
⊆
D. Nousavonsψ
(A) =T
{B
∈ S 1 |
A⊆
B} etψ
(D) =T
{B
∈ S 1 |
D⊆
B}.Cela implique que
A ⊆ ψ(A)
etD ⊆ ψ(D)
.Nous avons donφ(A) ⊆ ψ(D)
.
ψ(ψ(A))
=ψ( T
{B
∈ S 1 |
A⊆
B}) =T
{B
∈ S 1 |
A⊆
B} =ψ(A)
.Théorème 19 Soient
F 1
etF 2
deux systèmes de fermeture sur G. AlorsF 1 \ F 2
= {F∈ 2 G |
F =ψ
(F)}.Preuve.Nous savons par dénition que
F 1 \ F 2
={F ∈ G|F = T
{M ∈ M(F 1 \F 2 ) |
F
⊆
M}.D'après le théorème 16,nous avons
S 1
est un sur-ensemble des éléments inf-irrédutibles deF 1 \F 2
.Nousavons don
F 1 \ F 2
= {F∈ 2 G |
F=ψ
(F)}.Exemple 20 Considérons l'exemple 10. Nous voulons obtenir l'ensemble fermé de {b}
dans
F 1 \ F 2
. Nous appliquons alors l'opérateur de fermeture obtenu sur et ensemble :ψ(b) = T
{B ∈ S 1 |{b} ⊆ B} = {be} ∩ {bc} ∩ {b} = {b}
.5.4 Conlusion
L'opération de diérene entre deux systèmes de fermeture est la dernière opération
étudiée dans ette partie. Nous voyons ii, de la même manière que les opérations
préédentes, que les diultés de alul ne sont pas les mêmes selon les représentations
que nous onsidérons des systèmes de fermeture.
Tout d'abord, nousvoyons quele alulde l'ensembledes éléments inf-irrédutiblesde la
fermeture de la diérene de deux systèmes de fermeture s'eetue en temps polynomial
à partirdes élémentsinf-irrédutibles de haund'entre eux.
Enrevanhe, ettemêmeopérations'avère diilesinousonsidéronsunereprésentation
impliationnelle des systèmes de fermeture. Plus formellement, il n'existe pas
d'algo-rithme en temps total polynomial permettant de aluler une base d'impliations de la
fermeture de ladiérene des systèmes de fermeturehormis siP = NP.
Si nous regardons à présent, de manière globale, l'ensemble des opérations de ette
partie, nous remarquons que les diultés de alul ne sont pas liées à lareprésentation
onsidéréedes systèmesde fermeture. Sinous onsidéronsl'opérationdeborneinférieure,
nous voyons que pour la représentation par les éléments inf-irrédutibles, l'opération
est diile tandis que si nous onsidérons la représentation impliationnelle,l'opération
se fait en temps polynomial. A l'inverse, pour les opérations de borne supérieure et de
diérene, la diulté porte sur le alul sur la représentation impliationnelle tandis
que pour la représentation par les éléments inf-irrédutibles, ette opération se fait en
temps polynomial.
Borneinférieure Bornesupérieure Diérene
Inf-irrédutibles NP-diile Polynomial Polynomial
Basesd'impliations Polynomial o-NP-diile o-NP-diile
Basesd'impliationsdiretes Polynomial Polynomial ouvert
Opérateur de fermeture Polynomial Polynomial Polynomial
Tab. 5.1 Réapitulatif des omplexités des diérentes opérations sur les systèmes de
fermetureselon leur représentation.
données que nous onsidérons. Les omplexités de haque opération par rapport à leurs
diérentes représentations sont exposées dans la table 5.1
Problème de génération des bases
d'impliations mixtes
Nous avons vu dans la partie préédente qu'une base d'impliations est une
re-présentation ompate d'un ensemble de données. La génération de telles bases a été
très étudiée et reste toujours un problème d'atualité. Cette étude est ainsi présente
dans de nombreux domaines de l'informatique tel que le data mining, la théorie des
graphes, la logique... Ainsi le problème d'extration de règles d'assoiation à partir d'un
ensemble de données [2℄ est un des domaines oùette reherhe est toujours d'atualité.
Une règle d'assoiation est une impliation de la forme X
→
Y [sup,onf℄, où X et Ysont des sous-ensembles d'attributs (appelés itemsets) tel que X
∩
Y =∅
et tel que onfreprésente laonane etsup représente lesupport. Le supportd'une règle est dénipar
laprobabilité qu'un ensemble d'objets posséde X etY tandis que laonane représente
laprobabilité que Yappartienne à un objetsahant que X appartient à et objet.
Uneapproheintéressantefutl'utilisationde l'analysedeoneptsformelsandealuler
un ensemble réduit de règles d'assoiations. De e fait, plusieursétudes ont onduit à la
génération de représentations onises de es ensembles de règles telles que la base des
générateursminimaux (ou base générique) [85℄ et la base de Guigues-Duquenne[38, 54℄.
Les deux dernières bases de règles d'assoiations ont la propriété d'être omposées
uniquement de règles dont laonane est égale à1 quel'on nommerègles exates.Elles
orrespondent ainsi àdes bases d'impliations.
La plupart de es études ont été développées an de trouver des assoiations positives
entre les diérents éléments onsidérés. Si nous prenons l'exemple bien onnu du panier
delaménagère,uneassoiationpositivepossibleserait:Lesonsommateursquiahètent
de la bière et du whisky, ahètent aussi des aahuètes.
D'autres règles peuvent être intéressantes si nous onsidérons la négation sur les
éléments. Nous appellerons ii es règles règles mixtes. Cette négation peut ainsi
permettre d'obtenir de nouvelles informations pertinentes que ne permettent pas les
règles d'assoiations positives. Si nous reprenons l'exemple du panier de la ménagère,
une assoiation ave négationpourra être du typeles onsommateursqui ahètent de la
bière et du whisky, ahètent aussi des aahuètes mais n'ahètent pas de ouhe ulotte.
L'ajoutdans l'impliationdu non ahat desouhes ulottesrajouteune informationqui
permet de faire de nouvelles dédutions et d'étayer les analyses faites sur les données
onsidérées.
Diérents travaux ont ainsi été ménés sur e sujet. La notion d'assoiation négative
entre itemsets fut étudiée en premier par Brin et al. [20℄. Le manque d'expressivité des
règles d'assoiations positives onduit ainsi à la reherhe de nouvelles informations que
peut amener lesrègles d'assoiation mixtes. L'introdutionde la négationdans lesrègles
d'assoiationspeut ainsiêtreutilepourl'identiationd'exeptions[93℄etdeorrelations
négatives[3,90℄.Elleapermisd'aboutiràdiérentesperspetivesdanslalittératureetse
révèleêtre un dé importantdanslesdiérentsdomaines évoqués. Diérentes tehniques
etmesures de qualité sont explorées dans divers travaux de reherhe réents [19, 102℄.
Malheureusement, il n'existe que très peu d'algorithmes de génération eaes
permet-tant d'obtenir un ensemble valide etomplet de règles d'assoiation mixtes àpartir d'un
ensemble de données (La validité d'un ensemble de règles d'assoiation représente lefait
que toutes les règles d'assoiation satisfont l'ensemblede données etla omplétude d'un
ensemble de règles d'assoiation le fait que toutes les règles d'assoiation qui satisfont
un ensemble de données peuvent être déduites de l'ensemble de règles d'assoiation
généré). Dans ette partie, nous nous intéressons don auproblème de génération d'une
base d'impliations mixtes ('est à dire prenant en ompte la présene et l'absene des
attributs dans le ontexte) à partir d'un ontexte formel R = (G,M,I). Ce problème est
ainsi équivalent àla générationde règles d'assoiation dontla onane est égale à 1.
Nous verrons ainsi les diérentes problématiques qui peuvent exister sur es bases
d'im-pliations selon le hoix de données de départ que nous onsidérons. Nous regarderons
ainsi la faisabilitéet laomplexité de haune.
Nousnous foaliserons plus partiulièrementsur leproblème de la générationd'une base
d'impliations mixtes à partir des bases d'impliations purement positives et purement
négativesassoiées à un ontexte R.
Cette partie est struturée omme suit :
Le hapitre 6 présente les notations et les dénitions que nous allons utiliser pour
les bases d'impliations mixtes. Nous introduisons une méthode naïve de génération
des règles d'impliations à partir d'un ontexte formel R = (G,M,I). Nous regardons
ensuitediérentesproblématiquesliées àlagénérationdes basesd'impliationspurement
positives, purement négatives et mixtes. Nous verrons que la plupart des problèmes
évoqués sont à e jour enoreouverts.
Dans le hapitre 7, nous nous onentrons plus partiulièrement sur le problème
de la génération d'une base d'impliations mixtes à partir des bases d'impliations
génériques purement positives et purement négatives assoiées à un ontexte R. Nous
verrons ainsi, qu'à partir de ette information, nous n'avons auune garantie d'obtenir
une base d'impliationsmixtes omplète pour un ontexte Ronsidéré. Cependant, nous
exhiberons un ertain nombre de propriétés et de règles d'inférene qui nous permettent
de déduireun ertainnombre d'impliationsmixtes de R.
Nous montrerons aussi que dans le as partiulier d'un ontexte réduit, nous obtenons
une nouvelle règle d'inférene qui nous permet de montrer la validité et la omplétude
de la base d'impliations mixtes déduite pour un ontexe à partir des règles d'inférenes
que nous avons trouvées en onsidérant en données les bases d'impliations génériques
positives et négatives de e ontexte. Un ontexte partiulier, que l'on nomme ontexte
omplet sera traité indépendemment pour arriver àe résultat.
Dénitions et Problématique
Sommaire