• Aucun résultat trouvé

Remarque sur l’utilisation de la valeur critique

CHAPITRE 4. NOUVELLES BASES DES R` EGLES M GK -VALIDES Exemple 14

Prenons le contexte d´ecrit dans le tableau K= (O, I, R). Avec un minSupp = 1/2 et une pr´ecision α = 0, 7, le tableau 4.11 nous montre les r`egles dans N BP A(α) et celles dans SBP A(α), avec un taux de r´eduction non n´egligeable (29%).

N BP A r2 AB → ABE r3 AB → C r5 B → AE r6 B → AC r7 B → E r8 B → AB r9 B → BD r10 A → ABE r11 A → BC r12 A → AB r13 A → AD r14 D → BD r15 D → AD r20 E → ABE S´emi − BP A r2 r3 r5 B → AE r6 B → AC r7 r8 B → AB r9 B → BD r10 A → ABE r11 A → BC r12 r13 A → AD r14 D → BD r15 D → AD r20 E → ABE

Tableau 4.11 – Comparaison deN BP A(0, 7) et SBP A(0, 7)avecminSupp = 1/2 et taux de r´eduction de 29%

4.8.3 Semi-base n´egative approximative

Rappelons que la nouvelle base n´egative approximative est constitu´ee des r`egles entre les g´en´erateurs des motifs ferm´es. Bien qu’un g´en´erateur est toujours de taille r´eduite par rapport aux autres motifs non g´en´erateurs de sa classe, entre eux, comme les motifs ferm´es, les g´en´erateurs d’un contexte donn´e peuvent ˆetre comparables et par cons´equent, les r`egles, elles aussi, peuvent ˆetre comparables selon la relation d’ordre « domin´ee par » d´efinie dans l’ensemble des r`egles n´egatives approximatives. Prenons l’exemple des r`egles r1 : C → BD et r2 : C → D du contexte d’extraction K0 d´ecrit dans le tableau 4.9. Pour ces deux r`egles, nous avons : MGK(C → BD) = 0, 41 et MGK(C → D) = 0, 56. Au niveau de confiance α = 0, 7, les r`egles r1 et r2 sont valides. Selon la d´efinition de la relation d’ordre dans l’ensemble des r`egles n´egatives approximatives, r1 : C → BD est domin´ee par la r`egle r2 : C → D (puisque D ⊂ BD). Donc, la r`egle r1 : C → BD et toutes ses d´eriv´ees dr, de la forme X → Y avec X ∈ [C] et Y ∈ [BD] sont domin´ees par r2 : C → D. En g´en´eral, nous rencontrons une situation illustr´ee par la figure4.10. Consid´erons trois ferm´es X, Y et Z de g´en´erateurs respectifs GX, GY et GZavec GY, GZ comparables (exp. GY ⊂ GZ), en disposant de la relation d’ordre « domin´ee par » dans l’ensemble des r`egles n´egatives approximatives, nous sommes en mesure de comparer les deux r`egles r1 et r2. Dans le pr´esent cas, la r`egle r1 : GX → GY domine la r`egle r2 : GX → GZ et toutes ses d´eriv´ees.

Donc, au lieu de mettre les deux r`egles dans la base, on va se restreindre `a r1. C’est ainsi que nous avons d´efini la semi-base n´egative approximative :

Figure 4.10 – Choix des r`egles n´egatives dominantes

Comme dans le cas des autres semi-bases, certaines r`egles « redondantes » et leurs r`egles d´eriv´ees seront supprim´ees de la nouvelle base des r`egles n´egatives approximatives pour former la semi-base n´egative approximative. La disponibilit´e de ce type de base permettra `a l’utilisateur de focaliser ses interpr´etations dans l’ensemble des r`egles les plus informatives seulement. En cas de besoin, si l’utilisateur souhaite avoir les r`egles jug´ees redondantes, il est toujours possible de faire appel `a N BN A.

4.8.4 Semi-base n´egative exacte

Proposition 4.17. Soient r1 : X1 → Y1 et r2 : X2 Y2 deux ´el´ements de la Nouvelle Base des r`egles N´egatives exactes d’un certain contexte K= (O, I, R).

Par rapport `a la relation d’ordre d’inclusion, nous avons les deux r´esultats suivants : 1. X1 et X2 ne sont pas comparables.

2. Y1 et Y2 ne sont pas comparables.

Preuve. Prenons deux ´el´ements quelconque r1 : X1 → Y1 et r2 : X2 Y2 de la Nouvelle Base des r`egles N´egatives Exactes (N BN E). Comme r1 et r2 sont des ´el´ements de N BN E, il existe deux motifs ferm´es de supports non nuls F1 et F2 tels que X1 soit un g´en´erateur de F1 et X2 soit un g´en´erateur de F2, de plus, F1 et F2 sont des ´el´ements de Bd+(0). D´esignons par γ l’op´erateur de fermeture associ´e au contexte K. Effectuons un raisonnement par l’absurde. Supposons que X1 ⊂ X2, comme l’op´erateur de fermeture γ est isotone, γ(X1) ⊂ γ(X2), donc F1 ⊂ F2. Autrement dit, F2 est un sur-ensemble de F1 et ceci est en contradiction avec le fait que F1 est ´el´ement de Bd+(0), donc en contradiction avec le fait que r1 : X1 → Y1 est ´el´ement de N BN E. On peut donc conclure que X1 ne peut pas ˆetre un sous-ensemble de X2. Avec le mˆeme raisonnement, nous pouvons montrer que X2 ne peut pas ˆetre un sous ensemble de X1. X1 et X2 ne sont pas comparables.

D’autres part, les cons´equents des r`egles dans N BN E sont des singletons. Y1et Y2ne peuvent donc pas ˆetre comparables.

Corollaire 4.5. Aucune relation d’ordre bas´ee sur la relation d’inclusion ensembliste ne peut ˆetre d´efinie dans N BN E. C’est `a dire qu’en se servant uniquement de la relation d’in-clusion, il est impossible d’ordonner les ´el´ements de N BN E (les r`egles ne peuvent pas ˆetre comparables). Donc, aucune semi-base ne sera d´efinie `a partir de N BN E.

CHAPITRE 4. NOUVELLES BASES DES R`EGLES MGK-VALIDES

4.9 Conclusion partielle

Apr`es avoir apport´e des critiques par rapport `a la construction des anciennes bases des r`egles MGK-valides, nous avons pu proposer des nouvelles bases g´en´er´ees `a partir de l’utilisation des motifs ferm´es, des g´en´erateurs et les bordures positives. Dans la construction de ces nouvelles bases, nous avons aussi privil´egi´e l’utilisation de quelques propri´et´es souhaitables des r`egles non redondantes. Parmi ces propri´et´es, nous pouvons citer : la minimalit´e des pr´emisses, la maximalit´e des cons´equents des r`egles positives et la disjonction entre une pr´emisse et un cons´equent d’une r`egle. En ce qui concerne les r`egles n´egatives, nous avons montr´e qu’entre deux ou plusieurs r`egles n´egatives valides, celles qui ont des motifs n´egatifs minimaux sont les plus informatives (dans la pr´emisse comme dans le cons´equent).

En tenant compte de ces propri´et´es qui influencent l’informativit´e des r`egles d’association, nous avons pu proposer quatre nouvelles bases des r`egles valides selon la mesure MGK : Nou-velle Base des r`egles Positives Exactes (N BP E), NouNou-velle Base des r`egles N´egatives Exactes (N BN E), Nouvelle Base des r`egles Positives Approximatives (N BP A), Nouvelle Base des r`egles N´egatives Approximatives (N BN A). Nous avons propos´e des relations d’ordre dans chaque cat´egorie des bases des r`egles MGK-valides. Ces relations d’ordre nous permettront de comparer les r`egles entre elles. Ainsi, nous pouvons d´eterminer si une r`egle est plus in-formative que d’autres. En exploitant cette notion d’ordre dans l’ensemble des r`egles, nous avons pu r´eduire certains ´el´ements des nouvelles bases pour construire des ensembles des r`egles que nous avons appel´e semi-bases.

Relativement `a un niveau de confiance fix´e par l’utilisateur, les semi-bases regroupent toutes les r`egles les plus informatives seulement. De plus, il est appr´eciable que la consid´eration des semi-bases peut engendrer une r´eduction notable du nombre des r`egles en passant d’une base vers la semi-base associ´ee (cf. Tableau 4.10 et Tableau 4.11). Le mot semi-base vient du fait que ces ensembles ne sont pas tout `a fait des bases parce qu’avec eux, il est impos-sible de retrouver certaines r`egles valides. Nous avons donc pu construire trois semi-bases des r`egles MGK-valides : Semi-Base Positive Exacte (SBP E), Semi-Base Positive Approximative (SBP A) et Semi-Base N´egative Approximative (SBN A).

Dans le but d’automatiser l’extraction des connaissances `a partir des donn´ees en utilisant les outils math´ematiques que nous venons de d´ecrire, nous allons consacrer le prochain chapitre `a la conception des algorithmes relatifs `a la g´en´eration des bases des r`egles MGK-valides.

Chapitre 5