Année 2020/2021
2/6
TD/TP n° 2 : Modules "Datamining" (M2-IL) & " Fouille & Extraction de données " (M2-ISIA) Weka & "Règles d'association"
Travail à faire :
Le tableau suivant représente des achats (transactions) faits par des clients d'un hypermarché. Les items pi correspondent aux articles achetés.
Panier P1 P2 P3 P4
1 1 1 1 0
2 1 0 1 0
3 1 1 1 0
4 1 0 1 0
5 0 1 1 0
6 0 0 0 1
Exercice 1 : Donnez la définition d'une règle d'association X → Y.
Exercice 2 : Rappelez l'objectif général du modèle des règles d'association (RA).
Exercice 3 : Donnez le volume de chaque transaction.
Exercice 4 : Combien y'a-t-il de RA candidates ?
Exercice 5 : Donnez toutes les RA X → Y, où card(X)=1 et card(Y)=2.
Exercice 6 : Calculez le "support" et la "confiance" de chacune des RA trouvées à l’exercice 5. Que peut-on conclure
?.
Exercice 7 : Calculez le "support" et la "confiance" des RA suivantes. Que peut-on conclure ? :
{ p1 } → { p2 } { p2 } → { p1 }
{ p1 } → { p2, p3 } { p1, p2 } → { p3 }
Exercice 8 : Décrivez la méthode basique pour extraire les RA . Quels sont ses inconvénients ?.
Exercice 9 : Expliquez comment l'algorithme "apriori" améliore la méthode d'extraction .
Exercice 10 : Déroulez l'algorithme "apriori" sur les données de l'exemple pour extraire toutes les RA avec minsup=2 (2/6 = 33%).
Exercice 11 : Confrontez votre résultat avec une exécution sur Weka.