• Aucun résultat trouvé

FIASCO : un nouvel algorithme d'extraction d'itemsets fréquents dans les flots de données.

N/A
N/A
Protected

Academic year: 2021

Partager "FIASCO : un nouvel algorithme d'extraction d'itemsets fréquents dans les flots de données."

Copied!
3
0
0

Texte intégral

(1)

HAL Id: hal-00447421

https://hal.archives-ouvertes.fr/hal-00447421

Submitted on 15 Jan 2010

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

FIASCO : un nouvel algorithme d’extraction d’itemsets

fréquents dans les flots de données.

Lionel Vinceslas, Jean-Émile Symphor, Alban Mancheron, Pascal Poncelet

To cite this version:

(2)

FIASCO

: un nouvel algorithme d’extraction d’itemsets

fréquents dans les flots de données

Lionel VINCESLAS∗, Jean-Émile SYMPHOR, Alban MANCHERONet Pascal PONCELET∗∗ ∗GRIMAAG, Université des Antilles et de la Guyane, Martinique, France.

{lionel.vinceslas,je.symphor,alban.mancheron}@martinique.univ-ag.fr,

∗∗EMA-LG2IP/site EERIE, Parc Scientifique Georges Besse, 30035 Nîmes Cedex, France.

pascal.poncelet@ema.fr

Résumé. Nous présentons dans cet article un nouvel algorithme permettant la

construction et la mise à jour incrémentale duFIAθ1:FIASCO. Notre algorithme effectue un seul passage sur les données et permet de prendre en compte les nouveaux batches, itemset par itemset et pour chaque itemset, item par item.

1

Introduction

LeFIAθ est un nouvel automate qui permet de traiter de façon efficace la problématique de l’extraction des itemsets fréquents dans les flots de données.FIASCOest l’algorithme qui permet de construire et de mettre à jour leFIAθen effectuant un seul passage sur les données. Notre objectif dans cet article est de présenter et d’illustrer par l’expérimentation l’applicabilité et le passage à l’échelle deFIASCOdans le cas des flots de données.

2

FIASCO

(Frequent Itemset Automaton Stepwise Construction Operator)

LeFIAθest un automate déterministe et acyclique, ce qui nous permet d’établir une relation d’ordre sur ses états (notée 4). De par cette relation d’ordre, nous introduisons un algorithme en deux passes pour la construction de cet automate, en utilisant des bits positions :FIASCO2. Cet algorithme utilise les propriétés d’Apriori afin d’optimiser sa construction, ce qui le rend efficace dans le cas d’une base de données (cf.section 3). Nous proposons aussi un algorithme en une passe (FIASCO1), pour les flots de données, permettant de mettre à jour incrémentale-ment leFIAθ, item par item, avec une phase d’élagage en utilisant un support statistique.

3

Expérimentations

Les expérimentations ont été réalisées sur les jeux de données2 kosarak et T10I4D100K,

sur une machine munie d’un bi-processeurAMD ATHLON3600+ 64 bits, avec 1Go deRAM.

1LeFIA

θest présenté comme article long à EGC’08

(3)

FIASCO 3 4 5 6 7 8 9 10 11 12 40 35 30 25 20 15 10 2.02 Temps (secondes) Support (%) kosarak FIASCO2 FP-Growth Apriori 10000 40 35 30 25 20 15 10 2.02 Memoire (Ko) Support (%) kosarak FIASCO2 FP-Growth Apriori 1 10 100 1000 10000 100000 40 35 30 25 20 15 10 2.02 Etats et noeuds Support (%) kosarak FIA FP-Tree

« Les résultats confirment bien l’applicabilité du

FIAθ dans les flots de données (cf. courbes du jeu de données T10I4D100K). Les résultats obtenus sont comparables voire meilleurs pour certaines valeurs de support que Apriori et FP-Growth, sachant que le FIAθ est une structure qui indexe les itemsets

fré-quents du flot de données. »

30 35 40 45 50 0 2 4 6 8 10 12 14 16 18 20 Temps (secondes) Batchs T10I4D100K FIASCO1 100 150 200 250 300 350 400 450 500 0 2 4 6 8 10 12 14 16 18 20 Memoire (Ko) Batchs T10I4D100K FIASCO1

4

Conclusion

Nous présentons dans cet article un nouvel algorithme,FIASCO, qui permet de construire et de mettre à jour incrémentalement leFIAθappliqué aux flots de données. Cet algorithme est en une passe, avec une granularité par item. Les expérimentations, avec une analyse en temps et en espace, montrent l’applicabilité et le passage à l’échelle de l’algorithme.

Summary

We present in this paper a new algorithm for constructing and incrementally updating the

FIAθ : FIASCO. Our algorithm only needs one scan over the data and takes into account the

new batches, itemset per itemset and for each itemset, item per item.

Références

Documents relatifs

Enfin, les nouveaux silanols disponibles peuvent réagir avec la fonction d’ancrage de la deuxième fonction aboutissant à un matériau bifonctionnalisé dont les sites précurseurs

We refer to the class of programs restricted to a finite set of values as finite-value programs, and to the class of programs restricted to at most n ∈ N (resp., 1) region

On définit une structure de données Encodeur permettant de représenter, sous forme d’un enregistrement, l’état du codeur de longueurs de séquences. Cet état correspond à

Comme pour les machines habituellement manipul´ees dans S WING S TATES , les conditions de d´eclenchement des transitions sont r´eparties entre le type de transition, les

Via l’utilisation jointe d’une modélisation sous la forme d’un graphe orienté pondéré et d’un algo- rithme de recherche de flot de coût minimum dans un graphe de

L’algorithme développé pour la mise à jour du FIA effectue un unique passage sur les données qui sont prises en compte par batch, itemset par itemset et pour chaque itemset, item

ou un pont et nous permet de connaître un chemin entre deux structures. Parmi tous les liens possibles entre deux groupes nous ne conserverons que celui ayant la

Donc, nous avons fait beaucoup de lecture globale et imprimée, mais la mémoire rétive de certains enfants n'arrive pas, en tous cas insuffisamment vite, à se