• Aucun résultat trouvé

Nous avons étudié plusieurs parties du jeu Eleusis [Gar59]. Eleusis est un jeu de cartes dont le but est de trouver une règle secrète. Les règles secrètes sont des séquences de cartes contenant une partie droite et une partie gauche. Chaque partie peut contenir plusieurs cartes. Ce jeu permet de simuler la découverte scientifique qui est formée de tests, publications et réfutations. Nous avons donc analysé différentes parties du jeu développé1 dans [DS05]. Nous avons décrit ce problème selon plusieurs dimensions d’analyse :

– une dimension organisant la valeur des cartes (figures, chiffres, impairs, pairs, etc.) – une dimension organisant la couleur des cartes (rouge, noir, cœur, etc.)

– une dimension positionnant la carte dans la séquence (partie droite ou gauche) – une dimension pour la réponse de l’oracle (exemple positif ou négatif).

A l’aide de M2S_CD, nous obtenons des séquences convergentes et divergentes sur ce jeu de don- nées. Une des séquences divergentes extraites est : Pour la règle nénuphar, les joueurs jouent fréquemment le trois de pique, puis l’as de pique avant de jouer un carte impaire de type pique puis une carte impaire de couleur noire. Une des séquences convergentes extraites est : Pour la règle lis, les joueurs proposent d’abord une carte rouge puis une carte de cœur et enfin une carte de type chiffre de couleur cœur. Notons que ces règles, déclarées pertinentes par l’expert, n’auraient jamais pu être extraites à l’aide d’un algorithme classique.

2.2

Discussion

Dans ce chapitre, nous proposons une méthode originale pour extraire des connaissances multidimen- sionnelles définies sur plusieurs niveaux de hiérarchies mais selon un certain point de vue : du général au particulier ou vice et versa. Nous définissons ainsi le concept de séquences multidimensionnelles conver- gentes ou divergentes ainsi que les algorithmes associés basés sur le paradigme "pattern growth". Des expérimentations, sur des jeux de données synthétiques et réelles, montrent l’intérêt de notre approche M 2S_CD.

Il est nécessaire d’effectuer une analyse plus approfondie des connaissances extraites afin de ne retenir que les séquences qui sont réellement convergentes ou divergentes et d’éviter d’extraire des séquences qui sont artificiellement convergentes ou divergentes. Il serait également intéressant de tester notre proposition sur d’autres types de données réelles afin d’extraire de nouveaux types de connaissances comme la naissance d’une mode (études des achats), la découverte de pandémies (données hypocratiques) ou l’extraction d’article « fondateur » (données bibliographiques). A partir de ces nouveaux types de connaissances, nous pouvons extraire les top k séquences convergentes ou divergentes.

1

0 100 200 300 400 500 600 700 3 3.5 4 4.5 5 Runtime (s) Profondeur M2S_CD

(a) Temps d’exécution en fonction de la profondeur des hiérarchies (Degré =3) 0 100 200 300 400 500 600 700 3 3.5 4 4.5 5 # FREQ. Profondeur M2S_CD

(b) #séquences extraites en fonction de la profondeur des hiérarchies (Degré =3)

0 200 400 600 800 1000 3 3.5 4 4.5 5 Runtime (s). Profondeur M2S_CD

(c) Temps d’exécution en fonction du degré des hiérar- chies (Profondeur =4) 0 100 200 300 400 500 600 700 3 3.5 4 4.5 5 # FREQ. Profondeur M2S_CD

(d) #séquences extraites en fonction du degré des hié- rarchies (Profondeur =4)

1 10 100 1000 140 150 160 170 180 190 200 Runtime (s) Support M2S_CD

(a) Temps d’exécution en fonction du support (Profon- deur =3, Degré =3) 1 10 100 1000 140 150 160 170 180 190 200 # FREQ. Support M2S_CD

(b) #séquences extraites en fonction du support (Pro- fondeur =3, Degré =3) 0 100 200 300 400 500 600 700 800 2 2.5 3 3.5 4 4.5 5 Runtime (s) # dimensions d’analyse M2S_CD

(c) Temps d’exécution en fonction du nombre de di- mensions d’analyse (Profondeur =3, Degré =3)

0 50 100 150 200 250 300 2 2.5 3 3.5 4 4.5 5 # FREQ. # dimensions d’analyse M2S_CD

(d) #séquences extraites en fonction du nombre de di- mensions d’analyse (Profondeur =3, Degré =3)

Chapitre 3

Prise En Compte De La Mesure

3.1

Introduction

Dans les chapitres précédents, nous nous sommes intéressés à la prise en compte de certaines spécifi- cités inhérentes aux bases de données multidimensionnelles comme la multidimensionnalité et la présence de hiérarchies. Or, les données multidimensionnelles possèdent une autre spécificité qu’il est nécessaire de prendre en compte : la mesure. La mesure est une dimension numérique représentant le résultat de l’agrégation des faits définis sur les autres dimensions. Cette dimension apporte des informations signi- ficatives qui peuvent permettre d’améliorer la qualité de connaissances extraites si elle est correctement prise en compte car la prise en compte d’une dimension numérique dans l’extraction de motifs est un problème en soit. En effet, les approches d’extraction de motifs (séquentiels ou non, multidimensionnels ou non) s’appuient bien souvent sur une gestion symbolique des données qu’elles analysent alors que celle-ci peuvent nécessiter un tout autre traitement.

Dans ce chapitre, nous proposons différentes façons de prendre en compte la mesure :

– Nous introduisons des contraintes sur la mesure afin de ne considérer que les cellules vérifiant cette condition.

– Nous proposons de discrétiser cette dimension particulière à l’aide de partitions strictes ou floues. – Nous proposons également de prendre en compte la mesure pour calculer le support des séquences

multidimensionnelles.

Ce chapitre est organisé de la façon suivante. Nous montrons d’abord les limites des algorithmes définis précédemment lorsqu’ils doivent considérer les mesures des cellules dans un cube de données. Nous présentons ensuite les travaux sur l’extraction de motifs qui essaient de prendre en compte des attributs numériques. Nous présentons ensuite nos trois propositions pour prendre en compte cette dimension numérique. Chaque proposition est validée par des expérimentations effectuées sur des jeux de données synthétiques ou réels. Enfin, dans la section 3.7, nous discutons nos différentes propositions et introduisons des perspectives associées à ces travaux.

136 CHAPITRE 3. PRISE EN COMPTE DE LA MESURE

Documents relatifs