• Aucun résultat trouvé

Arbre de décision et données nominales

N/A
N/A
Protected

Academic year: 2022

Partager "Arbre de décision et données nominales "

Copied!
6
0
0

Texte intégral

(1)

Data Mining

Arbre de décisions

Arbres de décision et données binaires

Appliquez l’algorithme ID3 présenté en cours sur le tableau de données suivant.

Début de semaine En groupe Sexe Masculin Amateur de théâtre Apprécié

1 1 1 0 0

1 0 0 0 0

1 0 0 1 1

0 1 1 1 1

0 0 1 0 1

1 1 0 1 1

0 0 0 0 0

Arbre de décision et données nominales

Appliquez l’algorithme ID3 présenté en cours sur le tableau de données suivant.

Arbre de décision et données mixtes

Appliquez l’algorithme ID3 présenté en cours sur les données suivantes. Pour cela, vous devez trouver une méthode pour vous ramener au problème précédent avec des données purement nominales. Les données sont fournies dans le formalisme du logiciel WEKA vu en TP, c’est-à-dire au format .arff.

@relation weather

@attribute outlook {sunny, overcast, rainy}

@attribute temperature real

@attribute humidity real

@attribute windy {TRUE, FALSE}

@attribute play {yes, no}

@data

sunny,85,85,FALSE,no sunny,80,90,TRUE,no

overcast,83,86,FALSE,yes rainy,70,96,FALSE,yes rainy,68,80,FALSE,yes rainy,65,70,TRUE,no overcast,64,65,TRUE,yes sunny,72,95,FALSE,no sunny,69,70,FALSE,yes rainy,75,80,FALSE,yes sunny,75,70,TRUE,yes overcast,72,90,TRUE,yes overcast,81,75,FALSE,yes rainy,71,91,TRUE,no

(2)

Mining : le logiciel WEKA

Prise en main et Etude de fleurs.

Nous allons analyser des données concernant de la botanique.

Lancer le logiciel WEKA : java –jar weka.jar

Ce logiciel est développé en Java, et fournit le code source et la documentation complète des classes. On peut ainsi réutiliser les différents outils dans une application personnelle en important les classes nécessaires. Sachant que le langage JAVA propose des paquetages spécifiques à la gestion de bases de données, c’est un environnement idéal pour combiner les connaissances acquises en base de données, fouille de données et en programmation objet dans le cadre d’un stage ou d’un projet par exemple.

Nous allons utiliser l’environnement Explorer.

L’interface est composée de plusieurs panneaux. Dans la suite, je fais confiance à votre perspicacité pour répondre à certaines questions grâce à l’interface proposée.

Le panneau Preprocess

! "

# $ % % ! # & ' &

'

$ &

( $ ) # * * &

# $ % % &

+ , *

# - ! , * *

$ # + " " . / 0

0 + " ! #

' ! # 1 #

/ &

+ ! + ! 2 ,

Le panneau Visualisation

+ 2 3(

(3)

4 # 2 ! , 5 ! , 6* " ! #

+ #

" 2 * + 7 # 4 , 7 # /

! 8 4 + #

# * 5 6 + 3(

Le panneau Select Attributes

! # #2

! + + " + $

! #

4 * " ! #

- ' ! &

4 % + + &

9 +

Le panneau Classify

* # :! ; 0

! # ! 8 8

$

) <

' * ! # < 1 <

- " 8 !

: ! -

( " * 8 +

= # >

* $ ! ! $ * - $

!

??? - %+ ???

??? - $ ???

$ 1@ AA AAAA B

$ <@@ 77 777C B

D # <1@

??? ( $ E$ ???

D 0 0 0

< < @ AAA < %

@ @ @ @ %+

@ @ @ @ %+

(4)

??? , ???

# F%%

1@ @ @ G ? % 1@ @ @ G # ? %+

1@ @ @ G ? %+

(! # * $ + ! ) +

%+ ! % % ! ! # ! <@

# , * H + I ! , !

J 8 ! ! # $ !

! ! + !

! , : ! #

% # K # ! ,

+ =77 B > ! # !

+ AL B ! #

4 * # ) , # ,

AAB* , # ! 4 #

* D 0 , 9 =D

+ > M , 0 , , = + >

,

: D N=D O > 0 D N=D O > M

, ,

, &

- + * # 0 , + +

8 - + *

# &

" ! P

4 * 4 ) 1@

% % Q 1@ !

%+ R %+

$ " # ! E<

$ <% + <% =< + < # > 0 " + 3%

$ " # ! SLT +

# $ (A 0 " ! #

+ " 8 - U : 0-

0 " + ! SLT% 0D 8

(5)

0 " + E $ V

Le panneau Cluster

* + " + + % R ! W%

K ! # * " 0 : " +

# ! " + 4

# ! # * + + " , ,

,

Envol et Etude du temps.

! +

+ " X 4 "%

" + (A = $> 0 0 =

> $ "

4, " + % R ! =1 > + + *

&

+ " X

4 $ "

: ! , *

+ # * ( " ! 2

$ 4 * 0

# + " + " !

4 $ " + !

Critique et Etude d’un spectacle

0 " , #

# + "

.4W "%

+ # - + + "* R #

" 2 # #

" $ $ "

U " # # 8 ) , # *

+ # , U

* + !$ + )

(6)

( " + # $ # + " . / 0 - +

! #

0

# $ % % ! &

" ! ; 0 ( " + # , 4, "

9 " " ( # '

! # & R + + # # & - , &

- " Y ! $ = Z " -

0 - # >

! S = 2 ! # >* # "% +

0 S @

4 , 5 6* 2 + # =

> & , &

0

4 * $ # E

# ( # ' ! P +

DX 9 + 8 <* 3*@ 3*3*<

2! + ! + " 2 * ! # 3 = >

8 , + ) %E + <@3 %( + A<

" ! $ + 5 ( 6

# ' 2 + &

4 * " + # + (A

0 0

E + P

) S + 4 $ "

! + S%# ! # ! # X / 2

Références

Documents relatifs

En bas du formulaire, le bouton Visualisation produits permet d’afficher la liste des produits du fournis- seur ; le bouton Ajouter produits sert à afficher le formulaire Produits

La phase logique ou organisationnelle : dans cette phase, la base de données est re- présentée sous une forme logique plus proche de sa représentation réelle au

Donnez des droits de consultation de toutes les tables de la BD biblio aux bibliothécaires ainsi que des droits de consultation, d’insertion sur les tables des emprunts,

Indiquer au système une clé primaire pour chaque table permet une indexation des données à l'aide de cette clé, ce qui renforce l'efficacité des procédures d'interrogation de

public static boolean createTempFile(String p, String e, File dir) Création d'un chier temporaire (pas obli- gatoirement eacé à la n de l'appli- cation) dans le répertoire dir, dont

– si un même type d’entité intervient plusieurs fois dans un même type d’association, on doit explicitement indiquer le rôle de chaque entité – si on a

NumEtud Nom Prenom Adresse DateNais Sexe NumCours NomCours NomProf NbHC NbHTD NbHTP NumEtud NumCours Note. E1

Des pilotes existent pour mySQL, postGresSQL, ACCESS,... - Le DriverManager est une classe qui ne contient que des méthodes statiques. Elle fournit des méthodes qui sont des