Exercices du 18 mai 2005
Exercices IBD 1 / 2
Séance d'Exercices IBD N°9
Question 1 : Commentaire sur un arbre de décision
Dans le but de construire un outil d’aide au diagnostic des anomalies de la tension artérielle, la clinique « Petit-Des-Champs » a effectué un échantillonnage simple dans le fichier de ses anciens patients pour en extraire un modèle. Ce dernier se présente sous la forme d’un arbre de décision, la variable endogène est l’état de la pression artérielle (trois valeurs possibles : {Normal, High, Low}), les variables exogènes sont des informations signalétiques relatives au patient (taille, âge,…).
a) Combien de règles peut-on extraire de cet arbre ?
b) Construire la matrice de confusion relative à cet arbre et calculer le taux d’erreur associé. Qu’en concluez-vous ?
c) Le domaine de la médecine étant très sensible, il est impératif de s’assurer de la qualité de la prédiction. Si l’on fixe une précision minimum de 70% (taux de biens classés sur une feuille) et un support minimum de 20 individus pour chaque règle (nombre d’individus couverts) extraite, listez les règles que l’on peut garder.
Exercices du 18 mai 2005
Exercices IBD 2 / 2
Question 2 : application de l’algorithme ID3 sur un exemple
a) Dérouler l'algorithme ID3 sur l'exemple ci-dessous :
Age Revenue Solvabilité Etudiant Achète-ordinateur
<= 30
<= 30 31..40
> 40
> 40
> 40 31..40
<= 30
<= 30
> 40
<= 30 31..40 31..40
> 40
Elevé Elevé Elevé Moyen Bas Bas Bas Moyen Bas Moyen Moyen Moyen Elevé Moyen
Mauvaise Bonne Mauvaise Mauvaise Mauvaise Bonne Bonne Mauvaise Mauvaise Mauvaise Bonne Bonne Mauvaise Bonne
Non Non Non Non Oui Oui Oui Non Oui Oui Oui Non Oui Non
Non Non Oui Oui Oui Non Oui Non Oui Oui Oui Oui Oui Non