• Aucun résultat trouvé

Exercices du 18 mai 2005 Exercices IBD 1 / 2 Séance d'Exercices IBD N°9

N/A
N/A
Protected

Academic year: 2022

Partager "Exercices du 18 mai 2005 Exercices IBD 1 / 2 Séance d'Exercices IBD N°9"

Copied!
2
0
0

Texte intégral

(1)

Exercices du 18 mai 2005

Exercices IBD 1 / 2

Séance d'Exercices IBD N°9

Question 1 : Commentaire sur un arbre de décision

Dans le but de construire un outil d’aide au diagnostic des anomalies de la tension artérielle, la clinique « Petit-Des-Champs » a effectué un échantillonnage simple dans le fichier de ses anciens patients pour en extraire un modèle. Ce dernier se présente sous la forme d’un arbre de décision, la variable endogène est l’état de la pression artérielle (trois valeurs possibles : {Normal, High, Low}), les variables exogènes sont des informations signalétiques relatives au patient (taille, âge,…).

a) Combien de règles peut-on extraire de cet arbre ?

b) Construire la matrice de confusion relative à cet arbre et calculer le taux d’erreur associé. Qu’en concluez-vous ?

c) Le domaine de la médecine étant très sensible, il est impératif de s’assurer de la qualité de la prédiction. Si l’on fixe une précision minimum de 70% (taux de biens classés sur une feuille) et un support minimum de 20 individus pour chaque règle (nombre d’individus couverts) extraite, listez les règles que l’on peut garder.

(2)

Exercices du 18 mai 2005

Exercices IBD 2 / 2

Question 2 : application de l’algorithme ID3 sur un exemple

a) Dérouler l'algorithme ID3 sur l'exemple ci-dessous :

Age Revenue Solvabilité Etudiant Achète-ordinateur

<= 30

<= 30 31..40

> 40

> 40

> 40 31..40

<= 30

<= 30

> 40

<= 30 31..40 31..40

> 40

Elevé Elevé Elevé Moyen Bas Bas Bas Moyen Bas Moyen Moyen Moyen Elevé Moyen

Mauvaise Bonne Mauvaise Mauvaise Mauvaise Bonne Bonne Mauvaise Mauvaise Mauvaise Bonne Bonne Mauvaise Bonne

Non Non Non Non Oui Oui Oui Non Oui Oui Oui Non Oui Non

Non Non Oui Oui Oui Non Oui Non Oui Oui Oui Oui Oui Non

Références

Documents relatifs

On admet que dans la population d’enfants de 11 à 14 ans d’un département français le pourcentage d’enfants ayant déjà eu une crise d’asthme dans leur vie est de 13%.

6) Tracer la courbe de g -1 sur le

1) Rechercher tout d'abord les différentes dimensions et proposez éventuellement une hiérarchie pour ces dimensions (certaines dimensions n'auront pas de hiérarchie). 2) Pour

Une entreprise désire créer un fichier contenant pour chacun de ses 240 employés les informations suivantes: le nom (sur 25 caractères), le prénom (15 caractères), l’âge

Student(STUID, STUname, Major, Credits) Faculty(FACID, FACname, Dept, Rank) Class(Course#, Facno, Sched, Room) Enroll(Coursno, STUno, Grade). 1) Considérer le graphe ci-dessous

Si T1 se passe mal (RollBack), alors T2 utilisera des données incorrectes (lectures avant le RollBack) et écrira des informations incorrectes dans la base.. Toutes transactions

- Ainsi, la transaction T1 est confirmée parce qu'elle a fait commit avant le dernier checkpoint mais on ne sait pas si ses valeurs ont été écrites sur disque car la panne a eu

ƒ Mêmes fonctions d'agrégation que pour la dimension Organisation - L'axe Status marital avec la hiérarchie suivante:. o Un status marital (marié, concubinage, pacs,