• Aucun résultat trouvé

Classification des arythmies cardiaques par les arbres de décision flous

N/A
N/A
Protected

Academic year: 2021

Partager "Classification des arythmies cardiaques par les arbres de décision flous"

Copied!
96
0
0

Texte intégral

(1)

République Algérienne Démocratique et Populaire Université Abou Bakr Belkaid– Tlemcen

Faculté des Sciences Département d’Informatique

Mémoire de fin d’études

pour l’obtention du diplôme de Master en Informatique

Option: Modèle Intelligent et Décision(M.I.D)

Thème

Classification des arythmies cardiaques par les arbres

de décision flous

Réalisé par :

- Mme OUISSI Fatima Zohra née BILLAMI

Présenté le 06 décembre 2011 devant le jury composé de MM.

- BENAMMAR Abdelkrim (Président)

- CHIKH MED Amine. (Encadreur)

- HADJILA FethAllah (Examinateur)

- BENZIANE Yaghmoracen (Examinateur)

(2)

Dédicaces

Je dédie ce mémoire

A mon Mari Nabil, mes enfants Alae, Abderrahmane, mes beaux parents, mes

beaux frères,

ma mère, mes sœurs et mes frères

A la mémoire de mon père

Ainsi qu’à tous mes enseignants et mes amis(es), tous ceux que j’ai connus de

prés ou de loin.

(3)

Avant tout, je remercie mon Dieu pour m’avoir donné le courage, la volonté et la

patience pour réaliser ce présent travail.

Je tiens à remercier toute personne ayant contribué de prés ou de loin à l’aboutissement

de ce travail.

Tout d’abord Mr CHIKH Med

Amine

, pour son dévouement, ses conseils bienveillants,

ses critiques et son aide précieuse.

J’exprime mes profonds remerciements à Monsieur BEHADADA Omar.

J’aimerais également remercier les membre du jury : Mr

BENAMMAR Abdelkrim pour

avoir accepté de présider le jury et MM

HADJILA FethAllah

,

BENZIANE Yaghmoracen

pour

avoir bien voulu examiner mon travail.

Ma profonde gratitude s’adresse également à tous les enseignants du département

d’informatique et à leur tête le chef du département Mr

A. BENAMAR, qui ont dépensé tant

d’efforts pour nous inculquer le savoir.

(4)

1

Table des matières

TABLE DES MATIERES ... 1

TABLE DES FIGURES ... 4

RESUME : ... 7 ABSTRACT: ... 7 CHAPITRE 1 ... 10 LE CŒUR ET L’ELECTROCARDIOGRAPHIE ... 10 PRESENTATION ... 10 1.1 LE SYSTEME CARDIOVASCULAIRE : ... 11 1.2 ANATOMIE DU CŒUR : ... 11 1.3 FONCTIONNEMENT ELECTRIQUE : ... 12

1.4 L’ELECTROCARDIOGRAPHIE :(OU L‟ART D‟ENREGISTRER L‟ACTIVITE ELECTRIQUE DU CŒUR) : ... 13

1.4.1 Principe de l’électrocardiogramme (ECG) ... 13

1.5 ONDES CONSTITUANTS UN ECG : ... 17

1.5.1 Onde P : ... 18 1.5.2 Le complexe QRS : ... 19 1.5.3 L'onde T : ... 19 1.5.4 L'intervalle PR : ... 20 1.6 RYTHME CARDIAQUE : ... 20 1.6.1 Origine sinusale : ... 21 1.6.2 Origine jonctionnelle :... 21 1.6.3 Origine ventriculaire : ... 22

1.6.4 Origine ectopique auriculaire : ... 22

1.6.5 Origine artificielle (pace maker) : ... 23

1.7 ARYTHMIE OU TROUBLES DU RYTHME CARDIAQUE ... 23

1.7.1 Extrasystole : ... 24

1.7.2 Bradycardie : ... 24

1.7.3 Fibrillation auriculaire : ... 25

1.7.4 Tachycardie ventriculaire : ... 25

1.7.5 Tachycardie paroxystique (c'est-à-dire qui arrive par crise) : ... 26

1.7.6 Fibrillation ventriculaire : ... 26

1.8 EXTRASYSTOLES :... 26

1.8.1 Cause des extrasystoles : ... 27

1.9 TYPES D'EXTRASYSTOLES: ... 27

1.9.1 Extrasystoles auriculaires (ESA): ... 27

1.9.2 Extrasystoles nodales (ou jonctionnelles) (ESJ): ... 28

1.9.3 Extrasystoles ventriculaires (ESV): ... 28

(5)

2

LES ARBRES DE DECISION CLASSIQUES ET FLOUS ... 31

PRESENTATION ... 31

1.10 ARBRE DE DECISION CLASSIQUE : ... 32

1.10.1 Construction d’un arbre de décision :... 32

1.10.1.1 Bases de règles : ... 32

1.10.1.2 Prétraitements : ... 32

1.10.1.3 Algorithme de l’arbre de décision: ... 33

1.10.1.4 Phase d’apprentissage :... 33

1.10.2 Elagage d’un arbre de décision : ... 35

1.10.2.1 Le pré-élagage : ... 35

1.10.2.2 Le post-élagage : ... 36

1.10.3 Algorithme de création de l’arbre : ... 36

1.10.3.1 Algorithme ID3 (Induction of Decision Tree): ... 36

1.10.4 Autres algorithmes : ... 37

1.10.4.1 Algorithme C4.5 : ... 37

1.10.4.2 Algorithme CART (Classification and Regression Tree) : ... 37

1.11 ARBRE DE DECISION FLOU : ... 38

1.11.1 Concepts de la logique floue: ... 38

1.11.1.1 Historique: ... 38

1.11.1.2 Sous-ensembles flous : ... 39

1.11.1.3 Opérations de base sur les sous-ensembles flous : ... 40

1.11.2 Principes d’un arbre de décision flou : ... 42

1.11.2.1 Construction des arbres de décision flous : ... 43

1.11.3 Caractéristiques principales d’un arbre de décision flou: ... 44

1.11.4 Induction d’un arbre de décision flou : ... 46

1.11.5 Optimisation de l’arbre de décision flou: ... 48

1.12 RESUME : ... 48

CHAPITRE 3 ... 50

RESULTATS ET INTERPRETATIONS ... 50

PRESENTATION ... 50

3.1 CHOIX DES VARIABLES D’ENTREE : ... 51

3.1.1 Caractérisation du vecteur d’entré : ... 51

3.1.2 Présentation de la base de données ... 51

3.1.3 Caractérisation du signal ECG : ... 52

3.1.4 Analyse des variables d’entrée : ... 52

3.1.5 Analyse de l’importance des variables : ... 53

3.1.6 Présentation du logiciel FisPro : ... 53

3.1.7 Exploration de la base de données : ... 54

3.1.7.1 Représentation bidimensionnelle : ... 55

3.1.7.2 Représentation tridimensionnelle : ... 57

3.2 CONSTRUCTION DU SYSTEME D’INFERENCE FLOU (SIF) : ... 60

3.2.1 Choix des modalités floues et de quelques paramètres : ... 60

3.2.2 Critères de performances : ... 60

3.2.3 Étape de construction et d’analyse de l’arbre de décision flou : ... 61

(6)

3

3.2.3.2 Extraction de règles de classification à partir d’un arbre de décision... 62

3.2.4 Choix initiaux des modalités floues : ... 62

3.2.4.1 1ere expérimentation : ... 62 3.2.4.2 2ième expérimentation : ... 70 3.2.4.3 3ième expérimentation ... 78 3.2.4.4 4ième expérimentation ... 82 3.2.4.5 5ème expérimentation ... 86 CONCLUSION GENERALE... 90 4 ... 92

5 A BASE DE DONNEES MIT-BIH : ... ERREUR ! SIGNET NON DEFINI. BIBLIOGRAPHIE ... 92

(7)

4

Table des figures

Figure ‎1.1: Représentation du cœur ... Erreur ! Signet non défini.

Figure ‎1.2 Circuit électrique du cœur ... 13

Figure ‎1.3 Génération d'une activité électrique... 14

Figure ‎1.4 La corrélation entre le signal ECG et le cycle cardiaque ... 14

Figure ‎1.5 Enregistrement d'un ECG 3 voies ... 15

Figure ‎1.6 Ondes, intervalles et segments dans l'ECG ... 16

Figure ‎1.7 ECG normal ... 17

Figure ‎1.8 le cycle cardiaque complet ... 18

Figure ‎1.9 Onde P... 18

Figure ‎1.10 Le complexe QRS ... 19

Figure ‎1.11 Onde T ... 19

Figure ‎1.12 Rythme sinusal (ondes P identiques) ... 21

Figure ‎1.13 Rythme jonctionnel (ondes P rétrogrades) ... 21

Figure ‎1.14 Rythme Ventriculaire ... 22

Figure ‎1.15 Extrasystole Supraventriculaire ... 22

Figure ‎1.16 Extrasystole Ventriculaire ... Erreur ! Signet non défini. Figure ‎1.17 Arythmie complète par Fibrillation Auriculaire ... 25

Figure ‎1.18 Extrasystole auriculaire ... 28

Figure ‎1.19 Extrasystoles jonctionnelles ... 28

Figure ‎1.20 Extrasystoles ventriculaires ... 29

Figure ‎2.1 Logique classique ... 39

Figure ‎2.2 Logique floue ... 40

Figure ‎2.3 Fonction d’appartenances... 41

Figure ‎2.4 Intersection des fonctions d’appartenances ... 41

Figure ‎2.5 Union des fonctions d’appartenances ... 42

Figure ‎2.6 Arbre booléen (à gauche) et arbre flou ... 44

Figure ‎2.7 Appartenance au nœud ... 45

Figure ‎3.1 Différentes ondes du signal électrocardiogramme (ECG)... 52

Figure ‎3.2 Fenêtre principale du Logiciel FisPro ... 53

Figure ‎3.3 (a, b) : Une représentation de RR0 à gauche et de RRs à droite en fonction de la classe... 55

Figure ‎3.4 (a, b) : Une représentation de COMP à gauche et de QRS à droite en fonction de la classe ... 56

Figure ‎3.5 Représentation 3D du RRO et RRS en fonction de la classe ... 57

Figure ‎3.6 Représentation 3D du QRS et COMP en fonction de la classe... 58

Figure ‎3.7 Représentation 3D du QRSet RR0 en fonction de la classe ... 58

Figure ‎3.8 Représentation 3D du QRS et RRS en fonction de la classe ... 59

(8)

5

Figure ‎3.10 (a, b) : Histogramme de COMP à gauche et QRS à droite... 63

Figure ‎3.11 Arbre complet généré ... 64

Figure ‎3.12 Arbre complet généré - Zoom partie gauche ... 65

Figure ‎3.13 Arbre complet généré - Zoom partie droite ... 66

Figure ‎3.14 Arbre complet généré - Zoom partie centre ... 67

Figure ‎3.15 Arbre de décision flou optimisé (élagué) réduit à 5 branches ... 68

Figure ‎3.16 Extraction de règles de classification ... 68

Figure ‎3.17 Matrice de confusion ... 69

Figure ‎3.18 (a, b) : Histogramme de RR0 à gauche et RRs à droite ... 70

Figure ‎3.19 (a, b) : Histogramme de COMP à gauche et QRS à droite... 71

Figure ‎3.20 Table des règles... 72

Figure ‎3.21 Matrice de confusion ... 73

Figure ‎3.22 Arbre complet généré par FisPro constitué de 34 branches (34 feuilles) ... 74

Figure ‎3.23 Arbre complet généré - Zoom partie gauche ... 75

Figure ‎3.24 Arbre complet généré - Zoom partie centrale ... 76

Figure ‎3.25 Arbre complet généré - Zoom partie droite ... 76

Figure ‎3.26 Arbre de décision flou optimisé (élagué) réduit à 6 branches ... 77

Figure ‎3.27 (a, b) : Histogramme de RR0 à gauche et RRs à droite ... 78

Figure ‎3.28 (a, b) : Histogramme de COMP à gauche et QRS à droite... 79

Figure ‎3.29 Table des régles... 80

Figure ‎3.30 Matrice de confusion ... 80

Figure ‎3.31 Arbre complet généré par FisPro constitué de 78branches (78feuilles). ... 81

Figure ‎3.32 Arbre de décision flou optimisé (élagué) réduit à 7branches ... 82

Figure ‎3.33 (a, b) : Histogramme de RR0 à gauche et RRs à droite ... 83

Figure ‎3.34 (a, b) : Histogramme de COMP à gauche et QRS à droite... 84

Figure ‎3.35 Table des règles... 84

Figure ‎3.36 Matrice de confusion ... 85

Figure ‎3.37 (a, b) : Histogramme de RR0 à gauche et RRs à droite ... 86

Figure ‎3.38 (a, b) : Histogramme de COMP à gauche et QRS à droite... 87

Figure ‎3.39 Table des règles... 87

(9)

6

Liste des tableaux

Tableau ‎3.1 Signification des paramètres contenus dans la base de données... 52

Tableau ‎3.2 Calcul des performances ... 69

Tableau ‎3.3 Calcul des performances ... 73

Tableau ‎3.4 Calcul des performances ... 81

Tableau ‎3.5 Calcul des performances ... 85

Tableau ‎3.6 Calcul des performances ... 88

(10)

7

Résumé :

Dans ce travail nous appliquons la méthode de l‟arbre de décision flou afin d‟implémenter un classifieur des arythmies cardiaques. Dans un premier temps nous introduisons des notions de base en cardiologie en précisant la nature électrique du signal ECG et ses différentes ondes (P, Q, R, S et T). Nous présentons après la définition des arythmies cardiaques ciblées dans notre étude. Par la suite, nous présentons notre méthode basée sur les arbres de décision flous (algorithme ID3 de construction de l‟arbre) et quelques notions importantes (entropie, et gain d‟information).

Les résultats de nos expérimentations et leurs interprétations sont donnés pour mieux comprendre notre approche et bien voir l‟apport de cette dernière particulièrement dans le domaine cardiologique.

Mots clés : Electrocardiogramme (ECG), extrasystole ventriculaire, extrasystole auriculaire, extrasystole jonctionnelle, arbre de décision flou, ID3, entropie, règles floues.

Abstract:

In this memoire, we are going to treat the extraction of knowledge from data, in using the trees of decisions in order to implement a classifier of cardio-pathologies

In the first instance, we introduce the basic notions of electrophysiology of the heart in precizing the nature of electric signal ECG and its different waves (P, Q, R, S and T)

We present after that the definitions of some cardio-pathologies containing anomalies predefined in our study like premature ventricular contraction (V), right bundle branch block beat(R) and Left bundle branch block beat (L).

After that we present our method based on the trees of decisions (Algorithm ID3) and some other important notions.

The results of our experiments and their interpretations are given to better understand our approach and see better the influence of the latter on the cardiology, sphere.

Key words: cardio-pathologies, premature ventricular contraction, bloc of conduction, trees of decisions, extraction of knowledge, Algorithm ID3.

(11)

8 Introduction générale

L‟intelligence artificielle (IA) est une discipline en évolution rapide qui manipule des concepts, des techniques et des technologies informatiques pour traiter des problèmes difficilement résolus par l‟homme dont la solution exige des connaissances, de la perception, du raisonnement et de l‟apprentissage. Chaque jour, l‟IA offre son lot de découvertes dans différents domaines, tout comme en médecine. Les systèmes d‟aide au diagnostic et de suivi médical des patients, ont un rôle important dans l‟amélioration de la qualité des diagnostics. Ces systèmes constituent donc des moyens techniques indispensables dans le domaine médical notamment, la cardiologie. Dans un tel domaine, de nombreuses méthodes de classification ont été appliquées, cherchant toujours à améliorer et augmenter l‟efficacité et l‟interprétabilité.

Nous nous intéressons au domaine de la reconnaissance des arythmies cardiaques qui est devenu l‟un des sujets de recherche les plus intéressants en classification.

Dans ce travail nous avons appliqué la méthode de l‟arbre de décision flou pour la classification de quelques anomalies cardiaques en utilisant base de donnée MIT, sachant que la plus part des classifieurs des arythmies cardiaques développés au cours de ces dernières années, donnent des résultats non explicites, sans interprétation en adoptant généralement l‟approche neuronale, [1], [2], [3].

Un arbre de décision est un outil d'aide à la décision et à l'exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe grâce à sa lisibilité, sa rapidité d'exécution. La logique floue a été proposée par Zadeh [4] pour modéliser l‟information et pour se rendre compte du caractère vague des

(12)

9 connaissances que nous, les humains, manipulons au quotidien. Le couplage de la logique floue avec les arbres de décision rend les règles extraites plus linguistiques et plus explicites.

Ce mémoire est composé de trois chapitres:

Dans le premier figurent quelques notions de base cardiologiques. Ce qui est très important car il permet de mieux connaître la nature physiologique de l‟ECG, et nous aidera par la suite dans notre choix des paramètres représentatifs d‟un battement cardiaque.

Le deuxième chapitre décrira les principes des arbres de décision en mettant l‟accent sur les arbres de décision flous.

Nous présenterons dans le dernier chapitre les résultats de la classification de quelques anomalies cardiaques (l‟extrasystole auriculaire (A), l‟extrasystole jonctionnelles (J) et l‟extrasystole ventriculaires (V)).

Le mémoire se termine par une conclusion et perspectives. Elle donne un aperçu général du travail accompli.

(13)

10

Chapitre 1

Le cœur et l’électrocardiographie

Présentation : Nous présentons dans ce chapitre le fonctionnement général du système cardiovasculaire, puis, de manière plus détaillée, le principe de l’électrocardiogramme (ECG), cette présentation se limite au strict nécessaire pour une bonne compréhension du mémoire.

(14)

11 1.1 Le système cardiovasculaire :

Le système cardiovasculaire assure la circulation du sang dans l‟organisme et permet ainsi son alimentation en oxygène et en nutriments. Il est composé entre autres du cœur, sorte de double pompe, qui assure la circulation dans deux réseaux complémentaires: celui des artères et celui des veines [5].

1.2 Anatomie du cœur :

Le cœur humain est un organe creux qui mesure en moyenne 13 cm de long sur 8 cm de large, et qui pèse environ 300 grammes chez l‟homme adulte, et 250 grammes chez la femme adulte. Il se situe dans la partie antérieure caudale du médiastin, la partie centrale du thorax (vers le front de la cavité thoracique et il est légèrement déplacé vers la gauche) [6].

Le cœur propulse le sang grâce aux contractions de son tissu musculaire appelé myocarde (Figure ‎0.1). Une épaisse cloison le divise en deux moitiés (cœur gauche/cœur droit), et chacune d‟elles comporte deux cavités : l‟oreillette et le ventricule. À chaque battement, le myocarde suit la même séquence de mouvement : le sang pauvre en oxygène arrive au cœur par la veine cave, il y entre par l‟oreillette droite, et en est chassé par sa contraction appelée systole auriculaire qui le déplace dans le ventricule droit. La systole ventriculaire (contraction des ventricules) propulse à son tour le sang du ventricule droit vers les poumons où il va se charger en oxygène. De retour au cœur par les veines pulmonaires, le sang s‟accumule dans l‟oreillette gauche puis, lors de la systole auriculaire, passe dans le ventricule gauche qui lors de la systole ventriculaire l‟envoie vers les organes par l‟artère aorte (Figure ‎0.1) [7].

(15)

12 Figure ‎0.2 Représentation du cœur

1.3 Fonctionnement électrique :

Comme pour tous les muscles du corps, la contraction du myocarde est provoquée par la propagation d‟une impulsion électrique le long des fibres musculaires cardiaques induite par la dépolarisation des cellules musculaires.

L‟impulsion électrique se propage dans le muscle cardiaque et induit sa contraction. Elle prend naissance dans le sinus (Figure 1.2.a) puis se propage dans les oreillettes (Figure 1.2.b) entraînant leurs contractions (systole auriculaire). L‟impulsion arrive alors au nœud auriculo-ventriculaire (AV) seul point de passage électrique entre les oreillettes et les ventricules. Une courte pause est alors introduite (Figure 1.2.c) juste avant la propagation dans les fibres constituant le faisceau de His. Au passage de l‟impulsion électrique (Figure 1.2.d) les ventricules se contractent à leur tour (Figure 1.2.e) (systole ventriculaire).

(16)

13 Après la diastole (décontraction du muscle) les cellules se re-polarisent (Figure 1.2.f). Le cycle du battement cardiaque est alors terminé et le cœur est prêt pour un nouveau battement [8].

Figure ‎0.3 Circuit électrique du cœur

1.4 L’électrocardiographie

: (

Ou l’art d’enregistrer l’activité électrique du cœur) : 1.4.1 Principe de l’électrocardiogramme (ECG)

Un signal ECG est très utilisé dans la routine clinique par les cardiologues afin de connaître les origines des anomalies cardiaques, il mesure l‟activité électrique du cœur par l‟emploi d‟électrodes externes mises au contact de la peau sur le torse. L‟activité mesurée, formée d‟ondes qui permettent d‟identifier les phases de systoles et diastoles des oreillettes et des ventricules, rend compte de l‟activité cardiaque sous-jacente.

Les processus de dépolarisation et repolarisation des structures myocardiques se présentent dans l'ECG comme une séquence de déflections ou ondes superposées à une ligne de potentiel zéro, appelée ligne isoélectrique. L'ordre et la morphologie de ces ondes dépendent de deux aspects fondamentaux : la structure anatomique d'initiation de l'impulsion électrique (i.e. le nœud sinusal, une structure jonctionelle, . . .) et la séquence de conduction à travers le myocarde.

Dans le cas physiologique, comme il a déjà été présenté, l'impulsion est initiée dans le nœud sinusal. Le front de dépolarisation auriculaire résultant est représenté dans l'ECG par l'onde P. Cette onde se caractérise au niveau spectral par une composante basse fréquence de

(17)

14 faible énergie, qui limite souvent son observation dans plusieurs dérivations ECG, spécialement dans des conditions de bruit. La repolarisation auriculaire est représentée par l'onde Ta et sa direction est opposée à celle de l'onde P. Généralement l'onde Ta n'est pas visible dans l'ECG car elle coïncide avec le complexe QRS d'amplitude plus importante. Ce dernier correspond à la dépolarisation ventriculaire et représente la déflection de plus grande amplitude de l'ECG.

Il est constitué de trois ondes consécutives (les ondes Q, R et S. Le processus de repolarisation ventriculaire est reflété par l'onde T. Dans certaines occasions, une onde, dite onde U, de très basse amplitude peut être observée après l'onde T. Bien que son origine physiologique n'ait pas encore été démontrée, l'onde U (fréquemment observée chez les athlètes) est souvent associée aux processus de repolarisation ventriculaire tardive.

La figure 1.3 présente la génération d'une activité électrique corrélée aux diastoles et systoles par le cœur. A gauche, formation d'une onde P lors de la systole des oreillettes. A droite, formation d'une onde R par la systole des ventricules. T correspond à la repolarisation du tissu cardiaque [6].

La figure 1.4 représente la corrélation entre le signal ECG et le cycle cardiaque. Figure ‎0.4 Génération d'une activité électrique

(18)

15 L‟enregistrement d'un ECG peut être fait sur plusieurs voies. L'axe électrique du cœur suit la flèche rouge (Figure 1.5), les axes mesurés (A, B et C) donnent des informations complémentaires qui permettent de déduire le comportement électrique qui sous-tend les battements. Les voies A et B sont mesurées par des électrodes placées au niveau de la base du cou, respectivement à droite et à gauche et sur la dernière côte, respectivement à gauche et à droite. La voie C est quant à elle mesurée par deux électrodes placées l‟une dans le dos et l‟autre sur le bord d‟une côte gauche à l‟horizontale de l‟électrode dorsale. L‟enregistrement Holter utilise en général deux ou trois de ces voies (A, B ou A, B, C).

Selon l'angle utilisé pour récupérer l‟information ECG, le dipôle de courant mesuré change. Pour obtenir une information optimale, on effectue donc plusieurs enregistrements simultanés, on parle alors d‟enregistrements multivoies (Figure 1.5) [6].

Outre les formes d'ondes, un battement cardiaque est aussi caractérisé par plusieurs segments et intervalles (Figure 1.6) :

 L'intervalle PR : il est mesuré entre le début de l'onde P et le début du complexe QRS. Cet intervalle représente la dépolarisation des oreillettes et du nœud Atrio-Ventriculaire.  Le segment PR : c'est la période temporelle comprise entre la fin de l'onde P et le début

du complexe QRS. Il représente le temps de transmission du front de dépolarisation par le nœud Atrio-Ventriculaire.

(19)

16  le segment ST : il est compris entre la fin du complexe QRS (ou point J) et le début de la

phase ascendante de l'onde T.

 l'intervalle QT : le temps entre le début du complexe QRS et la fin de l'onde T. Il représente une indication de la longueur des phases de dépolarisation et repolarisation ventriculaire [6].

(20)

17 1.5 Ondes constituants un ECG :

Figure ‎0.8 ECG normal [8]

Les principaux critères qui permettent d‟affirmer qu‟un ECG est normal sont les ondes qui le constituent à savoir:

 L‟onde P

 Le complexe QRS  L'onde T

(21)

18 Figure ‎01.‎0.9 le cycle cardiaque complet [5]

1.5.1 Onde P :

Elle représente la dépolarisation des oreillettes depuis le nœud sinusal vers le nœud atrio-ventriculaire situé en bas à gauche. C'est l'onde qui précède le complexe QRS

Sa durée est de l‟ordre de 90 ms. C'est une onde positive dont l'amplitude est normalement inférieure ou égale à 0.2 mV.

(22)

19 1.5.2 Le complexe QRS :

C'est l‟ensemble des trois ondes accolées qui suivent l'onde P, et qui correspondent à la dépolarisation des ventricules précédent l‟effet mécanique de contraction. Sa durée normale est comprise entre 85 et 95 ms. L'onde Q est la première onde négative, l'onde R la première onde positive du complexe, et l'onde S la première onde négative après l'onde R.

Figure ‎01.‎0.11 Le complexe QRS

1.5.3 L'onde T :

Correspond au courant de repolarisation des ventricules. Cette onde succède au complexe QRS .L'onde T normale a une amplitude plus faible que le complexe QRS.

(23)

20 1.5.4 L'intervalle PR :

Cet intervalle mesure la durée entre le début de l'onde P et le début de Q ou de R. Sa durée est comprise entre 120 et 180 ms. La phase de repolarisation ST-T est beaucoup plus longue (300-400 ms) que la phase de dépolarisation ventriculaire (85-95 ms) [9].

1.6 Rythme cardiaque :

Le rythme cardiaque est - au sens médical du terme - le mécanisme électro physiologique à l‟origine de la contraction des ventricules. Définir le rythme est le préambule à toute interprétation de l‟électrocardiographie [5].

Dans le sens commun, le rythme (fréquence) est le nombre de battements cardiaques (pulsations) par unité de temps (généralement la minute). Un synonyme usuel est le pouls, bien que ce dernier terme désigne plus précisément la perception au toucher de l'artère battante, permettant, certes d'évaluer les battements cardiaques, mais apportant également d'autres renseignements. Chez l'adulte en bonne santé, au repos, le pouls se situe entre 50 (sportif pratiquant l'endurance) et 80 pulsations par minute. Pendant un effort, la fréquence cardiaque maximale théorique est de 220 moins l'âge (exemple : 18 à 40 ans) [8].

Plusieurs conditions peuvent faire accélérer ou ralentir le rythme cardiaque. Sa mesure est un outil diagnostique très important [7].

L'analyse du rythme cardiaque sur l'électrocardiogramme se fait en 2 étapes, vérifiant d'une part la régularité du rythme et d'autre part l'origine du rythme cardiaque qui peut être généré par 5 centres stimulateurs:

 Sinusal (du nœud sinusal)

 Jonctionnel (du nœud atrio-ventriculaire)  Ventriculaire (myocytes ventriculaires)  Ectopique (foyer auriculaire)

(24)

21 1.6.1 Origine sinusale :

Le rythme est dit sinusal lorsque l'activité électrique du cœur est issue du nœud sinusal. Ceci se traduit sur l'électrocardiogramme par une onde P identique qui précède chaque complexe QRS.

Figure ‎01.‎0.13 Rythme sinusal (ondes P identiques)

1.6.2 Origine jonctionnelle :

Le rythme est dit jonctionnel lorsque l'activité électrique du cœur est générée par le nœud atrio-ventriculaire. Ceci donne sur l'électrocardiogramme des complexes QRS fins (sauf bloc de branche) sans ondes P précessive le plus souvent. Quelques fois, on observe après le complexe QRS une onde P dite rétrograde.

(25)

22

1.6.3

Origine ventriculaire

:

Le rythme est dit ventriculaire lorsqu'il est issu des myocytes des ventricules. Ceci se traduit sur l'ECG par un complexe QRS élargi (>0,12 sec ou 3 petits carreaux), sans onde P, et avec une onde T modifiée.

Figure ‎01.‎0.15 Rythme Ventriculaire

1.6.4 Origine ectopique auriculaire :

Le rythme est issu des cellules musculaires auriculaires et non du nœud sinusal, et il se propage ensuite (normalement) au nœud atrio-ventriculaire et aux ventricules. Ceci se traduit par une onde P anormale avant un complexe QRS normal.

(26)

23

1.6.5

Origine artificielle (pace maker)

:

Le rythme est déterminé par un stimulateur cardiaque implanté à proximité du cœur, et relié à celui-ci par des électrodes. Selon la pathologie rythmique posée, ces électrodes vont stimuler les oreillettes, les ventricules ou les 2 en même temps [5].

1.7 Arythmie ou Troubles du rythme cardiaque

Le rythme est dit régulier lorsque l'espace R-R entre 2 complexes QRS consécutifs reste le même sur tout le tracé ECG. Il est irrégulier si l'espace R-R n'est pas constant. Ceci arrive en de nombreuses circonstances:

 arythmie respiratoire

 extrasystoles

 arythmie complète par fibrillation auriculaire ...

L'arythmie, qui peut être bénigne ou maligne, est un trouble du rythme cardiaque, c'est-à-dire une irrégularité des contractions du cœur [8].

Au repos, le cœur effectue normalement entre 60 et 80 battements à la minute (c'est ce qu'on appelle le pouls ou les pulsations cardiaques). Une accélération (tachycardie), un ralentissement (bradycardie) ou un changement du rythme cardiaque sont les formes d'arythmie. L'arythmie s'accompagne parfois de palpitations.

Les palpitations ne sont pas un trouble du rythme cardiaque, mais tout simplement le fait de sentir les battements du cœur. Cela se produit le plus souvent lorsque le pouls bat trop vite ou de façon irrégulière. Par ailleurs, on peut faire de l'arythmie sans faire de palpitations (on ne sait donc pas que le cœur bat de façon anormale). La palpitation est le principal symptôme de l'arythmie. Il est à noter que la palpitation peut également se manifester chez les personnes qui présentent une très grande sensibilité psychologique ou qui souffrent d'anxiété, sans pour autant faire de l'arythmie. Il existe différentes formes d'arythmie, dont voici les principales :

(27)

24 1.7.1 Extrasystole :

L'extrasystole est un battement cardiaque prématuré ou en surplus qui est ressenti comme un battement erratique ou manquant, comme si le cœur sautait un tour. C'est l'arythmie la plus fréquente. Nombreuses sont les personnes qui ont des extrasystoles qu'elles ne perçoivent même pas. Si celles-ci ne s'accompagnent pas d'autres symptômes, ce qui constitue la majorité des cas, cette anomalie est bénigne et peut se produire dans un cœur sain. Il arrive parfois que l'extrasystole s'accompagne d'un bref étourdissement, mais c'est sans gravité [5].

Figure ‎0.17 Extrasystole Ventriculaire

1.7.2 Bradycardie :

Ce terme médical signifie littéralement "cœur lent". La bradycardie est une diminution du rythme cardiaque, qui descend sous les 60 battements à la minute. Différentes raisons peuvent la

(28)

25 causer. Bien que cela puisse parfois exiger l'intervention d'un médecin, un pouls lent sans autre symptôme est considéré comme normal. Il arrive cependant que certaines personnes se sentent parfois rapidement fatiguées, essoufflées ou étourdies.

1.7.3 Fibrillation auriculaire :

Il s'agit de contractions rapides et désordonnées des oreillettes. Les oreillettes sont les deux cavités supérieures du cœur. Leur rôle est de pousser le sang vers les ventricules, les deux parties inférieures du cœur. L'oreillette droite envoie le sang dans le ventricule droit qui lui, le pousse vers les poumons. L'oreillette gauche envoie le sang dans le ventricule gauche, qui le propulse dans le reste de l'organisme. En état de fibrillation, les oreillettes n'arrivent plus à se contracter adéquatement, ce qui peut entraîner un rythme irrégulier du pouls, mais pas nécessairement des palpitations. On peut donc présenter des fibrillations auriculaires sans s'en rendre compte, car il est possible qu'il n'y ait aucun autre symptôme. Même si le sang continue à circuler et à se rendre jusqu'aux ventricules, le flux sanguin stagne dans certaines parties de l'oreillette et cela peut entraîner la formation de petits caillots. Ces caillots, se retrouvant dans la circulation, peuvent obstruer une artère et causer un accident vasculaire cérébral si le caillot va au cerveau.

Figure ‎0.18 Arythmie complète par Fibrillation Auriculaire 1.7.4 Tachycardie ventriculaire :

C'est un rythme cardiaque rapide, régulier ou non, et qui prend son origine dans les ventricules (au-delà de 100 battements à la minute). Cette forme d'arythmie ne représente que la minorité des cas d'arythmie et reflète en général un mauvais fonctionnement des ventricules. Une personne atteinte de tachycardie ventriculaire se sentira mal, sera pâle, aura la peau moite et des

(29)

26 palpitations. Si la fréquence cardiaque est très rapide, elle peut même souffrir d'étourdissements et d'évanouissement.

1.7.5 Tachycardie paroxystique (c'est-à-dire qui arrive par crise) :

Moins fréquente, cette anomalie du circuit électrique du cœur survient surtout chez les jeunes à cause d'une hypersensibilité émotive. Elle se traduit par une accélération soudaine de la fréquence cardiaque, qui varie alors entre 150 et 200 battements à la minute et qui peut durer quelques minutes ou même quelques heures, pour ensuite revenir à la normale tout aussi subitement. La tachycardie paroxystique peut être déclenchée par un effort anodin (se pencher pour atteindre un objet), par un stress émotif, par une simple extrasystole ou même, parfois, sans aucune raison. Elle s'accompagne habituellement de palpitations.

1.7.6 Fibrillation ventriculaire :

C'est la forme extrême et aiguë de l'arythmie, caractérisée par de multiples petites contractions ventriculaires complètement désordonnées et inefficaces entraînant rapidement une perte de conscience. Les ventricules n'arrivent plus à se contracter et à chasser le sang dans les artères pour le distribuer dans les poumons et le reste de l'organisme. Cette arythmie survient d'habitude dans les premières phases d'un infarctus du myocarde et peut en être sa première manifestation [8].

Dans le cadre de notre travail, nous nous intéressons en particulier aux extrasystoles. Nous définissons dans la suite les trois extrasystoles majoritairement existantes.

1.8 Extrasystoles :

Une extrasystole est une excitation ventriculaire prématurée par rapport à la dépolarisation attendue, d'origine auriculaire, nodale ou ventriculaire. Parfois physiologiques, elles peuvent cependant traduire une pathologie sous-jacente plus ou moins grave.

Les caractéristiques générales des extrasystoles sont:

(30)

27

 Repos compensateur après l'extrasystole, le complexe QRS suivant arrivant au moment attendu si le rythme était resté sinusal [7].

1.8.1 Cause des extrasystoles :

Les phénomènes principaux qui peuvent entraîner des arythmies sont :

 Les troubles de l'excitabilité : Soit que le nœud sinusal envoie des impulsions désordonnées, soit que l'impulsion prenne naissance dans un autre territoire du cœur et se substitue à celle du nœud sinusal

 Les troubles de la conduction : La transmission de l'impulsion électrique des oreillettes aux ventricules est bloquée, c'est pourquoi on appelle souvent ce phénomène bloc cardiaque ;

 Stress de situation, fièvre, anémie ;

 Excitants, tels que la caféine, l'alcool, le tabac, la cocaïne ;

 Surdosage de certains médicaments, tels que les agents thyroïdiens ou les diurétiques;

 Repas très copieux, surtout s'il est accompagné d'alcool [5]. 1.9 Types d'extrasystoles:

Il existe trois types d'extrasystoles : 1.9.1 Extrasystoles auriculaires (ESA):

Complexes QRS de morphologie identique au rythme sinusal, avec une onde P anormale précessive. Quand elles sont fréquentes, il y a un risque de passage en AC/FA.

(31)

28 Figure ‎0.19 Extrasystole auriculaire

1.9.2 Extrasystoles nodales (ou jonctionnelles) (ESJ):

Complexes QRS fins (sauf bloc de branche), de morphologie identique au tracé en rythme sinusal, sans onde P ou avec une onde P dite rétrograde.

Figure ‎0.20 Extrasystoles jonctionnelles

1.9.3 Extrasystoles ventriculaires (ESV):

Complexes QRS larges, de morphologie différente du tracé en rythme sinusal, avec anomalie de l'onde T, sans onde P précessive [5].

(32)

29 Figure ‎0.21 Extrasystoles ventriculaires

Résumé

Définir l‟anatomie du cœur, son fonctionnement et son électrophysiologie était le but principal de ce chapitre, la source électrique du cœur, les points de simulation cardiaque et son parcours qui sont très utiles pour comprendre la naissance du signal ECG et le sens de ses différentes ondes (P, O, R, S, T).

Comprendre l‟interprétation d‟un ECG et l‟interprétation d‟une déformation dans ce dernier qui présente des arythmies cardiaques et connaitre les différents paramètres discriminants comme la largeur du complexe QRS, le rythme R-R est un point très important. Reconnaitre telle anomalies, a un grand intérêt dans le domaine médical. Le chapitre suivant explique en détail les arbres de décision classiques et flous qui sont utilisé comme une méthode de classification et de reconnaissance.

(33)
(34)

31 31

Chapitre 2

Les arbres de décision classiques et flous

Présentation : Ce chapitre comporte deux parties : dans un premier temps, on présente succinctement les techniques de création d’un arbre de décision classique son élagage, et quelques définitions comme l’entropie et le gain d’information et l’algorithme de développement de l’arbre comme l’ID3 ; la deuxième partie présente l’arbre de décision flou comme une extension de l’arbre de décision classique.

(35)

32 32 1.10 Arbre de décision classique :

Un arbre de décision est un outil d'aide à la décision et à l'exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d'exécution et le peu d'hypothèses nécessaires à priori expliquent sa vaste utilisation dans différents applications et reconnaissance de forme. Il est composé de :

Une racine, qui est point de départ. des nœuds, ou sont réalisés des tests

des feuilles, qui contiennent l‟information cherchée.

Le parcours d‟un arbre se fait, par tests successifs, de la racine à une feuille et constitue une règle de décision [9].

1.10.1

Construction d’un arbre de décision

:

1.10.1.1 Bases de règles :

Un arbre est un système de règles de type particulier : Il y a autant de règles que de feuilles et autant de tests que de nœuds avec des différences [10] :

 Les règles sont mutuellement exclusives.  Une règle et une seule est entièrement évaluée.

 Les tests sur les attributs sont réalisés dans un ordre donné. 1.10.1.2 Prétraitements :

Nous attachons un test à chaque nœud et une réponse à chaque feuille ce qui définit la spécification des arbres de décision. Avec des avantages comme :

 Suite de tests mono variés.

(36)

33 33  Hiérarchisation de variables intégrée.

 Rapidité d‟exécution.

 Génération de règles logiques simples de classification.

1.10.1.3 Algorithme de l’arbre de décision:  Lire le vecteur d‟observation,‟V‟  Se mettre à la racine

 Tant que (non feuille) faire  N= testNoeud(V)

 Se positionner sur le fils N fait  Ecrire la réponse

1.10.1.4 Phase d’apprentissage : a) Entropie :

Le concept d‟entropie est utilisé pour ordonner la liste des descripteurs avec le respect des ensembles de données, et des classes. L‟entropie fournie une définition des descripteurs les plus significatifs [10].

Le calcul de l‟entropie est donné par la formule mathématique suivante :

)

(

log

)

(

)

(

2 1 i n i i

P

c

c

P

p

I

(2-1)

P(ci) est la probabilité que la classe ci soit correcte. La quantité

log

2

P

(

c

i

)

est la quantité d‟information que l‟on donne quand la classe est la valeur attendue de ce contenu de l‟information. Cette valeur attendue est la mesure d‟entropie de l‟ensemble.

(37)

34 34 On note X cardinal de l‟ensemble X. Si un ensemble T d‟enregistrements partitionnés par la valeur de l‟attribut catégorique en classes disjointes {C1, C2,…,Ck}, alors l‟information nécessaire pour reconnaître la classe d‟un élément de T est associée à l‟entropie I(p) ,où P est la distribution de la probabilité de la partition (C1,C2, …,Ck) :

T C T C T C p 1 , 2 ,, k (2-2)

Si l‟on partitionne notre ensemble T en valeurs disjointes, alors l‟information nécessaire pour identifier la classe d‟un élément de T devient :

   m i i i T Info T T T X Info 0 ( ) ) , (

(2-3)

Où Ti est un sous ensemble de A pour la valeur i.

De là nous pouvons définir ce qu‟est le gain, qui représente le gain obtenu dû au partitionnement par l‟attribut X :

Gain(X, T)= Info(X)-Info (X,T)

(2-4)

b) Test d’arrêt :

Les tests d‟arrêt permettent de contrôler la croissance de l‟arbre, En arrêtant éventuellement la création de nouveaux nœuds, même si tous les attributs n‟ont pas été évalués.

Deux cas ne posent pas de problème :

 Toutes les observations associées à un nœud sont de la même classe,  Tous les attributs ont été évalués.

(38)

35 35 Alors le nœud considéré est un nœud terminal.

Dans les autres cas, on définit des critères paramétrables :

 Une classe contient une proportion d‟observations de la même classe supérieure à un seuil donné,

 Les sous-ensembles d‟observations sortant d‟un nœud sont trop petits, ce qui évite d‟explorer des branches comportant trop peu d‟éléments.

1.10.2 Elagage d’un arbre de décision :

L‟objectif est de construire un arbre de taille réduite ayant à peu prés les mêmes performances que l‟arbre initial.

- L‟arbre initial est construit avec un ensemble d‟apprentissage et se fait sur un ensemble de test.

- L‟élagage consiste à remplacer un sous-arbre par une feuille, tant que les capacités de généralisation ne se dégradent pas [9].

1.10.2.1 Le pré-élagage :

La première stratégie utilisable pour éviter un sur ajustement massif des arbres de décision consiste à proposer des critères d‟arrêt lors de la phase d‟expansion. C‟est le principe du pré-élagage.

Nous considérons par exemple qu‟une segmentation n‟est plus nécessaire lorsque le groupe est d‟effectif trop faible ; ou encore, lorsque la pureté d‟un sommet a atteint un niveau suffisant, nous considérons qu‟il n‟est plus nécessaire de le segmenter ; autre critère souvent rencontré dans ce cadre, l‟utilisation d‟un test statistique pour évaluer si la segmentation introduit un apport d‟information significatif quant à la prédiction des valeurs de la variable à prédire [9].

(39)

36 36 1.10.2.2 Le post-élagage :

La seconde stratégie consiste à construire l‟arbre en deux temps : produire l‟arbre le plus pur possible dans une phase d‟expansion en utilisant une première fraction de l‟échantillon de données (échantillon d‟apprentissage) une marche arrière pour réduire l‟arbre, c‟est la phase de post-élagage, en s‟appuyant sur une autre fraction des données de manière à optimiser les performances de l‟arbre.

Selon les logiciels, cette seconde portion des données est désignée par le terme d‟échantillon de validation ou échantillon de test.

1.10.3 Algorithme de création de l’arbre :

1.10.3.1 Algorithme ID3 (Induction of Decision Tree):

a) Présentation :

J.Ross Quilan de l‟université de Syndney, est le créateur de l‟algorithme ID3 Ce fut en 1975. Construire un arbre de décision d‟un ensemble fixe d‟exemples. L‟arbre résultant est employé pour classifier de futurs exemples. L‟exemple a plusieurs attributs et appartient à une classe (comme oui ou non). Les nœuds de feuille de l‟arbre de décision contiennent le nom de classe contrairement aux nœuds de décision. Le nœud de décision est un essai d‟attribut avec chaque branchement (à un autre arbre de décision) étant une valeur possible de l‟attribut. Gain de l‟information des utilisations ID3 pour l‟aider à décider quel attribut entre dans un nœud de décision.

b) Contraintes de l’ID3:

Les exemples utilisés par ID3 doivent respecter certaines contraintes, tel que :  Etre fixes.

 Les mêmes attributs doivent décrire chaque variable, et avoir un nombre fixe de valeurs.

(40)

37 37  Des classes bien délimitées.

 ID3 met en jeux deux concepts majeurs :

 L‟entropie : concept permettant de trouver les paramètres les plus significatifs.  Les arbres de décision : efficaces et intuitifs permettent d‟organiser les

descripteurs qui peuvent être utilisés comme fonction prédictive. 1.10.4 Autres algorithmes :

1.10.4.1 Algorithme C4.5 :

L‟algorithme C4.5 a été élaboré par Quinlan en 1993, cet algorithme n‟est en fait qu‟une amélioration de ID3.

Cette méthode utilise un critère plus élaboré : « le gain ratio » dont le but est de limiter la prolifération de l‟arbre en pénalisant les variables qui ont beaucoup de modalités. Contrairement à ID3, C4.5 est parfaitement réalisable dans des applications industrielles.

1.10.4.2 Algorithme CART (Classification and Regression Tree) :

Cette méthode permet d'inférer des arbres de décision binaires, i.e. tous les tests étiquetant les nœuds de décision sont binaires. Le langage de représentation est constitué d'un certain nombre d'attributs. Ces attributs peuvent être binaires, qualitatifs (à valeurs dans un ensemble fini de modalités) ou continus (à valeurs réelles). Le nombre de tests à explorer va dépendre de la nature des attributs. A un attribut binaire correspond un test binaire. A un attribut qualitatif ayant n modalités, on peut associer autant de tests qu'il y a de partitions en deux classes, soit 2n-1 tests binaires possibles. Enfin, dans le cas d'attributs continus, il y a une infinité

de tests envisageables. Dans ce cas, on découpe l'ensemble des valeurs possibles en segments, ce découpage peut être fait par un expert ou fait de façon automatique [9].

(41)

38 38 1.11 Arbre de décision flou :

1.11.1 Concepts de la logique floue:

Dans la logique classique, les variables gérées sont Booléennes. C'est à dire qu'elles ne prennent que deux valeurs 0 ou 1.

La logique floue a pour but de raisonner à partir de connaissances imparfaites qui opposent une résistance à la logique classique. Pour cela la logique floue se propose de remplacer les variables booléennes par des variables flous.

1.11.1.1 Historique:

Depuis longtemps l'homme cherche à maîtriser les incertitudes et les imperfections inhérentes à sa nature. La première réelle manifestation de la volonté de formaliser la prise en compte des connaissances incertaines fut le développement de la théorie des probabilités à partir du XVII siècle. Mais les probabilités ne peuvent maîtriser les incertitudes psychologiques et linguistiques. On a donc assisté aux développements des théories de probabilité subjective (dans les années 50) puis de l'évidence (dans les années 60).

Puis la Logique Floue est apparue en 1965 à Berkeley dans le laboratoire de Lotfi Zadeh [4] avec la théorie des sous-ensembles flous puis en 1978 avec la théorie des possibilités. Ces deux théories constituent aujourd'hui ce que l'on appelle Logique Floue.

La Logique Floue permet la formalisation des imprécisions dues à une connaissance globale d'un système très complexe et l'expression du comportement d'un système par des mots.

Elle permet donc la standardisation de la description d'un système et du traitement de données aussi bien numériques qu'exprimées symboliquement par des qualifications linguistiques [9].

(42)

39 39 1.11.1.2 Sous-ensembles flous :

Un sous-ensemble floue F est défini sur un ensemble de valeur, le référentielle U. Il est caractérisé par une fonction d'appartenance [9]:

(2-5) Qui quantifie le degré d'appartenance de chaque élément de U à F.

Exemple : Evaluation de la température de l'eau d'un récipient par les mots Froide : F Tiède : T Chaude : C

En logique classique :

Figure ‎0.1 Logique classique En logique floue :

(43)

40 40 Figure ‎0.2 Logique floue

On voit que la logique classique ne peut utiliser que le 0 et le 1 ainsi l'eau est d'abord totalement froide puis tiède et enfin chaude. En dessous nous pouvons observer la représentation graphique de trois fonctions d'appartenance Froid, Tiède et Chaud. Ces fonctions nous permettent de superposer sur des plages de températures données les qualificatifs froid et tiède ainsi que tiède et chaud. On se rapproche donc du raisonnement humain.

1.11.1.3 Opérations de base sur les sous-ensembles flous :

La théorie mathématique sur les sous-ensembles flous définit de nombreuses opérations sur ces sous-ensembles et sur les fonctions d'appartenances qui rendent ces notions utilisables. Nous ne présentons ici que les opérations de base de cette théorie.

Si A et B sont deux sous-ensembles flous et  (A) et (B) leur fonction d'appartenance, on définit :

(44)

41 41 Figure ‎0.3 Fonction d’appartenances

Le sous-ensemble A et B, par la fonction d'appartenance :

 (A B)=min ((A),(B)) (2-6)

Figure ‎0.4 Intersection des fonctions d’appartenances 1- µ(x)

(45)

42 42 Le sous-ensemble A ou B, A B, par la fonction d'appartenance :

(AB)=max ((A),(B)) (2-7)

Figure ‎0.5 Union des fonctions d’appartenances

Ces définitions sont celles qui sont les plus communément utilisées mais parfois, pour certains cas, d'autres sont plus appropriées. Par exemple, l'intersection peut être définie par le produit des fonctions d'appartenance et l'union par la moyenne arithmétique des fonctions d'appartenance. Ces différentes techniques de calcul engendrent une énorme capacité d'adaptation des raisonnements flous.

1.11.2 Principes d’un arbre de décision flou :

La fouille de données consiste à extraire des connaissances à partir de données hétérogènes. Quand les données sont numériques et/ou symboliques, les arbres se décision constituent un bon outil. Ils permettent d‟extraire des informations sous la forme de règles du type :

“Si... alors…“.les arbres de décision flous constituent une extension des arbres de décision classiques du fait qu‟ils permettent de contourner la contrainte de seuil rigide pendant le test au niveau des nœud [9].

(46)

43 43 1.11.2.1 Construction des arbres de décision flous :

Les arbres de décision flous généralisent les arbres de décision classiques et sont beaucoup mieux adaptés pour le traitement de données numériques continues. Le parcours de la racine à une feuille constitue une règle floue. Lors de la présentation d‟un exemple, différentes règles sont activées et un mécanisme d‟inférence permet de composer ces règles pour obtenir la réponse de l‟arbre.

Les arbres de décision ou de régression flous permettent de manipuler des variables continues sans introduire des seuils arbitraires de décision booléenne, où des tests en tout-ou-rien sont réalisés à chaque nœud. Si par exemple dans un cas de test de taux de glycémie chez un diabétique : „le taux est inférieur à 1g, la réponse sera vrai pour les deux observations τ0 = 0g

et τ1 = 0,999g ; la réponse sera faux pour l‟observation τ3 = 1g. Pour une différence minime et

souvent non significative entre deux observations, les tests booléens peuvent ainsi conduire à des conclusions très différentes.

Il existe plusieurs implémentations pour les arbres de décision flous. Celle que nous avons choisie peut être considérée comme une extension d‟ID3 (logiciel d‟implémentation des arbres) :

Chaque nœud est associé à une variable dont le domaine de variation est découpé par une partition floue forte. Les tests réalisés à un nœud donnent alors les degrés d‟appartenance aux différents sous-ensembles flous et les branches issues du nœud sont activées par ces degrés d‟appartenance [9].

En appelant ri l‟activation de la branche i, on a (Figure ‎02.‎0.6) :

ri {0 ,1} et

i i

r =1 pour un arbre booléen (2-8)

ri  [0,1] et

i i

(47)

44 44 τ 1 τ 2 faible élevée 1 < τ 2 moyenne r1 r2 r3 r1 r2 r3

τ : le taux de glycémie chez un diabétique

Figure ‎02.‎0.7 Arbre booléen (à gauche) et arbre flou

1.11.3 Caractéristiques principales d’un arbre de décision flou:

Dans un arbre de décision flou la branche forme la partie prémisse, tandis que la valeur associée à une feuille forme la conclusion [11]. Soit cN cette conclusion et  N (Xi) la

valeur de la règle correspondante pour un vecteur d‟entrée Xi= (xi1,…,xiM) donné. Chaque

attribut,

x

ij, ayant des modalités floues, avec  A j (Xi j) est le degré d‟appartenance de xi j au

sous-ensemble flou Aj.

On appelle aussi :

  N (Xi) le degré d‟appartenance du vecteur xi au nœud N calculé de la racine au

nœud.

 N (Xi) est calculé à partir de tous les degrés d‟appartenance le long de la branche

concernée :      sinon ) Ai(x M(xi) recine la Nest si 1 ) ( ij   N xi (2-10)

T

T

(48)

45 45 Si N est la racine, alors  N (xi)=1 pour tout i. Si N est un nœud ou une feuille, alors  N (xi) est le produit de tous les degrés d‟appartenance sur la branche, de la racine à N

Avec les notations de la (Figure ‎0.8 ) ou M est le parent de N ,Xi j la variable attachée à

M et N et A est un sous-ensemble flou sur le domaine de Xi j.

A

Figure ‎0.9 Appartenance au nœud La sortie inférée par un ADDF est :

ADDF(x) = ) ( ) ( x c x F F F F F  

(2-11)

La conclusion associée à une feuille, CF est calculée par :

CF =

  N J i F j J j i j F x y x ) ( ) (   (2-12)

J : ensemble des couples (xj,yj) pour lesquels la valeur de vérité de la feuille est supérieure à un seuil de donné.

M

racine

(49)

46 46 1.11.4 Induction d’un arbre de décision flou :

On parle d‟induction car la construction permet de passer du particulier (données de l‟ensemble d‟apprentissage) au général (les règles extraites des données). Cette construction successive sur l‟ensemble d‟apprentissage en sous-ensembles d‟homogénéité croissante. Considérons le problème général suivant. Soit f(x1,…,x n) y=f(x1,…,x n) une relation

d‟entrée/sortie inconnue, les entrées x1 à x n étant des variables explicatives potentielles et y la

sortie. Parmi les entrées, certaines sont importantes, d‟autres redondantes, d‟autres enfin inutiles. L‟induction d‟un ADDF consiste à :

 Hiérarchiser les variables d‟entrée en fonction de leur importance.

 Évaluer l‟utilité de prendre en compte ou non certaines entrées, soit en ligne, soit hors ligne par élagage.

Il faut, pour cela, un ensemble d‟apprentissage,

E = { (xi, yi) ;x i = (x i1,…,x iM),yi R , pour i = 1 à P } , (2-13)

où les xij , pour j = 1 à M, sont des variables linguistiques possédant m j fonctions

d‟appartenance, (Ajk)mkj=1.

Les fonctions d‟appartenance forment des partitions floues triangulaires sur les domaines d‟entrée. Sans perte de généralité, la T-norme utilisée est le produit :

ET(x, y) = x * y. (2-14)

ces choix apportent la propriété suivante :

1 ) ( 

x F F  (2-15)

(50)

47 47 Et l‟équation (2-11) devient : ADDF(x) = F F F(x)c

 (2-16) La construction automatique d‟un arbre nécessite des mesures comme l‟entropie et le gain d‟information.

Dans un problème de classification, dans le cas idéal, les vecteurs d‟apprentissage associés à un nœud terminal (une feuille) appartiennent à la même classe.

On dit alors que la feuille est “pure“. Ce n‟est évidemment pas toujours possible et l‟objectif de l‟induction vise à créer des feuilles avec un degré de mélange minimum.

Le partitionnement est réalisé à chaque nœud par des tests portant sur une variable : il faut donc choisir le meilleur test, l‟entropie permet de faire le bon choix de la classe.

- la notion de représentation de la classe k au nœud N pour une modalité Aj de la variable

traitée, joue un rôle central. Elle est définie par :

r (k, j, N)=

P i i k x 1 ) (  ۸Aj(xij)۸N(xi) (2-17)

On en déduit les paramètres Pk et wj utilisés pour le calcul du gain :

Pk=



  P i i N j k j j X N j k r N j k r N j k r 1 ) ( ) , , ( ) , , ( ) , , (  (2-18) wj=



  P i i N k k j k x N j k r N j k r N j k r 1 ) ( ) , , ( ) , , ( ) , , (  (2-19)

(51)

48 48 Le gain d‟information apporté par un attribut X au nœud N est :

G(X, N)=I(N)-Info(X,N) (2-20) Avec I(N)=-

k k k P

P log Information au nœud N (entropie) (2-21)

Info(X, N)=

j

j

jI X

w ( ) Information apportée par X au nœud N (2-22)

1.11.5 Optimisation de l’arbre de décision flou:

Le défaut majeur des arbres de décision flous est qu‟il faut fixer à priori le nombre de fonctions d‟appartenances par entrée et les placer plus ou moins empiriquement sur chaque domaine.

Ce qui diminue la performance de l‟arbre car ils interviennent dans le calcul de la valeur des différents paramètres, tel que le gain d‟information. La méthode proposée est d‟augmenter le nombre de fonctions d‟appartenance selon une heuristique et trouver le nouveau placement optimal algorithme de Solis et Wetts [12].

1.12 Résumé :

Nous avons présenté dans ce chapitre les principes des arbres de décision classiques ensuite la technique des arbres de décision flous.

Nous avons défini quelques notions essentielles comme l‟entropie et le gain d‟information qui jouent un rôle très important dans la construction de l‟arbre de décision flou. Dans le chapitre suivant nous allons implémenter un classifieur des arythmies cardiaques en se basant sur le principe de cette technique.

(52)

49 49

(53)

50 50

Chapitre 3

Résultats et interprétations

Présentation : Dans ce chapitre, nous utiliserons la base de données MIT et le logiciel FisPro (source libre) comme plateforme de travail. Nous menerons plusieurs expérimentations afin de choisir le meilleur arbre de décision flou (ADF) dans la classification des arythmies ciblées (le cas normal (N), extrasystole ventriculaires (V), extrasystoles auriculaires (A) et extrasystoles jonctionnelles (J)). Nous commencerons par le choix des variables caractéristiques d’un battement cardiaque en utilisant des approches géométriques ensuite après avoir constitué le vecteur d’entrée nous allons tester les modèles des arbres de décision flous en choisissant les modalités floues pour chaque variable et en fixant les points modaux.

(54)

51 51

3.1 Choix des variables d’entrée :

3.1.1 Caractérisation du vecteur d’entré :

Le choix des paramètres du vecteur d‟entré d‟un classifieur est très important pour la bonne reconnaissance des arythmies cardiaques. Ce choix est fortement lié à la localisation précise des instants d‟apparition des différentes ondes du signal ECG (P, Q, R, S, et T).

3.1.2 Présentation de la base de données

Depuis 1975, les laboratoires de l'hôpital de Beth Israël à Boston et MIT ont réalisé une base de données MIT/BIH, qui a été commencé à être distribuée en 1980. Cette base de données contient 48 enregistrements extraits d'une demi-heure des enregistrements ambulatoires à deux voies d'ECG, obtenus à partir de 47 sujets étudiés par le laboratoire d'arythmie de BIH entre 1975 et 1979. Vingt-trois enregistrements ont été choisis au hasard d'un ensemble de 4000 enregistrements ambulatoires de 24 heures d'ECG rassemblées d'une population mélangée des patients hospitalisés (60 %) et des patients non hospitalisés (40 %) à l'hôpital de Beth Israël à Boston , les 25 enregistrements restants ont été choisis parmi les mêmes enregistrements mais qui en considération des arythmies rarement observés qui ont une signification cliniques. Les enregistrements ont été échantillonné à une fréquence fe = 360 Hz avec une résolution de 11 bits sur une gamme de 10mV. Deux cardiologues ou plus ont indépendamment annoté chaque enregistrement, environ 110.000 annotations ont été inclus avec la base de données.

(55)

52 52 3.1.3 Caractérisation du signal ECG :

Figure 3.1 Différentes ondes du signal électrocardiogramme (ECG)

Paramètres Définition

RRo depuis le pique R précédent et le

pique R présent

RRs depuis le pique R présent et le

pique R suivant.

Rapport représente le rapport entre le

RRo et le RRs

QRS représente la largeur du

complexe QRS

Tableau3.1 Signification des paramètres contenus dans la base de données

3.1.4 Analyse des variables d’entrée :

La caractérisation du battement cardiaque par des descripteurs pertinents est indispensable lors de la conception et l‟implémentation de tout modèle de reconnaissance d‟une anomalie cardiaque. De nombreuses approches citées dans la littérature ont porté sur la difficulté

(56)

53 53 que représentent la mesure et le choix des paramètres pertinents du signal ECG et leur classification.

Donc, le bon choix des paramètres du vecteur d‟entrée au classifieur basé sur l‟arbre de décision flou facilitera énormément la réduction de la complexité de l‟arbre et permettra d‟avoir des règles de décision plus crédibles (chaque branche de l‟arbre est une règle de décision). Pour cela nous procédons à une analyse géométrique (bidimensionnelle et tridimensionnelle) pour voir le degré d‟appartenance de chaque paramètre par rapport aux différentes classes ciblées (N, V, A. J).

3.1.5 Analyse de l’importance des variables :

Sachant que le choix des paramètres d‟entrée de tout classifieur est décisif pour une bonne discrimination, nous avons testé le degré de pertinence de chaque paramètre par rapport aux classes ciblées en utilisant le logiciel FISPRO (source libre).

3.1.6 Présentation du logiciel FisPro :

Figure

Figure 1.‎ 0.16 Extrasystole Supraventriculaire
Figure 3.1  Différentes ondes du signal électrocardiogramme (ECG)
Figure 3.7 Représentation 3D du QRSet RR0 en fonction de la classe
Figure 3.10 (a, b) : Histogramme de COMP à gauche et QRS à droite
+7

Références

Documents relatifs

L’interprétation des ECG est plus difficile chez le chat que chez le chien, car les complexes hypovoltés sont normaux (Figure 3) et les ondes P et T sont parfois difficiles

Dans un second temps, nous proposons une représentation stricte d’un ensemble de classes vectorielles floues en créant des classes de transition plutôt que de fixer

Aim: to describe the development of very preterm children free of cerebral palsy or severe sensory impairment in the domains of gross and fine motor functions, language and

(2013) demonstrated that lesions of the DTN (part of the brainstem circuit processing vestibular signals to generate HD cell activity) dramatically impair the engagement of distal

[r]

Dans le problème de la classification monoclasse, on suppose que seules les données de la classe cible sont disponibles pour l’apprentissage du classifica- teur, alors que l’ensemble

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

la définition d’un critère permettant de sélectionner la meilleure division parmi toutes celles admissibles pour les différentes variables.. une règle permettant de décider