• Aucun résultat trouvé

5.1 Introduction

T

out ce qui affecte le coeur et l’empêcher de fonctionner normalement fait partie des maladies du coeur. On groupe souvent ces maladies selon qu’elles sont congénitales (c-à-d présentes à la naissance) ou acquises (c-à-d attribuable à une autre condition). Parmi les maladies du coeur, on compte :

X la cardiomyopathie : une maladie du muscle cardiaque,

X l’insuffisance cardiaque congestive : fonctionnement insuffisant de la pompe car-diaque qui entraîne l’accumulation de liquide dans les poumons et ailleurs dans le corps ;

X les troubles des valves cardiaques : d’origine congénitale (p.ex. maladie d’Ebstein) ou acquis (Ex : péricardite infectieuse) ;

X la maladie du péricarde : une infection du péricarde, la membrane qui enveloppe le coeur tel un sac.

L’électrocardiographie est un procédé rapide, simple et indolore, qui consiste à am-plifier et enregistrer soit sur un papier soit sous forme de données les impulsions élec-triques traversant le coeur (électrocardiogramme). Cet enregistrement, l’électrocardio-gramme (ECG), donne des informations concernant la partie du coeur qui initie chaque battement cardiaque (le stimulateur cardiaque, appelé noeud sino-auriculaire ou sinusal), les voies de conduction nerveuse, ainsi que la vitesse et rythme cardiaque. Ces informa-tions peuvent être extraites soit par un expert en utilisant l’enregistrement sur un papier, soit automatiquement en utilisant un système expert contenant une base de données. Dans notre thèse on adopté la deuxième méthode. Généralement, ces systèmes se com-posent de deux parties, la première partie consiste à l’extraction des caractéristiques des différents battements constituant le signal électrocardiogramme, la deuxième étape sera le classement de ces battements selon le type de pathologie atteinte. Dans ce chapitre une nouvelle classe des caractéristiques appelée caractéristique floue sera exprimée en détails et fusionnée avec d’autres caractéristiques extraites en utilisant la transformée en onde-lettes discrète . Une méthode de classification baptisé (ELM : Extreme Learning Machine) sera utilisée pour l’étape de classement.

5.2 État de l’art sur l’extraction des caractéristiques et la

clas-sification des battements cardiaques

Dans cette section on va présenter chronologiquement les travaux développés dans le contexte d’extraction des caractéristiques et classification des battements cardiaques.

Maglaveras et al. [191] ont utilisé l’analyse en composantes principales (PCA : Principal

Component Analysis ) et les réseaux de neurones pour la reconnaissance de formes et la

classification du signal électrocardiogramme. Dokur et al. [192] ont proposé une structure hybride de réseau de neurones pour la classification des battements cardiaques, où les caractéristiques des battements ont été extraites en utilisant deux méthodes : la transfor-mée de Fourier et d’ondelettes. Engin [193] a présenté une méthode basée sur la logique floue et le réseau de neurones hybride pour la classification des battements cardiaques, où les variances de cumulant d’ordre supérieur et de la transformée en ondelettes ont été utilisées dans la phase d’extraction des caractéristiques. ozbay et al. [194] ont discuté une autre structure basée sur la logique floue et le réseau de neurones pour le diagnostic précoce.

Meau et al. [195] ont développé un système hybride se basant sur le filtre de Kal-man étendu, le perceptron multicouche et la logique floue pour la reconnaissance des signaux électrocardiogrammes. Ce système peut distinguer différents types de signaux ECG anormaux. Un schéma commutable a été proposé pour discriminer différents types de battements du signal électrocardiogramme basé sur l’analyse en composantes indépen-dantes (ICA : Independent Component Analysis) [196]. Ubeyli et al. [197] ont présenté une approche basée sur l’implémentation des machines à support de vecteurs multi-classe avec une méthode des codes correcteurs d’erreurs baptisé (ECOC : Error Correcting Output

Codes) pour la classification des battements cardiaques, où les caractéristiques des

batte-ments cardiaques ont été extraites en utilisant la transformée en ondelettes. Yu et al. [198] ont utilisé le réseau de neurones et l’analyse en composantes indépendantes (ICA) pour classifier les battements cardiaques, où le réseau de neurones a été utilisé comme classifi-cateur et l’ICA pour extraire les caractéristiques des battements cardiaques. Yu et al. [199] ont proposé une stratégie d’arrangement des composantes indépendantes pour coopérer avec la méthode d’analyse en composantes indépendantes (ICA) pour la classification des battements du signal électrocardiogramme.

Une méthode de classification des signaux électrocardiogrammes basée sur un sys-tème d’inférence neuro-flou adaptatif comme classificateur et l’exposant de Liapounov pour l’étape d’extraction des caractéristiques a été discutée dans [200]. Un autre classifi-cateur automatique pour la détection d’anomalies cardiaques basé sur le signal électrocar-diogramme en utilisant un modèle de mélange Gaussien (GMM : Gaussien Mixture Model) a été présenté dans [201]. Ceylan et al. [202] ont présenté un classificateur des arythmies d’électrocardiogramme basé sur un algorithme de clustreing neuro-flou, où une méthode de clustering floue type-2 a été utilisée pour améliorer la structure du réseau de neurones. Mishra et al. [203] ont discuté un classificateur basé sur la dimension fractale locale pour la classification des arythmies d’électrocardiogramme.

Un classificateur basé sur le réseau de neurones avec une fonction d’activation adap-tative a été implémenté pour la classification des arythmies électrocardiogrammes [204]. Korurek et al. [205] ont présenté une méthode pour la classification des battements du signal électrocardiogramme basée sur l’optimisation par essaims particulaires (PSO :

Par-ticle Swarm Optimization ) et le réseau de neurones. Gayathri et al. [206] ont développé un système pour la classification des signaux électrocardiogrammes en utilisant la machine à pertinence de vecteur (RVM : Relevance Vector Machine). Wang et al. [207] ont présenté un classificateur des arythmies du signal électrocardiogramme, où l’analyse en composantes principales (PCA : Principal Component Analysis ) et l’analyse discriminante linéaire (LDA :

Linear Discriminant analysis) ont été utilisées pour l’extraction et la réduction des

caracté-ristiques, et le réseau de neurones a été utilisé pour la classification de ces caractéristiques. Zidelmal et al. [208] ont utilisé un classificateur a base de machine à support de vecteurs, où des informations fréquentielles, l’intervalle RR et la morphologie du complexe QRS ont été utilisés comme caractéristiques. Martis et al. [209] ont développé une approche pour l’extraction des caractéristiques et la classification des battements cardiaques, où plu-sieurs méthodes ont été utilisées pour l’extraction et la réduction des caractéristiques dans le domaine d’ondelettes à savoir : l’analyse en composantes principales (PCA : Principal

Component Analysis ), l’analyse discriminante linéaire (LDA : Linear Discriminant analysis),

l’analyse en composantes indépendantes (ICA : Independent Component Analysis).

Une méthode de classification des arythmies cardiaques en utilisant plusieurs classifi-cateurs à savoir : la machine à support de vecteurs à noyau (KSVM : Kernel Support Vector

Machine) et le k-plus proche voisin (KNN : K-Nearest Neighbor), où les caractéristiques ont

été extraites en utilisant la méthode de Burg, a été discutée dans [210]. La machine à support de vecteurs, l’analyse en composantes principales et la transformée en ondelettes discrète ont été combinées pour construire un classificateur des battements cardiaques [211]. Faziludeen et al. [212] ont adopté le classificateur baptisé (KNN : K- Nearest

Neigh-bor) pour la classification des arythmies cardiaques, où les intervalles RR du signal

élec-trocardiogramme ont été pris comme caractéristiques de pathologie. L’optimisation par essaims particulaires et le réseau de neurones ont été combinées pour traiter le problème de la classification des signaux électrocardiogrammes, et ont été discutées par Shadmand

et al. [213]. Une approche pour la classification des arythmies cardiaques basée sur la décomposition en modale empirique (EEMD : Ensemble Empirical Mode Decompostion) et machine à support de vecteurs (SVM : Support vector machine) a été discutée dans [10], où l’EEMD a été utilisée pour l’extraction des caractéristiques et le SVM a été utilisée pour la classification.

5.3 Contribution

Dans ce chapitre, nous allons présenter notre méthode proposée pour la classification des arythmies cardiaques. Dans cette étude, cinq types de battements d’arythmie recom-mandés par AAMI (Association for the Advancement of Medical Instrumentation) seront considérés : battement normal (N), battement anormal d’origine supra-ventriculaire (S), battement anormal d’origine ventriculaire (V), battement résultant de la fusion d’un bat-tement V et d’un batbat-tement N (F), et batbat-tement inconnu (Q) (cf., chapitre 1). Pour la première étape qu’est l’extraction des caractéristiques, deux méthodes ont été utilisées afin de fusionner les caractéristiques extraites. La première méthode est la technique de modélisation et d’identification floue type-2 du signal électrocardiogramme discutée dans lechapitre 3, où les paramètres de ce modèle à savoir : les valeurs moyennes (centres) des fonctions d’appartenance floues type-2 Gaussiennes de la prémisse, et les intervalles de conséquences, ont été prises comme étant les caractéristiques des différents battement du signal électrocardiogramme. Dans la deuxième méthode on a utilisé la transformée en ondelettes, où après la décomposition du signal en plusieurs niveaux, des mesures (caractéristiques) ont été calculées pour chaque niveau à savoir : la variance, l’entropie, l’énergie. Comme méthode d’apprentissage automatique nous avons choisi d’utiliser la technique ELM (Extreme Learning Machine) comme classificateur, cette technique fait ré-férence à un type de réseau de neurones. La Figure5.1représente l’organigramme de la procédure adoptée.

5.4 Préparation des bases de données

La base de données MIT-BIH PhysioBank [129] nous a permis de créer deux sous bases de données : une pour l’apprentissage et l’autre pour les tests qui serviront l’entraine-ment et l’évaluation des performances du classificateur. Les battel’entraine-ments sélectionnés sont regroupés selon les cinq classes recommandées par AAMI (cf.,chapitre 1) données dans le Tableau5.1.

TABLE5.1 – Enregistrements ECG et nombres de battements utilisés dans cette étude.

Classe ECG record

(Sous classe) Base d’apprentissage Base de test N 100, 103, 105, 113, 115, 119, 121 07 03 S 100, 103, 113, 121, 202, 205, 209, 210 07 03 V 100, 105, 119, 121, 123, 202 07 03 F 202, 205, 210 07 03 Q 105, 203, 208 07 03 Total 35 15

Base de données du signal ECG

Extraction des Caractéristiques flous Extraction des caractéristiques

par la transformée en ondelettes

Fusion des caractéristiques

Matrice caractéristique Classificateur (ELM) Classes

V F Q

S

N

FIGURE5.1 – Organigramme de la procédure adoptée.

L’applicationLighthWAVE(cf.,Figure 5.2) de la base de données MIT-BIH physiobank nous a permet d’extraire les différents sous classes de notre base de données. Cette appli-cation permet de visualiser les différents enregistrements du signal électrocardiogramme (100.dat, 202.dat....etc) (cf.,Figure 5.2) et permet aussi de donner les différents annota-tions que contient un signal ainsi que leurs instants d’apparition (Figure 5.3).

Pour l’extraction d’une sous classe quelconque on prend l’instant d’apparition de l’an-notation correspondante (N, V, S, Q...etc) et l’instant de l’anl’an-notation qui la précède et on extrait le battement correspondant. La Figure5.4représente un exemple d’extraction de la sous classe 1 (annotation A) qui appartient à la classe S.

5.5 Extraction des caractéristiques

L’extraction et l’identification des caractéristiques du signal électrocardiogramme sont la base de l’analyse et du diagnostic de l’ECG. Après la création des bases de données (cf.,

Tableau 5.1) l’étape suivante sera l’extraction des caractéristiques des sous classes (diffé-rents battements) constituant les différentes classes. Ci-après les deux méthodes qui vont être utilisées pour l’extraction des caractéristiques des différents battements cardiaques.

FIGURE5.2 – LightWaVE.

FIGURE5.3 – Table récapitulatif du signal 100. dat en utilisant l’application LightWaVE.

5.5.1 Extraction des caractéristiques par la logique floue type-2

La méthode d’identification et de modélisation du signal électrocardiogramme (cf.,

chapitre 3) a été adoptée pour l’extraction des caractéristiques des différentes sous classes du tableau 5.1, et qui consiste à modéliser et identifier les différentes sous classes l’un après l’autre, afin de constituer les vecteurs caractéristiques de chaque sous classes des différentes classes. Ces caractéristiques correspondent aux vecteurs des paramètres des modèles flous des différentes sous classes, qui sont les valeurs moyennes (centres) des

Battement = Sous classe 1 de la classe S L’instant d’apparition de l’annotation A L’instant de l’annotation Précédente

FIGURE5.4 – Exemple d’extraction d’une sous classe.

fonctions d’appartenance floues type-2 Gaussiennes de la prémisse, et les intervalles de conséquence qui caractérisent les concepts flous dans les règles IF − T HEN . Finalement on compose la sous matrice caractéristique constitue de différents vecteurs caractéristiques des différentes sous classes constituant les classes (cf.,Tableau 5.1). La Figure5.5 repré-sente les différentes phases de l’étape d’extraction des caractéristiques, où les ci sont les paramètres des modèles flous type-2 des différentes sous classes, N , S, V , F , et Q sont les différentes classes, L est le nombre des sous classes dans chaque classe, n est le nombre des intervalles de sortie et les régresseurs pour chaque règle et M est le nombre de règles qui constituent le système de modélisation et identification flou type-2 (cf.,chapitre 3).

5.5.2 Extraction des caractéristiques par la transformée en ondelettes dis-crète DWT

Dans la littérature des ondelettes, on parle souvent d’approximation et de détails [214,215]. L’approximation représente les composantes basses fréquences du signal tan-dis que les détails représentent les composantes de haute fréquence. Selon cette transfor-mée, un signal x(t) peut être décomposé en plusieurs composantes de faibles et de hautes résolutions [216,217, 218] (composantes d’approximations et composantes de détails). Les Figures5.6et5.7représentent la décomposition en ondelettes à trois niveaux où fe

N

S

V

F

Q

Battement 1 Battement 2 Battement L Battement 1 Battement 2 Battement L Battement 1 Battement 2 Sous Classe L Battement 1 Battement 2 Battement L Battement 1 Battement 2 Battement L

Modèle flou type-2 Modèle flou type-2

Modèle flou type-2 Modèle flou type-2 Modèle flou type-2

Modèle flou type-2 Modèle flou type-2 Modèle flou type-2

Modèle flou type-2 Modèle flou type-2 Modèle flou type-2

Modèle flou type-2 Modèle flou type-2 Modèle flou type-2

Modèle flou type-2

Classes Sous-classes Modélisation et identification floue type-2 Vecteurs caractéristiques

FIGURE 5.5 – Organigramme de l’étape d’extraction des caractéristiques en utilisant la

logique floue type-2.

représente la fréquence d’échantillonnage, cA les coefficients d’approximation et cD les coefficients de détails.

Le nombre de décompositions est appelé nombre de niveaux, son choix dépend de la nature du signal considéré et du problème à résoudre.

Après la décomposition du signal électrocardiogramme par la transformée en onde-lettes en plusieurs niveaux L, une fenêtre glissante de taille N va être utilisée pour chaque niveau et pour chaque composante (composantes d’approximations et composantes de détails), où des mesures statistiques vont être calculées pour chaque fenêtre à savoir : l’énergie, la variance, Entropie de Shannon. Ces grandeurs vont être considérées comme

Signal x(t) avec N Echantillons cD1, N/2 cA1, N/2 cD2, N/4 cA2, N/4 cD3, N/8 cA3, N/8 0 à fe/2 fe/4 à fe/2 0 à fe/4 0 à fe/8 fe/8 à fe/4 0 à fe/16 fe/16à fe/8 Niveau 1 Niveau 3 Niveau 2

FIGURE5.6 – Décomposition : Transformée en ondelette discrète.

Signal original Niveau 01 Niveau 02 Niveau 03 cD1 cA1 cD1 cD1 cA2 cD2 cD2 cD3 fe/2 fe/4 fe/8 fe/16 cA3

FIGURE5.7 – Vue dans le domaine fréquentiel de la décomposition en ondelette discrète

des caractéristiques du signal électrocardiogramme.

Finalement les vecteurs caractéristiques extraits par la logique floue type-2 et la trans-formée en ondelettes seront réarrangés sous forme de deux matricesM et K, où la matrice

caractéristique finale peut s’écrire comme suit :

5.6 Sélection des caractéristiques par la méthode mRMR

Dans les problèmes de classification, et sur tous si la taille de la matrice caractéristique (Équation 5.1) est énorme, nous cherchons toujours à trouver le meilleur sous ensemble de caractéristiques pour choisir le modèle approprié et minimiser les erreurs de classification et aussi le temps de calcul. Plusieurs techniques ont été développées pour résoudre ce problème de sélection à savoir : l’analyse en composantes principales (PCA), l’analyse en composantes indépendantes (ICA), la décomposition en valeurs singulières (SVD), ReliefF, Fisher et autres. Dans notre thèse une méthode baptisé mRMR (minimum-redundancy

maximum relevany) est adoptée. L’mRMR est une méthode de filtrage pour la sélection des

caractéristiques proposée par Peng et al. [219]. Cette méthode est basée sur des mesures statistiques classiques comme l’information mutuelle, la corrélation...etc. L’idée de base est de profiter de ces mesures pour essayer de minimiser la redondance (mR) entre les variables et de maximiser la pertinence (MR). Peng et al. [219] ont utilisé l’information mutuelle pour calculer les deux facteurs mR et MR. Le calcul de la redondance et de la pertinence d’une variable est donnée par l’équation suivante :

Redondance(i) = 1 |F |2 X i,jßF I(i, j) (5.2) P ertinenece(i) = 1 |F |2 X i,jßF I(i, Y ) (5.3) avec :

|F | : représente la taille de l’ensemble de variables.

I(i, j): est l’information mutuelle entre la iiemeet la jieme variable.

I(i, Y ): est l’information mutuelle entre la iieme variable et l’ensemble des étiquettes de la classe Y.

Le score d’une variable est la combinaison de ces deux facteurs tel que :

Score(i) = P ertinence(i) − Redondance(i) (5.4)

5.7 Normalisation des paramètres

Puisque les quantités des paramètres peuvent être différentes, un procédé de norma-lisation est nécessaire pour normaliser tous les paramètres au même niveau. Nous avons appliqué l’Équation5.5, cette équation a été appliquée pour représenter chaque paramètre de matrice caractéristique dans l’intervalle [0,1].

matrice caractristique normalisee = X − min(X)

max(X) − min(X). (5.5) où X est la matrice caractéristique donnée par l’Équation5.1.

5.8 Classification

Le but est de classifier automatiquement les battements cardiaques selon le type d’aryth-mie. Le choix du classificateur est très important, parce qu’il constitue l’élément de déci-sion dans le système de reconnaissance de formes. L’efficacité du classificateur reste aussi subordonnée à plusieurs autres facteurs à savoir : le choix et la taille de la base d’apprentis-sage et la méthode d’extraction des caractéristiques. La machine à apprentisd’apprentis-sage extrême (ELM : Extreme Learning Machine) est un classificateur multi-classe introduit récemment pour la reconnaissance des formes. Le système d’action de reconnaissance incorpore ce classificateur, est une version de réseaux de neurones [220]. Comparativement à d’autres classificateurs, l’ELM fournit des performances significatives, telles que le temps d’appren-tissage rapide et la précision de reconnaissance. L’ELM est une technique d’apprend’appren-tissage automatique qui fait référence à un type de réseau de neurones, sa spécificité est de n’avoir qu’une seule couche des noeuds cachés. Les noeuds cachés dans l’ELM sont initialisés de manière aléatoire et ne doivent pas être réglés de manière itérative (les poids des entrées de connexion de noeuds cachés sont répartis au hasard et jamais misent à jour). En fait, ces noeuds restent fixes après l’initialisation. De cette manière, seuls les paramètres des poids d’entrée doivent être appris.

Lorsque l’échantillon d’apprentissage A est donnée par (xj, yj), j = [1, . . . , q] dans lequel xj ∈ RN et yj ∈ RM, la fonction de sortie du modèle ELM avec L neurones cachés peut être exprimée comme suit :

fl(x) = L X

i=1

giωi(x) = Ω(x)G, (5.6)

où G = [g1, . . . , gL] est le vecteur des poids de sortie reliant les noeuds cachés L aux noeuds de sortie m > 1, et Ω(x) = [ω1(x), . . . , ωL(c)] est une fonction d’activation non linéaire [220]. Le système Ω(x) peut être écrit sous une forme explicite comme suit :

i(x) = β(τi.x + i), τi ∈ Rd, i ∈ R, (5.7) avec B une fonction d’activation avec des paramètres de couche caché (τ, ). La deuxième étape du processus d’apprentissage dans l’ELM, est la minimisation des erreurs entre les données d’entrainement et les poids de sortie obtenus en utilisant la norme des moindres carrées décrite ci-dessous :

où Ω définit le système de la couche de neurones cachés donnée par : Ω =     β(τ1.x1+ 1) . . . β(τL.x1+ L) .. . · · · ... β(τ1.xN + 1) . . . β(τL.xN + L)     , (5.9) H =     hT1 .. . hTN     . (5.10)

La solution optimale pour minimiser l’erreur d’apprentissage dans5.8 suppose prati-quement que le nombre de neurones cachés L est inférieur à celui de l’ensemble d’appren-tissage (c’est-à-dire L < Q). Par conséquent, en utilisant l’inverse généralisé de la matrice de Moore-Penrose [220], la solution optimale de l’Équation5.8sera décrit comme suit :

G= ΩH, (5.11)

où Ω est l’inverse de Ω.

5.9 Résultat et discussion

Dans cette section nous fournissons les résultats de la méthode proposée pour l’ex-traction des caractéristique et la classification des signaux électrocardiogrammes. Les en-sembles de données des différents arythmies cardiaques sont des données réelles et elles sont présentées dans le Tableau5.1. Pour la première méthode d’extraction des caracté-ristiques (modélisation et identification floue type-2), la méthode a été simulée avec un nombre de règles M1 = M2 = 5. L’identificateur est structuré selon un ensemble de 10 règles, ce qui nous donne 10 × 3 = 30 paramètres ajustables (30 caractéristiques pour chaque sous classe (Tableau 5.1)), ce qui nous donne une première sous-matrice carac-téristique de taille 40 × 30. L’algorithme d’ajustement de ces paramètres (l’algorithme BBO) a été paramétré comme suit : le taux de mutation m = 0.01, le taux d’immigration λk et le taux d’émigration µk sont similaires aux courbes de migration linéaire (cf., Fi-gure 2.8). Pour la transformée en ondelettes discrète, chaque sous classe a été décomposé en ondelettes à un seul niveau et une fenêtre glissante de taille fe/16a été utilisée. Par conséquent, en utilisant cette fenêtre avec un seul niveau de décomposition (Figure 5.7) chaque composante (composante d’approximation et composante de détail) sera divisée en quatre fenêtres et on calcule quatre mesures (énergie , variance, entropie de shannon et H est la matrice des données d’entrainement décrite comme suit :

) pour chaque fenêtre, ce qui nous donne une deuxième sous-matrice caractéristique de taille 40 × 36. L’entrée du classificateur est l’ensemble des caractéristiques extraits des si-gnaux ECG représentant les différents types d’arythmies cardiaques en utilisant les deux méthodes discutées précédemment. Par conséquent, une matrice caractéristique de taille 40 × 64a été utilisée comme entrée de classificateur. Les battements sélectionnés à partir de l’ensemble des caractéristiques ont été assignés au hasard dans le sous-ensemble d’ap-prentissage et de test. La méthode proposé a classée efficacement les différents battements et fournit de résultat substantiel en termes de précision (99%).

5.10 Conclusion

Dans ce chapitre nous avons présenté une méthode pour classifier le signal