• Aucun résultat trouvé

Détection de diabète : approche par Data Mining

Chapitre 2 Systèmes embarqués communicant :

4. Détection de diabète : approche par Data Mining

4.1 Introduction

Le diabète est aujourd'hui considéré comme l'un des plus grands dangers pour la santé. Il est devenu une maladie sociale, associée à l'évolution de la civilisation qui a été affligeant de plus en plus des gens. Il a besoin de surveillance intensive et des soins médicaux.

Le diabète est un trouble métabolique grave marquée par l’augmentation de niveau de glucose dans le sang, une miction excessive et soif persistante, causées par le manque d'actions de l'insuline. [28]

L’insuline est une hormone qui régule la concentration de sucre dans le sang. L’hyperglycémie, ou concentration sanguine élevée de sucre, est un effet fréquent du diabète non contrôlé qui conduit avec le temps à des atteints graves de nombreux systèmes organiques et plus particulièrement les nerfs et les vaisseaux sanguins. [55]

33

Ces derniers temps, les différents équipements médicaux intègrent de plus en plus des modules (logiciels ou matériels) informatiques contrôlant leur fonctionnement (échographe, radio IRM, biocapteurs, etc.). Les systèmes chargés de la surveillance des patients doivent interpréter rapidement un flot de données important et sont ainsi soumis à une surcharge cognitive de plus en plus forte [45]. Ces systèmes de surveillance doivent plus ou moins réaliser des objectifs suivants :

- faciliter l’interprétation du flot de données provenant des différents capteurs d’un Système

- détecter les anomalies survenant sur le système et alerter les operateurs (fonction de détection)

- fournir une aide à la décision en proposant un diagnostic pour le problème rencontre (fonction de localisation du défaut et d’identification)

Dans le but de répondre à ces préoccupations, nous avons introduit dans notre architecture de surveillance de patient un module informatique de détection qui consiste à reconnaitre et indiquer en temps réel (le plus tôt possible) les anomalies de comportement des signes physiologiques du patient.

Lorsque le système de surveillance détecte que ces signes ne se présentent plus correctement, il doit générer une alarme pour alerter soit le patient lui-même, soit son médecin, soit les deux en même temps.

En outre, nous avons définis un module de diagnostic qui doit aller plus loin dans l’analyse de la situation de façon à déterminer avec précision un diagnostic particulier, à savoir le diagnostic de diabète.

4.2 Data-Mining

Le Data Mining ou fouille de données est la recherche d’informations pertinentes (des “pépites” d’information) pour l’aide à la décision et la prévision. Elle met en œuvre des techniques statistiques et d’apprentissage machine qui permettent de transformer les données en

34

connaissances en tenant compte de la spécificité de grandes à très grandes dimensions (big data) des données. [21]

Le Data Mining est un processus qui fait intervenir des méthodes et des outils issus de différents domaines de l’informatique, de la statistique ou de l’intelligence artificielle en vue de découvrir des connaissances utiles.

Le Data Mining, dans sa définition restreinte, opère sur des tables bidimensionnelles, appelées data marts, et fait appel à trois grandes familles de méthodes issues de la statistique, de l’analyse des données, de la reconnaissance de formes ou de l’apprentissage automatique. [23]

L’objectif ultime de Data Mining est de créer un modèle, un modèle qui peut améliorer la façon dont vous lisez et interprétez vos données existantes et vos données futures. Comme il existe nombreuse techniques avec Data Mining, l'étape importante de la création d'un bon modèle est de déterminer quel type de technique à utiliser. [19]

4.2.1 Les arbres de décision

Les arbres de décision sont des méthodes symboliques de l’apprentissage inductif très utilisées dans le domaine de classification reconnue par leur propriété d’intelligibilité, l’efficacité des algorithmes qu’elles présentent et l’exactitude et la précision des résultats fournis. [46]

Un arbre de décision est un outil d'aide à la décision et à l'exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d'exécution et le peu d'hypothèses nécessaires à priori expliquent sa popularité actuelle. Ils sont utilisés comme systèmes d'aide à la décision (SIAD) dans de nombreux domaines, en particulier en médecine, pour le scoring bancaire, et dans de nombreux problèmes de discrimination. [26]

35

Les arbres de décision permettent de produire des procédures de classification compréhensibles par l'utilisateur. C'est en particulier le cas pour l'aide au diagnostic médical où le médecin doit pouvoir interpréter les raisons du diagnostic. Car les arbres de décision représentent graphiquement un ensemble de règles et sont aisément interprétables. Pour les arbres de grande taille, la procédure globale peut être difficile à appréhender, cependant, la classification d'un élément particulier est toujours compréhensible [47]. Les algorithmes d'apprentissage par arbres de décision sont efficaces, disponibles dans la plupart des environnements de fouille de données.

Un arbre est constitué :

 de noeuds qui testent les attributs

 de branches qui représentent chacune une valeur de l'attribut testé dans le nœud dont elles sont issues

 de feuilles (ce sont les nœuds terminaux de l'arbre) qui indiquent la classe résultante.

La technique de l’arbre de décision est employée en classement pour détecter des critères permettant de répartir les individus d’une population en n classes prédéfinies (n= 2 dans notre cas). On commence par choisir la variable qui, par ses modalités, sépare le mieux les individus de chaque classe, de façon à avoir des sous-populations, que l’on appelle nœuds, contenant chacune le plus possible d’individus d’une seule classe, puis on réitère la même opération sur chaque nouveau nœud obtenu jusqu’à la séparation des individus ne soit plus possibles ou plus souhaitable. Les nœuds terminaux sont tous majoritairement constitués d’individus d’une seule classe. Un individu est affecté à une seule feuille, donc à une certaine classe avec une assez forte probabilité, quand il satisfait l’ensemble des règles permettant d’arriver à cette feuille. [27]

Pour parcourir un arbre de décision et trouver une solution il faut partir de la racine. Chaque nœud est une décision atomique. Chaque réponse

36

possible est prise en compte et permet de se diriger vers un des fils du nœud. De proche en proche, on descend dans l’arbre jusqu’à tomber sur une feuille. La feuille représente la réponse qu’apporte l’arbre au cas que l’on vient de tester.

5. Conclusion

Par rapport aux objectifs assignés à notre travail, nous avons proposé une architecture du système SMSP. Elle est composée essentiellement d'activités de collecte périodiques d'information sur les signes physiologiques et le traitement de ces informations afin de détecter d'éventuelle déviation par rapport au comportement normal. En outre, nous avons développés un moyen d'aide au diagnostic de diabète utilisant une technique de data mining.

37

Documents relatifs