• Aucun résultat trouvé

Procédure de résolution par apprentissage

I.3.1 Chaine de classification d'objets

I.3.1.3 Procédure de résolution par apprentissage

La classe reçoit une définition qui peut être une définition purement descriptive ou une interprétation, par exemple du type diagnostic médical. Le classifieur qui réalisera le classement des formes doit passer par deux phases [Leschi 1991], une phase d'apprentissage et une phase de test.

 Phase d'apprentissage

Le but de l'apprentissage est de découvrir les règles (généralement non déterministes) qui gouvernent et régissent des formes. L'apprentissage est un processus calculatoire qui doit être capable d'amener à une certaine prédiction et à une certaine généralisation. Il existe principalement deux types d'apprentissage, supervisé et non supervisé [Milgram 1993]. Dans le premier cas, on doit apprendre des associations (individus, classes) ; dans le deuxième cas on ne fournit pas d'indications sur les classes.[voir chapitre2]

 Phase de test

Cette phase doit permettre l'affectation d'un nouvel objet à l'une des classes, au moyen d'une règle de décision intégrant les résultats de la phase d'apprentissage [Leschi

27 1991]. L'objectif est d'obtenir une estimation la plus fidèle possible du comportement du

classifieur dans des conditions réelles d'utilisation. Pour cela, des critères classiques comme les taux de classification et les taux d'erreur sont presque systématiquement utilisés. Mais d'autres critères, comme la spécificité et la sensibilité, apportent aussi des informations utiles.

Taux de classification et taux d’erreurs [Chikh, 2005]

Les taux de classification et d'erreurs permettent d'évaluer la qualité du classifieur C par rapport au problème pour lequel il a été conçu. Ces taux sont évalués grâce à une base de test qui contient des formes décrites dans le même espace de représentation E que celles utilisées pour l'apprentissage. Elles sont aussi étiquetées par leur classe réelle d'appartenance afin de pouvoir vérifier les réponses du classifieur. Pour que l'estimation du taux de reconnaissance soit la plus fiable possible, il est important que le classifieur n'ait jamais utilisé les échantillons de cette base pour faire son apprentissage (la base de test ne doit avoir aucun objet en commun avec la base d'apprentissage et les éventuelles bases de validation). De plus, cette base de test doit être suffisamment représentative du problème de classification [Guyon 19981. En général, quand les échantillons étiquetés à disposition sont suffisamment nombreux, ils sont séparés en deux parties disjointes et en respectant les proportions par classes de la base initiale. Une partie sert pour former la base d'apprentissage et l'autre pour former la base de test. Le découpage le plus courant est de 2/3 pour l'apprentissage et le 1/3 restant pour la base de test. Les performances en terme de taux de classification sont alors déterminées en présentant au classifieur chacun des exemples ej de la base de test et en comparant la classe donnée en résultat C (ej) = s à la vraie classe de ej. En considérant que la base de test contient N objets et que sur ceux-ci N corrects sont biens classés par le système, le taux de classification class est simplement défini par :

Le taux d'erreur err est défini à partir du nombre d'objets Nerr mal classés :

28

Sensibilité et spécificité

L'évaluation des performances d'un classifieur peut être réalisée par l'appréciation de deux lois statistiques, qui sont la sensibilité et la spécificité. Pour rappel, ces deux quantités sont définies par :

Où les grandeurs VP(i), FN(i), VN(i), FP(i) sont définies dans le tableau1.2

La sensibilité Se (i) représente la probabilité de bonne classification de la classe i et

spécifité Sp (i) est une mesure indirecte de la probabilité de fausse alarme.

I.4 conclusion

Ce chapitre a permis de définir le système ADM, ainsi de présenter son intérêt dans la médecine et ses différents approches.

Ce chapitre a aussi introduit des notions sur la classification des formes dans les systèmes ADM, surtout la procédure de résolution par apprentissage que nous allons utiliser pour réaliser des classifieurs des signaux bio médicaux.

Présence d’événement de classe i

Absence d’événement de classe i Classification Positive Vrai Positif VP (i) Faux Positif FP (i)

30

II.1 Introduction

Un RNA est un ensemble de neurones formels (voir annexe c) (d'unités de calcul simples, de nœuds processeurs) associés en couches (ou sous-groupes) et fonctionnant en parallèle.

Les réseaux de neurone sont des modèles mathématiques et informatiques, des assemblages d’unités de calculs appelés neurone formels (voir annexe c), et dont l’inspiration originale était un modèle de la cellule nerveuse humain (voir annexe a)

Dans un réseau, chaque sous-groupe fait un traitement indépendant des autres et transmet le résultat de son analyse au sous-groupe suivant. L'information donnée au réseau va donc se propager couche par couche, de la couche d'entrée à la couche de sortie, en passant soit par aucune, une ou plusieurs couches intermédiaires (dites couches cachées). Il est à noter qu'en fonction de l'algorithme d'apprentissage, il est aussi possible d'avoir une propagation de l'information en sens inverse ("back propagation"). Habituellement (excepté pour les couches d'entrée et de sortie), chaque neurone dans une couche est connecté à tous les neurones de la couche précédente et de la couche suivante.

Les RNA ont la capacité de stocker de la connaissance empirique et de la rendre disponible à l'usage. La connaissance du réseau va être stockée dans les poids synaptiques, obtenus par des processus d'adaptation ou d'apprentissage. En ce sens, les RNA ressemblent donc au cerveau car non seulement, la connaissance est acquise au travers d'un apprentissage mais de plus, cette connaissance est stockée dans les connexions entre les entités soit, dans les poids synaptiques.

Ce chapitre présente les différentes structures des RNA, ainsi ses différents types d’apprentissage et ses problèmes