• Aucun résultat trouvé

3.2 Acquisition de r`egles monosources caract´erisant des arythmies cardiaques :

3.2.4 Comparaison des r´esultats entre Aleph et ICL

Les r´esultats obtenus `a ce jour montrent qu’ICL semble plus performant qu’Aleph au niveau de l’apprentissage puisque tous les apprentissages ont pu ˆetre effectu´es (no-tamment ceux sur la voie de pression) alors que ceux concernant le rythme sinusal ainsi que certains apprentissages concernant les classes apprises `a partir des donn´ees de pression sont insatisfaisants ou n’ont pas pu ˆetre effectu´es avec Aleph. Cela provient probablement des formes de biais utilis´ees par les deux logiciels. Le biais d’Aleph offre plus de libert´e li´ee `a la syntaxe Prolog, mais cette libert´e est souvent trop importante pour limiter l’espace de recherche des clauses r´esultats et ces recherches sont souvent tr`es longues et dans certains cas aboutissent `a des r´esultats insatisfaisants. On peut cependant noter que, dans le cas des apprentissages effectifs, les r`egles donn´ees par Aleph sont beaucoup plus compactes que celles donn´ees par ICL mˆeme si leur lisibi-lit´e demande une certaine expertise. En effet, il est n´ecessaire de d´efinir des pr´edicats structur´es tels que has_wave/8 pour obtenir des r´esultats satisfaisants. Ces pr´edicats offre un biais syntaxique `a l’apprentissage mais sont moins intuitifs que les pr´edicats cycle I ou simplement p/2 ou qrs/2 utilis´es par ICL.

Ces raisons nous poussent `a utiliser ICL comme syst`eme d’apprentissage dans la suite de nos recherches.

3.3 Conclusion

Dans ce chapitre, nous avons propos´e une r´ealisation bas´ee sur la PLI pour in-duire automatiquement les r`egles de classification qui permettent de caract´eriser des arythmies `a partir de diff´erentes sources de donn´ees : l’ECG et une mesure de pression art´erielle pour deux syst`emes de PLI ayant une s´emantique diff´erente : ICL et Aleph. Le codage des exemples et des biais utilis´es pour les deux syst`emes nous a conduit `a faire des choix sur les attributs pertinents permettant de d´ecrire les diff´erentes sources et `a cr´eer des biais complexes permettant d’apprendre des r`egles satisfaisantes.

Les r´esultats attestent que la m´ethode de PLI est appropri´ee pour l’apprentissage automatique de r`egles de classification pour diff´erentes arythmies `a partir d’exemples et de connaissance a priori sur le domaine. Ces r´esultats, en faveur d’ICL, nous ont conduit `a garder ce dernier syst`eme pour la suite de nos travaux. Les r`egles induites

Conclusion 97

sont lisibles et compr´ehensibles pour des m´edecins. Ceci leur permet d’´evaluer les r`egles par rapport `a leurs propres connaissances.

Bien que les r´esultats d’apprentissage avec ICL soient presque parfaits, il faut noter que les classes d’arythmies choisies sont tr`es distinctes et donc relativement faciles `a discriminer, tout en ´etant repr´esentatives de troubles du rythme. De plus, l’exactitude des r´esultats de l’apprentissage automatique d´epend fortement de la qualit´e des donn´ees en entr´ee. Ici, les donn´ees utilis´ees ne sont pas li´ees aux r´esultats d’un module de traitement du signal mais proviennent des annotations de la base de MIT BIH qui sont relativement correctes. Afin d’´evaluer plus compl`etement la PLI `a l’application de reconnaissance d’arythmies, il est n´ecessaire d’utiliser les r`egles apprises sur des signaux r´eels bruit´es. Des exp´eriences dans ce sens sont men´ees dans le chapitre suivant. Il faut ´egalement noter que la base d’exemples reste trop restreinte pour appendre des r`egles r´eellement fiables. Il faudrait qu’elle puisse contenir, pour chaque arythmie, des exemples de toutes les formes que peuvent prendre ces arythmies pour obtenir des r`egles discriminantes ayant une signification m´edicale vraiment pertinente. Puisque la construction d’une base d’exemples repr´esentative `a partir de signaux r´eels est coˆuteuse, on peut envisager d’utiliser un mod`ele du cœur tel que Carmen (cf. Section 1.1.3) qui permet de simuler de nombreuses classes d’arythmies ainsi qu’un ensemble exhaustif des manifestations possibles d’une arythmie donn´ee.

D’autres apprentissages ont ´et´e ´egalement effectu´es sur la voie V, la voie V sans prendre en compte la forme du QRS et la voie de pression sans prendre en compte les informations sur la diastole (la totalit´e des r´esultats est donn´ee en Annexe C). Ces apprentissages sont int´eressants car les r`egles apprises, en utilisant moins d’information sur les donn´ees, sont a priori plus robustes `a la pr´esence de bruit sur les sources. Les r´esultats de la validation crois´ee sont moins bons que les r´esultats obtenus avec la voie I ou avec la voie de pression mais restent acceptables (notamment pour la voie V). Ces nouvelles r`egles pourront ˆetre utilis´ees par le syst`eme Calicot pour am´eliorer la robustesse de la reconnaissance d’arythmies en pr´esence de bruit. Pour augmenter la fiabilit´e des apprentissages sur des donn´ees ainsi r´eduites, il peut ˆetre utile de b´en´eficier de la compl´ementarit´e des sources pour apprendre des r`egles utilisant des caract´eristique de chacune des sources. Ceci fait l’objet du chapitre suivant.

Chapitre 4

Apprentissage de r`egles

caract´erisant des arythmies

cardiaques `a partir de donn´ees

multisources

Dans de nombreux domaines tels que la m´et´eorologie, la bourse ou la m´edecine, l’utilisation de plusieurs points de vue refl´etant un mˆeme ph´enom`ene est souvent n´eces-saire pour caract´eriser ce ph´enom`ene de fa¸con pr´ecise. Lorsque les donn´ees proviennent de signaux clairs et lorsque les sources de donn´ees sont redondantes, le probl`eme est de s´electionner la source la plus porteuse d’information. Lorsque la redondance entre les donn´ees est difficile `a ´etablir a priori ou lorsque les donn´ees provenant des diff´e-rentes sources sont reconnues comme compl´ementaires, l’utilisation conjointe de plu-sieurs sources peut am´eliorer la robustesse et la pr´ecision de cette caract´erisation.

Dans le but de travailler sur des donn´ees inconnues (cf projet Cepica Section 2.1.2), nous cherchons une m´ethode permettant d’une part, d’´etablir la redondance ou la com-pl´ementarit´e des sources de donn´ees et d’autre part, dans le cas o`u les donn´ees sont compl´ementaires, de fournir des r`egles permettant de tirer parti de mani`ere simultan´ee des informations provenant des diff´erentes sources.

La premi`ere section de ce chapitre nous permet de formaliser le concept d’ap-prentissage multisource par PLI puis, nous proposons une m´ethode d’apprentis-sage multisource efficace qui tire parti d’apprentisd’apprentis-sages monosources pour restreindre l’espace de recherche multisource. Cette m´ethode a ´et´e pr´esent´ee dans l’article [Fromont et al., 2004] et est d´etaill´ee dans [Fromont et al., 2005a]. La deuxi`eme sec-tion pr´esente les r´esultats obtenus avec cette m´ethode sur les apprentissages mono-sources pr´esent´es en section 3.2.2.5 et dans l’annexe C. Ces r´esultats sont pr´esent´es dans [Fromont et al., 2005b]. Dans la troisi`eme section, nous testons nos r`egles sur de nouveaux signaux cliniques bruit´es et montrons que l’apprentissage multisource cou-pl´e `a des m´ethodes de pilotage permet d’am´eliorer la pr´ecision et la sensibilit´e des d´etections des arythmies dans Calicot. Ces r´esultats sont pr´esent´es dans l’article

[Fromont et Portet, 2005].

4.1 L’apprentissage multisource en PLI

Nous posons tout d’abord le probl`eme de l’apprentissage multisource en PLI. Puis, nous exposons une m´ethode permettant de construire un biais syntaxique automatique-ment pour r´eduire l’espace de recherche de l’apprentissage multisource. Nous pr´esentons les ´etapes de construction d’un tel biais et nous donnons les propri´et´es de l’espace ainsi r´eduit.