• Aucun résultat trouvé

Construction automatique du biais d’apprentissage multisource . 102

3.2 Acquisition de r`egles monosources caract´erisant des arythmies cardiaques :

4.1.3 Construction automatique du biais d’apprentissage multisource . 102

Nous proposons une m´ethode d’apprentissage multisource appel´ee apprentissage multisource biais´ee qui consiste `a apprendre ind´ependamment `a partir de chaque source, puis `a s’appuyer sur les r`egles apprises pour obtenir des r`egles multisources en effectuant une nouvelle ´etape d’apprentissage sur les donn´ees agr´eg´ees. Dans le cas des arythmies cardiaques, la construction s’apparente `a une synchronisation des r`egles monosources. La synchronisation des ´ev`enements sur les diff´erentes sources est d´ecrite par le pr´edicat suci(X,Y)(pour succession imm´ediate) qui signifie que l’´ev`enement X est le successeur imm´ediat de l’´ev`enement Y. L’algorithme 6 d´ecrit la m´ethode pour un apprentissage `a partir de deux sources, elle peut ˆetre facilement ´etendue `a l’apprentissage `a partir de n sources moyennant une complexit´e accrue.

L’apprentissage multisource en PLI 103

Algorithme 6 1. Apprendre avec le biais B1 sur le probl`eme de PLI < L1, E1, T1, C >. Soit H1 l’ensemble des r`egles apprises pour une classe c donn´ee.

2. Apprendre avec le biais B2 sur le probl`eme de PLI < L2, E2, T2, C >. Soit H2 l’ensemble des r`egles apprises pour la classe c.

3. Agr´eger les ensembles d’exemples E1 et E2 pour produire E3.

4. Construire `a partir de toutes paires (h1j, h2k) ∈ H1 × H2 et d’un ensemble de contraintes fournies par l’utilisateur, un ensemble de bottom clauses BT = {bt1, bt2, . . . , btn} tel que chaque clause bti construite `a partir de h1j et h2k est plus sp´ecifique que h1j et h2k. En particulier bti contient tous les pr´edicats ap-paraissant dans h1j et h2k ainsi que de nouveaux pr´edicats relationnels ( suci) permettant de synchroniser h1j et h2k tout en respectant l’ordonnancement relatif des ´ev`enements sur chacune des sources.

5. Construire B `a partir de BT . Chaque clause de BT correspond `a une partie de l’espace de recherche (que nous appellerons “bloc”). La syntaxe des litt´eraux dans B doit ˆetre telle que les hypoth`eses envisag´ees dans l’espace de recherche soient identiques ou plus g´en´erales que les bottom clauses bti et ces hypoth`eses doivent ˆetre ordonnanc´ees dans l’espace de recherche de mani`ere `a garantir la s´equence des ´ev`enements sp´ecifiques `a chaque bloc.

6. Apprendre un ensemble de r`egles multisources pour la classe c avec le biais B sur le probl`eme de PLI < L, E3, T3, C > o`u

– L est le langage multisource d´ecrit dans la d´efinition 4.1, – T3 est un ensemble de r`egles exprim´ees dans le langage L.

4.1.3.1 Construction des bottom clauses

Pour construire le biais multisource, nous cherchons, dans un premier temps, `a produire un ensemble de clauses particuli`eres que nous appellerons bottom clauses en r´ef´erence `a [Muggleton, 1995] car ce sont les clauses les plus sp´ecifiques de l’espace de recherche. La construction s’effectue au point 4 de l’algorithme 6. Pour chaque paire (h1j,h2k), l’algorithme peut cr´eer autant de bottom clauses qu’il y a d’ordonnancements maintenant l’ordre relatif des ´ev`enements sur chacune des sources (cf. l’exemple Figure 4.1 pour une paire (h1,h2)). Le nombre de bottom clauses pouvant ainsi ˆetre cr´e´ees est Cn

n+p o`u n est le nombre de pr´edicats ´ev`enementiels apparaissant dans la r`egle h1j et p le nombre de pr´edicats ´ev`enementiels apparaissant dans la r`egle h2k. Le cardinal de BT est ´egal au nombre total de bottom clauses cr´e´ees pour chaque paire possible (h1j,h2k). Ce nombre peut paraˆıtre tr`es ´elev´e dans le cas g´en´eral o`u les ensembles de r`egles H1 et H2 contiennent plus d’une clause et o`u le nombre d’´ev`enements caract´eristiques d’une classe donn´ee pour chaque source est important. En pratique, un nombre significatif de ces bottom clauses ne sont pas g´en´er´ees car certaines s´equences n’ont aucun sens du point de vue de l’application consid´er´ee. Sur l’exemple de la figure 4.1, un expert du domaine interdirait toutes les s´equences comprenant un ´ev`enement de la source 1 situ´e entre les ´ev`enements diastole(A,B) et systole(C,D) de la source 2 car elles

Soit h1 =class(x) :− %s´equence P0-R0 p(P0,normal), qrs(R0,normal), pr1(P0,R0,normal), suc(R0,P0).

la r`egle induite pour la classe x sur les donn´ees de la source 1. Soit h2 = class(x) :− %s´equence D0-S0

diastole(D0,normal), systole(S0,normal), suc(S0,D0).

la r`egle apprise pour la mˆeme classe x sur les donn´ees de la source 2. Les bottom clauses g´en´er´ees pour la paire (h1,h2) sont :

bt1 = class(x) :− %s´equence P0-D0-R0-S0 p(P0,normal), diastole(D0,normal), suci(D0,P0), qrs(R0,normal), pr1(P0,R0,normal), suci(R0,D0), suc(R0,P0), systole(S0,normal), suci(S0,R0), suc(S0,D0). bt2 = class(x) :− %s´equence D0-P0-S0-R0 diastole(D0,normal), p(P0,normal), suci(P0,D0), systole(S0,normal), suci(S0,P0), suc(S0,D0), qrs(R0,normal), pr1(P0,R0,normal), suci(R0,S0), suc(R0,P0). . . ., btn−1= class(x) :− %s´equence D0-S0-P0-R0 diastole(D0,normal), systole(S0,normal), suc(S0,D0), p(P0,normal), suci(P0,S0), qrs(R0,normal), pr1(P0,R0,normal), suc(R0,P0). btn = class(x) :− %s´equence P0-R0-D0-S0 p(P0,normal), qrs(R0,normal), pr1(P0,R0,normal), suc(R0,P0), diastole(D0,normal), suci(D0,R0), systole(S0,normal), suc(S0,D0).

Fig. 4.1 – Exemple de g´en´eration d’un ensemble de bottom clauses `a partir d’une paire de clauses (h1,h2) d´ecrivant une mˆeme classe x.

sont physiologiquement impossibles. Cette contrainte ´elimine, en particulier, les bottom clauses bt1 et bt2 dans l’exemple de la figure 4.1.

Les pr´edicats suci ne sont introduits que s’il y a r´eellement synchronisation entre les diff´erentes sources. Par exemple pour la clause btn, le pr´edicat suc(R0,P0) garde la s´emantique qu’il avait en monosource, c’est-`a-dire que l’onde R0 suit directement l’onde

L’apprentissage multisource en PLI 105

P0sur la voie I mais, on autorise la pr´esence de n’importe quelle onde provenant d’une autre source de donn´ees entre P0 et R0. La s´emantique du pr´edicat suci(D0,R0) est diff´erente puisqu’il ne doit y avoir aucun ´ev`enement entre D0 et R0.

bt1 bt3 bt4 bt5 bt6 bt7 bt2 H1 H2 L1 L2 false <− true L

Fig. 4.2 – Construction de l’espace de recherche pour l’apprentissage multisource biais´e

4.1.3.2 Espace de recherche multisource biais´e `

A l’instar des bottom clauses utilis´ees dans les syst`emes de PLI tels que Progol ou Aleph (cf. Section 3.1.7), chaque bottom clause construite pr´ec´edemment nous sert `a limiter un espace de recherche. L’intersection des espaces de recherche d´efinis par l’ensemble des bottom clauses est suppos´ee non vide. Pour chaque espace de recherche d´efini, on recherche des hypoth`eses plus g´en´erales que la bottom clause qui borne cet espace.

De la mˆeme mani`ere que pour Aleph, chaque bottom clause va servir de “r´eservoir” de litt´eraux lors de l’op´eration d’ajout de litt´eral de l’algorithme de recherche d’ICL. Pour rendre chaque espace de recherche fini, on ajoute des restrictions aux hypoth`eses recherch´ees :

1. pour un espace de recherche donn´e, le nombre de litt´eraux dans les hypoth`eses est limit´e par le nombre de litt´eraux dans la bottom clause qui borne cet espace; 2. un pr´edicat relationnel ne peut ˆetre ajout´e `a une hypoth`ese que si les ´ev`enements qu’il met en relation ont d´ej`a ´et´e ajout´es `a l’hypoth`ese par l’interm´ediaire de pr´edicats ´ev`enementiels;

3. chaque pr´edicat ´ev`enementiel doit ˆetre en relation (directe ou indirecte) avec tous les autres pr´edicats ´ev`enementiels (pour ´eviter les clause non connexes) via un ou plusieurs pr´edicats relationnels globaux.

Chaque nœud de l’espace de recherche correspond ainsi `a une clause s´emantiquement acceptable : d’une part, les ordonnancements physiquement impossibles ne sont pas

g´en´er´es et, d’autre part, les litt´eraux utilis´es sont s´emantiquement acceptables du point de vue de la classe consid´er´ee puisqu’ils apparaissent dans une r`egle apprise lors de l’apprentissage monosource.

Dans un second temps, nous construisons un biais DLAB de mani`ere `a ce que l’espace de recherche multisource engendr´e par ce biais corresponde exactement `a l’en-semble des espaces de recherche d´efinis par les bottom clauses et les contraintes d´efinies pr´ec´edemment.

La figure 4.2 illustre les diff´erents espaces de recherche en jeu lors d’un apprentissage multisource biais´e. L repr´esente l’espace de recherche multisource na¨ıf. L1 et L2 les espaces monosources. L’espace d´elimit´e par les pointill´es repr´esente l’union des espace de recherche d´efinis par chacune des bottom clauses. L’espace de recherche associ´e `a une bottom clause correspond `a la ligne blanche. Il contient l’ensemble des hypoth`eses plus g´en´erales que la bottom clause satisfaisant les contraintes d´efinies pr´ec´edemment.

4.1.3.3 Construction du biais DLAB

1-1:[

%on choisit un et un seul des bloc suivants : ...,

1-1:[len-len:[...]], %(n-1)ieme bloc : bt(n-1) 1-1:[len-len:[ % btn p(P0,normal),qrs(R0,normal),suc(R0,P0), 0-1:[pr1(P0,R0,normal)] ], 0-1:[len-len:[ len-len:[ diastole(D0,normal),suci(D0,R0) ], 0-1:[len-len:[ len-len:[ systole(S0,normal),suc(S0,D0) ] ]]]]] ]

Fig. 4.3 – Exemple de biais cr´e´e `a partir d’un ensemble de bottom clauses

Le biais est g´en´er´e automatiquement `a partir de l’ensemble des bottom clauses cr´e´ees et de l’ensemble des contraintes fournies par l’utilisateur. Chaque espace de recherche born´e par l’une des bottom clause est d´efini par un bloc du biais DLAB. La figure 4.3 explicite la partie d’un biais DLAB correspondant `a la bottom clause btn de la figure 4.1. Chaque bloc permet d’induire une hypoth`ese identique ou plus g´en´erale que la bottom clause consid´er´ee. Tous les espaces de recherche doivent ˆetre parcourus pour trouver la ou les hypoth`eses multisources les plus pr´ecises dans l’union des espaces de

L’apprentissage multisource en PLI 107

recherche. Tous les blocs doivent donc ˆetre ´evalu´es mais seul un bloc doit ˆetre choisi pour apprendre une hypoth`ese multisource. Cette contrainte est exprim´ee par l’expression 1-1:[...]qui parenth`ese le biais DLAB expos´e Figure 4.3.

A l’int´erieur de chaque bloc, le biais est d´efini de mani`ere `a satisfaire toutes les contraintes sur les hypoth`eses pr´esent´ees dans la section pr´ec´edente :

– les seuls pr´edicats utilis´es sont ceux apparaissant dans la bottom clause (contrainte 1). Les pr´edicats relationnels locaux sont tous optionnels.

– tous les pr´edicats relationnels sont d´efinis apr`es que les pr´edicats ´ev`enementiels correspondants ont ´et´e d´efinis (contrainte 2).

– Pour ´eviter les litt´eraux non connexes, un pr´edicat ´ev`enementiel est toujours d´e-fini conjointement `a un pr´edicat relationnel global (except´e pour les deux premiers pr´edicats ´ev`enementiels qui doivent ˆetre d´efinis en mˆeme temps pour satisfaire la contrainte 2 avec le premier pr´edicat relationnel global). Les pr´edicats ´ev`enemen-tiels sont imbriqu´es de mani`ere `a satisfaire la contrainte 3.