Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

disponibles dans le logiciel Causal Explorer [ATSB03]

Dans le document Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens. (Page 159-168)

6.5.2 R´esultats

Tout d’abord nous considérons les résultats des méthodes hybrides. L’algorithme BN-PC-B

présente les plus mauvais résultats, que ce soit en termes de sensibilité ou de ppv. Son

ini-tialisation, réalisée avec la méthode de l’arbre de recouvrement maximum, produit un arbre

orienté qui ne permet pas d’approcher précisément la structure objectif. On peut supposer que

les tests d’ind´ependances conditionnelles qui s’en suivent ne parviennent pas `a identifier les arcs

manquants ou surnuméraires, probablement du fait de la faible quantité de données utilisées

pour réaliser ces tests. L’algorithme MMHC, qui est fondé sur le même principe de recherche

des indépendances conditionnelles, a également unesensibilité médiocre. Il présente par contre

une ppv relativement ´elev´ee. Manifestement, la seconde phase de cet algorithme (qui repose

sur une recherche gloutonne) permet de produire nettement moins de faux positifs,

notam-ment en assurant une meilleure orientation des arcs identifiés. Bien sûr, un meilleur réglage du

146

R´esultats num´eriques Chapitre 6

seuil de confiance utilis´e pour les tests d’ind´ependances conditionnelles devrait nous permettre

d’am´eliorer ces r´esultats. Par exemple, un seuil de confiance plus faible devrait nous permettre

d’´eliminer un certain nombre de faux positifs, mais au prix d’une perte de sensibilit´e.

Toute-fois, avec le paramètrage que nous avons proposé, ces deux algorithmes sont dépassés par les

m´ethodes d’exploration de l’espace des DAG (exception faite de MMHC pour la ppv).

Parmi les diff´erentes heuristiques de recherche, l’algorithme de mont´ee de colline donne les

plus mauvais r´esultats, que ce soit en termes de sensibilit´e ou de ppv. En effet, il s’agit d’une

heuristique d´eterministe qui converge vers le maxima local le plus proche de la solution que

nous générons aléatoirement à l’initialisation. L’algorithme MCMC, qui repose sur une

heuris-tique stochasheuris-tique donne de meilleurs résultats. Toutefois, si l’on considère la variabilité de ces

m´ethodes, nous notons que les performances de la recherche gloutonne et de l’algorithme MCMC

sont relativement proches.

En revanche, l’algorithme génétique, qui surpasse légèrement MCMC en termes de

sensibi-lité, donne des résultats très supérieurs à la recherche gloutonne et à MCMC en termes deppv.

Il est vrai que les courbes de performance de l’algorithme MCMC d´ependent de la valeur du

seuil à partir duquel on considère que la fréquence d’un arc parmi les 4 000 DAG générés est

suffisante pour l’inclure dans le graphe consensus. Ce param`etre que nous avons ici fix´e

arbitrai-rement `a 50% rend plus difficile la comparaison de MCMC avec d’autres m´ethodes. L’utilisation

de courbes ROC, visant `a trouver le seuil donnant le meilleur compromis entre sensibilit´e et

ppv est ici difficile `a mettre en œuvre. En effet, les r´esultats obtenus d’une base d’apprentissage

`

a l’autre présentent trop de variabilité pour qu’un paramètre de seuil optimal puisse émerger.

Toutefois, le large écart entre les courbes deppv de l’algorithme génétique et du MCMC semble

garantir la pr´edominance du premier sur le second.

Finalement, l’algorithme K2 est le seul qui surpasse l’AG en termes de ppv. Cela ´etait

prévisible car K2 génère naturellement moins de faux positifs que les autres méthodes. En

effet, l’information a priori est particulièrement précieuse lorsque l’on apprend à partir d’un

petit nombre d’exemples et grâce à l’ordre topologique que nous lui avons fourni, K2 réalise la

recherche dans un espace des solutions plus petit comprenant un nombre d’arcs restreint. Malgr´e

cela, les performances de K2 concernant la sensibilit´e sont disput´ees par l’AG pour des tailles

d’échantillons supérieures à 200.

Comme l’ont montré Leray et Francois [FL04], utiliser un arbre généré par la méthode de

Chow et Liu pour initialiser l’algorithme de mont´ee de colline aurait permis d’am´eliorer

si-gnificativement les solutions générées par ce dernier. Cependant, pour être juste, il faudrait

alors proposer des m´ethodes d’initialisation similaires pour les autres heuristiques. Cela

de-vient problématique pour l’algorithme évolutionnaire qui est initialisé avec une population de

solutions. Il est envisageable d’utiliser l’algorithme MCMC pour générer un échantillon de

so-lutions prometteuses à soumettre à l’algorithme évolutionnaire. La difficulté qui apparaˆıt alors

est d’ordre purement calculatoire, les temps de calcul cumul´es de ces deux algorithmes rendant

cette approche difficilement exploitable dans un cadre exp´erimental (lorsqu’un grand nombre de

tests sont requis).

Pour finir, précisons que le nombre d’évaluations de la fonction objectif (le score BIC) réalisé

par l’algorithme MCMC, l’algorithme de montée de colline et l’algorithme génétique, est de

l’ordre de quelques dizaines de milliers pour toutes ces m´ethodes. Dans la mesure o`u le calcul

de la fonction objectif accapare l’essentiel du temps de calcul d’un algorithme de recherche,

147

Troisième partie Apprentissage évolutionnaire des réseaux Bayésiens

nous pouvons donc dire que ces trois algorithmes ont des coˆuts de calcul du mˆeme ordre. Leur

comparaison paraˆıt donc fondée. Les autres algorithmes étant déterministes, leur coût de calcul

importe peu. En effet, mˆeme si K2 ou MMHC sont nettement moins coˆuteux que les algorithmes

que nous venons de citer, il n’est pas possible de recourir `a un proc´edure d’initialisation multiple.

Fig. 6.2 – Repr´esentation des populations successives d’un AE utilisant la recombinaison

rela-tionnelle par Sammon-mapping. Ces figures montrent l’´evolution de la distribution de la

popu-lation au cours d’un AE utilisant la recombinaison relationnelle (avec un taux d’´echange de

0,4) avec niching (A1-A3) et sans niching (B1-B3). Les populations de DAG ont été enregistrées

toutes les 10 000 générations jusqu’à la génération 50 000. Chaque figure compare la répartition

des DAG appartenant à une population donnée à celle des DAG issus des populations suivantes.

Les DAG de ces populations sont représentés sous la forme de points sur une carte 2D grâce à

l’utilisation duSammon-mapping.

Fig.6.3 – Repr´esentation des populations successives d’un AE utilisant la recombinaison

paren-tale par Sammon-mapping. Ces figures montrent l’´evolution de la distribution de la population

au cours d’un AE utilisant la recombinaison parentale (avec un taux d’´echange de 0,1) avec

niching (A1-A3) et sans niching (B1-B3). Les populations de DAG ont été enregistrées toutes les

10 000 générations jusqu’à la génération 50 000. Chaque figure compare la répartition des DAG

appartenant à une population donnée à celle des DAG issus des populations suivantes. Les DAG

de ces populations sont représentés sous la forme de points sur une carte 2D grâce à l’utilisation

Fig. 6.4 – Repr´esentation des populations successives d’un AE utilisant la recombinaison

rela-tionnelle par KPCA. Ces figures montrent l’´evolution de la distribution de la population au cours

d’un AE utilisant la recombinaisonrelationnelle(avec un taux d’´echange de 0,4) avec niching

(A1-A4) et sans niching (B1-B4). Les populations de DAG ont été enregistrées toutes les 2 000

générations ainsi qu’après convergence de l’algorithme. Chaque figure représente les graphes

is-sus de deux populations enregistr´ees cons´ecutivement avec un pas de 2 000. Les graphes de ces

deux populations sont représentés sous la forme de points sur une carte 2D grâce à l’utilisation

de l’Analyse en Composantes Principales Kernelis´ee.

Fig. 6.5 – Repr´esentation des populations successives d’un AE utilisant la recombinaison

pa-rentale par KPCA. Ces figures montrent l’´evolution de la distribution de la population au cours

d’un AE utilisant la recombinaison parentale (avec un taux d’´echange de 0,4) avec niching

(A1-A4) et sans niching (B1-B4). Les populations de DAG ont été enregistrées toutes les 2 000

générations ainsi qu’après convergence de l’algorithme. Chaque figure représente les graphes

is-sus de deux populations enregistr´ees cons´ecutivement avec un pas de 2 000. Les graphes de ces

deux populations sont représentés sous la forme de points sur une carte 2D grâce à l’utilisation

de l’Analyse en Composantes Principales Kernelis´ee.

Fig.6.6 – Comparaison des courbes d’apprentissage obtenues avec les recombinaisons parentale

et relationnelle. Pour chaque algorithme d’apprentissage, les r´esultats de la comparaison entre

graphe appris et graphe de référence sont exprimés en termes de valeur de prédiction positive

(A1 et A2) et desensibilit´e(B1 et B2). Les sous-figures A1 et B1 montrent les r´esultats obtenus

sans niching, alors que les sous-figures A2 et B2 montrent les r´esultats obtenus avec niching. Le

codage des couleurs est bleu pour la recombinaison parentale et rouge pour la recombinaison

par lien. Pour chaque taille d’échantillon, les tests sont répétés sur 10 bases d’apprentissages

distinctes et indépendantes. Les mêmes jeux de données sont utilisés pour tous les AE. Chaque

point sur les courbes correspond à une taille d’échantillon donnée et représente la valeur moyenne

ainsi que l’écart-type de la mesure de qualité considérée sur les 10 exécutions de l’algorithme.

Fig. 6.7 – Comparaison des courbes d’apprentissage pour six m´ethodes d’apprentissages

dis-tinctes. Pour chaque algorithme d’apprentissage, les r´esultats de la comparaison entre graphe

appris et graphe de référence sont exprimés en termes devaleur de prédiction positive (A) et de

sensibilit´e (B). Le codage des couleurs est magenta pour BN-PC, vert pour la recherche

glou-tonne, bleu pour l’algorithme MCMC, noir pour l’algorithme K2, pointill´e-noir pour MMHC

et rouge pour l’algorithme génétique. Pour chaque taille d’échantillon, les tests sont répétés

sur 10 bases d’apprentissages distinctes et indépendantes. Les mêmes jeux de données sont

uti-lis´es pour tous les algorithmes d’apprentissage. Chaque point sur les courbes correspond `a une

taille d’échantillon et représente la valeur moyenne ainsi que l’écart-type de la mesure de qualité

considérée sur les 10 exécutions de l’algorithme.

Chapitre 7

Dans le document Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens. (Page 159-168)

Télécharger maintenant "Approches évolutionnai..."

Outline

Documents relatifs