Au final, les CPDAG appris peuvent être évalués ` a l’aide des mesures suivantes

_{tp+f n}^tp

_{tp+f p}^tp

Au final, les CPDAG appris peuvent être évalués ` a l’aide des mesures suivantes

Sensibilité Egalement appelée´ précision, lasensibilité est égale à

.

Valeur de prédiction positive Généralement notéeppv,valeur de prédiction positive est égale

`

a

.

Spécificité Egalement appelée´ rappel, laspécificité est égale à

.

Toutefois dans cette étude, laspécificité apparaˆıt comme une métrique peu pertinente.

L’intro-duction d’une borne supérieure sur le degré entrant des nœuds du réseau, au même titre que

la contrainte sur la complexité présente au sein du BIC, garantissent la génération de solutions

parcimonieuses. Dans la mesure où le graphe de référence comme les graphes appris présentent

un faible nombre d’arcs, le nombre de vrais négatifs est toujours élevé en comparaison du nombre

total de négatifs (tn+f p), donc la spécificité n’est pas discriminante.

Le temps de calcul ne nous a pas semblé être un critère d’évaluation fondamental pour cette

étude. Lorsque nous réalisons une comparaison entre différentes méthodes d’apprentissage, il est

certes naturel de mettre en relief leurs temps de calcul respectifs. Dans le cas d’heuristiques

sto-chastiques ces derniers sont généralement élevés. Sous Matlab, plusieurs heures sont nécessaires

pour exécuter un algorithme génétique ou un algorithme MCMC sur des systèmes comportant

quelques dizaines de variables. Cependant, compar´e au temps n´ecessaire aux biologistes pour

générer des données, cela semble négligeable. En effet, après plusieurs mois d’expérimentation,

le fait qu’un algorithme mette quelques minutes ou quelques heures pour proposer une hypoth`ese

de réseau de régulation à partir des données obtenues importe peu. D’autant plus que le temps

nécessaire à la validation des résultats et à leur interprétation peut également nécessiter

plu-sieurs semaines. Typiquement, les influences régulatrices représentées au sein de la structure

du modèle appris doivent être confrontées à la littérature et les plus intéressantes doivent être

testées au moyen d’expériences supplémentaires. Il est donc possible de se montrer plus tolérant

face au temps de calcul cons´equent des algorithmes ´evolutionnaires que dans d’autres domaines

d’applications.

Nous avons donc choisi d’évaluer la qualité des différentes approches d’apprentissage en nous

référant à la sensibilité et la ppv des structures de modèles appris. Bien sûr, l’inconvénient

majeur d’un algorithme stochastique réside dans la variabilité des solutions qu’il propose à

l’issue de différentes exécutions. Tous les tests ont donc été répétés afin de rendre compte du

comportement moyen des algorithmes étudiés. Au final, nous souhaitons apprendre des réseaux

fidèles à l’original ayant une bonnesensibilité (capacité à découvrir des interactions) mais aussi

et surtout une bonneppv afin de limiter les faux positifs. En effet, une sensibilité élevée, si elle

s’accompagne de nombreux faux positifs, est de peu d’intérêt car les interactions proposées par

le mod`ele ´etant fausses pour la plupart, il est difficile de les tester et de les confirmer au moyen

d’expériences complémentaires. S’il est indéniable que les biologistes sont prêts à accepter une

faible proportion d’erreurs afin de faire des d´ecouvertes, il est fondamentale que ces derni`eres

ne soient pas noy´ees parmi les faux positifs. Comme nous le verrons par la suite les m´ethodes

d’apprentissage tendent à founir un taux élevé de faux positifs.

6.3 Comparaison de diff´erentes approches ´evolutionnaires

Dans un premier temps, nous étudions les performances de l’algorithme évolutionnaire décrit

précédemment selon la stratégie de recombinaison et la méthode de préservation de la diversité

136

R´esultats num´eriques Chapitre 6

utilis´ees. Tout d’abord, nous avons compar´e l’effet de la mutation et celui du deterministic

crowding pour différentes stratégies de reproduction. Plus précisément, nous avons étudié le

comportement des trois stratégies de reproduction présentées au chapitre précédent, en faisant

varier le taux d’´echange pour les recombinaisons relationnelles et parentales. Ce taux d’´echange

permet de paramétrer le nombre de gènes virtuels échangés entre deux chromosomes par la

recombinaison uniforme. Puisque nous n’étions pas intéressé par un réglage précis de ce

pa-ramètre, nous avons simplement considéré un taux d’échange bas (0,1) et élevé (0,4). Nous

avons également considéré une faible probabilité de mutation de 0,002 impliquant de l’ordre de

2 arcs modifiés par DAG. Nous avons travaillé sur des populations de taille relativement limitée

(en comparaison de la taille de l’espace des solutions) de 200 DAG. Enfin, l’algorithme s’arrˆete

lorsque le meilleur score de la population ne montre aucune am´elioration durant au moins 1 000

itérations. Nous avons en plus imposé un nombre maximum de 50 000 itérations. Nous rappelons

que cet algorithme ne produit que deux solutions candidates par it´eration, c’est pourquoi ces

derni`eres sont si nombreuses.

Chaque test a été effectué 10 fois, en s’appuyant sur des jeux de données distincts et indépendants

pour juger de la robustesse des diff´erentes approches ´evolutionnaires. Pour tenir compte de la

disponibilité des données biologiques (qui sont des instantanés de l’activité transcriptionnelle des

cellules) nous avons considéré des échantillons de faible taille (300 mesures). Nous considérerons

cependant des tailles d’´echantillon variables dans un second temps.

Lasensibilité et lappv que nous avons obtenues pour chaque test sont représentées dans les

tables 6.1 et 6.2, respectivement. Ces résultats correspondent à la moyenne et à l’écart-type de

chacun de ces indices de qualité sur les 10 exécutions réalisées pour chaque test. Pour favoriser

la lisibilité, ces résultats ont été exprimés en termes de pourcentage et arrondis à l’entier le plus

proche.

Les lignes correspondent aux strat´egies de recombinaison : recombinaison relationnelle (lignes

1 et 2), recombinaison parentale (lignes 3 et 4), recombinaison classique (lignes 5). Pour les

recombinaisons relationnelles et parentales, deux lignes sont disponibles puisque le croisement

uniforme sur lequel elles reposent est testé pour un taux d’échange élevé (lignes 1 et 3) et faible

(lignes 2 et 4). Les colonnes correspondent aux diverses techniques de pr´eservation de la

diver-sité utilisées dans chaque test. Nous comparons les cas où aucune de ces techniques n’est utilisée

(colonne 1), o`u seulement l’une des deux est utilis´ee (colonne 2 pour la mutation et colonne 3

pour DC) et où les deux sont utilisées simultanément (colonne 4).

Sensibilité Egalement appelée^´ précision, lasensibilité est égale à

Spécificité Egalement appelée^´ rappel, laspécificité est égale à