La plus ´evidente concerne le contexte de mise en œuvre des algorithmes g´en´etiques. De la
mˆeme mani`ere qu’une initialisation judicieuse au moyen de l’algorithme de Chow et Liu permet
d’am´eliorer significativement l’algorithme de mont´e de colline, il est possible d’initialiser un
al-gorithme ´evolutionnaire avec un alal-gorithme MCMC, en utilisant un ´echantillon de solutions
pro-metteuses g´en´er´ees par ce dernier. Il est ´egalement possible d’envisager l’utilisation de m´ethodes
de sp´eciation plus ´elabor´ees. De nombreux auteurs ont sugg´er´e que les distances ph´enotypiques
entre individus sont plus int´eressantes que les distances g´enotypiques. Nous pourrions utiliser le
noyau entre graphes pr´esent´e dans le cadre de l’ACP kernelis´ee pour calculer les similarit´es entre
DAG candidats au sein mˆeme d’une m´ethode de sp´eciation. Cette m´etrique pourrait ˆetre utilis´ee
par un algorithme de classification non supervis´ee tel qu’un algorithme de classification spectrale
afin de d´eterminer les niches au sein de la population. En ce qui concerne ces deux premi`eres
id´ees de travail, la principale limitation est d’ordre calculatoire. Les algorithmes ´evolutionnaires
impliquent des temps de calcul consid´erables. Si l’on rajoute `a ces derniers, les temps d’ex´ecution
d’un algorithme MCMC ou d’un algorithme de classification appliqu´e durant tout ou partie du
processus d’´evolution , les temps de calculs ne seront pas r´ealistes en l’´etat. Pour entreprendre
de tels travaux, il est n´ecessaire de passer par une phase de d´eveloppement afin d’implanter un
algorithme ´evolutionnaire optimis´e dans un environnement plus rapide que Matlab.
Comme nous l’avons d´ej`a laiss´e entendre, une direction de travail int´eressante concerne
l’am´elioration des EDA. En particulier, nous pensons envisageable d’utiliser les outils de
l’ap-prentissage pour r´esoudre efficacement des probl`emes pos´es par les approches ´evolutionnaires. Un
exemple embl´ematique de ces questions est l’utilisation de mod`eles de m´elange pour mod´eliser
diff´erentes sous-populations de solutions occupant des niches distinctes. Un second exemple est
175
Conclusion
la possibilit´e de conserver un codage explicite des graphes candidats tout en utilisant des lois
pa-ram´etriques ou semi-papa-ram´etriques de graphes al´eatoires s’inspirant des mod`eles d’Erd¨os-R´enyi
[ER59] ou les m´elanges de ces lois [PDR08] jusqu’ici utilis´es pour l’analyse d’un seul graphe. Deux
probl`emes sont alors `a r´esoudre : l’apprentissage de ces lois qui n´ecessite une taille d’´echantillon
(nombre de graphes) importante et l’´echantillonnage de graphe al´eatoire qui est un domaine
as-sez nouveau. Si de plus, des r´esultats de convergence peuvent ˆetre obtenus, alors cette m´ethode
pourrait constituer une voie tr`es prometteuse non seulement pour l’apprentissage de r´eseaux de
r´egulation mais aussi pour l’apprentissage de tout type de r´eseaux, dans un cadre probabiliste
et statistique.
Une troisi`eme direction de travail concerne l’application de notre algorithme d’apprentissage
de structure `a d’autres types de mod`eles : en effet, notre algorithme prend en entr´ee l’ensemble
des donn´ees d’apprentissage et fait appel `a un algorithme d’apprentissage de param`etres (par
exemple ceux des tables de probabilit´es conditionnelles du r´eseau bay´esien). Rien ne s’oppose
donc `a l’application de cette m´ethode `a l’apprentissage de structure dans d’autres types de
mod`eles : syst`emes d’´equations diff´erentielles non lin´eaires ou r´eseaux bay´esiens dynamiques
non lin´eaires. Pour tous ces mod`eles, il est int´eressant de distinguer l’apprentissage des
pa-ram`etres pour une structure de graphe donn´ee, et l’apprentissage de la structure elle-mˆeme.
Des algorithmes d’estimation de param`etres dans des mod`eles dynamiques non lin´eaires ont
´et´e d´evelopp´es dans l’´equipe [QBdB07], `a IBISC, et il serait possible de coupler les deux types
d’algorithmes. Notons que, dans le cadre dynamique, la difficult´e li´ee `a la contrainte du DAG
dis-paraˆıt. Cependant, des limitations d’ordre pratique compliquent singuli`erement de tels travaux :
compte-tenu des probl`emes d’identifiabilit´e des syst`emes dynamiques, en l’absence de contraintes
ou de connaissancesa priori, il n’est possible aujourd’hui d’estimer les param`etres que pour des
syst`emes dynamiques non lin´eaires de petite taille. Pour que l’apprentissage de structure soit
int´eressant, il faudra donc que ces m´ethodes soient am´elior´ees de mani`ere `a pouvoir
envisa-ger l’apprentissage de r´eseaux de quelques dizaines de variables. Ceci fait actuellement l’objet
d’´etudes dans la communaut´e. Enfin, les m´ethodes d’estimation de param`etres des mod`eles
non-lin´eaires ´etant beaucoup plus lourdes `a mettre en œuvre que l’estimation des param`etres d’un
mod`ele lin´eaire ou d’une table de probabilit´e conditionnelle, elles aboutissent `a des temps de
calcul importants, mˆeme pour des mod`eles de taille r´eduite. La r´esolution ce type de probl`eme
devrait pourtant nous permettre d’envisager l’ultime objectif de l’apprentissage de r´eseaux de
r´egulations `a partir de cin´etiques d’expression.
Glossaire
Diff´erentiation M´ecanisme permettant `a un type de cellules — g´en´eralement appel´ees cellules
souches — de se transformer en plusieurs types cellulaires sp´ecialis´es, c’est-`a-dire capables
de remplir des fonctions distinctes et sp´ecifiques, propres `a un tissu (par exemple la peau,
le sang).
Division cellulaire Processus permettant aux cellules de se multiplier, chacune se divisant en
deux cellules identiques entre elles et `a la cellule ((m`ere)). Ce processus appel´e mitose
comporte diverses phases cruciales pour la cellule parmi lesquelles la r´eplication de l’ADN.
Cette ´etape consiste pour la cellule m`ere `a dupliquer son mat´eriel g´en´etique afin que de
transmettre `a chacune des cellules filles un exemplaire de son g´enome.
ARN ribosomique Mol´ecule entrant dans la composition des ribosomes, de vastes ´edifices
Dans le document
Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens.
(Page 188-192)