• Aucun résultat trouvé

La plus ´evidente concerne le contexte de mise en œuvre des algorithmes g´en´etiques. De la

mˆeme mani`ere qu’une initialisation judicieuse au moyen de l’algorithme de Chow et Liu permet

d’am´eliorer significativement l’algorithme de mont´e de colline, il est possible d’initialiser un

al-gorithme ´evolutionnaire avec un alal-gorithme MCMC, en utilisant un ´echantillon de solutions

pro-metteuses g´en´er´ees par ce dernier. Il est ´egalement possible d’envisager l’utilisation de m´ethodes

de sp´eciation plus ´elabor´ees. De nombreux auteurs ont sugg´er´e que les distances ph´enotypiques

entre individus sont plus int´eressantes que les distances g´enotypiques. Nous pourrions utiliser le

noyau entre graphes pr´esent´e dans le cadre de l’ACP kernelis´ee pour calculer les similarit´es entre

DAG candidats au sein mˆeme d’une m´ethode de sp´eciation. Cette m´etrique pourrait ˆetre utilis´ee

par un algorithme de classification non supervis´ee tel qu’un algorithme de classification spectrale

afin de d´eterminer les niches au sein de la population. En ce qui concerne ces deux premi`eres

id´ees de travail, la principale limitation est d’ordre calculatoire. Les algorithmes ´evolutionnaires

impliquent des temps de calcul consid´erables. Si l’on rajoute `a ces derniers, les temps d’ex´ecution

d’un algorithme MCMC ou d’un algorithme de classification appliqu´e durant tout ou partie du

processus d’´evolution , les temps de calculs ne seront pas r´ealistes en l’´etat. Pour entreprendre

de tels travaux, il est n´ecessaire de passer par une phase de d´eveloppement afin d’implanter un

algorithme ´evolutionnaire optimis´e dans un environnement plus rapide que Matlab.

Comme nous l’avons d´ej`a laiss´e entendre, une direction de travail int´eressante concerne

l’am´elioration des EDA. En particulier, nous pensons envisageable d’utiliser les outils de

l’ap-prentissage pour r´esoudre efficacement des probl`emes pos´es par les approches ´evolutionnaires. Un

exemple embl´ematique de ces questions est l’utilisation de mod`eles de m´elange pour mod´eliser

diff´erentes sous-populations de solutions occupant des niches distinctes. Un second exemple est

175

Conclusion

la possibilit´e de conserver un codage explicite des graphes candidats tout en utilisant des lois

pa-ram´etriques ou semi-papa-ram´etriques de graphes al´eatoires s’inspirant des mod`eles d’Erd¨os-R´enyi

[ER59] ou les m´elanges de ces lois [PDR08] jusqu’ici utilis´es pour l’analyse d’un seul graphe. Deux

probl`emes sont alors `a r´esoudre : l’apprentissage de ces lois qui n´ecessite une taille d’´echantillon

(nombre de graphes) importante et l’´echantillonnage de graphe al´eatoire qui est un domaine

as-sez nouveau. Si de plus, des r´esultats de convergence peuvent ˆetre obtenus, alors cette m´ethode

pourrait constituer une voie tr`es prometteuse non seulement pour l’apprentissage de r´eseaux de

r´egulation mais aussi pour l’apprentissage de tout type de r´eseaux, dans un cadre probabiliste

et statistique.

Une troisi`eme direction de travail concerne l’application de notre algorithme d’apprentissage

de structure `a d’autres types de mod`eles : en effet, notre algorithme prend en entr´ee l’ensemble

des donn´ees d’apprentissage et fait appel `a un algorithme d’apprentissage de param`etres (par

exemple ceux des tables de probabilit´es conditionnelles du r´eseau bay´esien). Rien ne s’oppose

donc `a l’application de cette m´ethode `a l’apprentissage de structure dans d’autres types de

mod`eles : syst`emes d’´equations diff´erentielles non lin´eaires ou r´eseaux bay´esiens dynamiques

non lin´eaires. Pour tous ces mod`eles, il est int´eressant de distinguer l’apprentissage des

pa-ram`etres pour une structure de graphe donn´ee, et l’apprentissage de la structure elle-mˆeme.

Des algorithmes d’estimation de param`etres dans des mod`eles dynamiques non lin´eaires ont

´et´e d´evelopp´es dans l’´equipe [QBdB07], `a IBISC, et il serait possible de coupler les deux types

d’algorithmes. Notons que, dans le cadre dynamique, la difficult´e li´ee `a la contrainte du DAG

dis-paraˆıt. Cependant, des limitations d’ordre pratique compliquent singuli`erement de tels travaux :

compte-tenu des probl`emes d’identifiabilit´e des syst`emes dynamiques, en l’absence de contraintes

ou de connaissancesa priori, il n’est possible aujourd’hui d’estimer les param`etres que pour des

syst`emes dynamiques non lin´eaires de petite taille. Pour que l’apprentissage de structure soit

int´eressant, il faudra donc que ces m´ethodes soient am´elior´ees de mani`ere `a pouvoir

envisa-ger l’apprentissage de r´eseaux de quelques dizaines de variables. Ceci fait actuellement l’objet

d’´etudes dans la communaut´e. Enfin, les m´ethodes d’estimation de param`etres des mod`eles

non-lin´eaires ´etant beaucoup plus lourdes `a mettre en œuvre que l’estimation des param`etres d’un

mod`ele lin´eaire ou d’une table de probabilit´e conditionnelle, elles aboutissent `a des temps de

calcul importants, mˆeme pour des mod`eles de taille r´eduite. La r´esolution ce type de probl`eme

devrait pourtant nous permettre d’envisager l’ultime objectif de l’apprentissage de r´eseaux de

r´egulations `a partir de cin´etiques d’expression.

Glossaire

Diff´erentiation M´ecanisme permettant `a un type de cellules — g´en´eralement appel´ees cellules

souches — de se transformer en plusieurs types cellulaires sp´ecialis´es, c’est-`a-dire capables

de remplir des fonctions distinctes et sp´ecifiques, propres `a un tissu (par exemple la peau,

le sang).

Division cellulaire Processus permettant aux cellules de se multiplier, chacune se divisant en

deux cellules identiques entre elles et `a la cellule ((m`ere)). Ce processus appel´e mitose

comporte diverses phases cruciales pour la cellule parmi lesquelles la r´eplication de l’ADN.

Cette ´etape consiste pour la cellule m`ere `a dupliquer son mat´eriel g´en´etique afin que de

transmettre `a chacune des cellules filles un exemplaire de son g´enome.

ARN ribosomique Mol´ecule entrant dans la composition des ribosomes, de vastes ´edifices