• Aucun résultat trouvé

i=1 P  Vi|PaG(Vi).

Pour sp´ecifier le RB, il faut ensuite sp´ecifier P Vi|PaG(Vi) ; cela peut se faire de deux mani`eres, soit en utilisant un mod`ele multinomial (ce qui suppose, ´evidemment, que l’on ait d’abord discr´etis´e les variables) soit en utilisant un mod`ele gaussien. Dans le premier cas, il suffit alors de calculer la probabilit´e de chaque ´etat selon l’´etat des parents (Friedman et al. 2000). L’algorithme BANJO (Yu et al. 2004), souvent utilis´e, est bas´e sur cette m´ethode ´egalement.

L’hypoth`ese de Markov impose au graphe G d’ˆetre acyclique. C’est-`a-dire qu’on ne peut pas avoir, par exemple : V1 influence V2, V2 influence V3, et V3 influence V1. C’est une des raisons pour lesquelles les RBD ont ´et´e d´evelopp´es (Murphy et Mian 1999). En effet, l’ajout de la dimension temporelle permet de lever l’hypoth`ese d’acyclicit´e.

Les mod`eles les plus utilis´es dans ce cadre sont les mod`eles espaces ´etat, dans lesquels on suppose qu’un processus non-observ´e intervient dans le mod`ele (Beal et al. 2005, Rau et al. 2010) ou dans une version non-lin´eaire (Quach et al. 2007).

Enfin, le temps de calcul des mod`eles bay´esiens ´etant algorithmiquement long, l’incorporation d’information a priori permet d’obtenir des algorithmes plus rapides (Young et al. 2014).

1.6 Quelle utilit´e pour les r´eseaux biologiques

Nous venons de voir comment inf´erer un r´eseau de r´egulation g´enique. Ce r´eseau de r´egulation g´enique doit ˆetre vu comme une mod´elisation d’un syst`eme biologique complexe, en l’occurrence le programme de r´egulation g´enique. Nous avons vu dans le d´ebut de ce chapitre que la compr´ehension d’un syst`eme complexe passe par quatre ´etapes successives : description de la topologie, de la structure, puis d´etermination de la dynamique, puis utili-sation de la connaissance de la structure et de la dynamique pour contrˆoler

1.6. QUELLE UTILIT ´E POUR LES R ´ESEAUX BIOLOGIQUES 29

le syst`eme, et enfin la modification orient´ee du syst`eme.

Le r´eseau de g`enes doit ˆetre consid´er´e comme ´etant la structure du sys-t`eme complexe ´etudi´e. Cependant, les m´ethodes d’inf´erence `a ´equation, du fait de leur nature, permettent d’obtenir dans le mˆeme temps la dynamique du syst`eme. C’est pour cette raison que ces m´ethodes seront privil´egi´ees dans cette th`ese. En particulier, nous reviendrons dans le chapitre suivant sur un mod`ele de r´egression parcimonieuse classique : la r´egression Lasso.

Inf´erer un r´eseau de g`enes permet donc de r´ev´eler la structure (et la dy-namique selon la m´ethode choisie) du programme g´enique ´etudi´e. Ce qui est int´eressant, c’est que les structures des r´eseaux de g`enes, et plus g´en´erale-ment des r´eseaux m´etaboliques, montrent une topologie semblable. En effet, comme nous l’avons d´ej`a vu, ces r´eseaux sont invariants d’´echelle (Barab´asi et Albert 1999). Cette propri´et´e a ´et´e v´erifi´ee dans les r´eseaux de prot´eines `

a prot´eines, dans les r´eseaux de g`enes, chez l’homme et chez la levure (Vidal et al. 2011, Barab´asi et Oltvai 2004, Seebacher et Gavin 2011). Pourtant, il faut distinguer les distributions des degr´es entrants et sortants. En effet, la distribution des degr´es sortants semblent bien suivre une distribution de type puissance, conduisant `a avoir beaucoup de g`enes faiblement r´egula-teurs et quelques g`enes fortement r´egular´egula-teurs. En revanche, la distribution des liens entrants, c’est-`a-dire le nombre de g`enes r´egulant un g`ene donn´e semble ˆetre de type exponentielle, indiquant que les g`enes r´egul´es par un grand nombre de r´egulateurs sont exponentiellement rares (Deplancke et al. 2006). Ceci conforte l’id´ee de parcimonie que nous avons d´ej`a introduite. La raison pour laquelle l’organisation invariante d’´echelle est retrouv´ee dans la plupart des r´eseaux de g`enes semble ˆetre due au principe d’attachement pr´e-f´erentiel (Barab´asi et Albert 1999). Selon ce principe, le nombre de nœuds augmente petit `a petit, et chaque nouveau nœud s’int`egre dans le r´eseau d´ej`a form´e. Sa probabilit´e de liaison avec un g`ene d´ej`a int´egr´e est d’autant plus forte que ce g`ene est d´ej`a fortement connect´e. Parfois, ce ph´enom`ene est appel´e “les riches deviennent encore plus riches”. Il a ´et´e montr´e que, dans le cadre des r´eseaux biologiques, cette hypoth`ese est fortement pro-bable (Pastor-Satorras et al. 2003).

Maintenant que nous avons montr´e qu’il existait une universalit´e des structures des r´eseaux biologiques, nous allons nous int´eresser `a l’interpr´e-tation biologique des ´el´ements de ces structures. Les r´eseaux biologiques sont donc de type invariant d’´echelle. Par cons´equent, ils disposent de hubs, c’est-`a-dire de nœuds fortement connect´es. Une premi`ere question apparaˆıt donc : que sait-on de ces nœuds ? quelle est leur importance biologique ?

Mˆeme si ce n’est pas exactement le sujet de cette th`ese, regardons ce qui a ´et´e ´ecrit sur les hubs dans les r´eseaux prot´eines `a prot´eines (dont on attend qu’ils aient un lien important avec les r´eseaux de g`enes) :

— ils correspondent `a des g`enes essentiels (Jeong et al. 2001),

— ils sont plus vieux et ont ´evolu´e plus lentement (Fraser et al. 2002), — ils ont tendance `a ˆetre plus abondants (Ivanic et al. 2009),

que les autres prot´eines moins connect´ees (Yu et al. 2008).

De mani`ere plus g´en´erale, le nombre de connections semble ˆetre un in-dicateur pertinent de l’importance d’une prot´eine. Par exemple, chez les patients ayant un cancer, les prot´eines li´ees au cancer sont deux fois plus connect´ees que les autres (Jonsson et Bates 2006).

Cette structure invariante d’´echelle a une autre cons´equence : les d´el´e-tions ou ruptures de fonctionnement d’un nœud sont peu importantes tant qu’elles ne touchent pas un hub. En revanche, d`es lors qu’un hub est touch´e, un partitionnement du r´eseau est observ´e (Albert et Barab´asi 2002). La va-lidit´e de cette conclusion pour les r´eseaux biologiques peut ˆetre v´erifi´ee en associant la s´ev´erit´e d’une inhibition de g`enes avec le nombre d’interactions de ce g`ene. Plusieurs ´etudes montrent effectivement une forte corr´elation entre cette association. Par exemple, 73% des g`enes de S. cerevisiae ne sont pas importants, dans le sens o`u leur inhibition n’a pas d’effet ph´enotypique important (Giaever et al. 2002). Les r´eseaux sont donc robustes face `a des ruptures de fonctionnement al´eatoires. Par ailleurs, la probabilit´e qu’un g`ene soit essentiel (c’est-`a-dire que son absence entraˆıne la mort de la cellule) est corr´el´ee au nombre d’interactions de sa prot´eine (Jeong et al. 2001, Said et al. 2004). Cela indique que la cellule est en revanche tr`es vuln´erable `a une perturbation de ses g`enes hubs. La prot´eine p53, par exemple, est une prot´eine anti-tumeurs. Elle a ´et´e trouv´ee comme hub dans plusieurs ´etudes. Dans la moiti´e des tumeurs cette prot´eine est inactiv´ee par mutation, ce qui confirme le lien entre hub et vuln´erabilit´e cellulaire pour les hubs (Vogelstein et al. 2000).

Nous souhaitons encore rendre le lecteur attentif `a une diff´erence impor-tante entre hubs : il y a d’une part les hubs constants (party hubs, en anglais) et les hubs de circonstances. Les premiers sont des hubs quels que soient les circonstances ou les moments d’´etude tandis que les seconds ne revˆetent leur caract`ere de hubs que dans des circonstances particuli`eres (Seebacher et Gavin 2011, Han et al. 2004). Les hubs constants semblent caract´eriser des modules fonctionnels tandis que les hubs de circonstances serviraient plutˆot `a connecter les modules fonctionnels les uns aux autres (Han et al. 2004).

Si nous regardons plus en d´etail la structure des r´eseaux biologiques, plusieurs remarques peuvent encore ˆetre formul´ees :

— les g`enes co-exprim´es partagent souvent une mˆeme fonction,

— certains motifs, comme les boucles de r´egulation et les boucles de r´egulation inverses sont significativement plus pr´esents (Balazsi et al. 2005, Shen-Orr et al. 2002) : ces motifs permettent d’apporter une r´eponse biologique rapide `a une situation donn´ee,

— la probabilit´e qu’il existe deux chemins pour aller d’un g`ene `a un autre dans le r´eseau est importante (Papin et Palsson 2004) : l’int´e-rˆet ici est ´evident en cas de rupture d’un des chemins.