• Aucun résultat trouvé

Article pp.229-236 du Vol.26 n°1-2 (2007)

N/A
N/A
Protected

Academic year: 2022

Partager "Article pp.229-236 du Vol.26 n°1-2 (2007)"

Copied!
8
0
0

Texte intégral

(1)

1. Introduction

Cette dernière décennie a vu l’avènement de techniques expérimentales d’analyse à grande échelle qui ont généré un formidable volume de données (génomiques, trans- criptomiques, protéomiques). Ces données conduisent à l’identification de réseaux d’interactions qui sont au cœur du contrôle des processus cellulaires. La complexité de ces réseaux provient de leur taille, ainsi que de la nature hétérogène des interactions et des composants moléculaires. Pour étudier la dynamique induite par ces réseaux, nous devons développer des outils adaptés, de modélisation, d’analyse et de simu- lation. De tels outils permettent de valider les interactions, de caractériser le rôle de motifs de régulation (typiquement, les circuits de régulation), et de générer des prédic- tions qui doivent être validées par l’expérimentation. Les formalismes classiquement utilisés vont des graphes aux systèmes d’équations différentielles, en passant par des représentations logiques (voir (de Jong, 2002) pour une revue des modèles de réseaux de régulation génique). Les réseaux de Petri (RdP), introduits par Carl Adam Petri dans les années 1960, définissent un langage graphique formel pour la modélisation de systèmes discrets, concurrents et distribués (voir (Murata, 1989) pour une excel- lente introduction). Ce formalisme bénéficie des travaux d’une communauté active depuis de nombreuses années et de tout un ensemble d’outils mathématiques et infor- matiques (consulter Petri Nets World1). Dans (Reddy et al., 1996), les auteurs ont, les premiers, démontré l’applicabilité des RdP pour la modélisation de réseaux biochi- miques. Depuis, et surtout au cours de ces cinq dernières années, on a vu se multiplier les publications présentant des modèles basés sur les RdP ou leurs extensions (Hardy et al., 2004).

L’objectif de cette chronique est de faire le point sur l’utilisation des RdP pour la modélisation et l’analyse de réseaux biologiques. Après une brève introduction au formalisme, l’applicabilité des RdP standards pour la modélisation qualitative des ré- seaux moléculaires est exposée. Si la modélisation qualitative permet de mieux com- prendre les comportements dynamiques induits par ces réseaux, une modélisation plus détaillée est parfois souhaitable. Cette dernière est rendue possible par l’utilisation de différente extensions du formalisme original. Enfin, j’évoquerai, dans la conclusion, quelques perspectives pour une approche descendante (vers un raffinement des infor- mations) et modulaire de la modélisation des réseaux moléculaires en RdP.

1. http ://www.informatik.uni-hamburg.de/TGI/PetriNets/

(2)

Figure 1. Exemple de réseau de Petri. (a) Les cercles symbolisent les places qui sont marquées par un nombre entier de jetons, les rectangles symbolisent les transitions.

Ici, le marquage initial attribue une marque aux placesp1etp2. Le poids d’un arc est omis s’il vaut1. (b) Le vecteur du marquage initialM0et les matricesP reetP ost correspondants. (c) Le graphe de marquagesR(M0)donne l’évolution à partir de M0; les nœuds sont les états (marquages) et les arcs, les transitions entre états (qui correspondent au tir d’une transition du RdP)

2. Réseaux de Petri, définitions de base

Les réseaux de Petri constituent un formalisme graphique adapté à la représenta- tion et l’analyse de systèmes concurrents. Ce sont des graphes bipartites avec deux types de nœuds : les places et les transitions (voir figure 1). Les places représentent les ressources du système dont l’état est symbolisé par un nombre entier de marques et les transitions modélisent les événements modifiant l’état du système, c’est-à-dire le marquage des places. L’évolution du système correspond donc à la modification du marquage du RdP (apparition et/ou disparition de marques). Le marquage des places d’entrée d’une transition conditionne son déclenchement (pré-condition pour l’occur- rence de l’événement correspondant). Ce déclenchement provoque la consommation de marques des places d’entrée et la production de nouvelles marques dans les places de sortie (post-condition). Un réseau de Petri est donc défini par :

– un ensemble fini de placesP, – un ensemble fini de transitionsT,

– des arcs pondérés entre places et transitions (matriceP re(|P| × |T|)), – des arcs pondérés entre transitions et places (matriceP ost(|T| × |P|), – un marquage initial (vecteurM0).

L’évolution est donnée par la règle de déclenchement des transitions. Une tran- sition t ∈ T est habilitée par un marquage M si chacune de ses places d’entréep contient au moins le nombre de marques stipulé par le poids de l’arc reliant pàt (M(p)≥P re(p, t)). Alors, cette transition peut être déclenchée (ou tirée) et modi- fier le marquage de ses places d’entrée et de sortie :P re(p, t)marques sont retirées de toute place d’entréepetP ost(t, p)marques sont ajoutées dans toute place de sortie p. Le marquageM obtenu à partir du marquageM après le tir de la transitionti

(3)

Avec les RdP standards ainsi définis, on dispose d’outils d’analyse (essentielle- ment basés sur l’analyse structurelle du RdP et sur l’analyse du graphe des mar- quages), qui permettent de vérifier un ensemble de propriétés qualitatives (Murata, 1989).

3. Réseaux de Petri standard et modélisation de réseaux moléculaires

De nombreuses propriétés étudiées en théorie des réseaux de Petri se transposent de façon naturelle au cas des réseaux moléculaires. Par exemple, la bornitude garantit qu’il ne peut pas y avoir accumulation d’un produit. La vivacité d’une transition as- sure que la réaction qu’elle représente pourra toujours avoir lieu à terme, et ce, pour toute évolution du système à partir de l’état initial. Un P-invariant est un ensemble de places pour lequel la somme pondérée des marquages est constante, indépendam- ment de l’évolution. Un P-invariant caractérise donc une relation de conservation. Un T-invariant est une séquence de tirs de transitions qui reproduit un marquage. Dans le cadre de la modélisation de réseaux biochimiques, il peut être relié à un flux élémen- taire qui correspond à une voie métabolique réalisable. L’atteignabilité d’un marquage M assure l’existence d’un chemin (une séquence de tirs) entre le marquage initial et M. Cette propriété porte sur l’existence d’une trajectoire menant le système à un état donné. Dans le graphe de marquages, les nœuds terminaux (sans successeurs) dé- notent des états stables, les composantes fortement connexes terminales représentent des attracteurs plus complexes dans la dynamique du système. Certaines propriétés dé- pendent de la seule structure du réseau et sont vérifiées par des techniques d’algèbre linéaire, d’autres ne peuvent être prouvées que sur le graphe de marquages. Toutes peuvent être vérifiées en utilisant, par exemple, l’outil INA2.

Les RdP permettent de décrire les composants essentiels des réseaux métaboliques, où les interactions entre composants sont des transformations (Reddy et al., 1996 Zevedei-Oancea et al., 2003 ; Koch et al., 2005). Dans ce cas, la règle de consomma- tion/production attachée au déclenchement des transitions des RdP est bien adaptée et rend compte de la circulation de métabolites dans le réseau. Les places sont asso- ciées aux composants et les transitions aux réactions. Parfois, différentes places sont associées à un même composant comme lorsque l’on veut représenter une enzyme dans ses formes active et inactive. Le marquage représente les quantités de chaque espèce moléculaire, en unités qui dépendent de l’échelle considérée. La modélisation

2. Integrated Net Analyzer, http ://www2.informatik.hu-berlin.de/lehrstuehle/automaten/ina/

(4)

Figure 2. A gauche, la réaction de synthèse du glucose-6-phosphate catalysée par l’hexokinase. A droite, la réaction est modélisée par la transition, les réactants par les places d’entrée, les produits par les places de sortie. L’enzyme de catalyse est modélisée par une place reliée à la transition par un arc test (pas de consommation)

d’une réaction catalysée est donnée dans la figure 2. La matrice d’incidence du RdP correspond à la matrice stœchiométrique du réseau métabolique qu’il modélise (sans toutefois rendre compte des arcs bidirectionnels, comme l’arc test reliant une enzyme et la réaction qu’elle catalyse).

Dans la figure 2, on n’a pas représenté l’inhibition de l’hexokinase par le produit.

Quand on veut modéliser une telle régulation, la sémantique liée à l’interaction reliant deux composants est différente ; il ne s’agit plus de la transformation d’un produit en un autre, mais d’une relation de contrôle. L’absence d’un produit inhibiteur peut avoir un effet positif sur le produit qu’il régule. On a donc besoin d’utiliser l’opéra- teur logique de négation. Cela se fait classiquement en RdP par l’introduction d’arcs inhibiteurs qui testent l’absence de marque dans une place. Mais cette extension des RdP rend inutilisables la représentation matricielle du RdP et l’équation fondamentale qui détermine son évolution. Une représentation spécifique des modèles logiques de réseaux de régulation en RdP standards peut être définie. Dans un modèle logique, un nœud d’un graphe de régulation correspond à un gène (ou son produit) et prend des valeurs booléennes (on/off) ou multivaluées discrètes. Son évolution est donnée par une fonction logique de ses régulateurs (Thomas, 1991 ; Chaouiya et al., 2003). Dans la modélisation en RdP, chaque produit régulateur est décrit par deux places com- plémentaires (pour éviter les arcs inhibiteurs) et les transitions représentent les effets des différentes combinaisons d’interactions entrantes (Chaouiya et al., 2006). Pour ces réseaux de régulation, on vérifie des propriétés dynamiques comme l’existence et l’atteignabilité d’attracteurs (état(s) stable(s) ou composantes fortement connexes dé- notant un comportement cyclique). Une modélisation intégrée de réseaux comprenant des voies métaboliques et leur régulation est alors possible, en connectant le RdP du modèle de régulation et celui des cascades de réactions (Simão et al., 2005). Le re- cours à un unique formalisme, les RdP, est sans doute un bon moyen pour aborder ce problème difficile de modélisation de réseaux mixtes.

(5)

par CII, inhibée par Cro. (b) Chaque place du RdP coloré contient une marque avec le niveau de la protéine (0 ou 1, dans une simplification booléenne), la transition associée à CI est habilitée si le niveau courant de CI est différent de la valeur deKC I

(fonction logique définissant le niveau de CI en fonction de celui de CII et Cro)

4. Extensions des réseaux de Petri et applications aux réseaux moléculaires

Avec les RdP standard (ou colorés, cf. ci-après), on définit des modèles basés sur la topologie des interactions, aucune information de délai n’est donnée. Cela conduit à des comportements non déterministes qui peuvent révéler des trajectoires qui ne sont généralement pas observées in vivo. Par ailleurs, le marquage dénote une population discrète alors qu’il s’agit souvent de représenter des concentrations et des évolutions continues. Il est parfois souhaitable de rendre compte au plus près de la réalité biolo- gique, et donc de disposer de modèles quantitatifs détaillés. Les extensions des RdP répondent à ce besoin en enrichissant le pouvoir de représentation du formalisme.

Les RdP colorés conduisent à une modélisation compacte et structurée de grands réseaux, particulièrement quand ceux-ci ont des composants qui se comportent de façon similaire. De plus, on peut toujours déplier un RdP coloré et obtenir un RdP standard équivalent (et donc recourrir aux approches analytiques propres aux RdP standards). La couleur associée aux marques est une valeur (d’un type quelconque), les arcs sont étiquetés par un nombre entier et par une couleur. Lors du déclenchement d’une transition, le nombre et la couleur des marques consommées et produites sont conformes à l’étiquette des arcs entrants et sortants (Jensen, 1997).

Les RdP colorés ont été utilisés pour séparer les voies d’un réseau métabolique et différencier des molécules de même espèce selon les chemins suivis pour leur pro- duction (Voss et al., 2003). Pour les réseaux de régulation, une première traduction des modèles logiques de réseaux de régulation en RdP colorés, proposée dans (Co- met et al., 2005), comporte une place (représentant l’ensemble du réseau, une marque pour chaque composant de régulation indiquant le niveau de celui-ci) et une unique transition qui définit l’ensemble des fonctions logiques. Les techniques de vérifica- tion formelle (model-checking) permettent alors de sélectionner les fonctions logiques pour lesquelles le modèle satisfait des propriétés temporelles données. Il existe une autre représentation en RdP colorés des graphes de régulation, en associant à chaque régulateur, une place (avec une marque associée à son niveau discret), et une transition spécifiant les règles de son évolution (sa fonction logique) (Chaouiya et al., 2006). La

(6)

topologie du graphe de régulation est ainsi conservée. Cette représentation permettra de modéliser des réseaux de signalisation en se basant sur la représentation définie dans (Klamt et al., 2006), qui consiste à utiliser des hypergraphes d’interactions ren- dant compte de connexions logiques. La figure 3 illustre la modélisation d’une portion du réseau contrôlant le choix entre la lyse et la lysogénie chez le phageλ(Thieffry et al., 1995).

Le comportement des processus biologiques, comme la régulation génétique, la signalisation, la différenciation cellulaire, a une composante stochastique. Dans (Goss et al., 1998), les auteurs recourrent aux RdP stochastiques pour modéliser les effets stochastiques dus aux faibles concentrations moléculaires. Un délai exponentiel est associé aux transitions et le graphe des marquages est alors isomorphe à une chaîne de Markov. Plus récemment, les RdP hybrides fonctionnels ont été largement utilisés, en particulier avec le logiciel Genomic Object Net pour modéliser et simuler des réseaux complexes (Matsuno et al., 2003). Cette extension comprend des places continues ou discrètes, des transitions temporisées avec des délais discrets ou continus, des arcs inhibiteurs, et des étiquettes sur les arcs qui peuvent être fonction du marquage. La concentration d’une protéine peut être modélisée par le marquage d’une place continue et ses vitesses de production ou dégradation sont associées aux transitions continues correspondantes. Par ailleurs, les places et transitions discrètes peuvent être utilisées pour modéliser des mécanismes de régulation (Doi et al., 2004). Cette richesse de représentation est appréciable pour une modélisation détaillée, bien qu’elle ferme la voie à la vérification de propriétés par des méthodes analytiques. De plus, on conserve un aspect graphique proche du réseau modélisé.

5. Conclusion

Ce rapide tour d’horizon montre l’applicabilité des RdP pour la modélisation de réseaux moléculaires. On a vu que, pour les réactions métaboliques, la représentation en RdP est naturelle. Elle l’est moins pour les régulations (activations/inhibitions) qui signifient non plus une relation de consommation/production mais une relation d’in- fluence. Cela dit, les RdP colorés conduisent à une représentation élégante de telles interactions. Si les biologistes disposent d’un nombre considérable de données d’in- teractions, ils accèdent difficilement à des données précises concernant les niveaux de concentrations, les paramètres cinétiques, etc. Cette réalité motive le développement de modèles qualitatifs qui permettent une analyse formelle et constituent une première étape vers la définition de modèles quantitatifs et le réglage de leurs paramètres. Di- verses extensions des RdP ont été définies pour accroître le pouvoir d’expression du formalisme (en particulier pour considérer des aspects temporels, stochastiques, ou des quantités continues). En contrepartie, ces extensions rendent l’analyse plus diffi- cile et l’on doit souvent se contenter de simulations. Il faut noter que l’enrichissement d’un modèle (par exemple l’ajout de délais) peut conduire à la perte de propriétés (ty- piquement, un chemin existant dans le graphe de marquages peut ne plus exister pour une instance temporisée du modèle). Il reste qu’il est intéressant de disposer d’un

(7)

interconnectés. De plus, les communications cellulaires – facteurs paracrines, voies de signalisation, etc. – sont fondamentales (pour le développement embryonnaire par exemple). Il devrait être possible d’étudier le comportement d’un réseau relatif à une cellule isolée, de l’encapsuler et de passer alors à l’échelle du tissu cellulaire.

6. Bibliographie

Chaouiya C., Remy E., Mossé B., Thieffry D., « Qualitative analysis of regulatory graphs : a computational tool based on a discrete formal framework », Positive Systems, POSTA’03, vol. 294 of Lecture Notes in Control and Information Sciences - LNCIS, Springer, 2003, p. 119-26.

Chaouiya C., Remy E., Thieffry D., « Qualitative Petri Net Modelling of Genetic Networks », Trans. on Comput. Syst. Biol., vol. VI, n° LNBI 4220, 2006, p. 95-112.

Comet J., Klaudel H., Liauzu S., « Modeling Multi-valued Genetic Regulatory Networks Using High-Level Petri Nets », ICATPN’05, vol. 3536 of LNCS, 2005, p. 208-27.

de Jong H., « Modeling and simulation of genetic regulatory systems : a literature review », J.Comput Biol., vol. 1, n° 9, 2002, p. 67-103.

Doi A., Fujita S., Matsuno H., Nagasaki M., Miyano S., « Constructing biological pathway models with hybrid functional Petri nets », In Silico Biol., 2004.

Goss P., Peccoud J., « Quantitative modeling of stochastic systems in molecular biology by using stochastic Petri nets », PNAS, vol. 95, n° 12, 1998, p. 6750-5.

Hardy S., Robillard P., « Modeling and simulation of molecular biology using Petri nets : mo- deling goals of various approaches », JBCB, vol. 2, n° 4, 2004, p. 619-37.

Jensen K., Coloured Petri Nets. Basic Concepts, Analysis Methods and Practical Use, vol. 1-3 of Monographs in Theoretical Computer Science, Spinger-Verlag, 1997.

Klamt S., Saez-Rodriguez J., Lindquist J., Simeoni L., Gilles E., « A methodology for the struc- tural and functional analysis of signaling and regulatory networks. », BMC Bioinformatics, 2006, 7 :56.

Koch I., Junker B., Heiner M., « Application of Petri net theory for modelling and validation of the sucrose breakdown pathway in the potato tuber », Bioinformatics, vol. 21, n° 7, 2005, p. 1219-26.

Matsuno H., Tanaka Y., Aoshima H., Doi A., Matsui M., Miyano S., « Biopathways represen- tation and simulation on hybrid functional Petri net. », In Silico Biol., 2003, 3 :0032.

Murata T., « Petri Nets : Properties, Analysis and Applications. », Proc. IEEE, 1989, p. 541-80.

Reddy V., Liebman M., Mavrovouniotis M., « Qualitative analysis of biochemical reaction sys- tems », Comput Biol Med., vol. 26, n° 1, 1996, p. 9-24.

(8)

Simão E., Remy E., Thieffry D., Chaouiya C., « Qualitative modelling of regulated metabolic pathways : application to the tryptophan biosynthesis in E.Coli », Bioinformatics, vol. 21, n° 21 Suppl 2, 2005, p. 190-6.

Thieffry D., Thomas R., « Dynamical Behaviour of Biological Regulatory Networks, II. Immu- nity Control in Bacteriophage Lambda. », Bul. Math. Biol., vol. 57, n° 2, 1995, p. 277-297.

Thomas R., « Regulatory networks seen as asynchronous automata : A logical description », Journal of Theoretical Biology, vol. 153, 1991, p. 1-23.

Voss K., Heiner M., Koch I., « Steady state analysis of metabolic pathways using Petri nets », In Silico Biol, vol. 3, n° 3, 2003, p. 367-87.

Zevedei-Oancea I., Schuster S., « Topological analysis of metabolic networks based on Petri net theory. », In Silico Biol.2003, 3 :0029.

Claudine Chaouiya TAGC, ERM 206, Université de la Méditerranée chaouiya@tagc.univmed.fr

Références

Documents relatifs

D’un point de vue évolutif, le génome du puceron du pois, en cours de séquençage (environ six fois plus petit que celui de l’homme), sera le premier de l’ordre des Hémiptères,

La biologie des pucerons entre aujourd’hui dans une nouvelle ère, grâce au décryptage de la structure et du fonctionnement de leur génome. Pucer on des

Simplification of the assays with the front-end ionisation sources and mass spec- trometry systems from Applied Biosystems/MDS SCIEX has drastically reduced the risk of

La pharmacopée actuelle visant à traiter ces afflictions cible exclusivement les neurones, les cellules les plus connues et les plus étudiées du système nerveux.. Et pourtant,

Le dossier du mois explore le rôle des cellules gliales dans les pathologies du système nerveux, par un survol des maladies concernées et des développements thérapeutiques dans

M ichel Popoff nous montre que les toxines botuliques sont maintenant des médicaments irremplaçables pour traiter nombre de contractions musculaires inappropriées (spasmes,

Il leur faut donc lire un grand volume d’articles pour y dénicher l’information pertinente sur telle ou telle interaction dont ils rendront compte sous la forme d’un terme dans

De même, les approches préventives et thérapeutiques abondent dans les pipelines R&D des laboratoires, contre des maladies comme le cancer mais aussi d’autres,