3.4 Les fonctionnalit´es de SymbioCyc
3.4.3 Fichiers SBML, graphes de r´eactions, graphes de compos´es 75
aussi les sous-produits de cette transformation, par exemple le phosphate dans la transformation pr´ec´edente.
3.4.2 Propri´et´es globales des r´eseaux
SymbioCyc permet de voir les propri´et´es globales de chaque r´eseau m´etabo-lique (Figure 3.4). A l’´ecran s’affichent le nombre de voies m´etabom´etabo-liques, de com-pos´es, de r´eactions, de num´eros EC diff´erents, de g`enes m´etaboliques et d’enzymes impliqu´ees. Ces nombres vont nous renseigner imm´ediatement sur la taille du r´e-seau et l’´etendue de ses capacit´es m´etaboliques. A partir de la mˆeme interface, il est possible de t´el´echarger un document pdf pr´esentant d’autres statistiques qui vont permettre `a l’utilisateur de caract´eriser plus finement le jeu de donn´ees ´etudi´e. Par exemple, la fr´equence des 30 compos´es les plus connect´es donne une id´ee de quels sont les compos´es importants dans le r´eseau et la distribution de la connectivit´e des compos´es renseigne sur la connectivit´e globale des compos´es. Il est possible d’appliquer les filtres pr´ec´edemment d´ecrits et de visualiser aussitˆot les propri´et´es des r´eseaux filtr´es.
3.4.3 Fichiers SBML, graphes de r´eactions, graphes de
compos´es
Chaque r´eseau m´etabolique est t´el´echargeable sous la forme de fichier SBML, de graphes de compos´es ou de r´eactions. Le format SBML est maintenant utilis´e par de nombreux outils de mod´elisation du r´eseau m´etabolique (cf Section 2.1).
Les fichiers pr´esents dans SymbioCyc ne contiennent aucune information sur les quantit´es des compos´es ou les vitesses de r´eactions, informations non dispo-nibles dans les reconstructions automatiques. Pour une analyse de balance des flux ou de contrˆole m´etabolique, l’utilisateur doit ajouter manuellement ces in-formations. Un fichier SBML contient simplement une liste de r´eactions. Pour chacune de ces r´eactions, nous avons dans un fichier SBML classique les infor-mations suivantes : la r´eversibilit´e, la liste des substrats et des produits et les coefficients stœchiom´etriques. En nous inspirant du format SBML am´elior´e uti-lis´e par (Reed et al., 2003), nous avons ajout´e les liens g`enes-prot´eines-r´eaction (GPR), les voies m´etaboliques dans lesquelles la r´eaction intervient et son num´ero EC (Figure 3.5).
NAD+ + H+ ↔ NADH NADPH ↔ NADP+ + H+ NAD(P)H ↔ NAD(P) + H+ ADP + Phosphate ↔ ATP AMP + Diphosphate ↔ ATP
S-Adenosyl-L-homocysteine ↔ S-Adenosyl-L-methionine CoA ↔ Acetyl-CoA
2-Oxoglutarate ↔ L-Glutamate UDP ↔ UDP-glucose
Acceptor ↔ Reduced acceptor CoA ↔ Acyl-CoA
Pyruvate ↔ L-Alanine
Succinate + CO2 ↔ 2-Oxoglutarate + O2 UDP ↔ UDP-N-acetyl-D-glucosamine GDP + Phosphate ↔ GTP
Oxaloacetate ↔ L-Aspartate
UDP + Phosphate ↔ UDP-D-galactose
Adenosine 3’,5’-bisphosphate ↔ 3’-Phosphoadenylyl-sulfate UDP ↔ UTP CoA ↔ Malonyl-CoA CoA ↔ Succinyl-CoA GDP ↔ GDP-mannose CoA ↔ Propanoyl-CoA IDP ↔ ITP CDP ↔ CTP CMP ↔ CMP-N-acetylneuraminate Reduced ferredoxin ↔ Oxidized-ferredoxin Tetrahydrofolate ↔ 5,10-Methylenetetrahydrofolate CoA ↔ Palmitoyl-CoA
UDP ↔ UDP-glucuronate
UDP ↔ UDP-N-acetyl-D-galactosamine dADP + Phosphate ↔ dATP
CoA ↔ p-Coumaroyl-CoA
Dihydrobiopterin ↔ Tetrahydrobiopterin CoA ↔ Caffeoyl-CoA
Thioredoxin ↔ Oxidized thioredoxin Ubiquinol ↔ Ubiquinone
Reduced rubredoxin ↔ Oxidized rubredoxin CoA ↔ S-Benzoate coenzyme A
Reduced-adrenal-ferredoxin ↔ Oxidized adrenal ferredoxin Coenzyme-F420 ↔ Reduced coenzyme F420
Dithiothreitol ↔ Oxidized dithiothreitol FAD ↔ FADH2
PQQ ↔ PQQH2 FMN ↔ Reduced FMN Donor ↔ Oxidized donor UDP ↔ UDP-L-rhamnose
Deoxynucleoside ↔ Deoxynucleoside 5’-phosphate CoA ↔ Methylmalonyl-CoA
Reduced-flavoprotein ↔ Oxidized flavoprotein Protein-histidine ↔ Protein N(pi)-phospho-L-histidine
Electron-transferring flavoprotein ↔ Reduced electron transferring flavoprotein Oxidized azurin ↔ Reduced azurin
dTDP ↔ dTDP-L-oleandrose Quinone ↔ Hydroquinone
Ferricytochrome c ↔ Ferrocytochrome c Protein dithiol ↔ Protein disulfide
Tableau 3.1. Liste des transformations impliquant des cofacteurs, utilis´ee dans un des filtres de SymbioCyc. Lorsque l’une de ces transformations est trouv´ee dans une r´eaction, le filtre ´elimine de la r´eaction les m´etabolites correspondants.
3.4 Les fonctionnalit´es de SymbioCyc tb
Figure 3.4. Visualisation des caract´eristiques globales des r´eseaux m´etaboliques dans SymbioCyc.
Les fichiers SBML sont directement lisibles par les logiciels de visualisation Cytoscape (Shannon et al., 2003) et MetaViz (Bourqui et al., 2007). Ce dernier logiciel, dont nous avons particip´e `a la conception, prend en compte les informa-tions sur les voies m´etaboliques contenues dans le fichier SBML pour am´eliorer la visualisation.
SymbioCyc permet ´egalement `a l’utilisateur d’enregistrer les graphes corres-pondant `a chaque r´eseau m´etabolique. Le graphe peut ˆetre dirig´e ou non et les noeuds peuvent ˆetre, soit les r´eactions, soit les compos´es (voir Section 2.2).
Chaque graphe est enregistr´e sous la forme d’une liste d’arˆetes au format sif, directement utilisable par Cytoscape et lisible facilement par de simples routines de programmation (Figure 3.6).
Les filtres d´ecrits pr´ec´edemment sont applicables, autant sur les fichiers SBML que sur les graphes de r´eactions et de compos´es avant leur t´el´echargement.
3.4.4 Comparaison des r´eseaux m´etaboliques
SymbioCyc propose un outil de comparaison de r´eseaux m´etaboliques original. Il est possible, en effet, de comparer les ensembles de compos´es, de r´eactions et de voies m´etaboliques entre organismes et entre groupes d’organismes. Cet outil vient compl´eter les outils de comparaison d´ej`a pr´esents dans les interfaces Bio-Cyc. Ici, les r´eactions prises en compte sont seulement celles pour lesquelles une enzyme ou un g`ene a ´et´e assign´e, au contraire de l’outil de comparaison global propos´e par BioCyc qui prend en compte ´egalement les autres (voir Section 2.3.1).
Figure 3.5. El´ement ”r´eaction” dans un fichier SBML. Les liens entre g`enes, prot´eines et r´eactions, les voies m´etaboliques et le num´ero EC ont ´et´e ajout´ees en note.
La comparaison des voies m´etaboliques de plusieurs organismes choisis par l’utilisateur permet d’identifier les diff´erences ou les similitudes globales dans les capacit´es m´etaboliques des organismes. La comparaison renvoie un tableau avec, pour chaque organisme s´electionn´e, les voies m´etaboliques qui lui sont propres et les voies m´etaboliques partag´ees entre tous les organismes s´electionn´es.
Par rapport au mode de comparaison d´ej`a pr´esent dans l’interface BioCyc, la proportion du nombre de r´eactions possibles dans l’organisme est indiqu´e et les voies compl`etes sont mises en relief (Figure 3.7). Un clic sur une voie m´eta-bolique renvoie l’utilisateur sur l’outil de comparaison entre esp`eces d’une voie m´etabolique de l’interface BioCyc.
La comparaison des compos´es de plusieurs organismes renvoie plusieurs ta-bleaux correspondant, pour chaque organisme, aux compos´es qui lui sont propres, ainsi qu’un tableau correspondant aux compos´es partag´es par tous les organismes choisis. Pour chaque compos´e, apparaˆıt un lien vers la page correspondante de l’interface BioCyc, son nom, son poids mol´eculaire, le nombre de r´eactions dans lequel il intervient en tant que substrat ou produit, et le nombre de voies m´eta-boliques dans lequel il apparaˆıt.
La comparaison des r´eactions de plusieurs organismes renvoie ´egalement plu-sieurs tableaux, les premiers correspondant aux r´eactions uniques `a un organisme et le dernier aux r´eactions communes. Pour chaque r´eaction, apparaˆıt un lien vers l’outil de comparaison d’une r´eaction de l’interface BioCyc, ses substrats, les enzymes impliqu´ees et les voies m´etaboliques dans lesquelles on trouve cette r´eaction.
Le r´esultat des comparaisons des voies, compos´es ou r´eactions entre groupes d’organismes, est pr´esent´e de la mˆeme mani`ere. Cette fois-ci, l’utilisateur peut pr´eciser jusqu’`a six ensembles d’organismes. Un objet (voie, compos´e ou r´eaction) sera consid´er´e comme unique `a un ensemble s’il apparaˆıt syst´ematiquement dans tous les organismes qu’il contient et s’il est absent de tous les autres organismes de
3.4 Les fonctionnalit´es de SymbioCyc
Figure 3.6. Extrait d’une liste d’arˆetes dans un graphe des compos´es sous format sif.
chaque groupe. Ce mode de comparaison original permet de d´egager rapidement les grandes diff´erences m´etaboliques entre groupes d’organismes.
Figure 3.7. Extrait de la comparaison des voies m´etaboliques de Rickettsia prowazekii, Mycoplasma genita-liumet Buchnera aphidicola APS dans SymbioCyc (1.). Un clic sur une voie m´etabolique renvoie sur le d´etail de la comparaison dans l’interface de BioCyc (2.)