• Aucun résultat trouvé

Élargir le champ d'application des modèles au-delà du métabolisme

CHAPITRE 1 INTRODUCTION

1.5 BIOLOGIE DES SYSTÈMES DES CELLULES MINIMALES

1.6.1 Élargir le champ d'application des modèles au-delà du métabolisme

1.6.1.1 Modélisation de l'expression des gènes

L'utilisation de la contrainte imposée par la stoechiométrie des réactions a été essentielle pour le développement du FBA (Kauffman et al., 2003) et, ultérieurement, pour le développement des modèles métaboliques à l'échelle du génome. Dans une tentative d'étendre la portée des modèles au-delà du métabolisme, Thiele et al. ont reconstruit la matrice d'expression pour E. coli (Thiele et al., 2009). La reconstruction de cette matrice, appelée matrice E pour expression par opposition à la matrice M pour le métabolisme, a été réalisée en utilisant le même protocole que celui mentionné ci-dessus (Thiele and Palsson, 2010). Toutes les réactions nécessaires à la transcription de l'ARN et à la traduction des protéines sont incluses dans la matrice E. Il est intéressant de noter que chaque élément nécessaire à la synthèse des protéines est considéré comme un métabolite dans le réseau. Par exemple, l'ARN de transfert (ARNt) et l'ARN ribosomique (ARNr) sont tous deux des métabolites qui peuvent être produits à partir des réactions de transcription. Les ARNt sont ensuite chargés et utilisés dans une autre réaction qui synthétise les protéines. Alors que le nombre de gènes inclus dans la matrice E (423 gènes) était inférieur à celui de la matrice M (1515 gènes (Monk et al., 2017)), le nombre de réactions est nettement supérieur (13 694 réactions dans la matrice E contre 2719 réactions dans la matrice M). La grande taille de la matrice E est due au nombre élevé de réactions similaires catalysées par les mécanismes d'expressions des gènes.

Tout comme la matrice M, la stœchiométrie imposée par la matrice E peut être utilisée comme une contrainte et la reconstruction peut être convertie en un format mathématique en appliquant des limites au flux des réactions et en fixant un objectif. Dans ce cas, les taux d'absorption des acides aminés et des nucléotides doivent être fixés car ce sont les métabolites nécessaires à la production de tous les métabolites en aval. La production de ribosomes par le modèle peut alors être optimisée pour différents taux de croissance puisque la production de ribosomes est

41

essentielle à la croissance des cellules. Dans cette étude, le raffinement des contraintes a permis au modèle de générer un nombre de ribosomes correspondant aux données expérimentales. Ces travaux ont démontré l'applicabilité de l'analyse de la structure des ribosomes à des systèmes autres que le métabolisme.

Afin de coupler la machinerie de l'expression des gènes au métabolisme de la cellule et de générer un modèle unifié pour la croissance cellulaire, des contraintes supplémentaires ont été nécessaires. Appelées "contraintes de couplage", ces équations sont fonction du temps de doublement de l'organisme et tiennent compte de la dilution des métabolites dans les cellules qui se divisent et fournissent aussi des limites supérieures à l'expression enzymatique (Lerman et al., 2012; Lloyd et al., 2018; O’brien et al., 2013; Thiele et al., 2012). Ces nouvelles contraintes sont à la fois entières et linéaires et définissent donc un problème de programmation linéaire avec nombres entiers (MILP). Ce type de problème est plus intense en termes de calcul que le problème de programmation linéaire ordinaire résolu en FBA et nécessite également des solveurs plus spécifiques (Yang et al., 2016).

1.6.1.2 Simulation avec des modèles ME

Un modèle ME relie le métabolisme à l'expression des gènes et peut être utilisé pour générer des prévisions testables expérimentalement telles que : le taux de croissance, les taux d'absorption et de sécrétion des substrats, les flux métaboliques et les niveaux d'expression des produits géniques (O’brien et al., 2013). Cette dernière propriété est importante car elle simplifie la comparaison avec les niveaux expérimentaux d'expression des gènes, qui peuvent maintenant être générés de façon routinière dans plusieurs conditions différentes. La facilité d'intégration de multiples données omiques dans les modèles ME a permis d'identifier des régularités biologiques clés (Ebrahim et al., 2016). Les données protéomiques expérimentales peuvent fournir le nombre absolu de protéines dans une cellule, qui peuvent être utilisés pour limiter la quantité de protéines dans le modèle ME. Les données de fluxomique peuvent également être utilisées comme une contrainte puisqu'elles fournissent le flux à travers un

42

certain nombre de réactions. La combinaison de ces deux types de données dans les simulations du modèle ME a permis de générer des taux de rotation (keff) pour les enzymes du modèle, un

exemple de génération de connaissances guidée par le modèle.

En simulant des modèles ME dans 333 conditions environnementales différentes, Yang et al. ont identifié des gènes systématiquement essentiels pour une croissance optimale de E. coli (Yang et al., 2015b). Dans cette étude, le protéome commun exprimé dans toutes les conditions a été prédit par le modèle. Ce noyau commun du protéome était consistant avec l’expression différentielle de gènes pour l’ensemble de ces conditions. Aussi, il est possible de regrouper les gènes d’un ensemble minimal déterminé par le modèle ME en catégories fonctionnelles afin d’obtenir une représentation plus globale des fonctions conservées. À cette fin, les auteurs ont utilisé les catégories COG (Koonin et al., 2004). Ce regroupement en catégories fonctionnelles a mis en lumière le fait que les modèles ME n’incluent pas les mécanismes de réparation et de réplication de l’ADN. Leur absence dans le noyau commun justifie de poursuivre l’extension des modèles afin d’inclure un plus grand nombre de systèmes cellulaires, et permettant aussi d’augmenter leur potentiel prédictif. Ainsi, en incluant des systèmes tels que celui de la régulation, tout en conservant une approche de modélisation basée sur les contraintes, il serait possible d’obtenir une approximation fonctionnelle d’un modèele de cellule entièere nécessitant moins de paramètres expérimentaux que celui qui a été généré précédemment pour M. genitalium (Karr et al., 2012).

Finalement, en raison de la taille de la matrice E, la reconstruction de modèles ME entiers n’est présentement limitée qu'à deux espèces, soit Thermotoga maritima et E. coli (Lerman et al., 2012; O’brien et al., 2013). Tout comme la génération de modèles M est facilitée par l'existence de boîtes à outils, la reconstruction de modèles ME pourrait être généralisée grâce à la récente publication de COBRAme, un cadre Python pour la reconstruction de modèles ME (Lloyd et al., 2018).

43

Documents relatifs