CHAPITRE 3 : Modifications métaboliques et transcriptomiques des compartiments 1.2 Les enjeux du couplage métabolomique/transcriptomique Comme nous l’avons défini plus tôt, la métabolomique correspond à l’étude de l’ensemble des métabolites (primaires et secondaires) d’un individu, d’un compartiment ou d’un organe. Même si le contenu en métabolites d'un individu explique directement son phénotype, les analyses métabolomiques ne permettent pas d'établir une telle corrélation. Les métabolites annotés sont en effet souvent impliqués dans différentes voies métaboliques et présents dans plusieurs compartiments (cellulaires et tissulaires) de la plante. Pour des raisons analytiques exposées dans le Chapitre 1, il est de plus techniquement impossible d'analyser, en une analyse métabolomique, l'ensemble des métabolites d'un extrait. Ceci est lié à la très grande variété des propriétés physico-chimiques des métabolites composant un organisme vivant. L'analyse 84 métabolomique est de plus une analyse d'une image instantanée d'un état physiologique, ce qui ne permet pas de comprendre comment un organisme vivant répond à un stimulus. Le décryptage d'un phénotype doit donc faire appel à une approche plus intégrative des phénomènes biologiques que la seule analyse métabolomique. L'approche la plus classiquement employée pour complémenter les données de métabolomique est la transcriptomique. Cette dernière correspond à l’étude de l’ensemble des ARN messagers, c’est-à-dire des transcrits d’un génome (Wang et al. 2009). La très grande majorité des métabolites d'un organisme vivant est produite par l'action de catalyseurs protéiques appelés enzymes. Ceux-ci sont eux même produits (traduits) à partir de l'information portée par des ARNm qui eux-mêmes sont générés (transcrits) à partir de l'information portée par les zones codantes du génome. La compartimentation cellulaire des métabolites tient au fait que leurs enzymes possèdent des séquences qui les adressent spécifiquement dans les bons compartiments des cellules. La compartimentation tissulaire, tient quant à elle à l'expression tissus-spécifique des ARNm, une information contenue dans leurs zones promotrices d'expression qui sont souvent situées en amont des zones codantes des gènes. Le manque de connaissance sur le fonctionnement des zones promotrices de transcription et la multiplicité des mécanismes de régulation post-traductionnelle des enzymes rend cependant impossible l'établissement de connexions directes entre métabolome et génome d’un individu (Nielsen et Oliver 2005). L'analyse expérimentale directe du métabolome est donc nécessaire mais des informations génomiques et transcriptomiques seront également nécessaires pour compléter les limitations expérimentales des analyses génomiques. Idéalement, des informations protéiques seraient aussi utiles. Leur séquence nous renseigne sur leur localisation et la mesure des activités enzymatiques sur leur niveau de fonctionnement. Ces analyses sont hélas complexes, coûteuses et sujettes à des limitations intrinsèques comme les analyses métabolomiques. En ce sens, les analyses transcriptomiques représentent un compromis intéressant car elles peuvent être réalisées en une seule analyse, couvrir une très large part du transcriptome à coût raisonnable et tout de même renseigner sur le niveau de régulation transcriptomique et la localisation subcellulaire et tissulaire des transcrits. Il existe deux principales méthodes d'analyse du transcriptome : celle faisant appel à des puces de microarray et celles résultant du séquençage direct des ARNm (Seq). Même si le RNA-Seq a l'avantage de pouvoir être appliqué à des espèces végétales pour lesquelles une connaissance intégrale du génome n'est pas disponible, les progrès récents dans les technologies de séquençage à haut débit font qu'il fournit une plus grande couverture du génome exprimé 85 que les microarray (Sekhon et al. 2013). Dans le cas où le génome de l'organisme a été séquencé et annoté, le RNA-Seq renseigne également sur les évènements d'épissage alternatifs. Etant quantitatif, le RNA-Seq permet une analyse plus fine des différences significatives entre conditions. Par exemple, dans l’étude de Sekhon et al. 2013, alors que les microarrays montrent une différence d’expression de 390 gènes, l’analyse par RNA-Seq met en évidence celle de 427 gènes. Le RNA-Seq est ainsi considéré comme la technologie la plus appropriée pour évaluer le niveau des transcrits et leur épissage différentiel (Wang et al. 2009). Les outils modernes de bioinformatique permettent de tirer plus d'information d'une analyse RNA-Seq si une annotation fonctionnelle du génome de l'organisme étudié est disponible. Ces outils permettent en effet de relier l'expression différentielle d'un groupe de gènes avec l'enrichissement d'un terme d'ontologie de gènes (GO). L'effort actuel sur l'ontologie des gènes permet de définir les gènes de manière non-spécifique d'une espèce et donc d'utiliser un vocabulaire unique et universel pour communiquer sur la fonction d'un gène selon trois termes, la localisation cellulaire, la fonction cellulaire et le processus biologique auquel il participe. Ces outils utilisent également comme données de fond des cartes d'expression spatio-temporelle des gènes de l'organisme étudié. Même si ces outils ne sont pas optimaux pour le maïs où la fonction de nombreux gènes est extrapolée selon l'analyse fonctionnelle d'un orthologue dans une autre espèce végétale, ils sont tout de même disponibles (http://bioinfo.cau.edu.cn/agriGO/analysis.php) de même que des cartes d'expression spatio-temporelles en dehors de tout stress connu (Sekhon et al. 2011). Les nombreux séquençages RNA-Seq réalisés ces dernières années par de nombreuses équipes ont permis d’agrémenter les bases de données même si ces dernières sont encore limitées pour des organismes non-modèles. Pour les génomes non-séquencés, des méthodologies appropriées et qui ne sont pas basées sur un alignement de séquence mais sur un ré-assemblage, doivent-être créées et optimisées (Grabherr et al. 2011). Le génome du maïs a été entièrement séquencé et plusieurs études ont étudié son transcriptome avec la création d'un certain nombre d'outils d'analyse bioinformatique. Dans une étude, Sekhon et al. (2013) a montré que 39 429 gènes étaient transcrits chez le maïs, tout organe confondu, et qu'au maximum 29 447 gènes étaient transcrits au sein d’un même organe (feuilles, embryon, tige, grain en germination). En tout, 32 540 gènes codant pour des protéines, appartenant à 11 892 familles ont été annotés chez le maïs dans une autre étude. C’est plus que chez le Sorgho mais un nombre de gènes inférieur à celui de l’Arabette ou du Riz (Schnable et al. 2009). Plus 86 chercher un plus grand nombre de transcrits et atteindre 126 708 transcrits annotés chez le maïs dont 4 842 transcrits nouvellement annotés (Ja et al. 2014). Il a été montré que le transcriptome du maïs était fortement modifié lors d'un stress abiotique ou lors de l’attaque d'un pathogène. Lors de stress hydriques notamment, le niveau d’expression des transcrits issus de la voie de l’ABA augmente en parallèle à une diminution de la concentration en glucose, faisant penser à une modification dans la signalisation ABA/sucre (Kakumanu et al. 2012). Au niveau des ovaires et au niveau du méristème basal des feuilles, respectivement, 10 426 et 682 gènes sont différentiellement exprimés chez les plantes soumises au stress. Ceci indique que le nombre de transcrits dont l'expression est significativement modifiée entre deux conditions peut être très différent en fonction de l’organe étudié. Le couplage d'analyses métabolomiques et transcriptomiques a permis d’étudier des phénomènes biologiques complexes tels que la tolérance des plantes à des stress abiotiques comme le froid ou le gel (Hincha et al. 2012). Dans cette étude, le couplage entre les deux ‘omiques’ a permis d’étudier non seulement le facteur ‘stress’ mais aussi le facteur ‘espèces végétales’ en reliant les données de céréales, buissons et arbres. C’est le cas aussi de l’étude de Lee et al. (2017) qui couple la transcriptomique et la métabolomique afin de mettre en exergue les différences fines dans la biosynthèse du ginsenoside entre différents cultivars de ginseng. Dans le cas d’études de stress, certaines équipes ont utilisé des biosimulations qui prenaient en compte les voies métaboliques modifiées afin de définir des biomarqueurs pour prédire les transcrits discriminants. Cette approche a été appelée technologie ‘transriptome -to-metabolome’ (TTM) (Phelix et Feltus 2015). Il a de même été envisagé d’utiliser le couplage des ‘omiques’ dans un contexte actuel de culture du maïs difficile, afin de mieux comprendre comment cette plante fait face aux différents stress environnementaux (Gong et al. 2014). Dans le cas précis des interactions plantes-microbes chez les plantes non-modèles, il a été montré que la génomique et la transcriptomique seules n’étaient pas assez puissantes pour déceler les modifications minimes et que l'ajout d'information issue de la métabolomique avait permis de découvrir de nouvelles molécules intervenant dans ces interactions (Feussner et Polle 2015). Des corrélations ont été établies entre les niveaux des transcrits, ceux des métabolites et la réponse de systèmes biologiques à des transformations (Urbanczyk‐Wochniak et al. 2003) afin de mettre à jour les gènes clés de ces réponses. Combiner les informations issues des transcriptomes et métabolomes est un challenge actuel important pour éviter de tirer des conclusions erronées. 87 Dans le document Variations métaboliques du maïs lors de l’association coopérative avec la bactérie phytostimulatrice Azospirillum lipoferum CRT1 (Page 96-100)