• Aucun résultat trouvé

CHAPITRE 3 : Modifications métaboliques et transcriptomiques des compartiments

1.2 Les enjeux du couplage métabolomique/transcriptomique

Comme nous l’avons défini plus tôt, la métabolomique correspond à l’étude de l’ensemble des

métabolites (primaires et secondaires) d’un individu, d’un compartiment ou d’un organe. Même

si le contenu en métabolites d'un individu explique directement son phénotype, les analyses

métabolomiques ne permettent pas d'établir une telle corrélation. Les métabolites annotés sont

en effet souvent impliqués dans différentes voies métaboliques et présents dans plusieurs

compartiments (cellulaires et tissulaires) de la plante. Pour des raisons analytiques exposées

dans le Chapitre 1, il est de plus techniquement impossible d'analyser, en une analyse

métabolomique, l'ensemble des métabolites d'un extrait. Ceci est lié à la très grande variété des

propriétés physico-chimiques des métabolites composant un organisme vivant. L'analyse

84

métabolomique est de plus une analyse d'une image instantanée d'un état physiologique, ce qui

ne permet pas de comprendre comment un organisme vivant répond à un stimulus. Le

décryptage d'un phénotype doit donc faire appel à une approche plus intégrative des

phénomènes biologiques que la seule analyse métabolomique. L'approche la plus classiquement

employée pour complémenter les données de métabolomique est la transcriptomique. Cette

dernière correspond à l’étude de l’ensemble des ARN messagers, c’est-à-dire des transcrits d’un

génome (Wang et al. 2009).

La très grande majorité des métabolites d'un organisme vivant est produite par l'action de

catalyseurs protéiques appelés enzymes. Ceux-ci sont eux même produits (traduits) à partir de

l'information portée par des ARNm qui eux-mêmes sont générés (transcrits) à partir de

l'information portée par les zones codantes du génome. La compartimentation cellulaire des

métabolites tient au fait que leurs enzymes possèdent des séquences qui les adressent

spécifiquement dans les bons compartiments des cellules. La compartimentation tissulaire, tient

quant à elle à l'expression tissus-spécifique des ARNm, une information contenue dans leurs

zones promotrices d'expression qui sont souvent situées en amont des zones codantes des gènes.

Le manque de connaissance sur le fonctionnement des zones promotrices de transcription et la

multiplicité des mécanismes de régulation post-traductionnelle des enzymes rend cependant

impossible l'établissement de connexions directes entre métabolome et génome d’un individu

(Nielsen et Oliver 2005). L'analyse expérimentale directe du métabolome est donc nécessaire

mais des informations génomiques et transcriptomiques seront également nécessaires pour

compléter les limitations expérimentales des analyses génomiques. Idéalement, des

informations protéiques seraient aussi utiles. Leur séquence nous renseigne sur leur localisation

et la mesure des activités enzymatiques sur leur niveau de fonctionnement. Ces analyses sont

hélas complexes, coûteuses et sujettes à des limitations intrinsèques comme les analyses

métabolomiques. En ce sens, les analyses transcriptomiques représentent un compromis

intéressant car elles peuvent être réalisées en une seule analyse, couvrir une très large part du

transcriptome à coût raisonnable et tout de même renseigner sur le niveau de régulation

transcriptomique et la localisation subcellulaire et tissulaire des transcrits.

Il existe deux principales méthodes d'analyse du transcriptome : celle faisant appel à des puces

de microarray et celles résultant du séquençage direct des ARNm (Seq). Même si le

RNA-Seq a l'avantage de pouvoir être appliqué à des espèces végétales pour lesquelles une

connaissance intégrale du génome n'est pas disponible, les progrès récents dans les technologies

de séquençage à haut débit font qu'il fournit une plus grande couverture du génome exprimé

85

que les microarray (Sekhon et al. 2013). Dans le cas où le génome de l'organisme a été séquencé

et annoté, le RNA-Seq renseigne également sur les évènements d'épissage alternatifs. Etant

quantitatif, le RNA-Seq permet une analyse plus fine des différences significatives entre

conditions. Par exemple, dans l’étude de Sekhon et al. 2013, alors que les microarrays montrent

une différence d’expression de 390 gènes, l’analyse par RNA-Seq met en évidence celle de 427

gènes. Le RNA-Seq est ainsi considéré comme la technologie la plus appropriée pour évaluer

le niveau des transcrits et leur épissage différentiel (Wang et al. 2009).

Les outils modernes de bioinformatique permettent de tirer plus d'information d'une analyse

RNA-Seq si une annotation fonctionnelle du génome de l'organisme étudié est disponible. Ces

outils permettent en effet de relier l'expression différentielle d'un groupe de gènes avec

l'enrichissement d'un terme d'ontologie de gènes (GO). L'effort actuel sur l'ontologie des gènes

permet de définir les gènes de manière non-spécifique d'une espèce et donc d'utiliser un

vocabulaire unique et universel pour communiquer sur la fonction d'un gène selon trois termes,

la localisation cellulaire, la fonction cellulaire et le processus biologique auquel il participe. Ces

outils utilisent également comme données de fond des cartes d'expression spatio-temporelle des

gènes de l'organisme étudié. Même si ces outils ne sont pas optimaux pour le maïs où la fonction

de nombreux gènes est extrapolée selon l'analyse fonctionnelle d'un orthologue dans une autre

espèce végétale, ils sont tout de même disponibles

(http://bioinfo.cau.edu.cn/agriGO/analysis.php) de même que des cartes d'expression

spatio-temporelles en dehors de tout stress connu (Sekhon et al. 2011). Les nombreux séquençages

RNA-Seq réalisés ces dernières années par de nombreuses équipes ont permis d’agrémenter les

bases de données même si ces dernières sont encore limitées pour des organismes non-modèles.

Pour les génomes non-séquencés, des méthodologies appropriées et qui ne sont pas basées sur

un alignement de séquence mais sur un ré-assemblage, doivent-être créées et optimisées

(Grabherr et al. 2011).

Le génome du maïs a été entièrement séquencé et plusieurs études ont étudié son transcriptome

avec la création d'un certain nombre d'outils d'analyse bioinformatique. Dans une étude, Sekhon

et al. (2013) a montré que 39 429 gènes étaient transcrits chez le maïs, tout organe confondu,

et qu'au maximum 29 447 gènes étaient transcrits au sein d’un même organe (feuilles, embryon,

tige, grain en germination). En tout, 32 540 gènes codant pour des protéines, appartenant à 11

892 familles ont été annotés chez le maïs dans une autre étude. C’est plus que chez le Sorgho

mais un nombre de gènes inférieur à celui de l’Arabette ou du Riz (Schnable et al. 2009). Plus

86

chercher un plus grand nombre de transcrits et atteindre 126 708 transcrits annotés chez le maïs

dont 4 842 transcrits nouvellement annotés (Ja et al. 2014). Il a été montré que le transcriptome

du maïs était fortement modifié lors d'un stress abiotique ou lors de l’attaque d'un pathogène.

Lors de stress hydriques notamment, le niveau d’expression des transcrits issus de la voie de

l’ABA augmente en parallèle à une diminution de la concentration en glucose, faisant penser à

une modification dans la signalisation ABA/sucre (Kakumanu et al. 2012). Au niveau des

ovaires et au niveau du méristème basal des feuilles, respectivement, 10 426 et 682 gènes sont

différentiellement exprimés chez les plantes soumises au stress. Ceci indique que le nombre de

transcrits dont l'expression est significativement modifiée entre deux conditions peut être très

différent en fonction de l’organe étudié.

Le couplage d'analyses métabolomiques et transcriptomiques a permis d’étudier des

phénomènes biologiques complexes tels que la tolérance des plantes à des stress abiotiques

comme le froid ou le gel (Hincha et al. 2012). Dans cette étude, le couplage entre les deux

‘omiques’ a permis d’étudier non seulement le facteur ‘stress’ mais aussi le facteur ‘espèces

végétales’ en reliant les données de céréales, buissons et arbres. C’est le cas aussi de l’étude de

Lee et al. (2017) qui couple la transcriptomique et la métabolomique afin de mettre en exergue

les différences fines dans la biosynthèse du ginsenoside entre différents cultivars de ginseng.

Dans le cas d’études de stress, certaines équipes ont utilisé des biosimulations qui prenaient en

compte les voies métaboliques modifiées afin de définir des biomarqueurs pour prédire les

transcrits discriminants. Cette approche a été appelée technologie ‘transriptome

-to-metabolome’ (TTM) (Phelix et Feltus 2015). Il a de même été envisagé d’utiliser le couplage

des ‘omiques’ dans un contexte actuel de culture du maïs difficile, afin de mieux comprendre

comment cette plante fait face aux différents stress environnementaux (Gong et al. 2014). Dans

le cas précis des interactions plantes-microbes chez les plantes non-modèles, il a été montré que

la génomique et la transcriptomique seules n’étaient pas assez puissantes pour déceler les

modifications minimes et que l'ajout d'information issue de la métabolomique avait permis de

découvrir de nouvelles molécules intervenant dans ces interactions (Feussner et Polle 2015).

Des corrélations ont été établies entre les niveaux des transcrits, ceux des métabolites et la

réponse de systèmes biologiques à des transformations (Urbanczyk‐Wochniak et al. 2003) afin

de mettre à jour les gènes clés de ces réponses. Combiner les informations issues des

transcriptomes et métabolomes est un challenge actuel important pour éviter de tirer des

conclusions erronées.

87