• Aucun résultat trouvé

1. Introduction

1.2. Analyse de réseaux de co-expression de gènes

L‟identification de l‟ensemble des gènes des deux familles de FT les plus impliquées dans la régulation des parois secondaires chez les plantes permettra de disposer d‟une base de données sur laquelle mener des analyses génomiques globales. Ainsi, la construction d‟un réseau de co-expression de gènes sur des données transcriptomiques étoffées alliée à la connaissance des clés de voute potentielles de la mise en place des parois permet de participer à leur validation et d‟identifier les autres acteurs de ce processus en interrogeant les réseaux de gènes dont ils font partie.

94

1.2.1. Utilisation des réseaux de co-expression de gènes

L‟expression des gènes est un facteur déterminant de la construction du phénotype d‟un organisme (Gamazon et al., 2015; Lin et al., 2017). Si l‟expression est régulée à différents niveaux, organisation des chromosomes, accessibilité de la chromatine, transcription, transport et modification des ARN, ou modification des protéines, l‟étude du transcriptome et des informations portées par les ARN messagers focalise beaucoup de recherches de par sa relative facilité de mise en œuvre. A chacun de ces niveaux, le réseau de régulation s‟articule entre régulateurs et cibles. Au niveau transcriptomique, l‟identification des régulateurs comme les FTs (FT) et des gènes dont les promoteurs sont les cibles des FT est la clé de la compréhension du réseau régulateur de l‟expression génétique (Thompson et al., 2015). Les changements de régulation et d‟expression sont des déterminants majeurs de la diversité phénotypique, c‟est pourquoi les études comparatives au sein de populations de la même espèce (Liu et al., 2019b; Yu et al., 2017) et d‟espèces différentes (Ficklin et Feltus, 2011; Oldham et al., 2006) tirent parti de leurs divergences et similarités qui permettent de mettre au jour les mécanismes de changement d‟expression et les réseaux de régulation (Thompson et al., 2015)Wittkopp, 2007.

L‟objectif de l‟analyse de co-expression de gènes est donc de reconstruire des réseaux de gènes sur la base de leurs similarités d‟expression. De telles approches peuvent être menées à partir de différentes sources, en majorité des données de transcriptomiques, telles des micro-arrays (Rao et al., 2017) et le séquençage d‟ARN (RNAseq)(Huang et al., 2017). Elles peuvent donc porter sur le transcriptome entier d‟un organe ou de différents tissus, voire cellules d‟un organisme ((Ma et al., 2018; Takahagi et al., 2018; Tan et al., 2017), un sous-set de gènes déterminés par leur fonctionnalité (Ding et al., 2015; Smita et al., 2015) ou par leur expression différentielle dans des conditions contrastées (Tai et al., 2018).

Des analyses de réseaux de co-expression de gènes aux objectifs variés ont été menées sur différentes monocotylédones proches du sorgho, comme le riz (Hu et al., 2017; Tan et al., 2017), le maïs (Huang et al., 2017; Wang et al., 2018) et brachypodium (Sibout et al., 2017; Sircar et al., 2018). Le sorgho a également fait l‟objet de quelques études de ce type dans le cadre d‟une étude méthodologique conjointe avec Arabidopsis évaluant un pipeline d‟analyse de transcriptome (Proost et al., 2017), d‟une base de données transcriptomiques (Tian et al., 2016) et de l‟analyse d‟un mutant de la voie de biosynthèse de la lignine (Tetreault et al., 2018) ainsi que de la régulation de la formation des parois en ciblant spécifiquement le FT

95

SbMYB60 (Scully et al., 2017). La mise en place des parois secondaires a également fait l‟objet d‟études de co-expression de gènes dans le contexte du développement des entre-nœuds chez Miscanthus (Hu et al., 2017), la lignification chez Brachypodium (Sibout et al., 2017), de la qualité du bois chez l‟eucalyptus (Dharanishanthi et Ghosh Dasgupta, 2018), de la compréhension de la mise en place des parois chez le peuplier (Cai et al., 2014) et de l‟évaluation d‟une méthode d‟analyse de réseaux en étudiant le cas de la biosynthèse et la régulation des parois chez le maïs (Huang et al., 2017).

1.2.2. Principe de l’analyse de réseaux de co-expression de gènes

La méthode d‟analyse pondérée de co-expression de gènes (Weighted Gene Coexpression Network Analysis, WGCNA) est une des méthodes les plus utilisées pour construire des réseaux de co-expression (Langfelder et Horvath, 2008). C‟est la méthode que nous avons choisie d‟utiliser ici pour analyser des données RNAseq collectées sur des entre-nœuds de tige de sorgho en développement. Les méthodes de construction de réseau reposant sur la corrélation entre les gènes, comme c‟est le cas de WGCNA avec l‟utilisation d‟un coefficient de corrélation de Pearson, sont préconisées pour l‟analyse d‟un nombre de gènes supérieur à 10 000 (Krouk et al., 2013).

Toutes les analyses de co-expression de gènes du type de WGCNA sont construites en connectant des paires de gènes dont les profils d‟expression sont statistiquement fortement corrélés sur de nombreuses conditions d‟échantillonnages (Gupta et Pereira, 2019). En effet, des paires de gènes co-exprimés sont souvent couplés fonctionnellement, par exemple à travers la régulation coordonnée de voies de signalisation/biosynthèse. Identifier et connecter les paires de gènes au niveau du transcriptome entier est ce qui permet de construire le réseau de co-expression qui n‟est qu‟une façon mathématique et graphique abstraite de représenter les associations qui sont analysées. L‟extraction de groupes de gènes dont l‟expression est très corrélée permet d‟identifier des gènes qui font très probablement partie des mêmes voies de régulation responsables de la synchronisation de leur expression et ont ainsi de grandes chances d‟être fonctionnellement reliés ou à défaut d‟être impliqués dans des phénomènes synchrones.

96

1.2.3. Gènes impliqués dans le réseau de régulation des parois chez le

sorgho

La mise en place des parois fait intervenir de nombreuses enzymes de biosynthèse, de transport, de modification et de dégradation des éléments pariétaux. Plusieurs études ont utilisées ou générées des listes de gènes potentiellement impliqués dans la biosynthèse des parois. Rai et al. (2016) ont utilisé une approche phylogénétique similaire à celle développée dans ce chapitre en partant des familles de gènes impliqués dans la synthèse des parois chez d‟autres espèces pour en isoler une signature et pouvoir récupérer les gènes homologues dans le génome du sorgho. D‟autres approches ont été utilisées dans cette étude pour interroger les bases de données existantes et identifier de façon la plus exhaustive les gènes potentiellement impliqués dans la mise en place des parois (Rai et al., 2016). Les familles de gènes ciblées dans cette étude sont des gènes impliqués dans la biosynthèse des polysaccharides de structure, leur remodelage et dégradation ainsi que la famille des laccases, impliquée dans la biosynthèse des lignines. Cinq cent vingt gènes de 20 familles ont été identifiés dont des CESA, CSL, PME, XTH, expansines, etc. La majorité de ces enzymes appartiennent à la superfamille des glycosyl transférases qui sont impliquées dans la synthèse de la cellulose, hémicellulose, et des pectines. McKinley et al. (McKinley et al., 2016) se sont intéressés à la caractérisation des profils d‟expression (différentiels d‟expression) des gènes liés aux parois végétales récupérés à partir des annotations d‟une base de données et de différentes études (Mitchell et al., 2007; Penning et al., 2009). Ils ont identifié 200 gènes impliqués dans la biosynthèse des parois différentiellement exprimés pendant le développement des entre-nœuds de sorgho. Ils ont montré que les profils d‟expression des familles de gènes identifiés (GAX, biosynthèse de la cellulose, des lignines, etc.) étaient très variés pendant le développement et, qu‟en particulier, les CESA spécifiques des parois secondaires (Tanaka et al., 2003) atteignent un pic d‟expression très tardivement dans le développement (7 jours avant l‟anthèse). Petti et al. ont menés différentes études portant sur la biosynthèse de la cellulose et des lignines chez le sorgho (Petti et al., 2013, 2015). Ils ont permis d‟identifier des gènes liés à la biosynthèse de la cellulose dans le cadre de la signalisation des gibbérellines (Petti et al., 2015) et ont également détecté la régulation négative de l‟expression des gènes de la biosynthèse des lignines en conséquence d‟une mutation entraînant une meilleure saccharification de la biomasse (Petti et al., 2013).

Peu d‟études se sont donc intéressées aux gènes liés aux parois sans a priori et les connaissances sont encore très incomplètes chez le sorgho. Les liens entre les gènes de

97

structure responsable de la biosynthèse des parois restent ainsi largement à explorer chez le sorgho. En effet, mis à part Tetreault et al. (2018) et Scully et al. (2017) qui se sont focalisés sur des transformants bien précis, les réseaux de co-régulations liés à la mise en place des parois n‟ont pas été explorés. En particulier, les régulateurs des parois et leurs cibles sont particulièrement méconnus chez le sorgho.

98

1.2.4. Objectifs des analyses de réseaux de co-expression de gènes

Les FT qui régulent la mise en place des parois chez le sorgho sont donc en grande majorité inconnus. Les connaissances acquises chez d‟autres espèces couplées à une analyse phylogénétique globale permettront d‟identifier des FT MYB et NAC potentiellement clés dans la régulation des parois chez le sorgho. L‟utilisation d‟un réseau de co-expression pour analyser les groupes de gènes dont ces gènes candidats font partie permettra d‟accumuler un autre niveau d‟information pour leur rôle chez le sorgho. Au-delà de l‟obtention d‟indices sur le rôle de gènes dont on connait déjà l‟importance chez d‟autres espèces, cette approche permet une analyse globale de tous les gènes des familles impliquées et la mise en évidence de nouveaux FT potentiellement régulateurs de la mise en place des parois chez le sorgho. L‟analyse des groupes de co-expression peut être réalisée grâce à différentes approches. L‟étude de l‟enrichissement en « GO-terms » (Gene Ontology, GO) de ces groupes permet d‟identifier les grands processus biologiques, et en particulier ceux de mise en place des parois, dans lesquels les gènes qui le composent sont impliqués. L‟enrichissement en gènes de biosynthèse des parois des groupes de gènes est également testé dans cet objectif. Les gènes clés des groupes identifiés comme étant impliqués dans la mise en place des parois peuvent être identifiés grâce à des mesures de centralité comme la connectivité. Ce sont des gènes potentiellement cruciaux pour la mise en place des parois, que ce soit dans la régulation ou dans la biosynthèse.

L‟utilisation des FT identifiés par les approches sur les données issues de transcriptomes de sorgho mentionnées ci-dessus et par leur rôle chez d‟autres espèces peuvent servir d‟ancrage solide à l‟analyse des autres gènes qui composent leurs groupes de co-expression. En particulier, les gènes dont l‟expression est la plus corrélée avec ces FT sont des gènes également potentiellement impliqués dans la mise en place des parois.

Le travail décrit ici a donc pour objectif de renforcer par l‟analyse d‟un réseau de co-expression de gènes les informations suggérant l‟implication de FT des familles NAC et MYB déjà identifiés chez d‟autres espèces dans la mise en place des parois chez le sorgho. L‟identification de nouveaux FT et de listes de gènes clés est également attendue.