• Aucun résultat trouvé

ANALYSE DU TRANSCRIPTOME LORS DU DEVELOPPEMENT DE LA GRAINE 1 Stratégie utilisée pour caractériser le développement de la graine

A gene expression atlas of the model legume Medicago truncatula

3. ANALYSE DU TRANSCRIPTOME LORS DU DEVELOPPEMENT DE LA GRAINE 1 Stratégie utilisée pour caractériser le développement de la graine

Le principal objectif de cette étude est de décrire en détail les variations de profils d’expression des gènes pendant le développement de la graine et plus particulièrement pendant la phase de remplissage. Même si le changement dans le niveau d’expression d’un ARN messager ne reflète pas toujours la quantité de protéines traduites et l’activité des enzymes, la présence de transcrits représente, cependant, une indication des mécanismes moléculaires mis en jeu. Par ailleurs, la puce Affymetrix récemment disponible chez M. truncatula ne dispose pas du génome entier mais elle contient approximativement 51000 gènes (50899 sondes) (approximativement 90% des gènes de M. truncatula), elle fournit donc l’opportunité unique de suivre l’expression d’un peu moins de 51k gènes tout au long du développement de la graine et ainsi permet d’avoir une vue d’ensemble des processus moléculaire de la graine chez cette espèce modèle.

Le profil d’expression de ces 51k gènes a été réalisé à six stades clefs du développement de la graine, stades choisis sur la base de données protéomiques (Gallardo et al. 2003). Tout d’abord, le stade 10 jours après pollinisation (JAP) correspond au stade d’embryogenèse tardive. Le stade 12 JAP marque la transition entre l'embryogenèse et le remplissage, caractérisée par la fin des divisions cellulaires de l’embryogenèse et précédant la synthèse des composés de stockage. Ensuite, les stades 16, 20 et 24 JAP correspondent au processus de remplissage du grain et de la synthèse des protéines de réserve, principalement composées de globulines 7S (vicilines et convicilines) ou 11S (légumines). Enfin, le stade 36 JAP correspond au stade de maturité physiologique de la graine et à l’entrée dans la phase de dessication.

3.2 Analyse des profils d’expression pendant le développement de la graine

En utilisant l’ADNc synthétisé à partir des stades précédemment cités, des hybridations ont été réalisées sur la puce "Affymetrix M. truncatula genome array". Des analyses statistiques ont été faites à partir de trois répétitions biologiques afin de mettre en évidence les gènes ayant des profils de niveau d’expression répétables. Un total de 92% (46811/50899) des sondes oligonucléotidiques présentes sur la puce ont pu s’hybrider avec de l’ADNc issu d’au moins un stade du développement de la graine. Par ailleurs, plus de la moitié de ces gènes (25745/46811) ont des transcrits détectables aux six stades étudiés. Ce premier résultat souligne que le développement de la graine est un processus complexe qui implique la grande majorité des gènes. Une analyse statistique de type ANOVA a permis d’identifier 15786 gènes dont l’expression varie significativement durant le développement de la graine (p-value <0,01). Une première structuration du jeu de données a été réalisée en annotant ces 15k gènes en fonction de leur domaine protéique (annotation utilisant The Gene Ontology Project, http://www.geneontology.org/index.shtml) (tableau 1.1). Un histogramme catégorisé reflétant les amplitudes de variations d'expression des gènes (figure 1.1) a révélé que, parmi les 15k gènes différentiellement exprimés, pour approximativement 75% d'entre eux (11795/15786) cette expression varie de plus de deux fois entre les différents stades du développement de la graine. Cette variation d'expression atteint même un facteur 500 pour

0 5 10 15 20 25 30 35 40 45 50 Ratio % de gènes 3990 7394 2185 1666 228 255 50 17 Figure 1.1 : Histogramme catégorisé reFlétant les amplitudes de niveaux d'expression des 15k  gènes au cours du développement de la graine. Les ratios d'expression sont indiqués en abscisse et 

le  pourcentage  de  gènes  concernés  en  ordonnée.  Le  chiffre  présent  au  dessus  des  histogrammes  correspond au nombre de gènes concernés par cette variation.  

67 gènes. Parmi ces derniers, 16 (16/67) correspondent à des gènes codant pour des protéines de maturation de la graine (plusieurs protéines de réserves et des protéines associées à la dessication de type Late Embryogenesis Abundant, les protéines LEA).

Un classement hiérarchique, sur la base des profils d’expression, des 15k gènes différentiellement exprimés a permis de mettre en évidence quatre groupes (Figure 1.2). Le premier groupe (cluster I) contient 5309 gènes qui présentent un maximum d’expression à 10 JAP, donc associés à des mécanismes d’embryogenèse. Le deuxième et le troisième groupe (cluster II et III) sont constitués de gènes qui sont liés aux mécanismes de remplissage du grain. Le cluster II comporte 2545 gènes préférentiellement exprimés à 16 JAP, ce groupe contient des gènes associés au début de la synthèse des ARNm des protéines de réserve : 14 JAP pour la synthèse des ARNm de vicilines et 16 JAP pour les légumines (Verdier et al. 2008). Le cluster III est composé de 2620 gènes qui présentent un pic d’expression à 20 et/ou 24 JAP, c’est à dire de manière concomitante au maximum d’expression des protéines de réserve (20 JAP pour les vicilines et 24 JAP pour les légumines K) (Verdier et al. 2008). Enfin, le cluster IV est composé de 5312 gènes dont le maximum d’expression se situe à 36 JAP, ce qui correspond à la phase de dessication.

3.3 Classification fonctionnelle des gènes différentiellement exprimés

Afin d’identifier les principaux processus moléculaires associés aux différents stades du développement de la graine, nous avons utilisé l’outil GeneBins (Goffard et al. 2006 et 2007) pour assigner à chaque transcrit une classe fonctionnelle selon l’ontologie KEGG (the Kyoto Encyclopedia of Genes and Genomes ontology). Environ 17,5% (2767/15786) des 15k gènes différentiellement exprimés ont pu être associés à une classe fonctionnelle (p-value <0,05 avec correction de Bonferroni). En accord avec les besoins en azote et carbone de la graine, on peut noter que les classes fonctionnelles les plus représentées sont le métabolisme des carbohydrates et celui des acides aminés. La répartition des gènes dans les classes fonctionnelles a été réalisée pour les différents clusters d’expression. La première conclusion est que selon le cluster d’expression et donc en fonction du stade de développement de la graine, la répartition des classes fonctionnelles varie fortement (Figure 1.3), traduisant des fonctions biologiques différentes aux stades étudiés.

L’ontologie KEGG est organisée en six différents modules dont quatre sont applicables aux plantes : les voies métaboliques (metabolic pathways), les mécanismes de traitement de l’information génétique (genetic information processing), les mécanismes de traitement de l’information environnementale (environmental information processing) et les mécanismes cellulaires (cellular processes) (Kanehisa et al. 2004).

Nous pouvons ainsi montrer que les différents modules sont préférentiellement associés avec des clusters spécifiques. En effet, nous constatons une grande abondance de transcrits associés aux différentes activités métaboliques pendant le remplissage du grain (cluster II et III). A l’opposé, au cours de l’embryogenèse (cluster I) et de la dessication (cluster IV), les transcrits sont plutôt associés aux mécanismes de traitement de l’information génétique. Enfin, les mécanismes de traitement de l’information environnementale ainsi que les

Cluster I: Embryogénèse tardive