• Aucun résultat trouvé

Les génomes des champignons associés aux plantes sont également marqués par des répertoires de gènes spécifiques relatifs aux modes de vie mutualistes ou parasitaires établis

avec leurs plantes hôtes. Les gènes codant des enzymes impliquées dans la dégradation des

composants de la paroi végétale comme les CAZymes, dans la transduction du signal, dans

le transport de nutriments ou encore les effecteurs sont essentiels pour le succès de la

colonisation de l’hôte, la nutrition et la reproduction. La composition en CAZymes d’un génome

fongique peut être un indicateur de son mode de vie. Les mutualistes ectomycorrhiziens ou

les biotrophes obligatoires comme les Pucciniales présentent des répertoires en CAZymes

réduits par rapport à des champignons nécrotrophes ou saprotrophes, indiquant une moindre

capacité à altérer la paroi végétale, ce qui permettrait d’éviter de déclencher une réponse

136

immunitaire pendant l’étape de colonisation de l’hôte (Duplessis et al., 2011a ; Martin et al.,

2008). On retrouve aussi un large répertoire de gènes codant des protéines prédites comme

sécrétées (sécrétome), dont une partie est de petite taille (inférieure à 300 acides aminés). Au

sein du sécrétome on peut distinguer des protéines présentant une homologie de fonction

dans les bases de données comme des CAZymes, des lipases ou encore des protéases mais

aussi des protéines de fonction inconnue qui représentent le répertoire d’effecteurs candidats

ayant potentiellement un rôle dans le processus infectieux (Lowe & Howlett, 2012; Raffaele &

Kamoun, 2012; Spanu & Panstruga, 2012). Ces génomes sont souvent marqués par une

prépondérance d’éléments transposables ainsi parfois qu’un large nombre de familles

multigéniques (Castanera et al., 2016; Raffaele & Kamoun, 2012). L’association entre les

gènes codant des familles d’effecteurs candidats et des régions riches en éléments

transposables a été décrite dans les génomes de différents pathogènes filamenteux (par

exemple L. maculans et P. infestans) suggérant que l’activité des transposons pourrait jouer

un rôle central dans la diversification des répertoires d’effecteurs chez les pathogènes (Haas

et al., 2009; Rouxel et al., 2011). En effet, les effecteurs de ces régions riches en éléments

transposables peuvent présenter un polymorphisme élevé suggérant une adaptation au

système immunitaire de l’hôte (Raffaele & Kamoun, 2012). Des résultats ont conduit à émettre

l’hypothèse de l’existence de génomes à deux vitesses chez les pathogènes (Dong et al.,

2015).

Les génomes de la rouille du peuplier M. larici-populina et de la rouille du blé Puccinia

striiformis f. sp. tritici furent les premiers génomes de Pucciniales séquencés en 2011 dans le

cadre de consortia de recherche internationaux et en collaboration avec le JGI (pour la rouille

du peuplier) et le Broad Institute of MIT and Harvard (pour la rouille noire du blé) (Duplessis et

al., 2011a ; McDowell, 2011). L’organisation et la composition similaires de ces deux génomes

ont mis en évidence les particularités des génomes des Pucciniales en comparaison avec

d’autres champignons pathogènes parmi les Ascomycètes et d’autres Basidiomycètes. En

effet, les Pucciniales présentent un génome de grande taille (101Mb pour M. larici-populina),

comprenant un grand nombre d’éléments transposables (45% pour M. larici-populina) et un

nombre important de gènes (16 399 pour M. larici-populina). La comparaison avec d’autres

parasites biotrophes indiquent le partage de certaines de ces caractéristiques avec des

différences notables, par exemple B. graminis présente un génome de très grande taille et un

nombre conséquent d’éléments transposables avec un nombre de gènes limité, alors que

U. maydis présente un génome de petite taille, pauvre en gènes et en éléments transposables

(Duplessis et al., 2014). Ces données indiquent différentes trajectoires évolutives chez ces

champignons pathogènes des plantes. Depuis, plusieurs génomes de Pucciniales ont été

séquencés, notamment les espèces appartenant aux familles des Pucciniaceae (4 espèces),

137

des Melampsoraceae (2 espèces), et les quatres espèces Austropuccinia psidii, Hemileia

vastatrix, Phakopsora pachyrhizi et Uromyces fabae (Tableau 1). La qualité de ces génomes

varie grandement en fonction de la stratégie de séquençage retenue (Aime et al., 2017). En

effet, la grande taille et la composition de ces génomes rend difficile leur assemblage et la

qualité des annotations en gènes.

Tableau 1 : Ressources génomique des Pucciniales

Espèce Taille du génome Elements transposables et répétés (%) Nombre de gènes Référence Melampsora larici-populina 101,1 Mb 45% 16 399 Duplessis et al. 2011

Melampsora lini 220 Mb 45,9% 16 271 Nemri et al. 2014

Puccinia graminis f. sp. tritici 88,6-92 Mb 43,7% 17773 - 21 874 Duplessis et al. 2011 ; Upadhyaya et al.2015 Puccinia triticina 100.6-135.3 Mb 37,5 - 50,9% 26 384 – 27 678

Kiran et al. 2016 ; Cuomo et al. 2017 Puccinia striiformis f. sp. tritici 53-117,3 Mb 17,8 – 48,9% 18 362 – 25 288

Cantu et al. 2011 ; Cantu et al. 2013 ; Zheng et al. 2013 ; Cuomo et al. 2017 ; Kiran et al. 2017 ;

Puccinia sorghi 102 Mb 33% 21087 Rochi et al. 2016

Uromyces fabae 330-379 Mb

n.a. n.a. Link et al. 2014

Hemileia vastatrix 333 Mb 74.4% 14 445 Cristancho et al. 2014

Austropuccinia psidii 103-145 Mb 27% > 19 000 Tan et al. 2014 Phakopsora pachyrhizi 850 Mb - 1 Gb

n.a. n.a. Loehrer et al. 2014

Taille estimée; n.a Donnée non renseignée

En 2014, dans le cadre de la thèse de Michaël Pernaci (UMR 1136 IAM), une carte génétique

de M. larici-populina a été obtenue dans le but de cartographier certains des traits de vie lié à

138

la virulence et à l’agressivité du champignon (Pernaci, 2014). Pour ce faire, une population de

95 descendants issue de l'autofécondation de l’isolat de référence 98AG31 de M.

larici-populina a été générée. Les génomes de ces 95 descendants ont ensuite été séquencés par

Illumina, avec une profondeur de séquençage moyenne d’environ 6,9X. Ce résultat entre dans

le cadre d’un projet Community Science Programme en partenariat avec le JGI. Les données

de séquençage obtenues par la technologie Sanger pour le génome de M. larici-populina

(Duplessis et al., 2011a) ont été réassemblées avec des logiciels plus récents et plus

performants. Il a alors été procédé à l’ancrage des scaffolds obtenus sur la carte génétique

composée de 18 groupes de liaison (LGs) (Pernaci, 2014). La version 2 du génome de M.

larici-populina est actuellement disponible dans la base de données génomiques Mycocosm

du JGI (https://genome.jgi.doe.gov/programs/fungi/index.jsf). Dans cette nouvelle version, le

génome de M. larici-populina comprend donc 18 chromosomes (LGs) pour une taille de près

de 110Mb contre 101Mb dans sa première version. Il contient aussi 488 scaffolds de petite

taille issus de l’assemblage qui n’ont pas pu être intégrés dans les LGs. En effet, on retrouve

près de 5.8% de trous dans le génome et la phase des haplotypes n’est pas résolue (Tableau

2). Il est à noter que si on ne connaît pas le nombre attendu de chromosomes chez M.

larici-populina, des travaux de génétique indiquent que 18 chromosomes seraient présents dans le

génome haploïde de l’espère voisine M. lini (Boehm & Bushnell, 1992). Ceci laisserait

supposer que le nombre fini de chromosomes a bien été atteint avec 18 LGs. Il est à noter

qu’une carte génétique par RAD-Seq produite récemment chez M. lini n’a permis de résoudre

que 27 LGs (Anderson et al., 2016). L’annotation automatique du génome de M. larici-populina

a été réalisée en utilisant les ESTs de la version 1 du génome ainsi que les données de

RNAseq obtenues sur mélèze issues de l’article n°3 du Chapitre II. L’apport des données

d’expression chez l’hôte alternant a permis d’étendre le catalogue de gènes prédits à 19 550

modèles de gènes. Dans le cadre de ma thèse, j’ai contribué à l’effort d’analyse de cette

nouvelle version du génome en vue de sa publication en 2018. Sur la base des données mises

à disposition par le JGI, je me suis attachée à réaliser l’annotation des éléments transposables

ainsi que de certaines familles de gènes (dont les CAZYmes, protéases et transporteurs), et

notamment du sécrétome dans la version 2.0 du génome de M. larici-populina. J’ai aussi

procédé à l’analyse comparative des familles multigéniques chez les Pucciniales et chez

d’autres champignons interagissant avec les plantes. Ce travail a été réalisé avec l’appui

d’Emmanuelle Morin (IE Bioinformatique de l’UMR 1136 IAM). Les résultats issus de ces

analyses sont détaillés dans la première partie de ce chapitre.

139

Tableau 2: Statistiques de réassemblage de la version 2.0 du génome de Melampsora larici-populina (Mlp) 98AG31 genome versus la version 1

Métrique Mlp version 1* Mlp version 2