avec leurs plantes hôtes. Les gènes codant des enzymes impliquées dans la dégradation des
composants de la paroi végétale comme les CAZymes, dans la transduction du signal, dans
le transport de nutriments ou encore les effecteurs sont essentiels pour le succès de la
colonisation de l’hôte, la nutrition et la reproduction. La composition en CAZymes d’un génome
fongique peut être un indicateur de son mode de vie. Les mutualistes ectomycorrhiziens ou
les biotrophes obligatoires comme les Pucciniales présentent des répertoires en CAZymes
réduits par rapport à des champignons nécrotrophes ou saprotrophes, indiquant une moindre
capacité à altérer la paroi végétale, ce qui permettrait d’éviter de déclencher une réponse
136
immunitaire pendant l’étape de colonisation de l’hôte (Duplessis et al., 2011a ; Martin et al.,
2008). On retrouve aussi un large répertoire de gènes codant des protéines prédites comme
sécrétées (sécrétome), dont une partie est de petite taille (inférieure à 300 acides aminés). Au
sein du sécrétome on peut distinguer des protéines présentant une homologie de fonction
dans les bases de données comme des CAZymes, des lipases ou encore des protéases mais
aussi des protéines de fonction inconnue qui représentent le répertoire d’effecteurs candidats
ayant potentiellement un rôle dans le processus infectieux (Lowe & Howlett, 2012; Raffaele &
Kamoun, 2012; Spanu & Panstruga, 2012). Ces génomes sont souvent marqués par une
prépondérance d’éléments transposables ainsi parfois qu’un large nombre de familles
multigéniques (Castanera et al., 2016; Raffaele & Kamoun, 2012). L’association entre les
gènes codant des familles d’effecteurs candidats et des régions riches en éléments
transposables a été décrite dans les génomes de différents pathogènes filamenteux (par
exemple L. maculans et P. infestans) suggérant que l’activité des transposons pourrait jouer
un rôle central dans la diversification des répertoires d’effecteurs chez les pathogènes (Haas
et al., 2009; Rouxel et al., 2011). En effet, les effecteurs de ces régions riches en éléments
transposables peuvent présenter un polymorphisme élevé suggérant une adaptation au
système immunitaire de l’hôte (Raffaele & Kamoun, 2012). Des résultats ont conduit à émettre
l’hypothèse de l’existence de génomes à deux vitesses chez les pathogènes (Dong et al.,
2015).
Les génomes de la rouille du peuplier M. larici-populina et de la rouille du blé Puccinia
striiformis f. sp. tritici furent les premiers génomes de Pucciniales séquencés en 2011 dans le
cadre de consortia de recherche internationaux et en collaboration avec le JGI (pour la rouille
du peuplier) et le Broad Institute of MIT and Harvard (pour la rouille noire du blé) (Duplessis et
al., 2011a ; McDowell, 2011). L’organisation et la composition similaires de ces deux génomes
ont mis en évidence les particularités des génomes des Pucciniales en comparaison avec
d’autres champignons pathogènes parmi les Ascomycètes et d’autres Basidiomycètes. En
effet, les Pucciniales présentent un génome de grande taille (101Mb pour M. larici-populina),
comprenant un grand nombre d’éléments transposables (45% pour M. larici-populina) et un
nombre important de gènes (16 399 pour M. larici-populina). La comparaison avec d’autres
parasites biotrophes indiquent le partage de certaines de ces caractéristiques avec des
différences notables, par exemple B. graminis présente un génome de très grande taille et un
nombre conséquent d’éléments transposables avec un nombre de gènes limité, alors que
U. maydis présente un génome de petite taille, pauvre en gènes et en éléments transposables
(Duplessis et al., 2014). Ces données indiquent différentes trajectoires évolutives chez ces
champignons pathogènes des plantes. Depuis, plusieurs génomes de Pucciniales ont été
séquencés, notamment les espèces appartenant aux familles des Pucciniaceae (4 espèces),
137
des Melampsoraceae (2 espèces), et les quatres espèces Austropuccinia psidii, Hemileia
vastatrix, Phakopsora pachyrhizi et Uromyces fabae (Tableau 1). La qualité de ces génomes
varie grandement en fonction de la stratégie de séquençage retenue (Aime et al., 2017). En
effet, la grande taille et la composition de ces génomes rend difficile leur assemblage et la
qualité des annotations en gènes.
Tableau 1 : Ressources génomique des Pucciniales
Espèce Taille du génome Elements transposables et répétés (%) Nombre de gènes Référence Melampsora larici-populina 101,1 Mb 45% 16 399 Duplessis et al. 2011
Melampsora lini 220 Mb† 45,9% 16 271 Nemri et al. 2014
Puccinia graminis f. sp. tritici 88,6-92 Mb 43,7% 17773 - 21 874 Duplessis et al. 2011 ; Upadhyaya et al.2015 Puccinia triticina 100.6-135.3 Mb 37,5 - 50,9% 26 384 – 27 678
Kiran et al. 2016 ; Cuomo et al. 2017 Puccinia striiformis f. sp. tritici 53-117,3 Mb† 17,8 – 48,9% 18 362 – 25 288
Cantu et al. 2011 ; Cantu et al. 2013 ; Zheng et al. 2013 ; Cuomo et al. 2017 ; Kiran et al. 2017 ;
Puccinia sorghi 102 Mb† 33% 21087 Rochi et al. 2016
Uromyces fabae 330-379 Mb†
n.a. n.a. Link et al. 2014
Hemileia vastatrix 333 Mb 74.4% 14 445 Cristancho et al. 2014
Austropuccinia psidii 103-145 Mb† 27% > 19 000 Tan et al. 2014 Phakopsora pachyrhizi 850 Mb - 1 Gb†
n.a. n.a. Loehrer et al. 2014
† Taille estimée; n.a Donnée non renseignée
En 2014, dans le cadre de la thèse de Michaël Pernaci (UMR 1136 IAM), une carte génétique
de M. larici-populina a été obtenue dans le but de cartographier certains des traits de vie lié à
138
la virulence et à l’agressivité du champignon (Pernaci, 2014). Pour ce faire, une population de
95 descendants issue de l'autofécondation de l’isolat de référence 98AG31 de M.
larici-populina a été générée. Les génomes de ces 95 descendants ont ensuite été séquencés par
Illumina, avec une profondeur de séquençage moyenne d’environ 6,9X. Ce résultat entre dans
le cadre d’un projet Community Science Programme en partenariat avec le JGI. Les données
de séquençage obtenues par la technologie Sanger pour le génome de M. larici-populina
(Duplessis et al., 2011a) ont été réassemblées avec des logiciels plus récents et plus
performants. Il a alors été procédé à l’ancrage des scaffolds obtenus sur la carte génétique
composée de 18 groupes de liaison (LGs) (Pernaci, 2014). La version 2 du génome de M.
larici-populina est actuellement disponible dans la base de données génomiques Mycocosm
du JGI (https://genome.jgi.doe.gov/programs/fungi/index.jsf). Dans cette nouvelle version, le
génome de M. larici-populina comprend donc 18 chromosomes (LGs) pour une taille de près
de 110Mb contre 101Mb dans sa première version. Il contient aussi 488 scaffolds de petite
taille issus de l’assemblage qui n’ont pas pu être intégrés dans les LGs. En effet, on retrouve
près de 5.8% de trous dans le génome et la phase des haplotypes n’est pas résolue (Tableau
2). Il est à noter que si on ne connaît pas le nombre attendu de chromosomes chez M.
larici-populina, des travaux de génétique indiquent que 18 chromosomes seraient présents dans le
génome haploïde de l’espère voisine M. lini (Boehm & Bushnell, 1992). Ceci laisserait
supposer que le nombre fini de chromosomes a bien été atteint avec 18 LGs. Il est à noter
qu’une carte génétique par RAD-Seq produite récemment chez M. lini n’a permis de résoudre
que 27 LGs (Anderson et al., 2016). L’annotation automatique du génome de M. larici-populina
a été réalisée en utilisant les ESTs de la version 1 du génome ainsi que les données de
RNAseq obtenues sur mélèze issues de l’article n°3 du Chapitre II. L’apport des données
d’expression chez l’hôte alternant a permis d’étendre le catalogue de gènes prédits à 19 550
modèles de gènes. Dans le cadre de ma thèse, j’ai contribué à l’effort d’analyse de cette
nouvelle version du génome en vue de sa publication en 2018. Sur la base des données mises
à disposition par le JGI, je me suis attachée à réaliser l’annotation des éléments transposables
ainsi que de certaines familles de gènes (dont les CAZYmes, protéases et transporteurs), et
notamment du sécrétome dans la version 2.0 du génome de M. larici-populina. J’ai aussi
procédé à l’analyse comparative des familles multigéniques chez les Pucciniales et chez
d’autres champignons interagissant avec les plantes. Ce travail a été réalisé avec l’appui
d’Emmanuelle Morin (IE Bioinformatique de l’UMR 1136 IAM). Les résultats issus de ces
analyses sont détaillés dans la première partie de ce chapitre.
139
Tableau 2: Statistiques de réassemblage de la version 2.0 du génome de Melampsora larici-populina (Mlp) 98AG31 genome versus la version 1