réticulum endoplasmique (Figure 17). Grâce à l’annotation des familles multigéniques de
M. allii-populina décrite précédemment, nous avons pu mettre en évidence 448 familles de SP
de plus de deux membres. Ainsi le sécrétome final de M. allii-populina comprend 2177 SP
dont 57% font partie de familles de SP de plus de deux membres, 20% font partie de familles
multigéniques de trois membres au moins et 23% sont des singletons (Figure 17). Parmi ces
163
2177 SP, 61,1% (1337) sont des gènes codant des SSP de moins de 300 acides aminés.
L’outil de prédiction EffectorP a permis de mettre en évidence 826 effecteurs candidats
rassemblant des caractéristiques typiques des effecteurs fongiques. Le sécrétome de M.
allii-populina contient également 1500 SP prédites comme non-apoplastiques et 674 sont prédites
comme résidente de l’apoplaste. Nous avons également utilisé l’outil LOCALIZER sur le
sécrétome de M. allii-populina et prédit 313 SP ciblant les chloroplastes, 177 les mitochondries
et 411 les noyaux des cellules végétales.
Figure 17 : Prédiction et analyse du sécrètome de M. allii-populina
Le sécrètome de M. allii-populina
a été prédit en utilisant les trois outils de prédiction de peptide signal suivants : TargetP1.1 (T) ; SignalP4.1 (S) et Phobius (P). Une protéine donnée a été considérée comme prédite sécrétée « Secreted Protein » (SP) si au moins deux sur trois prédictions indiquent la présence d’un peptide signal. La présence dans la séquence protéique de chaque protéine de M. allii-populina de domaines transmembranaires et de motifs de rétention dans le réticulum endoplasmique est prédite par les outils de prédiction TMHMM et PS-scan, respectivement. Les SP protéines avec plus d’un domaine transmembranaire prédit ou avec un domaine transmembranaire prédit en dehors des 60 premiers acides aminés ne sont pas considérées comme sécrétées. De même les protéines contenant un motif de rétention dans le réticulum endoplasmique prédit sont éliminées du sécrètome. Les familles multigéniques déterminées par analyse MCL qui contiennent au moins la moitié des membres prédits comme sécrétés sont considérées comme des familles multigéniques de protéines sécrétées (Familles de SP). Parmi ces familles, les protéines non prédites comme sécrétées par au moins deux des trois outils de prédiction des protéines sécrétées mais montrant une structure introns/exons similaire aux autres
164
membres sécrétés de la
Figure 17 : Prédiction et analyse du sécrètome de M. allii-populina
famille, sont ajoutées au sécrètome de M. allii-populina. Les petites protéines sécrétées de moins de 300 acides aminés sont identifiées comme SSP (« small secreted proteins »). Enfin les effecteurs candidats de M. allii-populina sont prédits parmi le sécrètome avec l’outil de prédiction EffectorP et leur localisation intracellulaire in planta est prédite par les deux outils ApoplastP et LOCALIZER.
Dans le répertoire de 2177 protéines sécrétées de M. allii-populina, 232 SP (10,7%) sont
spécifiques de l’espèce, 391 SP (18,0%) sont spécifiques des deux rouilles du peuplier, 480
SP (22,0%) sont spécifiques des Melampsoraceae et 383 SP (17,6%) sont spécifiques des
Pucciniales. Au total, 1486 SP de M. allii-populina sont partagées parmi les Pucciniales. Parmi
les protéines sécrétées de M. allii-populina, nous avons recherché les homologues des
effecteurs caractérisés chez les autres Pucciniales. On retrouve des homologues des
effecteurs connus de M. lini : 8 SP homologues de l’effecteur AvrL567, 5 SP (et 3 protéines
non sécrétées) homologues de AvrM, 4 de AvrP4 et 1 de AvrP123 et 3 SP homologues de
RTP1. Le sécrétome de M. allii-populina est composé à 66,5% (1448 SP) de protéines sans
fonctions et sans domaine connus. Parmi les 33,5% (729 SP) avec une fonction prédite par
les bases de données GO, KOG, IPR ou annotées spécifiquement, on trouve spécifiquement
9,2% (201 SP) de CAZymes % (53 SP) de prtoéases et 3 SP transporteurs. Les fonctions
prédites sur la base de données KOG présentent 1738 SP sans fonction KOG et 546 SP avec
des fonctions prédites (Figure 18). On retrouve notamment, 3 catégories avec plus de 50
gènes avec des 82 protéines impliquées dans le métabolisme et le transport carboné
(catégorie KOG Carbohydrate transport and metabolism, en agnlais) ; 74 attribuées aux
modifications post-traductionnelles, renouvellement des protéines et chaperonnes (catégorie
KOG Posttranslational modification, protein turnover, chaperones en anglais) et 57 SP sont
catégorisées dans les « Fonctions générales » (catégorie KOG General function prediction
only en anglais). Les catégories Lipid transport and metabolism (22 SP), Transcription (24 SP),
Inorganic ion transport and metabolism (27 SP), Extracellular structures (28 SP), Nuclear
structure 29 SP), et Signal transduction mechanisms (37 SP) représentent chacune plus de
1% du sécrétome de M. allii-populina. Enfin, comme pour M. larici-populina on retrouve 16
protéines portant un domaine CFEM dont 11 sont sécrétées. Ces résultats montrent les
caractéristiques du sécrétome de M. allii-populina.
165
Figure 18 : Catégories KOG annotées dans le sécrétome de M. allii-populina
Les axes des abscisses et des ordonnées indiquent respectivement le nombre de protéines sécrétées (SP) et chaque catégorie KOG. *Les SP sans fonction KOG ne sont pas affichées sur ce graphique et représentent 1609 SP.
Avec un génome trois fois plus grand que celui de M. larici-populina, l’hypothèse d’une
association entre régions riches en TE et en gènes SP/SSP pourrait être envisagée. Nous
avons ainsi cartographié les régions intergéniques du génome et du sécrétome afin de la
tester. Contrairement à ce qui a été décrit chez l’oomycète P. infestans, et de manière similaire
à M. larici-populina, le sécrétome de M. allii-populina présente un profil similaire à celui du
génome entier et se superpose principalement aux régions denses en gènes (Figure 19).
Toutefois, la représentation des gènes de M. allii-populina en fonction de leur distance
intergénique sur la Figure 13 présente un profil très particulier avec un groupe principal en bas
à gauche du graphique (faible distance en 5’ et 3’ entre gènes adjacents) et trois autres
groupes avec des distances distinguables (et similaires entre l’ensemble des gènes et ceux
du sécrétome). Il serait particulièrement intéressant de regarder la distribution des catégories
de gènes, et de TE, ainsi que de familles multigéniques appartenant à ces groupes et
déterminer ainsi si la grande plasticité génomique générée par l’invasion en TE a pu avoir une
influence sur des familles de gènes au cours de l’évolution. Il est possible que les groupes en
haut à gauche et en bas à droite soient des artefacts créés par l’assemblage encore très
incomplet du génome.
166
Figure 19 : Environnement génique des génome et sécrètome de M. allii-populina.
Les axes des abscisses et des ordonnées indiquent respectivement régions intergéniques 5’ et 3’ du génome de M. allii-populina. Les gènes de M. allii-populina ont été triés selon des « fenêtres » à deux dimensions sur la base de la distance avec les régions intergéniques environnantes en 5’ et 3’. A. « Heatmap » représentant la distribution des distances intergéniques en 5’ et 3’ pour tous les gènes de
M. allii-populina. B. pour le sécrètome de M. allii-populina. Les échelles représentent le nombre de gènes par « fenêtre ».