• Aucun résultat trouvé

Les outils de prédiction utilisés ont mis en évidence 2402 protéines possédant un peptide signal dont 2118 ne contiennent ni domaine transmembranaire, ni motif de rétention dans le

réticulum endoplasmique (Figure 17). Grâce à l’annotation des familles multigéniques de

M. allii-populina décrite précédemment, nous avons pu mettre en évidence 448 familles de SP

de plus de deux membres. Ainsi le sécrétome final de M. allii-populina comprend 2177 SP

dont 57% font partie de familles de SP de plus de deux membres, 20% font partie de familles

multigéniques de trois membres au moins et 23% sont des singletons (Figure 17). Parmi ces

163

2177 SP, 61,1% (1337) sont des gènes codant des SSP de moins de 300 acides aminés.

L’outil de prédiction EffectorP a permis de mettre en évidence 826 effecteurs candidats

rassemblant des caractéristiques typiques des effecteurs fongiques. Le sécrétome de M.

allii-populina contient également 1500 SP prédites comme non-apoplastiques et 674 sont prédites

comme résidente de l’apoplaste. Nous avons également utilisé l’outil LOCALIZER sur le

sécrétome de M. allii-populina et prédit 313 SP ciblant les chloroplastes, 177 les mitochondries

et 411 les noyaux des cellules végétales.

Figure 17 : Prédiction et analyse du sécrètome de M. allii-populina

Le sécrètome de M. allii-populina

a été prédit en utilisant les trois outils de prédiction de peptide signal suivants : TargetP1.1 (T) ; SignalP4.1 (S) et Phobius (P). Une protéine donnée a été considérée comme prédite sécrétée « Secreted Protein » (SP) si au moins deux sur trois prédictions indiquent la présence d’un peptide signal. La présence dans la séquence protéique de chaque protéine de M. allii-populina de domaines transmembranaires et de motifs de rétention dans le réticulum endoplasmique est prédite par les outils de prédiction TMHMM et PS-scan, respectivement. Les SP protéines avec plus d’un domaine transmembranaire prédit ou avec un domaine transmembranaire prédit en dehors des 60 premiers acides aminés ne sont pas considérées comme sécrétées. De même les protéines contenant un motif de rétention dans le réticulum endoplasmique prédit sont éliminées du sécrètome. Les familles multigéniques déterminées par analyse MCL qui contiennent au moins la moitié des membres prédits comme sécrétés sont considérées comme des familles multigéniques de protéines sécrétées (Familles de SP). Parmi ces familles, les protéines non prédites comme sécrétées par au moins deux des trois outils de prédiction des protéines sécrétées mais montrant une structure introns/exons similaire aux autres

164

membres sécrétés de la

Figure 17 : Prédiction et analyse du sécrètome de M. allii-populina

famille, sont ajoutées au sécrètome de M. allii-populina. Les petites protéines sécrétées de moins de 300 acides aminés sont identifiées comme SSP (« small secreted proteins »). Enfin les effecteurs candidats de M. allii-populina sont prédits parmi le sécrètome avec l’outil de prédiction EffectorP et leur localisation intracellulaire in planta est prédite par les deux outils ApoplastP et LOCALIZER.

Dans le répertoire de 2177 protéines sécrétées de M. allii-populina, 232 SP (10,7%) sont

spécifiques de l’espèce, 391 SP (18,0%) sont spécifiques des deux rouilles du peuplier, 480

SP (22,0%) sont spécifiques des Melampsoraceae et 383 SP (17,6%) sont spécifiques des

Pucciniales. Au total, 1486 SP de M. allii-populina sont partagées parmi les Pucciniales. Parmi

les protéines sécrétées de M. allii-populina, nous avons recherché les homologues des

effecteurs caractérisés chez les autres Pucciniales. On retrouve des homologues des

effecteurs connus de M. lini : 8 SP homologues de l’effecteur AvrL567, 5 SP (et 3 protéines

non sécrétées) homologues de AvrM, 4 de AvrP4 et 1 de AvrP123 et 3 SP homologues de

RTP1. Le sécrétome de M. allii-populina est composé à 66,5% (1448 SP) de protéines sans

fonctions et sans domaine connus. Parmi les 33,5% (729 SP) avec une fonction prédite par

les bases de données GO, KOG, IPR ou annotées spécifiquement, on trouve spécifiquement

9,2% (201 SP) de CAZymes % (53 SP) de prtoéases et 3 SP transporteurs. Les fonctions

prédites sur la base de données KOG présentent 1738 SP sans fonction KOG et 546 SP avec

des fonctions prédites (Figure 18). On retrouve notamment, 3 catégories avec plus de 50

gènes avec des 82 protéines impliquées dans le métabolisme et le transport carboné

(catégorie KOG Carbohydrate transport and metabolism, en agnlais) ; 74 attribuées aux

modifications post-traductionnelles, renouvellement des protéines et chaperonnes (catégorie

KOG Posttranslational modification, protein turnover, chaperones en anglais) et 57 SP sont

catégorisées dans les « Fonctions générales » (catégorie KOG General function prediction

only en anglais). Les catégories Lipid transport and metabolism (22 SP), Transcription (24 SP),

Inorganic ion transport and metabolism (27 SP), Extracellular structures (28 SP), Nuclear

structure 29 SP), et Signal transduction mechanisms (37 SP) représentent chacune plus de

1% du sécrétome de M. allii-populina. Enfin, comme pour M. larici-populina on retrouve 16

protéines portant un domaine CFEM dont 11 sont sécrétées. Ces résultats montrent les

caractéristiques du sécrétome de M. allii-populina.

165

Figure 18 : Catégories KOG annotées dans le sécrétome de M. allii-populina

Les axes des abscisses et des ordonnées indiquent respectivement le nombre de protéines sécrétées (SP) et chaque catégorie KOG. *Les SP sans fonction KOG ne sont pas affichées sur ce graphique et représentent 1609 SP.

Avec un génome trois fois plus grand que celui de M. larici-populina, l’hypothèse d’une

association entre régions riches en TE et en gènes SP/SSP pourrait être envisagée. Nous

avons ainsi cartographié les régions intergéniques du génome et du sécrétome afin de la

tester. Contrairement à ce qui a été décrit chez l’oomycète P. infestans, et de manière similaire

à M. larici-populina, le sécrétome de M. allii-populina présente un profil similaire à celui du

génome entier et se superpose principalement aux régions denses en gènes (Figure 19).

Toutefois, la représentation des gènes de M. allii-populina en fonction de leur distance

intergénique sur la Figure 13 présente un profil très particulier avec un groupe principal en bas

à gauche du graphique (faible distance en 5’ et 3’ entre gènes adjacents) et trois autres

groupes avec des distances distinguables (et similaires entre l’ensemble des gènes et ceux

du sécrétome). Il serait particulièrement intéressant de regarder la distribution des catégories

de gènes, et de TE, ainsi que de familles multigéniques appartenant à ces groupes et

déterminer ainsi si la grande plasticité génomique générée par l’invasion en TE a pu avoir une

influence sur des familles de gènes au cours de l’évolution. Il est possible que les groupes en

haut à gauche et en bas à droite soient des artefacts créés par l’assemblage encore très

incomplet du génome.

166

Figure 19 : Environnement génique des génome et sécrètome de M. allii-populina.

Les axes des abscisses et des ordonnées indiquent respectivement régions intergéniques 5’ et 3’ du génome de M. allii-populina. Les gènes de M. allii-populina ont été triés selon des « fenêtres » à deux dimensions sur la base de la distance avec les régions intergéniques environnantes en 5’ et 3’. A. « Heatmap » représentant la distribution des distances intergéniques en 5’ et 3’ pour tous les gènes de

M. allii-populina. B. pour le sécrètome de M. allii-populina. Les échelles représentent le nombre de gènes par « fenêtre ».

Cette première analyse du sécrétome de M. allii-populina permet de mettre à jour le sécrétome

de M. allii-populina, qui montre les caractéristiques communes des sécrétomes des

Pucciniales comme par exemple une majorité de SP de fonction inconnue. Il est à noté que

10,7% des SP sont spécifiques à l’espèce. Ce répertoire contient potentiellement des

effecteurs impliqués dans les infections des hôtes écidiens (Allium spp.) de M. allii-populina.

4. Annotation des familles de gènes codant des CAZymes, des protéases et des

transporteurs

Au total, 432 CAZymes ont été annotées dans le génome de M. allii-populina (Table S6 ; 11

CMB ; 49 CE ; 207 GH ; 16 PL ; 89 GT and 21 Expansines). Un ensemble de 207 GH est mis

à jour, ce qui est comparable au nombre rapporté chez M. larici-populina. Une expansion plus

ou moins modérée est observée pour certaines familles de GH impliquées dans la dégradation

de la paroi végétale par clivage de la cellulose et hémicellulose dans ce génome (GH5 ; GH7,

GH10, GH12, GH26, GH27 et GH47; Table S6). M. allii-populina contient un répertoire

restreint de PL (16) et CBM (11) également impliquées dans la dégradation de la paroi

végétale. Enfin, 21 protéines apparentées aux expansines végétales (Table S6 ; Cosgrove,

2000). Les profils en CAZymes des deux rouilles du peuplier ne présentent que quelques

différences en termes de nombre de gènes, qui pourraient refléter une spécificité vis à vis des

167

hôtes alternants infectés par ces deux champignons. Sept CAZymes identifiées chez M.

allii-populina ne sont pas retrouvées chez M. larici-populina (4 Carbohydrate-Binding Module

Family 48; 1 Carbohydrate-Binding Module Family 13; 1 Glycoside Hydrolase Family 1; 1

Glycoside Hydrolase Family 13 /Glycoside Hydrolase Family 133). Trois GH sont présentes

en nombre plus important chez M. allii-populina (7 GH2 ; 7 GH15 ; 6 GH92 contre 4 GH2 ; 3

GH15 et 2 GH92 chez M. larici-populina) et 1 famille de PL semble en expansion chez M.

allii-populina (8 contre 1 chez M. larici-populina).

Au total, 417 protéases ont été annotées dans le génome de M. allii-populina, soit 72 de plus

en comparaison aux 345 identifiées chez M. larici-populina. Il est intéressant de noter

qu’aucune famille de protéases n’est présente que chez M. allii-populina et non chez M.

larici-populina. Cependant quelques différences sont observables dans le nombre de membre de

certaines familles. La différence la plus marquée se fait chez les inhibiteurs de protéases dont

ont en retrouve 125 chez M. allii-populina contre 98 chez M. larici-populina (par exemple : 9

Alpha-1-peptidase inhibitor chez M. allii-populina contre 4 chez M. larici-populina ; 27

inhibiteurs protéases I39 contre 22, respectivement). On observe le même schéma dans les

autres familles, très peu semblent en expansion chez M. allii-populina et non chez M.

larici-populina comme par exemple : les peptidases N10 (respectivement 7 contre 1), les peptidases