• Aucun résultat trouvé

Chapitre 5 - Synthèse et conclusion générale

2. Vers l'identification des déterminants génétiques

2.1. Identification de gènes candidats par la génomique comparative

Le chapitre 2 s'est concentré sur la recherche de gènes candidats d'avirulence, par une approche

d'identification de polymorphismes non-synonymes au sein de gènes codant des protéines sécrétées,

considérées comme effecteurs candidats. Plusieurs types de polymorphismes ont été caractérisés

dans des gènes codant des effecteurs pour leurs effets sur la virulence d'agents pathogènes.

L’effecteur apoplastique Avr4 de Cladosporium fulvum, pathogène de la tomate, échappe à la

reconnaissance par la protéine de résistance Cf4 par des changements d'acides aminés (Joosten et

al., 1994). L'effecteur AvrL567 de M. lini échappe à la reconnaissance des récepteurs L5, L6 et L7

de Linum usitatissimum par une série de mutations non-synonymes (Dodds et al., 2006). De plus, la

famille d'effecteurs Avr3a présente dans plusieurs espèces de Phytophthora (dont P. infestans et P.

sojae), présente des mutations non-synonymes permettant à ces oomycètes d'échapper à la

reconnaissance par les différentes plantes hôtes (Boutemy et al., 2011; Yaeno et al., 2011).

Cependant, au-delà des mutations ponctuelles sur lesquelles j'ai concentré mon travail, plusieurs

autres mécanismes moléculaires peuvent expliquer l'émergence d'une virulence.

L'apparition de nouveaux gènes et de nouvelles fonctions par insertion est également un

mécanisme connu de virulence. Le transfert horizontal permet l’acquisition de nouveaux gènes issus

d'espèces phylogénétiquement proches ou non. Ce mécanisme a d'abord été décrit chez les

bactéries, principalement pour le transfert de gènes de résistance aux antibiotiques (Akiba et al.,

1960). Plus récemment, des transferts horizontaux ont été décrits chez des parasites des plantes et

cela représenterait une force évolutive non négligeable de ces espèces (Danchin et al., 2010; Soanes

and Richards, 2014). Différentes études ont permis de mettre à jour 46 transferts de gènes vers des

micro-organismes pathogènes des plantes, avec des gènes codant des protéines impliquées dans la

pathogénie soit codant pour des fonctions pathogènes putatives (Soanes and Richards, 2014). Par

exemple, le gène de la toxine ToxA a subi un transfert horizontal récent, d'un champignon pathogène

du blé, Stagonospora nodorum, à un autre, Pyrenophora tritici-repentis (Friesen et al., 2006). Cet

évènement unique est censé s'être produit juste avant 1941 et être responsable de l'émergence de

l'helminthosporiose du blé dans les années 1940.

Les délétions sont également connues pour promouvoir la virulence (Raffaele and Kamoun,

2012). Des délétions dans les régions génomiques portant les gènes d’avirulence AvrLm1 et AvrLm6

chez Leptosphaeria maculans ont rendu les lignées correspondantes virulentes sur les plants de

Brassica napus porteurs des gènes de résistance RLM1 et RLM6 (Fudal et al., 2009; Gout et al.,

2007). La grande concentration de rétrotransposons dans les régions riches en isochores AT,

lesquelles abritent des gènes codant des effecteurs chez L. maculans, peut avoir contribué à

l'augmentation de la fréquence des évènements de recombinaison, conduisant à des délétions. Le

gène AvrLm6 se situant en amont d'éléments transposables dégénérés et des mutations RIP

engendrant des codons stop prématurés ayant été détectés dans les allèles d'AvrLm6, il est envisagé

que la virulence engendrée par ce gène soit due à des délétions inactivant la reconnaissance du

produit du gène(Fudal et al., 2009; Van de Wouw et al., 2010). Différentes études ont démontré par

génétique les interactions gène-pour-gène dans le pathosystème L. maculans-B. napus où les gènes

d'avirulence fongique (AvrLm) sont la cible des gènes de résistance de la plante (Rlm) (Rouxel and

Balesdent, 2005). Si l'on appliqueles principes de la relation gène-pour-gène, on peut conclure que

l'absence des gènes d'avirulence, qui sont les cibles des gènes de résistance correspondants chez la

plante, empêche la mise en place de l'immunité spécifique de la plante et permet le succès de

l'infection. D'autres exemples de délétions favorisant la virulence sont connus, tels que la délétion

du gène d'avirulence Avr-Pita chez M. oryzae (Dai et al., 2010; Orbach et al., 2000) ou celle de

l'effecteur de type RXLR Avr4 de Phytophthora infestans (van Poppel et al., 2008). Dans le chapitre

2, la recherche des régions délétées (détectées parce qu'elles ne présentent aucune couverture) a

permis de mettre à jour des régions potentiellement impliquées dans le système d'appariement

(Persoons et al., 2014). Pour aller plus loin dans la détection des délétions il faudrait réaliser un

assemblage du génome de chacun des individus échantillonnés, permettant ainsi la détection des

régions absentes chez les individus virulents. En effet, notre approche est basée sur l'alignement de

toutes les séquences générées sur un génome de référence provenant d'un individu virulent 7, ce qui

fait que seules les régions présentes chez cet individu sont considérées. Cependant, séquencer à une

profondeur permettant un assemblage de qualité suffisante représenterait un coût conséquent.

L’acquisition d'un nouveau génome de référence avirulent 7 permettrait de détecter les insertions et

délétions potentiellement associées à l'émergence de la virulence. Au cours de ma thèse, j'ai

séquencé le génome de l'isolat 93GS3 qui est avirulent 7. Ce séquençage de novo a été réalisé avec

deux banques différentes de séquençage Illumina, une librairie paired-end générant des séquences

courtes à partir de fragments courts d'ADN (500 bases environ) et une librairie mate pair générant

séquences de taille similaire à partir de fragments d'ADN plus longs (> 5000 kilobases). Un premier

essai d'assemblage de novo a été réalisé à l'aide du programme SOAP de novo (Luo et al., 2012b),

en utilisant la librairie paired-end pour l'assemblage et la librairie mate pair pour le scaffolding

(utilisation des longues lectures pour joindre les régions assemblées entre elles). L'obtention d'un

premier assemblage de ce nouveau génome de référence de plus de 11 000 scaffolds nécessite d'être

améliorée en optimisant les paramètres d'assemblage de novo. De plus, le transcriptome de cet isolat

a été séquencé dans deux conditions distinctes (spores et lésions sporulantes 4 jours après

inoculation) par RNA sequencing. Cela permettra de valider l'expression des gènes une fois

l’assemblage finalisé, et de différencier les gènes exprimés de façon identique dans les deux

conditions testées de ceux exprimés uniquement dans les feuilles infectées et donc potentiellement

impliqués le processus infectieux. Ce nouveau génome de référence avirulent 7 permettra aussi

d'aligner les séquences Illumina des isolats avirulents 7 décrites dans le chapitre 2 sur celui-ci et

ainsi de détecter d'éventuels réarrangements chromosomiques, de larges insertions ou délétions, qui

pourraient être associés à la virulence 7 si cette dernière ne s'expliquait pas par des mutations de

type SNP.

2.2. Identification de gènes candidats par la génomique des populations

Le chapitre 4 traite de la recherche de gènes candidats impliqués dans le contournement de la

résistance 7, par une approche de scan génomique. Cette approche, contrairement à la précédente

(chapitre 2), peut être considérée comme naïve puisqu’elle ne s'intéresse pas aux fonctions des

gènes avant de les avoir identifiés. Ce type d'analyse est de plus en plus utilisé avec l'accès facilité

aux séquences (Shendure and Ji, 2008). Les méthodes de scan génomique permettent de s’intéresser

à de très nombreux phénomènes biologiques tels que la divergence entre populations (Beaumont

and Balding, 2004; Begun et al., 2007; Liti et al., 2009), leur histoire comme par exemple la

domestication (porc : Li et al., 2014, blé :Haudry et al., 2007, riz : Wang et al., 2014), l'adaptation

(Burke, 2012; Ellison et al., 2011; Namroud et al., 2008), l'invasion (Lombaert et al., 2014;

Stukenbrock et al., 2011), et dans notre cas, les balayages sélectifs (De Mita et al., 2007; Nielsen et

al., 2005; Pariset et al., 2009). Concernant les balayages sélectifs, il s’agit d'identifier les gènes sous

pression de sélection positive au sein des génomes, idéalement après avoir décrit l'histoire

démographique des isolats pour en éviter les effets confondants (Cadzow et al., 2014). Ce type

d'analyse a été réalisé avec succès sur de nombreuses espèces modèles. Par exemple, une étude de

génomique des populations basée sur des scans génomiques étudiant le déséquilibre de liaison, la

diversité nucléotidique et les fréquences des haplotypes entre populations humaines a permis de

mettre à jour des gènes sous sélection dans les différentes populations, tels que des gènes de

résistance à la malaria (Kimura et al., 2007). Une analyse approfondie de la structure

populationnelle de Saccharomyces cerevisiae et S. paradoxus à l'aide du séquençage d'une trentaine

individus par espèce (Liti et al., 2009) a permis l'identification et l'étude de gènes de réparation de

l'ADN impliqués dans la variation du taux de mutation des espèces, générant des souches avec un

taux de mutation très élevés (Demogines et al., 2008).

Dans notre cas, l’étude et la description des populations de M. larici-populina présentées au

chapitre 3 a permis d'identifier un scénario démographique et de l'utiliser pour trouver des gènes

sous sélection à l'aide d'un scan génomique. Mais ce type de méthode peut manquer de puissance

pour détecter les balayages sélectifs trop récents (où l'allèle favorable n'est pas allé jusqu'à la

fixation complète). La puissance (le taux de vrais positifs détectés) du D de Tajima, par exemple,

n’excède pas 0,5 et est même beaucoup plus faible si le goulot d'étranglement est faible ou trop

récent (Depaulis et al., 2003). C'est dans ce cadre que des méthodes plus sophistiquées sont

apparues, en particulier pour l'humain, avec pour objectif de détecter plus finement les balayages

sélectifs récents. Il existe plusieurs catégories de méthodes statistiques pour détecter les balayages

sélectifs, qui peuvent être basées sur différents types de signaux (Akey, 2009). Certaines sont basées

sur le spectre de fréquences alléliques, soit sur la base de statistiques comme le D de Tajima et ses

variants qui en font un résumé, ou sur la base d'une comparaison de la vraisemblance des données

(exploitant donc le jeu de données de manière plus complète) sous des modèles avec et sans

sélection (Kim and Stephan, 2002). D'autres méthodes exploitent l'extension du déséquilibre de

liaison en cas d'augmentation en fréquence récente d'un allèle, telles que l'homozygotie étendue des

haplotypes (EHH) qui est basée la longueur des haplotypes en forte fréquence (Sabeti et al., 2002).

Enfin, des méthodes utilisent le niveau de différenciation génétique entre populations pour

déterminer des régions qui présentent un excès, ou un déficit de différenciation (Bazin et al., 2010;

Beaumont and Balding, 2004). Ces régions peuvent être le signe d'adaptation locale à des

conditions variables entre populations, ou d'un balayage n'ayant eu lieu que dans une seule des

populations. Certaines méthodes combinent plusieurs sources d'information, telle une variante de

l'EHH prenant en compte le contraste entre différentes populations (Tang et al., 2007). Dans le

chapitre 4 nous avons essayé de combiner le spectre de fréquence allélique et la différenciation

entre populations en utilisant des statistiques assez simples (D de Tajima et F

ST

). Exploiter

l'information du déséquilibre permettrait d'augmenter la puissance de détection, notamment pour

des balayages sélectifs récents, ce qui est le cas du contournement de la résistance 7. Néanmoins,

cela nécessiterait l'identification des haplotypes du génome de référence issu d'un individu

dicaryotique, autrement dit la reconstruction de l'association des états alléliques le long des brins

haplotypiques. Or pour l'instant la phase des SNP hétérozygotes que nous avons détectés n'est pas

connue.

La reconstruction de la phase est possible avec des méthodes spécifiques de séquençage et

d’assemblage qui permettent de distinguer les deux haplotypes. L'électrophorèse capillaire est

utilisée dans ce sens (Szantai et al., 2005), tout comme la nano-PCR (Pan et al., 2012) qui permet

l'amplification spécifique de chaque séquence ou encore les nanopores (Mirsaidov et al., 2010) qui

détectent les séquences une par une grâce à leurs signaux électriques. Ces méthodes sont fiables car

elles permettent une lecture directe des haplotypes, mais elles sont coûteuses et longues à mettre en

place. Par ailleurs, des algorithmes permettant de reconstruire la phase à partir des données

génomiques sans séquençage spécifique, et qui sont donc moins coûteux, ont été développés (Niu,

2004). En particulier, des programmes dédiés à la reconstruction des haplotypes à partir de données

populationnelles existent, tels que PHASE (Scheet and Stephens, 2006) même si son utilisation

présente le risque de bruiter le signal à cause de l'histoire démographique forte des isolats de M.

larici-populina.

2.3. Validation des candidats, approche biochimique et moléculaire

Une fois les gènes candidats identifiés, les méthodes de génétique des populations ne permettent pas

la validation des fonctions sous-jacentes et leur implication dans les phénomènes adaptatifs

considérés (Bonin, 2008). Cette validation passe par des études moléculaires et biochimiques des

gènes et des protéines qu'ils codent. Dans le cadre des interactions hôte-pathogène, de nombreuses

études s'intéressent au dialogue moléculaire entre l’hôte et le pathogène, depuis la recherche

d'homologie de séquences jusqu'à la localisation de la protéine exprimée (Petre and Kamoun, 2014).

Une des approches employées consiste en l'expression des gènes candidats dans un système

dont on contrôle les conditions (hôte sensible, mutant, etc.). Pour les espèces qui ne sont pas

propices à la transformation stable, comme c'est le cas pour les espèces de peuplier, on peut obtenir

une transformation transitoire (agro-infiltration) ou utiliser un système hétérologue chez une espèce

modèle comme Nicotiana benthamiana. Dans le cas de M. larici-populina, les tentatives

d’agro-infiltration d'effecteurs candidats (initialement choisis sur la base des patrons d'expression de gènes

codant des petites protéines sécrétées au cours de la phase infectieuse ; Hacquard et al., 2012) sur le

peuplier se sont avérées infructueuses. Dans une étude récente, 20 effecteurs candidats de M.

larici-populina ont été testés en système hétérologue. Cette étude a démontré que six de ces effecteurs

candidats avaient une localisation cellulaire spécifique dans le nucléole, les mitochondries ou les

chloroplastes, indiquant les sites possibles des interactions moléculaires de chacune de ces protéines

(Petre et al., 2015). Cette approche en système hétérologue permet aussi d'identifier des interactions

potentielles de l'effecteur avec des protéines de la plante par co-immunoprécipitation suivie de

l'identification des peptides sélectionnés par spectrométrie de masse. Ainsi, plusieurs effecteurs

candidats exprimés chez N. benthamiana ont montré des interactions fortes avec des protéines

candidates de plante (Petre et al., 2015). Toutefois, ces études ne sont pas encore suffisante pour

démontrer le statut de gène d'avirulence de tels gènes candidats. Une autre approche envisageable,

et actuellement testée au sein de l'UMR Interactions Arbres/Microorganismes, est de produire des

protéines recombinantes des effecteurs candidats chez la bactérie Escherichia coli. Une fois

produites, ces protéines peuvent être utilisées à diverses fins. Si leur infiltration dans les tissus

foliaires de cultivars de peupliers porteur de résistances déployées en plantation déclenche une

réaction d'hypersensibilité (HR), cela démontrerait leur statut de facteur d'avirulence. Par ailleurs,

les protéines recombinantes peuvent permettre de générer des anticorps spécifiques pour réaliser

l'immunolocalisation in planta chez l'hôte peuplier sur des coupes de feuilles infectées par M.

larici-populina et vérifier ainsi les localisations observées en système hétérologue. Enfin, la

structure des effecteurs candidats peut être déterminée par cristallographie ou par résonance

magnétique nucléaire. Par ailleurs, pour formellement démontrer l'interaction R-Avr entre les

produits des gènes de résistance et d'avirulence chez l'hôte et le champignon, respectivement, il faut

identifier la protéine de résistance de la plante. Une telle interaction a pu être démontrée chez la

rouille modèle M. lini, l'agent de la rouille du lin, avec notamment la protéine AvrL567 qui interagit

avec les protéines de résistance L5, L6 et L7 du lin (Dodds et al., 2006). Dans le pathosystème

peuplier-rouille du peuplier, il serait également envisageable d’isoler les protéines de résistance de

cultivars de peuplier en passant des extraits protéiques de feuilles sur des colonnes d’affinité

porteuses d'une protéine d'avirulence candidate (par exemple Avr7). Une fois les couples protéine

d'avirulence/protéine de résistance identifiés, la démonstration formelle de l'interaction moléculaire

pourrait être testée par des techniques telles que le système double hybride en levure, par BiFC

(fluorescence par complémentation bi-moléculaire ; Kerppola, 2006) ou encore par

co-immunoprécipitation. De telles interactions ont pu être montrées chez Cladosporium fulvum

(Stergiopoulos and de Wit, 2009), Verticillium spp. (Thomma et al., 2011), et M. lini (Ellis et al.,

2007).

Dans de nombreux systèmes, ces approches moléculaires et biochimiques sont conduites sur

des gènes d'effecteurs candidats sélectionnés a priori selon des critères prédéfinis tels que la

présence d'un peptide signal indiquant une sécrétion, la taille des protéines (les effecteurs sont le

plus communément de petite taille), une richesse en cystéines, bien que ces différents critères ne

constituent pas une définition absolue des effecteurs (Petre et al., 2014). De plus, les approches

moléculaires et biochimiques sont longues à mettre en place dans des pathosystèmes complexes non

modèles tels que celui associant peuplier et rouille du peuplier. Ainsi, elles ne permettent, pour le

moment, que d'étudier un faible nombre de candidats simultanément. Un des intérêts des études de

génomique des populations est de permettre l’identification des gènes candidats sans aucun apriori

de fonction ou d'homologie avec des effecteurs connus. Cette approche populationnelle devrait

permettre à terme d'identifier de nouvelles classes de gènes d'avirulence et de les caractériser.