B. Etude du locus CRISPR2
IV. Discussion
Le MLST est la méthode de référence pour le génotypage de S. agalactiae. Il est
reproductible, utilise une base de données internationale, mais présente des limites en
termes de coût, de faisabilité technique et un pouvoir discriminant relativement faible. A
l’aide d’un algorithme spécialement élaboré eBurst, basé sur la parcimonie, il a permis
l’analyse dynamique de cette espèce en proposant un modèle évolutif clonal. La
concordance obtenue entre les résultats de la comparaison des profils alléliques et la
comparaison des séquences corrobore ce modèle. En effet, en cas d’évolution clonale la
différentiation allélique portera sur un évènement mutationnel unique modifiant peu la
séquence nucléotidique, alors qu’en cas de recombinaison, la variation attendue sur la
séquence est plus importante se manifestant par une discordance entre les résultats
obtenus par les 2 méthodes analytiques (comparaison de profil allélique et comparaison de
séquences). Néanmoins, cette approche a, par le passé et par excès, attribué au clone
« hypervirulent » ST17 une origine commune avec des souches bovines ST61 et ST67
(Bisharat et al., 2004). Les différences de profil allélique entre ces trois ST portent sur des
gènes de ménage relativement distants (adhP, glnA et tkt) et sont des mutations
ponctuelles, arguments en faveur de modifications acquises de façon verticale, plus que par
transfert horizontal. On retrouve également ce lien entre ST17 et ST61/ST67 de par la
structure résiduelle du système CRISPR2-Cas qui est identique chez ces clones. Il est
désormais établit et confirmé par MLVA que ces clones sont indépendants. Les souches
animales du CC17 sont distantes des souches d’origine humaine. Elles appartiennent soit à
une branche distincte, soit à une branche proche des souches CC23 de sérotype III
(Haguenoer et al., 2011). Cette analyse est corroborée par Lier qui met en évidence deux
complexes clonaux distincts adaptés à une niche écologique différente (Lier, 2014). Il est
probable que ces erreurs d’interprétation soient liées à des phénomènes de recombinaison.
On pourra alors reprocher au MLST une répartition des « housekeeping genes » peu
homogène, en effet 6 des 7 gènes sont disposés sur moins de la moitié du génome, nous
exposant ainsi à un biais de liaison d’autant plus qu’il a été montré, sur la base de génomes
de 8 souches de S. agalactiae totalement séquencés (Brochet et al., 2008), des phénomènes
de recombinaisons homologues portant sur d’importants segments du génome (Sørensen et
al., 2010).
Techniquement plus simple que le MLST, le MLVA est une méthode rapide, peu coûteuse,
reproductible, très discriminante du fait de l’évolution rapide des loci VNTR dans les
génomes bactériens et significativement plus discriminante dans notre étude. Une des
problématiques de cette méthode est la stabilité des VNTR. Un algorithme a été développé
pour estimer leur variabilité et permettre la sélection de loci suffisamment stables pour du
génotypage (Legendre et al., 2007). Malheureusement, cet algorithme n’est actuellement
plus disponible en ligne. Chez Mycobacterium leprae il a été observé des variations dans le
génotype MLVA (de un à quatre loci sur un profil de 5) pour plusieurs isolats venant de
différentes biopsies d’un même patient (Monot et al., 2008). Ainsi le génotypage par MLVA
semble inapproprié pour des surveillances épidémiologiques sur le long terme pour certains
pathogènes. Concernant nos marqueurs, la stabilité in vitro a été évaluée pour 4 d’entre eux
seulement (SAG4, SAG7, SAGTR8, SAG21) (Radtke et al., 2010a). De plus, il a été remarqué,
notamment pour plusieurs VNTR de E. coli (Cooley et al., 2010) et pour le gène sclB codant
une protéine de surface de S. pyogenes (Rasmussen and Björck, 2001), que les conditions
environnementales peuvent influer, par des mécanismes encore mal compris, sur la
fréquence des variations du nombre de répétitions des VNTR. La stabilité in vitro n’est alors
pas toujours corrélée à celle in vivo et reste donc également à évaluer pour l’ensemble des
loci étudiés. Dans notre étude, malgré la très grande variabilité attribuée aux VNTR dans le
cadre de leur rôle dans la « phase variation » et l’« antigenic variation », la plupart restent
relativement stables au sein d’un même ST. Il n’y a le plus souvent que peu de VNTR qui
varient, ce qui pourrait conforter la relative stabilité de ces marqueurs chez S. agalactiae.
Cette stabilité observée nous permet de proposer un génotypage approximatif mais peu
discriminant pour les principaux CC d’intérêt clinique basé sur un panel réduit de VNTR.
Ainsi, dans notre souchier, l’association de SAG41, SAG2 et SAG4 permet de déterminer
l’origine clonale de la souche avec une spécificité de 96,7% sur l’ensemble des souches de
complexes clonaux majeurs et de 100% sur les ST17. Notre panel à 9 loci avec un pouvoir
discriminant à 0,966 [0,946-0,987] ne semble pas améliorer les résultats comparativement à
un panel de 5 VNTR (dont SAG4, SAG7, SAGTR8, SAG21) qui présentait un index de Simpson
à 0,963 (Radtke et al., 2010a) ou 7 loci avec un index de Simpson de 0,960 [0,943-0,978]
ou moins distinctes au sein du CC23 : une associée au sérotype III et l’autre au sérotype Ia
comme observé par DNA arrays (Brochet et al., 2006). Il existe également 2 sous-populations
au sein du ST2 : une de groupe prophagique F phylogénétiquement proche du CC19 et une
de groupe prophagique C rattachée au CC1. L’analyse des marqueurs utilisés au cours de
différentes études, combinant séquences prophagiques, loci de MLST et de MLVA, montre
des homologies entre souches de ST phylogénétiquement éloignées portant sur des
segments génomiques de grande taille (Tableau VIII) faisant suspecter des phénomènes de
recombinaison comme ceux déjà décrits (Brochet et al., 2008), et non mis en évidence par le
MLST. Concernant la répartition du nombre de répétitions en fonction de l’origine de la
souche, nous retrouvons des résultats conformes à ceux de Rosenau pour le locus SAG21. En
effet, il s’agit d’un VNTR intra-génique du gène fbsA codant un facteur de virulence par
adhérence au fibrinogène humain. Il a été montré, sur modèle expérimental, que le nombre
de répétition était corrélé à l’adhérence et au pouvoir pathogène de la souche avec un
maximum d’adhérence pour un nombre de répétitions compris entre 4 et 7 (Rosenau et al.,
2007). Pour les infections invasives du nouveau-né, 50% de nos souches sont associées à un
nombre de répétition compris entre 4 et 7, et très majoritairement à 6 répétitions (40%).
SAG57 se situe dans le gène codant la PBP1A (Penicillin Binding Protein) qui joue un rôle
important dans la pathogénèse des infections à S. agalactiae puisque des souches mutantes
dépourvues de PBP1a ont montrées une virulence atténuée dans un modèle de sepsis (Jones
et al., 2003a) et une clairance pulmonaire plus rapide dans un modèle de sepsis par
contamination aérienne chez des rats nouveaux-nés (Jones et al., 2007). Nos résultats
retrouvent une prépondérance de l’allèle 3 de SAG57 dans les infections invasives du
nouveau-né, alors même que la pathogénèse des syndromes précoces fait intervenir une
porte d’entrée pulmonaire. Ceci fait évoquer un possible avantage en termes de « fitness »
de cet allèle permettant le maintien de la bactérie au niveau pulmonaire, prélude à la phase
d’invasion. Néanmoins, il existe un biais relativement important puisque toutes les souches
ST17, associées aux IMF, forment un ensemble homogène et possèdent l’allèle 3 de SAG57.
L’allèle 4 apparait plus fréquent dans les infections invasives de l’adulte. La variation du
nombre de répétitions semble donc être un candidat intéressant comme élément
influençant la virulence des souches. Il n’existe, à notre connaissance, pas de données
expérimentales concernant l’éventuelle influence de cette variation allélique sur la virulence
des souches. Des analyses complémentaires sont nécessaires pour conclure.
L’étude du locus CRISPR1 assure un pouvoir discriminant correct mais certains génotypes
sont surreprésentés, ceci étant inhérent à la limitation de l’analyse aux spacers ancestraux
les plus conservés et donc les plus consensuels au sein d’un groupe phylogénétique. Ainsi
elle est peu discriminante pour le ST17 et le CC23 qui apparaissent relativement homogènes
(6 génotypes pour 26 souches de CC23) contrairement au CC1 (15 génotypes pour 26
souches) et au CC19 (10 génotypes pour 14 souches). Néanmoins, l’analyse complète du
locus CRISPR1 présente un pouvoir discriminant bien supérieur (index de Simpson calculé à
partir des données de Lier (Lier, 2014), score à 0,9985). Par ailleurs, nos résultats mettent en
évidence une corrélation relativement médiocre avec ceux obtenus par MLST. Cette
faiblesse peut s’expliquer par la limitation de l’analyse aux 3 derniers couples DR/spacer,
alors que sont décrits des phénomènes de délétion et de duplication de spacers, associée à
l’analyse des données par alignement de séquences. Néanmoins, des outils analytiques
adaptés comme par exemple le fichier Excel CRISPR database version II (Danisco, 2010), ne
prenant en compte que les analogies de quelques spacers ancestraux et non pas l’ensemble
de la séquence permettent de déterminer l’appartenance à un groupe phylogénétique (Lier,
2014). L’analyse complète du locus permet d’obtenir un pouvoir discriminant très supérieur
aux autres techniques mais sa stabilité reste à étudier.
On pourra noter cependant, que le seul représentant ST130 de notre souchier semble lié à
au ST17 par le génotypage du locus CRISPR1, alors qu’il est associé aux CC7 et CC8 par les 2
autres méthodes de typage. De plus, comme expliqué précédemment, l’analyse combinée
de plusieurs marqueurs laisse à penser que le locus CRISPR1 se situe dans une région siège
de recombinaisons. Il n’est donc pas impossible qu’il puisse être la cible de ces phénomènes
et des études de phylogénie basées sur ce seul locus semblent hasardeuses, alors que cette
problématique est diluée par le nombre de loci étudiés dans le MLVA et le MLST.
Un complément de génotypage par amplification et séquençage du locus CRISPR2 ne semble
pas corroborer le génotypage par séquençage du locus CRISPR1. Nos résultats sont
globalement concordants avec ceux publiés par Lopez-Sanchez (Lopez-Sanchez et al., 2012)
qui retrouve un locus CRISPR2 chez 3 des 5 souches ST8, la totalité des souches ST10 et ST12.
L’analyse du locus CRISPR2 et de son environnement (opéron cas) a permis la mise en
évidence, contrairement à Lopez-Sanchez (Lopez-Sanchez et al., 2012) d’un vestige de ce
système chez 44 % des souches, puisque grâce à notre analyse in silico nous avons pu mettre
en évidence un DR terminal tronqué, non pris en compte par son analyse. Ce DR terminal
conforte les observations de Barrangou selon lesquelles le DR terminal est le plus souvent
tronqué ou dégénéré par rapport au DR consensus (Barrangou et al., 2007) et a été retrouvé
chez un nombre important de souches. L’opéron cas complet est observé quasi
exclusivement pour les souches ayant un locus CRISPR2 complet (mais également pour
quelques souches ST260) et correspond à un système CRISPR-Cas I-C, selon la classification
établie par Makarova (Makarova et al., 2011), dont les gènes présentent de très fortes
homologies avec les gènes cas associés aux CRISPR02 de S. pyogenes et S. dysgalactiae
subsp. equisimilis (Lopez-Sanchez et al., 2012).
La variabilité des profils observés tant au sein des gènes cas que du locus CRISPR, parfois au
sein d’un même ST (ST23, ST61, ST67, ST260) laisse supposer des phénomènes successifs et
indépendants de délétion et de réarrangement au sein des différentes lignées. En revanche,
il semble potentiellement fonctionnel chez les CC8 et apparentés. L’analyse des spacersmet
en évidence des séquences d’origine phagique témoignant très probablement d’une activité
de ce système à un moment de son histoire. L’intégration de fragments de son propre
chromosome, phénomène occasionnel qui semble fréquemment associé à des systèmes
CRISPR-Cas inactifs, la faible variabilité des spacers, le faible nombre de spacers par locus et
son caractère inconstant chez ST12 remettent en doute cette hypothèse qui doit être
vérifiée expérimentalement.
Chez plusieurs bactéries, le gène tlyA a été mis en évidence notamment chez Helicobacter
pylori pour lequel son produit est décrit comme un puissant agent cytotoxique impliqué dans
la virulence de l’espèce (Lata and Chattopadhyay, 2014), et M. tuberculosis où il aurait une
double fonction d’hémolyse et de méthylation de l’ARN ribosomal (Rahman et al., 2010).
Chez S. agalactiae, ce gène situé à 50kb du locus CRISPR2 présente dans sa séquence un
fragment homologue à la partie terminale du DR terminal sur 12 nucléotides. Par ailleurs, la
conservation de cette séquence est en adéquation avec la conservation du gène tlyA chez
d’autres espèces de Streptocoques. Sa présence au sein du gène tlyA chez S. agalactiae,
n’entraine ni codon stop prématuré, ni décalage du cadre de lecture. Le lien physique,
explication. Se pose alors la question d’un lien fonctionnel entre ces 2 loci, en sachant que la
fonction de l’hémolysine A chez S. agalactiae n’est, à l’heure actuellepas clairement définie.
De la même façon, et situé juste en amont du gène tlyA, on note la présence du gène xseB
codant la petite sous-unité de l’exodéoxybonucléase VII. Cette protéine est impliquée dans
le système de réparation de l’ADN, de suppression des recombinaisons homologues, dans le
maintien de la stabilité génomique et dans la plasticité. Elle a été identifiée comme
biomarqueur protéomique potentiel, surexprimé chez les souches ST17. Ces rapports avec le
locus CRISPR2 restent à évaluer et pourraient être purement fortuits (Lanotte et al., 2013).
Dans le document
FACULTE DE MEDECINE DE TOURS
(Page 89-95)