Discussion - Etude du locus CRISPR2 - FACULTE DE MEDECINE DE TOURS

B. Etude du locus CRISPR2

IV. Discussion

Le MLST est la méthode de référence pour le génotypage de S. agalactiae. Il est

reproductible, utilise une base de données internationale, mais présente des limites en

termes de coût, de faisabilité technique et un pouvoir discriminant relativement faible. A

l’aide d’un algorithme spécialement élaboré eBurst, basé sur la parcimonie, il a permis

l’analyse dynamique de cette espèce en proposant un modèle évolutif clonal. La

concordance obtenue entre les résultats de la comparaison des profils alléliques et la

comparaison des séquences corrobore ce modèle. En effet, en cas d’évolution clonale la

différentiation allélique portera sur un évènement mutationnel unique modifiant peu la

séquence nucléotidique, alors qu’en cas de recombinaison, la variation attendue sur la

séquence est plus importante se manifestant par une discordance entre les résultats

obtenus par les 2 méthodes analytiques (comparaison de profil allélique et comparaison de

séquences). Néanmoins, cette approche a, par le passé et par excès, attribué au clone

« hypervirulent » ST17 une origine commune avec des souches bovines ST61 et ST67

(Bisharat et al., 2004). Les différences de profil allélique entre ces trois ST portent sur des

gènes de ménage relativement distants (adhP, glnA et tkt) et sont des mutations

ponctuelles, arguments en faveur de modifications acquises de façon verticale, plus que par

transfert horizontal. On retrouve également ce lien entre ST17 et ST61/ST67 de par la

structure résiduelle du système CRISPR2-Cas qui est identique chez ces clones. Il est

désormais établit et confirmé par MLVA que ces clones sont indépendants. Les souches

animales du CC17 sont distantes des souches d’origine humaine. Elles appartiennent soit à

une branche distincte, soit à une branche proche des souches CC23 de sérotype III

(Haguenoer et al., 2011). Cette analyse est corroborée par Lier qui met en évidence deux

complexes clonaux distincts adaptés à une niche écologique différente (Lier, 2014). Il est

probable que ces erreurs d’interprétation soient liées à des phénomènes de recombinaison.

On pourra alors reprocher au MLST une répartition des « housekeeping genes » peu

homogène, en effet 6 des 7 gènes sont disposés sur moins de la moitié du génome, nous

exposant ainsi à un biais de liaison d’autant plus qu’il a été montré, sur la base de génomes

de 8 souches de S. agalactiae totalement séquencés (Brochet et al., 2008), des phénomènes

de recombinaisons homologues portant sur d’importants segments du génome (Sørensen et

al., 2010).

Techniquement plus simple que le MLST, le MLVA est une méthode rapide, peu coûteuse,

reproductible, très discriminante du fait de l’évolution rapide des loci VNTR dans les

génomes bactériens et significativement plus discriminante dans notre étude. Une des

problématiques de cette méthode est la stabilité des VNTR. Un algorithme a été développé

pour estimer leur variabilité et permettre la sélection de loci suffisamment stables pour du

génotypage (Legendre et al., 2007). Malheureusement, cet algorithme n’est actuellement

plus disponible en ligne. Chez Mycobacterium leprae il a été observé des variations dans le

génotype MLVA (de un à quatre loci sur un profil de 5) pour plusieurs isolats venant de

différentes biopsies d’un même patient (Monot et al., 2008). Ainsi le génotypage par MLVA

semble inapproprié pour des surveillances épidémiologiques sur le long terme pour certains

pathogènes. Concernant nos marqueurs, la stabilité in vitro a été évaluée pour 4 d’entre eux

seulement (SAG4, SAG7, SAGTR8, SAG21) (Radtke et al., 2010a). De plus, il a été remarqué,

notamment pour plusieurs VNTR de E. coli (Cooley et al., 2010) et pour le gène sclB codant

une protéine de surface de S. pyogenes (Rasmussen and Björck, 2001), que les conditions

environnementales peuvent influer, par des mécanismes encore mal compris, sur la

fréquence des variations du nombre de répétitions des VNTR. La stabilité in vitro n’est alors

pas toujours corrélée à celle in vivo et reste donc également à évaluer pour l’ensemble des

loci étudiés. Dans notre étude, malgré la très grande variabilité attribuée aux VNTR dans le

cadre de leur rôle dans la « phase variation » et l’« antigenic variation », la plupart restent

relativement stables au sein d’un même ST. Il n’y a le plus souvent que peu de VNTR qui

varient, ce qui pourrait conforter la relative stabilité de ces marqueurs chez S. agalactiae.

Cette stabilité observée nous permet de proposer un génotypage approximatif mais peu

discriminant pour les principaux CC d’intérêt clinique basé sur un panel réduit de VNTR.

Ainsi, dans notre souchier, l’association de SAG41, SAG2 et SAG4 permet de déterminer

l’origine clonale de la souche avec une spécificité de 96,7% sur l’ensemble des souches de

complexes clonaux majeurs et de 100% sur les ST17. Notre panel à 9 loci avec un pouvoir

discriminant à 0,966 [0,946-0,987] ne semble pas améliorer les résultats comparativement à

un panel de 5 VNTR (dont SAG4, SAG7, SAGTR8, SAG21) qui présentait un index de Simpson

à 0,963 (Radtke et al., 2010a) ou 7 loci avec un index de Simpson de 0,960 [0,943-0,978]

ou moins distinctes au sein du CC23 : une associée au sérotype III et l’autre au sérotype Ia

comme observé par DNA arrays (Brochet et al., 2006). Il existe également 2 sous-populations

au sein du ST2 : une de groupe prophagique F phylogénétiquement proche du CC19 et une

de groupe prophagique C rattachée au CC1. L’analyse des marqueurs utilisés au cours de

différentes études, combinant séquences prophagiques, loci de MLST et de MLVA, montre

des homologies entre souches de ST phylogénétiquement éloignées portant sur des

segments génomiques de grande taille (Tableau VIII) faisant suspecter des phénomènes de

recombinaison comme ceux déjà décrits (Brochet et al., 2008), et non mis en évidence par le

MLST. Concernant la répartition du nombre de répétitions en fonction de l’origine de la

souche, nous retrouvons des résultats conformes à ceux de Rosenau pour le locus SAG21. En

effet, il s’agit d’un VNTR intra-génique du gène fbsA codant un facteur de virulence par

adhérence au fibrinogène humain. Il a été montré, sur modèle expérimental, que le nombre

de répétition était corrélé à l’adhérence et au pouvoir pathogène de la souche avec un

maximum d’adhérence pour un nombre de répétitions compris entre 4 et 7 (Rosenau et al.,

2007). Pour les infections invasives du nouveau-né, 50% de nos souches sont associées à un

nombre de répétition compris entre 4 et 7, et très majoritairement à 6 répétitions (40%).

SAG57 se situe dans le gène codant la PBP1A (Penicillin Binding Protein) qui joue un rôle

important dans la pathogénèse des infections à S. agalactiae puisque des souches mutantes

dépourvues de PBP1a ont montrées une virulence atténuée dans un modèle de sepsis (Jones

et al., 2003a) et une clairance pulmonaire plus rapide dans un modèle de sepsis par

contamination aérienne chez des rats nouveaux-nés (Jones et al., 2007). Nos résultats

retrouvent une prépondérance de l’allèle 3 de SAG57 dans les infections invasives du

nouveau-né, alors même que la pathogénèse des syndromes précoces fait intervenir une

porte d’entrée pulmonaire. Ceci fait évoquer un possible avantage en termes de « fitness »

de cet allèle permettant le maintien de la bactérie au niveau pulmonaire, prélude à la phase

d’invasion. Néanmoins, il existe un biais relativement important puisque toutes les souches

ST17, associées aux IMF, forment un ensemble homogène et possèdent l’allèle 3 de SAG57.

L’allèle 4 apparait plus fréquent dans les infections invasives de l’adulte. La variation du

nombre de répétitions semble donc être un candidat intéressant comme élément

influençant la virulence des souches. Il n’existe, à notre connaissance, pas de données

expérimentales concernant l’éventuelle influence de cette variation allélique sur la virulence

des souches. Des analyses complémentaires sont nécessaires pour conclure.

L’étude du locus CRISPR1 assure un pouvoir discriminant correct mais certains génotypes

sont surreprésentés, ceci étant inhérent à la limitation de l’analyse aux spacers ancestraux

les plus conservés et donc les plus consensuels au sein d’un groupe phylogénétique. Ainsi

elle est peu discriminante pour le ST17 et le CC23 qui apparaissent relativement homogènes

(6 génotypes pour 26 souches de CC23) contrairement au CC1 (15 génotypes pour 26

souches) et au CC19 (10 génotypes pour 14 souches). Néanmoins, l’analyse complète du

locus CRISPR1 présente un pouvoir discriminant bien supérieur (index de Simpson calculé à

partir des données de Lier (Lier, 2014), score à 0,9985). Par ailleurs, nos résultats mettent en

évidence une corrélation relativement médiocre avec ceux obtenus par MLST. Cette

faiblesse peut s’expliquer par la limitation de l’analyse aux 3 derniers couples DR/spacer,

alors que sont décrits des phénomènes de délétion et de duplication de spacers, associée à

l’analyse des données par alignement de séquences. Néanmoins, des outils analytiques

adaptés comme par exemple le fichier Excel CRISPR database version II (Danisco, 2010), ne

prenant en compte que les analogies de quelques spacers ancestraux et non pas l’ensemble

de la séquence permettent de déterminer l’appartenance à un groupe phylogénétique (Lier,

2014). L’analyse complète du locus permet d’obtenir un pouvoir discriminant très supérieur

aux autres techniques mais sa stabilité reste à étudier.

On pourra noter cependant, que le seul représentant ST130 de notre souchier semble lié à

au ST17 par le génotypage du locus CRISPR1, alors qu’il est associé aux CC7 et CC8 par les 2

autres méthodes de typage. De plus, comme expliqué précédemment, l’analyse combinée

de plusieurs marqueurs laisse à penser que le locus CRISPR1 se situe dans une région siège

de recombinaisons. Il n’est donc pas impossible qu’il puisse être la cible de ces phénomènes

et des études de phylogénie basées sur ce seul locus semblent hasardeuses, alors que cette

problématique est diluée par le nombre de loci étudiés dans le MLVA et le MLST.

Un complément de génotypage par amplification et séquençage du locus CRISPR2 ne semble

pas corroborer le génotypage par séquençage du locus CRISPR1. Nos résultats sont

globalement concordants avec ceux publiés par Lopez-Sanchez (Lopez-Sanchez et al., 2012)

qui retrouve un locus CRISPR2 chez 3 des 5 souches ST8, la totalité des souches ST10 et ST12.

L’analyse du locus CRISPR2 et de son environnement (opéron cas) a permis la mise en

évidence, contrairement à Lopez-Sanchez (Lopez-Sanchez et al., 2012) d’un vestige de ce

système chez 44 % des souches, puisque grâce à notre analyse in silico nous avons pu mettre

en évidence un DR terminal tronqué, non pris en compte par son analyse. Ce DR terminal

conforte les observations de Barrangou selon lesquelles le DR terminal est le plus souvent

tronqué ou dégénéré par rapport au DR consensus (Barrangou et al., 2007) et a été retrouvé

chez un nombre important de souches. L’opéron cas complet est observé quasi

exclusivement pour les souches ayant un locus CRISPR2 complet (mais également pour

quelques souches ST260) et correspond à un système CRISPR-Cas I-C, selon la classification

établie par Makarova (Makarova et al., 2011), dont les gènes présentent de très fortes

homologies avec les gènes cas associés aux CRISPR02 de S. pyogenes et S. dysgalactiae

subsp. equisimilis (Lopez-Sanchez et al., 2012).

La variabilité des profils observés tant au sein des gènes cas que du locus CRISPR, parfois au

sein d’un même ST (ST23, ST61, ST67, ST260) laisse supposer des phénomènes successifs et

indépendants de délétion et de réarrangement au sein des différentes lignées. En revanche,

il semble potentiellement fonctionnel chez les CC8 et apparentés. L’analyse des spacersmet

en évidence des séquences d’origine phagique témoignant très probablement d’une activité

de ce système à un moment de son histoire. L’intégration de fragments de son propre

chromosome, phénomène occasionnel qui semble fréquemment associé à des systèmes

CRISPR-Cas inactifs, la faible variabilité des spacers, le faible nombre de spacers par locus et

son caractère inconstant chez ST12 remettent en doute cette hypothèse qui doit être

vérifiée expérimentalement.

Chez plusieurs bactéries, le gène tlyA a été mis en évidence notamment chez Helicobacter

pylori pour lequel son produit est décrit comme un puissant agent cytotoxique impliqué dans

la virulence de l’espèce (Lata and Chattopadhyay, 2014), et M. tuberculosis où il aurait une

double fonction d’hémolyse et de méthylation de l’ARN ribosomal (Rahman et al., 2010).

Chez S. agalactiae, ce gène situé à 50kb du locus CRISPR2 présente dans sa séquence un

fragment homologue à la partie terminale du DR terminal sur 12 nucléotides. Par ailleurs, la

conservation de cette séquence est en adéquation avec la conservation du gène tlyA chez

d’autres espèces de Streptocoques. Sa présence au sein du gène tlyA chez S. agalactiae,

n’entraine ni codon stop prématuré, ni décalage du cadre de lecture. Le lien physique,

explication. Se pose alors la question d’un lien fonctionnel entre ces 2 loci, en sachant que la

fonction de l’hémolysine A chez S. agalactiae n’est, à l’heure actuellepas clairement définie.

De la même façon, et situé juste en amont du gène tlyA, on note la présence du gène xseB

codant la petite sous-unité de l’exodéoxybonucléase VII. Cette protéine est impliquée dans

le système de réparation de l’ADN, de suppression des recombinaisons homologues, dans le

maintien de la stabilité génomique et dans la plasticité. Elle a été identifiée comme

biomarqueur protéomique potentiel, surexprimé chez les souches ST17. Ces rapports avec le

locus CRISPR2 restent à évaluer et pourraient être purement fortuits (Lanotte et al., 2013).

Dans le document FACULTE DE MEDECINE DE TOURS (Page 89-95)