B. Typage moléculaire
2. Typage moléculaire par MLVA
a) Principe
Le MLVA analyse le polymorphisme de VNTR de position intra- ou inter-génique dont le
caractère hypervariable assure un pouvoir discriminant important. La détermination du
nombre de répétitions du motif unitaire permet de définir un numéro d’allèle et la
combinaison des numéros d’allèles de plusieurs VNTR définit un génotype MLVA. Ce motif
b) Modalités de sélection des VNTR
Des travaux préalables ont été réalisés au sein de l’unité « Bactéries et Risque
Materno-fœtal » pour identifier des loci VNTR, étudier leur polymorphisme et proposer un typage
MLVA présentant un pouvoir discriminant supérieur aux autres techniques de typage
actuellement employées pour S. agalactiae.
Les loci ont d’abord été identifiés in silico par la recherche de séquences répétées en tandem
sur les génomes séquencés des 3 souches de S. agalactiae 2603 V/R, NEM316, et A909 à
l’aide de la base de données «The Microorganisms Tandem Repeats Database» disponible
sur le site http://minisatellites.u-psud.fr/ (Denoeud and Vergnaud, 2004). Celle-ci utilise le
programme Tandem Repeat Finder (Benson, 1999) qui permet la détection des séquences
répétées en tandem même lorsque le motif unitaire varie par rapport à la séquence
consensus. Le polymorphisme est appréhendé par comparaison de plusieurs génomes
séquencés de la même espèce bactérienne. Certains loci ont été sélectionnés pour une
analyse in vitro sur une population de S. agalactiae. Les amorces ont été dessinées à partir
d’une des 3 souches de référence 2603 V/R, NEM316 et A909 dans des régions flanquantes
suffisamment stables et à une distance permettant une amplification pour une majorité des
isolats.
Lors d’un premier travail, 34 VNTR ont été repérés, nommés de SAG1 à SAG34 (Béry, 2007;
Lecharpentier, 2007) et 25 ont été retenus pour une évaluation sur une population de 60
souches de S. agalactiae (Haguenoer, 2008). Leur motif unitaire compris entre 12 et 493 pb
permettait la détermination de la taille du fragment et donc du nombre de répétitions par
simple migration sur gel d’agarose. Quatre loci étaient polymorphes et présentaient une
amplification pour toutes les souches ; pour 13 loci, l’amplification était inconstante et 3
d’entre eux ont eu un développement spécifique. Finalement, un génotypage MLVA à 7 loci
polymorphes et discriminants a été retenu avec révélation des produits de PCR en gel
d’agarose (Haguenoer et al., 2011). Un autre travail s’est intéressé à 14 loci VNTR (SAG35 à
SAG57), selon les mêmes modalités pratiques (Philippe, 2008). Sur ces 14 VNTR, seulement 4
présentaient un intérêt pour le typage dont 2 microsatellites pour lesquels l’exploitation
s’est révélée délicate après révélation du produit de PCR en gel d’agarose du fait de la faible
différence de taille entre les fragments et de la résolution insuffisante de la révélation sur gel
d’agarose. Les caractéristiques des TR étudiés sont résumées dans le Tableau
I.
Une résolution supérieure semblait nécessaire pour l’exploitation des microsatellites et
pouvait être obtenue par l’utilisation de gel d’acrylamide, de microélectrophorèse ou de
séquenceur capillaire. Cette dernière méthode, permettant par ailleurs le multiplexage par
utilisation d’amorces fluorescentes, a été développée pour S. aureus (Francois et al., 2005)
et proposée pour S. agalactiae par une équipe norvégienne avec l’étude de 5 VNTR : SATR1,
SATR2 et SATR5 correspondant respectivement à SAG4, SAG7 et SAG21 ; et SATR3 et SATR4
non explorés jusqu’alors. SATR3 n’était pas amplifié chez 80% des souches et le motif
unitaire de SATR4 présentait un caractère dégénératif pouvant être un obstacle au calcul du
nombre de répétition (taille variant de 15 à 18 pb) (Radtke et al., 2010a).
Pour notre travail, il a été décidé de réaliser un typage MLVA basé sur un panel de 9 VNTR : 7
minisatellites (SAG2, SAG3, SAG4, SAG7, SAG21, SAG22 et SAGTR8 (correspondant à SATR4
ou TR8 décrit par Radtke)) et 2 microsatellites (SAG41, SAG57). L’utilisation d’amorces
fluorescentes et l’électrophorèse capillaire permettaient le multiplexage et l’obtention d’une
meilleure résolution en particulier pour les microsatellites. Les amorces utilisées
correspondent à celles décrites dans les études précédentes mais l’une des deux étaient ici
marquée par un fluorochrome (Tableau II), la position des loci est précisée Figure 17.
Tableau I : Résumé des caractéristiques des TR étudiés au sein de l’unité « Bactéries et Risque Materno-fœtal ». 1, Nom du locus selon la nomenclature : nom usuel_taille du motif unitaire_taille attendue pour la souche de référence_nombre de répétitions correspondant ; la souche de référence étant celle parmi 2603 V/R, A909, NEM316 à partir de laquelle les amorces ont été dessinées (surligné en jaune). 2, Tandem Repeats étudiés sur une population de 60 isolats de S. agalactiae (Béry, 2007; Haguenoer, 2008); 3, Tandem Repeats étudiés sur une population de 60 isolats de S. agalactiae (Philippe, 2008).
Locus1 Longueur
unitaire Protéine correspondante
Nombre de répétitions Taille
attendue Caractéristiques du locus
2603 V/R A909 NEM316
SAG1_30pb_176pb_2U2 30 Streptococcal surface protein Immunogen 1.9 1.9 1.9 176 Monomorphe
SAG2_32pb_244pb_3U2 32 Ribosomal protein S10, L3 2.1 2.1 2.1 244 Polymorphe et amplifié chez tous les isolats
SAG3_24pb_150pb_3U2 24 Cochaperone prot. DnaJ 2.9 1.5 2.9 150 Polymorphe et amplifié chez tous les isolats
SAG4_60pb_234pb_3U2 60 Hypothetical protein 2.8 - - 234 Polymorphe et amplifié chez tous les isolats
SAG5_25pb_245pb_4U2 25 Membrane protein, putative 3.6 3.6 - 245 Amplification inconstante
SAG7_18pb_249pb_6U2 18 Hypothetical protein 5.9 7.9 0 249 Amplification inconstante, développement spécifique
SAG8_27pb_177pb_2U2 27 Phosphoglucosamine mutase 2.0 2.0 2.0 177 Monomorphe
SAG9_293pb_663pb_2U2 293 Transglycosylase associated protein 1.9 1.9 1.9 663 Amplification inconstante
SAG10_27pb_157pb_3U2 27 Laminin binding surface protein 2.2 2.2 2.2 157 Monomorphe
SAG11_50pb_313pb_3U2 50 C5a peptidase ScpB 2.8 2.8 2.8 313 Monomorphe
SAG12_30pb_198pb_2U2 30 Hydroxymethylglutaryl-CoA reductase 2.0 2.0 2.0 198 Monomorphe
SAG13_48pb_297pb_5U2 48 Cell wall surface anchor family protein, putative 4.3 - - 297 Amplification inconstante
SAG14_24pb_656pb_23U2 24 Surface protein 22.2 25.8 23.8 656 Amplification inconstante
SAG16_31pb_237pb_3U2 31 IS1381 transposase - 2.6 - 237 Amplification non spécifique
SAG17_21pb_235pb_3U2 21 Hypothetical protein - 2.4 - 235 Amplification inconstante
SAG18_72pb_700pb_5U2 72 Collagen like surface protein, putative - 4.4 - 700 Amplification non spécifique
SAG20_18pb_373pb_17U2 18 Collagen like surface protein, putative - 16.1 - 373 Amplification inconstante
SAG21_48pb_690pb_14U2 48 FbsA 0 13.4 15 690 Amplification inconstante, développement spécifique
SAG22_159pb_928pb_5U2 159 Prenyltransferase 1.8 4.8 1.8 928 Polymorphe et amplifié chez tous les isolats
SAG23_48pb_389pb_6U2 48 Surface protein - 5.6 5.0 389 Amplification inconstante
SAG24_493pb_1434pb_2U2 493 Hypothetical protein - - 2.0 1434 Amplification inconstante
SAG25_33pb_234pb_3U2 33 Cell wall surface anchor family protein, putative - - 2.2 234 Amplification inconstante
SAG31_45pb_210pb_4U2 45 Hypothetical protein - - 3.4 210 Amplification inconstante
SAG33_12pb_300pb_21U2 12 Surface protein - 21.3 20.7 300 Amplification inconstante, développement spécifique
SAG35_22pb_163pb_2U3 22 Surface immunogenic protein (SAG0032) 2 2 2 163 Monomorphe
SAG36_12pb_239pb_4U3 12 Polyribonucleotide nucleotidyltransferase (SAG0203) 4 4 4 239 Monomorphe
SAG37_22pb_183pb_2U3 22 KH domain protein (SAG0306) 2 2 2 183 Monomorphe
SAG38_20pb_194pb_2U3 20 Conserved hypothetical protein (SAK_0625) - 2 - 194 Amplification inconstante et monomorphe
SAG39_21pb_201pb_3U3 21 Hypothetical protein (SAG0694) 3 3 3 201 Monomorphe
SAG40_20pb_178pb_2U3 20 DNA-binding response regulator (SAG0712) 2 2 2 178 Monomorphe
SAG41_9pb_203pb_4U3 9 Lipoprotein (SAG1024) 4 - 3 203 Amplification inconstante (46.67% des isolats) et polymorphe
SAG42_17pb_294pb_3U3 17 Hypothetical protein (SAG1245) 3 - - 294 Amplification non spécifique
SAG43_12pb_220pb_2U3 12 Hypothetical protein (gbs2064) - 2 2 220 Amplification inconstante et monomorphe
SAG44_21pb_201pb_2U3 21 Cell wall surface anchor family protein (SAG2021) 2 - - 201 Amplification inconstante (65% des isolats) et polymorphe
SAG49_21pb_248pb_3U3 21 Amidase family protein (SAG1474) 3 3 3 248 Monomorphe
SAG51_21pb_250pb_2U3 21 Manganese ABC transporter, manganese-binding adhesion
lipoprotein (SAG1533) 2 2 2 250 Monomorphe
SAG53_15pb_200pb_3U3 15 Prophage LambdaSa2, bacteriophage replication
protein/hypothetical protein, truncation/fusion (SAG1871) 3 - - 200 Amplification inconstante et polymorphe (18.33% des isolats)
Tableau II : Amorces utilisées pour le MLVA. Les fluorochromes de chacun des couples d’amorces sont également indiqués.
Amorces pour Multiplexage Référence
SAG2 forward (5’-3’) 6-FAM-TCTTCCAAGTGGTGTCAACG (Haguenoer, 2009)
reverse (5’-3’) CAACGTTTGGAGTTGCTTCA
SAG3 forward (5’-3’) 6-FAM-CAAAAACGTGCTGCCTATGA (Haguenoer, 2009)
reverse (5’-3’) CATCCCTCCTCCACCAAAA
SAG4 forward (5’-3’) Hex-GGTCAGTTTTTATTTATCGTAAGC (Haguenoer, 2009)
reverse (5’-3’) AGTCTTGCGAAGGCAGACAC
SAG7 forward (5’-3’) 6-FAM-TGGTGTTGATAAAGTTGATGTTCC (Haguenoer, 2009)
reverse (5’-3’) GCCATATGAACTGCGGAAAC
SAG7bis forward (5’-3’) 6-FAM-ACCTATGCTCCCAGTGGTTC (Haguenoer, 2009)
reverse (5’-3’) TCACTTAAGCGCACTGCAAC
SAGTR8 forward (5’-3’) 6-FAM-AAAGCATCTTTAATTCAGGCA (Radtke et al., 2010b)
reverse (5’-3’) CTGTGGCAGACTCAACTTGTG
SAG21 forward (5’-3’) Atto-TGAAAGAAGTGGATTTTTCCCTA
SAG21b R reverse (5’-3’) AAAATAGGTTTTAGAACTTGGAAATCA
SAG22 forward (5’-3’) Atto-TGTAACACTAGCTCCAATTTGTTTT (Haguenoer, 2009)
reverse (5’-3’) TCGGTCTTGTCTCAGCAATG
SAG41 forward (5’-3’) 6-FAM-TTTCAACTCAGTTTCCGGATG (Philippe, 2008)
reverse (5’-3’) AAAAGCCGGGTGGCTATAAT
SAG57 forward (5’-3’) Hex-AGAGGCTTACAACGCAGAGC (Philippe, 2008)
reverse (5’-3’) ATCCCCACAAGTCGAAACAC
c) Amplification des loci des séquences répétées en tandem
Trois mix de PCR ont été réalisés comprenant chacun 3 à 4 paires d’amorces. Les conditions
de PCR avaient été déterminées lors des études préalables, mais dans un souci
d’uniformisation une seule condition a été retenue pour l’ensemble des mix (Tableau III).
Tableau III : Résumé des caractéristiques des 3 mix de PCR multiplexe pour MLVA.
Mix 1 Mix 2 Mix 3
Tampon standardisé OneTaq 5X (New England Biolabs)
5 µL
dNTP 4*400 µM
OneTaq Polymerase (New England Biolabs)
1 unité
ADN 100 ng
La réaction de PCR a été effectuée dans un thermocycleur T3000 (Biometra). Après une
dénaturation initiale de 5 minutes à 94°C, 22 cycles ont été réalisés comprenant une étape
de dénaturation à 94°C pendant 1 minute, une étape d’hybridation de 1 minute à 55°C, une
étape d’élongation de 2 minutes à 68°C, suivis d’une étape d’élongation finale de 7 minutes
à 68°C.
d) Détermination du nombre de répétitions
Un mix extemporané était réalisé contenant 15 µL de Hi-Di Formamide (Applied Biosystem)
préparé avec du formamide déionisé pour éliminer les anions et cations pouvant interférer
avec l’analyse génétique et 0,4 µL de marqueur de taille GeneScan-600LIZ Size Standard pour
le mix1 et GeneScan-1200LIZ Size Standard (Applied Biosystem) pour les mix 2 et 3. Quinze
µL de ce mélange étaient distribués dans chacun des puits d’une plaque MicroAmp Optical
96-well Reaction Plate (Applied Biosystem) et 1 µL du produit de PCR dilué au demi a été
ajouté avant centrifugation de la plaque à 1500 rpm.
La taille des fragments de PCR a été déterminée par électrophorèse capillaire sur séquenceur
capillaire Hitachi 3130XL Genetic Analyser en utilisant le protocole standard avec capillaires
de 36 cm et polymère POP7. L’analyse a été effectuée sur le logiciel GeneMapper version 4.0
(Applied Biosystem).
Du fait des limites inhérentes aux marqueurs de taille et au capillaire utilisés, pour tout
fragment mesuré supérieur à 850 pb sur capillaire, un contrôle sur gel a été réalisé (PCR
effectuée selon les même modalités mais avec 35 cycles et utilisation d’amorces dépourvues
de fluorochrome). La révélation a été effectuée par transillumination UV sur gel d’agarose à
1% (Eurogentec, Liège, Belgique) préparé avec du tampon TBE 1X (Tris Borate 89 mM, EDTA
2,5 mM, pH 8) (Euromedex) et contenant du Bromure d’Ethidium (Invitrogen) après une
migration de 5 heures à 7V/cm. Lors du dépôt, environ 5 µl de tampon de charge (glycérol
30%, bleu de bromophénol 0,25%, tampon tris-base 40 mM, pH8, EDTA 2mM) a été ajouté à
l'échantillon et un marqueur de taille 100 pb PCR Molecular Ruler (BioRad) a été ajouté à
intervalle régulier. Il assure un marquage tous les 100 pb entre 100 et 3000 pb ce qui
permet, à l’aide de logiciel Vision-Capt (Vilber Lourmat), un pouvoir discriminant satisfaisant
même pour des fragments de grande taille ne variant entre eux que de quelques dizaines de
paires de bases.
e) Séquençage des VNTR
Par ailleurs, pour tous les allèles supposés nouveaux (obtention de taille de fragment non
décrit jusqu’alors), le nombre de répétition a été vérifié par séquençage selon la méthode de
Sanger.
L’amplification était suivie d’une vérification par migration en gel d’agarose. Une purification
des produits de PCR était ensuite réalisée sur colonne à l’aide du kit Centrifugal Filter Units®
(Millipore Corporation) selon les recommandations du fournisseur. Les amorces utilisées
pour la réaction de séquençage étaient celles utilisées pour l’amplification et le volume
réactionnel contenait : 2 µL de tampon de séquençage 5X et 1 µL de BigDyeTerminator Mix
v.3.1 (Applied Biosystems), 0,5 µM d’amorce et 1 µL de produit d’amplification purifié dilué
au 1/5
epour un volume final de 10 µL. Le programme de séquençage comprenait : une étape
de dénaturation à 96°C de 1 minute, suivie de 30 cycles de 10 secondes à 96°C, 10 secondes
à 50°C et 4 minutes à 60°. Les produits obtenus ont été purifiés par filtration sur plaque
Multi screen 0,45 µm hydrophylic (Millipore) à travers une résine Sephedex G50
(Sigma-Aldrich) préalablement réhydratée et recueillis sur plaque MicroAmp Optical 96-well
Reaction Plate (Applied Biosystems) après centrifugation 5 minutes à 2000 rpm. Les
séquences ont été déterminées sur séquenceur capillaire automatique Hitachi 3130XL
Genetic Analyser (Applied Biosystems), vérifiées sur le logiciel Sequence Scanner version 1.0
(Applied Biosystems), puis alignées grâce au logiciel BioEdit (Tom Hall, Ibis Biosciences,
Carlsbad) et comparées aux locus VNTR des souches de référence permettant ainsi de
déterminer de façon certaine le nombre de répétitions de ces allèles inconnus.
f) Assignement des allèles et détermination du génotype MLVA
Le numéro d’un allèle est défini par le nombre de répétitions du motif unitaire au sein de cet
allèle. Pour un locus donné, une taille de fragment correspond à un nombre de répétition
fixe et permet ainsi aisément de définir le numéro d’allèle. L’absence d’amplification avec les
amorces SAG7 associée à la présence d’un amplicon de 501 pb avec les amorces SAG7b
définissait l’allèle 0 de SAG7 (absence du locus SAG7) (Haguenoer, 2009). L’absence
d’amplification de SAG41 confirmée par électrophorèse en gel d’agarose associée à
l’amplification d’un témoin positif (locus CRISPR2 ou gène du CAMP factor) pour chaque
extrait d’ADN définissait l’allèle 0 de SAG41. Par ailleurs, l’alignement des séquences des
souches de référence A909 (absence d’amplification) et 2603 V/R (amplicon de 203 pb) par
le logiciel BLASTN confirme l’absence de la région contenant le locus SAG41 sur une
longueur d’environ 9 kb chez la souche A909, comme illustré Figure 18.
Figure 18 : Représentation graphique de l’alignement des régions entourant le locus SAG41 sur les souches de référence 2603 V/R et A909 selon le logiciel BLASTN. Absence de locus SAG41 chez A909.
Le profil MLVA correspond à la succession des numéros d’allèles des VNTR classés
arbitrairement par ordre croissant : SAG2, SAG3, SAG4, SAG7, SAGTR8, SAG21, SAG22,
SAG41, SAG57. Les génotypes MLVA ont été attribués grâce aux outils bio-informatiques
disponible sur le site http://www.mlva.eu/.
g) Analyse génétique de la population typée par MLVA
Les relations entre les souches typées par MLVA ont été analysées par la construction d’un
dendrogramme selon l’algorithme UPGMA (Unweighted Pair Group Method with Arithmetic
A909 2603 V/R