Académie d’Orléans –Tours Université François-Rabelais
FACULTE DE MEDECINE DE TOURS
Année 2015 N°30
MEMOIRE DE DIPLOME D’ETUDES SPECIALISEES TENANT LIEU DE THESE D’EXERCICE
pour le
DIPLOME D’ETAT DE DOCTEUR EN MEDECINE
Par
Olivier AUGEREAU
Né le 02 Juin 1983, à Talence (33)PRESENTEE ET SOUTENUE PUBLIQUEMENT LE LUNDI 08 JUIN 2015
Apport du MLVA (MultiLocus VNTR Analysis) et de l’étude des loci CRISPR dans le typage et la phylogénie de
Streptococcus agalactiae
Jury
Président : Monsieur le Professeur Jacques Chandenier, PU-PH, UFR Médecine, CHRU Tours
Membres : Madame le Professeur Agnès Rosenau-Ilias, PU émérite Praticien attaché, UFR de Sciences et Techniques, Tours
Madame le Docteur Eve Haguenoer, Docteur en Médecine, Laboratoire ABO+, Tours Monsieur le Professeur Francis Barin, PU-PH, UFR Pharmacie, CHRU Tours Monsieur le Professeur Laurent Mereghetti, PU-PH, UFR Médecine, CHRU Tours Monsieur le Docteur Philippe Lanotte, MCU-PH, UFR Pharmacie, CHRU Tours
Apport du MLVA (MultiLocus VNTR Analysis) et de l’étude des loci CRISPR dans le typage et la phylogénie de Streptococcus agalactiae
RESUME :
Streptococcus agalactiae est une bactérie commensale du microbiote génito-urinaire et
intestinal de l’Homme qui constitue un pathogène majeur pour certaines sous-populations humaines. La compréhension de l’épidémiologie de cette bactérie et la virulence de certains sous-groupes génétiques particuliers au sein de cette espèce constituent des éléments importants dans la connaissance de la physiopathologie de l’infection. Différentes techniques de génotypage ont été développées et appliquées à
S. agalactiae avec desperformances variables en terme de pouvoir discriminant et de pertinence d’information sur la dynamique évolutive de la population bactérienne. Parmi celles–ci, le Multi Locus Sequence Typing (MLST) ciblant des gènes conservés dits de « ménage » reste actuellement la référence.
L’objectif de notre étude a été de développer une méthode de génotypage par l’analyse de neuf loci de VNTR (Variable Number of Tandem Repeats) ou Multi Locus VNTR Analysis (MLVA) suivie d’une révélation par électrophorèse capillaire. Le polymorphisme de ces VNTR a été estimé chez 127 souches de S. agalactiae représentatives de la diversité intra-species dans le but d’évaluer l’intérêt de son utilisation comme marqueur épidémiologique et d’apprécier son rôle dans la dynamique évolutive de l’espèce. Ces résultats ont été comparés à ceux obtenus par MLST et par l’analyse du contenu en spacers du locus CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) récemment décrit.
L’étude du polymorphisme du panel des 9 VNTR a montré un pouvoir discriminant supérieur au MLST, une typabilité satisfaisante et une bonne concordance épidémiologique avec le MLST tout en identifiant des liens phylogénétiques proches de ceux suspectés par DNA arrays. L’analyse du contenu en spacers du locus CRISPR1 présente également un excellent pouvoir discriminant, un complément de génotypage par l’analyse du locus CRISPR2 ne semble pas nécessaire.
MOTS-CLÉS :
Streptococcus agalactiae
Génotypage
Variable Number of Tandem Repeat (VNTR) Multi Locus Sequence Typing (MLST)
Multi Locus VNTR Analysis (MLVA)
Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)
Contribution of MLVA (MultiLocus VNTR Analysis) and of the CRISPR loci's study in the typing and phylogeny of Streptococcus agalactiae
ABSTRACT :
Streptococcus agalactiae
is a commensal bacterium of the human belonging to the digestive microbiota and which is present in the vaginal flora of up to 30%. This bacterium is an emergent pathogen in human especially in the elderly and constitutes the first cause of maternofoetal infection in industrial countries. Understanding the epidemiology of this bacterium and the virulence of some particular genetic subgroups within this species are significant components in the knowledge of the pathophysiology of the infection. Genotyping technologies have been developed and applied to
S. agalactiae with varying performance interms of discriminatory power and information relevance on the changing dynamics of the bacterial population. Among them, the Multi Locus Sequence Typing (MLST) targeting conserved genes called "housekeeping gene" remains the reference.
The aim of our study was to develop a genotyping method by analyzing nine VNTR (Variable Number of Tandem Repeats) loci or Multi Locus VNTR Analysis (MLVA) followed by a capillary electrophoresis revelation. The polymorphism of these VNTR was estimated in 127
S.agalactiae
strains representative of the intra-species diversity to assess its interest as an epidemiological marker and appreciate its role in the evolutionary dynamics of the species.
These results were compared to those obtained by MLST and by analyzing the content of the CRISPR locus (Clustered Regularly Interspaced Short Palindromic Repeats) spacers.
The study of the nine VNTR panel polymorphism showed a higher discriminatory power compared to MLST, satisfactory typability and good epidemiological consistent with MLST while identifying phylogenetic relationships similar to those suspected by DNA arrays. Analysis of the content of the CRISPR1 locus spacers also presents an excellent discriminating power, additional genotyping by CRISPR2 locus analysis does not seem necessary.
KEYWORDS :
Streptococcus agalactiae
Génotyping
Variable Number of Tandem Repeat (VNTR) Multi Locus Sequence Typing (MLST)
Multi Locus VNTR Analysis (MLVA)
Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)
03 avril 2015
UNIVERSITE FRANCOIS RABELAIS F
FAACCUULLTTEE DDEE MMEEDDEECCIINNEE DDEE TTOOUURRSS
DOYEN
Professeur Patrice DIOT
VICE-DOYEN Professeur Henri MARRET
ASSESSEURS
Professeur Denis ANGOULVANT, Pédagogie Professeur Mathias BUCHLER, Relations internationales Professeur Hubert LARDY, Moyens – relations avec l’Université Professeur Anne-Marie LEHR-DRYLEWICZ, Médecine générale
Professeur François MAILLOT, Formation Médicale Continue Professeur Philippe ROINGEARD, Recherche
SECRETAIRE GENERALE Madame Fanny BOBLETER
********
DOYENS HONORAIRES Professeur Emile ARON (†) – 1962-1966 Directeur de l’Ecole de Médecine - 1947-1962 Professeur Georges DESBUQUOIS (†)- 1966-1972
Professeur André GOUAZÉ - 1972-1994 Professeur Jean-Claude ROLLAND – 1994-2004
Professeur Dominique PERROTIN – 2004-2014
PROFESSEURS EMERITES
Professeur Alain AUTRET Professeur Catherine BARTHELEMY
Professeur Jean-Claude BESNARD Professeur Patrick CHOUTET
Professeur Etienne DANQUECHIN-DORVAL Professeur Guy GINIES
Professeur Olivier LE FLOCH Professeur Etienne LEMARIE Professeur Chantal MAURAGE Professeur Léandre POURCELOT
Professeur Michel ROBERT Professeur Jean-Claude ROLLAND
PROFESSEURS HONORAIRES
PROFESSEURS DES UNIVERSITES - PRATICIENS HOSPITALIERS
MM. ALISON Daniel ... Radiologie et Imagerie médicale ANDRES Christian ... Biochimie et Biologie moléculaire ANGOULVANT Denis ... Cardiologie
ARBEILLE Philippe ... Biophysique et Médecine nucléaire AUPART Michel ... Chirurgie thoracique et cardiovasculaire BABUTY Dominique ... Cardiologie
BALLON Nicolas ... Psychiatrie ; Addictologie Mme BARILLOT Isabelle ... Cancérologie ; Radiothérapie
MM. BERNARD Louis ... Maladies infectieuses ; maladies tropicales BEUTTER Patrice ... Oto-Rhino-Laryngologie
BINET Christian ... Hématologie ; Transfusion BODY Gilles ... Gynécologie et Obstétrique BONNARD Christian ... Chirurgie infantile
BONNET Pierre ... Physiologie Mme BONNET-BRILHAULT Frédérique ... Physiologie
MM. BOUGNOUX Philippe ... Cancérologie ; Radiothérapie
BRILHAULT Jean ... Chirurgie orthopédique et traumatologique BRUNEREAU Laurent ... Radiologie et Imagerie médicale
BRUYERE Franck ... Urologie BUCHLER Matthias ... Néphrologie
CALAIS Gilles ... Cancérologie ; Radiothérapie CAMUS Vincent ... Psychiatrie d’adultes
CHANDENIER Jacques ... Parasitologie et Mycologie CHANTEPIE Alain ... Pédiatrie
COLOMBAT Philippe ... Hématologie ; Transfusion
CONSTANS Thierry ... Médecine interne ; Gériatrie et Biologie du vieillissement CORCIA Philippe ... Neurologie
COSNAY Pierre ... Cardiologie
COTTIER Jean-Philippe ... Radiologie et Imagerie médicale COUET Charles ... Nutrition
DANQUECHIN DORVAL Etienne ... Gastroentérologie ; Hépatologie DE LA LANDE DE CALAN Loïc ... Chirurgie digestive
DE TOFFOL Bertrand ... Neurologie
DEQUIN Pierre-François ... Thérapeutique ; médecine d’urgence DESTRIEUX Christophe ... Anatomie
DIOT Patrice ... Pneumologie
DU BOUEXIC de PINIEUX Gonzague . Anatomie & Cytologie pathologiques DUMONT Pascal ... Chirurgie thoracique et cardiovasculaire EL HAGE Wissam ... Psychiatrie adultes
FAUCHIER Laurent ... Cardiologie
FAVARD Luc ... Chirurgie orthopédique et traumatologique FOUQUET Bernard ... Médecine physique et de Réadaptation FRANCOIS Patrick ... Neurochirurgie
FROMONT-HANKARD Gaëlle ... Anatomie & Cytologie pathologiques
FUSCIARDI Jacques ... Anesthésiologie et Réanimation chirurgicale ; médecine d’urgence GAILLARD Philippe ... Psychiatrie d'Adultes
GYAN Emmanuel... Hématologie ; thérapie cellulaire
GOGA Dominique ... Chirurgie maxillo-faciale et Stomatologie GOUDEAU Alain ... Bactériologie -Virologie ; Hygiène hospitalière GOUPILLE Philippe ... Rhumatologie
GRUEL Yves ... Hématologie ; Transfusion
GUERIF Fabrice ... Biologie et Médecine du développement et de la reproduction GUILMOT Jean-Louis ... Chirurgie vasculaire ; Médecine vasculaire
GUYETANT Serge ... Anatomie et Cytologie pathologiques HAILLOT Olivier ... Urologie
HALIMI Jean-Michel ... Thérapeutique ; médecine d’urgence (Néphrologie et Immunologie clinique) HANKARD Régis ... Pédiatrie
HERAULT Olivier ... Hématologie ; transfusion HERBRETEAU Denis ... Radiologie et Imagerie médicale
Mme HOMMET Caroline ... Médecine interne, Gériatrie et Biologie du vieillissement MM. HUTEN Noël ... Chirurgie générale
LABARTHE François ... Pédiatrie
LAFFON Marc ... Anesthésiologie et Réanimation chirurgicale ; médecine d’urgence LARDY Hubert ... Chirurgie infantile
LAURE Boris ... Chirurgie maxillo-faciale et stomatologie LEBRANCHU Yvon ... Immunologie
LECOMTE Thierry ... Gastroentérologie ; hépatologie ; addictologie
LINASSIER Claude ... Cancérologie ; Radiothérapie LORETTE Gérard ... Dermato-Vénéréologie MACHET Laurent ... Dermato-Vénéréologie MAILLOT François ... Médecine Interne MARCHAND-ADAM Sylvain ... Pneumologie
MARRET Henri ... Gynécologie et Obstétrique MARUANI Annabel ... Dermatologie
MEREGHETTI Laurent ... Bactériologie-Virologie ; Hygiène hospitalière MORINIERE Sylvain ... O.R.L.
MULLEMAN Denis ... Rhumatologie
PAGES Jean-Christophe ... Biochimie et biologie moléculaire
PAINTAUD Gilles ... Pharmacologie fondamentale, Pharmacologie clinique PATAT Frédéric ... Biophysique et Médecine nucléaire
PERROTIN Dominique ... Réanimation médicale ; médecine d’urgence PERROTIN Franck ... Gynécologie et Obstétrique
PISELLA Pierre-Jean ... Ophtalmologie
QUENTIN Roland ... Bactériologie-Virologie ; Hygiène hospitalière REMERAND Francis ... Anesthésiologie et Réanimation chirurgicale ROBIER Alain ... Oto-Rhino-Laryngologie
ROINGEARD Philippe ... Biologie cellulaire
ROSSET Philippe ... Chirurgie orthopédique et traumatologique
ROYERE Dominique ... Biologie et Médecine du développement et de la Reproduction RUSCH Emmanuel ... Epidémiologie, Economie de la Santé et Prévention
SALAME Ephrem ... Chirurgie digestive
SALIBA Elie... Biologie et Médecine du développement et de la Reproduction Mme SANTIAGO-RIBEIRO Maria ... Biophysique et Médecine Nucléaire
MM. SIRINELLI Dominique ... Radiologie et Imagerie médicale THOMAS-CASTELNAU Pierre ... Pédiatrie
Mme TOUTAIN Annick ... Génétique
MM. VAILLANT Loïc ... Dermato-Vénéréologie VELUT Stéphane ... Anatomie
WATIER Hervé ... Immunologie.
PROFESSEUR DES UNIVERSITES DE MEDECINE GENERALE M. LEBEAU Jean-Pierre ... Médecine Générale Mme LEHR-DRYLEWICZ Anne-Marie ... Médecine Générale
PROFESSEURS ASSOCIES
MM. MALLET Donatien ... Soins palliatifs POTIER Alain ... Médecine Générale ROBERT Jean ... Médecine Générale
MAITRES DE CONFERENCES DES UNIVERSITES - PRATICIENS HOSPITALIERS
Mme ANGOULVANT Théodora ... Pharmacologie fondamentale ; pharmacologie clinique : addictologie M. BAKHOS David ... Physiologie
Mme BERNARD-BRUNET Anne ... Biostatistiques, Informatique médical et Technologies de Communication M. BERTRAND Philippe ... Biostatistiques, Informatique médical et Technologies de Communication Mme BLANCHARD Emmanuelle ... Biologie cellulaire
BLASCO Hélène ... Biochimie et biologie moléculaire M. BOISSINOT Éric ... Physiologie
Mme CAILLE Agnès ... Biostatistiques, Informatique médical et Technologies de Communication M. DESOUBEAUX Guillaume ... Parasitologie et mycologie
Mme DUFOUR Diane ... Biophysique et Médecine nucléaire M. EHRMANN Stephan ... Réanimation médicale
Mme FOUQUET-BERGEMER Anne-Marie .. Anatomie et Cytologie pathologiques M. GATAULT Philippe ... Néphrologie
ROUMY Jérôme... Biophysique et médecine nucléaire in vitro Mme SAINT-MARTIN Pauline ... Médecine légale et Droit de la santé MM. SAMIMI Mahtab ... Dermatologie
TERNANT David ... Pharmacologie – toxicologie
Mme VALENTIN-DOMELIER Anne-Sophie .. Bactériologie – virologie ; hygiène hospitalière M. VOURC’H Patrick... Biochimie et Biologie moléculaire
MAITRES DE CONFERENCES
Mme ESNARD Annick ... Biologie cellulaire M. LEMOINE Maël ... Philosophie
Mme MONJAUZE Cécile ... Sciences du langage - Orthophonie M. PATIENT Romuald ... Biologie cellulaire
MAITRE DE CONFERENCES ASSOCIE
Mmes HUAS Caroline ... Médecine Générale RENOUX-JACQUET Cécile ... Médecine Générale
CHERCHEURS INSERM - CNRS - INRA
M. BOUAKAZ Ayache ... Directeur de Recherche INSERM – UMR INSERM 930 Mmes BRUNEAU Nicole ... Chargée de Recherche INSERM – UMR INSERM 930
CHALON Sylvie ... Directeur de Recherche INSERM – UMR INSERM 930 MM. CHARBONNEAU Michel ... Directeur de Recherche CNRS – UMR CNRS 7292
COURTY Yves ... Chargé de Recherche CNRS – UMR INSERM 1100 GAUDRAY Patrick ... Directeur de Recherche CNRS – UMR CNRS 7292 GILOT Philippe ... Chargé de Recherche INRA – UMR INRA 1282 GOUILLEUX Fabrice ... Directeur de Recherche CNRS – UMR CNRS 7292 Mmes GOMOT Marie ... Chargée de Recherche INSERM – UMR INSERM 930
GRANDIN Nathalie ... Chargée de Recherche CNRS – UMR CNRS 7292 HEUZE-VOURCH Nathalie ... Chargée de Recherche INSERM – UMR INSERM 1100 MM. KORKMAZ Brice ... Chargé de Recherche INSERM – UMR INSERM 1100
LAUMONNIER Frédéric ... Chargé de Recherche INSERM - UMR INSERM 930 LE PAPE Alain ... Directeur de Recherche CNRS – UMR INSERM 1100 Mme MARTINEAU Joëlle ... Chargée de Recherche INSERM – UMR INSERM 930 MM. MAZURIER Frédéric ... Directeur de Recherche INSERM – UMR CNRS 7292
MEUNIER Jean-Christophe ... Chargé de Recherche INSERM – UMR INSERM 966 RAOUL William ... Chargé de Recherche INSERM – UMR CNRS 7292 Mme RIO Pascale ... Chargée de Recherche INSERM – UMR INSERM 1069 M. SI TAHAR Mustapha ... Directeur de Recherche INSERM – UMR INSERM 1100
CHARGES D’ENSEIGNEMENT
Pour la Faculté de Médecine
Mme BIRMELE Béatrice ... Praticien Hospitalier (éthique médicale) M. BOULAIN Thierry ... Praticien Hospitalier (CSCT)
Mme CRINIERE Lise ... Praticien Hospitalier (endocrinologie) M. GAROT Denis ... Praticien Hospitalier (sémiologie) Mmes MAGNAN Julie ... Praticien Hospitalier (sémiologie)
MERCIER Emmanuelle ... Praticien Hospitalier (CSCT) Pour l’Ecole d’Orthophonie
Mme DELORE Claire ... Orthophoniste MM. GOUIN Jean-Marie ... Praticien Hospitalier
MONDON Karl ... Praticien Hospitalier Mme PERRIER Danièle ... Orthophoniste Pour l’Ecole d’Orthoptie
Mme LALA Emmanuelle ... Praticien Hospitalier M. MAJZOUB Samuel... Praticien Hospitalier
SERMENT D’HIPPOCRATE
E n présence des Maîtres de cette Faculté, de mes chers condisciples
et selon la tradition d’Hippocrate,
je promets et je jure d’être fidèle aux lois de l’honneur et de la probité dans l’exercice de la Médecine.
Je donnerai mes soins gratuits à l’indigent,
et n’exigerai jamais un salaire au-dessus de mon travail.
Admis dans l’intérieur des maisons, mes yeux ne verront pas ce qui s’y passe, ma langue taira
les secrets qui me seront confiés et mon état ne servira pas à corrompre les mœurs ni à favoriser le crime.
Respectueux et reconnaissant envers mes Maîtres, je rendrai à leurs enfants
l’instruction que j’ai reçue de leurs pères.
Que les hommes m’accordent leur estime
REMERCIEMENTS
Monsieur le Professeur Jacques CHANDENIER
Je vous remercie d’avoir accepté de présider cette thèse et de juger ce travail. Je vous remercie de votre enseignement de qualité et de votre accueil au sein de votre service de Parasitologie, Mycologie et Médecine Tropicale. Veuillez trouver ici le témoignage de ma reconnaissance et de mon profond respect.
Monsieur le Professeur Francis BARIN
Je vous remercie d’avoir accepté de juger ce travail. Je vous remercie également pour votre disponibilité et votre enseignement au cours de mon passage au sein du laboratoire de Virologie. Merci d’avoir partagé avec moi quelques bribes de votre immense savoir, ces échanges avec vous ont toujours été fructueux et un plaisir. C’est un honneur pour moi de vous compter parmi les membres de ce jury.
Monsieur le Professeur Laurent MEREGHETTI
Je vous remercie d’avoir accepté de juger ce travail. Merci de votre enseignement et
encadrement de qualité lors de mon stage malgré vos très grandes responsabilités. Merci
également de m’avoir accueilli pendant quelques mois au sein de l’unité « Bactéries et
Risque Materno-fœtal ». Soyez assuré de ma gratitude.
Monsieur le Docteur Philippe LANOTTE
Je vous remercie d’avoir dirigé ce travail et de m’avoir encadré avec rigueur, attention et beaucoup de patience tout au long de son élaboration. Je vous remercie pour votre enseignement et votre grande disponibilité, pour vos qualités tant professionnelles qu’humaines. Veuillez trouver ici l’expression ma gratitude et de ma sincère considération.
Madame le Professeur Agnès ROSENAU-ILIAS
Je vous remercie d’avoir accepté de juger ce travail. Vous m’avez accompagné dans mes premiers pas dans le monde de la microbiologie. Veuillez recevoir mes sincères remerciements.
Madame le Docteur Eve HAGUENOER
Je te remercie d’avoir accepté de juger ce travail qui s’inscrit dans la continuité du
tien. Ton mémoire de thèse a été une source d’inspiration pour moi. J’espère que tu
prendras du plaisir à la lecture de mon mémoire et qu’il te rappellera peut-être quelques
souvenirs.
JE REMERCIE EGALEMENT
Clément, bien entendu, pour ta grande aide dans la réalisation de ce travail. Mais également pour ces 2 ans et demi d’internat partagés, avec ces séjours dans des hôtels improbables pour les divers cours de DES et de DU ; et pour tes grandes qualités humaines. Je te souhaite tout le bonheur et la réussite que tu mérites.
Merci à toute l’équipe de l’unité de recherche « Bactéries et Risque Materno-fœtal » pour leur intérêt apporté à ce projet et leur précieux conseils ; et en particulier à Amine et Kévin pour leur très grande aide en bio-informatique et pour tant d’autres choses encore.
Merci à Cécile et à Sylvie pour ces échanges fructueux sur la microbiologie… parfois autour d’un petit verre.
Merci aux équipes du laboratoire de Bactériologie-Virologie pour leur accueil. Et en particulier à Catherine Louin, pour ta gentillesse, l’intérêt que tu as porté à mes échecs ainsi que tes conseils ; et à Brigitte Berton.
Merci à Thierry Cochard de l’INRA pour l’analyse des résultats de MLVA sur le logiciel Bionumerics.
Un immense merci aux équipes des laboratoires du CHR d’Orléans :
Aux biologistes du laboratoire de Microbiologie : à Didier pour les échanges bibliographiques et pour m’avoir intégré dans l’équipe, Laurent pour ta bonne humeur, ton accompagnement à la paillasse et sur les antibiogrammes, Jérôme pour toutes tes qualités, trop nombreuses pour être énumérées ici et Aurélie.
Aux techniciennes sans oublier les 3 gars : José, Didier et Joël. Merci pour tous ces bons moments, vous me manquez !
Aux biologistes du laboratoire d’Hématologie : à Sophie pour votre rigueur en
cytologie (et sur les microcytoses), Thomas pour ton enseignement en cytologie et CMF et
Isabelle pour ton enseignement en hémostase.
Aux techniciens et en particulier Jacqueline, parce que tu le vaux bien, la petite Sophie et les moelleuses : Francine, Mélanie et ma super Ginette dont le son de la douce voix restera un doux souvenir.
Et aux co-internes Thomas dit Pablo et sa voiture sans permis, à Candice et à ma petite Anne-Blandine préférée, mais également la seule que je connaisse : j’ai eu trop de chance d’être 6 mois avec toi ! Merci pour tes encouragements et ton soutien. Ces 6 mois partagés avec toi furent très enrichissants.
ET AUSSI
Aux amis : Sébastien, Loïc, Jeff, Sylvain, ma Martine, Lucie, Adrien, Lauranne et la petite Louise, le grand Romain….
A mes parents : un très grand merci pour votre soutien et vos encouragement pendant ces très, très longues études. Merci d’avoir toujours cru en moi.
A Isabelle, pour ta relecture très assidue de ce mémoire. Merci pour tous ces bons moments
partagés et pour tout ce que tu m’apportes chaque jour.
TABLE DES MATIERES
INDEX DES FIGURES ...3
INDEX DES TABLEAUX ...5
INDEX DES ANNEXES ...5
ABREVIATIONS ...6
I. Introduction ...8
A. Epidémiologie de Streptococcus agalactiae ...8
B. Facteurs de pathogénicité de S. agalactiae ...9
C. Génétique des populations bactériennes ... 12
1. « Core genome » et « dispensable genome » ... 13
2. Implication des Variable Number of Tandem Repeat (VNTR) dans la variation génomique . 14 3. Lysogénie et virulence ... 19
4. Les systèmes CRIPSR-Cas ... 21
D. Méthodes de typage moléculaire ... 26
1. Les méthodes basées sur la mesure de longueur de fragments obtenus : ... 28
2. Les méthodes basées sur le séquençage par méthode de Sanger ou par pyroséquençage : 31 3. Les méthodes basées sur des techniques d’hybridation, macro ou microarrays ... 32
E. Objectifs ... 34
II. Matériels et méthodes ... 35
A. Souches bactériennes ... 35
1. Population étudiée ... 35
2. Extraction et préparation des ADN bactériens ... 35
B. Typage moléculaire ... 36
1. Typage moléculaire par MLST ... 36
2. Typage moléculaire par MLVA ... 38
3. Typage moléculaire par séquençage du locus CRISPR1 ... 46
4. Test statistiques utilisés pour comparaison des méthodes de typage ... 48
C. Exploration du locus CRISPR2 ... 49
1. Amplification-séquençage du locus CRISPR2 ... 49
2. Analyse in silico du locus CRISPR2 ... 50
III. Résultats ... 53
A. Typage moléculaire ... 53
1. Typage moléculaire par MLST ... 53
2. Typage moléculaire par MLVA ... 56
3. Typage moléculaire par séquençage du locus CRISPR1 ... 65
4. Comparaison des différentes méthodes de typages ... 68
B. Etude du locus CRISPR2 ... 69
1. Description des résultats obtenus in vitro ... 69
2. Comparaison avec les résultats obtenus par l’analyse in silico de la base de donnée NCBI . 71 3. Analyse du polymorphisme et origine des spacers ... 71
4. Organisation globale du système CRISPR2-Cas déterminée par analyse in silico ... 73
IV. Discussion ... 77
V. Conclusion ... 83
VI. Annexes ... 85
VII. Bibliographie ... 90
INDEX DES FIGURES
Figure 1 : Mécanismes d’adhérence et d’invasion cellulaire chez S.agalactiae ...10
Figure 2 : Mécanismes d’évasion immune chez S. agalactiae...11
Figure 3 : Composition du « core genome » et du « dispensable genome » ...14
Figure 4 : Conséquences de la « phase variation » et de l’« antigenic variation » sur l’expression des gènes des « contingency loci » ...15
Figure 5 : Représentation schématique de différents types de Tandem Repeats ...16
Figure 6 : Représentation schématique du réarrangement des TR par mécanisme de glissement ...17
Figure 7 : Représentation schématique d’exemples de mécanismes de recombinaison évoqués pour expliquer certains réarrangements de TR ...19
Figure 9 : Représentation schématique de la structure génétique d’un système CRISPR-Cas 21 Figure 10 : Représentation et relations phylogénétiques entre les 3 types et dix sous-types d’opérons cas selon la classification définie par Makarova ...22
Figure 11 : Représentation du mécanisme d’action du système CRISPR-Cas ...24
Figure 12 : Mécanismes de l’expression et de l’interférence dans les 3 types de systèmes CRISPR-Cas ...25
Figure 13 : Résumé des différentes méthodes de génotypage reposant sur la mesure de longueur de fragments ...28
Figure 14 : Principe du MultiLocus Variable Number of Tandem Repeat Analysis ...29
Figure 15 : Résumé des différentes méthodes de typage basées sur le séquençage ...31
Figure 16 : Organisation des 2 systèmes CRISPR-Cas chez S. agalactiae ...33
Figure 17 : Position des loci des différents marqueurs employés sur le génome de la souche de référence 2603 V/R ...37
Figure 18 : Représentation graphique de l’alignement des régions entourant le locus SAG41 sur les souches de référence 2603 V/R et A909 ...45
Figure 19 : Génotypage adapté du locus CRISPR1 ...47
Figure 20 : Position des amorces utilisées pour amplification et séquençage du locus CRISPR2
...49
Figure 21 : Distribution des profils alléliques (ST) des souches de Streptococcus agalactiae .54
Figure 22 : Relations phylogénétiques entre les souches de S. agalactiae typées par MLST ..55
Figure 23 : Exemple d’électrophorégrammes obtenus pour le génotypage MLVA de la souche
C1 ...56
Figure 24 : Répartition des allèles de SAG21 par origine de souche ...59
Figure 25 : Répartition des allèles de SAG41 et SAG57 par origine de souche ...60
Figure 26 : Relations phylogénétiques entre les souches de S. agalactiae typées par MLVA .64
Figure 27 : Relations phylogénétiques déterminées à partir de l’analyse des génotypes
CRISPR1 ...68
Figure 28 : Représentation graphique des loci CRISPR sur fichier Excel CRISPR database
version II (Danisco, 2010)...70
Figure 29 : Représentation graphique de l’ensemble des loci CRISPR2 identifiés sur fichier
Excel CRISPR database version II (Danisco, 2010) ...72
Figure 30 : Organisation de la région occupée par le système CRISPR2-Cas chez S. agalactiae
...74
Figure 31 : Caractéristiques des différents profils de locus CRISPR2 observables dans les
Sequence Type étudiés ...75
Figure 32 : Comparaison de séquences du gène de l’hémolysine A entre différentes espèces
de Streptocoques (BioEdit) ...76
INDEX DES TABLEAUX
Tableau I : Résumé des caractéristiques des TR étudiés au sein de l’unité « Bactéries et
Risque Materno-fœtal » ...41
Tableau II : Amorces utilisées pour le MLVA ...42
Tableau III : Résumé des caractéristiques des 3 mix de PCR multiplexe pour MLVA ...42
Tableau IV : Amorces utilisées pour amplification et séquençage du locus CRISPR2 ...49
Tableau V : Caractéristiques des 9 loci de VNTR étudiés chez les 123 souches de S. agalactiae et les 4 souches de référence ...57
Tableau VI : Génotypes MLVA déterminés à partir des profils alléliques des 9 loci de VNTR .62 Tableau VIII : Représentation schématique des homologies entre ST ...64
Tableau IX : Génotypes CRISPR1 de notre souchier ...66
Tableau X : Caractéristiques des méthodes de typage : congruence par index de Rand ajusté et pouvoir discriminant par index de Simpson ...68
Tableau XI : Prévalence du locus CRISPR2 selon les amorces définies par Lopez-Sanchez en fonction du Sequence Type ...71
INDEX DES ANNEXES Annexe 1 : Composition génomique de la région contigüe au locus CRISPR2 ...85
Annexe 2 : Prévalence du locus CRISPR2 en fonction du Sequence Type sur l’ensemble des
souches étudiées ...88
ABREVIATIONS
ADN : Acide désoxyribonucléique ARN : Acide ribonucléique
AMP : AntiMicrobial Peptides Cas : CRISPR associated
Cascade : CRISPR-associated complex for antiviral defense CC : complexe clonal
CRISPR : Clustered Regularly Interspaced Short Palindromic Repeats crRNA : CRISPR RNA
crRNP : complexe CRISPR ribonucléoprotéine DR : Direct Repeats
DVR : Direct Variant Repeats EGM : éléments génétiques mobiles ICE : Integrative and Conjugative Element IMF : infection materno-fœtale
kb : kilobase
MLEE : MultiLocus Enzyme Electrophoresis MLST : MultiLocus Séquence Typing
MLVA : MultiLocus VNTR Analysis
NCBI : National Center for Biotechnology Information nt : nucléotides
PAM : Proto-spacer Adjacent Motif pb : paires de bases
PBP1a : Penicillin Binding Protein
PCR : Polymerase Chain Reaction
PFGE : Pulsed Field Gel Electrophoresis
SLV : Single Locus Variant
tracrRNA : transactivating crRNA
UPGMA : Unweighted Pair Group Method with Arithmetic Average VNTR : Variable Number of Tandem Repeat
I. Introduction
A. Epidémiologie de Streptococcus agalactiae
Streptococcus agalactiae est une bactérie commensale du microbiote génito-urinaire et
digestif de l’homme et de la femme avec un taux de portage qui varie entre 10 et 36%
(Trijbels-Smeulders et al., 2004). Les hommes et les bovins en sont le principal réservoir, ce germe étant plus rarement isolé chez d’autres espèces animales mais gardant un spectre d’hôtes relativement large. C’est dans les années 1930 que Rebecca Lancefield a décrit
S. agalactiaecomme étant un streptocoque du groupe B et a divisé l’espèce en plusieurs sérotypes. Ce germe était alors connu comme un des principaux agents de mastite chez les bovidés. Par ailleurs, jusque dans les années 1960, les cas identifiés d’infections humaines à
S. agalactiae étaient rares et sporadiques, uniquement décrits dans la littérature par Fry(Fry, 1938) avec trois formes létales de fièvres puerpérales.
Dans les années 1960 à 1970, cette bactérie a montré un potentiel pathogène croissant chez le nouveau-né (McCracken, 1973), devenant rapidement la première cause d’infections materno-fœtales (IMF) bactériennes dans les pays industrialisés. Deux formes cliniques des infections du nouveau-né sont différenciées selon leur délai de survenue. Les formes précoces surviennent dans la première semaine de vie. Il s'agit essentiellement des bactériémies et/ou des infections pulmonaires, associées à une atteinte méningée dans moins de 10 % des cas. Les formes tardives surviennent après la première semaine de vie et jusqu'à l'âge de 3 mois, les bactériémies et les atteintes méningées prédominent.
Selon les dernières données épidémiologiques françaises, l’imputabilité relative des divers sérotypes est différente entre les IMF précoces et tardives : sérotype III (62%), Ia (28%), Ib (5%), V (3%) versus sérotype III (83%), Ia (7%), Ib (4%) et V (1,5%) respectivement (Poyart et al., 2008).
Cette bactérie est également responsable d'infections chez la femme enceinte : bactériémie,
L’efficacité d’une antibioprophylaxie per-partum sur la diminution des complications maternelles et des infections néonatales précoces ayant été démontrée (Boyer and Gotoff, 1986), des recommandations concernant le dépistage et l’antibioprophylaxie vis-à-vis de
S. agalactiae ont alors été adoptées et sontrégulièrement révisées (Verani et al., 2010). En France, cette prévention repose sur le dépistage systématique du portage vaginal de
S.agalactiae chez la femme enceinte entre 34 et 38 semaines d’aménorrhée avec, en cas de
positivité, une antibioprophylaxie la plus précoce possible au cours du travail reposant sur la pénicilline G ou l’amoxicilline par voie intraveineuse en l’absence d’allergie (HAS). Ces mesures ont permis une diminution des complications maternelles du per-partum et des syndromes précoces. Elles n’ont pas montré d’efficacité sur la survenue des syndromes tardifs dont la physiopathologie reste discutée (Jordan et al., 2008).
S. agalactiae est également devenu un pathogène émergent chez l’adulte, hors contexte
obstétrical. Aux USA, l'incidence des infections invasives a augmenté entre 1990 et 2007, de 3,6 à 7,3 cas pour 100 000 individus, se manifestant par des bactériémies sans porte d’entrée identifiée, infections de la peau et des tissus mous, pneumopathies et ostéomyélites (Skoff et al., 2009) sur terrain débilité avec un taux de mortalité supérieur à celui observé dans les infections néonatales (Phares et al., 2008). Le sérotype V est le plus fréquent (33%), devant le Ia (25%), le III (20%), et le Ib (13%) (Tazi et al., 2011), soit une distribution équivalente à celle du portage asymptomatique témoignant du caractère opportuniste de ce germe dans ce contexte.
La modification de l’épidémiologie des pathologies associées à
S. agalactiae s’explique, aumoins en partie, par l’émergence de certains clones possédant une spécificité d’hôte et des facteurs de virulence leur conférant un pouvoir pathogène particulier au sein d’une sous- population humaine.
B. Facteurs de pathogénicité de S. agalactiae
L’étude des mécanismes moléculaires de la virulence de
S. agalactiaea permis la mise en évidence de plusieurs protéines clés impliquées dans chacune des étapes de sa pathogénèse.
Ces protéines de surface jouent un rôle essentiel dans la virulence en favorisant les
interactions avec les cellules de l'hôte permettant adhésion et/ou invasion, et
l'échappement aux défenses immunitaires.
Les protéines FbsA/B, BibA et les pili sont impliqués dans l’attachement à la cellule hôte ou aux composants de la matrice extracellulaire. L’absence de pili est corrélée à une réduction de l’adhérence aux cellules épithéliales chez des mutants déficients. L'adhésion au fibrinogène est médiée par le motif répété de la protéine d’ancrage FbsA, qui a un rôle dans la promotion de l’invasion épithéliale ou endothéliale. Il semble que la β- hémolysine/cytolysine soit impliquée dans le processus d’invasion : la rupture des barrières de l’hôte permettrait de démasquer de nouveaux récepteurs sur la membrane basale (Figure 1). Dans les syndromes précoces, il existe des lésions importantes de l’épithélium pulmonaire et de l’endothélium attribuées à l’action de la β-hémolysine/cytolysine (Maisey et al., 2008).
Figure 1 : Mécanismes d’adhérence et d’invasion cellulaire chez S.agalactiae (d'après Maisey et al., 2008). Les protéines
D'autre part, l’échappement au système immunitaire est permis grâce à la capsule polysaccharidique qui, de par la présence de groupements acide sialique, confère une protection antiphagocytaire en empêchant le dépôt de la fraction C3 du complément à la surface de la bactérie. La réduction du dépôt de C3 est corrélée à une diminution de la production de C5a conduisant à une réduction de la mobilisation des polynucléaires neutrophiles. L’adhésine BibA est également impliquée dans l’inhibition d’autres composants du complément. Pour échapper à la phagocytose,
S. agalactiae peut résister austress oxydatif grâce à l’enzyme SodA qui neutralise les ions superoxydes. Il est également capable d’induire l’apoptose des macrophages par le biais notamment de la β- hémolysine/cytolysine mais par des mécanismes encore mal connus. Enfin, la PBP1a (Penicillin Binding Protein) et la sous-unité pilB des pili confèrent une résistance aux AMP (AntiMicrobial Peptides) produits par différents types de cellules (Figure 2) (Maisey et al., 2008).
Figure 2 : Mécanismes d’évasion immune chez S. agalactiae (d'après Maisey et al., 2008). La β-hémolysine/cytolysine peut favoriser la survie de la bactérie en induisant des lésions pro-apoptotiques ou la cytolyse des les phagocytes.
L’enzyme SodA la protège de la mort induite par les phagocytes via les espèces réactives de l’oxygène. La protéine PBP1a et la sous-unité pilB des pili contribuent à la résistance vis-à-vis des AMP. BibA et les groupements acide sialique de la capsule polysaccharidique inhibent le processus de clairance en interférant avec les composants du complément.
Plusieurs de ces protéines ont été identifiées dans une sous-population bactérienne épidémiologiquement individualisée de par son implication dans les IMF et en particulier les formes tardives.
C. Génétique des populations bactériennes
Les premières études de génétique des populations basées sur le génotypage de
Streptococcus agalactiae par MultiLocus Enzyme Electrophoresis (MLEE) et MultiLocusSéquence Typing (MLST) ont mis en évidence un cluster significativement associé aux IMF (Jones et al., 2003b; Musser et al., 1989). Certaines études basées sur le MLST et sur l’acquisition de séquences d’insertion ont laissé supposer que le clone ST17, homogène, spécifiquement adapté à l’homme et préférentiellement associé aux IMF tardives et aux méningites (Manning et al., 2009), serait phylogénétiquement lié à un clone ancestral d’origine bovine (Bisharat et al., 2004; Héry-Arnaud et al., 2005), alors que d’autres études contredisent cette hypothèse (Bohnsack et al., 2004; Sukhnanand et al., 2005).
La génétique des populations microbiennes a pour but de mesurer la diversité génétique et sa variabilité dans l’espace-temps, de déterminer la distance génétique entre les individus, la structure intra-spécifique et d’analyser la microévolution en déterminant le rôle relatif des modifications génomiques. La grande variation de la diversité intra-spécifique est le reflet de la période de temps écoulé depuis la divergence à partir d’un ancêtre commun, ainsi que de la variabilité des niches écologiques que l’espèce a réussi à exploiter.
Une espèce bactérienne peut être considérée comme un groupe de souches ayant entre elles un degré de similarité élevé tout en respectant plusieurs caractères indépendants. Les souches d’une même espèce ont en général une homologie au niveau génomique de l’ordre de 70%. Deux types de mécanismes évolutifs coexistent :
Les transferts horizontaux intra ou inter espèces par conjugaison, transposition,
Les mécanismes verticaux où le chromosome et les plasmides sont transmis aux cellules filles après duplication. La diversification est alors liée aux mutations ponctuelles, duplications, délétions ou transpositions.
La structure d’une population bactérienne est le plus souvent clonale hors espèces naturellement compétentes pour la transformation définissant les modèles panmictique et panmictique épidémique (Smith et al., 1993).
Les taux de mutations et de recombinaisons, minimisés par les mécanismes de réparations, sont en général très faibles. Si l’on considère que les variations génétiques s’effectuent au hasard et à une fréquence constante dans le temps, la distance génétique entre deux lignées est alors proportionnelle au temps écoulé, on parle d’horloge moléculaire. Néanmoins, les mécanismes et les vitesses d’évolution, en fonction de la région génomique d’une part et du stress environnemental auquel est soumise la bactérie d’autre part, restent des questions ouvertes. En effet, on divise actuellement le génome bactérien en « core genome » très conservé et donc à faible potentiel évolutif, et en « dispensable genome » de composition très variable dont les gènes sont issus d’éléments génétiques mobiles (EGM) et en particulier de bactériophages. L’intégration de ces EGM dans le génome est conditionnée par les capacités de défense des bactéries et notamment les systèmes CRISPR-Cas, responsables d’une immunité adaptative, de découverte récente (Barrangou et al., 2007). Par ailleurs, la
« phase variation » et l’« antigenic variation », responsables d’une adaptation phénotypique rapide, reposent sur des mécanismes épigénétiques mais également génétiques impliquant des régions hautement variables.
1. « Core genome » et « dispensable genome »
Le « core genome » est composé des gènes présents chez toutes les souches d’une espèce
donnée incluant tous les gènes de ménage, ou « housekeeping genes », codant des
protéines essentielles du métabolisme ou des gènes impliqués dans la régulation de la
transcription. Il est habituellement très conservé puisque tout évènement majeur le
modifiant tend à aboutir à un individu non viable.
En revanche, les modifications génomiques portant sur le « dispensable genome », composé des gènes accessoires présents uniquement chez une partie des souches de l’espèce n’altèrent pas la fonction et sont une source importante de polymorphisme. Le
« dispensable genome » est composé de gènes provenant de phages ou d’autres EGM et pouvant coder entre autres des « pathways » biochimiques supplémentaires ou des protéines impliquées dans l’interaction avec l’environnement : facteurs de colonisation ou de virulence. Il est souvent issu d’autres espèces bactériennes par transfert horizontal, regroupé au sein d’îlots génomiques à contenu GC différent du GC pour cent du « core genome ». La majorité de ces gènes semblent conférer un avantage sélectif aux bactéries qui les hébergent, seul un petit nombre sert à promouvoir leur propagation (Lilley et al., 2000).
Ils sont responsables de bonds évolutifs majeurs en terme de « fitness », d’adaptation à de nouvelles niches écologiques et d’acquisition de mécanismes de résistance (Hacker and Carniel, 2001).
Le contenu en gènes du « core » et du « dispensable genome » est rappelé Figure 3.
Figure 3 : Composition du « core genome » et du « dispensable genome » (Hacker and Carniel, 2001).
La « phase variation » et l’« antigenic variation », support de la plasticité, permettent une commutation phénotypique de la bactérie visant à améliorer le « fitness » face à des modifications environnementales brutales. Elles peuvent être le fait de mécanismes épigénétiques mais également de variations génétiques localisées et rapides au niveau de loci d’ADN hypervariables ou « contingency loci » (Moxon et al., 1994) contrôlant principalement mais non exclusivement l’expression d’antigènes de surface. Plusieurs mécanismes sont impliqués dans ces modifications génétiques : les recombinaisons homologues, les recombinaisons spécifiques de sites et la contraction ou l’extension des Variable Number of Tandem Repeat (VNTR) en sont des exemples (Rando and Verstrepen, 2007; van der Woude and Bäumler, 2004) ; (Figure 4).
Figure 4 : Conséquences de la « phase variation » et de l’« antigenic variation » sur l’expression des gènes des
« contingency loci » (Bayliss, 2009). L’allèle constitutif du gène et son produit sont représentés en gris, l’allèle silencieux et son produit en noir. (a) L’insertion par recombinaison d’une partie de l’allèle silencieux au sein de l’allèle constitutif est responsable d’une variation qualitative de l’expression du gène et de la variation antigénique de la structure de surface issue de l’expression de ce gène. On parle alors d’« antigenic variation ». (c) Recombinaison spécifique avec altération de l’orientation du promoteur du gène responsable d’un effet « on/off » sur l’expression du gène. Il y a variation quantitative de l’expression, on parle alors de « phase variation ». (b) Recombinaison spécifique avec altération de l’orientation du promoteur, situé entre 2 variants alléliques : l’un constitutif, l’autre silencieux. Cette recombinaison est responsable d’un effet « on/off » : arrêt de l’expression de l’allèle constitutif et en parallèle expression de l’allèle jusqu’alors silencieux, et donc d’une « antigenic variation ».
Les VNTR sont la seconde source de variation génétique après les SNP (Single Nucleotide Polymorphism). Il s’agit de séquences de 1 à plus de 200 nucléotides, répétées en tandem, de taille variable, de localisation intra- ou inter-génique retrouvées à la fois chez les eucaryotes et les procaryotes (Figure 5).
Figure 5 : Représentation schématique de différents types de Tandem Repeats (Zhou et al., 2014). (a) La séquence du motif unitaire peut n’être que partiellement conservée, on parle alors de TR dégénéré. (b) Différentes taille de motif unitaire définissant les micro, mini et macrosatellites. Les espaces entre les unités répétées ne sont présents que pour clarifier la figure.
Du fait de leur structure favorisant les erreurs de l’ADN polymérase, ces séquences sont des régions hypervariables par contraction (délétion) ou expansion (insertion) de l’unité répétée.
Le modèle de genèse de ces variations le plus largement accepté est celui de « strand-
slippage mispairing » ou glissement de la polymérase (Streisinger et al., 1966) pour les
Tandem Repeats (TR) dont le motif unitaire est de petite taille alors que des phénomènes de
recombinaison seraient plus fréquents pour ceux ayant un motif unitaire de grande taille
(Gemayel et al., 2010) ; (Figure 6 et Figure 7).
Figure 6 : Représentation schématique du réarrangement des TR par mécanisme de glissement (Zhou et al., 2014). Les motifs unitaires sont représentés par des rectangles (vert clair pour le brin d’ADN en cours de synthèse et vert foncé pour le brin parental), les espaces entre les motifs unitaires ne sont présents que pour clarifier la figure. Le processus repose sur la formation d’un renflement portant sur plusieurs unités répétées non appariées d’un des 2 brins d’ADN favorisé par la structure secondaire en boucle formée par les TR. Lorsque le renflement se produit sur le brin parental, on observera une contraction du TR (délétion) sur le brin néoformé ; s’il se produit sur le brin en cours de synthèse, il y aura expansion du TR (insertion) sur le brin néoformé.
Figure 7 : Représentation schématique d’exemples de mécanismes de recombinaison évoqués pour expliquer certains réarrangements de TR (Zhou et al., 2014). Les motifs unitaires sont représentés par des rectangles de différentes couleurs, les espaces entre les motifs unitaires ne sont présents que pour clarifier la figure. (a) Lorsque les unités répétées de 2 molécules d’ADN sont incorrectement alignées, il peut se produire un crossing-over déséquilibré ayant pour conséquence l’extension de la séquence répétée pour l’un des produit et la contraction pour l’autre. (b) Modèle de recombinaison intramoléculaire aboutissant à 2 produits ayant subi une contraction de l’unité répétée.
La propension à la variabilité semble être fonction de plusieurs facteurs : taille du motif unitaire et sa teneur en GC, nombre de répétitions et orientation des séquences répétées par rapport au sens de la réplication (Hebert et al., 2004; Legendre et al., 2007; Wells et al., 2005). D’après des modèles théoriques, il semble que les expansions soient plus fréquentes pour les petits VNTR alors que les longs semblent soumis de façon préférentielle à des phénomènes de délétion (Lai and Sun, 2003). Un nombre croissant d’exemples montre que les bactéries peuvent exploiter cette instabilité pour moduler la fonction ou l’expression de certains gènes permettant une adaptation génomique et phénotypique rapide à leur environnement. En effet, chez plusieurs pathogènes, certains gènes contenant un VNTR codent des facteurs de virulence, des composants de surface cellulaire et des protéines de régulation (Janulczyk et al., 2010; Moxon et al., 2006). En outre, la variation du nombre de répétitions confère une variabilité phénotypique. Chez
S. agalactiae, ce mécanisme estévoqué pour expliquer certains phénotypes capsulaires (Janulczyk et al., 2010) bien qu’il n’ait jamais été mis en évidence par l’expérimentation
in vivo ou in vitroà notre connaissance. Il serait également impliqué dans la virulence de certaines sous-populations bactériennes, puisque la capacité d’adhérence au fibrinogène de la protéine d’ancrage FbsA semble être fonction du nombre de répétitions de son motif unitaire intra-génique favorisant ainsi les processus de colonisation et d’invasion (Rosenau et al., 2007). De la même façon, la distribution des VNTR inter-géniques ne semble pas aléatoire ; chez
Escherichia coli, il a été montré qu’ils se situent le plus souvent dans les régions promotricesde gènes (Gur-Arie et al., 2000), en particulier de gènes induits par le stress, et qu’ils modulent leur transcription en affectant la liaison des protéines de régulation de la transcription, la liaison de l’ARN polymérase ou la stabilité de l’ARN messager (Figure 8).
Ainsi, en contrôlant la distribution spatiale des mutations par la présence de séquences
hypervariables au sein de « contingency loci » (LeClerc et al., 1996), les bactéries assurent
leur plasticité en un temps très court, tout en se prémunissant des effets délétères liés aux
mutations aléatoires.
Figure 8 : Représentation schématique de la « phase variation » sous la dépendance des VNTR (van der Woude and Bäumler, 2004)
A. Schéma des différentes positions et mécanismes d’action de VNTR responsables de « phase variation ». Sont indiqués : la séquence codante (rectangle), le promoteur (-35, -10) avec l’ARN polymérase, le site d’initiation de la transcription (+1), le site d’attachement du ribosome (Shine-Dalgarno sequence (SD)) et le codon start de transcription ATG. Les séquences répétées au niveau des sites 1 à 4 peuvent être responsables de « phase variation » en affectant l’initiation de la transcription (site 1 et 2), la traduction (site 4) ou par un mécanisme encore inconnu (site 3).
B. Exemple d’effet on/off d’un VNTR de motif unitaire tétranucléotidique de localisation intra-génique sur le produit de traduction (gène mod de Haemophilus influenzae). L’insertion d’une répétition supplémentaire est responsable d’une modification du cadre de lecture qui induit la formation prématurée d’un codon stop.
3. Lysogénie et virulence
L’analyse génomique de
S. agalactiae a montré l’importance du rôle joué par les phagesdans le transfert horizontal de gènes par lysogénie et dans l’enrichissement du « dispensable
genome ». Des facteurs de virulence portés par de l’ADN prophagique ont été identifiés chez
de nombreuses bactéries incluant notamment
Vibrio cholerae, Escherichia coli, Corynebacterium diphteriae, Staphylococcus aureus et Streptococcus pyogenes (Brüssow etal., 2004). Les phages de S. agalactiae sont peu connus. Ils ont d’abord été isolés en 1969 à
partir de souches d’origine bovine. Plus récemment, des souches totalement séquencées ont
révélé la présence de nombreuses régions présentant des homologies avec des séquences prophagiques hautement variables sur environ 10 % du « dispensable genome »(Tettelin et al., 2002, 2005), bien qu’il n’y ait pas de preuve de leur caractère fonctionnel. Salloum a identifié deux groupes prophagiques présentant une plus forte exposition ou sensibilité que les souches de colonisation au processus de lysogénie et ayant une forte implication dans les infections de la peau, des tissus mous et des infections ostéo-articulaires suggérant l’importance du processus de lysogénie dans l’acquisition de « dispensable genome » et du contenu prophagique dans la virulence de certaines sous-populations bactériennes (Salloum et al., 2010). Cependant, aucun gène de virulence d’origine prophagique n’a encore été identifié chez
S. agalactiae. Il est possible que, comme il a été montré avec l’intégrationd’autres éléments génétiques mobiles dans des régions inter-géniques (Al Safadi et al., 2010), l’intégration d’ADN prophagique dans le génome modifie l’expression de certains facteurs déjà présents par réarrangements génétiques. Les autres mécanismes évoqués pour expliquer l’avantage de ces sous-populations de bactéries lysogènes sont : la résistance à l’infection par un phage homologue, propriété intrinsèque à la lysogénie sous la dépendance des systèmes d’exclusion de la superinfection (Labrie et al., 2010) ; et la capacité de certains phages à détruire des isolats autres que ceux issus du clone lysogène d’origine après commutation vers un cycle lytique suite à un stress environnemental conférant un avantage sélectif dans la colonisation ou le processus d’invasion comme cela est suspecté pour les phages infectant les souches du CC17 (Domelier et al., 2009; Gaidelyte et al., 2007).
L’intégration de matériel génétique prophagique est limitée par l’environnement et la niche
écologique occupée par la bactérie l’exposant ainsi aux phages spécifiques de cet
écosystème. Elle est également conditionnée par sa capacité de défense vis-à-vis des
bactériophages qui restent une menace pour sa survie. Il existe donc une concurrence entre
systèmes de défense des bactéries et stratégies d’échappement des bactériophages
aboutissant à un équilibre dynamique co-évolutif entre ces organismes. Les mécanismes de
défense peuvent concerner toutes les étapes de l’infestation, sous la dépendance de
différents mécanismes et notamment la « phase variation » et l’« antigenic variation »
4. Les systèmes CRIPSR-Cas
Les systèmes CRISPR-Cas sont constitués d’un locus CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) et d’un ensemble de gènes
cas(CRISPR associated), codant respectivement des ARN interférents et des protéines Cas ; l’ensemble forme un système de dégradation ciblant les EGM, et en particulier les acides nucléiques phagiques après leur entrée dans la cellule. Ils sont actuellement retrouvés chez 83 % des
Archaea et 45 % desbactéries et ont la particularité de leur conférer une immunité adaptative (Grissa et al., 2007). Celle-ci est acquise par l’intégration de courts fragments d’ADN d’origine exogène au sein d’un locus CRISPR. Sa structure se compose de séquences répétées de 23 à 47 paires de bases (pb), partiellement palindromiques et hautement conservées au sein d’un locus CRISPR appelées « Direct Repeats » (DR) séparés par des séquences uniques de taille relativement bien conservée au sein d’un locus donné (de 21 à 72 pb) appelées « Spacers » et correspondant aux fragments capturés et intégrés entre 2 DR de façon polarisée du côté de la séquence « Leader ». A proximité de ce locus, on retrouve l’ensemble des gènes
casorganisé en opéron et codant un ensemble variable de protéines de fonction hétérogène mais essentielles au fonctionnement du système CRISPR-Cas (Figure 9).
Figure 9 : Représentation schématique de la structure génétique d’un système CRISPR-Cas. Les gènes cas organisés en opéron, codent chacun une protéine Cas essentielle au fonctionnement du système. A proximité se trouve le locus CRISPR constitué de séquences répétées, ou DR, conservées au sein d’un même locus (représentées en bleu), séparées de séquences variables ou « spacers » (de couleur variable). Le locus débute et se termine par un DR. Le DR terminal désigné ici par la lettre « T » présente souvent un caractère dégénéré ou tronqué par rapport à la séquence du DR consensus ((Barrangou et al., 2007). La séquence « Leader », précédant directement le premier DR, contient le promoteur de transcription du locus.
En raison de l’évolution dynamique et rapide de ces systèmes en réponse à la pression sélective et évolutive exercée par les EGM et de la complexité de l’architecture génomique qui en résulte, il existe une très grande variabilité dans l’organisation de ces systèmes pour lesquels une classification a été proposée par Makarova (Makarova et al., 2011). Cette dernière repose sur la composition en gènes cas et considère les gènes cas1 et cas2 comme le « core » du système, gènes universels présents dans tous les systèmes CRISPR-Cas potentiellement fonctionnels. Les types et sous-types sont alors définis par un gène
casspécifique. La Figure 10 représente la composition des opérons cas au sein de chaque type et sous-type.
Figure 10 : Représentation et relations phylogénétiques entre les 3 types et dix sous-types d’opérons cas selon la classification définie par Makarova (Makarova et al., 2011). Seule l’architecture typique d’opéron pour chacun des types et sous-types de système CRISPR-Cas est représentée. Les gènes cas sont représentés par des
Malgré cette évidente variabilité génique, tous les systèmes CRISPR-Cas possèdent un mécanisme d’action analogue en trois étapes :
1. L’immunisation ou adaptation 2. L’expression de l’immunité 3. L’interférence
L’immunisation ou adaptation aboutit à l’intégration d’un nouveau couple DR/spacer à l’extrémité du locus CRISPR contigu à la séquence « Leader ». Dans les 3 types de systèmes CRISPR-Cas, cette étape est sous la dépendance des protéines Cas1 et Cas2. La séquence proto-spacer correspond à la séquence d'ADN phagique cible du système CRISPR-Cas. Le choix de cette séquence au niveau de l’EGM d’origine exogène semble être sous la dépendance d’une séquence adjacente spécifique appelée « Proto-spacer Adjacent Motif » (PAM) pour les systèmes CRISPR-Cas de type I et II. Le proto-spacer est alors intégré dans le locus CRISPR sous forme de spacer.
L’expression de l’immunité correspond à la transcription du locus CRISPR sous forme d’un long transcrit pré-crRNA qui subit une maturation en petits ARN interférents ou crRNA. Les crRNA matures sont associés à des protéines Cas au sein du complexe crRNP (CRISPR- ribonucléoprotéine) qui permet la surveillance immunitaire et la reconnaissance d’acides nucléiques exogènes.
Lors de la phase d’interférence, ceux-ci permettent le ciblage par complémentarité d’acides
nucléiques exogènes aboutissant à leur clivage par des nucléases spécifiques (Figure 11).
Figure 11 : Représentation du mécanisme d’action du système CRISPR-Cas (Sorek et al., 2013). Une fraction de l’ADN phagique injecté va être reconnue comme étrangère et intégrée sous forme de spacer au locus CRISPR. Cette étape, dite d’immunisation, d’adaptation ou d’acquisition, fait intervenir les protéines universelles Cas1 et Cas2 ainsi que la séquence PAM permettant la reconnaissance de la séquence proto-spacer. Au cours de l’étape d’expression le locus CRISPR dans son ensemble est transcrit en long pré-crRNA qui subit une maturation en petits crRNA interférents. Ceux-ci vont reconnaître, par complémentarité de séquence, les acides nucléiques exogènes et guider les protéines Cas, en particulier des nucléases qui assureront la dégradation de ce matériel génétique exogène.