• Aucun résultat trouvé

Etudes de la diversité microbienne et des métabolismes potentiels associés

Dans le document en fr (Page 152-156)

Approches techniques et contraintes liées à l’étude des communautés microbiennes en

3.4. Extraction, purification et séquençage de l’ADN

3.4.2. Etudes de la diversité microbienne et des métabolismes potentiels associés

Du fait de leur fonction essentielle dans les cellules, les gènes codant pour les ARNr, et plus particulièrement ceux constituant la petite sous unité des ribosomes (l’ARNr 16S chez les procaryotes et 18S chez les eucaryotes) présentent des caractéristiques intéressantes pour étudier l’évolution des microorganismes. En effet, ils sont présents dans tous les organismes, leurs séquences globales sont fortement conservées mais présentent des régions

hypervariables propres à chaque espèce et les bases de données de séquences sont fournies. Le séquençage du gène codant pour l’ARNr 16S fournit ainsi un outil efficace pour classifier et donc identifier les microorganismes en particulier ceux qui ne sont pas cultivés à ce jour (Pace 2009). Cette technologie a été rapidement utilisée sur des extraits d’ADN d’échantillons environnementaux amplifiés par réaction en chaîne de la polymérase (PCR pour « polymerase chain reaction ») et a ainsi rapidement révélé la faible quantité de taxons microbiens caractérisés par des approches culturales (Baker et Dick 2013).

Initialement, les communautés microbiennes étaient caractérisées en séquençant des banques de clones du gène complet de l’ARNr 16S (environ 1500 paires de bases, pb). Ce fut le cas pour les premières études menées sur les échantillons de Lost City (Schrenk et al. 2004 ; Brazelton et al. 2006) et de Prony (Quéméneur et al. 2014 ; Postec et al. 2015). La création de banques de clones est néanmoins un travail fastidieux et conduit généralement à une la mise en évidence d’une centaine d’espèces différentes tout au plus. Elle ne permet donc pas de couvrir l’intégralité des communautés microbiennes présentes dans un échantillon. Impliquant plusieurs étapes de PCR, cette méthode augmente également le nombre de biais et d’erreurs. Toutefois, permettant d’obtenir des séquences complètes des gènes codant pour l’ARNr 16S, cette approche est avantageuse pour l’analyse phylogénétique (Woese et Fox 1977 ; Pace 2009) et est encore appliquée aujourd’hui à cet effet. Avec le développement de séquenceurs de haut débit (séquençage de nouvelle génération, NGS pour « next generation sequencing ») permettant le séquençage automatisé de plusieurs millions de fragments d’ADN en parallèle (Escobar-Zepeda et al. 2015), une fraction bien plus élevée des communautés microbiennes a pu être identifiée. Les séquences obtenues par ces méthodes sont plus courtes (300 à 400 pb) et le séquençage haut débit des gènes codant pour l’ARNr 16S se focalise donc sur certaines des régions hypervariables. Généralement, les deux parties terminales du fragment d’ADN d’intérêt, délimitées par des amorces d’oligonucléotides, sont séquencées en parallèle (séquençage dit « paired-end ») créant ainsi des fragments d’ADN (ou « reads ») de haute qualité qui peuvent être alignés et assemblés. Avec la décroissance drastique du coût de séquençage l’automatisation croissante des approches et leur diversification, un nombre de plus en plus important de communautés microbiennes environnementales de plus en plus complexes a été caractérisé (Dick et Lam 2015 ; Escobar-Zepeda et al. 2015). Aujourd’hui, plus d’une dizaine de sites serpentinisés ont été caractérisés par cette méthode (Schrenk 2017). Les travaux sur les communautés microbiennes des écosystèmes profonds et notamment sur des sites serpentinisés ont bénéficié d’initiatives internationales d’envergure comme le Census

of Deep Life (CoDL) du Deep Carbon Observatory (DCO ; https://deepcarbon.net/tag/census-deep-life) qui viser à financer le séquençage de l’ADN génomique de communautés microbiennes d’environnements profonds ou extrêmes. Ce projet de thèse a bénéficié de financements de ce type pour l’étude de la diversité des communautés microbiennes colonisant les cheminées hydrothermales du site de Old City. Ainsi, les séquences des régions hypervariables V4-V5 du gène codant pour l’ARNr 16S des bactéries et des archées d’échantillons de six cheminées différentes ont été obtenues avec un séquenceur Illumina Miseq au Marine Biological Laboratory (Woods Hole, USA). Cette région V4-V5 a été sélectionnée sur la base du nombre important d’études de sites serpentinisés se focalisant sur cette région. Bien que le séquençage du gène codant pour l’ARNr 16S soit un outil puissant, il n’est pas sans limite car il implique une étape d’amplification de ce gène. En effet, l’affinité des amorces d’oligonucléotides utilisées pour l’amplification peut être plus faible pour certains taxa, notamment les phyla récemment décrits et/ou identifiés via des métagénomes (Polz et Cavanaugh 1998 ; Hong et al. 2009 ; Eloe-Fadrosh et al. 2016 ; Llyod et al. 2018).

En parallèle à l’explosion des données de séquençage du gène codant pour l’ARNr 16S d’échantillons environnementaux, le développement de séquenceurs haut débit a ouvert une perspective nouvelle pour l’étude des populations de génomes de microorganismes non cultivés (Figure 3.4 ; Dick et Lam 2015 ; Escobar-Zepeda et al. 2015). Depuis le séquençage des premiers génomes bactériens en 1995, le nombre de ces séquençages tant pour les bactéries que pour les archées a augmenté exponentiellement (Land et al. 2015). L’ensemble des gènes constituant un génome renseigne sur le potentiel métabolique et physiologique, et donc sur les fonctions écologiques possibles des microorganismes. Avec le séquençage des génomes microbiens complets, la variabilité du contenu génétique de microorganismes phylogénétiquement proches a conduit aux notions importantes de pangénome (l’ensemble des gènes de toutes les souches d’une même espèce), de « core » génome (l’ensemble des gènes partagés par les souches d’une même espèce) et de gènes accessoires ou écogénomes (les gènes présents uniquement dans certains génomes de ces souches pour des écosystèmes particuliers) (Cordero et Datta 2016). L’évolution génomiques des communautés microbiennes étant liée à leurs conditions environnementales, ces notions sont importantes pour comprendre les facteurs écologiques contrôlant la diversité des populations génomiques (Allen et Banefield 2005).

Figure 3.4: Evolution chronologique du coût de séquençage (courbe rouge) et du nombre de génomes séquencés (courbe bleue). La frise chronologique en haut du graphique représente les principales évolutions des technologies « -omiques » (Dick et Lam 2015).

Pour caractériser l’ensemble des gènes et des génomes des microorganismes non cultivés dans les environnements, la métagénomique dite « shotgun » s’est rapidement imposée comme la méthode la plus viable et valorisable (Tyson et al. 2004 ; Baker et Dick 2013 ; Dick et Lam 2015). Elle repose sur la fragmentation aléatoire de la totalité de l’ADN d’une communauté microbienne et sur son séquençage complet. De là, les gènes et génomes microbiens peuvent être reconstruits et ainsi les métabolismes potentiels mis en œuvre au sein des communautés microbiennes peuvent être identifiés (Tyson et al. 2004), et associés à leur microorganisme correspondant. De même, l’évolution des populations génomiques peut être étudiée (Allen et Banefield 2005). Avec cette avancée technologique, de nombreux métabolismes microbiens et leur influence sur les processus environnementaux ont été révélés. L’augmentation du rendement de séquençage et son coût de moins en moins élevé ont permis d’étudier des communautés plus complexes et de reconstruire et identifier de plus en plus d’espèces microbiennes non cultivées. Les arbres phylogénétiques et phylogénomiques ont ainsi connus une expansion significative (Hug et al. 2016). Anantharaman et al. (2016) ont ainsi reconstruit plusieurs milliers de génomes à partir de métagénomes.

Pour compléter les données de diversité microbienne basées sur les gènes codant pour l’ARNr 16S, plusieurs métagénomes des échantillons de Old City ont été séquencés pendant

cette thèse. Les métabolismes potentiels des communautés microbiennes ont alors été étudiés (Chapitre 5) et des génomes ont été reconstruits à partir de certains métagénomes. Finalement, les variations et les processus évolutifs des populations génomiques ont été explorés en comparant avec des métagénomes de Lost City, Prony et The Cedars (Chapitre 6). Ces approches sont proposées pour fournir une première caractérisation des communautés microbiennes du site de Old City, mais aussi afin d’améliorer nos connaissances sur les processus écologiques, adaptatifs et évolutifs dans les écosystèmes serpentinisés. D’autre part, si les potentiels métaboliques des microbiotes du site d’Hellisheiði ont d’ores et déjà été étudiés (Trias et al. 2017), cette thèse s’attache plus particulièrement à la reconstruction de génomes à partir de quatre métagénomes et à la diversité fonctionnelle associée aux populations génomiques (Chapitre 7).

3.4.3. Reproductibilité des résultats : difficultés liées à la faible

Dans le document en fr (Page 152-156)