HAL Id: hal-01208716
https://hal.archives-ouvertes.fr/hal-01208716
Submitted on 6 Jun 2020
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Optimisation du pyroséquençage haut-débit pour caractériser la diversité taxonomique des communautés
bactériennes des sols
Sébastien Terrat, Pierre Plassart, Richard Christen, Samuel Dequiedt, Tiffanie Regnier, Mélanie Lelievre, Virginie Nowak, Philippe Lemanceau, Pierre-Alain
Maron, Christophe Mougel, et al.
To cite this version:
Sébastien Terrat, Pierre Plassart, Richard Christen, Samuel Dequiedt, Tiffanie Regnier, et al.. Opti-misation du pyroséquençage haut-débit pour caractériser la diversité taxonomique des communautés bactériennes des sols. Workshop”Interactions des Microorganismes avec leurs Environnements : Cir-culation, Adaptation”, Jun 2012, Dijon, France. �hal-01208716�
Contacts : sebastien.terrat@dijon.inra.fr - lionel.ranjard@dijon.inra.fr
S. TERRAT
1, P. PLASSART
1, R. CHRISTEN
2, S. DEQUIEDT
1, T. REGNIER
1, M. LELIEVRE
1, V. NOWAK
1, P. LEMANCEAU
1, PA.
MARON
1, C. MOUGEL
1et L. RANJARD
1.
1 Laboratoire de Microbiologie du Sol et de l’Environnement et Plateforme GenoSol (UMR 1229), INRA/Université de Bourgogne, DIJON
2 Laboratoire de Biologie virtuelle (UMR CNRS 6543), Université de Nice, NICE
Optimisation du pyroséquençage haut-débit pour caractériser la
diversité taxonomique des communautés bactériennes des sols.
La diversité bactérienne d’un sol est difficile à caractériser. Toutefois, d’importantes avancées en biologie moléculaire, comme le développement du pyroséquençage, ont permis d'obtenir plusieurs centaines de milliers de séquences à partir d’un ADN métagénomique, permettant une meilleure caractérisation de la diversité des communautés microbiennes du sol.
Toutefois, dans un contexte ou l’écologie microbienne du sol commence à s’accaparer les échantillonnages de grande envergure afin de mieux hiérarchiser les filtres environnementaux et les processus impliqués dans l’assemblage de ces communautés, il est nécessaire d’identifier tous les biais méthodologiques liées a ces nouvelles techniques (procédure d’extraction, profondeur de séquençage nécessaire, influence des tags ajoutés pour le multiplexage) qui peuvent entraîner une faible généricité des résultats obtenus.
Problématique
0 1 2 3 4 5 0 1 2 3 4 5 M O B IO GnS-GII 0 1 2 3 4 5 0 1 2 3 4 5 SY3 GnS-GII Ab ondance rela tiv e (% ) Abondance relative (%) Gemmatimonadetes Nitrospira Crenarchaeota Firmicutes TM7 WS3 OP10(A)
(B)
Fig2. Comparaison d’abondances relatives obtenues pour chaque protocole et chaque sol. Sols sous
culture : ● ♦; forêt à feuilles caduques : ▲ ▼; forêt de conifères : ■; prairies : ◄ et vignes : ►. (A) Comparaison de GnS-GII avec MOBIO, et (B) de Gns-GII avec SY3. Les Firmicutes et les Crenarchaeota sous largement sous-estimés par SY3 et MOBIO.
Pour un même sol, le nombre de genres détectés varie de 1 à 26 % entre deux procédures,
le protocole GnS-GII donnant la meilleure couverture (Fig1).
Les Firmicutes et Les Crenarchaeota sont fortement sous-estimés avec SY3 et MOBIO, en
comparaison avec GnS-GII (Fig2).
Procédure d’extraction d’ADN de sol
Profondeur de séquençage
Fig3. ACP générées avec les abondances relatives au niveau du
phylum des sols étudiés. Les chiffres sont indiqués en milliers de séquences, Total: nombre de séquences maximal pour le sol donné.
Quelque soit le nombre de séquences utilisées, la discrimination des différents sols étudiés
est similaire (ACP globale, Fig3).
De 10 000 à 50 000 séquences, l’abondance relative des groupes minoritaires
(moins de 1%
de la communauté totale) varie fortement, ce qui entraîne une variabilité des inventaires
(sous-ACP, Fig3).
Conclusion & Perspectives
Ces premières études nous ont permis
d'évaluer certains biais pour optimiser
l'usage du pyroséquençage,
ceci afin d’ étudier la
diversité taxonomique microbienne des sols
.
D’autres études sont actuellement en cours, comme l’évaluation de l’influence du multiplexage des échantillons, nécessitant l’ajout de tags et/ou d’adaptateurs.
Au final, toutes ces informations nous permettront de caractériser au mieux la diversité taxonomique des microorganismes du sol, et de l’appliquer en
moyen débit sur les réseaux de surveillance des sols ou sur des chrono séquences à long terme.
(Milliers de séquences) 50 400 10 100 250 0 200 400 600 800 1000 1200 1400 1600 1800 0 2000 4000 6000 8000 10000 12000 14000 N o m b re d 'O T U s Nombre de séquences
Sol sous culture
0 200 400 600 800 1000 1200 1400 0 2000 4000 6000 8000 10000 12000 14000 N o m b re d 'O T U s Nombre de séquences
Forêt à feuilles caduques
0 200 400 600 800 1000 0 2000 4000 6000 8000 10000 12000 14000 N o m b re d 'O T U s Nombre de séquences Prairies
Fig1. Courbes de saturation déterminées pour chaque protocole et chaque sol au niveau du genre. Noir:
GnS-GII, Gris foncé: SY3, Gris clair: MOBIO. Le protocole GnS-GII semble le protocole le plus adapté pour obtenir une bonne couverture des sols étudiés.
10 000 séquences est un minimum pour obtenir un bon génotypage et comparer efficacement différents sols.
Cependant, pour avoir un bon inventaire de la diversité bactérienne des sols étudiés, il faut au moins 50 000 séquences.
Evaluation de 3 procédures d’extraction d’ADN (SY3, GnS-GII, un kit: Ultraclean Soil DNA Kit, MOBIO) pour déterminer la méthode la plus représentative de la diversité indigène des sols. Les sols étudiés ont été choisis pour leurs caractéristiques physico-chimiques variables et leurs différents modes d’usage.
La diversité bactérienne de chaque sol extrait a été déterminée par pyroséquençage de l’ADNr 16S (Figs 1&2).
La procédure d’extraction GnS-GII est la plus efficace pour détecter un maximum de groupes bactériens au sein des sols étudiés.
Vignes (pH = 8.3) Prairies (pH = 5.4) Forêt à feuilles caduques (pH = 7.8 )
Sol sous cultures (pH = 8.2) 10 30 200 100 150 70 50 60 80 10 40 60 10 90 50 80 70 10 50 300 150 30 d = 2 1850 0 2 4 6 8 30 10 50 40 20 60 100 90 70 Total 80 Forêt de conifères (pH = 4.0) 20 10 40 100 70 50 60 80 200 250 90 400 350 Total
Sol sous cultures (pH = 8.2) 90 30 200 20 80 150 250 60 40 100 Total 70 Prairies (pH = 5.4) 20 30 100 Total Vignes (pH = 8.3) 20 30 40 50 Total 10 20 30 70
Sols sous cultures (pH = 7.9)
Total
Forêt à feuilles caduques (pH = 7.9) 20 40 60 80 250 50 Total 40 90
Forêt à feuilles caduques (pH = 7.8 )
La diversité bactérienne de chaque sol (choisis pour leurs caractéristiques physico-chimiques variables et leurs différents modes d’usage) a été déterminée par pyroséquençage de l’ADNr 16S.
Afin de déterminer le nombre de séquences permettant une bonne estimation de la diversité des communautés bactériennes des sols étudiés, des sous-jeux de séquences ont été tirés aléatoirement sur les jeux complets obtenus (allant à plus de 400 000 séquences brutes pour certains sols).
La structure des communautés bactériennes détectées a été comparée par ACP avec les abondances relatives au niveau du phylum (Fig3).