• Aucun résultat trouvé

CHAPITRE 2. ETUDE BIBLIOGRAPHIQUE

2.4. DETECTION ET IDENTIFICATION MICROBIENNE EN SUBSURFACE

2.4.1. Méthodes basées sur les techniques de biologie moléculaire

L’identification et la classification microbiennes ont beaucoup évolué ces dernières années

grâce au développement des outils de biologie moléculaire. De nombreuses techniques sont

disponibles dont certaines, basées sur la PCR (Polymerase Chain Reaction), sont relativement simples

à mettre en œuvre et accessibles au plus grand nombre, pour permettre de détecter des espèces

dans les écosystèmes avec ou sans connaissance a priori des espèces présentes [Tailliez et al, 2002].

Ces méthodes présentent l’avantage majeur de ne pas nécessiter de savoir cultiver les

microorganismes en présence. En revanche, les études basées sur des extractions d’ADN total ne

renseignent pas sur l'état initial des cellules dont provient l’ADN amplifié : spores, cellules en

quiescence, organismes actifs, ou encore cellules mortes. Les principales approches moléculaires

permettant d'évaluer la diversité génétique et la structure de communautés bactériennes présentes

dans les sols sont présentées dans la figure 11 [Ranjard et al., 2000a]. Les méthodes les plus utilisées

en écologie microbienne de la subsurface sont détaillées dans les paragraphes suivants.

Classiquement, les approches retenues pour l'identification de microorganismes sans

connaissance préalable des environnements considérés ciblent les opérons ribosomiques. Ce sont des

régions particulières des génomes, présentes dans chaque cellule vivante, codant des molécules

essentielles à la synthèse protéique : les ARN ribosomiques (ARNr). Les ADNr 16S et 18S codent les

ARN ribosomiques entrant dans la composition de la petite sous-unité des ribosomes des procaryotes

et des eucaryotes, respectivement. Ces ARNr ne sont pas traduits en protéines: ils adoptent une

structure secondaire particulière, responsable de leur fonction au cours de la traduction des ARN

messagers (ARNm) en protéines. Les ADNr sont ainsi ubiquitaires et leur séquence est constituée

d'une alternance de régions constantes, formant les tiges double brin impliquées dans l'adoption de

la structure secondaire de l'ARNr (Figure 12), et de régions variables intermédiaires [Brosius et al.,

1981]. Cette structure mosaïque a facilité la construction d'amorces universelles de PCR permettant

la détection de groupes microbiens plus ou moins étendus [Stackebrandt et Rainey, 1995]. Depuis

l'avènement des méthodes moléculaires de caractérisation microbiologique, les ADNr 16S et 18S

constituent les séquences de référence en classification bactérienne et fongique. Les régions

variables d’une zone codante sont généralement conservées au sein d’une même espèce. Ainsi, chez

les Bactéries, les ADNr 16S de souches de la même espèce présentent généralement plus de 97%

d'identité de séquence [Stackebrandt et Goebel, 1994].

Figure 11. Représentation schématique des différentes approches moléculaires permettant

d'évaluer la diversité génétique et la structure de communautés bactériennes complexes dans les

sols. L'ADN des bactéries en présence est directement extrait des échantillons puis analysé soit par

l'étude de séquences-cibles particulières amplifiées par PCR ('Partial community DNA analysis'), soit

par caractérisation de l'information génétique globale ('Whole community DNA analysis'). Les

produits de PCR obtenus peuvent être analysés par clonage moléculaire, par analyse d'empreinte

génétique, ou même par séquençage direct. L'analyse d'empreinte génétique repose sur une analyse

électrophorétique simple et rapide des produits de PCR permettant l'obtention d'un profil

spécifique de la structure génétique de la communauté, et permettant la distinction de différentes

espèces. Le séquençage des produits de PCR ou des clones permet d'explorer la diversité génétique

d'une communauté et d'établir les relations phylogénétiques reliant ses différents membres. Les

analyses globales de communautés telles que l'hybridation ADN-ADN ou la séparation d'ADN sur

gradient de densité (détermination du pourcentage en G+C) peuvent participer à la détermination

de la structure génétique d'une communauté, alors que les cinétiques de réassociation estiment la

Figure 12. Structure secondaire de l'ARNr 16S

de Escherichia coli. Cette structure requiert

la présence de séquences constantes,

entrecoupées de région dont la séquence

varie selon les espèces.

Toutefois, l'utilisation des ADNr 16S dans le cadre des études de biodiversité présente

quelques faiblesses. En effet, la longueur des gènes codant les ARNr 16S varie très peu d'une

bactérie à l'autre. Sur une longueur moyenne de 1550 pb, on observe une variabilité maximale

d'environ 200 pb, ce qui ne permet pas de séparer facilement plusieurs gènes de séquence différente

en fonction de leur taille [Rainey et al., 1996]. Si différentes espèces sont initialement présentes

dans les échantillons, on obtient alors un produit d'amplification hétérogène à l'issue de la PCR

ciblant l'ADNr 16S, mélange de fragments de taille identique mais de séquences différentes qu’il est

nécessaire de séparer afin de pouvoir effectuer la réaction de séquençage et procéder à

l'identification des organismes en présence. Diverses techniques sont alors mises en oeuvre pour

différencier les fragments amplifiés.

Il existe des amorces universelles supposées capables de s’hybrider sur toutes les séquences

16S des procaryotes (Bactéries et Archaea). Toutefois leur utilisation est déconseillée pour la

détection d’Archaea au sein de mélanges de microorganismes de différents domaines. En effet, le

génome des Archaea contient un nombre de copies d’ADNr 16S inférieur à celui des génomes

bactériens, générant ainsi un biais de représentativité des Archaea à l’issue de réactions de PCR

ciblant ces séquences [Pedersen et al., 1996].

Des banques de données comportant toutes les séquences d’ADNr connues sont disponibles

sur internet pour toute la communauté scientifique. Pour les procaryotes, 262.030 séquences d’ADNr

16S étaient disponibles au 15 septembre 2006 sur le serveur du Ribosomal Database project II [Cole

et al., 2005], soit plus du double du nombre de séquences disponibles en 2003 au début de cette

organismes cultivables apparentés à un isolat nouveau, ou du moins d'établir la phylogénie qui lie cet

isolat aux autres microorganismes [Amann et al., 1995].

Un clonage des produits d'amplification peut être réalisé dans un vecteur plasmidique afin

de les séparer physiquement. Les plasmides recombinants sont introduits dans des bactéries hôtes

compétentes qui sont cultivées séparément. Chaque culture pure constitue un clone, ne portant

qu’un type de produit d'amplification 16S et pouvant faire l’objet d’une extraction plasmidique et

d'un séquençage d'insert à l'aide d'amorces spécifiques des régions plasmidiques bordant le site de

clonage. Pour permettre l'accès à l'ensemble de la diversité bactérienne présente dans l'échantillon

initial, cette méthode requiert le séquençage d'un grand nombre de clones, fournissant souvent des

données redondantes, et s'avère par conséquent coûteuse en temps et en crédits. Bien qu'elle soit

encore fréquemment utilisée en écologie microbienne des sols, une alternative peut consister à

effectuer une présélection des clones à séquencer par la méthode d'ARDRA (Amplified Ribosomal

DNA Restriction Analysis), qui consiste à hydrolyser les plasmides recombinants, et donc les

séquences 16S clonées, par une ou plusieurs enzymes de restriction dans des réactions

indépendantes [Gürtler et al., 1991]. L’obtention de profils différents après restrictions

enzymatiques témoigne alors de la présence de microorganismes distincts, et l'on pourra ainsi ne

séquencer que des clones présentant des profils différents à l'issue de ce traitement. Toutefois la

sélection des clones préalable à la restriction enzymatique reste une étape limitante. Si un nombre

trop restreint de clones est analysé, seuls les microorganismes les plus représentés dans l’échantillon

initial seront détectés.

Les méthodes de DGGE ou TGGE (Denaturing/Thermal Gradient Gel Electrophoresis)

constituent un autre moyen de séparer différents produits d'amplification de l'ADNr 16S [Muyzer et

al., 1993]. Ces méthodes consistent à déposer directement un produit d'amplification hétérogène

d’ADNr 16S sur un gel de polyacrylamide présentant un gradient d’agent dénaturant de l'ADN

(mélange d'urée et de formamide) ou de température. Ce gradient provoque alors une migration

différentielle des molécules d'ADN en fonction de leur séquence, par dissociations locales des brins

d'ADN selon leur composition nucléotidique. La dissociation totale des deux brins n’est jamais

atteinte grâce à l’utilisation d’une amorce de PCR munie d’un GC-Clamp (séquence de 40 à 50

nucléotides à son extrémité 5’ constituée d’une succession de bases G et C) qui maintient une des

extrémités des produits d’amplification sous forme double brin. Les fragments ainsi séparés peuvent

alors être extraits du gel puis directement séquencés, ou préalablement clonés en vue de leur

séquençage si les quantités d'ADN prélevables sur gel sont trop faibles. La mise en œuvre de cette

technique requiert généralement une longue phase de mise au point pour déterminer le gradient

(gamme de concentration d'agent dénaturant ou de température) et les conditions d'électrophorèse

(durée, voltage) les mieux adaptés à la séparation des ADNr 16S issus des échantillons traités. Mais

elle s'avère cependant plus résolutive car elle permet la détection des microorganismes minoritaires,

la distinction des fragments amplifiés se faisant avant l’étape de clonage. Toutefois, cette méthode

ne peut être utilisée que pour amplifier une petite région de l'ADNr 16S (environ 400 pb en général).

Les analyses de SSCP (Single-Strand Conformation Polymorphism) sont basées sur une autre

technique électrophorétique permettant également de séparer des produits d'amplification de même

longueur mais de séquences différentes. Pour cela, la PCR ciblant l'ADNr 16S est réalisée avec deux

amorces dont l'une est phosphorylée à son extrémité 5'. Ainsi, chaque produit d'amplification obtenu

est phosphorylé sur un brin d'ADN. Ce brin est digéré par une exonucléase qui reconnaît

spécifiquement cette extrémité phosphorylée. Les ADN simple brin résultant de cette digestion sont

ensuite analysés par électrophorèse en conditions non dénaturantes. En fonction de leur séquence

nucléotidique et des conditions physico-chimiques environnantes (température et force ionique

principalement), les molécules d'ADN vont adopter une structure secondaire particulière résultant en

une mobilité électrophorétique spécifique. Chaque espèce moléculaire sera donc caractérisée par un

point de migration particulier. Cette méthode est plus simple à mettre en œuvre que la DGGE/TGGE

car elle ne requiert pas d'amorce munie d'un GC-clamp, ni l'acquisition d'un appareillage spécifique

d'électrophorèse [Schwieger et Tebbe, 1998]. Toutefois, elle ne permet également que la séparation

de produits d'amplification de longueur réduite (200 à 400 pb).

Ces méthodes présentent donc toutes quelques inconvénients notables basés sur le fait que

les séquences 16S, en dépit des régions hypervariables qu'elles comportent et des informations

cruciales qu'elles fournissent, ne sont en général pas assez divergentes pour distinguer des

organismes très proches phylogénétiquement. C'est par exemple le cas de bactéries d'espèces,

sous-espèces, ou souches différentes au sein du même genre [Normand et al. 1996]. L'ensemble de ces

remarques s'applique de la même façon à l'utilisation des séquences d'ADNr 18S dans les études de

biodiversité fongique.

La technique RISA (Ribosomal Intergenic Spacer Analysis) constitue une autre approche

moléculaire d'étude de la biodiversité microbienne par analyse d'empreinte génétique. Dans le cas

des Bactéries, elle consiste à amplifier non plus la séquence correspondant à l'ADNr 16S, mais la

région intergénique séparant les gènes 16S et 23S des opérons ribosomiques, codant les ARNr entrant

respectivement dans la composition de la petite et de la grande sous-unité des ribosomes bactériens

[Garcia-Martinez et al., 1999; Ranjard et al., 2000b]. La séquence de cet espace intergénique est

extrêmement variable en taille et en composition nucléotidique, même entre groupes taxonomiques

très proches [Gürtler et Stanisich, 1996]. Cette méthode est de plus en plus répandue pour la

caractérisation de communautés constituées de Bactéries et d'Archaea [e.g., Enwall et al., 2005], et

permet de préciser la taxonomie de ces domaines microbiens [Nour et al., 1994; Kamekura et al.,

1997]. La méthode RISA exploite cette variabilité de longueur de la séquence intergénique 16S-23S

de l’opéron rrn portant les gènes codant les différents ARN ribosomiques bactériens. La première

étape de cette approche consiste à effectuer une amplification par PCR de ces régions intergéniques

avec deux amorces spécifiques de séquences conservées situées de part et d’autre de l’espace

intergénique, aux extrémités des gènes codant les ARN ribosomiques 16S et 23S. La longueur des

séquences intergéniques varie d'une espèce bactérienne à une autre. D'autre part, le nombre

d'opérons ribosomiques par génome varie généralement de 1 à 11 copies en fonction de l'espèce

considérée et de son potentiel multiplicatif [Garcia-Martinez et al., 1996; Gürtler et Stanisich,

1996]. Chez les espèces comportant plusieurs opérons ribosomiques, on peut en outre observer une

variation de la longueur de l'espace intergénique d'un opéron à l'autre, en raison de la présence d'un

nombre variable de séquences codant des ARN de transfert (une à deux unités par espace

intergénique en général), qui ne couvrent qu'au maximum 50% de la longueur de l'espace

intergénique (figure 13). Le reste de la séquence intergénique correspond à des séquences non

essentielles, présentant moins de contraintes évolutives, dans lesquelles des insertions et délétions

surviennent fréquemment, ceci résultant en des séquences divergentes, même entre espèces

proches.

Figure 13. Représentation schématique d'un espace intergénique 16S-23S bactérien et organisation

de ses régions fonctionnelles. Comme indiqué entre crochets, le nombre de gènes codant des ARNt

n'est pas constant mais varie d'une espèce à l'autre et d’un opéron à l’autre. Les séquences RIII et

boxA sont impliquées dans la transcription de l'opéron ribosomique et dans l'épissage du transcrit

polycistronique. D'après Garcia-Martinez et al., 1999.

La réaction de PCR génère ainsi un nombre variable de produits d'amplification de diverses

longueurs. En séparant les produits d'amplification obtenus pour une espèce bactérienne par

électrophorèse, on peut ainsi visualiser un profil de bandes constituant une empreinte RISA

spécifique, soit d'une espèce bactérienne dans le cas de cultures pures, soit d'une communauté dans

le cas de cultures mixtes. On peut ainsi aisément distinguer divers produits d'amplification apparus

suite à une seule réaction de PCR. On peut également procéder au séquençage de l'espace

intergénique et soumettre le résultat aux bases de données répertoriant les séquences de ce type

comme la banque spécialisée RISCC [Garcia-Martinez et al., 2001]. Toutefois, la limite principale de

cette approche réside dans le fait que les banques de séquences intergéniques sont encore peu

fournies par rapport à celles qui regroupent les séquences d'ADNr 16S. Il est donc moins probable de

pouvoir procéder à l'identification précise d'isolats bactériens, en particulier dans le cadre d'études

portant sur des niches écologiques nouvelles.

Toutes ces techniques moléculaires sont transposables au domaine des Champignons. L'ARNr

18S, qui entre dans la composition de la petite sous-unité des ribosomes fongiques, constitue comme

l’ARNr 16S bactérien la séquence de référence en taxonomie. L'espace intergénique entre ADNr 18S

et ADNr 28S peut aussi être ciblé par la méthode RISA [Ranjard et al., 2001].

Il est important de rappeler que toutes ces méthodes basées sur des amplifications de

séquences d'ADN par PCR standard ne sont en aucun cas quantitatives ni même semi-quantitatives.

Elles ne permettent d'aborder la diversité microbiologique que du point de vue qualitatif, c'est-à-dire

de déterminer les espèces en présence sans pour autant donner d'information sur le niveau de

représentation de chacune. Pour quantifier une espèce ou un groupe particulier dans une

communauté indépendamment des techniques de culture, il sera nécessaire de définir des amorces

spécifiques de l’espèce ou du groupe microbien d’intérêt et d’amplifier la séquence ciblée par PCR

quantitative.