• Aucun résultat trouvé

I. Synthèse bibliographique

I.5. Stratégies d’études moléculaires des communautés microbiennes

I.5.1. Les marqueurs moléculaires

Les marqueurs moléculaires phylogénétiques

Zuckerkandl et Pauling (1965) ont été les premiers à considérer les molécules comme des marqueurs de l’histoire évolutive et ont développé le concept d’horloge moléculaire. Quelques années plus tard, Woese et Fox (1977) ont procédé à des comparaisons systématiques de séquences d’ARN ribosomiques (ARNr). Ils ont ainsi constaté que ces molécules sont des marqueurs phylogénétiques pertinents et fiables, car :

elles sont présentes dans tous les organismes ;elles sont abondantes dans la cellule ;

elles accomplissent un rôle important dans la cellule, et donc leur structure secondaire

a été conservée durant l’évolution ;

• elles possèdent des régions hautement conservées ou variables. Certaines sont identiques dans l’ensemble des bactéries et sont ciblées par des amorces universelles. D'autres sont spécifiques à un groupe et permettent l'identification des taxa (espèce, genre, phyla ou encore domaine). La comparaison de régions conservées permet d’évaluer les relations phylogénétiques entre microorganismes éloignées, tandis que les régions variables permettent l'étude d'espèces plus proches ;

elles ont une taille adéquate pour les méthodes moléculaires.

En quelques années, l’analyse comparative des séquences de la petite sous-unité des ARNr amplifiées à partir de souches pures et d’échantillons environnementaux a totalement changé notre vision de la biosphère et a permis de reconstruire l’arbre de la vie (Figure 17). Les organismes vivants sont alors répartis en trois domaines : Bacteria, Archaea et Eucarya.

Les procaryotes possèdent trois molécules d’ARNr, l’ARNr 5S, l’ARNr 16S et l’ARNr 23S, réparties dans deux sous-unités et codées par des gènes généralement organisés en opéron, l’opéron rrn. Bien que l’ARNr 23S possède une plus grande quantité d’information phylogénétique (~2300 nt), sa taille plus importante et la présence de structures secondaires particulièrement marquées ont longtemps rendu son clonage et son séquençage difficile. De plus, l’efficacité de l’ARNr 5S (~120 nt) pour l’étude de communauté complexe est limitée par sa petite taille. Par conséquent, les bases de données de séquences d’ARNr 16S (~1500 nt)

sont rapidement devenues plus importantes et ont permis de mieux comparer les bactéries. Plus de 600000 séquences de gènes codant l’ARNr 16S sont aujourd’hui disponibles dans Genbank.

L’ARNr 16S est devenu le marqueur de référence pour identifier et déterminer les relations phylogéniques entre les différentes bactéries (Muyzer et Ramsing, 1995). L’identification d’une bactérie peut être simplement réalisée en évaluant la position de sa séquence d’ARNr 16S au sein d’un arbre phylogénétique (Figure 17). Deux bactéries appartiennent à la même espèce si leur ARNr 16S présente plus de 97% d’homologie de séquence. Néanmoins, Normand et al. (1996) ont indiqué que le gène codant l’ARNr 16S n’est souvent pas assez divergent pour permettre une bonne séparation au sein d’espèces d’un même genre. Ce problème peut être résolu par l’analyse de la région localisée entre les gènes codant l’ARNr 16S et l’ARNr 23S, caractérisée par une taille et une composition de séquences fortement variables au sein de groupes phylogénétiquement proches, et donc bien plus discriminante pour étudier la diversité de bactéries étroitement apparentées (García-Martínez et al., 1999).

Le choix de l’ARNr 16S pour déterminer la phylogénie bactérienne s’est basé sur une diversité de séquences purement due aux changements évolutifs et non pas influencée par des transferts horizontaux. Pourtant, dès 1993, Sneath a mis en évidence l’échange horizontal de fragments de gènes codant l’ARNr 16S chez des espèces d’Aeromonas. D’autres études ont mis en évidence des transferts latéraux de fragments de gènes d’ARNr chez des espèces de

Rhizobium, Helicobacter, Bradyrhizobium et d’actinomycètes (Schouls et al., 2003, Eardly et al., 1996, Parker et al., 2001, Ueda et al., 1999, Wang et Zhang, 2000, Dewhirst et al., 2005).

Des transferts d’opérons rrn complets, inter- ou intra-espèces peuvent également avoir lieu (Lan et Reeves, 1998 ; Yap et al., 1999). Bien que ces événements restent rares, leur possibilité impose une vérification plus rigoureuse de la validité d'arbres phylogénétiques basés sur les ARNr.

Plusieurs exemplaires de l’opéron rrn peuvent être retrouvées au sein d’une même souche (e.g., il en existe 10 chez B. subtilis). Bien qu’ils soient généralement identiques ou très proches, d’importantes variations peuvent être retrouvées au sein d’une même souche, tandis que des gènes codant l’ARNr 16S presque identiques ont été retrouvés chez des bactéries phénotypiquement différentes (Fox et al., 1992). Ainsi, de nouveaux marqueurs phylogénétiques ont été proposés, en complément à l’ARNr 16S pour la caractérisation de

certaines espèces et genres bactériens cultivables, tels que le gène rpoB, codant la sous-unité β

de l’ARN polymérase et présent en une seule copie dans les génomes (Dahllöf et al., 2000 ; Kim et al., 2004). Ces marqueurs peuvent posséder un pouvoir discriminant plus grand pour analyser la diversité des espèces au sein d’un même genre. Néanmoins, aucune molécule analysée individuellement, incluant l’ARNr 16S, est complètement fiable pour reconstruire la phylogénie d’un organisme et des analyses intégrant différents marqueurs sont de plus en plus réalisées (Holmes et al., 2004, Bavykin et al., 2004).

Figure 17 : Représentation schématique de l’arbre de la vie basée sur l’analyse des séquences de la petite sous-unité des ARN ribosomaux. Les triangles verts représentent les phyla, divisions ou

groupes de rangs taxonomiques élévés pour lesquels au moins un membre a été cultivé et/ou convenablement décrit. Les triangles rouges représentent les phylotypes et les lignées retrouvés exclusivement à partir de séquences issues de clones environnementaux (d’après López-Garcia et

Si l’analyse des gènes codant l’ARNr 16S (ou d’autres marqueurs phylogénétiques) permet d’identifier les espèces présentes au sein d’une communauté bactérienne dans un environnement donné, l’analyse des ARNr (après une transcription inverse) permet la détection et l’identification d’espèces métaboliquement active, car la quantité d’ARNr produit est directement relié à l’activité de croissance des bactéries (Wagner, 1994).

Le principal inconvénient de l’approche moléculaire basée sur les ARNr 16S est son incapacité à fournir des informations directes sur les capacités métaboliques des bactéries détectées, contrairement à des espèces isolées par des méthodes culturales. Des prédictions peuvent néanmoins être réalisées si elles sont étroitement apparentées à des espèces cultivées déjà connues pour présenter une capacité métabolique d’intérêt (e.g. méthanogènes, sulfato-réductrices…). Cependant, peu de groupes phylogénétiques correspondent à un type métabolique donné. Le rôle fonctionnel d’une espèce détectée dans un écosystème via une séquence d’ARNr 16S reste donc indéterminé si cette séquence est phylogénétiquement éloignée de celle de souches connues. Les bactéries transformant l’As forment un groupe polyphylétique très divers avec des organismes étroitement apparentés à d’autres incapables de le transformer. La capacité à détecter et identifier spécifiquement de tels groupes métaboliques dans l’environnement par des approches basées sur l’ARNr 16S est donc réduite.

Les marqueurs moléculaires fonctionnels

Une approche alternative pour identifier un métabolisme spécifique à partir de séquences environnementales est de cibler les gènes de fonction codant les enzymes spécifiques du métabolisme ciblé. Le degré de conservation de ces gènes est moins important que celui des gènes codant l’ARNr 16S, mais pour certains, il l’est suffisamment pour pouvoir dessiner des amorces qui les ciblent spécifiquement. Ainsi, de nombreux gènes de fonction ont été utilisés pour détecter et analyser la diversité de bactéries impliquées dans un métabolisme particulier, tels que ceux impliqués dans la sulfato-réduction (dsrAB codant la bisulfite réductase, apsA codant l’APS réductase), dans la nitrification (amoA codant l’ammoniaque monooxygénase) ou dans la résistance aux métaux. De plus, l’analyse des ARN messagers (ARNm) de certains gènes fonctionnels a permis de détecter et identifier des bactéries exprimant les activités enzymatiques clés dans des conditions environnementales spécifiques.

Récemment, des gènes de fonction ont également été utilisés pour étudier les bactéries présentes et actives impliquées dans le cycle de l’As dans divers écosystèmes.

Les gènes codant la sous-unité catalytique de l’AsIII-oxydase (gènes aoxB ou aroA) ont été utilisés pour étudier la diversité des bactéries AsIII-oxydantes dans des environnements naturels. Ces gènes semblent répandus dans les différents compartiments environnements (sols, eaux et sédiments) (Inskeep et al., 2007, Fan et al., 2008). Inskeep et al. (2007) ont montré que l’expression des gènes aroA issus d’eaux géothermales (YNP, USA) est associée à une oxydation d’As in situ.

Les gènes arrA ont été utilisés comme marqueur moléculaire de la respiration de l’AsV dans l’environnement (Malasarn et al., 2004). L’expression et la quantité de ces gènes, amplifiés à l’aide d’amorces dégénérées, sont directement corrélées à l’augmentation d’AsIII solubilisé à partir d’oxy-hydroxydes de Fe amorphe piégeant l’AsV dans les sédiments du réservoir d’eau Haiwee (CA, USA). Cependant, la petite taille des fragments amplifiés (~180 pb) à l’aide de ces amorces a pour effet d’augmenter la similarité parmi les séquences arrA (Pérez-Jiménez et

al., 2005). En effet, ces fragments montrent 83 % de similarité entre eux en moyenne. Une

autre étude a été réalisée avec ces amorces à partir d’eaux du lac hypersalé Mono (CA, USA) et la phylogénie basée sur les fragments du gène arrA obtenus se montre cohérente avec celle basée sur le gène codant l’ARNr 16S (Hollibaugh et al., 2005). Cependant, ces amorces ont permis l’amplification de gènes arrA paralogues chez la souche MLHE-1 incapable de respirer l’AsV. Néanmoins, les auteurs ont précisé que des analyses réalisées sur un fragment court ne permettent pas de certifier à l’aide des pourcentages d’identité que la région étudiée est bien spécifique du gène ciblé. Les amorces utilisées n’ont pas permis l’amplification du gène arrA chez Desulfosporosinus auripigmentum, pourtant connue pour respirer l’AsV (Malarsarn et al., 2004). Le gène arrA d’une souche du même genre, Desulfosporosinus sp. Y5, a toutefois pu être amplifié à l’aide d’autres amorces (Perez-Jimenez et al., 2005). Kulp et

al. (2006) ont dessiné de nouvelles amorces dégénérées permettant d’amplifier un fragment

plus long (~600 pb) de gènes arrA à partir d’un plus large panel de bactéries et à partir de sédiments de deux lacs hypersalées (Mono et Searles, USA), où des activités de réduction de l’AsV sont mesurées. Lear et al. (2007) ont également développé des amorces permettant de cibler les gènes arrA à partir de sédiments collectés d’un aquifère cambodgien.

Sun et al. (2004) ont également proposé une méthode de détection et de quantification des gènes arsC, codant l’AsV-reductase cytoplasmique, pour évaluer l’abondance des bactéries AsV-réductrices dans des échantillons de sols (Sun et al., 2004).

Néanmoins, l’utilisation de ce type de marqueurs peut être compliquée par : (i) la variabilité interne au sein de communautés naturelles, inconnue pour ce type de gènes, entraînant des difficultés pour la formation d’OTU (operating taxon unit), (ii) les transferts horizontaux, induisant une faible valeur phylogénétique, (iii) l’absence d’amorces universelles pour les gènes fonctionnels et (iv) le dessin d’amorces, lié aux séquences déjà existantes, les banques de séquences fonctionnelles étant bien moins riches que celles d’ARNr 16S.