• Aucun résultat trouvé

Biologie des g´ enomes procaryotes

1.3 Variabilit´ e g´ en´ etique

Nous avons vu que :

1. les bact´eries se reproduisent « `a l’identique »

2. elles ont un temps de g´en´eration rapide (M. tuberculosis H37Rv a un temps de g´en´eration de trois semaines, ce qui est toujours bien plus rapide que l’homme qui met en moyenne vingt cinq ans `a se reproduire)

3. elles ont une capacit´e d’adaptabilit´e remarquable.

Comment font-elles pour adapter correctement leur m´etabolisme quand les conditions du milieu deviennent difficiles ? D’une part, les variations ph´enotypiques10 affectent le comportement de la bact´erie. Lorsqu’elles r´esultent de l’adaptation `a diverses conditions ext´erieures de l’ensemble d’une population bact´erienne ayant le mˆeme g´enotype11, elles sont r´eversibles, non transmissibles `a la descendance, mais sp´ecifiques (non al´eatoire). Leur m´ecanisme est en relation avec l’activit´e des g`enes qui peut ˆetre r´egul´ee par des syst`emes plus ou moins complexes : induction comme dans l’op´e-ron lactose, r´epression comme dans l’op´el’op´e-ron tryptophane. D’autre part, les variations g´enotypiques affectent le g´enome bact´erien dans sa s´equence nucl´eotidique.

Les variations g´en´etiques dans leur grande majorit´e ne permettent pas de s’adapter `a un nou-veau milieu et certaines sont mˆemes l´etales. Mais une population bact´erienne compte des milliards d’individus. Il existe donc une chance d’obtenir une variation g´en´etique qui permette de perp´etuer une population sur un milieu d´efavorable (´evolution par hasard et s´election). Les deux principes g´en´eraux de variation g´en´etique chez les bact´eries sont :

1. les alt´erations du g´enome (les mutations et les r´earrangements)

2. le transfert de g`enes (la transformation, la conjugaison, la transduction, la transposition). Evidemment, ces deux grands principes sont parfois li´es. Par exemple les transposons et les phages peuvent `a la fois alt´erer le g´enome et permettre le transfert de g`enes ou encore la recombi-naison peut permettre des r´earrangements chromosomiques ou des transferts de g`enes.

10Le ph´enotype est l’ensemble des propri´et´es observables d’une cellule.

1.3.1 Alt´erations g´enomiques

La mutagen`ese spontan´ee (qui arrive naturellement dans l’environnement) regroupe tous les types de mutations (mutations ponctuelles, r´earrangements g´enomiques) provoqu´ees par n’importe quel type d’´ev´enement (erreur de r´eplication, recombinaison).

Les mutations ponctuelles (point mutation) regroupent les substitutions d’une paire de bases ou de paires de bases adjacentes (en tandem), et les d´ecalages du cadre de lecture (frameshift). La substitution d’une base regroupe les transitions (changement d’une purine (AG) en une purine ou d’une pyrimidine (CT) en une pyrimidine) et les transversions (changement d’une purine en une pyrimidine ou d’une pyrimidine en une purine). Les substitutions sont entraˆın´ees par des erreurs dans la fid´elit´e de la r´eplication (s´electivit´e de la polym´erase, relecture de la polym´erase et r´eparation des m´esappariements) ou par des l´esions de l’ADN (site sans base). Ces l´esions peuvent apparaˆıtre spontan´ement, `a cause d’instabilit´es de l’ADN (d´esamination de la cytosine m´ethyl´ee en uracile) ou ˆetre provoqu´ees par des agents mutag`enes ext´erieurs (radiations ionisantes, radicaux libres) ou encore par des r´eactions avec des interm´ediaires ou avec des enzymes pr´esents durant le m´etabolisme normal (d´eriv´es toxiques de l’oxyg`ene, transf´erases). Ces l´esions sont normalement r´epar´ees par des syst`emes sp´ecialis´es [Den Rupp, 1996]. La plupart des frameshifts correspondent `a l’insertion ou `a la d´el´etion d’une ou deux paires de bases (-GC-) dans une suite de deux bases r´ep´et´ees (polyNN -GCGCGC-). Lorsque la fourchette de r´eplication est bloqu´ee par une l´esion (cassure simple brin), il arrive qu’une base se d´esapparie dans un polyN autorisant un d´erapage (slippage) d’un brin par rapport `a l’autre, et conduisant alors `a une base en plus ou en moins dans le brin nouvellement synth´etis´e [Hutchinson, 1996].

Les r´earrangements chromosomiques reposent sur un m´ecanisme de recombinaison homologue. Celle-ci est un processus fondamental pr´esent chez tous les organismes et qui permet de r´earranger les g`enes ou des parties de g`enes `a l’int´erieur d’un chromosome ou entre deux chromosomes, de limiter la divergence de s´equences d’ADN r´ep´et´ees et de r´eparer l’ADN endommag´e. Elle implique un ´echange d’information g´en´etique entre deux s´equences similaires. Les r´earrangements chromo-somiques regroupent des d´el´etions, des duplications en tandem (insertion d’une s´equence qui existe d´ej`a dans le g´enome) et des inversions. Ils peuvent avoir lieu entre deux chromosomes fr`eres issus de la fourche de r´eplication ou `a l’int´erieur d’un chromosome [Roth et al., 1996].

1.3.2 Transferts de g`enes

Les alt´erations g´enomiques que nous venons de d´ecrire ont en commun leur caract`ere endog`ene (transmission verticale). A l’inverse, le transfert de g`enes entre deux organismes implique la no-tion de mat´eriel exog`ene, d’o`u la notion de transfert horizontal (horizontal gene transfert, HGT ). Quatre processus permettent les transferts de mat´eriel g´en´etique : la transformation (plasmide), la conjugaison (´episome), la transduction (phage) et la transposition (s´equence d’insertion ou IS). De fa¸con g´en´erale, l’ADN transf´er´e ne peut se perp´etuer dans la bact´erie r´eceptrice que s’il est d´ej`a dans un r´eplicon (plasmide) ou s’il est imm´ediatement int´egr´e dans un r´eplicon (chromosome

ou plasmide) par recombinaison (homologue, site-sp´ecifique). La recombinaison site-sp´ecifique se fait entre deux segments d’ADN d´efinis et similaires, reconnues par des enzymes sp´ecifiques qui catalysent la coupure et la religature. Ces enzymes sont des recombinases sp´ecialis´ees comme les int´egrases de phage.

Les quatre processus ´evoqu´es plus haut peuvent ˆetre d´ecrits de la mani`ere suivante [Saunders et al., 1999] :

1. La transformation est le transfert passif d’ADN d’une bact´erie donatrice `a une bact´erie r´e-ceptrice, dite en ´etat de comp´etence. En 1944, suite `a l’exp´erience de F. Griffith de 1928, O. Avery d´emontre d’une part que l’ADN est le support de l’information g´en´etique et d’autre part que les bact´eries sont capables d’int´egrer des fragments d’ADN chromosomiques provenant du milieu ext´erieur [Avery et al., 1944]. En laboratoire, il est plus efficace de transformer les bac-t´eries par des plasmides plutˆot que par des fragments d’ADN lin´eaires, rapidement d´egrad´es par les bact´eries.

2. La conjugaison est un transfert d’ADN entre une bact´erie donatrice (mˆale, ou F+) et une bact´erie r´eceptrice (femelle, ou F-), qui n´ecessite le contact et l’appariement entre les bact´eries, et repose sur la pr´esence dans la bact´erie F+ d’un facteur de sexualit´e ou de fertilit´e (facteur F). Le facteur F est un plasmide conjugatif, c’est-`a-dire qu’un des brins est transf´er´e par son extr´emit´e 5 au travers d’un pont cytoplasmique (pilus sexuel) par le m´ecanisme r´eplicatif du cercle roulant (rolling circle). Le facteur F est un ´episome car il a aussi la capacit´e de s’int´egrer dans le chromosome bact´erien et de s’en exciser. Lors de l’excision le plasmide F peut emporter un fragment d’ADN chromosomique. Il est alors appel´e (F’). Enfin, si la conjugaison a lieu au moment o`u le plasmide F est int´egr´e dans le chromosome, il est alors possible de transf´erer tout le chromosome bact´erien.

3. La transduction est le transfert d’ADN par l’interm´ediaire de certains bact´eriophages, dits temp´er´es. En effet les autres bact´eriophages, dits virulents, ne peuvent transf´erer de l’ADN puisque apr`es multiplication dans les bact´eries, ils les lysent syst´ematiquement. Le phage temp´er´e peut exister sous sa forme prophage, int´egr´e dans le chromosome d’une bact´erie dite lysog`ene, ou sous sa forme virulente, apr`es induction du cycle lytique. Au moment de son encapsidation et de la lyse bact´erienne, il peut incorporer des fragments d’ADN bact´eriens qui seront inject´es dans le cytoplasme bact´erien lors de l’infection suivante. Ces fragments bact´eriens peuvent alors ˆetre int´egr´es par recombinaison dans le chromosome de la nouvelle bact´erie infect´ee. Le phage temp´er´e a seulement un rˆole de vecteur dans le m´ecanisme de trans-duction. Il existe aussi, la conversion lysog´enique, o`u le g´enome du phage temp´er´e contient un ou plusieurs g`enes utiles `a la bact´erie comme des g`enes codant des toxines ou des facteurs antig´eniques. Leur expression dans toutes les bact´eries est li´ee `a l’´etat lysog`ene. Il disparaˆıt avec la perte de celui-ci.

4. Les transposons sont des s´equences d’ADN capables de changer de localisation dans le g´e-nome sans jamais apparaˆıtre `a l’´etat libre. La recombinaison des transposons n’est ni une

recombinaison sp´ecifique, ni une recombinaison homologue. D’une part, la recombinaison des transposons ne n´ecessite pas deux s´equences homologues ou deux sites sp´ecifiques mais une seule s´equence cible tr`es courte (TCGAT). Il existe donc de tr`es nombreux sites potentiels d’int´egration. D’autre part, elle n´ecessite une r´eplication de l’ADN. Dans le cas g´en´eral des transposons duplicatifs, si la transposition est conservative, elle ne n´ecessite que la r´eplication de la s´equence cible dupliqu´ee, alors que si elle est r´eplicative, elle n´ecessite la r´eplication du transposon et de la s´equence cible dupliqu´ee [Craig, 1996]. Il existe trois types d’´el´ements transposables : les IS, les transposons compos´es et les transposons non compos´es. L’IS1 est constitu´ee de deux g`enes, insA et insB, flanqu´ee de deux s´equences r´ep´et´ees invers´ees (IR ; ACAGTTCAG-insA-insB-CTGAACTGT). Les deux polypeptides cod´es par insA et insB, s’assemblent pour former la transposase. Le transposon compos´e IS10-Tn10 est constitu´e du g`ene de r´esistance `a la t´etracycline flanqu´e par deux IS10. Le transposon non compos´e Tn3 est constitu´e par une transposase, un site de recombinaison, une r´esolvase, un g`ene de r´esistance `

a l’ampicilline, le tout flanqu´e par deux IR [Craig, 1996].

Enfin, il existe une cinqui`eme fa¸con de transf´erer de l’ADN : un int´egron permet de capturer une cassette et d’en exprimer les g`enes [Ochman et al., 2000]. Un int´egron est un ´el´ement immo-bile constitu´e d’une int´egrase, d’un promoteur et d’un site-sp´ecifique, et port´e par un r´eplicon. L’int´egrase est capable d’ins´erer ou d’exciser une cassette (´el´ement mobile) par recombinaison site sp´ecifique. Plus de 60 cassettes12 impliqu´ees dans la r´esistance aux antibiotiques ou aux antisep-tiques ont ´et´e d´ecrites.

1.4 Monde procaryote et phylog´enie

Le monde vivant est divis´e en trois grands domaines : les archaea (archaebact´eries) et les bac-t´eries (eubacbac-t´eries) qui constituent les organismes procaryotes, puis les eucaryotes (Fig. 1.4 p. 55). Les virus ne sont pas des ˆetres vivants car ils n’ont pas de m´etabolisme propre [Danchin, 1998], pas de reproduction autonome et pas de membrane plasmique. En avril 2004, parmi les g´enomes complets publi´es, 18 g´enomes d’archaea, 142 g´enomes de bact´eries et 26 g´enomes d’eucaryotes sont disponibles (d’apr`es le site GOLD13).

1.4.1 Classification des esp`eces

L’esp`ece constitue l’unit´e de base de la classification bact´erienne. La d´efinition classique d’une esp`ece biologique (une communaut´e d’ˆetres vivants reconnaissables par leurs caract`eres et capables de se reproduire sexuellement entre eux en donnant naissance `a une prog´eniture fertile) n’est pas applicable aux procaryotes [Cohan, 2002]. Les bact´eriologistes ont dˆu ´elaborer une d´efinition origi-nale de l’esp`ece. En bact´eriologie, une esp`ece est constitu´ee par sa souche type et par l’ensemble

12http://www.microbes-edu.org/etudiant/gene4.html

des souches consid´er´ees comme suffisamment proches de la souche type pour ˆetre incluses au sein de la mˆeme esp`ece. La syst´ematique a pour but de classer les ˆetres vivants de mani`ere rationnelle en se basant sur les ressemblances et sur les relations qui existent entre eux. Elle repose sur deux disciplines, la taxonomie et la nomenclature. La taxonomie est la science qui permet de classer les organismes en groupes d’affinit´e ou taxa, et la nomenclature est l’ensemble des r`egles qui pr´esident `a l’attribution d’un nom `a chaque taxon. Le nom r´esume l’ensemble des caract´eristiques d’un taxon et l’utilisation d’une nomenclature correcte permet `a tous les protagonistes d’une mˆeme discipline de se comprendre sans ambigu¨ıt´e. Par exemple, le placement d’une souche bact´erienne dans la fa-mille des Enterobacteriaceae permet `a un bact´eriologiste de comprendre que cette souche rassemble des bacilles `a Gram n´egatif, non sporul´es, a´ero-ana´erobies, etc. Pour ˆetre fonctionnel, un syst`eme de nomenclature doit ˆetre rigoureux, pr´ecis, unique, universel et non ambigu (annexe A p. 383). Il existe diff´erentes approches taxonomiques, dont les trois principales sont les suivantes :

1. La classification ph´enotypique utilise un faible nombre de caract`eres consid´er´es comme impor-tants tels que la morphologie, la mise en ´evidence d’un caract`ere biochimique jug´e essentiel, l’habitat, le pouvoir pathog`ene, etc. Cette classification a l’inconv´enient de ne refl´eter qu’une quantit´e d’information r´eduite. De plus le choix des crit`eres qualifi´es d’importants est subjectif et il peut varier d’un auteur `a un autre, ce qui est une source potentielle d’instabilit´e.

2. Il fallut attendre la deuxi`eme moiti´e du 20`eme si`ecle pour qu’une taxonomie phylog´en´etique commence `a se mettre en place.

– En 1950, Chargaff [Chargaff, 1950] montre que le contenu en bases puriques et en bases pyrimidiques de l’ADN peut varier d’un individu `a un autre mais est constant pour les individus d’une mˆeme esp`ece. Actuellement, on admet que des bact´eries dont les G+C diff`erent de plus de 5% ne peuvent appartenir `a une mˆeme esp`ece et que des bact´eries dont les G+C diff`erent de plus de 10% ne peuvent appartenir `a un mˆeme genre. Bien sˆur, des valeurs du pourcentage en G+C identiques n’impliquent pas que les bact´eries sont proches car les s´equences peuvent ˆetre tr`es diff´erentes.

– Les m´ethodes d’hybridation ADN-ADN sont bas´ees sur le fait que deux mol´ecules d’ADN d´enatur´ees peuvent se r´eassocier `a condition de pr´esenter une homologie. La renaturation est r´ealis´ee `a partir d’un m´elange de deux ADN d´enatur´es provenant de bact´eries diff´erentes. Dans ces conditions, on obtient d’autant plus de duplex h´et´erologues que les s´equences d’ADN des micro-organismes sont proches. Pour reconnaˆıtre la provenance de chaque brin d’ADN dans les hybrides, on marque l’un des ADN par un isotope radioactif ou par une enzyme. La solidit´e, et donc la sp´ecificit´e, des hybrides sont appr´eci´ees par la mesure de la stabilit´e thermique.

– En 1962, L. Pauling et E. Zuckerkandl ont ´emis le concept d’horloge mol´eculaire [Kimura, 1983] : la vitesse de l’´evolution est constante, les mutations qui surviennent dans le g´enome n’ont pas n´ecessairement de cons´equences ph´enotypiques mais elles sont ´etroi-tement corr´el´ees avec le temps (th´eorie neutraliste de l’´evolution). Dans ces conditions, il est possible de construire un arbre g´en´ealogique (phylog´en´etique) en utilisant des m´ethodes

bioinformatiques. Le principe de base consiste `a comparer des g`enes homologues de fonction homologue (s´equences similaires descendant d’un ancˆetre commun qui codent des polypep-tides ayant conserv´e une fonction identique au cours du temps). Le choix des s´equences `a comparer pose un probl`eme car il est difficile de trouver une mol´ecule qui soit pr´esente et homologue chez tous les organismes et qui pr´esente des niveaux successifs d’informa-tion. En effet, pour comparer des organismes tr`es ´eloign´es, il faut utiliser des s´equences qui restent sensiblement conserv´ees durant des centaines de millions d’ann´ees, tandis que la comparaison d’organismes proches requiert l’´etude de s´equences o`u des mutations se seront accumul´ees en quelques millions d’ann´ees. Ainsi, les ARNr ont ´et´e choisis en taxonomie pour quatre raisons principales :

(a) ils sont pr´esents dans toutes les cellules ce qui permet des comparaisons entre proca-ryotes et eucaproca-ryotes

(b) ils ont une structure bien conserv´ee car toutes modifications pourraient avoir des cons´e-quences importantes sur les synth`eses prot´eiques

(c) il existe des portions d’ARNr dont la s´equence est identique chez tous les ˆetres vivants

(d) ils sont abondants dans la cellule et faciles `a purifier.

L’ARN 16S est le plus utilis´e car il est plus facile `a analyser que l’ARN 23S et plus riche en information que l’ARNr 5S. Ces s´equences correspondent `a des oligonucl´eotides pr´esents dans un groupe phylog´enique donn´e mais absent dans la plupart des autres groupes.

3. Les termes de taxonomie mixte et consensuelle (polyphasic taxonomy) font r´ef´erence `a une classification qui tient compte d’un maximum de donn´ees : donn´ees g´en´etiques, donn´ees ph´e-notypiques, donn´ees chimiotaxonomiques, donn´ees ´ecologiques, etc.

La d´efinition d’une esp`ece bact´erienne diff`ere en fonction de l’approche taxonomique retenue. Selon [Stackebrandt et al., 2002], le Comit´e ad hoc pour la r´e´evaluation de la d´efinition d’esp`eces en bact´eriologie, la d´efinition d’une esp`ece g´enomique (genomospecies) rentre dans le cadre de la taxonomie mixte et consensuelle.

Elle prend en compte des crit`eres de la taxonomie : (1) phylog´en´etique (hybridation ADN-ADN, ARN 16S et pourcentage en GC) et (2) ph´enotypique (morphologie, mobilit´e, biochimie). Autant que possible, la description d’une nouvelle esp`ece devrait reposer sur plusieurs souches. De plus, la d´efinition d’une nouvelle esp`ece doit recevoir l’assentiment de nombreux taxonomistes et sa description doit suivre un plan coh´erent et standardis´e. Pour les bact´eries d’int´erˆet m´edical ou v´et´erinaire, l’´ecologie et/ou le pouvoir pathog`ene peuvent prendre le pas sur les crit`eres g´en´etiques et conduire `a conserver des nomenclatures distinctes pour des taxons tr`es proches sur le plan g´en´etique, par exemple :

– Mycobacterium africanum, Mycobacterium bovis, Mycobacterium canettii, Mycobacterium mi-croti, Mycobacterium pinnipedii et Mycobacterium tuberculosis sont des variants d’un seul clone qui devrait ˆetre appel´e Mycobacterium tuberculosis, historiquement d´ecouvert en pre-mier.

– Yersinia pestis devrait ˆetre consid´er´ee comme une sous-esp`ece de Yersinia pseudotuberculosis, mais la Commission Judiciaire a rejet´e l’appellation de Yersinia pseudotuberculosis subsp. pestis.

Dans le cadre d’un travail de g´enomique comparative, il est essentiel d’avoir un point de vue global sur la classification des g´enomes procaryotes complets. Le site Microbial Genome Database for Comparative Analysis (MBGD)14 [Uchiyama, 2003] fournit une taxonomie des g´enomes proca-ryotes complets bas´ee sur celle du National Center for Biotechnology Information (NCBI )15. La taxonomie du NCBI regroupe 101.148 esp`eces (82.202 eucaryotes, 12.254 procaryotes et 6.692 vi-rus). C’est une taxonomie mixte et consensuelle constitu´ee `a partir de diff´erentes ressources comme le manuel de syst´ematique bact´eriologique de Bergey16, la nomenclature bact´erienne DSMZ17, la liste des noms des taxons bact´eriens ayant un statut officiel dans la nomenclature18, le projet de base d’ARNr (Ribosomal Database Project (RDP-II )19[Cole et al., 2003]), etc. La taxonomie mixte et consensuelle des g´enomes complets de MBGD pr´esente les diff´erents phyla (ou embranchements) dans l’ordre alphab´etique et ne permet donc pas de connaˆıtre l’histoire de ces phyla. Ainsi, n’ayant pas trouv´e d’arbre des g´enomes procaryotes complets fond´e sur la classification mixte et consen-suelle, nous nous sommes pench´es sur les m´ethodes de reconstruction d’arbres phylog´en´etiques. Ceci afin de pouvoir r´epondre `a des questions du type : le phylum des Actinobact´eries auquel appartient M. tuberculosis H37Rv est-il un groupe fr`ere des Firmicutes (B. subtilis) ou des Prot´eobact´eries (E. coli K-12) ?

1.4.2 Reconstruction d’arbres phylog´en´etiques

En phylog´enie mol´eculaire, de nombreuses approches sont possibles car il existe diff´erents :

1. mod`eles de classification (hi´erarchique, pyramidale, r´eticulaire),

2. m´ethodes de reconstruction d’arbre (distance, parcimonie et vraisemblance)

3. types de s´equences (une ou plusieurs s´equences d’ARN ou de polypeptides),

4. types de donn´ees `a classer (distance pour chaque couple (pairwise distance), nombre de mu-tations en chaque site, proportion de g`enes communs i.e. contenu en g`enes, conservation de l’ordre des g`enes, conservation de signatures de s´equences comme les indels [Gupta & Griffiths, 2002], ou signatures g´enomiques [Karlin et al., 2002]).

N´eanmoins, ces diff´erentes approches partent g´en´eralement d’un alignement de s´equences. La recherche de similitudes entre deux s´equences `a partir des alignements permet de mettre en ´evidence

Documents relatifs