• Aucun résultat trouvé

Caractéristiques des génomes eucaryotes

Dans le document Annotation des génomes de paramécies (Page 32-36)

Les génomes eucaryotes

I.1 Caractéristiques des génomes eucaryotes

M

on travail de thèse porte sur l’annotation de génomes eucaryotes et plus particuliè- rement l’annotation du génome d’un cilié : la paramécie. Avant de définir où se placent phylogénétiquement les ciliés au sein des eucaryotes (voir section III (p.51)), il est important de définir ce qu’est un eucaryote. Les eucaryotes sont des organismes uni- ou pluri-cellulaires avec un compartiment nucléaire entouré par une membrane. Générale- ment, les cellules eucaryotes contiennent un organite mitochondrial, siège des voies respi- ratoires et énergétiques. Les plantes et les algues peuvent contenir des chloroplastes, lieu de la photosynthèse. Il y a environ 1.5 à 2 milliards d’années, des cyano- et eu-bactéries auraient été intégrées par endosymbiose aux cellules eucaryotes primitives (probablement des archées) pour donner les mitochondries et les chloroplastes (respectivement). Les mi- tochondries et les chloroplastes contiennent donc leurs propres séquences génomiques. Dans ce manuscrit, je vais me focaliser sur l’annotation des génomes nucléaires des orga- nismes eucaryotes.

I.1.1 Phylogénie

E

n 1977, à l’aide d’études sur l’ARN ribosomique, Woese et al. (1990) ont décomposé le vivant en trois domaines : les bactéries, les archées et les eucaryotes. L’Empire eucaryote était divisé en cinq règnes : les protozoaires, les chromistes, les plantes, les champignons et les animaux. Aujourd’hui les eucaryotes sont classifiés en cinq super- groupes majeurs : SAR (avec les stramenopiles, les alvéolés, rhizaria, ...), Archaeplastida (plantes, algues,...), Excavata (flagellés), Amoebozoa (amibes, moisissures, ...) et les Opis- thokonta (animaux, champignons, choanoflagellés, ...) (Adl et al. 2012). La figure I.1 (p.4) montre les liens phylogénétiques entre ces groupes d’espèces. Les ciliés sont des alvéolés dans le super-groupe des SAR (Figure III.2 p.54 et la section correspondante pour plus de détails). Reconstruire l’histoire évolutive de la vie est une tâche ardue. Elle passe par une classification des espèces les unes par rapport aux autres. Classiquement des mé-

thodes de génomique comparative sont utilisées. Cependant, nous n’avons accès qu’aux génomes d’une infime partie des organismes eucaryotes présents sur notre planète. De plus, ces organismes sont largement biaisés vers des organismes multicellulaires ayant divergé il y a seulement 550 millions d’années, alors que la vie serait apparue il y a ∼3 milliards d’années (Hugenholtz et al. 2016). Représentant la grande majorité de la bio- diversité, les microorganismes sont parfois très difficiles à cultiver en laboratoire et donc à étudier. Aujourd’hui, les études métagénomiques sont aidées par une modernisation des techniques de biologie moléculaire et de séquençage (exemple le projet TARA Océan (Carradec et al. 2018)). Obtenir les génomes d’espèces représentatives de la diversité biologique permettra d’affiner les arbres phylogénétiques et de corriger les erreurs taxo- nomiques (Adl et al. 2019). Des efforts concertés de la part des experts scientifiques sont réalisés pour synthétiser et intégrer au mieux l’ensemble des données (Ruggiero et al. 2015). Par exemple, la communauté scientifique s’intéressant aux ciliés a établi un guide de recommandations des meilleures pratiques à adopter pour l’étude de la biodiversité, facilitant l’identification de nouvelles espèces (Warren et al. 2017).

Figure I.1 – Arbre phylogénétique des eucaryotes

Classification des eucaryotes les divisant en cinq super-groupes principaux d’espèces. Les SAR, les Archaeplastida, les Excavata, les Amoebozoa et Opisthokonta. Figure tirée de Adl et al. (2012).

I.1.2 Taille des génomes

L

es organismes ont des tailles de génome très diverses. La taille d’un génome est dé- finie par le nombre de nucléotides (ou bases) qui composent son génome haploïde, ou par une valeur "C" en pg d’ADN (1 pg équivalent à 978 Mb). La "complexité" d’un organisme (terme vague je l’admets) n’est pas corrélée à la taille de son génome. Illustré par la figure I.2 (p.5), certaines plantes ont des génomes beaucoup plus grands que le génome humain. Ce paradoxe de la valeur "C" peut s’expliquer par la présence de plus ou moins de séquences non-codantes ou répétées dans les génomes mais également par des événements de polyploïdisation.

Figure I.2 – Schéma représentant les gammes de taille de génome

Dans un même groupe d’organismes les tailles de génomes peuvent varier de façon importante. La "complexité" de l’organisme n’est pas reliée à la taille de son génome. Figure tirée et modifiée du site http ://book.bionumbers.org/how-big-are-genomes/

A titre d’exemple, le génome hexaploïde du blé tendre (Triticum aestivum) est de 16 Gb, alors que l’homme n’a qu’un génome de 3.2 Gb. La plante Paris japonica a un génome de 150 Gb, un des génomes les plus grands connus (Pellicer et al. 2010). Et l’historiquement célèbre petit pois de Gregor Mendel a un génome diploïde 1.5 fois plus grand que le génome humain (4.5Gb), notamment dû à beaucoup de séquences hautement répétées (Kreplak et al. 2019). Le nombre de gènes codants n’est pas non plus relié à la taille du génome. Le nématode Caenorhabditis elegans compte environ 20 000 gènes pour un génome de 100 Mb, alors que l’homme a le même nombre de gènes mais un génome de 3 Gb (Table I.1 p.6). Bien évidemment, il faut relativiser ces observations sur le nombre de gènes

compte tenu de l’épissage alternatif introduisant une diversité de protéines produites très importante, et notamment chez l’humain.

Groupe Espèce Taille de gé-

nome Nombregènes codantsde Nombrechromosomesde haploïdes Bactérie E. coli 4.6 Mb 4300 1 Champignon S cerevisiae 12 Mb 6600 16 Protiste P. tetraurelia 100 Mb 40000 ? Plante A. thaliana 140 Mb 27000 5 (2n) P. japonica 150 Gb ? 20 (2n) Insecte D. melanogaster 140 Mb 14000 4 (2n) Nématode C. elegans 100 Mb 20000 6 (2n)

Poisson F. rubripes (fugu) 400 Mb 19000 22

Mammifère H. sapiens 3.2 Gb 21000 23 (2n)

Table I.1 – Taille de génomes et nombre de gènes pour plusieurs organismes

Le tableau rapporte la taille de génome, le nombre de gènes codants et le nombre de chromosomes pour une variété d’organismes. Informations tirées en partie du site http ://book.bionumbers.org/how-big-are-genomes/

I.2 Organisation des génomes eucaryotes

Dans le document Annotation des génomes de paramécies (Page 32-36)