• Aucun résultat trouvé

Génomique de la paramécie

Dans le document Annotation des génomes de paramécies (Page 93-98)

Annotation des génomes

A. Arbre sans racines (basé sur un consensus de données moléculaires et ultrastructurales) don nant une image large de la diversité des eucaryotes Paramecium appartient au phylum des ciliés

III.3 Génomique de la paramécie

III.3.1 Les génomes micronucléaire et macronucléaire

N

ous avons vu précédemment que les ciliés présentent un dimorphisme nucléaire. Le MIC est le noyau germinal transmettant le matériel génétique à la descendance. Le MIC est transcriptionnellement éteint pendant la vie végétative. En revanche, toute la transcription génique, nécessaire à la vie cellulaire, a lieu dans le noyau MAC somatique, Bien qu’étant originaire d’un même noyau zygotique (Figure III.6 p.59), les noyaux MIC et MAC sont très différents. En effet, le petit MIC est diploïde, alors que le gros MAC est hautement polyploïde. Le nouveau MAC en développement subit plusieurs vagues d’endoréplication pour passer d’un stade diploïde à un stade polyploïde (Figure III.8 p.65) (Berger 1973). L’ébauche endure également des réarrangements programmés de génomes (Coyne et al. 2012, Betermier and Duharcourt 2014). Ces réarrangements programmés de génome consistent en une fragmentation des chromosomes MIC et une perte de matériel génétique. Par exemple, contrairement aux chromosomes MIC, les chro- mosomes MAC sont dépourvus de centromères actifs, démontré par une absence de mar- quage des noyaux par le variant d’histone centromérique (Cervantes et al. 2006, Cui and Gorovsky 2006, Lhuillier-Akakpo et al. 2016) (voir section I.2.1 p.7). La majorité des séquences perdues pendant la maturation du MAC correspondent à des séquences répétées, satellites et transposons. Si ces processus biologiques sont communs aux ciliés, les modalités et la nature des événements diffèrent. En effet, la situation est relativement différente si l’on étudie Tetrahymena, Paramecium ou Oxytricha (Table III.1 p.64 et Figure III.8 p.65). Tetrahymena thermophila Paramecium te- traurelia Oxytricha trifallax

Nombre de chromosome MIC 5 ≥50

?

Ploïdie du MIC 2 2 2

Taille du génome MIC 157 Mb ∼100 Mb ∼500 Mb

Contenu en G+C du MIC 22% 27% 28%

Nombre d’IES 12 000 45 000 150 000

Complexité éliminée (%) 34% 28% 90%

Nombre de chromosome MAC 181 ∼150 15600

Ploïdie du MAC 45 800 ∼2 000

Taille du génome MAC 103 Mb 72 Mb 50 Mb

Nombre de gènes 24 700 40 460 ∼18 400

Contenu en G+C du MAC 22% 28% 31%

Table III.1 – Statistiques sur les génomes haploïdes MIC et MAC de Tetrahymena, Paramecium et Oxytri- cha

Figure III.8 – Dimorphisme nucléaire et réarrangements de l’ADN chez Paramecium et Tetrahymena Ce schéma représente les réarrangements programmés de génome entre le noyau MIC et le noyau MAC chez Tetrahymena thermophila (en haut en vert) et Paramecium tetraurelia (en bas en saumon). La figure est commentée dans le texte. Figure tirée de Coyne et al. (2012)

Tetrahymena thermophila a un micronoyau contenant 5 chromosomes métacentriques avec une complexité de génome haploïde de 157 Mb (Hamilton et al. 2016). Les chro- mosomes MIC sont coupés en 181 chromosomes MAC d’une taille comprise entre 20 kb et 3 Mb. La fragmentation des chromosomes s’effectue à des sites bien spécifiques de 15 pb, appelés Cbs (Chromosome breaking site) (Yao et al. 1990, Fan and Yao 2000, Hamilton et al. 2016). Aux abords des coupures, les extrémités sont dégradées puis télomérisées (Fan and Yao 1996) (Figure III.8 p.65). Pendant la différenciation macronucléaire, >30% du matériel génétique micronucléaire est éliminé. Environ 12 000 séquences, appelées IES (Internal Eliminated Sequences), sont excisées du futur génome MAC (Hamilton et al. 2016). La très grande majorité de ces IES sont intergéniques et excisées de manière impré- cise puis ligaturées. Uniquement 12 IES intragéniques ont été identifiées chez Tetrahymena (Hamilton et al. 2016, Cheng et al. 2016, Feng et al. 2017). D’autre part, le MAC de Tetrahymena thermophila passe d’un état diploïde à une ploïdie∼45n, pour une complexité de génome haploïde de 103 Mb (Eisen et al. 2006, Coyne et al. 2008) (Table III.1 p.64). Oxytricha trifallax est un autre organisme modèle cilié très distant phylogénétique- ment de Paramecium ou de Tetrahymena (Figure III.3 p.55 et III.4 p.55). Cette espèce est cependant très intéressante. Le génome MIC a une complexité estimée d’au moins 500 Mb (Chen et al. 2014). Les chromosomes micronucléaires sont fragmentés en ∼16 000 "nanochromosomes" somatiques de ploïdie variable (∼2000n), puis télomérisés (Nowacki et al. 2010, Swart et al. 2013). Avec une taille moyenne de 3.2kb, les nanochromosomes

ne contiennent en général qu’un seul gène. Plus de 90% de l’ADN MIC est éliminé pen- dant la différenciation macronucléaire. On estime que∼150 000 séquences (IES), bornées par de courtes répétitions appelées pointeurs, sont éliminées précisément (Chen et al. 2014). De petits ARN produits à partir de transcrits maternels ciblent les régions à pro- téger de l’élimination (Fang et al. 2012, Zahler et al. 2012). Nous verrons dans la section III.3.2.3 (p.75) que les réarrangements programmés de génome de la paramécie impliquent également des petits ARN, mais ils ont un rôle de ciblage des régions à éli- miner et non pas protecteur. En plus de cette élimination d’ADN, pour reconstituer ses nanochromosomes somatiques et reformer des gènes fonctionnels, Oxytricha utilise de longs transcrits maternels pour réordonner et réorienter les fragments de gènes portés par les chromosomes MIC (Figure III.9 p.66) (Nowacki et al. 2008).

Figure III.9 – Développement du génome macronucléaire chez Oxytricha

Pendant la conjugaison des cellules d’Oxytricha, des segments du génome micronucléaire sont ex- cisés et religués ensemble pour former les nanochromosomes du nouveau génome MAC (ou MDS pour Macronucleus Destined Sequence). Le reste du génome micronucléaire est éliminé. Les segments religués peuvent être soit en ordre (formant par exemple le nanochromosome 1, à gauche), soit en ordre ou inversés (formant par exemple les deux formes du nanochromosome 2), auquel cas ils doivent être ré-ordonnés. Une fragmentation alternative de l’ADN, pendant le développement MAC, produit des isoformes de nanochromosomes de tailles différentes (2a et 2b). Les nanochro- mosomes matures sont coiffés aux deux extrémités par des télomères. Figure de Swart et al. (2013)

Paramecium tetraurelia possède dans son cytoplasme deux micronoyaux (∼3µm) di- ploïdes et un macronoyau (∼30µm) polyploïde (∼800n) (Berger 1973). La complexité du génome MIC est estimée à ∼100 Mb (Guérin et al. 2017). Le nombre de chromosomes MIC n’est pas parfaitement connu, mais un marquage cytologique a détecté ∼60 paires de chromosomes germinaux (Jones 1956, Betermier and Duharcourt 2014). Contraire- ment à Tetrahymena, la fragmentation des chromosomes MIC de la paramécie ne s’effectue

pas à des sites spécifiques tels que les Cbs. Les points de cassures sont imprécis et localisés dans des zones particulières des chromosomes MIC contenant des minisatellites ou trans- posons. Cependant, aucun motif n’a été détecté. Le Mouël et al. (2003) ont observé chez Paramecium primaurelia une élimination variable d’ADN aux abords des coupures pouvant aller jusqu’à ∼20kb. Les extrémités peuvent être télomérisées ou religuées (Figure III.8 p.65). On considère que Paramecium tetraurelia possède∼120 chromosomes MAC (dénués de séquences répétées et sans centromères) pour une complexité haploïde de 72 Mb (Aury et al. 2006). La résolution variable des cassures chromosomiques entraine la présence de plusieurs versions différentiellement réarrangées d’un même chromosome MAC au sein d’une même cellule. L’assemblage du génome MAC est donc une version consensus et théorique de la diversité des molécules que l’on pourrait observer dans un macronoyau. Autrement dit, un chromosome MAC n’a pas de réelle existence. Environ 28% du gé- nome MIC est éliminé pendant la différentiation macronucléaire. Parmi ces ∼28%, ∼3% de séquences, appelées IES, sont excisées du génome de manière précise. Contrairement à Tetrahymena, les 45 000 IES de paramécie sont en copie unique et bornées invariablement par deux di-nucléotides TA à chaque extrémité (Bétermier et al. 2000, Arnaiz et al. 2012). Dans la section III.3.2 (p.68), je donnerai plus d’éléments sur les caractéristiques des IES de paramécie.

III.3.2 Élimination des séquences micronucléaires

C

omme pour tous les ciliés, le bon développement du nouveau MAC est critique pour la survie de la paramécie. Nous avons vu que ce développement macronucléaire im- plique des réarrangements programmés de génome et une amplification de l’ADN de 2n à environ 800n (8 à 10 cycles de réplication Berger (1973)). Les réarrangements de génome chez la paramécie correspondent à une perte de matériel génétique (Table III.1 p.64) que l’on peut séparer en deux catégories : une élimination hétérogène de séquences (∼25 Mb) plus ou moins répétées (transposons et satellites) et une excision précise de petites sé- quences (IES pour Internal Eliminated Sequences) représentant une complexité de∼3.5 Mb (Figure III.6 p.59). Ces deux processus complexes ont lieu dans une fenêtre de temps de quelques heures (Bétermier 2004). Les IES pouvant être intragéniques, le nouveau MAC doit être correctement réarrangé pour être fonctionnel. Pendant le développement ma- cronucléaire, les fragments de l’ancien MAC (en dégradation) assurent la transcription génique nécessaire à la vie cellulaire. Le développement du MAC commence par 3 à 4 cycles de réplication discrets. La suite de l’amplification d’ADN sera continue et se pour- suivra après la division caryonidale (Berger 1973). L’excision des IES commence après les premiers cycles de réplication et se terminera avant la division caryonidale (Gratias and Bétermier 2001). D’après des données préliminaires d’A. Le Mouël et A. Gratias, l’éli- mination hétérogène des séquences répétées s’amorcerait après les premières excisions d’IES.

III.3.2.1 Les Internal Eliminated Sequences

L

’ensemble des éléments, que je vais introduire dans ces paragraphes, seront dévelop- pés dans la section V.1.1 des résultats (p.105) et dans l’article associé (Arnaiz et al. 2012).

Caractérisation des IES Les IES de paramécie sont des segments d’ADN éliminés pré- cisément pendant le développement du génome MAC. A l’exception de l’IES du gène mtA (voir section III.2.3.1 p.61 et la discussion VII.2.2.3 p.178), les IES sont non codantes et globalement uniques dans le génome. Dans les années 1990-2000, seule une poignée d’IES avait pu être identifiée, majoritairement dans des gènes codant pour des antigènes de surface (Steele et al. 1994, Preer et al. 1992). Il a fallu attendre le séquençage du génome MAC et l’identification de la transposase domestiquée PiggyMac (Pgm), de la fa- mille des transposases piggyBac (voir section II.2.1.2 p.44), nécessaire aux réarrangements, pour identifier les 45 000 IES du génome de Paramecium tetraurelia (Aury et al. 2006, Bau- dry et al. 2009, Arnaiz et al. 2012). Les IES sont invariablement bornées par deux TA requis pour une excision correcte (Mayer and Forney 1999, Ruiz et al. 2000, Gratias et al. 2008). Les IES que nous avons identifiées sont de courtes séquences (entre 26pb et 5.5kb dont 93% avec une taille inférieure à 150 paires de bases) (Figure III.10A p.69) ne représentant que 3.5 Mb de complexité sur les 28 Mb éliminées pendant la maturation du

MAC (Guérin et al. 2017). La distribution des tailles d’IES est remarquable. Elle montre une périodicité de 10.2pb correspondant à un tour d’hélice de l’ADN double brin. Nous avons postulé que cette contrainte de taille traduirait une pression mécanistique pour une excision optimale des IES (Bischerour et al. 2018). En effet, le rapprochement des deux bornes de l’IES autoriserait l’introduction des cassures double brin, ensuite les deux TA résiduels s’apparieraient pour permettre la réparation (voir paragraphe suivant sur la Mécanismes moléculaires d’excision des IES). Donc deux TA spatialement proches minimise- raient l’énergie de torsion de l’ADN qui favoriserait la réaction (Arnaiz et al. 2012).

Figure III.10 – Propriétés de séquence des IES de P. tetraurelia

A. Histogramme de taille des IES B. Consensus aux bornes des IES. Figure tirée de Arnaiz et al.

Dans le document Annotation des génomes de paramécies (Page 93-98)