• Aucun résultat trouvé

4. Réarrangements chromosomiques et évolution des génomes chez les Saccharomycotina

4.2. Reconstruction des génomes ancestraux des Saccharomycotina

4.2.2. Construction de l’arbre phylogénétique des 66 espèces de Saccharomycotina

4.2.2.1. Identification des homologues synténiques

Pour construire l’arbre phylogénétique des 66 génomes, nous avons choisi d’utiliser les homologues synténiques non-dupliqués comme orthologues. Nous avons d’abord identifié les blocs de synténie avec

SynChro (Drillon et al., 2014) avec le paramètre ∆=3. Pour rappel, ∆ correspond au seuil de fragmentation

maximum autorisé pour décider si deux régions synténiques proches entre deux espèces forment un seul bloc de synténie ou deux blocs distincts.

Nous avons recherché par transitivité les blocs de synténie ubiquitaires entre les 66 espèces à partir des blocs de synténie entre paires de génomes (Figure 28). Cela signifie que si des gènes du génome 1 sont conservés en synténie avec le génome 2 et que ces gènes du génome sont eux-mêmes conservés en synténie avec le génome 3, alors ont considère que les régions du génome 1 et 3 sont conservées en synténie. Nous avons ensuite extrait les gènes homologues conservés dans l’intersection de ces blocs ubiquitaires. Dans chaque région, les gènes conservés à travers tous les génomes sont des homologues synténiques. Au total, 28 homologues synténiques uniques sont partagés par les 66 espèces considérées (Tableau 3).

Figure 28 Détection des homologues synténiques uniques. Dans cet exemple, les gènes bleus, rouges, verts, orange et roses

forment un bloc conservé d’homologues synténiques avec ∆=3. Le gène bleu présente un paralogue (à droite) mais celui-ci ne fait pas partie d’un bloc de synténie partagé par toutes les espèces et est donc exclu. Notons que l’insertion des deux gènes gris entre le gène vert et orange dans le génome 3 pourrait, si nous avions choisi ∆<2, conduire à la perte des gènes oranges et roses.

104

Tableau 3 Orthologues synténiques uniques des Saccharomycotina partageant 75% de similarité ou plus.

# Identifiant Symbole Nom

1 YCR047C BUD23 BUD site selection

2 YDL097C RPN6 Regulatory Particle Non-ATPase

3 YDR148C KGD2 alpha-KetoGlutarate Dehydrogenase

4 YDR375C BCS1 ubiquinol-cytochrome c reductase (bc1) Synthesis

5 YDR454C GUK1 GUanylate Kinase

6 YEL051W VMA8 Vacuolar Membrane Atpase

7 YER025W GCD11 General Control Derepressed

8 YFL038C YPT1 Yeast Protein Two

9 YGL058W RAD6 RADiation sensitive 519 YGL058W

10 YHR088W RPF1 Ribosome Production Factor

11 YIL078W THS1 THreonyl tRNA Synthetase

12 YJR064W CCT5 Chaperonin Containing TCP-1

13 YJR065C ARP3 Actin-Related Protein

14 YKL013C ARC19 ARp2/3 Complex subunit

15 YKL056C TMA19 Translation Machinery Associated

16 YKL170W MRPL38 Mitochondrial Ribosomal Protein, Large subunit

17 YKR081C RPF2 Ribosome Production Factor

18 YLR197W NOP56 NucleOlar Protein of 56.8 kDa

19 YLR289W GUF1 Gtpase of Unknown Function

20 YLR355C ILV5 IsoLeucine-plus-Valine requiring

21 YOR136W IDH2 Isocitrate DeHydrogenase

22 YOR157C PUP1 PUtative Proteasome subunit

23 YOR261C RPN8 Regulatory Particle Non-ATPase

24 YPL028W ERG10 ERGosterol biosynthesis

25 YPL211W NIP7 Nuclear ImPort 546 YPL211W

26 YPL235W RVB2 RuVB-like 1416 YPL235W

27 YPR016C TIF6 Translation Initiation Factor

28 YPR132W RPS23B Ribosomal Protein of the Small subunit

Nous avons ensuite recherché un enrichissement des « Gene Ontology terms » (GO-terms) pour les ces 28 gènes sur la base des annotations de S. cerevisiae à l’aide de l’outil « SGD Gene Ontology Slim Mapper» (https://www.yeastgenome.org/cgi-bin/GO/goSlimMapper.pl) mis à disposition par le site web Saccharomyces Genome Database (SGD) (Tableau 4). Seuls les GO-terms dont la p-valeur est inférieure à 10-2 sont indiqués. On observe que les termes rapportés peuvent globalement être regroupés autour de deux grandes catégories que sont la catégorie « mitochondrie » et la catégorie « ribosome ». Il est intéressant de constater que ces gènes, conservés en synténie tout au long de l’évolution des

Saccharomycotina sont impliqués dans ces processus cellulaires centraux de respiration et de traduction.

105

Tableau 4 Enrichissement en GO-slim (Process) à partir des 28 homologues synténiques identifiés chez les Saccharomycotina. Les

Go-slim se rapportant à la respiration/la mitochondrie sont indiqués en bleu. Les GO-slim se rapportant à la traduction/au ribosome sont indiqués en vert. Les GO-slim se rapportant au métabolisme protéique, ici la dégradation des protéines, sont indiqués en rouge.

GO term Gene(s) p-value

ribosomal subunit export from nucleus BUD23, RPF1, TIF6 1, 1E-10

rRNA processing

BUD23, RPF1, RPF2, NOP56, NIP7, RVB2, TIF6,

RPS23B 1, 9E-09

ribosomal large subunit biogenesis RPF1, RPF2, NIP7, TIF6 4, 3E-08

regulation;translation GCD11, GUF1, RPS23B 6, 2E-05

mitochondrion organization KGD2, BCS1, ARP3, ARC19, ILV5 1, 2E-04

ribosome assembly RPF1, RPF2 2, 6E-04

organelle inheritance ARP3, ARC19 2, 6E-04

proteolysis involved in cellular protein catabolic process RPN6, RAD6, PUP1, RPN8 7, 3E-04

cellular respiration KGD2, IDH2 3, 4E-03

nuclear transport BUD23, RPF1, TIF6 5, 6E-03

protein complex biogenesis RPN6, BCS1, YPT1, ARP3 7, 1E-03

Nous avons ensuite inféré l’arbre phylogénétique des Saccharomycotina avec la méthode du maximum de vraisemblance sur le concaténât des 28 familles d’homologues synténiques présentés plus haut. L’alignement multiple des séquences protéiques a été réalisé avec l’algorithme Muscle 3.8.31 et les paramètres par défaut (Edgar, 2004), les parties de l’alignement de piètre qualité ont été nettoyées avec

Gblocks 0.91 (Castresana, 2000), et l’arbre phylogénétique a été inféré avec PhyML 3.0 (Guindon et al., 2010)

avec le modèle LG, s paramètres « -s best » et 100 bootstraps.

L’arbre phylogénétique obtenu est représenté Figure 29. Cet arbre est globalement bien soutenu par les valeurs de Bootstrap (Figure 29, insert). De plus, les espèces des quatre grands groupes présentés dans l’introduction : (i) Saccharomycetaceae, (ii) CTG clade, (iii) méthylotrophes et (iv) lignées basales sont correctement séparées. La topologie de cet arbre est très cohérente avec les topologies précédemment publiées, cependant, elle présente une erreur de branchement, indiquée en rouge. Afin de résoudre cette erreur, nous avons subdivisé l’arbre au niveau de son nœud supérieur de manière à former trois grands groupes d’espèces : (i) Saccharomycetaceae, (ii) le clade CTG et les méthylotrophes, (iii) les lignées basales. Sur la base des clusters d’espèces enrichis en RBH présentés Figure 27, cette partition devrait permettre de considérablement intensifier le signal phylogénétique et de reconstruire des sous-arbres mieux résolus.

106

Figure 29 Arbre phylogénétique des Saccharomycotina obtenu à partir de 18 homologues synténiques uniques. L’étoile noire

indique la duplication totale du génome dans le clade des Saccharomycetaceae. L’erreur de branchement des clades

Naumovozyma/Kazachstania et Candida/Nakaseomyces est indiquée en rouge. Les valeurs de bootstrap différentes de 100% sont

indiquées en bleu.