• Aucun résultat trouvé

Construction d’arbres phylogénétiques à partir d’autres signaux

4. Réarrangements chromosomiques et évolution des génomes chez les Saccharomycotina

4.2. Reconstruction des génomes ancestraux des Saccharomycotina

4.2.2. Construction de l’arbre phylogénétique des 66 espèces de Saccharomycotina

4.2.2.3. Construction d’arbres phylogénétiques à partir d’autres signaux

L’analyse des séquences protéiques des homologues synténiques nous a permis d’obtenir un arbre phylogénétique robuste et cohérent pour reconstruire les génomes ancestraux. Toutefois, comme nous avons remarqué dans la matrice Figure 27, le nombre de RBH entre les paires de génomes de notre jeu de données forment des clusters suggérant la présence d’un signal phylogénétique exploitable pour reconstruire un arbre phylogénétique. Nous avons donc calculé une matrice de distance à partir de la matrice Figure 27 et reconstruit un arbre phylogénétique avec les paramètres par défaut de l’algorithme Fitch de PhyML. L’arbre obtenu est présenté Figure 34.

Comme on peut le voir, la topologie de l’arbre obtenu est assez cohérente, avec 60% de « splits » corrects (en vert dans la Figure 34). Un split est une bipartition des espèces actuelles obtenue en scindant une branche de l’arbre. L’arbre des Saccharomycetaceae est reconstruit avec seulement 10 erreurs. La plupart des erreurs se trouvent dans l’arbre des CUG et méthylotrophes dans lequel seulement 7 splits ont été inférés correctement, probablement en raison des nombreuses branches internes courtes, qui sont mal résolues. L’arbre des lignées basales est correct à une erreur de branchement près. On remarque a

posteriori que le nombre de RBH dans la matrice Figure 27, page 101 parait plus résolutif (plus « contrasté »)

et globalement plus élevé entre les Saccharomycetaceae que dans les autres sous-arbres, expliquant la différence de qualité entre les trois sous-arbres. Il est intéressant de voir que le répertoire de gènes en lui-même permet déjà de générer un arbre qui ait du sens. Cela témoigne de la dynamique importante du répertoire de gènes dans l’arbre des Saccharomycotina.

Comme nous l’avons expliqué dans l’introduction, les réarrangements s’accumulent au cours du temps en faisant progressivement diverger la structure des génomes. Nous avons cherché à reconstruire un arbre phylogénétique à partir de ce signal. Pour cela, nous avons analysé les blocs de synténie identifiés par

SynChro (∆=3) entre les espèces actuelles avec le logiciel PhyChro. Le principe de cet outil est de séparer de

manière itérative les génomes actuels en deux groupes sur la base d’adjacences de gènes incompatibles. Un arbre est ensuite reconstruit selon une approche bottom-up en regroupant les génomes qui minimisent le nombre d’adjacences incompatibles. PhyChro estime les longueurs de branches à partir du nombre de réarrangements inférés entre les génomes des espèces actuelles. L’arbre phylogénétique obtenu avec

PhyChro est présenté Figure 35. On voit que les trois grands groupes d’espèces (sous-arbre 1, 2 et 3) sont

correctement séparés, de même que les Saccharomycetaceae issues de la duplication totale du génome et les espèces n’ayant pas été dupliquées. On observe cependant un grand nombre de branches très courtes et des embranchements multiples, indiquant que l’identification des réarrangements n’est pas toujours très résolutive pour construire un arbre. Néanmoins, nous avons comparé les splits de l’arbre généré par

PhyChro aux splits de l’arbre obtenu à partir de l’analyse des homologues synténiques. Les résultats sont

représentés sous forme d’un cladogramme, pour plus de lisibilité (Figure 36). On observe, par rapport à l’arbre obtenu à partir des homologues synténiques, seulement 15 différences dans l’ensemble de l’arbre : 9 splits incorrects et 6 embranchements multiples. Les embranchements multiples sont liés à l’absence d’information plutôt qu’à de véritables erreurs, le taux de bipartitions correctes est donc de 86%.

113

Les arbres inférés à partir de ces deux signaux indépendants, issus de l’accumulation des mutations non-synonymes ou des réarrangements chromosomiques, fournissent donc des topologies remarquablement concordantes. Cela renforce la validité de notre topologie. Cependant, on voit que les longueurs de branches relatives entre ces deux arbres ne sont pas corrélées (insert dans la Figure 36).

Toutefois, l’analyse directe de la synténie sur les génomes actuels fournit souvent une approximation peu précise du nombre de réarrangements passés, notamment en raison de la réutilisation des points de cassure au cours de l’évolution des génomes (Guénola Drillon, thèse). Afin d’inférer les réarrangements passés de manière plus fiable, il faut d’abord reconstruire les génomes ancestraux, puis les comparer entre eux.

114

Figure 34 Comparaison entre l’arbre phylogénétique obtenu à partir de l’analyse des séquences protéiques des homologues synténiques (à gauche) et l’arbre obtenu en calculant une matrice de distance à

partir du nombre de RBH entre les paires d’espèces, sans analyser leur séquence (à droite). La duplication totale du génome est indiquée par l’étoile noire. Les espèces actuelles ont été reliées en gris pour faciliter la comparaison des deux arbres. L’arbre reconstruit à partir du nombre de RBH présente 40 splits corrects et donc partagés avec l’arbre de gauche (en vert). Les splits faux sont indiqués en rouge. Les branches menant aux espèces actuelles n’entrent pas dans la comparaison des splits et sont représentées en noir.

115

Figure 35 Arbre phylogénétique des 66 espèces généré par PhyChro. Les longueurs de branches correspondent à des nombres de

116

Figure 36 Splits corrects et incorrects dans la topologie de l’arbre généré par PhyChro. Les splits faux sont représentés par les

branches en rouge, les embranchements multiples sont indiqués par des flèches rouges. L’insert représente la comparaison entre les longueurs de branches de l’arbre inféré à partir des homologues synténiques (substitutions non-synonymes) et les longueurs de branches inférées par PhyChro (nombre de réarrangements inférés directement entre les génomes des espèces actuelles). Seules les branches correspondant à des splits communs aux deux arbres sont comparées.

117

4.2.3. Reconstruction des génomes ancestraux