• Aucun résultat trouvé

Inférence des réarrangements chromosomiques passés

4. Réarrangements chromosomiques et évolution des génomes chez les Saccharomycotina

4.2. Reconstruction des génomes ancestraux des Saccharomycotina

4.2.4. Inférence des réarrangements chromosomiques passés

Pour inférer les réarrangements chromosomiques passés, on compare la structure des génomes situés aux nœuds consécutifs de l’arbre. On compare donc soit deux nœuds internes pour inférer les réarrangements sur une branche interne soit une espèce actuelle avec son ancêtre commun le plus récent pour inférer les réarrangements sur les branches terminales de l’arbre. A cet effet, nous avons calculé les blocs de synténie entre les génomes des nœuds consécutifs de l’arbre avec SynChro en utilisant le paramètre ∆=0. Nous avons ensuite utilisé ReChro pour détecter à partir des blocs de synténie, les réarrangements qui ont eu lieu sur chaque branche de l’arbre. Notons que le paramètre ∆=0 de SynChro permet à ReChro d’identifier les inversions d’un seul gène en plus des réarrangements décrits à partir de blocs de synténie plus grands (Vakirlis et al., 2016).

Remarquons qu’AnChro exprime chaque génome ancestral de deux manières : en fonction des gènes du génome G1 et en fonction des gènes du génome G2. Par conséquent, il existe au plus quatre manières différentes de comparer la structure de deux génomes consécutifs de l’arbre. Cela pose problème, car en exprimant un génome ancestral en fonction des gènes d’espèces actuelles différentes, on peut en principe observer des différences dans les blocs de synténie inférés à l’étape SynChro (∆=0). Ceci peut engendrer des différences dans les réarrangements inférés par ReChro. Nous avons donc inféré les réarrangements balancés en comparant toutes les « versions » disponibles d’une même branche, c'est-à-dire en effectuant toutes les comparaisons des nœuds consécutifs exprimés de différentes manières.

Nous avons ensuite calculé pour chaque branche de l’arbre, la différence absolue entre le nombre de réarrangements balancés inférés pour une « version de branche » par rapport au nombre moyen de réarrangements sur toutes les versions de la branche. La distribution de ces écarts est représentée sur la Figure 43.

On observe que la distribution des écarts est très fortement centrée sur 0, ce qui signifie que la détection des réarrangements est robuste quelles que soient les versions des génomes ancestraux qu’on compare. On observe une valeur extrême de 250 qui correspond à la branche de l’arbre située entre Millerozyma

farinosa et son ancêtre le plus récent. Cet écart est dû au fait que Millerozyma farinosa est un hybride

interspécifique dont la structure du génome perturbe fortement la détection des réarrangements selon la version de l’ancêtre qu’on considère : exprimée en fonction des gènes de Candida guilliermondii ou des gènes de Debaryomyces hansenii. Cette observation était donc prévisible. Nous avons exclu les résultats de cette branche conformément à notre décision préalable de ne pas utiliser le génome de Millerozyma

farinosa comme source d’information. A l’échelle de l’ensemble de l’arbre, l’écart au nombre de

réarrangements moyen entre les différentes versions d’une même branche est de 3,2%. Dans la mesure du possible nous avons tout de même choisi de comparer pour chaque branche, des génomes consécutifs exprimés en fonction des gènes de la même espèce actuelle. Par exemple, les ancêtres 1.10 et 1.11 peuvent tous deux êtres exprimés en fonction des gènes de L. fantastica. Pour les autres branches, nous avons comparé les versions des génomes consécutifs dont la divergence protéique est la plus faible. Ces deux mesures visent à minimiser le bruit lié à la détection de la synténie à l’étape SynChro (∆=0).

125

Figure 43 Distribution des différences entre le nombre de réarrangements de chaque version de chaque branche de l’arbre des

Saccharomycotina et la moyenne de la branche calculée à partir des différentes versions des génomes ancestraux. A gauche :

distribution pour toutes les versions de toutes les branches de l’arbre. A droite, la valeur extrême à 250 a été exclue car elle correspond à la branche menant à l’espèce actuelle Millerozyma farinosa, un hybride dont la structure du génome perturbe fortement la détection des réarrangements.

126

Figure 44 Réarrangements chromosomiques balancés dans l’arbre des Saccharomycotina. Pour chaque branche, le nombre

d’inversions et de translocations est figuré par un diagramme à secteurs avec les inversions en rouge et les translocations en bleu. Les événements dont on ne peut pas distinguer s’ils sont une inversion ou une translocation sont représentés en gris. Les clades encadrés en rouge contiennent au moins trois fois plus d’inversions que de translocation. Les clades dans lesquels les translocations sont majoritaires sont en bleu. Les clades dans lesquels les inversions et translocations sont en proportions équivalentes sont en gris. Pour chaque clade encadré, les barres rouges et bleues indiquent le nombre global de translocations et d’inversions.

127

Au total, 5150 événements ont pu être inférés dans l’ensemble de l’arbre des Saccharomycotina (Figure 44). On remarque que selon les groupes d’espèces considérés, les réarrangements ne semblent pas s’accumuler au même rythme : pour des branches de longueur comparable, les génomes protoploïdes semblent avoir accumulé moins de réarrangements que les génomes issus de la duplication totale du génome. On pourrait penser que le nombre supérieur de réarrangements observé provient du fait que les génomes issus de la duplication ont massivement perdu les ohnologues, fragmentant la synténie. Or, comme nous l’avons vu dans l’introduction, il a été démontré que cette perte a été très rapide et s’est probablement déroulée entre l’événement de duplication totale et la divergence de Tetrapisispora phaffii. Ces génomes sont donc probablement devenus plus instables à la suite de l’événement de duplication. Les génomes du clade CTG sont plus réarrangés que les génomes issus de la duplication totale du génome (voire plus bas et Figure 45). Ces observations selon lesquelles les réarrangements n’ont pas le même taux d’apparition selon les clades considérés sont cohérentes avec d’autres études rapportant des nombres de blocs de synténie (comme estimation du nombre de réarrangements) différents dans différents clades de levures (Fischer et al., 2006).

Figure 45 Distribution de la longueur des branches et nombre total de réarrangements (inversions, translocations et

non-discernables) dans le clade des espèces issues de la duplication totale du génome (WGD), des Saccharomycetaceae qui n’ont pas la duplication totale du génome (protoploïdes) et des espèces du clade CTG (CTG).

Intéressons nous à présent aux types de réarrangements inférés. Parmi les 5150 réarrangements balancés identifiés, 1513 (29,4%) sont des inversions, 1174 (22,8%) sont des translocations et 2463 (47,8%) sont des événements « non-discernables » dont on ne peut pas déterminer s’il s’agit d’inversions ou de translocations. Le pourcentage global inversions/inversions+translocations dans l’ensemble de l’arbre des

Saccharomycotina est de 56,3%, mais les pourcentages locaux varient beaucoup (histogramme dans la

Figure 44). De plus on observe dans l’arbre que de manière assez cohérente, certaines lignées évoluent majoritairement par translocations et d’autres par inversion. Par exemple, chez les espèces issues de la duplication totale du génome, les génomes descendants de l’ancêtre 1.32 (dont les espèces actuelles sont

S. cerevisiae à C. glabrata) ont évolué essentiellement par translocation. Le clade frère des espèces

descendant de 1.23 (N. dairenensis à K. africana) évolue principalement par inversions. On peut imaginer que la présence de séquences dupliquées favorise les recombinaisons ectopiques et explique l’instabilité

128

des génomes issus de la duplication totale du génome. Les génomes des espèces du clade CTG évoluent presque exclusivement par inversions. La prévalence des inversions de petite taille chez ces espèces a déjà été rapporté chez les Saccharomycotina (Butler et al., 2009; Seoighe et al., 2000). Un mode d’évolution comparable a été rapportées chez les champignons filamenteux Ascomycètes (Hane et al., 2011). Dans cette étude, les auteurs identifient une nouvelle forme d’évolution chromosomique selon laquelle les gènes homologues sont maintenus sur un même chromosome, même si l’ordre et l’orientation des gènes est considérablement remanié. Les auteurs appellent ce mode d’évolution « méso-synténie » par analogie avec la micro-synténie désignant la conservation de la synténie sous la forme de petits segments de quelques gènes entre deux espèces et avec la macro-synténie désignant la conservation de grands segments conservés en synténie entre différents chromosomes. Le fait que les inversions soient prévalentes dans les clades issus des embranchements supérieurs de l’arbre (en particulier dans les lignées basales et le clade CTG) et que l’ensemble de l’arbre soit globalement enrichi en inversions (histogramme de la Figure 44) laisse penser que le mode de réarrangement par inversion est ancestral. Il existe d’autres exemples de génomes eucaryotes qui évoluent majoritairement par inversion comme par exemple celui de la drosophile (Bhutkar et al., 2008; Ranz et al., 2007), et du poulet (Burt et al., 1999). Les mécanismes expliquant le type d’évolution chromosomique, par inversions (conduisant à l’observation de méso-synténie) ou par translocation (conduisant à l’observation de macro-synténie) selon les lignées n’est pas claire. Ces différences proviennent peut être de mécanismes cellulaires différents, ou de mécanismes dont l’efficacité relative est différente. L’organisation spatiale du génome dans le noyau ainsi que la proportion et les types d’éléments répétés dans le génome de ces espèces pourrait surement apporter d’intéressants éléments de compréhension.

On observe que le nombre de réarrangements non-discernables est plus important dans les clades dont le taux d’apparition des réarrangements est grand. Cela est explicable par le fait que l’accumulation de points de cassure entre deux génome, ainsi que la réutilisation des points de cassure au cours de l’évolution des génomes crée des cycles dans le graphe d’adjacences dont la résolution ne permet pas de dire quel types d’événements ont eu lieu.

Une autre observation frappante est que le nombre de réarrangements balancés inférés dans l’arbre est corrélé à la longueur des branches de l’arbre (Figure 46). Notamment, la somme des inversions et des translocations est significativement corrélée aux longueurs de branches chez les Saccharomycotina (R²=0,40, P-valeur<10-10). Cette corrélation reste observable quand on décompose les données en

Saccharomycetaceae d’une part (R²=0,55, P-valeur<10-10) et clade CTG/méthylotrophes d’autre part (R²=0,26, P-valeur<10-2). Les translocations seules restent bien corrélées dans l’arbre complet mais également quand on distingue Saccharomycetaceae et CTG/méthylotrophes contrairement aux inversions qui ne semblent corréler aux longueurs de branches que chez les Saccharomycetaceae. Ces résultats montrent que la fixation des mutations ponctuelles non-synonymes et des réarrangements balancés se fait de manière coordonnée. Cette observation est en contraste avec les résultats présentés dans la Figure 36 dans laquelle la longueur des branches de l’arbre généré par PhyChro ne semblait pas corrélée à la longueur des branches de l’arbre obtenu avec PhyML à partir des homologues synténiques. Cela illustre le fait que la détection des réarrangements passés directement à partir des génomes actuels est fortement bruitée. Ce même constat a également été rapportée dans l’étude (Sacerdot et al., 2018).

129

Figure 46 Corrélations entre le nombre de réarrangements chromosomiques balancés et la longueur des branches de l’arbre

(divergence protéique). La première ligne représente l’ensemble de l’arbre des Saccharomycotina. La deuxième et troisième ligne représentent respectivement les Saccharomycetaceae et les espèces du clade CTG et des méthylotrophes. (*, ** et *** indiquent respectivement des p-valeurs inférieures à 10-2, 10-5 et 10-10).

Cette « horloge génomique » avait été rapportée chez les levures Lachancea (Vakirlis et al., 2016) mais il n’était pas évident que cette observation soit valide dans un groupe d’espèces plus divergées. La généralisation de cette horloge moléculaire des Lachancea (Vakirlis et al., 2016) à l’ensemble du subphylum des Saccharomycotina, du moins aux 66 espèces que nous avons pu analyser, laisse peut être entrevoir une règle générale de l’évolution des génomes eucaryotes.

130

5. Reshuffling yeast chromosomes with CRISPR/Cas9