• Aucun résultat trouvé

Vers une exploration plus large de la diversité intraspécifique

L’amélioration et la réduction des coûts de séquençage ces dernières années ont donné l’occasion d’explorer plus en détail l’évolution de différentes espèces. Chez S. cerevisiae, l’analyse de plus de 1000 génomes a permis une dissection précise de son histoire évolutive et des variants impliqués dans son adaptation1. En parallèle, l’étude d’espèces non-modèles est en plein essor, amenant à l’exploration d’un nombre toujours plus important d’espèces au sein du vivant et chez la levure5,6, nous renseignant sur les différences évolutives présentes entre les espèces. Cet axe de recherche qui se révèlera crucial dans notre compréhension de l’évolution du vivant est cependant encore en plein développement, ouvrant la voie à un grand nombre de perspectives intéressantes.

Dans un premier temps, il se révèlera essentiel d’explorer la variabilité génétique d’un plus grand nombre d’individus au sein des différentes espèces. En effet, la majorité des études de génomique des populations d’espèces non-modèles est pour l’instant limitée par un jeu de données restreint, habituellement bien inférieur à 100 souches (N = 41 en moyenne), ne permettant pas une analyse complète de l’ensemble des processus évolutifs impliqués dans l’évolution de ces espèces. Cet aspect reste cependant inhérent au nombre de souches isolées, et une collection plus importante sera nécessaire afin de produire de telles analyses pour une majorité des espèces. Néanmoins, certaines espèces possèdent déjà un nombre suffisant d’isolats, par exemple près de 1500 individus sont disponibles pour l’espèce D. bruxellensis. Chez S. cerevisiae, l’exploration de plus de 1000 souches a montré l’intérêt d’un tel jeu de données dans l’exploration de l’histoire évolutive et des processus adaptatifs entre les différentes sous-populations. Par ailleurs, ces données se révèleront particulièrement intéressantes dans l’étude de la relation génotype-phénotype. En effet, la comparaison entre les variants génomiques de plusieurs centaines individus et des données de phénotypage permettra l’établissement d’études d’association pangénomique. Chez les levures, ces études ont pour l’instant été principalement réalisées au sein de S. cerevisiae et ont permis d’identifier avec précision des associations entre des variants génétiques et l’adaptation des souches à certaines conditions1,7. Par ailleurs, ces études ont permis l’identification de différentes contraintes techniques, telle que la structure de la population, ce qui facilitera la mise en place d’études d’association pangénomique chez d’autres espèces.

Dans ce cadre, l’identification d’un plus grand nombre de variants génomiques et notamment des variants structuraux de large taille telles que les phénomènes d’inversions ou de translocations sera particulièrement intéressante. En effet, plusieurs études ont montré l’implication de ces mutations dans la variabilité phénotypique, par exemple plusieurs versions de translocations impliquant le gène SSU1 chez certains isolats de vin de S. cerevisiae sont associées à une résistance plus importante au sulfite8. Ces variants génétiques, difficilement indétectables avec un séquençage de type Illumina, sont maintenant identifiables à moindre coût grâce aux nouvelles technologies de séquençage telle que celle proposée par Oxford Nanopore. La mise en place d’une telle approche a ainsi été possible dans le cadre de notre étude de génomique des populations de D. bruxellensis ou dans l’analyse de 22 isolats naturels de S. cerevisiae9, confirmant la possibilité d’identifier de tels variants. L’amélioration de ces technologies offriront à l’avenir la possibilité de déterminer avec précision l’ensemble de ces variants génomiques à l’échelle d’une population qui pourront notamment être incorporés dans les études d’association, permettant ainsi de déterminer avec plus de précision leur rôle dans la variation phénotypique à l’échelle d’une espèce.

De manière additionnelle, l’obtention d’un assemblage de qualité pour plusieurs souches d’une même espèce facilitera de manière globale les analyses de génomique des populations au sein d’espèces présentant une forte variabilité génomique. Le passage d’une séquence de référence unique à l’alignement sur plusieurs génomes de référence permettra une meilleure identification des variants génétiques au sein de la population. Une telle approche, dénommée « genome graph » a ainsi été proposée dans l’analyse des variants génétiques chez l’Homme et a déjà

montré l’intérêt de cette méthode, permettant d’identifier avec une plus grande précision l’ensemble des variants génomiques10,11. Chez les levures, cette approche est particulièrement intéressante de par l’importante diversité génomique observable au sein de certaines espèces, telle que K. lactis pour laquelle une divergence de plus de 8% a été déterminée entre deux sous-populations. À terme, l’application de ce type d’approche permettra une meilleure identification des variants, mais aussi de mieux caractériser le pangénome de ces espèces.

Finalement, l’amélioration de ces techniques permettra d’étendre l’exploration de la variabilité intraspécifique à un plus grand nombre d’espèces. Au sein du groupe des Saccharomycetaceae, des génomes de référence de bonne qualité ainsi que des isolats sont déjà disponibles pour un grand nombre d’espèces12 (Figure 1). Par exemple, une large collection d’individus est disponible pour l’espèce Torulaspora delbrueckii, impliquée dans plusieurs processus de fermentation, notamment comme levure de boulangerie ou la production de boissons fermentées (cidre, bière, kéfir). À l’échelle du sous-phylum des Saccharomycotina, l’exploration d’espèces plus éloignées se révélera aussi intéressante, notamment au sein des espèces du groupe basal pour lesquelles la variabilité intraspécifique est encore largement inexplorée. L’analyse comparative au sein de ce groupe a révélé d’importantes différences dans la constitution de leur génome, par exemple le génome de Yarrowia lipolytica possède un nombre de CDS supérieur à S. cerevisiae (6618 vs 5769 respectivement), riches en intron (35%

vs 3%), ainsi qu’un génome bien plus large (20,6 vs 12,1 Mb), amenant potentiellement à une

évolution différente de leur génome. Dans ce cadre, l’obtention plus aisée d’une séquence de référence à partir de lectures longues facilitera la mise en place de telles études. L’établissement de tels jeux de données demande cependant encore un travail important, notamment de par les processus d’annotations encore complexes des génomes mais nécessaires à la mise en place d’une analyse fonctionnelle. Ces méthodes reposent notamment sur l’identification de protéines déjà annotées et ayant une similarité de séquence proche et l’obtention d’un nombre croissant de génomes annotés, pour faciliter la réalisation de ces annotations.

Figure 1. Arbre phylogénétique non exhaustif des espèces dont le génome a été séquencé au

sein du sous-phylum des Saccharomycotina. Les espèces étudiées dans mes travaux de thèse sont en gras. (A) Espèces pour lesquelles une ou plusieurs études de génomique des populations ont déjà été réalisées. (B) Souche de référence. (C) Taille en Mb du génome de référence. (D) Nombre de chromosomes. (E) Nombre de CDS identifiées dans les génomes de référence. (F) Aperçu des environnements retrouvés pour chaque espèce.

Ainsi, l’exploration de la variabilité intraspécifique au sein des différentes espèces n’en est qu’à son début et ouvre la voie à un ensemble de perspectives intéressantes. D’un point de vue technique, l’amélioration des techniques de séquençage, des ressources informatiques et des algorithmes utilisés rendront possible l’analyse fine de la variabilité génomique chez un nombre toujours plus important d’individus. Sur le long terme, la mise en place de différentes études enrichiront grandement notre vision sur les différences évolutives présentent au sein des levures, nous renseignant de manière sans précédent sur les mécanismes impliqués et leur impact dans l’évolution des génomes.

Lachancea kluyveri Lachancea thermotolerans Saccharomyces uvarum Saccharomyces cerevisiae Saccharomyces paradoxus Lachancea waltii Saccharomyces kudriavzevii Schizosaccharomyces pombe S288c 12.1 16 5,769 Dekkera bruxellensis Candida albicans Kazachstania africana Kazachstania naganishii Naumovozyma castellii Candida glabrata Zygosaccharomyces rouxii Kluyveromyces lactis Kluyveromyces marxianus Ashbya gossypii Hansenula polymorpha Debaryomyces hansenii Sugiyamaella lignohabitans Saccharomyces eubayanus [A] [B] [C] [D] [E] [F] CBS4309 11.4 9 4,700 CBS138 12.3 13 5,204 CBS6340 10.4 8 5,137 NCYC2644 10.7 8 5,230 CBS3082 11.3 8 5,397 CBS2359 10.7 6 5,108 CBS6556 10.9 6 4,998 CBS767 12.2 7 6,397 CBS2499 8 5,600 DL1 9 7 5,325 Saccharomycotina Perte d’introns Duplication complète du génome Perte du complexe I dans l’ADN mitochondrial Centromère condensé CUG → serine 13.4 Torulaspora delbrueckii CBS1146 9.2 8 5,174 CBS432 12.0 16 5,527 IFO1812 11.3 5,968 CBS12357 11.7 5,515 CBS7001 11.5 5,915 CBS2517 11.1 12 5,378 CBS8797 10.8 13 5,321 16 16 16 SC5314 14.3 2x8 6,207 CBS10342 16.0 4 6,820

Yarrowia lipolytica CLIB122 20.6 6 6,582

CBS782 9.8 7 4,997

Saccharomyces mikatae IFO1815 11.3 16 6,384

Références

1. Peter, J. et al. Genome evolution across 1,011 Saccharomyces cerevisiae isolates. Nature

556, 339–344 (2018).

2. Ford, C. B. et al. The evolution of drug resistance in clinical isolates of Candida

albicans. Elife 4, e00662 (2015).

3. Okuno, M. et al. Next-generation sequencing analysis of lager brewing yeast strains reveals the evolutionary history of interspecies hybridization. DNA Res. 23, 67–80 (2016).

4. Smukowski Heil, C. S. et al. Loss of heterozygosity drives adaptation in hybrid yeast.

Mol. Biol. Evol. 34, 1596–1612 (2017).

5. Ellegren, H. Genome sequencing and population genomics in non-model organisms.

Trends Ecol. Evol. 29, 51–63 (2014).

6. Peter, J. & Schacherer, J. Population genomics of yeasts: towards a comprehensive view across a broad evolutionary scale. Yeast 33, 73–81 (2016).

7. Strope, P. K. et al. The 100-genomes strains, an S. cerevisiae resource that illuminates its natural phenotypic and genotypic variation and emergence as an opportunistic pathogen. Genome Res. gr.185538.114- (2015). doi:10.1101/gr.185538.114

8. Pérez-Ortín, J. E., Querol, A., Puig, S. & Barrio, E. Molecular characterization of a chromosomal rearrangement involved in the adaptive evolution of yeast strains. Genome

Res. 12, 1533–9 (2002).

9. Istace, B. et al. de novo assembly and population genomic survey of natural yeast isolates with the Oxford Nanopore MinION sequencer. Gigascience 6, 1–13 (2017).

10. Novak, A. M. et al. Genome Graphs. bioRxiv 101378 (2017). doi:10.1101/101378 11. Paten, B., Novak, A. M., Eizenga, J. M. & Garrison, E. Genome graphs and the evolution

of genome inference. Genome Res. 27, 665–676 (2017).

12. Dujon, B. A. & Louis, E. J. Genome diversity and evolution in the budding yeasts (Saccharomycotina). Genetics 206, (2017).

Liste des publications Publiées :

§ Hou J, Friedrich A, Gounot J-S, Schacherer J (2015). Comprehensive survey of condition-specific reproductive isolation reveals genetic incompatibility in yeast.

Nature Communications. 6, 7214.

§ Fournier T*, Gounot J-S*, Freel K, Cruaud C, Lemainque A, Aury J.-M, Wincker P, Schacherer J and Friedrich A (2017). High-quality de novo genome assembly of the

Dekkera bruxellensis yeast using Nanopore MinION Sequencing. G3 (Bethesda). 7,

3243–3250.

En cours de rédaction :

§ Gounot J-S, Freel K, Friedrich A, Schacherer J. Yeast pangenomes are mainly shaped by introgression events

§ Gounot J-S, Neuvéglise C, Abou-Saada O, Fournier T, Friedrich A, Schacherer J. High complexity and degree of genetic variation in Dekkera bruxellensis population

Liste des communications

1. Gounot J-S, Freel K, Friedrich A, Schacherer J. (2016). Yeast Population Genomics Reveals Distinct Evolutionary Histories across Multiple Species. EMBO conferences on Experimental Approaches to Evolution and Ecology (Heidelberg, Germany). Poster

2. Gounot J-S, Freel K, Friedrich A, Schacherer J. (2016). Yeast Population Genomics Reveals Distinct Evolutionary Histories across Multiple Species. Levures, modèles, outils (Bruxelles, Belgique). Oral

3. Gounot J-S, Freel K, Friedrich A, Schacherer J. (2016). Yeast Population Genomics Reveals Distinct Evolutionary Histories across Multiple Species. Séminaire de microbiologie de Strasbourg (Strasbourg, France). Oral

Enseignements

Les différents enseignements ont été réalisés au sein de l’École Supérieure de Biotechnologie de Strasbourg (ESBS) dans le cadre d’un contrat ATER.

- Data processing using Python (TP) - Structural biology (TD)

- Protein structure (TD)