• Aucun résultat trouvé

La génomique des populations offre la possibilité d’obtenir une vue globale de l’évolution au sein d’une même espèce. Au niveau des levures du sous-phylum des Saccharomycotina, l’exploration de plusieurs centaines de génomes de S. cerevisiae a d’ores et déjà permis une dissection précise de son histoire évolutive. Des différences évolutives entre les sous-populations ont ainsi été mises en évidence, révélant l’impact des environnements associés à chacune d’entre elles. En parallèle, plusieurs études de génomique des populations menées sur des espèces non-modèles ont révélé des différences évolutives entre les espèces tant dans leur histoire évolutive que dans les modifications génomiques impliquées dans l’adaptation des espèces. L’exploration et la comparaison de l’évolution d’un plus grand nombre d’espèces se révèlent ainsi critiques afin de mieux comprendre les processus responsables de l’évolution des espèces. Cet axe de recherche est cependant toujours limité par différentes contraintes. Tout d’abord, d’importantes différences dans les outils et les analyses employés ainsi que des variants étudiés rendent difficile une comparaison précise de l’évolution entre les espèces. Par ailleurs, l’absence de séquence de référence et d’annotations pour un grand nombre d’espèces limitent encore l’établissement d’études de génomique des populations et seule une dizaine d’espèces ont été étudiées jusqu’à présent.

C’est dans ce cadre que se positionne mon projet de thèse. Dans un premier chapitre, je me suis concentré sur l’étude comparative de l’évolution au sein de 6 espèces non-modèles du sous-phylum des Saccharomycotina pour lesquelles une séquence de référence et des annotations de bonnes qualités avaient déjà été préalablement établies : Candida albicans, Kluyveromyces

lactis, Lachancea kluyveri, Lachancea thermotolerans, Saccharomyces paradoxus et Saccharomyces uvarum. Ces espèces sont retrouvées dans différents habitats et certaines

d’entre elles sont partiellement domestiquées. De plus, ces espèces couvrent différentes échelles évolutives, permettant la comparaison de la variabilité intraspécifique entre des espèces phylogénétiquement proches ou éloignées au sein du sous-phylum. Afin d’effectuer une comparaison globale de l’évolution de ces espèces, plusieurs types de variants allant de la duplication complète d’un chromosome à la diversité nucléotidique ont été quantifiés de manière systématique. Dans le cadre de cette étude, je me suis concentré sur l’analyse bio-informatique des données de séquençage (acquises au sein du laboratoire ou disponibles publiquement) et j’ai notamment développé une librairie informatique dédiée à l’exploration et l’exploitation de ces données. Cette étude a permis de mettre en relief des différences dans l’histoires évolutive des espèces. À l’opposé, certaines trajectoires évolutives semblent partagées entre les espèces. Par exemple, l’analyse comparative du pangénome de chaque espèce a ainsi révélé l’importance des évènements d’introgressions dans la dynamique des génomes au cours du temps pour l’ensemble des espèces étudiées.

Figure 1. Représentation schématique de mon projet de thèse.

Dans un second temps, je me suis concentré sur l’exploration de la variabilité́ génétique au sein de l’espèce Dekkera bruxellensis, qui présente des propriétés industrielles et des particularités évolutives intéressantes. En effet, D. bruxellensis contribue à la fermentation de certaines bières belges, mais est aussi connue comme un contaminant majeur du vin. De plus, cette espèce présente un intérêt au niveau évolutif : les isolats naturels arborent différents niveaux de ploïdie et des réarrangements chromosomiques étendus ont pu être observés. Dans ce cadre, une

S. c erevisiae S. par ado xus S. uv arum L. k luy veri L. t herm oto lerans K. lac tis D. b rux elle nsis C. albic ans S. p om be

Séquence de référence produite

Position genomique Le ctur es Illumina Duplication complète du génome

Assemblage à partir de données MinION

Annotation de la séquence de référence

A

ssemblages M

inION

Etude de génomique des populations

Séquence de référence connue

Position genomique

Lec

tur

es

Variabilité nucléotidique

Aneuploïdies / Nombre variable de copies Pangénome

Souches

Comparaison inter-espèces

Comparaison d’assemblages MinION Etude de génomique des populations

Variabilité nucléotidique

Aneuploïdies / nombre variable de copies Pangénome

Variants structuraux de large taille

Ch ap itr e 1 Ch ap itr e 2 Ch ap itr e 3

Etude comparative de génomique des

populations de 6 espèces de levures Génomique des populationsde D. bruxellensis

Souche A Souche B Souche N

Espèce A Espèce B Espèce N

collection de 56 souches a été constituée afin de réaliser une analyse de génomique des populations. Cependant, alors que les séquences des génomes de plusieurs souches ont déjà été déterminées et mises à disposition de la communauté scientifique, aucune n’associait une résolution au niveau chromosomique et des annotations de qualité, nécessaires à l’établissement d’une étude de génomique des populations. Le développement des technologies dites de 3ème

génération, qui génèrent des lectures longues (plusieurs kb) permettent aujourd’hui d’envisager l’obtention rapide et aisée d’assemblages de bonnes qualités. Dans un second chapitre, je me suis ainsi attelé à la création d’un génome de référence de qualité pour l’espèce D. bruxellensis à l’aide de données de séquençage produites par la technologie Oxford Nanopore. La comparaison de différents logiciels d’assemblage développés récemment et dédiés à l’exploitation de ces lectures a permis l’obtention d’une séquence de référence d’une qualité supérieure en comparaison à celles obtenues précédemment. Par cette étude, nous avons montré que la mise à disposition de ces nouvelles technologies de séquençage offre la possibilité d’explorer la variabilité génomique au sein d’espèces jusqu’alors inaccessibles de par l’absence de séquence de référence de bonne qualité.

Enfin, dans un troisième chapitre, les données de séquençage des 56 souches ont été exploitées afin de réaliser une étude de génomique des populations au sein de D. bruxellensis. L’exploration de la diversité génétique a dans un premier temps permis la mise en évidence de plusieurs sous-populations et l’identification et la caractérisation de plusieurs évènements d’hybridations au cours de l’histoire évolutive de l’espèce. Les données de séquençage ont par la suite été exploitées afin de caractériser le pangénome ainsi que d’étudier la variabilité du contenu en gènes au sein de l’espèce. Cette analyse a été complétée par le séquençage de 3 souches à partir d’une technologie de type Oxford Nanopore permettant l’identification des réarrangements chromosomiques indétectables avec des données de type Illumina. L’ensemble de ces données ont permis de caractériser des variants structuraux, affectant notamment des transporteurs de sucres ou de drogues et jouant potentiellement un rôle dans l’adaptation des souches dans les différents processus de fermentation dans lesquels intervient D. bruxellensis.

CHAPTER 1

Pangenomes of Saccharomycotina yeast