Données de séquençage - Génomique des populations : étude comparative au sein du sous-phylum de

Collections pour les études de génomique de population

Dans le cadre du chapitre 1, des collections d’isolats pour K. lactis et L. thermotolerans ont été spécifiquement constituées au laboratoire. A l’inverse, les isolats de C. albicans, L. kluyveri,

S. paradoxus et S. uvarum proviennent de différentes collections constituées dans le cadre de

précédentes études de génomique de population1–4. Le nombre de souches par collection varie, allant de 24 isolats pour S. paradoxus à 57 pour L. thermotolerans (Tableau 1).

Espèce Nombre d’isolats Nom de la souche de référence Nombre de chromosomes Taille du génome (Mb) C. albicans 20 SC 5314 8 14,3 D. bruxellensis 53 UMY321 8 13,0 K. lactis 41 CBS 2359 6 10,7 L. kluyveri 28 CBS 3082 8 11,3 L. thermotolerans 57 CBS 6340 8 10,4 S. paradoxus 24 CBS 432 16 11,7 S. uvarum 34 CBS 7001 16 11,5

Tableau 1. Caractéristiques principales des collections et des espèces étudiées

Pour les collections de K. lactis et L. thermotolerans, un panel de souches représentatif des origines écologiques et géographiques chez ces espèces a été constitué. Dans ce cadre, les isolats de K. lactis proviennent d’environnements naturels (exsudats de chêne ou d’équipements de vin) ou dans la production laitière (fromage, crème de lait, petit-lait) récupérés à travers le monde. Les souches de L. thermotolerans ont été isolées dans un ensemble d’environnements naturels incluant des exsudats d’arbre, des grappes de raisin, d’insectes ou de feuilles de riz. A l’exception de S. paradoxus pour laquelle les souches proviennent d’Amérique du Nord, les souches des autres espèces ont été isolées à travers le monde (Figure 1). Pour le chapitre 3, une collection de D. bruxellensis a été composée à partir de 56 isolats. Les souches proviennent d’origines géographiques variées (Europe, Afrique du Sud, Australie, Chile) et une large partie des isolats est associée aux processus de vinification.

Figure 1. Origines géographiques des souches utilisées dans le cadre du chapitre 1. Analyse de la ploïdie naturelle par cytométrie

La détermination de la ploïdie a été réalisée par une mesure cellule par cellule de l’intensité de fluorescence émise suite à un marquage de l’ADN à l’iodure de propidium, un agent intercalant de l’ADN fluorescent. Plus précisément, les cellules ont été mises en culture sur milieu YPG à 30°C afin d’obtenir une phase exponentielle de croissance. Les cellules ont par la suite été nettoyées avec 1 ml d’eau et le culot a été de nouveau suspendu dans 1 ml d’éthanol à 70 %. Après centrifugation, le surnageant a été enlevé et les cellules ont été encore suspendues dans 1 ml de tampon de citrate de sodium (trisodium citrate 50 mM ; pH 7,5). Après rajout de 10 µl de RNase A (100 mg/ml), les souches ont été incubées à 37°C pendant 2 heures. Les souches ont par la suite été soniquées pendant 20 secondes avec une amplitude de 20 %. Après sonication, les cellules ont été plongées dans 1 ml de citrate de sodium supplémenté de 10 µl d’iodure de propidium (1,6 mg/ml) et laissées dans le noir à 4°C pendant 12 heure. Une fois terminé, le contenu de l’ADN a été déterminé en mesurant l’intensité de la fluorescence grâce à une analyse de cytométrie en flux (CyFlow Space ; Partec).

Séquençage Illumina

Le séquençage des souches de K. lactis, L. thermotolerans (chapitre 1) et D. bruxellensis (chapitre 2 et 3) a été réalisé avec la technologie Illumina HiSeq 2000 au BGI (Beijing Genomics Institute), basée sur le séquençage par synthèse. Dans cette approche, le génome d’intérêt est fragmenté de manière aléatoire. Chaque fragment, auquel des adaptateurs ont été fusionnés avant amplification, est ensuite mis en présence de 4 types de nucléotide associé à un fluorophore et à un terminateur réversible. Le nucléotide à incorporer pour l'élongation du brin complémentaire est alors insèré. Un signal lumineux spécifique du nucléotide présent est

ensuite émis et détecté. En associant une séquence d'index aux échantillons, il est possible de séquencer simultanément plusieurs échantillons. Cette pratique, appelée multiplexage, permet de réduire les coûts en divisant le nombre d'expériences de séquençage.

Les souches ont préalablement été séparément mises en culture dans 20 ml de milieu YPG liquide et incubées à 30°C sous agitation pendant une nuit. Les cellules ont par la suite été centrifugées et l’ADN génomique a été extrait grâce au kit de purification MasterPure Yeast DNA (Cat No MPY80200). Pour l’ensemble des génomes, des librairies d’insertion de 280-bp ont été produites et les deux extrémités de chaque fragment ont systématiquement été séquencées, produisant ainsi des lectures dites pairées, de 96 à 102 pb.

Séquençage MinION de la souche UMY321

Pour le chapitre 2,2 µg d’ADN génomique a été coupé en fragment de 8000 bp dans des g-TUBE. Les fragments ont par la suite été nettoyés en utilisant des billes 1X AMPure XP et une librairie Nanopore à deux dimension (2D) de 8 kb a été préparée en suivant le protocole SQK-MAP005- MinION gDNA Sequencing Kit.

Le mix de séquençage a été préparé en utilisant 8 µl de la librairie d’ADN génomique, de l’eau, un Fuel mix et un running buffer, en accord avec le protocole SQK-MAP005. Ce mix a été ajouté dans une flowcell R7.3 pendant 48 heures. La flowcell a été rechargée une fois toutes les 24 heures par l’addition de 8 µl de la librairie d’ADN.

Séquençage MinION dans l’analyse de variants structuraux

Pour le chapitre 3, 5 µg d’ADN génomique de trois souches a été coupé en fragments de 20 kb dans des g-UBE. Les fragments ont par la suite été nettoyés en utilisant des billes 1X AMPure XP et une librairie Nanopore à une dimension (1D) a été préparée en suivant le protocole SQK-LSK108.

Le mix de séquençage a été préparé en utilisant 12 µl de la librairie d’ADN génomique, de l’eau, un Fuel mix et un running buffer, en accord avec le protocole SQK-LSK108. Pour les souches YJS5301 et YJS5416, une flowcell R9 a été utilisée, alors qu’une flowcell R9.4 a été utilisée pour la souche YJ5345. Dans les deux cas, les séquençages ont duré 48 heures.

Récupération des données externes

Pour le chapitre 1, les données de séquençage relatives aux génomes des isolats de C. albicans,

L. kluyveri, S. paradoxus et S. uvarum proviennent du domaine public et ont été téléchargées à

partir de la banque de données SRA qui stocke les données brutes issues de séquençage de nouvelle génération à partir d’un identifiant spécifique à chaque projet :

§ C. albicans : PRJNA193498 § L. kluyveri : PRJEB5130 § S. paradoxus : PRJNA277692

§ S. uvarum : PRJNA230139 et PRJEB5133.

La séquence et les annotations des génomes de référence pour les différentes espèces du chapitre 1 ont été produites dans le cadre de précédentes études et sont disponibles publiquement sur les sites web suivants :

§ IGénolevure (http://gryc.inra.fr) pour K. lactis5, L. kluyveri6 et L. thermotolerans6

§ SSS (http://sss.genetics.wisc.edu/cgi-bin/s3.cgi) pour S. paradoxus7 et S. uvarum7

Traitement des données de séquençage

Dans le document Génomique des populations : étude comparative au sein du sous-phylum des Saccharomycotina (Page 136-140)