• Aucun résultat trouvé

Analyse des sites de recrutements de Lsd1/Lsd2, Sap1 et Abp1 sur l'ensemble du génome

Enrichissement d'Abp1 : sauvage vs swi1∆

3. Analyse du recrutement de Lsd1/2, Sap1 et Abp1 sur l'ensemble du génome

3.1 Analyse des sites de recrutements de Lsd1/Lsd2, Sap1 et Abp1 sur l'ensemble du génome

La colocalisation de Sap1, Abp1, Lsd1 et de Lsd2 au niveau de mat1 ainsi que leurs rôles transcriptionnels et réplicatifs ont motivé une analyse de la répartition de ces différents acteurs sur l'ensemble du génome.

3.1 Analyse des sites de recrutements de Lsd1/Lsd2, Sap1 et Abp1 sur l'ensemble du génome

Grâce à la technique de ChIP-séq, j'ai identifié des régions préférentiellement liées par chacune des protéines étudiées. La méthode d'analyse décrite dans le Matériels et Méthodes m'a permis de valider statistiquement ces ensembles de pics. Nous constatons que le nombre de pics varie de 573 à 1083 en fonction de la protéine immunoprécipitée (tableau 1). Selon la méthode décrite par le " ENCODE Consortium" le nombre de pics statistiquement significatif est celui obtenu à la suite de l'analyse IDR (Irreproducibility Discovery Rate). Cette analyse utilise les réplicas biologiques et les pseudo réplicas dans le but de déterminer un seuil statistique. Ce seuil sera ensuite utilisé pour choisir un ensemble de pics "statistiquement significatif" (cf. Matériels et Méthodes). Ici les seuils utilisés sont indiqués dans le tableau 1. La valeur utilisée comme seuil pour la ChIP-séq de Lsd1 est 10 fois inférieure aux seuils des autres ChIP-séq. Ceci peut être expliqué par le fait que la ChIP-séq de Lsd1 est moins efficace. Le tableau 2 présente la comparaison de nos données avec celles déjà publiées. Nous remarquons une forte variabilité entre les différentes études. Dans un premier temps, nous pouvons dire que les données de ChIP-ChIP sont difficilement comparables à celles de ChIP-séq puisque la méthode de détection des pics et la résolution n'est pas la même. Cependant, les conclusions biologiques ne devraient pas être affectées (cf. figure 22, 23 et 24). En outre, le nombre de lectures dans les ChIP-séqs publiées par Zaratiegui, M. est inférieure à celui dans notre étude (Communication personnelle). Cela influence largement la détection des pics par le logiciel MACS2. En ce qui concerne le nombre de pics d'Abp1 publié par Daulny, A. nous remarquons qu'il est comparable à celui observé dans chaque réplica biologique avant l'IDR (cf. Matériels et Méthodes). L'analyse statistique que j'ai réalisée entraine une réduction de ce nombre.

116

Nombre de pics après IDR Seuil = -Log10(p value)

Lsd1 573 10,22646

Lsd2 682 19,19591

Sap1 958 26,07609

Abp1 1083 25,11338

Tableau 1 : Analyse du nombre de pics.

Les différents nombres de pics, statistiquement validés, obtenus pour Lsd1, Lsd2, Sap1 et Abp1 sont indiqués dans la deuxième colonne. La troisième colonne indique le "–log10(p value)", déterminée par l'IDR, utilisé comme seuil pour déterminer le nombre de pics statistiquement significatifs.

Etudes Années Techniques Lsd1 Lsd2 Sap1 Abp1

Nicolas et al 2006 ChIP-ChIP 105 164 Gordon et al 2007 ChIP-ChIP 426 Lan et al 2007 ChIP-ChIP 370 283 Cam et al 2008 ChIP-ChIP NA Zaratiegui et al 2011 ChIP-séq 151 136 Daulny et al 2016 ChIP-séq 1623

Cette étude 2016 ChIP-séq 573 682 958 1083 Tableau 2 : Comparaison avec les données publiées.

Les différentes études à haut débit sont répertoriées, ainsi que le nombre de pics trouvés dans chacune. La technique utilisée dans chaque étude est indiquée ainsi que l'année de publication. Dans un second temps, la distribution de la largeur des pics a été analysée (figure 22). Nous remarquons que la médiane de la largeur des pics est comprise entre 761 pb et 1247 pb en fonction de la protéine immunoprécipitée. La protéine Lsd2 se lie à des régions en moyenne plus larges comparées aux trois autres protéines. En ce qui concerne Lsd1, Sap1 et Abp1, les régions enrichies sont de taille similaire (environ 800 bp). Nous avons exclu de cette analyse les extrémités du chromosome 3 qui donnent deux pics très larges (supérieurs à 15 kb). En effet, ces pics sont dus aux répétitions de l'ADNr et télomèriques. Dans l'ensemble, nous remarquons que la majorité des pics pour chaque protéine a une taille inférieure à 2 kb ce qui nous permet de conclure que ces protéines ne recouvrent pas de larges régions mais sont plutôt réparties de façon ponctuelle sur l'ensemble du génome.

Dans un troisième temps, nous constatons que les pics sont répartis uniformément sur l'ensemble du génome (figure 23). Nous ne pouvons pas déterminer de région génomique ayant une densité de pics plus importante. Ce résultat nous indique qu'il n'y a pas de biais de répartition des pics sur l'ensemble du génome.

117

Figure 22 : Analyse de la largeur des pics.

Le panneau de gauche représente la distribution de la largeur des pics en fonction de la protéine immunoprécipitée : Lsd1 (bleu), Lsd2 (vert), Sap1 (gris) et Abp1 (jaune). Le panneau de droite indique les valeurs statistiques de ces distributions.

118

Figure 23 : Analyse de la répartition des pics sur l'ensemble du génome.

La largeur (en bp) de chaque pic est représentée en fonction de la position du pic dans le génome (en bp). A) Répartition génomique de la distribution de la largeur des pics de Lsd1. B) Répartition génomique de la distribution de la largeur des pics de Lsd2. C) Répartition génomique de la distribution de la largeur des pics de Sap1. D) Répartition génomique de la distribution de la largeur des pics de Abp1.

119 Dans un quatrième temps, nous avons déterminé quel type de régions biologiques étaient particulièrement enrichies pour chacune des protéines étudiées. Pour ce faire, nous avons utilisé les annotations du génome de S. pombe disponibles sur la base de données "pombase" (http://www.pombase.org/ ) auxquelles nous avons ajouté les coordonnées des régions répétées. Ces 238 régions répétées sont les rétrotransposons complets et les solo LTRs. Pour les quatre protéines, la majorité des pics se répartit au niveau des régions codantes (exons, miRNA, gènes, CDS, 3'/5' UTR, transcrits) (figure 24). Plus particulièrement, les ChIP-ChIP de Lsd1 et Lsd2 précédemment publiées montrent également que ces protéines sont enrichies au niveau de régions activement transcrites (Lan et al., 2007; Nicolas et al., 2006). De façon intéressante, nous observons, qu'à la différence des protéines Lsd1/2, les protéines Sap1 et Abp1 sont également enrichies dans des régions silencieuses appelées "repeat region". Ces régions rassemblent les rétrotransposons et les LTRs. Ces résultats corroborent le fait que Sap1 et Abp1 contrôlent la réplication des LTRs (Zaratiegui et al., 2011b), mais également le fait que Abp1 participe à la répression transcriptionnelle des rétrotransposons (Cam et al., 2008; Daulny et al., 2016).

120

Figure 24 : Analyse des régions enrichies.

Représentation du nombre de régions chromosomiques, classées par type, chevauchées par les pics d'enrichissement déterminés précédemment. Lsd1 (bleu), Lsd2 (vert), Sap1 (gris) et Abp1 (jaune). Le nombre de pics est également indiqué.