• Aucun résultat trouvé

Cartographie des protéines Lsd1/2, Sap1 et d'Abp1 dans la région mat

Code 2 : Répartition aléatoire des pics sur le génome

1. Cartographie des protéines Lsd1/Lsd2, Sap1 et Abp1 dans la région mat

1.2 Cartographie des protéines Lsd1/2, Sap1 et d'Abp1 dans la région mat

Le complexe Lsd1/Lsd2 contrôle la formation de la pause et de l'empreinte à mat1 (Holmes et al., 2012). Les données de ChIP-séq des protéines Lsd1 et Lsd2 dans une souche sauvage h90 alignées sur toute la région mat montrent que ce complexe est recruté à l'intérieur des locus

mat1, 2 et 3 (Figure 2). Ce complexe est capable de reconnaitre l'allèle P et M mais nous ne

pouvons pas déterminer si ces protéines sont recrutées seulement à mat1 au vu de la redondance des allèles sexuels dans la région. Ce résultat suggère que les deux allèles partagent des homologies de séquence et/ou une structure chromatinienne.

La protéine Sap1 est présente à mat1 in vitro, du côté centromère distal de l'empreinte (Arcangioli et al., 1994a; Arcangioli and Klar, 1991). Les données de ChIP-séq montrent que Sap1 est recrutée in vivo à l'intérieur de l'allèle M et à l'extérieur du locus mat3M (Figure 2,

mat1 et mat3). A la différence du complexe Lsd1/2, la protéine Sap1 ne semble pas être recrutée

au niveau de l'allèle P (Figure 2, mat2).

Ces résultats nous indiquent que les protéines Lsd1, Lsd2 et Sap1 ne sont pas recrutées par le même mécanisme. En effet, Sap1 n'étant pas recrutée au niveau de l'allèle P a certainement une spécificité de séquence de liaison plus stricte que le complexe Lsd1/Lsd2.

De façon intéressante, la protéine Abp1, décrite comme contrôlant une étape tardive du CTS (la directionnalité), est également recrutée dans la région mat et plus particulièrement à mat1

80 (figure 2, mat1). Cependant, contrairement au complexe Lsd1/2 et à la protéine Sap1, Abp1 est recrutée du côté centromère distal de mat1 au niveau d'une séquence unique qui ne change pas en fonction de l'allèle présent à mat1.

Les donneurs sont dans une région transcriptionnellement inactive. En effet, l'hétérochromatine recouvre cette région comprise entre les deux répétitions IR-R et IR-L qui agissent comme frontières entre les deux types de chromatine (Grewal and Klar, 1997; Thon et al., 2002; Thon et al., 1994; Thon and Klar, 1992). Nous remarquons que Sap1 est recrutée au niveau des deux répétitions (figure 2 carrés rouges). Ces enrichissements de Sap1 au niveau de la fin des deux répétitions pourraient participer au blocage de la propagation de l'hétérochromatine. D'autre part, Abp1 est recrutée du côté centromère proximal de CEN-H. Au niveau de ce site, il a précédemment été montré qu'Abp1 permet le recrutement de Clr3, une histone acétylase (Cam et al., 2008). Cependant, en absence d'Abp1, la répression transcriptionnelle dans la région des donneurs est maintenue (Aguilar-Arnal et al., 2008; Nakagawa, 2002). Abp1 pourrait participer à la formation de l'hétérochromatine mais son rôle n'est pas indispensable.

81

Figure 2 : Analyse de la région mat.

A) Distribution des enrichissements normalisés (IP RPkM reads per kilobase million/ WCE RPkM) des ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 dans le fond génétique h90. La séquence utilisée pour l'alignement est une région de 44 kb contenant l'allèle M à mat1. Les gènes, les séquences répétées IR-R et IR-L ainsi que le locus CEN-H sont notés en bas du panneau. Les rectangles noirs indiquent la position des trois loci mat1M, mat2P et mat3M. Les rectangles rouges mettent en évidence la liaison de Sap1 au niveau des limites de l'hétérochromatine. Les flèches noires indiquent les sites de recrutement de Sap1 à l'extérieur de mat3M.

82 Le problème que pose l'étude de la région mat est la présence de répétitions des allèles M et P. En effet, si on regarde précisément les signaux des IP de Lsd1 et de Lsd2 dans les allèles M et

P, on remarque que les signaux à mat2 et mat3 se terminent abruptement à la fin de l'homologie

de séquence avec mat1. Quant au signal à mat1, il se propage à l'extérieur de l'homologie. Cette observation suggère que ce complexe est recruté à mat1M et mat1P et non au niveau des donneurs. Afin d'assigner les signaux à l'intérieur de l'allèle M et P à un locus donné, j'ai étudié la distribution des lectures ne s'alignant qu'à un seul endroit sur la région h90 ayant l'allèle M ou P à mat1 (figure 3A et 3B). Les lectures ambiguës (pouvant s'aligner à plusieurs endroits) ne sont pas comptabilisées.

La figure 3A présente les deux types d'alignements (toutes les lectures, ligne 1 et les lectures ne s'alignant qu'à un endroit, ligne 2) pour chacune des IP sur la séquence h90 ayant l'allèle M à mat1. La fin du signal d'enrichissement des protéines Lsd1 et Lsd2 est présent à mat1M (figure 3A, flèches noires). Nous remarquons que du côté centromère distal de mat3M, la couverture de ces IP est de l'ordre du bruit de fond. Cette comparaison nous permet d'assigner les lectures réparties aléatoirement entre mat1M et mat3M à mat1M.

D'autre part, nous remarquons qu'Abp1 n'est pas recrutée au niveau des donneurs.

De façon plus surprenante, Sap1 est recrutée au niveau de mat1M et mat3M. En effet, le signal de l'enrichissement se propage à la fois à l'extérieur de mat1M et à l'extérieur de mat3M (figure 3A, flèches noires). De plus, le signal de Sap1 au niveau de IR-L et IR-R n'est plus visible quand je retire les lectures ambiguës (figure 3A, carrés rouges). L'homologie de séquence de ces répétitions ne nous permet pas de déterminer si Sap1 fixe les deux répétitions ou une seule.

La même analyse a été réalisée en utilisant comme séquence de référence la séquence h90 avec l'allèle P à mat1. Les signaux du complexe Lsd1-2 et d'Abp1 se répandent à l'extérieur de

mat1P, comme pour mat1M. Ces résultats suggèrent que la nature de la chromatine plutôt que

la séquence d'ADN contrôle le recrutement de Lsd1 et Lsd2. Cette chromatine serait ressemblante quand l'allèle est M à mat1 ou bien quand il est P et permettrait la liaison de Lsd1-2, par contre elle serait différente au niveau des donneurs inhibant ainsi le recrutement du complexe.

En ce qui concerne Sap1, nous observons un faible signal à l'extérieur de mat1P. Ce signal peut être dû au recrutement de Sap1 à SAS1 quand l'allèle à mat1 est P. Alternativement ce signal peut être dû à des lectures provenant du signal à l'extérieur de mat1M aligné ici par défaut. En effet, l'utilisation de la souche h90 ne nous permet pas distinguer si les lectures à l'extérieur de

83 bien qu'ayant tous deux une empreinte ne sont pas équivalents. Nous pouvons supposer que la nature des protéines présentes au niveau de ces allèles pourra influencer les différentes étapes du CTS.

84

Figure 3 : Lsd1, Lsd2 et Abp1 ne sont recrutées qu'à

mat1.

A) Distribution des lectures des ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 dans le fond génétique h90. L'alignement est fait en utilisant la séquence

h90 avec M à mat1. Les lignes

1 et 2 représentent la distribution de toutes les lectures et des lectures qui ne s'alignent qu'à un seul site, respectivement. Les flèches noires indiquent les sites uniques à l'extérieur de l'allèle

M. Les rectangles rouges

mettent en évidence la liaison de Sap1 au niveau des limites de l'hétérochromatine. B) Même que A en utilisant pour l'alignement la séquence h90 avec l'allèle P à mat1.

85 1.3 Lsd1/2, Sap1 et d'Abp1 sont recrutées à mat1 indépendamment des donneurs Afin de valider l'analyse précédente et d'étudier le rôle des donneurs dans le recrutement de ces acteurs, nous avons déterminé les enrichissements de ces protéines dans des souches ne contenant plus les donneurs (mat1M ∆2-3 et mat1P ∆2-3). Dans ces fonds génétiques seul le locus mat1 est présent. Les données de ChIP-séq des protéines Lsd1 et Lsd2 montrent que ce complexe est recruté à l'intérieur du locus mat1 indépendamment de l'allèle présent et des donneurs (figure 4A et 4B). Le locus mat1 est donc suffisant au recrutement de ce complexe (figure 4). La protéine Sap1 est recrutée préférentiellement, in vivo, à l'intérieur de l'allèle

mat1M et cela indépendamment des donneurs (Figure 4A, 4B, 4E). Ce résultat montre que le

site de liaison caractérisé in vitro (du côté centromère distal de mat1) n'est pas celui préférentiellement lié in vivo par Sap1 dans les conditions utilisées.

Ainsi, les protéines Lsd1, Lsd2 et Sap1 ne sont pas recrutées par le même mécanisme. En effet, Sap1 n'étant pas recrutée au niveau de l'allèle P a certainement une spécificité de séquence de liaison plus stricte que le complexe Lsd1/Lsd2.

La protéine Abp1 est également recrutée indépendamment de l'allèle présent à mat1 et des donneurs au niveau d'une séquence unique (figure 4A, 4B et 4E).

De façon globale, nous observons un enrichissement normalisé plus faible pour Sap1 que pour les trois autres protéines. Cela peut être expliqué par le fait que nous utilisons un sérum et non un anticorps monoclonal pour la ChIP de Sap1. En effet, Sap1 n'est pas étiquetée, à la différence de Lsd1, Lsd2 et d'Abp1. Dans le sérum, la quantité d'anticorps spécifiquement dirigé contre Sap1 n'est pas connue à contrario de l'utilisation d'anticorps monoclonaux contre une étiquette. L'analyse des lectures uniques et l'utilisation des fonds génétiques ne comportant pas les donneurs nous a permis de valider le recrutement spécifique de ces protéines à mat1. J'ai donc aligné les séquençages des souche h90 sur les séquences de 10 kb ne contenant que mat1M ou

mat1P (cf. figure 4C et 4D). Les profils d'enrichissements sont globalement similaires à ceux

observés avec les souches sans les donneurs (comparaison figure 4A et 4C, comparaison figure 4B et 4D). Le maximum du pic à mat1 pour la protéine Abp1 ne change pas en fonction de l'allèle ou de la souche (figure 4E). Cela peut être dû au fait qu'elle soit à l'extérieur de mat1. Pour les protéines à l'intérieur de mat1, le maximum du pic est en général deux fois plus faible pour les souches h90 par rapport aux souches mat1M ∆2-3 ou mat1P ∆2-3 (figure 4E). Ce qui corrèle le fait que dans une souche h90 la moitié des cellules sont M et l'autre P.

86

Figure 4 : Lsd1, Lsd2, Sap1 et Abp1 sont recrutées à mat1 indépendamment des donneurs.

A) Distribution des enrichissements normalisés (IP RPkM reads per kilobase million/ WCE RPkM) des ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 dans le fond génétique mat1M∆2-3. La séquence utilisée pour l'alignement est une région de 10 kb contenant l'allèle M à mat1. Le sens de la transcription de Mc et Mi est indiqué. La flèche marque le site de l'empreinte. B) Distribution des enrichissements normalisés (IP RPkM / WCE RPkM) des ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 dans le fond génétique mat1P∆2-3. La séquence utilisée pour l'alignement est une région de 10 kb contenant l'allèle P à mat1. C-D) Distribution des enrichissements normalisés (IP RPkM / WCE RPkM) des ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 dans le fond génétique h90. La séquence utilisée pour l'alignement est une région de 10 kb contenant l'allèle M à mat1 pour C et l'allèle P à mat1 pour D. E) Enrichissement normalisé du maximum de chaque pic à mat1 pour les ChIP-séq de Lsd1, Lsd2, Sap1 et de Abp1 pour les séquençages des souches mat1M∆2-3 ( ) et mat1P∆2-3 ( ) et pour les séquençages des souches h90 alignés sur la séquence mat1M ( ) ou sur la séquence mat1P ( ).

87 1.4 Sap1 est recrutée entre 211 et 111 pb du côté centromère proximal du site de l'empreinte

Afin d'identifier le site de fixation de la protéine Sap1, nous avons utilisé la technique de gel retard. Cette technique permet de caractériser une liaison protéine/ADN in vitro. Nous avons décidé d'analyser toute la région mat1M afin de déterminer si le site de recrutement observé en ChIP-séq pouvait être identifié. Pour ce faire, différents fragments d'ADN double brin marqués en 5' par un phosphate radioactif sont incubés 10 min avec un extrait protéique de S. pombe (figure 5A). Dans ces conditions, nous observons que les séquences SAS1, Ter1, M4, M5 et M6 sont retardées. Afin de confirmer que ce retard est dû à la liaison de Sap1, nous avons purifié la protéine Sap1 d'Escherichia coli et nous avons analysé par gel retard son recrutement au niveau de la région mat1. Nous observons le même profil de retard qu'avec l'extrait brut (figure 5B et 5C). Le fait que Sap1 lie SAS1 et TER1 in vitro est en accord avec ce qui a déjà été décrit (Arcangioli and Klar, 1991; Krings and Bastia, 2005). En revanche, le recrutement de Sap1 au niveau d'une séquence à l'intérieur de l'allèle M n'a jamais été analysé. Les séquences liées par Sap1 à l'intérieur de M sont situées à 111 pb du site de l'empreinte (M4, M5 et M6) ce qui corrobore les données de ChIP-séq (figure 4). Le fait que trois séquences soient retardées suggère l'existence d'une coopération de différents sites in vivo qui permet le recrutement de Sap1 spécifiquement à l'intérieur de l'allèle M.

L'ensemble de ces résultats nous indique qu'au-delà de la séquence d'ADN, la structure de la région mat1 influence le positionnement de la protéine Sap1 in vivo.

J'ai aussi produit et purifié le domaine HMG de la protéine Lsd1 dans E. coli afin de tenter de déterminer son site de fixation. Je n'ai pas été capable d'observer un retard sur gel avec ce domaine en utilisant les mêmes fragments d'ADN que précédemment. Ce résultat suggère, soit que le domaine HMG de Lsd1 produit chez E. coli ne fixe pas l'ADN, soit qu'une structure particulière de l'ADN et nécessaire pour son recrutement.

88

Figure 5 : Identification de la séquence liée par Sap1 au niveau de l'allèle M.

A) Représentation schématique du locus mat1M avec les ADN db (double brin) utilisés pour le gel-retard. Les ADN db de M1 à M10 sont à l'intérieur de l'allèle M. La boite H1 est représentée en bleu et le locus mat1M en gris. B) Les séquences des ADN db contrôles sont indiquées SAS1 et TER1. En vert, les sites de liaison précédemment caractérisés sont notés (Arcangioli et al., 1994b; Krings and Bastia, 2006). C) Le gel retard d'un extrait brut de protéines de S. pombe. Les oligonucléotides utilisés comme contrôles sont SAS1 et TER1. Dans les lignes (-), 1 ng de la sonde radio-marquée indiquée est déposé. Dans les lignes (+), un mélange contenant 1 ng de la sonde et 5 µg d'extrait total sont déposés D) Le gel retard de la protéine Sap1-6xHis purifiée chez E. coli. Les oligonucléotides utilisés comme contrôles sont SAS1 et TER1. Dans les ligne (-), 1 ng de la sonde radio-marquée indiquée est déposé. Dans les lignes (+), un mélange contenant 1 ng de la sonde et 40 ng d'extrait sont déposés.

1.5 Caractérisation du site de recrutement de Lsd1 et de Sap1 par ChIP-séq