Partie IV : Ciblage des complexes du PcG sur les gènes
2. Ciblage dynamique des complexes du PcG au cours du développement
L’introduction des techniques de ChIP pour l’étude des protéines du PcG aura donc permis dans un premier temps d’identifier de nombreux nouveaux gènes cibles de ces protéines. Ces gènes, pour la plupart, correspondent à des facteurs de différenciation cellulaire. Par
consé-Réprimés Ac+fs Pauses
Figure 19 : Différentes signatures aux TSSs pour les gènes des domaines Polycomb
Version simplifiée des différentes classes de TSSs associées aux protéines du PcG dans les cellules S2, décrites par (Kharchenko et al., 2010). Dans cette étude, les auteurs présentent les résultats de plusieurs expériences de ChIP pour un grand nombre de marques histones et de protéines ainsi que des expérience de GRO-seq (glo-bal run-on sequencing, qui permet de manière précise de donner l’état transcriptionnel des gènes) . Par une analyse combinatoire des données, ils mettent en évidence l’existence de plusieurs domaines chromatiniens caractérisés par des combinaisons de marques et de protéines particulières. Pour les domaines Polycomb ils ont ensuite identifié différentes signatures épigénétiques au niveau des TSSs de ces domaines. Trois d’entre eux sont représentés ici : 1 des gènes complètements réprimés marqués par un fort enrichissement de Pc et de H3K27me3 sans aucune marque d’activation. 2 les gènes qui malgré la présence de Pc sont entièrement transcrits et possèdent des marques d’activations et la protéine Ash1 du trxG. 3 des gènes qui produisent de courts ARN sens, indiquant la présence de l’ARN polymérase en état de pause.
Ciblage des complexes du PcG sur les gènes au cours du développement
quent, au cours de ce processus biologique, selon le lignage dans lequel les cellules s’engagent, certains d’entre eux vont devoir être activés et d’autres maintenus silencieux. Il a donc rapide-ment été proposé que les protéines du PcG pourraient, au cours de ces processus dynamiques, être recrutées de manière également dynamique et de ce fait modifier l’expression de ces gènes cibles afin de permettre le bon déroulement de ces étapes de différenciation, Figure 20. Ce pos-tulat va bien entendu à l’encontre du paradigme selon lequel les protéines du PcG maintiennent leurs gènes cibles dans un état réprimé « Ad vitam æternam ».
Les systèmes de différenciation cellulaire se prêtent bien à l’étude de la dynamique de ci-blage des protéines du PcG et de H3K27me3 et des études menées chez la souris et chez l’homme en ont naturellement tiré profit, table 2. D’autre part, plusieurs études menées chez la droso-phile, chez la plante Arabidopsis et chez les mammifères ont comparé le ciblage des protéines du PcG et de H3K27me3 dans des cellules provenant de différents tissus ou stades développemen-taux table 2. L’ensemble de ces études rapporte alors l’existence d’une dynamique de ciblage du système Polycomb au cours de la différentiation ou à travers le développement.
Figure 20 : Recrutement dynamique et retrait des protéines du PcG au cours de la spécification d’un lignage cellulaire
Les protéines du PcG sont retirées du promoteur d’un certain nombre de gènes et apparaissent sur d’autres groupes de gènes cibles au cours de la spécification d’un lignage cellulaire. Dans ce modèle, des cellules souches ou précurseurs ont le potentiel de se différentier en trois lignages différents (A, B, C). Les cellules souches non différentiées expriment des gènes nécessaires pour le maintien de la prolifération et répriment les gènes de différentiation des différents lignages. A la réception de signaux de différentiation, les gènes des cellules souches vont être réprimés par les protéines du PcG et selon la voie de différentiation dans laquelle les cellules s’engagent, les protéines du PcG vont être retirées des gènes spécifiques de ce lignage cellulaire. Illustration de (Bracken and Helin, 2009).
74
INTRODUCTION
Tout d’abord, chez les mammifères, dans les cellules souches non différentiées, les gènes spécifiant les différents lignages cellulaires sont marqués par un état de bivalence. Au cours de la différenciation, ces gènes vont perdre, soit H3K27me3, soit H3K4me3 et pouvoir ainsi être activés dans le premier cas ou bien maintenus réprimés dans le second (Maruyama et al., 2011; Mikkelsen et al., 2007; Mohn et al., 2008; Pan et al., 2007). D’autre part, toujours chez les mammifères, la méthylation de l’ADN est un mécanisme couplé aux étapes de différenciation. Les gènes qui perdent la marque H3K4me3 sont méthylés sur l’ADN, verrouillant ainsi leur état transcriptionnel réprimé. Toutefois, certains gènes sont capables de conserver un état de biva-lence dans les précurseurs multipotents et des gènes bivalents ont également été observés dans des cellules complètement différentiées.
De manière intéressante, il a été montré, qu’au cours de la différenciation des cellules mus-culaires ou neuronales, les gènes fixés à la fois par le PRC1 et le PRC2 sont plus réfractaires à la perte de H3K27me3 que ceux seulement occupés par PRC2 (Asp et al., 2011; Ku et al., 2008). L’ensemble de ces travaux suggère qu’il existe différentes signatures épigénétiques permettant de spécifier le devenir d’un gène au cours de la différenciation. En accord avec cette hypothèse, deux récentes études ont également mis en évidence ce type de signatures. Ainsi, les gènes biva-lents qui seront activés au cours de la différenciation des cellules hématopoïétiques en érythro-cytes possèdent une combinaison de marques épigénétiques activatrices qui les distingue des autres gènes (Cui et al., 2009). De la même manière, dans les cellules de l’endoderme, juste avant la différenciation, les gènes qui spécifient les cellules du pancréas ou du foie possèdent des modi-fications d’histones différentes (Xu et al., 2011).
La plupart des études mentionnées ici se sont focalisées sur la marque H3K27me3. En ce qui concerne les protéines du PcG elles mêmes, il a également été observé qu’au cours de la dif-férentiation neuronale, il pouvait exister une dissociation de certaines des protéines du PRC1 et du PRC2 sur un petit groupe de gènes impliqués dans ce processus de différentiation, pour permettre leur activation (Bracken et al., 2006; Dietrich et al., 2012; Sher et al., 2012).
Chez les plantes, la marque H3K27me3 joue également un rôle crucial au travers des diffé-rents processus développementaux. En effet dans le génome de Arabidopsis, de nombreux gènes sont réprimés par cette marque (Zhang et al., 2007). Ces gènes sont impliqués dans le développe-ment des graines, dans la floraison, la vernalisation et l’identité des organes de la plante et vont donc devoir à un stade du développement, dans des tissus spécifiques, être activés. Il est donc également attendu que la marque H3K27me3 puisse être dynamiquement régulée en réponse à des signaux développementaux ou environnementaux pour permettre l’expression de ces gènes.
Ciblage des complexes du PcG sur les gènes au cours du développement
Dans ce sens, une étude récente a comparé les gènes ciblés par cette marque, entre des cellules non différentiées du méristème apical des racines et des cellules différentiées des feuilles de la plante (Lafos et al., 2011). Il a donc été mis en évidence que, selon le type de cellules, la marque H3K27me3 pouvait apparaître ou être dissociée sur les gènes et ceci de manière dépendante de leur état transcriptionnel.
Chez la drosophile, l’existence d’une dynamique de ciblage du système Polycomb au cours du développement a également été suggérée Table 2. Dans une étude récente, il a été montré par une analyse de la marque H3K27me3 sur tout le génome de drosophile, pour 12 stades du déve-loppement de l’embryon jusqu’à la mouche adulte, que 69% des gènes associés avec H3K27me3 allaient à un stade donné perdre cette marque (Negre et al., 2011). Par ailleurs il a été montré que, selon le tissu, le stade développemental ou bien encore le lignage cellulaire étudiés, les gènes associés aux protéines du PRC1 peuvent varier (Kwong et al., 2008; Negre et al., 2006; Schwartz et al., 2010). Il faut toutefois noter que dans ces études, si quelques exemples de ciblage
dyna-Table 2 : Liste non exhaustive d’études démontrant une dynamique développementale du ciblage des protéines du PcG et de H3K27me3 sur leurs cibles.
Dans chaque cas sont observés le gain, la perte ou la maintenance de protéines du PcG ou de H3K27me3. Les flèches indiquent les études dans lesquelles ont été utilisés des systèmes de différentiations cellulaires, pour les autres études il s’agit d’une comparaison entre tissus ou différents types cellulaires.
Systèmes Protéines / modifications d’histones Références
Drosophila : embryons, pupes, adultes PRC1 (Pc, Ph) ; recruteur GAF Negre et al 2006
Drosophila : embryons, pupes, adultes H3K27me3 ; H3K27ac ; H3K4me3 Negre et al 2010
Drosophila : embryons, disques larvaires PRC1 (Pc) ; recruteur (Pho) Kwong et al 2008
Drosophila : Lignées cellulaires dérivées des tissus
embryonnaires et larvaires
PRC1 (Pc) ; PRC2 (E(z)) Schwartz et al 2010
Arabidopsis : Cellules du méristème apical de pousse,
cellules différentiées des feuilles
H3K27me3 Lafos et al 2011
Souris : Cellules souches embryonnaires précurseurs
neuronaux neurones différenciés
H3K27me3 et H3K4me3
Mohn et al 2008
Souris : Cellules souches embryonnaires précurseurs
neuronaux, et fibroblastes embryonnaires
H3K27me3 ; H3K4me3 ; H3K9me3, H3K36me3 et H4K20me3
Mikkelsen et al 2007
Souris : Cellules souches neuronales
olygodendrocytes
PRC2 (EZH2) Sher et al 2012
Souris: Myoblastes myotubes PRC1 (Bmi1) ; 10 modifications d’histone (dont H3K27me3)
Asp et al 2011
Souris : Cellules souches embryonnaires; précurseurs
pancréatiques purifiés; cellules bêta purifiées et 10 autres tissus différentiés
H3K27me3 et H3K4me3. Arensbergen et al 2010
Homme : Cellules souches embryonnaires
précurseurs neuronaux
H3K27me3 et H3K4me3 Pan et al 2007
Homme : Fibroblastes embryonnaires; cellules du
tératocarcinome embryonnaire neurones différenciés
PRC1 (CBX8) ; PRC2 (EZH2) ; H3K27me3 Bracken et al 2006
Homme : cellules du tératocarcinome embryonnaire
neurones différenciés
PRC1 (RNF2) Dietrich et al 2012
Homme : Cellules souches hématopoïétiques
erythrocytes
8 modifications d’histones (dont H3K27me3)
Cui et al 2009
Homme : Cellules souches embryonnaires cellules
neuroéctodermiques
H3K27me3; H3K27ac and H3K4me1 Rada-‐Iglesias et al 2010
Homme : Cellules précurseurs du tissu mammaire,
cellules luminales
H3K27me3 et H3K4me3
Mayurama et al 2011
76
INTRODUCTION
miques on été mentionnés, les auteurs vont plus en faveur d’un maintien des sites de fixation de ces protéines au cours du développement. En revanche, dans des études sur la différenciation des cellules germinales en spermatocytes matures, il a été montré l’existence d’une dissociation des protéines du PcG au niveau des gènes de différenciation pour permettre leur activation et que le retrait des PcG sur ces gènes nécessite l’action de facteurs de transcriptions spécifiques (Chen et al., 2005; Chen et al., 2011).
Les mécanismes par lesquels les protéines du PcG sont retirées commencent tout juste à être explorés. En effet, en plus de l’action des facteurs de transcription, on peut également ci-ter, l’action de déméthylase spécifique de H3K27me3 (Smith et al., 2008; Swigut and Wysocka, 2007), le dépôt de marques antagonistes telles que H3K27ac, ou la phosphorylation de H3S28, qui interfèrent sur la fixation de Pc à H3K27me3 (Pasini et al., 2010; Tie et al., 2009) (Tie et al 2009, Pasini et al 2010, (Gehani et al., 2010; Lau and Cheung, 2011) ou bien l’action d’enhancer pour le retrait des PcG chargés aux promoteurs des gènes (Taberlay et al., 2011; Vernimmen et al., 2011).
L’ensemble de ces études laisse donc apparaître une toute autre vision du système Polycomb qui peut osciller entre une régulation génique stable ou à l’inverse dynamique. Chez les mam-mifères, cette flexibilité observée pourrait s’expliquer par l’existence de la méthylation de l’ADN qui peut constituer un deuxième verrou pour assurer le maintien de la répression des gènes. Cependant, la majorité de ces études s’est focalisée sur la marque H3K27me3. Concernant les protéines du PcG elles mêmes, il est difficile d’analyser leur dynamique de ciblage, car l’exis-tence de multiples isoformes de ces protéines chez ces espèces complique énormément cette analyse. Enfin ces études ont été menées dans des lignées cellulaires ou dans des tissus extraits d’un organisme. Pour pouvoir comprendre la régulation dynamique d’un réseau de gènes par les protéines du PcG, il faudrait pouvoir étudier directement dans un organisme ce qui se passe dans un tissu au moment de la transition du destin cellulaire.
Chez la drosophile, si quelques études ont également suggéré une dynamique de ciblage des protéines du PcG ou de la marque H3K27me3 au cours du développement, il semble que le sys-tème dans cet organisme soit plus stable. L’absence de méthylation de l’ADN pourrait d’ailleurs en être la raison.
Toutefois, comme pour les mammifères, les protéines du PcG ciblent des gènes de différen-ciation qui doivent à un moment du développement être activés pour assurer la mise en place d’un tissu. C’est le cas par exemple des gènes du réseau de détermination de l’œil présentés
Ciblage des complexes du PcG sur les gènes au cours du développement
adopter des patrons d’expression spécifiques dans le temps et dans l’espace. On peut alors se demander :
• Quel est le rôle des protéines du PcG dans la régulation transcriptionnelle de ce réseau de gènes ?
• Est ce que les protéines du PcG restent associées à ces gènes malgré les transitions trans-criptionnelles ?
Répondre à ces questions par la mise en place d’un système expérimental aura été le pre-mier objectif de ma thèse et est présenté dans la première partie des résultats.