• Aucun résultat trouvé

Analyse à l’échelle du génome des gènes ciblés par les protéines du PcG

Partie IV : Ciblage des complexes du PcG sur les gènes

1. Analyse à l’échelle du génome des gènes ciblés par les protéines du PcG

1.1. Techniques d’immunoprécipitation de la chromatine

L’utilisation de techniques d’immunoprécipitation de la chromatine (ChIP) permet de savoir si une protéine, ou bien une marque histone, est associée à une région génomique par-ticulière Figure 16. Dans ces techniques, les étapes principales sont : (1) la fixation des cel-lules tissus ou organismes à étudier par du formaldéhyde afin de générer in vivo des liaisons

66

INTRODUCTION

5.   Amplifica+on  d’une  séquence  

spécifique  par  PCR  quan3ta3ve   en  temps  réel  

4.  Purifica+on  de  l'ADN  

1.  Fixa+on  in  vivo  des  interac3ons  moléculaires  

au  formaldéhyde  

2.  Fragmenta+on  et  immunoprécipita+on  de  la  

chroma3ne  associée  à  la  protéine  d'intérêt  

3.  «  De-­‐crosslinking  »  

qChIP   ChIP  on  chip   ChIP-­‐seq   Hybrida+on  sur  puce  à  ADN  des  fragments  d’  

ADN  associés  à  la  protéine  d’intérêt    

Séquençage    de  l’ensemble  des  fragments  d’  

ADN  associés  à  la  protéine  d’intérêt  

Figure 16 : Techniques d’immunoprécipitation de la chromatine (ChIP) et méthodes d’analyses

La technique de ChIP permet d’identifier les régions génomiques occupées par une protéine particulière, cette technique comprend 5 étapes principales : 1. La fixation du matériel biologique à étudier par du formaldé-hyde pour établir des liaisons covalentes entre les protéines et l’ADN 2. La fragmentation de l’ADN et l’utili-sation d’anticorps spécifiques contre la protéine d’intérêt pour précipiter l’ADN associé à cette protéine 3. Le « de-crosslinking » : dissociation des fragments d’ADN des protéines 4. La purification des fragments d’ADN 5. L’analyse des résultats peut se faire de 3 différentes façons : Par PCR quantitative en temps réel pour rechercher si une séquence particulière est enrichie par rapport à une autre après le ChIP, on parle alors de qChIP. Le maté-riel obtenu peut également être amplifié avec incorporation de marqueurs fluorescents pour être hybridé sur une puce à ADN. Dans cette technique dite de ChIP on chip, sera également hybridé un matériel témoin marqué par un autre marqueur fluorescent, pour identifier les séquences spécifiquement enrichies lors de la lecture de la fluorescence (en vert clair dans l’illustration). Enfin le matériel peut être directement séquencé, on parle alors de ChIPseq.

Ciblage des complexes du PcG sur les gènes au cours du développement

covalentes entre les protéines et l’ADN, (2) la sonication de l’ADN qui permet de générer des petits fragments, (3) l’immunoprécipitation de la protéine d’intérêt associée à ses séquences cibles d’ADN, et enfin (4) la purification de ces fragments d’ADN après les avoir dissociés des protéines. Ensuite, pour identifier l’ensemble des séquences d’ADN cibles de la protéine, il faut amplifier ces fragments en incorporant des marqueurs fluorescents, dans le cas d’une lecture par puce à ADN, ou bien alors, ajouter des adaptateurs aux fragments, dans le cas d’une lecture par séquençage. Après le protocole de ChIP, il est également possible de mesurer l’enrichissement d’une protéine sur une région génomique spécifique, par PCR quantitative en temps réel, mais cela nécessite de connaitre à l’avance la région génomique à tester. Enfin lorsqu’il n’existe pas d’anticorps dirigés contre la protéine à étudier, il existe une variante de ce protocole, le DamID (DNA adenine methyltransferase identification), dans lequel les sites de fixation sont identifiés grâce à l’expression de la protéine d’intérêt fusionnée à la méthylase Dam (Greil et al., 2006). En effet, cette association va permettre à Dam, une fois à proximité du site de fixation de la protéine, de méthyler l’ADN et de rendre ces régions méthylées sensibles à la digestion enzymatique, révé-lant ainsi les fragments fixés par la protéine d’intérêt.

1.2. Nature des gènes ciblés par les protéines du PcG

Dès leur mise au point, ces techniques ont été mises à profit dans le but d’identifier, dans diverses espèces, les gènes ciblés par les protéines du PcG. L’analyse de la nature des gènes ainsi identifiés est directement corrélée aux diverses fonctions biologiques dans lesquelles les pro-téines du PcG étaient suspectées de jouer un rôle crucial. Par ailleurs, de façon remarquable, ces fonctions biologiques nécessitent une régulation génique dynamique comparativement à la régulation exercée sur les gènes HOX, Figure 17A. Ainsi, au cours de la même année, une première série d’études a établi les profils génomiques de certaines protéines du PcG dans des cellules de drosophile (Negre et al., 2006; Schwartz et al., 2006; Tolhuis et al., 2006), et dans des cellules mammifères humaines et murines (Boyer et al., 2006; Bracken et al., 2006; Lee et al., 2006). Ces études ont permis d’identifier entre 200 et 300 gènes cibles co-fixés par plusieurs membres du PcG dans les cellules embryonnaires de drosophile ainsi qu’environ 500 et 600 gènes respectivement dans les cellules souche embryonnaires de souris et d’homme.

L’analyse comparative entre espèces de ces cibles a mis en évidence un certain nombre de particularités sur la nature des gènes ciblés par les protéines du PcG. Il s’agit majoritairement de gènes impliqués dans des processus du développement précoce ou tardif. Ces gènes codent es-sentiellement pour des facteurs de transcription mais également pour des protéines sécrétées ou

68

INTRODUCTION

Gènes  de   signalisa,on  

FTs  du  développement  

Gènes  du  cycle   cellulaire   Système  de  mémoire  

cellulaire   Protéines   PcG   Gènes   HOX   Développement  du   cancer  

Proliféra,on  et  contrôle  du   cycle  cellulaire  

Plas,cité  des  cellules  souches   Spécifica,on  et  différen,a,on    

,ssulaires  

A  

B  

shf/WIF1   toy/PAX6  

eya/EYA1-­‐4   so/SIX1-­‐2  

dac/DACH1-­‐2   OpFx/Six3-­‐6   Développement   de  l’œil   ey/PAX6   eyg/PAX6(5A)  

Autres  cibles  des  protéines  du  PcG  chez  la  drosophile   qui  sont  impliquées  dans  la  régulaFon  du  RDGN  

Dpp   Hh   Egfr   Wg   Notch   udp   Oc   Ato   Tsh   Hth   bi  

Facteurs  de  transcripFon  :   Gènes  de  signalisaFon  :  

Figure 17 : Cibles des protéines du PcG et fonctions biologiques associées

A : Large spectre d’action des protéines du PcG et identification de nouveaux gènes cibles de ces protéines. Les protéines du PcG par l’étude des gènes HOX ont été définies comme un système de mémoire cellulaire per-mettant la répression stable à long terme de ces gènes (pointe verte). Cependant elles ont également été im-pliquées dans d’autres processus biologiques nécessitant des régulations géniques plus dynamiques (pointe bleue). L’utilisation de techniques d’immunoprécipitation de la chromatine dans diverses espèces a permis d’identifier de nouveaux gènes cibles de ces protéines. Les fonctions associées à ces gènes (cercle rose) sont corrélées aux processus biologiques dans lesquels les protéines du PcG participent.

B : Contrôle du développement de l’œil par les protéines du PcG. 7 des 8 gènes constituant le RDGN (Retinal Determination Genes Network) sont ciblés par les protéines du PcG (boules bleues). Ce réseau de gènes est conservé chez les mammifères (nom en orange). Les facteurs de transcription et les gènes de signalisation également impliqués dans le contrôle du développement de l’œil sont également des cibles des protéines du PcG (Listé à droite sous la bannière bleu). Figure inspirée de (Schuettengruber et al., 2007).

Ciblage des complexes du PcG sur les gènes au cours du développement

de membranes appartenant aux principales voies de signalisation, telles que les voies wingless, Hedgehog et Notch.

D’autre part, une étude récente a mis en évidence que les potéines du PcG ciblent également un grand nombre de gènes des microARN impliqués dans la différenciation et l’apoptose, ce qui renforce l’idée que ces protéines sont essentielles pour le bon déroulement des processus déve-loppementaux (Enderle et al., 2011).

Ces cibles sont relativement bien conservées entre les espèces. Par exemple, 76% des fac-teurs de transcription identifiés comme cibles chez les mammifères s’avèrent être également fixés sur leurs gènes homologues de drosophile (Ringrose and Paro, 2007).

De manière intéressante, les gènes de certains réseaux développementaux que l’on retrouve chez la drosophile et chez les vertébrés, ainsi que les voies de signalisation qui les régulent, apparaissent comme étant tous ciblés par les protéines du PcG, c’est à dire à tous les niveaux de hiérarchie de la cascade. C’est le cas par exemple du réseau de développement de l’œil, où plu-sieurs des gènes qui existent chez la drosophile, la souris et chez l’homme, apparaissent comme cibles des protéines du PcG dans ces différentes espèces (Schuettengruber et al., 2007), Figure

17B. Chez la drosophile, concernant les gènes de signalisation associés à la régulation de ce

réseau, en plus de ceux identifiés par les études de ChIP, certains ont été découverts ou validés à la suite d’études fonctionnelles menées dans d’autres types de tissus, Figure 17B. Deux études menées chez la drosophile visant à étudier le rôle suppresseur de tumeurs des PcGs ont utilisé les disques imaginaux de drosophile (tissus larvaires précurseurs de l’œil adulte) comme tissu modèle. Il a ainsi été démontré que la voie de signalisation Notch, connue pour son implication dans la balance prolifération/différenciation, est ciblée à tous les niveaux de sa cascade par le complexe PRC1. Ainsi, le gène Notch lui même mais également son ligand serrate et le gène eygone, un effecteur de la voie Notch, sont tous régulés par les protéines du PcG (Martinez et al., 2009). De la même manière, les gènes unpaired (Upd1, 2, 3), des activateurs de la voie de signa-lisation des JAK-STAT, ont été identifiés comme cibles des protéines du PcG et sont suractivés lorsque ces dernières sont mutées dans le disque d’œil (Classen et al., 2009). Par ailleurs, en plus des gènes de signalisation, il a été montré que chez la drosophile et chez les vertébrés les pro-téines du PcG régulent également des gènes impliqués dans le contrôle des différentes phases du cycle cellulaire (Sauvageau and Sauvageau, 2010).

Enfin, la présence dans des cellules souches embryonnaires de souris et d’homme des pro-téines du PcG au niveau des gènes de différenciation (Boyer et al., 2006; Bracken et al., 2006;

70

INTRODUCTION

Lee et al., 2006) conforte l’idée que les protéines du PcG sont impliquées dans la plasticité des cellules souches en maintenant réprimés ces gènes.

1.3. Profils des protéines du PcG sur le génome et état transcriptionnel

Ces études de ChIP à l’échelle du génome ont également permis de cartographier précisé-ment la distribution des protéines du PcG le long du génome et révèlent certaines différences notables entre les espèces étudiées.

Chez la drosophile (Figure 18), pour l’ensemble des facteurs du PRC1 et du PRC2 analysés, à l’exception de Pc, leurs profils correspondent à des pics précis localisés soit aux promoteurs des gènes soit, dans la majorité des cas, dans des régions intergéniques à une distance pouvant aller jusqu’à 10kpb du premier promoteur (Ringrose and Paro, 2007). La marque H3K27me3 forme de larges domaines pouvant englober plusieurs gènes et atteindre des centaines de kpb. Cette discordance visible entre la présence de la marque H3K27me3 sur de larges domaines et une présence de la protéine E(z) (responsable de cette marque) restreinte au PRE pourrait s’expliquer par un modèle dit de boucle. Dans ce modèle, l’association transitoire de la région occupée par E(z) avec des régions voisines au PRE permettrait le dépôt progressif de la marque et son étalement sur une plus large région (Schuettengruber and Cavalli, 2009; Schwartz et al., 2006). La protéine Pc forme également des pics dont les sommets sont corrélés aux sites de fixa-tions des autres protéines du PcG, mais on observe également un étalement de cette protéine le long des domaines de H3K27me3. L’étalement apparent de cette protéine pourrait refléter ces associations transitoires des PREs par la formation de boucles chromatiniennes, qui auraient été capturées lors du processus de fixation. Trois études récentes ont également rapporté les profils de fixation de la protéine Pho du complexe Pho-RC dans l’embryon et pour les disques imaginaux de drosophile (Kwong et al., 2008; Oktaba et al., 2008; Schuettengruber et al., 2009). La majorité des sites occupés par les protéines du PcG dans l’embryon est également marquée par la présence d’un pic de Pho. Cependant, la réciproque n’est pas vraie ; il existe en effet de nombreux sites Pho inoccupés par les protéines du PcG (Schuettengruber et al., 2009), Figure

18. Enfin, la concordance des sites de fixation des protéines du PRC1 et du PRC2 dans l’embryon

de drosophile plaide en faveur de l’idée d’une coopération de ces complexes pour la régulation dépendante des protéines du PcG à ce stade du développement.

Chez les mammifères, à l’inverse de la drosophile, la majorité des sites associés aux pro-téines du PcG sont proches du promoteur puisque situés à moins de 1kb du TSS (Ringrose and Paro, 2007). De plus, les régions recouvertes par H3K27me3 correspondent cette fois ci

exacte-Ciblage des complexes du PcG sur les gènes au cours du développement

ment aux sites de fixation des protéines du PRC2. Par ailleurs, ces régions occupées par les pro-téines du PcG et la marque H3K27me3 chevauchent les régions promotrices et forment rarement de larges domaines (Boyer et al., 2006; Bracken et al., 2006; Lee et al., 2006). Néanmoins, une autre étude, réalisée dans des fibroblastes de souris, a montré l’existence de larges domaines de H3K27me3, proposant alors que ces profils pourraient également dépendre du type cellulaire (Pauler et al., 2009). Enfin, une autre différence majeure avec la drosophile est la présence chez les mammifères de nombreux sites portant H3K27me3 mais étant dépourvus de protéines du PRC1 (Ku et al., 2008; Min et al., 2011). Ces sites observés dans des cellules souches de souris et d’homme correspondent à certains des domaines bivalents sur lesquels on retrouve de manière concomitante les marques antagonistes H3K27me3 et H3K4me3.

A l’échelle du génome, la présence des protéines du PcG est associée globalement à un état transcriptionnellement inactif, ce qui est en accord avec la fonction de ces protéines. Cependant, de nombreuses études mentionnent que parmi toutes ces cibles certaines d’entres elles sont ac-tives (Beisel et al., 2007; Bracken et al., 2006; Brookes et al., 2012; Enderle et al., 2011; Papp and Muller, 2006; Schwartz et al., 2006). Chez les mammifères, l‘état de bivalence est marqué par la présence de l’ARN polymérase en état de pause et cet état semble dépendre des protéines du

ANT-­‐C  

Ph   Pc   PR C1   Pho   Ph o-­‐R C   E(z)   PR C2   Su(z)12   H3K27me  3   3R   2.472M   2.572M   2.672M   2.772M   2.872M   2.972M   Antp   Scr   Dfd   pb   lab  

Figure 18 : Profils génomiques des protéines du PcG et de H3K27me3 dans l’embryon de drosophile

Sont présentées ici des données de ChIP on chip, obtenues sur des embryons de 4-12h pour les protéines du PRC2 (Su(z)12, E(z)) de la marque H3K27me3, des protéines du PRC1 (Pc, Ph) et de la protéine Pho du complexe Pho-RC. La région génomique correspond à un segment du chromosome 3R de 600kpb au niveau du com-plexe homéotique Antennapedia (ANT-C). Les flèches indiquent les sites Pho dans l’embryon qui ne sont pas occupés par les autres protéines du PcG. Ces données obtenues dans le laboratoire ont en partie été publiées (Schuettengruber et al., 2009). L’outil pour visionner les données de ChIP a été réalisé par Benjamin Leblanc pour le laboratoire.

72

INTRODUCTION

PRC1 (Oguro et al., 2010; Stock et al., 2007). En plus de cet état de pause, il a aussi été observé que pour certains des gènes bivalents l’ARN polymérase assure un faible niveau transcription-nel (Brookes et al., 2012).

Chez la drosophile, bien que les domaines bivalents n’aient pas été identifiés, l’existence de profils épigénétiques alternatifs, associant les protéines du PcG à des régulations géniques plus fines, vient d’être découverte. En effet, deux récentes études menées sur des lignées cellu-laires dérivées d’embryon ou de tissus larvaires de drosophile ont analysé les profils de plusieurs protéines du PcG et du trxG ainsi que diverses marques d’histones (Kharchenko et al., 2010; Schwartz et al., 2010). Dans ces études, les auteurs décrivent la coprésence de facteurs protéiques ou/et de marques histones au niveau des promoteurs ou PRE de certaines cibles des protéines du PcG qui, selon les combinaisons qu’elles forment, sont associées à des états transcriptionnels dif-férents : réprimé, en pause mais aussi actif en présence même de protéines du PcG, Figure 19.

Ainsi les protéines du PcG sont, non seulement capables de cibler différents types de gènes, mais semblent aussi pouvoir adopter différentes formes de régulation transcriptionnelle selon leurs cibles.