CHAPITRE 1 : Introduction 1
1.3 Organisation tridimensionnelle de la chromatine 48
1.3.2 Les protéines impliquées dans le repliement du génome 56
1.3.2.2 Le complexe cohésine 59
La cohésine est un complexe protéique, conservé de la levure à l’homme et possédant de proches homologues chez les bactéries, qui a la capacité d’encercler deux segments d’ADN à l’intérieur de sa structure en anneau415. Cette propriété topologique permet à la
cohésine de jouer de nombreux rôles à l’interface entre la préservation de l’intégrité du génome, de la régulation de la transcription et de l’établissement de domaines architecturaux au sein de la chromatine.
Structure et dynamique du complexe cohésine
Initialement identifiées chez la levure comme des mutants présentant une séparation prématurée des chromatides sœurs au cours de la mitose416, les sous-unités de la cohésine sont au nombre de quatre : deux sous-unités SMC (structural maintenance of chromosomes), SMC1 et SMC3, une sous-unité kléisine RAD21 et l’antigène stromal (SA ;; aussi connu sous le nom de STAG)417 (Figures 1.20.A et B). Les protéines SMC sont de
longs polypeptides qui se replient sur eux même pour former une structure semblable à une tige avec un domaine charnière à une extrémité et un domaine ATPase à l’autre extrémité. D’une part, l’association de SMC1 et SMC3 par leurs domaines charnières permet de constituer un hétérodimère en forme de V418–420. D’autre part, l’association de RAD21 par ses régions amino- et carboxy-terminales avec les domaines ATPase de SMC3 et SMC1, respectivement, mène à la formation d’un anneau tripartite419 où RAD21 interagit de surplus avec la sous-unité SA421(Figure 1.20.A). L’intégrité de cet anneau est
cruciale pour l’association de la cohésine avec la chromatine, qui a été décrite comme étant topologique419. Cela signifie que la cohésine encercle les fibres chromatiniennes
mais ne possède pas de domaine de liaison à l’ADN et ainsi ne reconnait pas une séquence spécifique. À l’exception de SMC3, toutes les autres sous-unités existent au moins sous deux isoformes, dont certaines sont spécifiques de la méiose. Deux complexes cohésine coexistent dans les cellules somatiques des vertébrés : chacun possède les sous-unités SMC1A, SMC3 et RAD21, et soit SA1 ou SA2422,423. L’abondance relative de ces deux complexes est probablement variable d’un type cellulaire à un autre et/ou au cours du développement, et leurs fonctions spécifiques ne sont pas encore totalement comprises.
Figure 1.20: Le complexe cohésine.417,424
A. Structure du complexe cohésine des cellules somatiques de vertébrés. B. Sous-unités
et régulateurs du complexe cohésine chez la levure, la drosophile et l’Homme. C. NIPBL- MAU2 et PDS5-WAPL régulent la présence du complexe cohésine sur la chromatine.
La cohésine interagit avec d’autres protéines afin de réguler sa dynamique tout au long du cycle cellulaire. Le complexe s’associe à la chromatine au cours de la phase G1 en un processus qui nécessite la présence de l’hétérodimère NIPBL (Nipped-B-like protein)- MAU2, l’hydrolyse de l’ATP par les domaines ATPases des sous-unités SMC et la séparation transitoire de leurs régions charnières425–428(Figure 1.20.C). Une reconstitution
biochimique de la réaction de chargement sur de l’ADN nu indique que le complexe cohésine a une capacité intrinsèque à se charger topologiquement sur l’ADN mais ce processus est inefficace à moins que NIPBL soit présent. Il a été proposé que NIPBL- MAU2, interagissant avec l’ensemble des sous-unités du complexe cohésine, pourrait agir comme un conduit moléculaire pour transmettre l’énergie issue de l’hydrolyse de l’ATP des domaines ATPases aux domaines charnières des sous-unités SMC pour permettre leur séparation et laisser entrer l’ADN429. Toutefois, la localisation des sites de chargement de la cohésine commence tout juste à être élucidée. Chez la levure, la cohésine et son facteur de chargement sur l’ADN ne colocalisent pas, peut-être en raison de la capacité du
drosophile, NIPBL et la cohésine sont retrouvés au niveau de sites de transcription active431. Il en est de même dans les cellules souches embryonnaires de souris, bien
qu’une large proportion de la cohésine ne colocalise pas avec NIPBL432. Une étude
récente présente un mécanisme, semblable à celui proposé chez la levure, permettant d’expliquer cette répartition du complexe cohésine sur la chromatine. En effet, les auteurs proposent un modèle où la cohésine est chargée par NIPBL au niveau des TSSs des gènes actifs, puis déplacée vers d’autres régions du génome grâce à l’ARN Pol II en transcription433. L’ensemble de ces observations suggère donc que la cohésine est plus
dynamique au niveau de loci transcriptionnellement actifs et a ainsi besoin d’être rechargée à une fréquence plus élevée, d’où sa colocalisation avec son facteur de charge uniquement au niveau de ces régions. Deux autres facteurs, WAPL (wings apart-like protein homologue) et PDS5 (precocious dissociation of sisters) (A ou B chez les vertébrés), s’associent entre eux ainsi qu’avec la cohésine liée à la chromatine afin de promouvoir le déchargement du complexe434(Figure 1.20.C). Ainsi, la fraction de cohésine
qui est présente sur la chromatine est le résultat des actions opposées de NIPBL-MAU2 et PDS5-WAPL. Par ailleurs, la dynamique du complexe cohésine est régulée tout au long du cycle cellulaire (Figure 1.21).
Figure 1.21: Dynamique du complexe cohésine au cours du cycle cellulaire.424
Durant la phase G1, la cohésine n’est liée qu’à une seule chromatide. Après le passage de la fourche de réplication en phase S, le complexe encercle les deux chromatides sœurs et devient alors cohésif. L’établissement de la cohésion nécessite l’acétylation de deux résidus lysine au niveau du domaine ATPase de SMC3 par les acétyltransférases de cohésine (CoATs pour cohesin acetyltransferases) ESCO1 et ESCO2 (establishment of cohesion) (Eco1 chez la levure)435,436, ainsi que la liaison de la protéine sororine à PDS5 menant au déplacement de WAPL, évitant ainsi son action de déchargement437. Les complexes cohésines acétylés et liés à la soronine sont stables sur la chromatine438. Chez
les métazoaires, la cohésine est relâchée de la chromatine en deux étapes au cours de la mitose, en prophase et en anaphase. La voie de dissociation en prophase libère la majorité de la cohésine et nécessite la phosphorylation de la sous-unité SA par la kinase PLK1 (polo-like kinase 1) ainsi que l’action de déchargement de PDS5-WAPL439 est
facilitée par l’élimination de la soronine après phosphorylation par CDK1 (cyclin-dependent kinase 1) et aurora B434,437,440. Une petite proportion de cohésine, principalement enrichie au niveau des centromères, est protégée de cette dissociation grâce à l’action de shugoshine 1 (SGO1) qui est liée à la phosphatase PP2A (protein phosphatase 2A). SGO1-PP2A reconnait la cohésine liée à la soronine et antagonise sa phosphorylation441,442. La cohésine centromérique permet ainsi l’alignement des
chromosomes sur la plaque métaphasique. L’activation du complexe APC/C (anaphase promoting complex/cyclosome) au début de l’anaphase mène à la dégradation de la sécurine et à l’activation de la séparase. Cette dernière clive la sous-unité RAD21 des complexes cohésine restants, ce qui détruit l’intégrité de l’anneau et permet la séparation des chromatides sœurs443–445. Une fois dissocié de la chromatine, le complexe cohésine
doit être déacétylé afin d’être réutilisé. Cette tâche est accomplie par HDAC8 dans les cellules humaines446 et par Hos1 chez la levure447,448.
Fonctions du complexe cohésine dans l’organisation de la chromatine en interphase
La cohésine possède de nombreuses fonctions nucléaires essentielles qui sont dépendantes ou non de la cohésion. Lorsque le complexe encercle deux segments d’ADN appartenant à des chromatides sœurs, il agit comme un médiateur de la cohésion et est alors important pour réguler la ségrégation des chromosomes en mitose et en méiose ainsi que la réparation de l’ADN par recombinaison homologue. Lorsque la cohésine maintient deux régions de la même chromatide, elle participe alors à des processus impliquant la formation de boucles d’ADN, dont la régulation de la transcription et le contrôle de la structure de la chromatine en interphase449. Même si les mécanismes moléculaires sous-jacents semblent similaires, ces fonctions distinctes diffèrent par d’importants aspects. Nous ne traiterons dans cette partie que des fonctions de la cohésine dans la formation de structures de repliement du génome.
Chez les eucaryotes supérieurs, la cohésine joue des rôles importants en dehors du cycle cellulaire. Elle représente d’ailleurs un composant majeur de la chromatine dans des cellules post-mitotiques450–452 ou des cellules qui ne cyclent pas453. Au niveau génomique,
le nombre de sites de liaison de cohésine varie entre 10000 et 60000 en fonction du type cellulaire et de la méthodologie utilisés408,432,454,455. Approximativement 50% de ces sites
sont localisés au niveau de régions inter-géniques, 37% dans des introns et exons et environ 7% dans une région allant jusqu’à 5kb en amont de promoteurs454. En particulier, entre 60 et 80% des sites de liaison de cohésine sont co-occupés par la protéine CTCF432,454–457. Il convient alors de globalement distinguer deux types de sites cohésine : des sites forts qui coïncident avec la présence de CTCF et des sites souvent plus faibles localisés au niveau de TSSs et d’enhancers actifs. Au niveau de ces derniers, le complexe colocalise avec son facteur de chargement NIPBL et le complexe Médiateur, ainsi qu’avec des facteurs de transcription tissus-spécifiques432,455,458,459.
La démonstration de l’existence d’interactions chromatiniennes sur de grandes distances entre des sites de liaison de cohésine432,453,460,461 suggère que ce complexe pourrait
réguler la transcription en stabilisant topologiquement des boucles rapprochant des éléments distaux du génome. En effet, il a été proposé que cohésine est capable de former des boucles d’ADN stables en s’associant avec CTCF (Figure 1.19.B) ou avec NIPBL et Médiateur (Figure 1.23.B) afin de réguler l’expression de certains gènes. Dans un premier temps, le fait que les interactions distales médiées par CTCF soient dépendantes de la cohésine a d’abord été démontré pour le locus Ifng460. De manière dépendante de cohésine, des interactions distales entre trois sites CTCF sont sélectivement produites afin de permettre l’expression inductible de Ifng. CTCF et cohésine collaborent également pour la régulation de loci complexes comme le locus de la β-globine462, de la protocadhérine463,464 et du récepteur des lymphocytes465. Dans un
second temps, il a été montré que la délétion de la cohésine est liée à la perturbation d’interactions enhancer-promoteur dans les cellules souches embryonnaires (ESCs, pour embryonic stem cells)432 ainsi que les thymocytes453 de souris. Les interactions cartographiées dans les ESCs impliquent des distances relativement courtes (3-5kb)432,
alors que la délétion de la sous-unité Rad21 dans les thymocytes induit la déformation de l’architecture chromatinienne du locus du récepteur des lymphocytes T α Tcra sur au moins 80 kb. Dans ces deux exemples, la cohésine permet de renforcer des interactions promoteur-enhancer et cela corrèle avec la transcription ainsi que la différentiation453 ou le
maintien de l’état cellulaire432. Il a également été montré que des interactions distales médiées par le complexe cohésine pouvaient perturber les contacts enhancer-promoteur au sien du locus à empreinte parentale H19/IGF2 régulé par CTCF461. L’ensemble de ces
dépend de la nature des éléments régulateurs qu’elle connecte au niveau de loci spécifiques. Néanmoins, il n’est pas encore clair si le rôle transcriptionnel de cohésine est uniquement lié à sa propriété topologique ou si le complexe peut directement réguler des composantes de la machinerie transcriptionnelle. Il a par exemple été montré que la cohésine interagit directement avec l’ARN Pol II ainsi que le complexe de super élongation (SEC)466 et qu’elle facilite la liaison de facteurs de transcription à des motifs de faible affinité458.
De toutes les protéines qui interagissent avec CTCF, la cohésine est la seule qui a été démontrée comme étant nécessaire pour stabiliser la plupart des contacts chromosomiques régulés par CTCF et essentielle aux fonctions de ce facteur au niveau de la majorité de ses sites de liaison génomique454,456,457,467–470. Le complexe cohésine est
par exemple retrouvé enrichi, tout comme CTCF, au niveau des frontières des TADs346. Il
est intéressant de noter que les sous-unités SA1 et SA2 du complexe cohésine peuvent physiquement interagir avec l’extrémité C-terminale de CTCF in vitro et la délétion de ce domaine de liaison putatif réduit l’enrichissement de cohésine et l’isolation transcriptionnelle au niveau de gènes rapporteurs467. Au niveau génomique, la déplétion de CTCF réduit l’enrichissement de cohésine au niveau des sites de liaison de CTCF, mais ne perturbe pas sa présence sur la chromatine457. Par conséquent, CTCF ne semble pas affecter le chargement ou l’association de la cohésine sur les chromosomes, mais régule sa distribution. La délétion de sous-unités de cohésine n’altère pas considérablement le profil de liaison de CTCF, suggérant que CTCF est positionné en amont de cohésine pour réguler sa localisation au niveau de ses cibles génomiques. De plus, CTCF et cohésine possèdent des rôles topologiques complémentaires, mais non identiques. En effet, la déplétion de CTCF augmente l’interaction entre des TADs voisins alors que la déplétion de cohésine induit une perte globale de l’organisation chromatinienne locale, mais les TADs restent intacts408. Le repliement des chromosomes
au-delà de l’échelle de la mégabase est uniquement perturbé par la déplétion à la fois de CTCF et de cohésine, ce qui résulte en une compaction générale de la chromatine471. La formation de boucles au sein de la chromatine est un mécanisme qui n’est pas encore très bien compris. Actuellement, l’hypothèse de choix est le modèle d’extrusion qui implique l’action combinée de moteurs d’extrusion (probablement les cohésines) qui peuvent liés la chromatine de manière dynamique et la transloquer afin de former une boucle, jusqu’à ce que leur progression sur la fibre chromatinienne soit arrêtée par un
cohésine permettrait donc de former des boucles en expulsant la chromatine à travers sa structure en anneau jusqu’à ce qu’elle rencontre un site occupé par CTCF de chaque côté de la boucle en formation. Ce modèle permet notamment d’expliquer pourquoi certains sites CTCF interagissent ensemble. De plus, le modèle d’extrusion est proposé comme étant un processus actif ayant besoin d’énergie. Bien que la cohésine soit capable de se déplacer le long de l’ADN de manière passive474,475, et qu’elle possède une activité ATPase, il ne semble pas que ce soit suffisant pour actionner l’extrusion de boucles476,477.
Une étude publiée récemment propose que l’ARN Pol II permette de déplacer la cohésine le long de l’ADN jusqu’à des sites occupés par CTCF (Figure 1.22). En effet, dans des conditions de perte de fonction de CTCF et de Wapl, le facteur de déchargement de cohésine, les auteurs observent une accumulation de cohésine notamment en aval de gènes activement transcrits, y compris dans des régions de transcription convergente, suggérant ainsi que la transcription puisse déplacer la cohésine433. Ces travaux présentent donc une façon de recruter la cohésine aux sites CTCF, une fois que le complexe est chargé par NIPBL-MAU2 au niveau des TSSs des gènes433;; mécanisme qui n’était pas compris jusque-là. En accord avec l’hypothèse de cohésine comme moteur de l’extrusion, une autre étude récente montre que la taille des boucles chromatiniennes augmente avec la durée de la présence de la cohésine sur la chromatine478.
Figure 1.22: Modèle de l’ARN Pol II comme médiateur de l’extrusion de boucles.477 Busslinger et al.433, proposent que la formation de boucles chromatiniennes soit permise grâce au mouvement de l’ARN Pol II qui déplace le complexe cohésine le long de la chromatine jusqu’à des sites CTCF.