CHAPITRE 1 : Introduction 1
1.3 Organisation tridimensionnelle de la chromatine 48
1.3.2 Les protéines impliquées dans le repliement du génome 56
1.3.2.1 La protéine architecturale CTCF 56
Le repliement du génome dans l’espace nucléaire est en partie établi par une classe particulière de protéines architecturales, parmi laquelle CTCF (CCCTC-binding factor) est le facteur le mieux caractérisé. CTCF crée des frontières entre les domaines topologiquement associés des chromosomes, et au sein de ces domaines, facilite les interactions entre des séquences régulatrices de la transcription (Figure 1.19). La liaison de CTCF mène à des conséquences fonctionnelles spécifiques qui sont dépendantes du contexte et déterminées par la nature des séquences rapprochées et par les protéines avec lesquelles elles interagissent. Ainsi CTCF permet de lier l’architecture du génome à ses fonctions383.
La protéine CTCF est conservée chez la majorité des bilatériens, mais est absente chez la levure, le vers et les plantes384. De plus, elle est exprimée de manière ubiquitaire et est
essentielle au développement embryonnaire385,386. CTCF se lie à l’ADN grâce à son
domaine central à 11 doigts de zinc fortement conservé387 (Figure 1.19.A) qui reconnaît un
motif de liaison non palindromique de 52 paires de bases388,389. Chez les mammifères, le
facteur CTCF est localisé au niveau de 55000 à 65000 sites de liaison390. Approximativement 45% de ces sites sont retrouvés dans des régions inter-géniques, 15% sont proches de promoteurs et 40% sont intra-géniques390,391. De plus, autour de 30 à 60% des sites de liaison de CTCF montrent une distribution spécifique en fonction du type cellulaire391–394 et des changements de méthylation de l’ADN au niveau de ces sites variables sont souvent corrélés avec une liaison différentielle de CTCF. Cependant, la sensibilité de la liaison de CTCF à la méthylation de l’ADN et le lien causal entre ces deux
évènements sont controversés. Par ailleurs, la liaison de CTCF peut également être modulée par des modifications post-traductionnelles de la protéine ou par son interaction avec d’autres protéines ainsi que des ARNs non codants au niveau de certains loci383.
Figure 1.19: La protéine architecturale CTCF395.
A. Structure primaire de CTCF. B. Représentation schématique des fonctions de CTCF,
en collaboration avec le complexe cohésine, dans la régulation de l’organisation 3D de la chromatine en lien avec la transcription.
Les diverses fonctions de CTCF dans la régulation de la topologie du génome passent par sa capacité à rapprocher des séquences génomiques qui sont éloignées sur le génome linéaire (Figure 1.19.B). CTCF a initialement été caractérisée comme une protéine insulatrice capable de limiter les interactions promoteur-enhancer à la fois dans des plasmides rapporteurs et dans leur environnement génomique natif396,397(exemple : Figure 1.14.B). Cependant, d’autres observations semblent contredire l’idée d’un rôle prédominant de CTCF dans le blocage des enhancers. En effet, une étude analysant les interactions distales entre des promoteurs et des séquences régulatrices par 5C a montré que 79% de ces interactions ne sont pas bloquées par la présence d’un ou de plusieurs sites CTCF intermédiaires. Au contraire, un certain nombre de ces éléments distaux ont été retrouvés enrichis pour CTCF373. D’autres études ont suggéré que CTCF jouait un rôle
important dans le ciblage d’éléments régulateurs à leur(s) promoteur(s) respectif(s). À titre d’exemple, des travaux portant sur l’étude de la localisation génomique de CTCF par ChIP-Seq (chromatin immunoprecipitation coupled with massively parallel DNA sequencing) ont identifié un chevauchement significatif entre les sites de liaison tissu- spécifiques de CTCF et des éléments enhancer398. Enfin, il a également été montré que CTCF est important pour réguler l’expression de clusters complexes de gènes au sein
desquels des séquences régulatrices sont éloignées de certains de leurs gènes cibles. CTCF est par exemple un régulateur clé des gènes de protocadhérines dans les neurones399.
D’autres rôles topologiques de CTCF ont été rapportés dans la littérature. En effet, il a été suggéré que CTCF influence la recombinaison V(D)J au niveau des gènes d’immunoglobulines et des récepteurs des lymphocytes T en régulant des interactions enhancer-promoteur ainsi que la compaction des loci400–403. De plus, des études indiquent
que CTCF peut contrôler à la fois la pause de l’ARN Pol II et l’épissage alternatif des ARNm en mettant en place des interactions au sein même des gènes404,405.
Un des rôles clés de CTCF dans l’organisation 3D de la chromatine est son implication dans la démarcation de frontières au niveau des structures de repliement du génome (Figure 1.19.B). En effet, les frontières des TADs sont enrichies en CTCF chez la drosophile ainsi que les mammifères346,406. Cependant, uniquement 15% des sites de liaison de CTCF chez les mammifères sont localisés au sein d’une frontière ;; la majorité des sites se retrouvant à l’intérieur des TADs et participant probablement à des interactions intra-TAD407. Cela suggère que, seul, CTCF ne suffit pas à établir des
frontières. En accord avec cela, il a été montré que la perte de fonction de CTCF dans des lignées cellulaires humaines n’affecte pas fortement les frontières de TADs mais réduit les interactions intra-domaines et augmente les contacts inter-domaines408. Bien que la
délétion de CTCF ne fût pas totale, cette étude suggère que d’autres facteurs pourraient intervenir dans la séparation des différents TADs. Les vertébrés pourraient alors adopter une stratégie similaire à celle utilisée par les cellules de drosophile où CTCF s’associe à de nombreuses autres protéines architecturales au niveau des frontières de TADs383,409,410.
Il est intéressant de noter que la probabilité ainsi que la force des interactions entre deux sites CTCF sont dictées par l’orientation des motifs CTCF. Dans les cellules de mammifères, des données de Hi-C à haute résolution ont montré que la grande majorité des interactions distales basées sur CTCF ont lieu entre des motifs convergents349. Cette
découverte suggère que les protéines CTCF liées à l’ADN au niveau des sites d’ancrage de boucles chromatiniennes s’alignent dans une configuration tête-tête. Cette observation a été confirmée par des études utilisant les techniques de ChIA-PET et de 4C, bien que des interactions entre des sites CTCF organisés en tandem, à une fréquence moindre, aient également été identifiées365,411. De plus, il a été montré que des paires de motifs
partiellement corrélée à l’orientation des motifs CTCF365, ce qui suggère un rôle potentiel
de CTCF et des boucles de chromatine dans le renforcement de la directivité de la synthèse d’ARN.
L’orientation des motifs CTCF est importante pour la formation des boucles chromatiniennes. En effet, l’inversion d’un motif CTCF au niveau d’une paire de sites convergents engagés dans une interaction perturbe la boucle411,413, ce qui suggère que
l’orientation convergente est centrale à l’interactivité entre des paires éloignées de sites CTCF. L’inversion expérimentale de clusters de sites CTCF au niveau des loci de la protocadhérine et de la β-globine perturbe le repliement local de la chromatine et permet l’accès au cluster inversé de CTCF à des régions précédemment isolées en aval du site CTCF413. Il est intéressant de noter que ce changement dans la topologie locale de la
chromatine est accompagné d’une sous-expression des gènes ciblés par la boucle endogène, sans induire une augmentation correspondante dans l’expression des gènes nouvellement ciblés. Ces résultats suggèrent que la formation de boucles chromatiniennes est nécessaire, mais probablement pas suffisante, pour la transcription. D’autres travaux ont procédé à l’inversion de motifs uniques de CTCF engagés dans des boucles. Malgré des niveaux de recrutement similaires de CTCF, cette inversion abroge la formation de la boucle, et, dans un cas, altère l’expression du gène voisin, mais est insuffisante pour rediriger des interactions distales411. Ainsi, la perturbation de clusters de sites CTCF
pourrait avoir des effets plus importants sur l’architecture chromatinienne locale que la perturbation de sites uniques de liaison. Étant donné que les boucles se forment entre des paires de sites CTCF convergents, la résultante de l’altération d’un site dépend de l’organisation des sites CTCF environnants et est alors hautement dépendante du contexte génomique414. Néanmoins, le fait que certaines boucles délimitent des frontières
de domaines alors que d’autres, localisées au sein des TADs, ne constituent pas des éléments barrières reste à élucider.