• Aucun résultat trouvé

Corrélation à l’échelle des compartiments d’interaction (TADs et hié-

3.3 Corrélations entre compartimentation 3D et compartimentation 1D

3.3.3 Corrélation à l’échelle des compartiments d’interaction (TADs et hié-

Précédemment on a étudié les corrélations entre épigénome et contacts génomiques à l’échelle des monomères, dans cette sous section, on étudie comment l’information épigénomique est associée à la compartimentation 3D (TADs et compartiments de hiérarchie supérieure). Pour des embryons tardifs de drosophile et pour la lignée cellulaire humaine GM12878, on récupère les cartes Hi-C de chaque chromosome respectivement dans [Sexton et al.,2012] et dans [Rao

et al.,2014]. On applique IC-Finder à ces cartes de contact avec l’option de ré-échantillonnage

dans un premier temps avec les paramètres par défaut et dans un second temps avec σ0 = 5 ce qui permet d’accéder à une hiérarchie de compartimentation supérieure (Fig. 2.3.5). On se demande, ici, si, pour les deux organismes étudiés, les caractéristiques du repliement de la chromatine obtenues avec IC-Finder corrèlent avec l’information épigénomique donnée par

[Ho et al., 2014] (Fig. 3.3.2). Dans notre analyse, on ne considère pas les régions

centromé-riques et pericentromecentromé-riques principalement composées d’hétérochromatine constitutive et nulle.

Pour chaque paire d’états épigénomiques (µ, ν), on estime l’enrichissement en colocalisation intra-TAD Cµν caractérisant si un locus d’état µ est susceptible de partager le même

com-3.3. Corrélations entre compartimentation 3D et compartimentation 1D

partiment d’interaction avec un autre locus d’état ν. On détaille ci-dessous la définition de la matrice Cµν :

Pour un locus donné i, on définit Sµ

i la proportion de l’état épigénomique µ dans le locus (0 6 Sµ

i 6 1). Pour une paire d’états épigénomiques (µ, ν), l’enrichissement en colocalisation intra-compartiment Cµν est défini par l’équation 3.5 :

Cµν = 1 Nintra µν P i6=jSµiSν jpd(i, j) P i6=jpd(i, j) (3.5) avec Nµν = P i6=jSµiSνj P i6=j1

avec pd(i, j) la probabilité que i et j soient prédits comme appartenant au même compar-timent d’interaction. La matrice Cµν représente la valeur moyenne de Sµ

iSνj pour les loci colocalisant dans le même compartiment normalisée par la valeur correspondante le long du génome Nµν. Une valeur Cµν > 1 (resp. Cµν < 1) indique que les associations, dans un même compartiment d’interaction, de loci d’états épigénomiques µ et ν sont enrichies (resp. appauvries).

On calcule donc les matrices Cµν avec les 16 états épigénomiques données dans [Ho et al.,

2014] et avec les probabilités de colocalisation dans un même TAD donnés par IC-Finder (Fig.3.3.5A,D). Un regroupement hiérarchique standard (avec distance de corrélation et me-sure de similarité entre classes moyenne) montre que des groupes d’états se forment et que les interactions dans les TADs entre ces différents groupes sont appauvris (Fig. 3.3.5B,E gauche). Cela suggère fortement que la composition épigénomique des TADs est relative-ment homogène dans de tels groupes. Pour la drosophile, nous avons trouvé 6 familles épi-génomiques : un groupe actif comprenant les promoteurs et les états de transcription, un groupe d’enhancers, un groupe actif riche en introns (états « transcription 5’ 2 » et « gene, H4K20me1 »), un groupe polycomb, un groupe nul (peu de signal) et un groupe d’hétéro-chromatine. Pour l’homme, quatre familles seulement sont ressorties de notre analyse : un groupe actif, un groupe d’enhancers, un groupe polycomb et un groupe d’hétérochromatine et de signal faible. Ces familles sont donc très similaires entre les deux espèces avec toutefois des exceptions soulignant les spécificités de régulation épigénomique propre à chaque espèce. Par exemple, H4K20me1 est présent dans les introns de longs gènes actifs de drosophile alors qu’il est associé à des gènes réprimés par polycomb chez l’homme [Ho et al.,2014].

Pour chaque locus d’une famille épigénomique donnée (six familles dans le cas de la drosophile et quatre pour l’homme), on calcule la distance relative à la frontière du compartiment la plus proche : une distance relative nulle signifie donc que le locus se situe au niveau d’une frontière alors qu’une distance relative de 0.5 signifie que le locus se trouve au centre d’un

compartiment d’interaction. Les figures 3.3.5C,F à gauche montrent la distribution cumulée de ces distances pour chacune des familles. En général, on observe que les familles actives sont enrichies au niveau des frontières alors que les familles inactives sont plus enrichies au coeur des TADs. Avec tout de même une notable exception chez la drosophile pour qui on voit que la famille hétérochromatine est enrichie aux frontières, ce qui illustre la partition de l’hétérochromatine constitutive en petits domaines (Fig. 3.3.6) pour cet organisme (à l’exception des régions centromériques et péricentromériques que nous ne considérons pas dans notre étude) [Sexton et al., 2012]. On observe que la corrélation entre épigénome et position des TADs (enrichissement ou appauvrissement aux frontières) est plus prononcée chez la drosophile.

Afin d’examiner si l’organisation du génome à plus haute échelle que les TADs est aussi corré-lée à l’épigénome, on calcule de nouveau l’enrichissement en colocalisation intra-compartiment Cµνet la distribution des distances relatives à la frontière la plus proche pour les six et quatre familles épigénomiques mais cette fois avec des compartiments d’une hiérarchie supérieure à celle des TADs (on ne lance plus IC-Finder avec les paramètres par défaut mais avec σ0 = 5). On peut voir sur les figures 3.3.5B,E à droite (et aussi figure2.3.5B,D pour une illustration) une perte nette de colocalisation pour les familles actives chez la drosophile alors que les autre familles sont toujours auto-enrichies dans les compartiments. De manière assez sur-prenante, excepté la famille hétérochromatine qui reste isolée dans de petits compartiments d’interaction, les autres familles sont maintenant pauvrement isolées les unes des autres par des compartiments d’interaction (Cµν≈ 1). Cette observation suggère qu’à ce degré d’orga-nisation, les petits domaines actifs ont été fusionnés avec des plus grands inactifs, résultant en des compartiments moins bien épigénomiquement définis (Fig.2.3.5B dans le chapitre pré-cédent). Toutefois, les frontières de tels compartiments restent enrichis en marques actives. Chez l’homme, à ce niveau d’organisation, les familles restent partiellement auto-colocalisées et isolées, alors que les frontières sont seulement faiblement enrichies en familles actives. Il est intéressant de noter que l’enrichissement en colocalisation intra-TAD diminue légèrement pour les familles inactives, alors qu’il augmente (légèrement aussi) pour les familles actives, ceci suggère qu’à ce niveau de hiérarchie, les compartiments d’interaction sont mieux associés avec la chromatine active (Fig. 2.3.5D).

3.4 Conclusion

Nous avons vu dans ce chapitre que les données Hi-C combinées aux données épigénomiques (malgré leurs incertitudes) suggèrent chez la drosophile et chez l’homme que les loci de même état épigénomique interagissent spécifiquement entre eux. Dans le chapitre suivant

3.4. Conclusion

intra-TAD colocalization enrichment (log2-scale)

Active Enhancer Intron-rich Null Polycomb Heterochromatin

A B

C

D E

F

h

u

m

a

n

d

ro

s

o

p

h

il

a

Active Enhancer Intron-rich Null Polycomb Heterochromatin Average Active Enhancer Polycomb Heterochromatin Average

Figure 3.3.5 – Couplage entre compartimentation 3D et information épigéno-mique. (A,D) Enrichissement en colocalisation intra-TAD des 16 états épigénomiques, Cµν, pour la drosophile (A) et pour l’homme (D). Au dessus, de chaque matrice se trouve un dendrogramme groupant hiérarchiquement les différentes colonnes (c’est-à-dire les différents états), on retient 6 familles pour la drosophile et 4 pour l’homme. (B,E) Matrices Cµν cal-culées par famille épigénomique plutôt que par état, à l’échelle des TADs à gauche et à une échelle plus grande à droite (compartiments obtenues avec σ0 = 5 dans IC-Finder). (C,F) Distribution cumulée des distances relatives à la frontière la plus proche pour chaque famille. Les courbes noires représentent le comportement moyen.

100 101 102 0 0.2 0.4 0.6 0.8 1

size of domain (10kbp)

C

D

F

Active Enhancer Intron-rich Null Polycomb Heterochromatin Average

Figure 3.3.6 – Fonction de distribution cumulée (CDF) de la taille des domaines pour des loci appartenant à une famille épigénomique donnée, dans le cas de la drosophile. La courbe noire représenter la CDF moyenne.

on se demandera si l’existence d’interactions pilotées par l’épigénome permet d’expliquer l’organisation 3D de la chromatine.

CHAPITRE 4

MODÉLISATION DE LA CHROMATINE

PAR UN COPOLYMÈRE PAR BLOC

Nous avons décrit dans les chapitres précédents l’existence d’une corrélation entre domaines topologiques (ou TADs) et domaines épigénomiques. Nous avons vu qu’un locus dans un cer-tain état épigénomique colocalisera majoritairement avec des loci de même état au sein d’un TAD. Ainsi, dans ce chapitre, on s’intéresse à la modélisation de la structure tridimension-nelle de la chromatine sous l’hypothèse que la séquence épigénomique joue un rôle majeur dans l’organisation 3D de la chromatine. On commence par présenter succintement quelques propriétés des hétéropolymères justifiant l’idée de modéliser la chromatine par un copolymère par bloc dont les propriétés dépendent de l’état épigénomique de chacun des monomères. On détaille alors le formalisme et les équations correspondantes, décrivant la dynamique de la chromatine. Enfin, on présente trois approches permettant la résolution ou la simulation de ces équations dans le but d’être prédictif. La première consiste à réaliser une approximation « gaussienne auto-cohérente » permettant l’étude rapide et fiable de petits segments chro-mosomiques isolées. Les deux approches suivantes relèvent de la dynamique sur réseau avec simulations de Monte-Carlo cinétique et de la dynamique moléculaire. Ces deux dernières approches vont permettre de valider la première en précisant son cadre d’application.

4.1 Introduction