• Aucun résultat trouvé

Nombre de contacts total cumulé en fonction de la distance génomique 48

2.4 Conclusion

3.1.3 Nombre de contacts total cumulé en fonction de la distance génomique 48

Dans cette sous section on cherche à savoir à quelle échelle de distance génomique se font la majorité des contacts mesurés avec la technique de Hi-C. On présente sur la figure 3.1.3 le nombre de contacts entre loci total cumulé en fonction de la distance génomique. On peut voir que plus de 50% des contacts intra-chromosomiques (courbe en bleu) sont détectés pour des distances génomiques inférieures à 1Mb. La figure nous renseigne aussi sur les contacts inter chromosomiques (en rouge) : on constate qu’ils représentent environ 1/3 des contacts totaux. Ceci implique que, pendant l’interphase, malgré l’existence de territoires chromosomiques

[Cremer and Cremer,2010] il existe une interpénétration entre chromosomes non négligeable.

3.1. Analyse statistique de données HiC

Figure 3.1.2 – Segmentations prédites en fonction du schéma de normalisation. (A) Taux de vrai positif, TPR, en fonction du taux de fausse découverte, FDR, pour les domaines (symboles carrés) et pour les frontières (astérisques) des segmentations obtenues à partir de schémas de normalisation différents indiqués sur la figure. (B) Distribution des tailles des domaines prédits par IC-Finder à partir de cartes de contact normalisées différemment. Le nombre total de domaine obtenue avec chaque méthode de normalisation est indiqué en légende. (C) Exemples de segmentations prédites avec IC-Finder pour une région génomique du chromosome 3L de drosophile [Sexton et al., 2012]. En haut : carte Hi-C avec en lignes blanches les frontières prédites avec IC-Finder. En bas : Probabilité pd que deux loci soient prédits comme appartenant au même TAD. Pour obtenir ces résultats IC-Finder est lancé avec les paramètres σ et σ+ par défaut.

contacts doit on s’attendre dans un cas idéal. Pour répondre à cette question, on considère un modèle théorique simple consistant à modéliser les 10 chaînes chromosomiques présentes dans le noyau cellulaire de la drosophile par des polymères purement gaussien (c’est-à-dire avec des interactions de connectivité seulement). Les 10 chaînes dont on parle sont les 2 paires des bras suivants : 2L (23Mb), 3L (25Mb)), 2R (21Mb)), 3R (28Mb)), ainsi que le chromosome X (22Mb) éventuellement en double dans le noyau ou bien accompagné du chromosome Y (40Mb). Le chromosome 4 de taille 1.4Mb est négligé. On cherche à calculer, dans ce cadre, le nombre total de contact entre bins de 10kb, Ntotal= Nintra+ Ninter avec Nintra (resp.

Ninter) le nombre de contacts intra (resp. inter) chromosomique.

Dans la partie4.2.1, on présentera les distributions gaussiennes multivariées et on montrera en particulier que la probabilité de contact entre deux monomères i et j, Pij, peut être approchée par la relation Pij ≈ a3q 2

Dij3/2 (Éq. 4.10), avec a ≈ 100nm le rayon d’interaction pour des bins de 10kb et avec Dij la distance quadratique moyenne entre bin. On suppose ici que : Dij ≈ (s× b)2, avec s la distance génomique entre les bins et avec b la taille typique d’un bin de 10kb. Ceci permet d’estimer le nombre total de contact intra chromosomique :

Nintra ≈ #c× N−1 X s=1 r 2 9π ×ab3× s3/2 × (N − s) (3.2)

avec #c = 10 le nombre total de chaînes dans le noyau de drosophile et N = 2500 le nombre moyen de bin de 10kb dans une chaîne. On estime, en première approximation, que b = a = 100nm

Concernant le terme Ninter, on peut supposer que le mélange est parfait. Ainsi, deux bins i et j sur des chaînes différentes sont en contact s’ils se trouvent dans une même sphère d’interaction de volume 4

3πa3

0. D’où l’estimation de Ninter :

Ninter≈ 4 3πa3 0 4 3πR3  N2#c (#c − 1) 2

avec R = 2µm le rayon du noyau cellulaire de drosophile et avec le facteur #c(#c−1)

2

repré-sentant le nombre de paires de chaînes.

L’application numérique donne Nintra = 1.3 × 104 et Ninter = 2.2 × 104 ce qui signifie que les contacts inter chromosomiques représentent 62% des contacts totaux alors que nous avons trouvé 33% à partir des données expérimentales. Ce calcul suggère que, dans le noyau cellulaire, les chromosomes ne sont pas très mélangés. Notons qu’il a été montré qu’un mo-dèle polymèrique tenant compte de contraintes topologiques telles que les interactions avec la membrane permet de reproduire l’existence des territoires chromosomiques [Rosa and

3.1. Analyse statistique de données HiC 0 1 5 10 15 20 25 s (Mb) 0 2 4 6 8 10 12 14 16 18

Nombre total de contact cumulé

×107

Contacts

inter

chromosomiques

Figure3.1.3 – nombre de contacts entre loci total cumulé en fonction de la distance génomique, s, en Mb. La courbe en bleu concerne les contacts intra chromosomiques alors que le palier en rouge indique le nombre toal de contact inter chromosomique sur l’ensemble du génome cartographiable de la drosophile [Sexton et al.,2012].

De la même manière qu’on a calculé Nintra (Éq.3.2), on peut calculer le nombre de contacts cumulé à n’importe quelle échelle (il suffit de sommer jusqu’à l’échelle choisie plutôt que jusqu’à N − 1). Si on somme les contacts jusqu’à 20kb, soit deux bins, on trouve 7.2 × 103

contacts. La moitié des contacts intra chromosomiques se produit donc entre très proches voisins. Dans le cas expérimental, on a vu qu’environ 50% des contacts concernaient des bins espacés de distances génomiques allant jusqu’à 1Mb. Ceci suggère que le confinement dans le noyau cellulaire de drosophile est si fort qu’il conduit à avoir beaucoup plus d’interactions entre loci génomiquement éloignés.

3.1.4 Nombre de contacts moyen en fonction de la distance

génomique

Dans cette partie, on présente le nombre de contacts moyen, Nc, en fonction de la distance génomique, s, calculé dans les cas de la drosophile (chromosome 3R) et de l’homme (chro-mosome 2) [Sexton et al., 2012; Rao et al., 2014]. On observe sur la figure 3.1.4 en échelle log que pour les deux organismes différents régimes se succèdent (4 pour la drosophile et 3 pour l’homme).

Dans le cas de la drosophile, avant 50kb, Nc décroît très peu ce qui est probablement dû à l’existence d’interactions à courte portée mais aussi dû à la ligation opérée par le formaldéhyde ce qui rapproche artificiellement les monomères les uns des autres. Ensuite, jusqu’à 1Mb, la loi d’échelle est Nc ∼ s−1ce qui peut entre autre être dû à un effet de crumpling ou encore à la coexistence de plusieurs états multistables (pelote ou globule) au voisinage du point θ. Entre 1Mb et 5Mb, la décroissance du nombre de contacts moyen est plus lente, Nc ∼ s−0.6 ce qui est probablement la conséquence d’un confinement hors équilibre des chromosomes dans leur territoire chromosomique. Enfin, au delà de 5Mb, on observe de nouveau une décroissance selon Nc ∼ s−1. Cette loi est sûrement le fruit d’un confinement longitudinal dû à un effet de mémoire de l’état initial caractérisé par une configuration en Rabl.

Pour l’homme, au cours du premier régime, jusqu’à 0.8Mb environ, la loi d’échelle est Nc ∼ s−0.8 ce qui est cohérent avec un modèle d’extrusion [Sanborn et al., 2015; Fudenberg et al.,

2016]. Ensuite, jusqu’à 8Mb environ, la décroissance est plus forte, Nc ∼ s−1.3, ce qui peut être interprété par l’effet de crumpling. Enfin, au delà de 8Mb, la loi est Nc ∼ s−0.6 ce qui est imputable à un fort confinement des chromosomes dans leur territoire chromosomique. On peut noter que les territoires chromosomiques sont plutôt cylindriques chez la drosophile alors qu’ils sont sphériques chez l’homme [Cremer and Cremer,2010]. Ceci peut expliquer la différence de pente entre les derniers régimes de chaque organisme. Toutefois, pour s’assurer de cette explication, il aurait fallu tracer sur la figure 3.1.4 l’observable Nc jusqu’à la fin du chromosome, soit 243Mb, ce qui n’a pas été possible en raison d’un manque de données. Enfin, on peut ajouter qu’il existe une différence de comportement entre les deux organismes à très petite échelle. Cette différence n’est pas évidente à interpréter, elle peut avoir pour origine la différence de protocole expérimental qui induit des artefacts plus ou moins important via le formaldéhyde .