• Aucun résultat trouvé

Résumé et complémentarité des trois approches

Nous avons décrit dans ce chapitre le formalisme permettant de modéliser la chromatine par un copolymère par bloc linéaire, non homogène auto-évitant et dont les monomères ont chacun une couleur caractéristique de leur état épigénomique. Ce modèle a pour avantage de s’inscrire dans le cadre de la physique des polymères - qui permet de reproduire bon nombre de propriétés de la chromatine à grande échelle - tout en intégrant des interactions biologiques pertinentes. La particularité du modèle est en effet que les monomères de même état épigé-nomique interagissent préférentiellement. Nous avons présenté trois approches permettant la description de la dynamique de la conformation 3D d’une telle chaîne. La première ap-proche, la plus simple à mettre en oeuvre, consiste à réaliser une approximation « gaussienne auto-cohérente » permettant l’intégration numérique de l’équation de la dynamique portant sur les distances quadratiques moyennes entre monomères de la chaine. La seconde approche repose sur l’étude de la dynamique sur réseau par des simulations de Monte-Carlo cinétique et la dernière, celle avec le moins d’approximations, consiste en la réalisation de simulations de dynamique moléculaire. Nous résumons dans le tableau 4.3 les différences entre ces trois approches.

Les trois approches ont chacune leur limites, il est donc intéressant de les utiliser de ma-nière complémentaire. Avec l’approximation gaussienne auto-cohérente introduite initiale-ment dans Jost et al., 2014, on peut simuler une carte de contact à partir d’une séquence épigénomique assez rapidement et de façon raisonnable. En effet, même si on a étudié des petits bouts équilibrés dans le cadre de cette approche, on a intégré les effets d’autres chaînes et les effets de crumpling avec l’introduction d’un champ générique. Les résultats apportés avec cette approche peuvent être valider et détailler en utilisant les deux autres approches. Sur réseau, on a présenté l’étude de petits bouts équilibrés par simulations de Monte Carlo cinétique (méthode développé dans Olarte-Plata et al.,2016). On ne s’est donc pas intéressé aux effets dus au caractère hors équilibre. Toutefois, le formalisme n’empeche pas l’étude de crumpling en travaillant avec plusieurs segments plus grands. Pour les petits bouts que nous avons étudié, nous avons tenu compte de l’environnement, de la densité, avec des conditions aux bords périodiques.

Enfin, grâce aux simulations de dynamique moléculaire réalisées par Pascal Carrivain, on a pu s’intéresser à la dynamique de repliement du copolymère. Nous avons particulièrement appris que l’état stationnaire local était très vite atteint chez la drosophile (moins de 20 minutes à 200kb et environ 2h à 1Mb) ce qui est un point important car il permet de valider la première approche développée dans ce chapitre. Aussi, l’analyse statistique des simulations réalisées à l’échelle du génome comparées aux données expérimentales obtenues chez la drosophile

4.5. Résumé et complémentarité des trois approches Approximation gaussienne auto-cohérente Dynamique sur réseau Dynamique moléculaire Cadre d’application Molécule isolée de petite taille, de 1 à 5Mb D’une molécule isolée de 1Mb au génome entier D’une molécule isolée de 1Mb au génome entier Observables Propriétés d’ensemble de la chaîne Trajectoires individuelles de chaque monomère Trajectoires individuelles de chaque monomère Connectivité Interactions de type

ressort

Contrainte d’être plus proches voisins

sur le réseau

Capsules jointes ponctuellement avec un angle relatif libre Volume exclu Potentiel de type

Lennard-Jones tronqué ou gaussien

Site occupé par au plus deux monomères

Potentiel de Morse tronqué Confinement Potentiel gaussien Boite cubique avec

conditions aux bords périodiques Sphère avec collisions sur la surface Interactions entre monomère de même état épigénomique

Potentiel gaussien Énergie de contact limitée aux plus

proches voisins Superposition de potentiels gaussiens Dynamique Équation de Langevin auto-cohérente Monte Carlo cinétique Équation de Langevin Temps de calcul Typiquement 10s

pour 1Mb, 100s pour 5Mb 10−8 cpumin/min/pb 4× 10−8 cpumin/min/pb Défauts principaux

Approximations Coût en temps de

calcul. Coût en temps de calcul. Sensible à la condition initiale Avantages principaux Facile à mettre en oeuvre Compromis entre dynamique et approximation Fidélité à la réalité

Table 4.3 – Résumé des différences entre les trois types d’approche permettant la modéli-sation de la chromatine par un copolymère par bloc.

montre de fortes corrélations.

Tous les résultats obtenus avec ces trois approches sont donc qualitativement identiques. Ces résultats mis bout-à bout prouvent que le repliement 3D de l’épigénome peut expliquer le repliement 3D adopté par la chromatine.

Dans le chapitre suivant nous allons nous concentrer sur l’approche gaussienne auto-cohérente. Le but du modèle étant d’être prédictif, nous allons chercher à en inférer les paramètres.

CHAPITRE 5

INFÉRENCE DES POTENTIELS

D’INTERACTION ENTRE MONOMÈRES À

PARTIR DE CARTES HI-C

À partir du modèle de copolymère par bloc et de l’approximation gaussienne auto-cohérente décrits dans le chapitre précédent, il est possible de simuler des cartes Hi-C dépendant des paramètres d’interaction entre monomères et donc possible d’élaborer un diagramme de phase du copolymère (Fig. 4.2.32). Dans ce chapitre, on se propose de développer des méthodes permettant l’inférence des paramètres d’interaction d’un modèle copolymère afin d’obtenir un accord quantitatif avec les données expérimentales. Nous allons commencer par décrire la manière la plus naturelle permettant d’obtenir la matrices des interactions, elle consiste en une inversion des équations mathématiques du modèle décrit dans le chapitre 4 et a donc pour avantage de ne nécessiter aucune simulation. Nous verrons qu’en revanche cette méthode est fortement sensible au bruit rendant impossible l’inférence, et ce, malgré la diminution du conditionnement du problème en travaillant à l’échelle des TADs plutôt qu’à l’échelle des monomères. Nous verrons alors trois autres méthodes visant à calculer itérativement les coefficients de la matrice d’interaction en égalant les nombres de contact prédits et simulés, elles seront respectivement basées sur une résolution faisant appel à des courbes d’étalonnage, une dichotomie et enfin une inversion de Boltzmann itérative.

5.1 Motivation

Afin de modéliser le repliement de la chromatine, nous avons développé dans le chapitre 4 un modèle de copolymère par bloc dont la dynamique est résolue via une approximation gaussienne auto-cohérente. On choisi dans ce chapitre de modéliser la chromatine avec l’ha-miltonien H2B(Éq.4.37) car parmi les quatre hamiltoniens présentés dans lechapitre 4, H2B

est celui qui reproduit le mieux la loi Pc ∼ s−1 (observée expérimentalement dans le cas des longs polymères équilibrés) tout en ayant des paramètres d’interaction d’ordre de grandeur raisonnable. Cet hamiltonien contient un terme d’interaction type ressort représentant la connectivité de la chaîne, un terme de volume exclu modélisé par un potentiel gaussien, un terme générique reproduisant de façon simple les effets de l’environnement et de crumpling et un terme d’interactions entre monomères (ces interactions peuvent être spécifiques entre les monomères de même état épigénomique ou non spécifiques). Les paramètres des deux pre-miers termes sont fixés par le modèle. Les paramètres des deux derniers termes dépendent, en revanche, de la région chromosomique que l’on souhaite étudiée.

Après avoir présenté le formalisme lié à ce problème direct, nous avons pu élaborer des dia-grammes de phase qui décrivent comment les paramètres associés à l’hamiltonien du système se traduisent en terme de carte de contact. En particulier, nous avons montré que ce cadre associé à certains jeux de paramètres permettent de produire des cartes de contact qui res-semblent fortement aux cartes expérimentales (Fig. 4.2.34).

Ainsi, maintenant, afin d’être prédictif, nous allons chercher à résoudre le problème inverse, c’est-à-dire que nous allons chercher à inférer les paramètres du modèle qui reproduisent le mieux les cartes de contact obtenues expérimentalement, justement à partir de ces dernières. Cette résolution peut se faire de manière analytique ou avec des simulations numériques. Nous commencerons avec la méthode analytique qui a pour avantage d’être plus directe mais nous verrons que comme nous avons à faire un problème mal posé au sens mathématique du terme, la résolution mathématique est rendue difficile. Afin de simplifier le problème d’origine, on cherchera à inferer les potentiels entre TADs plutôt que les potentiels entre monomères. Ce changement d’échelle ne suffira pas à transformer notre problème en un problème bien posé donc nous verrons deux autres méthodes d’inférence locale basées respectivement sur l’utilisation de courbes d’étalonnage et sur une résolution d’équation par dichotomie. Ces deux dernières méthodes ont pour point commun de nécessiter des simulations et de reposer sur l’égalisation locale des nombres de contacts expérimentaux et prédits. Enfin on présentera une inversion de Boltzmann itérative.