CHAPITRE 5 : Discussion 151
5.1 L’analyse de l’architecture tridimensionnelle du génome permet de mieux comprendre
transcriptionnelle
Le syndrome de Cornelia de Lange est une pathologie du développement, causée par des mutations de sous-unités ou de régulateurs du complexe cohésine, caractérisée par une dérégulation modeste mais globale de l’expression des gènes, que ce soit chez les patients atteints du syndrome466,582 ou dans des modèles animaux de la pathologie518,583–
585. En particulier, il a été montré que les mutations de NIPBL associées au CdLS mènent
à une réduction de la liaison du complexe cohésine582,587 et que celles de SMC1A augmentent l’affinité du complexe cohésine avec l’ADN580. Par ailleurs, les patients ayant
des mutations dans NIPBL et SMC1A partagent des caractéristiques phénotypiques, mais diffèrent par la sévérité de leurs symptômes, les mutations de NIPBL affectant plus sévèrement les patients491. L’ensemble de ces observations suggère que les mutations de
ces facteurs affectent des étapes du développement communes, mais que les mécanismes moléculaires pourraient être quelque peu différents.
Dans le Chapitre 2 de cette thèse, nous présentons des travaux décrivant que la majorité des gènes dérégulés dans le CdLS ne sont pas directement liés par NIPBL et SMC1A dans des cellules normales, mais qu’ils sont organisés dans des communautés de gènes centrées sur l’ARN Pol II où ils interagissent avec des régions liant ces facteurs par des
contacts chromosomiques. Nous montrons également que bien que très peu de gènes dérégulés soient partagés dans les cellules ayant des mutations de SMC1A ou NIPBL, un grand nombre de communautés contenant des gènes différentiellement exprimés sont communes aux deux mutations. Or, il a été montré que les communautés de gènes organisent des gènes impliqués dans la même fonction ou dans des fonctions complémentaires et il a été proposé que cela permet de coordonner la réponse à des stimuli externes545. De plus, il a été décrit que les interactions chromosomiques associées
à l’ARN Pol II sont en partie tissu-spécifiques365,543,621. Par ailleurs, il est important de noter
que l’architecture chromosomique est réorganisée au cours de la différenciation351. Ainsi,
nous proposons que les communautés de gènes constituent un type d’organisation fonctionnelle des gènes conservé tout au long de la différentiation, mais regroupant différents gènes en fonction du type cellulaire. Dans le contexte du CdLS, l’organisation des communautés de gènes, qui est en partie régulée par NIPBL et le complexe cohésine, pourrait être affectée menant ainsi à une réponse inadéquate à des signaux développementaux, expliquant les caractéristiques phénotypiques partagées entre les patients ayant des mutations de NIPBL ou SMC1A.
Toutefois, les conséquences des mutations de NIPBL et SMC1A sur la liaison du complexe cohésine étant distinctes580,582,587,597, la façon dont l’architecture des communautés serait affectée pourrait être différente. En effet, les mutations haploinsuffisantes de NIPBL mènent à une réduction des niveaux de cohésine sur la chromatine582,587 alors que ce n’est pas le cas pour les mutations de SMC1A. Par ailleurs,
une étude récente propose que NIPBL charge le complexe cohésine au niveau des promoteurs des gènes actifs, à partir desquels il est transloqué par l’action de l’ARN Pol II433 par la suite. Ainsi, puisque les mutations de SMC1A associées au CdLS mènent à une
augmentation de l’affinité de la cohésine pour l’ADN580, cela pourrait affecter la capacité de translocation du complexe le long de la chromatine et pourrait mener à une accumulation au niveau des TSS des gènes. En accord avec cela, il a été montré que les niveaux du complexe cohésine étaient significativement enrichis aux promoteurs de gènes dont l’expression est affectée dans des cellules dérivées de patients ayant des mutations pour SMC1A597. En considérant l’ensemble de ces observations, nous proposons que les
mutations de NIPBL et SMC1A pourraient déstabiliser ou stabiliser l’architecture de communautés des gènes et ultimement mener à des défauts de réponse à des signaux environnementaux. Autrement dit, au cours du développement, les gènes répondant à un stimulus environnemental donné seraient en contact et corégulés au sein de
communautés de gènes. Dans le cas de mutations de NIPBL ou de SMC1A, des interactions au sein de ces structures seraient déstabilisées ou stabilisées, menant à une expression inadéquate de certains gènes au sein d’une communauté. En accord avec cela, il a été montré que l’expression des gènes d’une même communauté est différentiellement affectée en fonction du contact chromosomique qui est aboli546. De
manière similaire, les gènes d’une communauté donnée pourraient alors être différentiellement affectés en fonction du facteur muté puisque les mutations de NIPBL et SMC1A ont des effets différents sur le complexe cohésine et affecte donc potentiellement différemment certains contacts au sein d’une communauté. L’organisation des interactions chromatiniennes dans des cellules de patients atteints du CdLS n’étant pas encore disponible, il serait très intéressant de les générer. De plus, une autre façon de tester nos hypothèses serait d’intégrer des données d’expression d’autres types cellulaires dérivés de patients atteints du CdLS à l’architecture chromosomique des mêmes cellules. Enfin, il serait intéressant d’analyser comment CTCF s’intègre à l’architecture des communautés de gènes. En effet, CTCF a été retrouvé dans une analyse protéomique des usines transcriptionnelles de l’ARN Pol II541 et des mutations de CTCF ont également été liées à
un trouble développemental caractérisé par un handicap mental ainsi qu’un retard de croissance558,559, des phénotypes partagés avec le CdLS.
Dans le contexte de l’étude présentée dans le Chapitre 2, l’intégration de l’architecture chromosomique apporte une information essentielle pour tenter d’expliquer les changements d’expression observés dans le CdLS. En accord avec un lien entre l’organisation spatiale du génome et les défauts d’expression associés à cette pathologie, une étude récente a montré une diminution des interactions promoteur-enhancer, associée à une réduction de la liaison du complexe cohésine, au niveau des gènes sous- exprimés dans des MEFs de souris Nipbl +/-587. Comme mentionné dans la partie 1.3.3.3 de cette thèse, la perturbation de l’architecture chromosomique a été associée avec le développement de cancers et de malformations congénitales. En particulier, l’annotation des frontières de TADs a permis de comprendre comment la variation structurale du génome humain provoque des phénotypes pathogéniques556. De plus, une étude récente
analysant le "connectome" des enhancers dans des cellules primaires humaines a permis d’identifier des gènes cibles d’éléments génomiques non codants associés à des pathologies683. Ainsi, l’étude de l’architecture tri-dimensionnelle du génome a une
importance indéniable dans l’amélioration de la compréhension des mécanismes physiologiques et pathologiques impliqués dans la régulation de la transcription et cela va
surement pousser le domaine de recherche à systématiquement interroger ce type de régulation dans l’avenir. Des consortiums comme ENCODE605 et FANTOM5684 ont déjà
grandement contribué à cartographier et à caractériser les régions régulatrices non codantes du génome. Toutefois, avec la mise au point de techniques d’étude de la conformation des chromosomes de plus en plus abordables, reproductibles et de meilleure résolution, la prochaine aire des approches "omiques" sera surement celle de la "connectomique", comme en atteste le nouveau projet 4D nucleome685.