• Aucun résultat trouvé

Les variations des séquences non-codantes sont à l’origine de maladies

3. Les éléments cis-régulateurs au cœur des processus développementaux, évolutifs et des maladies

3.3 Les variations des séquences non-codantes sont à l’origine de maladies

Les variants génétiques non-codants sont divisés en mutations ponctuelles ou SNVs (Single-Nucleotide Variants), en petites insertions et délétions de moins de 50 pb (indels) et en grandes variations structurales comprenant : les variants du nombre de copies (CNVs pour Copy Number Variants) pour les délétions et duplications, ou les variants neutres de types inversions ou translocations. Les études d’associations pangénomiques (GWAS) interrogent divers variants génétiques au sein d’une cohorte d’individus pour évaluer le lien avec un trait particulier. Globalement, 95 % des SNVs identifiés par GWAS sont retrouvés dans des régions intergéniques, dont 75 % sont associés à des sites de sensibilité à l’ADNase I, suggérant un lien fort avec les séquences cis-régulatrices (Maurano et al. 2012). Ces séquences régulent le patron d’expression des gènes et des SNVs ou CNVs affectant ces séquences peuvent conduire à l’apparition de pathologies. Il est cependant souvent difficile de relier les variants non-codants à un gène. Des approches de cartographie quantitative d’expression des loci (eQTL) peuvent permettre une interprétation fonctionnelle de ces variations. Il est aussi possible de relier des séquences cis-régulatrices à un ou plusieurs gènes grâce aux techniques de capture de conformation de chromatine (3C et ses variantes) et d’identifier notamment les altérations de conformation lorsqu’une séquence est affectée. Les deux paragraphes suivants visent à illustrer l’impact des petites et grandes variations affectant les éléments cis-régulateurs dans la fixation des facteurs de transcription et la structure chromatinienne qui peuvent engendrer des maladies génétiques souvent complexes et des cancers.

3.3.1 Les petites variations génétiques modifient la fixation des TFs sur les éléments cis-régulateurs

L’analyse de plus en plus de génomes a permis d’identifier des mutations ponctuelles affectant les éléments cis-régulateurs qui sont susceptibles de modifier la fixation des TFs sur ces séquences et d’être reliées à l’expression inappropriée de certains gènes.

Les SNVs peuvent entraîner la formation d’une nouvelle séquence consensus pour un TF sur un élément cis-régulateur et la fixation ectopique du facteur (fig. 9A). C’est le cas pour le

Figure 9 : L’altération des éléments cis-régulateurs à l’origine de maladies

A. Les petites variations génétiques impactant les éléments cis-régulateurs : enhancers, promoteurs et insulateurs mo-diient la ixation des facteurs de transcription (TFs).

B. De grandes variations structurales au locus EphA4 entraînent plusieurs malformations des membres. Le TADa

comprend le gène EphA4 et un groupe d’enhancers régulant son expression dans le membre. L’interaction ectopique

des enhancers avec Pax3 dans le cas de la brachydactylie suite à une délétion, Wnt6 dans le syndrome F après une

inversion ou une duplication et Ihh dans la polydactylie suite à une duplication chez l’homme et une délétion chez la

souris. En rouge, les frontières des TADs empêchent ces interactions ectopiques et favorisent les interactions entre

le gène EphA4 et les enhancers pour l’expression correcte. Le patron d’expression des gènes associé aux variations

structurales est indiqué en rouge, alors que celui sauvage du gène EphA4 est en vert et le phénotype associé au niveau

des membres est représenté en dessous.

B

A

Promoteur Enhancer Insulateur Gène codant TF3 TF1 TF2 TF Exons Mutations de gain ou perte

de xation de TFs

Facteur de transcription Régions cis-régulatrices

promoteur du gène TERT où des mutations récurrentes ont été observées dans plusieurs types de cancers à l’origine de la création de motifs pour les facteurs ETS conduisant à la surexpression du gène (Huang et al. 2013; Horn et al. 2013). Dans certains cas de leucémie lymphoblastique aiguë à cellules T (T-ALL), des mutations somatiques dans une région non-codante créent un motif de fixation pour MYB formant ainsi un « super-enhancer » en amont du gène TAL1 (T cell Acute lymphocytic leukaemia 1). La fixation de MYB sur cette séquence entraîne la surexpression du gène TAL1 qui est un oncogène impliqué dans la différenciation des cellules érythroïdes, illustrant un gain de fixation d’un TF sur un enhancer. Dans le cas contraire, les SNVs abolissent parfois la fixation d’un TF indispensable à l’établissement correct du patron d’expression d’un gène. Une étude combinant du séquençage de génomes entiers et des données épigénomiques a identifié plusieurs mutations ponctuelles dans une région correspondant à l’enhancer du gène PITF1A (encoding pancreas-specific transcription factor 1a) qui abolissent la fixation de plusieurs facteurs de transcription importants pour le développement du pancréas et elles sont liées à des cas isolés d’agénésie du pancréas (Weedon et al. 2014). Une étude récente a identifié de fréquentes mutations ponctuelles dans les sites de fixation de CTCF co-occupés par la cohésine dans les cancers colorectaux (Katainen et al. 2015). Il est alors facile d’imaginer les implications de ces mutations sur l’expression des gènes adjacents en tenant compte du rôle du facteur CTCF et de la cohésine dans les frontières des TADs (cf. ci-après).

3.3.2 Les grandes variations structurales altèrent les domaines chromatiniens

L’organisation chromatinienne en TADs représente le squelette du génome qui facilite la reconnaissance des enhancers avec leur promoteur cible en les isolant en même temps des autres régions du génome grâce à leurs frontières enrichies en protéines de structure. Les variations structurales peuvent altérer l’architecture des TADs par délétion, inversion, duplication et repositionnement des frontières conduisant à l’activation ectopique des gènes par des enhancers des domaines voisins et causant une expression aberrante des gènes à l’origine des maladies.

Une étude élégante montre que de grandes variations structurales au locus EphA4 sont associées à plusieurs malformations des membres (Lupiáñez et al. 2015). Une délétion comprenant le gène EphA4 conduit à une brachydactylie (doigts courts) alors qu’une inversion ou une duplication d’une partie du TAD d’EphA4 entraîne un syndrome F (fusion des doigts). De plus, une duplication chez l’homme et une délétion chez la souris entre le gène

système CRISPR/Cas9, les auteurs ont reproduit ces variations chez la souris. Ils montrent alors qu’un groupe d’enhancers contrôlant l’expression d’EphA4 dans le membre régule Pax3 dans le cas de la brachydactylie, Wnt6 dans le syndrome F et Ihh dans la polydactylie à la place d’EphA4 (fig. 9B). Tous les phénotypes sont causés par une interaction ectopique entre le groupe d’enhancer et les autres gènes entraînant leur expression anormale et ce uniquement lorsqu’une frontière de TAD est affectée. Ces résultats confirment l’importance de l’intégrité du TAD et des frontières pour l’expression correcte des gènes. (fig. 9B). D’autres exemples de grandes variations structurales affectant les TADs ont été étudiés et associés au syndrome de Liebenberg (Spielmann et al. 2012; Seoighe et al. 2014), de Rett (Allou et al. 2012) et à des maladies congénitales (Ibn-Salem et al. 2014). La mise en évidence de la structure du génome en TADs met en lumière des études plus anciennes, notamment celle décrivant une inversion au locus SHH conduisant à l’expression ectopique du gène où les auteurs introduisent alors la notion ‘d’adoption d’enhancer’ (Lettice et al. 2011). D’autre part, une étude récente interroge la conformation du génome de cellules cancéreuses de prostate par Hi-C et montre que celui-ci comprend de plus petits TADs à cause de la formation de frontières supplémentaires. Ceci est notamment le cas pour une délétion au locus du suppresseur de tumeur TP53 qui conduit à la division d’un TAD en deux. Ces subdivisions sont accompagnées de modifications des interactions entre enhancers et promoteurs et liés à un changement d’expression des gènes (Taberlay et al. 2016).

Longtemps considérés comme une partie du ‘junk DNA’ du génome, les éléments cis-régulateurs sont maintenant au cœur d’une intense recherche. L’identification et le rôle fonctionnel de ces séquences sont un enjeu majeur dans la compréhension des thèmes abordés dans cette partie. La dernière partie retrace les connaissances actuelles sur la régulation du gène de développement Krox20 dans le cerveau postérieur des Vertébrés ainsi que les arguments qui ont conduit à la dissection fonctionnelle des éléments cis-régulateurs contrôlant son expression.