SREBP, un facteur de transcription contrôlant l'expression des gènes du métabolisme du cholestérol et des acides gras
II. Structure et activité transcriptionnelle des facteurs SREBP
1. Structure protéique de SREBP
SREBP a été purifiée en 1993 à partir d'extraits nucléaires de cellules humaines HeLa pour sa capacité à se lier spécifiquement sur une séquence d'ADN de 10 pb correspondant à un élément de réponse au cholestérol appelé SRE (Sterol Regulatory Element) (Briggs et al., 1993; Wang et al., 1993). Environ 1500 litres de cellules HeLa ont été nécessaires pour obtenir 6 !g de protéine SREBP purifiée afin de permettre son micro-séquençage (Yokoyama et al., 1993). Trois isoformes SREBP appelées SREBP-1a, -1c et -2 ont été identifiées par criblage d'une banque d'ADNc de cellules HeLa (Hua et al., 1993; Yokoyama et al., 1993). Le facteur de transcription ADD1 (Adipocyte Determination and Differentiation-dependent factor 1) est l'homologue chez le rat de l'isoforme SREBP-1c. ADD1 a été cloné simultanément et indépendamment de SREBP-1c par l'équipe de Bruce Spiegelman pour son rôle dans la différenciation adipocytaire (Tontonoz et al., 1993).
1 331 480 1141 séquences
trans-membranaires
Domaine régulateur COOH-terminal Domaine régulateur COOH-terminal Domaine régulateur COOH-terminal Pro Ser Pro Ser Ser Gly Pro Gln Acide Acide 49 % 33 % 71% 1 1 1c 1a 2 1123 bHLH-LZ COOH COOH COOH NH2 NH2 NH2
Figure 16: Représentation schématique des domaines structuraux des protéines SREBP- 1a, -1c et -2 humaines.
La séquence protéique des isoformes SREBP-1a et -1c sont identiques, excepté le domaine acide NH2-terminal qui contient 24 acides aminés dans SREBP-1c versus 42 acides aminés dans SREBP-1a et les 113 acides aminés de l’extrémité COOH-terminale. Le pourcentage d’identité entre différents domaines des isoformes SREBP est indiqué. Une séquence d’adressage nucléaire NLS (Nuclear Localization Signal) est présente au niveau du domaine HLH-LZ. Abréviations: bHLH-LZ, domaine basic helix-loop-helix-leucine zipper (D’après Brown & Goldstein, 1997a).
bHLH
Rég.
Cytoplasme Lumière du RE
Membrane du RE
Figure 17: Représentation schématique de la structure membranaire de la forme précurseur de SREBP.
Abréviations: bHLH, domaine basic helix-loop-helix-leucine zipper; Rég., domaine régulateur; RE, réticulum endoplasmique.
boucle hydrophile intra-RE (31 aa)
Acide
Ces facteurs de transcription SREBP ont la particularité d'être synthétisés sous la forme d'un précurseur d'environ 1150 acides aminés (125 kda) fixés dans les membranes du réticulum endoplasmique (RE) et du noyau cellulaire. Ce précurseur SREBP est composé par les trois domaines suivants (figure 16):
1/ L'extrémité NH2-terminale d'environ 480 aa correspond à un domaine de
facteur transcription de la famille bHLH-LZ (basic domain-Helix-Loop-Helix- Leucine Zipper)
2/ Une région d'environ 80 aa contenant deux segments transmembranaires hydrophobes de 22 aa séparés par 31 aa projetés dans la lumière du RE.
3/ Une région COOH-terminale d'environ 590 aa correspondant à un domaine de régulation.
Le précurseur SREBP est ancré dans les membranes du RE et dans l'enveloppe nucléaire sous la forme d'une épingle à cheveux avec les segments NH2-terminal et COOH-terminal du côté cytoplasmique et la boucle hydrophile
de 31 aa espaçant les deux segments transmembranaires est projetée à l'intérieur ces deux organites (Brown & Goldstein, 1997a; Hua et al., 1995b) (figure 17). Lorsque le contenu cellulaire en cholestérol est réduit, le domaine NH2-terminal
transcriptionnellement actif de SREBP est libéré des membranes par clivages protéolytiques. Ce fragment NH2-terminal appelé forme mature de SREBP (68
kda) est transloqué dans le noyau pour activer la transcription des gènes impliqués dans le métabolisme du cholestérol et des acides gras (Brown & Goldstein, 1997a).
2. Les gènes SREBP
Les isoformes SREBP-1a et -1c sont produites à partir d'un seul et même gène par l'utilisation de deux promoteurs alternatifs permettant la transcription de deux premiers exons alternatifs, alors que les exons suivants sont communs aux isoformes SREBP-1a et -1c. Chez l'homme, les ARNm SREBP-1a et -1c peuvent subir également un épissage alternatif des exons 18 et 19 au niveau de leur extrémité 3' pour former des isoformes qui diffèrent par leurs 113 derniers acides aminés (figure 18). Chez l'homme, le gène SREBP-1 est localisé sur le chromosome 17 (17p11.2) (Hua et al., 1995a).
Le gène codant pour l'isoforme SREBP-2 est localisé sur le chromosome 22 chez l'homme (22q13) et est composé de 19 exons et 18 introns (Hua et al., 1995a; Miserez et al., 1997). Le gène SREBP-2 est long de 72 kb alors que le gène SREBP-1 est 2,8 fois plus court (26 kb), cependant la position des liaisons
1a 1c 2 17 18a 19a 18c 19c
SREBP-1a
SREBP-1c
Figure 18: Structure du gène SREBP-1 chez l’homme.
Les isoformes SREBP-1a et SREBP-1c sont produites à partir d’un seul gène. La présence de deux promoteurs alternatifs permet la transcription du premier exon 1a ou 1c, les exons 2 à 17 sont communs au deux isoformes, les deux derniers exons (18 et 19) spécifiques aux deux isoformes sont issus d’un épissage alternatif.
Promoteur SREBP-1c Promoteur
exon-intron sont similaires dans ces deux gènes (Miserez et al., 1997). La protéine SREBP est bien conservée au cours de l'évolution puisque la protéine HLH106 homologue de SREBP chez la drosophile possède une structure identique à celle des facteurs SREBP de mammifères (Theopold et al., 1996).
3. Caractéristiques de la partie transcriptionnellement active de SREBP a/ Structure de la partie facteur de transcription de SREBP
Le domaine NH2-terminal de SREBP d'environ 480 aa correspond à un
facteur de transcription de la famille bHLH-LZ. Cette partie commence par une région acide nécessaire à l'activité transcriptionnelle de SREBP. Si cette région est délétée, la protéine est capable de se fixer sur l'ADN mais perd sa capacité d'activer la transcription, et se comporte alors comme un inhibiteur transcriptionnel (Sato et al., 1994). Le domaine acide de l'isoforme SREBP-1a humaine comporte 42 aa dont 12 aa acides, SREBP-2 en contient 48 dont 14 aa acides tandis que SREBP-1c en comporte seulement 24 dont 6 aa acides. Le domaine acide écourté de SREBP-1c résulte de l'utilisation d'un premier exon codant une région plus courte. Ceci explique pourquoi SREBP-1c est un activateur transcriptionnel beaucoup plus faible que SREBP-1a (Pai et al., 1998; Shimano et al., 1997a; Shimomura et al., 1997a) ou SREBP-2. Cette région acide est suivie de séquences riches en proline, sérine, glycine et glutamine qui varient entre SREBP-1a/c et SREBP-2. Puis, ces séquences sont suivies par un domaine bHLH-LZ comparable à ceux retrouvés dans les facteurs transcriptionnels de la famille bHLH de classe B tels que Myc, Max et USF (Atchley & Fitch, 1997). La région basique des protéines bHLH-LZ permet la liaison sur des séquences d'ADN spécifiques et la région HLH-LZ permet l'homo- ou l'hétérodimérisation de ces protéines. Une séquence d'adressage nucléaire NLS (Nuclear Localization Signal) a été localisée à l'intérieur du motif HLH-LZ de l'isoforme SREBP-2 (Nagoshi et al., 1999) (figure 16).
b/ Sites de liaison à l'ADN de SREBP
Habituellement les facteurs bHLH-LZ se fixent sur une séquence d'ADN palindromique appelée boîte E de consensus CANNTG. Jusqu'à présent les sites de liaison fonctionnel décrit pour SREBP sont des séquences non palindromiques appelées SRE (Sterol Regulatory Element) contenant deux demi-
liaison sur SRE ou bo îte E liaison sur bo îte E uniquement