Différents groupes d’études ont démontré l’existence d’une spécificité de liaison de ces
protéines à l’ADN. Les techniques d’interférence par méthylation et de retard de migration en
gel d’électrophorèse ont permis d’en déterminer la séquence d’ADN cible. Les deux exemples
suivants sont loin d’être exhaustifs.
Le facteur bHLH nommé E47 peut se lier au site κE2 du promoteur des immunoglobulines
qui contient la séquence de liaison GGCAGGTGG (Murre et al., 1989). Des résultats
similaires ont été obtenus en étudiant la liaison du facteur bHLH appelé MyoD sur le
promoteur de la kinase de la créatine de muscle (MCK). MyoD reconnaît les séquences
CACCTG et CATGTG (Lassar et al., 1989). Chaque famille bHLH se lie donc, en général, à
une séquence consensus CANNTG dénommée boîte E ou E-box. Les deux nucléotides au
Figure 8 : Alignement de certains bHLH (Ferre-D'Amare, et al. 1993 ).
Le domaine basique (BASIC), la première hélice (H1), la boucle (loop), la deuxième hélice (H2) et la glissière à leucines (ZIPPER) ainsi que les résidus caractéristiques de ces régions sont colorés respectivement en rouge, jaune, violet, bleu et orange.
B
A C
Figure 9 : Structure tridimensionnelle du dimère Max (A), USF(B) et E47 (C) sur leur site de reconnaissance.
Les bHLH sont colorés en rouge et jaune (A-B) ou vert et jaune (C). L’ADN est représenté en bleu (A-B) ou en rose (C) (A-B: Ferre-D'Amare, et al. 1994; C: Ellenberger, et al. 1994 ).
B
A
Arg 36
Arg 35
C A C G T G
D
C
Figure 10 : Structure tridimensionnelle de la partie basique des bHLH sur leur site de reconnaissance ou libre.
(A) Vue de la région basique d’un des monomères Max (Ferre-D'Amare, et al. 1993). En rouge sont représentés les acides aminés. Les paires de base GC et AT sont respectivement colorées en bleu et vert. Le consensus CACGTG est renseigné.
(B) Comparaison du domaine basique d’un monomère Max à l’état libre (bleu) ou sur son site de reconnaissance (protéine en gris, ADN en rouge). Les Arg 35 et 36 de Max sont représentées en bâtonnets jaunes pour la forme libre ou en gris pour la forme complexée à l’ADN (Sauvé et al.2004).
(C) Comparaison des dimères Max (en jaune) et USF (en rouge). Les résidus de Max sont notés en minuscule et pour USF en majuscule. L’ADN reconnu par Max ou USF est réprésenté en bleu ou en rose (Ferre-D'Amare, et al. 1994).
A B
Figure 11 : Schéma des contacts entre les facteurs bHLH Max (A) ou E47 (B) et leur site de reconnaissance. (A) Un seul des monomères est représenté sur ce schéma. Les interactions entre les acides aminés et les bases
nucléotidiques sont désignées par des flèches continues; les contacts avec les phosphates par des flèches discontinues. Les interactions avec les bases situées en dehors du consensus sont indiquées entre parenthèses. L’ellipse au centre de la figure correspond à l’axe du dimère formé (Ferre-D'Amare, et al. 1993).
(B) Les monomères sont dénommés ‘CAC’ou ‘CAG subunit’ d’après la moitié du site de reconnaissance en contact avec le domaine basique de chaque monomère. Les interactions sont représentées par des lignes discontinues. Les consensus CAGGTG sont encadrés en rouge (adapté d’ Ellenberger, et al. 1994 ).
Introduction
centre de cet hexamère sont spécifiques à différentes classes de bHLH. D’autres protéines de
type bHLH comme les COE-HLH ou les bHLH-PAS se lient à d’autres séquences (Figure 7).
L’étude du profil hydrophobe des résidus prédit la présence de deux domaines hélicoïdaux
séparés par une région sans structure apparente. Environ quinze résidus à l’extrémité
N-terminale de la première hélice sont à caractère basique (domaine basique). Mis en présence
d’ADN, les bHLH présentent, dans leur spectre par dichroïsme circulaire, une augmentation
de la structure en hélice (Anthony-Cahill et al., 1992). Le fait que des mutations dans le
domaine basique perturbent la liaison à l’ADN suggère que ce domaine adopterait une
structure en hélice en présence d’ADN (Davis et al., 1990).
Les analyses de cristaux bHLH /ADN ont permis de déterminer la structure tridimensionnelle
de certains de ces complexes. Plusieurs exemples sont illustrés ci-après. Un alignement des
séquences protéiques de quelques bHLH est présenté à la Figure 8.
Comparons les cristaux des protéines bHLH Max, USF et E47 sur leur site de reconnaissance
d’ADN (Ferre-D'Amare et al., 1993; Ferre-D'Amare et al., 1994; Ellenberger et al., 1994).
Chacun de ces trois facteurs se fixe à l’ADN sous forme d’homodimère en adoptant une
structure à quatre hélices parallèles en forme de tenaille enserrant l’ADN (Figure 9 A-B-C).
Chaque monomère se fixe à une moitié du site CANNTG dans le sillon majeur de l’ADN.
Max possède une structure hélicoïdale observable à partir du résidu Arg25 du domaine
basique à la sérine 49 de l’hélice 1 (Figure 10A). Une récente analyse de la structure du
dimère Max en solution par RMN a démontré qu’à l’état « libre » (c’est-à-dire non lié à
l’ADN), le domaine basique n’a pas de structure secondaire hélicoïdale (Figure 10B). Ces
observations confirment donc le changement de structure du domaine basique lors de sa
fixation à l’ADN.
En plus de ce domaine, une partie de la première hélice interagit également avec l’ADN
(Figure 10 A). Les Figures 8 et 10C-D permettent de déterminer que les résidus Glu et Arg
conservés dans la plupart des facteurs bHLH sont importants pour la fixation à l’ADN.
La Figure 11 schématise les interactions entre les acides aminés du domaine basique des
bHLH Max ou E47 et la molécule d’ADN au site de reconnaissance, telles qu’elles ont pu être
déduites de la structure tridimensionnelle des complexes cristallisés. Les acides aminés sont
en contact avec le squelette désoxyribose-phosphodiester et avec les bases de l’ADN
elles-mêmes. Avant l’obtention de la structure tridimensionnelle des bHLH, plusieurs équipes
avaient déjà déterminé un rôle des hélices dans la dimérisation. Davis et al. (1990) ont testé
b HLH O I
A WRPW
HES
YXXW
25 % 48 % 29 % 9 %
TE(I/V)GAF
HRT
HES7 HES5 HES2 hHES4 HES1 HES3 HES6 HRT3 HRT1 HRT2 HELT DEC1 DEC222 % 39 % 19 % 22 %
Helt
20 % 41 % 21 % 6 %
DEC
B
Figure 12 : Schéma de la structure des bHLH-O (A) et arbre phylogénétique (B).
(A) Les domaines conservés sont représentés en bleu pour le domaine basique (b) ; en rouge pour le domaine hélice-boucle-Hélice (HLH) et en Orange, le domaine Orange (O). La région en aval du domaine Orange est la moins conservée. Dénommée région intermédiaire (I), elle sépare le motif conservé chez les HES (WRPW en jaune) ou le motif dégénéré YXXW (en jaune égalemant) chez les HRT du reste de la protéine. Chez les HRT,un nouveau motif TEI/VGAF est conservé; il est coloré en vert. Les protéines des familles Helt et DEC ne
contiennent aucun de ces motifs. Les similitudes de séquence entre HES et les autres sous-familles des bHLH-O sont exprimées en pourcentages en regard des domaines et régions concernés.