• Aucun résultat trouvé

I. 5.7.2.2 Le motif "EF hand"

I.9. Les facteurs de transcription

Si la transcription est bien effectuée par l'ARN polymérase, cette enzyme pour fonctionner requiert la présence d'autres protéines. Celles-ci sont soit directement associées à l'ARN polymérase, ou sont nécessaires au fonctionnement de la machinerie. On appelle facteur de transcription (transcription factor), l'ensemble de ces protéines à l'exception de l'ARN polymérase elle-même [54].

Leurs interactions peuvent être de la forme :

 Liaison à l'ARN polymérase ;

 Liaison à autre un facteur de transcription ;

 Liaison à des séquences d'ADN cis-acting ;

 Le «basale transcription apparatus" : L'ARN polymérase + l'ensemble des facteurs de transcription.

Les facteurs de transcription qui coopèrent avec l’ARN polymérase peuvent êtres divisés en trois groupes :

Les facteurs généraux de transcription, qui sont nécessaires à l’initiation de la synthèse de l’ARN au niveau des gènes de classe II (gènes codants pour des protéines). Ils forment avec l’ARN pol II un complexe au niveau du site d’initiation de la transcription et déterminent ainsi le site de démarrage de la transcription ; ce complexe est appelé complexe basal de transcription.

 Les facteurs de transcription généraux et spécifiques de séquence, qui reconnaissent des petites séquences d’ADN localisées en amont du site de démarrage de la transcription (comme le facteur SP-1 qui reconnaît les boîtes GC). Ces facteurs sont ubiquitaires, ils augmentent l’efficacité de la transcription des gènes contenant les boîtes GC dans leurs promoteurs.

 Les facteurs de transcription spécifiques de séquence et inductibles, qui possèdent un rôle régulateur. Ils sont synthétisés ou activés d’une manière spécifique de tissu. Les séquences qu’ils reconnaissent sont appelées les éléments de réponse [54].

Figure 13. Structure typique d'un gène eucaryote à ARNm [50].

Figure 14. La région promoteur des eucaryotes "supérieurs". La TATA-box est environ 30 bases en amont du

TSS. Généralement deux ou plus régions forment le promoteur proximal, souvent dans la zone 100-200 en amont du TSS. Dans cette figure sont indiquées la CCAAT-box et une région riche en GC [51].

Figure 15. Structure typique de la région en 5' d'un gène à deux exons codant pour un ARNm. Les boites

TATA-box and CCAAT-box sont indiquées aux positions respectives -25 et -100.Le facteur de transcription TFIID est indiqué comme la protéine de liaison à la TAT-box (TATA-box binding protein, TBP).

D'autres facteurs de transcription sont indiqués en 5' de ces boites, leur localisation et ordre n'est pas général (CREB=cAMP response element binding protein; C/EBP=CCAAT-box/enhancer binding protein).

I.9.1. Régulation de l’expression génique par la calmoduline chez les plantes

Comme tous les organismes, les plantes intègrent en permanence les fluctuations de l’environnement, et modulent en conséquence leur croissance et leur développement. Parmi les systèmes de signalisation servant de relais entre la perception des stimuli et les réponses biologiques, le calcium participe, en tant que second messager, à la régulation de nombreux processus cellulaires, et au routage d’informations jusqu’au compartiment nucléaire où sont activés les programmes génétiques appropriés [56].

La calmoduline (CaM) est une protéine capable de percevoir les variations du taux de calcium par des motifs de type EF-hand, qui ont une affinité élevée pour cet ion [57]. Le complexe Ca2+/CaM interagit et module l’activité de protéines cibles, qui présentent des structures et des fonctions variées. À côté d’une forme typique de CaM conservée chez tous les eucaryotes, les plantes possèdent un répertoire particulier de protéines apparentées à la CaM, dont les fonctions commencent à être décrites [58].

Différents travaux sur les CaM végétales et leurs cibles montrent l’importance de la signalisation calcique dans les processus associés à l’expression génique. En particulier, l’étude d’une forme atypique de CaM, présente dans le tabac, a révélé son intervention dans le contrôle du gene silencing [59].

Ce mécanisme de régulation de l’expression génique, initialement identifié chez les plantes, est un processus général chez les eucaryotes, qui agit par la dégradation ciblée d’ARN messagers. Des approches génétiques conduisant à moduler le niveau d’expression de cette CaM de tabac ont démontré son rôle essentiel dans la suppression du phénomène de gene silencing.

D’autres travaux relatifs à la distribution sub-cellulaire des pools de CaM, indiquent une dynamique de répartition de la CaM entre le cytosol et le noyau. Par exemple, la CaM 53 du pétunia et la CaM 61 du riz, deux isoformes qui se distinguent de la CaM typique par la présence d’un motif de prénylation à leur extrémité carboxy-terminale, se trouvent ancrées au plasmalemme lorsque les plantes sont exposées à la lumière [60]. En revanche, un passage à l’obscurité provoque leur accumulation dans le noyau, ce qui indique une mobilisation nucléaire de ces CaM lors d’un changement de régime lumineux [61].

I.9.2. CAMTAs: calmodulin-binding activateurs de la transcription à partir de plantes l'homme

Récemment, une nouvelle famille de la calmoduline-binding activateurs de transcription (CAMTAs) a été signalée chez les eucaryotes différents. Tous partagent CAMTAs une organisation de domaine similaire, avec un nouveau type de séquences d'ADN spécifiques domaine de liaison (désignés CG-1). Ce domaine pourrait lier l'ADN directement et activer la transcription, ou d'interagir avec les autres facteurs de transcription, et non par liaison à l'ADN, agissant ainsi comme un co-activateur de la transcription [62].

Calmodulin-activateur de la transcription de liaison (CAMTA) 3 (aussi appelé SR1) est un facteur de transcription de la calmoduline obligatoire dans Arabidopsis thaliana qui contient six gènes CAMTA (AtCAMTA1-AtCAMTA6).

Fractionnement subcellulaire de tissus d'Arabidopsis a révélé la présence de CAMTAs principalement dans le noyau. Des essais de fixation Calmoduline identifié une région de 25 acides aminés capables de liaison de la calmoduline avec une haute affinité en présence de calcium.

CAMTAs représentent une famille conservée de facteurs de transcription dans un large éventail d'eucaryotes multicellulaires, qui répondent peut-être à la signalisation calcique par liaison directe de la calmoduline [63].

I.9.3. Organisation de domaine de CAMTAs

Les protéines de CAMTA se composent du multiple ont prévu des domaines fonctionnels, conservés dans les séquences des acides aminés, et organisés dans un ordre conservé (figure.16). Les domaines fonctionnels incluent : signaux nucléaires de localisation (NLS) ; CG-1, un domaine unique d’ADN-binding; TIG, un domaine impliqué dans les contacts non spécifiques d'ADN dans TFs [64], et impliqué dans la dimérisation de protéine [65, 66] ; Les répétitions d'ANK (ankyrin), qui sont présentes en tant que modules tandemly répétés d'environ 33 acides aminés dans un grand nombre de protéines et de virus d'eucaryote, et participent aux interactions de protéine-protéine [67, 68, 69]. En outre, CAMTAs contiennent un nombre variable des motifs de Q.I. [70]. Les motifs de Q.I sont connus pour être associés à lier de la CAM et CAM-like les protéines [71].

I.9.4. Spécificité de l’ADN-relais aux CAMTAs

Le contrôle de la transcription est le résultat d’un réseau compliqué entre les différents canaux, les isoformes de CAM, les CBPs (CGCG-box Binding Protein) et d’autres régulateurs. Au cours des deux dernières décennies, plusieurs facteurs de transcription liée aux sites de séquence spécifique de l’ADN ont été identifiés

[72].

Les facteurs spécifiques à l’ADN-relais (SSDB) jouent un rôle crucial dans la transcription, la réplication, la recombinaison et dans la réparation de l’ADN.

Yang et Poovaiah (2002) [73] ont utilisé un groupe de 30 séquences aléatoires d’oligonucliotides afin de vérifier si la protéine nucléaire (ou CAMTA3, At2g22300) avaient une interaction spécifique avec l’ADN [73].

Les retardateurs d’oligonucléotide ont montré qu’il y a 6-pb commune ACGCGG (ou CCGCGT) dans 50% des cas. Chacun d’entre eux partagent la séquence CGCG au milieu de (A/C/G) CGCG (C/G/T) consensus box CGCG. Taleb et al. Ont trouvé un consensus plus large AAA(C)(Xn)(C/A/G)CGCG(C/G/T) avec n<18

[62]. C’est le consensus Taleb/Fromm [72].

Yang et Poovaiah (2002) ont signalé la présence d’un box CGCG dans les promoteurs d’un grand nombre de gènes de divers organismes multicellulaires, et ils ont montré que les motifs étaient présents dans les régions promoteur d’environ 130 gènes dans le génome d’Arabidopsis [73].

Le motif CGCG pourrait générer une structure secondaire, qui joue un rôle dans la décélération ou l’identification de différents facteurs de transcription [74].

I.10. La bioinformatique

Documents relatifs