• Aucun résultat trouvé

Distance boîte - ATG

III. Analyse bioinformatique des promoteurs

Au vu des résultats présentés dans ce manuscrit, le niveau d’expression des gènes est contrôlé au sein d’une famille multigénique. Des éléments intervenant dans cette régulation existent, nous avons repéré notamment l’implication de certains introns et de la boîte TATA.

A. Fonctions des boîtes télo et GGCCCA 1. Définitions

Chez les eucaryotes, le promoteur d’un gène transcrit par l’ARN polymérase Il comprend deux parties. La partie proximale est la zone située autour du site d’initiation de la transcription. Elle contient les éléments pour la mise en place de la machinerie de transcription et le recrutement de l’ARN polymérase II, dont la boîte TATA et le site d’initiation de la transcription. La partie distale, jusqu’à plusieurs milliers de paires de bases en amont, contient notamment les sites de fixation des facteurs de transcription. Classiquement, on implique la région proximale dans le contrôle de l’activité de base du promoteur, c’est-à-dire le contrôle du recrutement des différents facteurs d’initiation de la transcription, et la région distale dans la régulation de l’activité du promoteur (Rombauts et al., 2003). Des exemples montrent que cette vue est simplificatrice et que des éléments présents dans la région proximale peuvent intervenir dans la régulation de l’activité transcriptionnelle (Smale & Kadonaga, 2003). D’autre part, des éléments régulateurs peuvent se trouver en aval du site d’initiation de la transcription, par exemple dans le premier intron du gène (Curie et al., 1993; Norris et al., 1993; Plesse et al., 2001).

D’autres éléments interviennent dans l’activité transcriptionnelle du promoteur, notamment la structure de l’ADN dans l’espace, son état de méthylation ou encore l’enroulement du nucléofilament autour des nucléosomes (Rombauts et al., 2003). En effet, l’activation de la transcription d’un gène commence par une succession de réactions faisant intervenir la phosphorylation puis l’acétylation d’histones et enfin le déplacement du nucléosome qui rendent accessible la boîte TATA et le site d’initiation de la transcription (Featherstone, 2002). Ainsi, les éléments cis-régulateurs ne sont pas les seuls éléments contrôlant l’activité d’un promoteur.

2. Les boîtes télo et GGCCCA

Nous avons basé la recherche de motifs conservés dans les promoteurs des AtRH sur l’hypothèse que, comme ces gènes présentent globalement un profil similaire, ils pouvaient être régulés par les même facteurs et donc présenter des sites de fixation communs. Les motifs

identifiés interviendraient donc sur le profil et non sur le niveau d’expression. Comme aucun lien entre la présence des motifs et l’expression n’a été relevé, on peut proposer l’hypothèse que les boîtes télo et GGCCCA ont un autre rôle que celui de recruter des facteurs de transcription, comme par exemple participer à la mise en place de la machinerie de transcription, à la structuration en 3D des promoteurs ou à la méthylation de l’ADN.

La zone proximale des promoteurs est une zone où la déstabilisation des deux brins doit être plus facile pour permettre aisément l’initiation de la transcription. La répartition des insertions de ADN-T dans les collections de mutants d’A. thaliana est d’ailleurs préférentielle dans cette zone (Brunaud et al., 2002). La boîte télo est également située préférentiellement dans cette région. Ce motif pourrait donc être impliqué dans la facilitation de l’ouverture de la double hélice d’ADN ou dans la protection de l’intégrité de l’ADN au cours de la transcription. Comme les motifs télo sont préférentiellement localisés autour du site d’initiation de la transcription, on peut penser qu’ils font parti du corps du promoteur et qu’ils sont impliqués dans la machinerie de l’initiation de la transcription ou de la protection de l’ADN lors de l’ouverture. Cependant, ils ne semblent pas occuper une localisation fixe par rapport au site d’initiation de la transcription : selon le gène la (ou les) boîte(s) télo sont situées en aval ou en amont. De plus, il est difficile de justifier la présence préférentielle de ce motif dans le promoteur des AtRH par rapport à d’autres catégories de gènes dans le cas d’une fonction liée à la protection de l’intégrité de l’ADN ou de facilitation d’ouverture de la double hélice. La boîte télo pourrait être un site de fixation d’un régulateur négatif de la transcription qui, en se fixant à l’ADN inhiberait l’initiation de la transcription par compétition.

Les boîtes GGCCCA sont toujours situées en amont du site d’initiation de la transcription, ce qui répond mieux à la définition de site de fixation d’un facteur de transcription. La non-mise en évidence de lien entre la présence de cette boîte et l’expression des AtRH peut provenir de la combinaison de différents facteurs de transcription au sein des promoteurs. En effet, selon l’hypothèse classique, la régulation de l’expression d’un gène résulte de la combinaison des interactions des différents facteurs de transcription se fixant sur son promoteur. Ainsi, l’action du facteur se liant au motif GGCCCA sera modulée en fonction des autres facteurs régulant l’expression des gènes AtRH. Si la composition en sites de fixation de facteurs de transcription diffère entre deux gènes, leur expression variera en conséquence.

B. D’autres éléments dans les introns

Les gènes AtRH4, 19 et 23 sont les orthologues présumés des gènes ScRH-TIF1 et -TIF2, deux gènes fortement transcrits et codant la même protéine, le facteur d’initiation de la traduction eIF4A. Des expériences d’inactivation de gènes indiquent une redondance fonctionnelle complète entre TIF1 et TIF2 (Linder & Slonimski, 1989). AtRH4, AtRH19 et AtRH23 possèdent un intron dans leur région 5’ UTR, juste en amont de leur codon d’initiation de la traduction. AtRH4 et AtRH19 ont une boîte TATA et sont fortement transcrits alors que le gène AtRH23 est caractérisé par l’absence d’une boîte TATA et un faible niveau de transcrit. Les arbres de distance établis sur la base des séquences protéiques indiquent que la duplication du gène ancestral à l’origine d’AtRH23 précède la duplication conduisant aux gènes AtRH4 et 19.

Une autre caractéristique des gènes AtRH4 et 19, mais absente du gène AtRH23, est la présence dans leur intron en 5’ UTR d’une séquence codant un petit ARN non-messager nucléaire, les snoR81 et snoR98. SnoR81 et snoR98 sont deux snoRNA H/ACA qui guident la pseudo-uridylation de l’ARNr 25S (Marker et al., 2002b) à la même position (i.e. ψ 1013). AtRH4 et AtRH19 sont les seuls gènes de toute la famille AtRH pour lesquels un snoRNA a été cloné (groupes H/ACA et C/D) ou prédit (seulement le groupe C/D). Ces deux gènes sont aussi les gènes les plus exprimés des AtRH.

Chez les vertébrés, parmi les snoRNA localisés dans les introns, un grand nombre appartient à des gènes impliqués dans la biogenèse des ribosomes. Chez A. thaliana, un tiers des séquences des snoRNA sont localisées dans les introns de gènes codant des protéines ribosomales, des hélicases ou des facteurs d’initiation de la traduction (Marker et al., 2002a). Ces trois catégories « fonctionnelles » de gènes sont celles qui présentent le plus fréquemment une boîte télo (tableau 12, cf partie précédente).

La transcription des snoRNA introniques est sous le contrôle du promoteur du gène hôte et de l’épissage du pré-ARNm (Brown et al., 2003a), ce qui implique une expression coordonnée du gène hôte et du snoRNA. Une récente hypothèse propose que la conservation de paires de gènes co-régulés, à l’intérieur d’un génome ou entre deux génomes, puisse être une indication d’interaction directe entre les produits de ces gènes co-régulés. Chez les procaryotes et les eucaryotes, des faits s’accumulent en faveur cette hypothèse (van Noort et al., 2003). Chez A. thaliana, les deux paires de gènes homologues AtRH4-snoR81 et AtRH19-snoR98 sont sous le contrôle du même promoteur et appartiennent tous deux au métabolisme de l’ARN. Pourtant, contrairement aux paires de gènes co-régulés évoquées plus haut, aucune interaction

directe des produits des gènes ne peut être envisagée dans leur cas. En effet, les snoR81 et snoR98 sont impliqués dans la modification de l’ARNr 25S. Or, chez la levure S. cerevisiae, la maturation des ARNr est un processus complexe qui nécessite l’action de plusieurs ScRH à différentes étapes mais pas celle de TIF1/TIF2, les orthologues potentiels d’AtRH4 et AtRH19 (Nissan et al., 2002). De fait, une interaction fonctionnelle entre AtRH4 et snoR81 ou AtRH19 et snoR98 ne peut être recherchée au cours de la maturation des ribosomes. Ainsi, les snoR81 et snoR98 n’interagiraient pas directement avec les hélicases AtRH4 et AtRH19.

Cependant, on peut s’attendre à ce que les ARNm d’AtRH4 et AtRH19 interagissent avec l’ARNr 25S modifié par les snoRNA snoR81 et snoR98 ou avec un ARNr dérivé de l’ARNr 25S modifié. La fonction des modifications nucléotidiques des ARNr par les snoRNA est actuellement inconnue. Mais ces modifications sont probablement impliquées dans le contrôle des interactions des ARNr avec d’autres ARN ou protéines (Smith & Steitz, 1997). Dans ce contexte, à la fois la conservation de l’organisation de AtRH4-snoR81 et AtRH19-snoR98 et le maintient d’un fort taux de transcription des deux AtRH suggèrent que les snoR81 et snoR98 auraient un rôle spécifique dans le maintien de forts taux de transcription pour AtRH4 et AtRH19 et que la modification spécifique de l’ARNr 25S par les snoR81 et snoR98 pourrait augmenter l’efficacité de recrutement des transcrits AtRH4 et AtRH19 vers le ribosome ou leur stabilité une fois associés au ribosome. Il en résulterait une augmentation spécifique du taux de transcription réel ou apparent des ces deux gènes.

Perspectives

Le contexte génomique de la régulation de l’expression des gènes d’A. thaliana : une approche bioinformatique