• Aucun résultat trouvé

Expression des AtRH et analyse des promoteurs

III. Eléments cis-régulateurs et niveaux de transcription

A. Classification des AtRH en fonction de la structure des régions promotrices 1. Annotation structurale des AtRH

Les récents projets de production et séquençage d’ADNc pleine longueur chez A. thaliana ont permis d’augmenter et d’améliorer de façon significative les données disponibles pour les transcrits (Haas et al., 2002; Seki et al., 2002c; Seki et al., 2002d; Castelli et al., 2004). Pour caractériser précisément la structure intron-exon et les parties codantes et non codantes des AtRH, nous avons aligné leur séquence génomique avec celle de leurs transcrits. Lorsque aucune séquence transcrite n’était disponible, nous nous sommes appuyés sur les prédictions des logiciels NetGene2 et GeneMark HMM et sur la structure de paralogues proches. Au 1er février 2003, les transcrits présents dans les bases de données publiques ont permis de déterminer la région 5’ UTR de 46 gènes AtRH sur les 56 de la famille. Les AtRH ont alors été répartis en trois groupes en fonction de la structure de leur 5’ UTR. Le groupe I rassemble les 15 AtRH avec un intron dans la région 5’ UTR, démontré expérimentalement par la présence de séquences de transcrits dans les bases de données. Leur région 5’ UTR est donc composée d’un exon non codant, d’un intron et d’un deuxième exon contenant l’ATG initiateur. La taille des introns varie entre 65 et 649 pb, avec une moyenne de 289 pb. Le groupe II contient les 31 AtRH avec une région 5’ UTR sans intron. La longueur de la partie exonique de la région 5’ UTR des 46 AtRH, interrompue ou non par un intron, est similaire : 123 ± 98 pb et 147 ± 54 pb pour les groupes I et II, respectivement. Le groupe III correspond aux 10 AtRH dont la région 5’ UTR n’est pas connue. Très peu d’EST (0-3) sont disponibles pour ces gènes, indiquant un niveau d’expression transcriptionnel très faible.

2. Identification de la boîte TATA

Nous avons recherché la boîte TATA dans les 60 pb en amont du site apparent d’initiation de la transcription des gènes AtRH, à partir de la séquence consensus TATAWA (Joshi, 1987). Les 10 gènes dont la région 5’ UTR n’est pas connue n’ont pas été analysés. En acceptant une substitution d’un A en T ou d’un T en A par motif, une boîte TATA a été identifiée pour 17 gènes sur 46 (Figure 14). Huit gènes présentent une boîte TATA correspondant au consensus et les neuf autres gènes une boîte avec une substitution. La position des boîtes TATA varie de -27 à -50 pb en amont du site apparent d’initiation de la transcription. La majorité des boîtes TATA (15/17), dont les 8 boîtes canoniques identifiées, sont localisée entre -27 et -37 pb.

Tableau 11 Présence d’une boîte TATA dans la séquence promotrice des gènes AtRH selon leur groupe structurel.

Les chiffres romains désignent les groupes de gènes qui possèdent un intron en 5’ UTR (I), qui n’en possèdent pas (II) ou dont la région 5’ UTR n’est pas connue (III). Ces groupes sont subdivisés en fonction de la présence d’une boîte TATA consensus (I+, II+), modifiée (I∆, II∆) ou de l’absente de boîte TATA (I, II). La présence d’une boîte TATA n’a pas été recherchée pour les gènes du groupe III.

Nombre de gènes TATA consensuelle (+) TATA modifiée (∆) Sans boîte TATA Total

Intron (I) 6 2 7 15

Sans intron (II) 2 7 22 31

Sans 5’ UTR (III) - - - 10

Total 8 9 29 56

Quantité totale de transcrits

Taille de l’intron (nt) 4 4023 19 14 56 38 42 0 200 400 600 0 200 400 600 800

Quantité totale de transcrits

Taille de l’intron (nt) 4 4023 19 14 56 38 42 0 200 400 600 0 200 400 600 800

Figure 15 Influence de la taille de l’intron en 5’ UTR sur la transcription des AtRH mesurée par PCR quantitative en temps réel.

Les huit gènes sélectionnés correspondent à l’ensemble des gènes possédant un intron en 5’ UTR et dont l’expression transcriptionnelle a été mesurée par PCR quantitative en temps réel. Les gènes pour lesquels une boîte TATA a été identifiée (I+) sont représentés par des losanges noirs et les gènes sans boîte TATA par des triangles blancs (I). Les gènes avec une boîte TATA modifiée sont représentés par des losanges blancs (I∆). La quantité totale de transcrits est exprimée en 102 eg.ng–1 ARN totaux (Tableau 9). La taille de l’intron est exprimée en nucléotides.

Les groupes I et II définis précédemment ont été subdivisés en fonction de la présence d’une boîte TATA consensus (I+, II+), modifiée (I, II) ou de l’absente de boîte TATA (I, II). Il y a un biais de répartition des boîtes TATA (Tableau 11). Les boîtes respectant le consensus sont plus fréquentes lorsqu’un intron est présent dans la région 5’ UTR (groupe I). Comme il a été montré que la séquence de la boîte TATA influence l’efficacité de l’expression transcriptionnelle (Starr et al., 1995; Yean & Gralla, 1997), ce biais pourrait indiquer un lien transcriptionnel entre la présence d’une boîte TATA fonctionnelle et celle d’un intron en 5’UTR.

B. Groupes structuraux et niveaux d’expression des gènes AtRH

Les plus forts niveaux d’expression transcriptionnelle sont observés pour les AtRH du groupe I+ (gènes possédant à la fois un intron dans la région 5’ UTR et une boîte TATA), soit AtRH4, 14, 19 et 56. Plus précisément, nous observons une corrélation directe pour ces AtRH entre la taille de l’intron en 5’ UTR et la quantité totale de transcrits mesurée par RT-PCR quantitative en temps réel (Figure 15). En effet, la pente de la droite de régression est proche de 1 (0,86; r2 = 0,96). Cette corrélation est aussi observée (r2 = 0,84) lorsque le nombre d’EST disponible pour chaque gène est utilisé comme estimateur de l’abondance des transcrits. Le rôle des introns en 5’ UTR dans la régulation de la transcription a été expérimentalement démontré par exemple pour les gènes ubiquitine et les facteurs d’élongation EF1α d’A. thaliana (Axelos et al., 1989; Curie et al., 1991; Norris et al., 1993). Les mécanismes impliqués restent inconnus. Un effet secondaire de l’épissage de l’intron, la stimulation de la re-initiation de la transcription par l’ADN polymérase Pol II (Manley, 2002; Dieci & Sentenac, 2003) ou la présence d’informations cryptiques contenues dans l’intron pourraient être envisagés. A notre connaissance, c’est la première fois qu’une corrélation entre la taille de l’intron en 5’ UTR et la transcription est observée.

Nos données démontrent que la présence d’un intron en 5’ UTR n’est pas suffisante pour prédire un fort niveau d’expression. En effet, les gènes AtRH23, AtRH40 et dans une moindre mesure AtRH42, se démarquent significativement de la corrélation. En effet, 11, 10 et 4 fois moins de transcrits ont été mesurées par rapport à ce que la taille de l’intron permettait de prédire. De façon intéressante, ces trois gènes ont un intron en 5’ UTR mais aucune boîte TATA canonique. AtRH40 et AtRH42 ne possèdent pas de boîte TATA et AtRH23 présente une boîte modifiée. Ainsi, la corrélation entre la taille de l’intron et la quantité totale de

Tableau 12 Eléments en amont du site d’initiation de la traduction et niveau d’expression des AtRH.

Les gènes sont classés en six groupes en fonction de la présence ou de l’absence d’un intron en 5’ UTR (I/II) et/ou d’une boîte TATA canonique ou modifiée (+/∆). La colonne « Expression totale » indique la somme des niveaux d’expression mesurée dans les neuf organes étudiés (en eg.ng-1 ARN totaux). La prédiction de la localisation cellulaire des produits des gènes est celle indiquée dans FLAGdb++18 (Samson et al., 2002). Lorsque l’adressage est mitochondrial, le numéro du gène est souligné, lorsqu’il est chloroplastique, le numéro du gène est en italique et lorsqu’il est nucléaire, le numéro du gène est suivi d’un n en exposant.

AtRH Expression totale Autres AtRH de gènes Nombre

Groupe I+ 6 Intron en 5’UTR 04 76543 11, 15 Boîte TATA 14 35063 19 50148 56 17252 Groupe I∆ 2 Intron en 5’UTR 23 4652

Boîte TATA modifiée 38 9730

Groupe I 7 Intron en 5’UTR 40n 4563 41, 47, 51, 52, 57 42n 2776 Groupe II+ 2 Boîte TATA 07n, 27n Groupe II∆ 7

Boîte TATA modifiée 05n 7526 03, 10n

08 8145 12 627 30 6022 58 1713 Groupe II 22 01 742 09, 13n, 16, 18n, 22, 25, 26, 28n, 35, 37, 39, 46, 49, 02 18233 50, 53 06 10965 20 5710 21n 13846 24 4500 34 923 18 http://genoplante-info.infobiogen.fr/FLAGdb

transcrits n’est vraie que lorsque ces AtRH contiennent aussi une boîte TATA caractéristique. Par ailleurs, le groupe II contient des AtRH montrant des niveaux totaux de transcrits entre 1/4 et 1/110 de celui du gène AtRH4 (Tableau 12). De fait, en l’absence d’un intron en 5’ UTR, le niveau d’expression transcriptionnel couvre une large gamme de valeurs, ce qui reste à expliquer.