• Aucun résultat trouvé

Définition de l’exon, éléments régulateurs de l’épissage et épissage alternatif . 31

1.2 Epissage

1.2.5 Définition de l’exon, éléments régulateurs de l’épissage et épissage alternatif . 31

Les exons chez les mammifères sont plutôt courts (50-250bp, la moyenne étant autour de 150pb) alors que les introns sont très longs (la moyenne est de 3365 pb, certains font plus de

10kb)[173] et représentent plus de 90% des transcrits [325]. Les premières expériences ont

supposé que l’épissage reposait sur une « définition par l’exon » : il existe une interaction initiale et une stabilisation à travers l’exon des facteurs liés au 3’ss et au 5’ss avant la formation d’interactions

à travers l’intron[200]. Une représentation schématique de la définition de l’exon est présentée

dans la figure 1.10 A. Ce système est retrouvé chez les mammifères. Il s’oppose à la « définition

par l’intron » plus commune chez les invertébrés, les plantes et les champignons[337], également

schématisé dans la figure 1.10 A. L’une ou l’autre de ces définitions est le résultat du croisement d’informations portées par des séquences régulatrices de l’épissage (SRE). Ces séquences se dis-tinguent en 2 groupes en fonction de leur localisation (figure 1.10 B) : ESE et ESS (exonic

spli-cing enhancer/silencer) séquences contenues dans l’exon et stimulant ou inhibant l’inclusion de

l’exon ; ISE et ISS (intronic splicing enhancer/silencer) séquences contenues dans l’intron et

1.2. Epissage 33

FIGURE1.10 – Définition par l’exon ou par l’intron et les séquences régulatrices de l’épissage. A. Il existe deux modes pour le splicéosome de reconnaître les sites actifs pour l’épissage : par la défi-nition de l’intron (à gauche) ou par la défidéfi-nition de l’exon (à droite). Dans la défidéfi-nition de l’intron, ce sont les sites 5’ss (ou donneur) et 3’ss (ou accepteur) qui encadrent l’intron qui permettent l’as-semblage. Ce mode est utilisé chez les invertébrés, les plantes et les champignons. La définition de l’exon consiste à reconnaître les sites 5’ss et 3’ss encadrant l’intron. Ce mode est privilégié chez les mammifères. Dans les deux cas, le splicéosome passe par les mêmes complexes, à la différence que dans la définition par l’exon, le complexe E et A sont légèrement différents de leurs homo-logues dans la définition par l’intron. Dans le complexe EDE (Exon-defined E), c’est la snRNP U1 en aval qui interagit avec U2AF. Et dans le complexe EDA (Exon-defined A), l’interaction se fait entre la snRNP U2 en amont et la snRNP U1 en aval de l’exon. Avec la formation du lasso, les in-teractions changent et se font dans le même ordre 5’-3’ que dans la définition par l’intron. B. Les séquences régulatrices de l’épissage se trouvent dans les exons et dans les introns. Elles peuvent être inhibitrices de l’épissage : ESS (Exonic Splicing Silencer) et ISS (Intronic Splicing Silencer) et favoriser l’exclusion de l’exon ou l’inclusion de l’intron respectivement. Elles peuvent aussi être activatrices : ESE (Exonic splicing Enhancer) et ISE (Intronic Splicing Enhancer) et entraîner l’in-clusion de l’exon ou l’exl’in-clusion de l’intron respectivement.

Il n’existe pas de séquences consensus à proprement parler. Pour autant, il existe des familles de protéines associées à ces séquences. Les ESE sont très divers par leurs séquences et presque

tous les exons en contiennent[81]. La plupart recrutent des protéines SR (Ser-Arginine) par leurs

domaines RRM qui établissent des interactions protéiques et ARN par leurs domaines RS. Les

pro-téines les plus connues sont SF2/ASF et SC35 [187, 41]. Les ESS au contraire, sont plutôt associés

aux protéines de la famille des hnRNPs (heterogeneous nuclear RNP). Les modes d’action de ces dernières sont variés. Par exemple, le PTB (Polypyrimidine Tract Binding protein ou hnRNP I) se lie à la séquence polypyrimidine et empêche les snRNP U1 et U2 de se fixer en interférant avec

U2AF65[271]. hnRNPA1, lui, peut se lier de chaque côté d’un exon et l’exclure de l’ARNm en cours

d’épissage[221]. Les ISE et ISS sont moins étudiés, donc moins connus. Néanmoins, les données

actuelles montrent que les ISS recrutent les mêmes protéines que les ESS[272].

Pour comprendre l’épissage alternatif, il faut ajouter à ces interactions, leur variabilité dans l’espace et dans le génome. En effet, ces séquences peuvent n’avoir aucun rôle ou bien un rôle op-posé en fonction de la localisation : si la séquence est dans l’intron ou dans l’exon, proche d’un 3’ ou d’un 5’, son effet pourra être activateur ou inhibiteur. Ou bien en fonction du gène : la sé-quence n’a pas d’effet dans un autre gène. Un exemple du premier état est le cas du triplet GGG qui est lié par des protéines hnRNPH. Cette séquence, située dans un intron, stimule l’épissage des

exons qui l’encadrent alors que, située dans un exon, cette séquence inhibe son épissage[38]. On

comprend bien que ces séquences jouent un rôle capital dans l’épissage alternatif. Elles entraînent plusieurs possibilités d’épissage alternatif (figure 1.7). Mais elles ont aussi un rôle essentiel dans la fiabilité et l’exactitude de l’épissage qui repose sur des séquences dégénérées (5’ss, 3’ss et BP)

1.2. Epissage 35

FIGURE1.11 – Sites et réactions catalytiques de l’épissage. A. L’épissage fait intervenir 3 sites : le site 5’ss ou site donneur, le point de branchement et le site 3’ss ou site accepteur. Chaque site est déterminé par une séquence consensus qui repose essentiellement sur un ou deux nucléotides très conservés. Les autres sont relativement dégénérés. B. Attaque nucléophile du point de bran-chement sur le site 5’ss. L’intron forme un lasso et l’exon en 5’ est coupé. L’exon en 5’ attaque le site 3’ss. Formation de l’ARNm épissé et du lasso intronique.

La transcription et l’épissage sont deux étapes indispensables dans la production de protéines (au moins chez les métazoaires) et sont très proches spatialement et dans le temps. L’existence d’interactions entre ces deux mécanismes est une hypothèse facile à admettre et dont des preuves de plus en plus nombreuses sont apportées par la littérature. Nous allons y venir en nous attardant sur la protéine majeure de la transcription : l’ARN polymérase II.

Chapitre 2

ARN polymérase II

2.1 Le domaine carboxy-terminal