• Aucun résultat trouvé

Modulation de l'épissage alternatif de hnRNP A1 : éléments de contrôle et mécanismes d'action

N/A
N/A
Protected

Academic year: 2021

Partager "Modulation de l'épissage alternatif de hnRNP A1 : éléments de contrôle et mécanismes d'action"

Copied!
176
0
0

Texte intégral

(1)

INFORMATION TO USERS

This manuscript has been reproduced from the microfilm master. UMI films the text directly from the original or copy submitted. Thus, some thesis and dissertation copies are in typewriter face, while others may be from any type of computer printer.

The quality of this reproduction is dependent upon the quality of the copy submitted. Broken or indistinct print, colored or poor quality illustrations and photographs, print bleedthrough, substandard margins, and improper alignment can adversely affect reproduction.

ln the unlikely event that the author did not send UMI a complete manuscript and there are missing pages, these will be noted. Also, if unauthorized copyright material had to be removed, a note will indicate the deletion.

Oversize materials (e.g., maps, drawings, charts) are reproduced by sectioning the original, beginning at the upper left-hand corner and continuing from left to right in equal sections with small over1aps.

Photographs included in the original manuscript have been reproduced xerographically in this copy. Higher quality 6" x 9" black and white photographie prints are available for any photographs or illustrations appearing in this copy for an additional charge. Contact UMI directly to order.

Bell & Howell Information and Leaming

300 North Zeeb Road, Ann Arbor, Ml 48106-1346 USA 800-521-0600

(2)
(3)

NOTE TO USERS

(4)
(5)

Université de Sherbrooke

Modulation de l' épissage alternatif de hnRNP A 1: éléments de contrôle et mécanismes d'action

Par

Marco Blanchette

Thèse présentée à la Faculté de médecine En vue de l'obtention du grade de

philosophae doctor (Ph.D.) en microbiologie

(6)

l+I

National Library

of Canada Bibliothèque nationale du Canada

Acquisitions et Acquisitions and

Bibliographie Services services bibliographiques 395 Wellington Street

Ottawa ON K1A ON4 Canada

395, rue Wellington

Ottawa ON K1 A ON4

Canada

Tue author has granted a

non-exclusive licence allowing the

National Library of Canada to

reproduce,

Io~

distnbute or sell

copies of this thesis

in

microform,

paper or electronic formats.

The author retains ownership of the

copyright

in

this thesis. Neither the

thesis nor substantial extracts from it

may be printed or otherwise

reproduced without the author' s

permission.

Your fila Vo1111 ''fliffll>CM

Dur 6Je Notffl re"""""'

L'auteur a accordé

une

licence non

exclusive permettant à la

Bibliothèque nationale du Canada de

reproduire, prêter, distribuer ou

vendre des copies de cette thèse sous

la forme de microfiche/film, de

reproduction sur papier ou sur format

électronique.

L'auteur conserve la propriété du

droit d'auteur qui protège cette thèse.

Ni la thèse

ni

des extraits substantiels

de celle-ci ne doivent être imprimés

ou autrement reproduits sans son

autorisation.

0-612-56990-X

(7)

TABLE DES MATIÈRES

Table des matières ... I Liste des figures ... III Liste des abréviations ... IV Résumé ... VI Introduction ... 1 Généralités ... 1 Épissage ... 4 Épissage alternatif .. . . .. .. . . .. . .. . . .. . . .. . . .. .. . . .. . . . .. . . .. . . 16 HnRNP Al ... 25 Article I ... 3 0 Préambule ... 30 Article II ... 46 Préambule ... 46 Article

m ...

60 Préambule ... 60 I

(8)

Discussion ... . .. ... .. .. ... ... ... .... .. . . . .. ... ... ... .. ... .. . . .. ... .. . . . .. .. . . .. . . .. . . .... ... 101 Éléments de contrôle de l' épissage de A 1 . .. . . ... .. .. . .. .. . . .. .. .. ... .... .. . . .. . . . .. 101

La structure secondaire formée par CE6 bloque le site d'épissage 5' de

l'exon 7B ... 103 La liaison de Al à CEla et CE4 favorise l'exclusion de l'exon 7B ... 105 Al module l'épissage en rapprochant les partenaires les plus distants ... 106 La liaison de A 1 8 à CE4m inhibe le site d' épissage 3' de l' exon 7B . . . .. . . .. . 1 0 7

A 1 est en compétition avec une protéine SR pour la liaison à un

stimulateur d'épissage ... 109 Modèle de régulation de l'expression de Al et de Al 8 ... 110

Autres modèles d'autorégulation de l'épissage alternatif ... 114 Conclusion... 11 7 Remerciements . . .. . . . .. .. . . .. . . .. . . .. . . .. . . 1 18 Références . . . 11 9 Annexe I . . . 151 Préambule... 151 II

(9)

LISTE DES FIGURES

Figure 1 ... 4 Figure 2 ... 5 Figure 3 ... 6 Figure 4 ... 8 Figure 5 ... 9 Figure 6 ... 10 Figure 7 ... 12 Figure 8 ... 1 7 Figure 9 ... 22 Figure 10 ... 27 Figure 11 ... 109 Figure 12 ... 111 Figure 13 ... 113 Figure 14 ... 114 III

(10)

LISTE DES ABRÉVIATIONS

att « alternative-testes-transcript »

BBP/ScSFl S. cerevisiae BBP/SFl

CBC «Cap Binding Complex »

dsx « doublesex »

exu « exuperantia »

FBPl l, FBP12 « Formin Binding Protein » 11 et 12

fru

« fruitless »

hnRNP « heterogenous nuclear RiboNucleoParticle »

mBBP/SFl « mammalian Branchpoint Binding Protein/ Splicing Factor 1 »

PAP « Poly-Adenosine Polymerase »

RBD « RNA Binding Domain »

rp/32 gène de la protéine ribosomale L32

RRM « RNA Recognition motif»

SELEX « Systematic Evolution of Ligands by EXponential enrichment » IV

(11)

snoRNP « small nucleolar RiboNucleoParticle »

snRNA « small nuclear RNA »

snRNP « small nuclear RiboNucleoParticle » « suppressor-of-white-apricot »

sxl « sex-lethal »

tra, tra-2 «transformer» et« transformer »-2

U2AF « U2 snRNP Auxiliary factor »

(12)

RÉSUMÉ

L 'épissage alternatif est une stratégie efficace employée par les métazoaires dans le but de contrôler l'expression et l'identité des protéines cellulaires. Quoique les bases biochimiques et moléculaires de l'assemblage du spliceosome soient bien maîtrisées, la compréhension des mécanismes de régulation de l' épissage alternatif demeure restreinte. Le gène hnRNP Al encode deux isoformes, Al et Al 8 , produites respectivement par exclusion et inclusion de l'exon alternatif 7B. La protéine Al, qui représente le prototype de la famille des hnRNP A/B, lie l' ARN et possède la propriété de moduler l' épissage alternatif. Les introns flanquant l' exon alternatif contiennent plusieurs régions conservées entre l'homme et la souris. Leur identification a permis de mettre en évidence des éléments impliqués dans le contôle de l' épissage de l' exon 7B et a mené à la caractérisation des mécanismes moléculaires utilisés par certains de ces éléments. Parmi ces derniers, se trouve CE6, situé entre l'exon 7B et 8. Celui-ci forme une structure secondaire très stable avec le site d'épissage 5' de l'exon alternatif. La formation de cette structure a pour conséquence de réduire la liaison du snRNP Ul au site d'épissage de l' exon 7B et de provoquer l'exclusion ce dernier in vivo. En plus de CE6, deux éléments contenant un site de liaison à haute affinité pour Al ont été identifiés de part et d'autre de l'exon 7B, soit CEla et CE4. In vivo, ces éléments ont la propriété de promouvoir l'exclusion de l'exon alternatif et, in vitro, l'utilisation d'un site d'épissage 5' distal. La liaison de Al à CEla ou CE4 ne modifie pas l'affinité de Ul pour les sites d'épissage 5' en compétition. Ces observations ont permis de proposer que la liaison de Al à l'ARN, en l'occurrence à CEla et CE4, serait suivie d'une interaction protéine:protéine homomérique entre les molécules de Al. Ceci aurait pour effet de rapprocher dans

(13)

l'espace les sites d'épissage les plus distants et d'augmenter l'avantage compétitif de cette paire de signaux d' épissage. Ce réarrangement structural aurait comme conséquence de réduire l'inclusion de l'exon alternatif. De plus, un élément capable d'inhiber l'épissage a été identifié en aval de l'exon altematif (CE4m). La liaison d'un facteur à CE4m réduit, in vitro, l'utilisation du site d'épissage 3' amont et, in vivo, favorise l'exclusion de l'exon 7B . Les protéines membres de la famille des hnRNP Al/A2 interagissent de façon spécifique avec un ARN correspondant à CE4m, mais seule Al 8 a la propriété de moduler

la sélection des sites d'épissage 3' de façon CE4m-spécifique.

Ces résultats ont permis de caractériser certains mécanismes complexes à l' œuvre dans la régulation précise du niveau d' ARN messager qui inclut un simple exon cassette. Pour une première fois, ces observations démontrent que, chez les mammifères, les deux isoformes Al et Al 8 participent au contrôle de l'épissage alternatif de leur propre ARN

pré-messager, laissant présager une boucle fine d'autorégulation. La distribution des sites de liaison optimaux potentiels pour la protéine Al a été établie pour plusieurs gènes, dont certains possèdent de grands introns. Les sites de liaison potentiels pour Al se trouvent surtout dans les introns et leur distribution est enrichie à proximité des extrémités ainsi que dans le centre de certains grands introns. Ces observations permettent donc de proposer que l'interaction entre molécules de Al liées à l'ARN pourrait aider à réunir une paire de partenaires d' épissage, souvent séparés par des dizaines de milliers de nucléotides.

(14)

INTRODUCTION

Généralités

La régulation de l'expression des gènes responsables de l'homéostasie et de l'intégration des différents processus cellulaires joue un rôle central chez tous les organismes vivants, de la plus simple bactérie jusqu'au plus complexe organisme multicellulaire, comme l'homme. Chez les procaryotes, l'expression génétique est principalement contrôlée lors de la transcription et de la traduction des ARNs messagers. Par contre, chez les eucaryotes, la modulation de l'expression génétique peut s'opérer à tous les échelons de la transmission de l'information. En plus des mécanismes contrôlant la transcription, les cibles de choix pour moduler l'expression des gènes sont la maturation post-transcriptionelle, l'épissage alternatif et la polyadénylation alternative (revue dans Adams et al. 1996; Colgan et Manley 1997; Lopez 1998), le transport des ARNs messagers à travers le cytoplasme (revue dans Arn et Macdonald 1998; Nakielny et Dreyfuss 1999) et la traduction (revue dans Hentze et Kuhn 1996; Sachs 2000). Tout comme la transcription, les événements d'épissage alternatif peuvent être contrôlés de façon spatio-temporelle afin de produire des isoformes protéiques possédant différentes activités (revue dans Adams et al. 1996; Chabot 1996; Lopez 1998). La comparaison de multiples séquences présentes dans les banques d' ADNc à celles de gènes humains, générées par le projet génome humain, permet d'estimer que, chez l'homme, entre 20 et 35 % des gènes subiraient au moins un événement d'épissage alternatif (Mironov et al.

1999; Croft et al. 2000). De plus, l'estimation du nombre d'ARNs messagers différents produits par gène permet d'évaluer que les deux tiers des protéines de l'homme

(15)

proviendraient d'événements d'épissage alternatif (Mironov et al. 1999). Cependant, il faut noter que les données actuelles ne sont qu'une appréciation minimale, compte tenu que les banques d' ADNc ne proviennent que d'un échantillon très limité de tissus humains, dont certaines isoformes histo-spécifiques pourraient être absentes. L'étude des mécanismes contrôlant l'épissage alternatif est donc un sujet passionnant qui permettra de mieux comprendre comment la régulation de l'expression génique s'opère chez les mammifères.

Bien que l'on observe la présence de nombreux gènes possédant des introns chez la levure, autant chez Saccharomyces cerevisiae que chez Schizosaccharomyces pombe, l' épissage alternatif y est généralement absent. Par contre, chez ces deux organismes, la régulation de l'épissage constitutif joue un rôle essentiel dans le contrôle de l'homéostasie cellulaire. Par exemple, le niveau d'expression de la protéine ribosomale L32 (Dabeva et Wamer 1987; Dabeva et Wamer 1993) est contrôlé par une boucle d'autorégulation raffinée. Lorsque le niveau de protéines est suffisamment élevé, L32 lie une séquence particulière dans son unique intron, bloquant ainsi son épissage (Vilardell et Wamer 1994; Li et al. 1996; Vilardell et Wamer 1997). Ceci engendre un ARN contenant un intron ne codant pour aucune protéine, ce qui entraîne la réduction de l'expression de L32. Lorsque le niveau de protéines devient minimal, L32 ne peut s'associer à l'intron et l'épissage de celui-ci rétablit des niveaux normaux de L32.

Chez les eucaryotes supérieurs, l' épissage alternatif et son contrôle sont essentiels à l'intégrité cellulaire. Notre compréhension actuelle des mécanismes d'épissage alternatif émane d'études faites chez la drosophile. Chez cet organisme, la détermination du sexe

(16)

résulte en partie d'une cascade d'événements d'épissage alternatif (revue dans Adams et al. 1996; Chabot 1996). De plus, le contrôle de la transposition des éléments Pest régulé par l'expression de facteurs spécifiques modulant l' épissage de l' ARN de la transposase (revue dans Adams et al. 1996; Chabot 1996).

Chez l'homme, plusieurs maladies génétiques sont causées par des mutations ponctuelles dans les signaux d'épissage (revue dans Krawczak et al. 1992; Hutton et al.

1998; D'Souza et al. 1999). Aussi, il est possible qu'un certain nombre de maladies génétiques, dont les mutations ne touchent pas directement les signaux d'épissage, aient pour effet d'affecter des éléments de contrôle de l'épissage alternatif. La très grande diversité de ces éléments modulateurs et leur très large distribution suggèrent qu'une meilleure compréhension des événements qui contrôlent la sélection des signaux d'épissage permettra de mieux saisir l'origine de ces dysfonctions (Tian et Kole 1995; Liu

et al. 1998; Schaal et Maniatis 1999b; Liu et al. 2000).

Enfin, on a récemment identifié chez les métazoaires certains introns, peu nombreux, qui n'utilisent pas la machinerie conventionnelle, mais plutôt un spliceosome contenant les snRNPs Ul 1 et U12 (Hall et Padgett 1996; Tarn et Steitz 1996). Le rôle et l'importance de ces introns et de cette seconde machinerie d'épissage demeurent obscurs, et leurs origines soulèvent de nombreux débats (Dietrich et al. 1997; Sharp et Burge 1997; Burge et al. 1998).

(17)

Épissage

i~

15' exon l•fs• exon 1 mANA

+

rAG 41(iUAOG!J'\lalla! '--CAAIJCAU_..,lntron

Afin d'éviter des erreurs de phase de lecture pouvant s'avérer catastrophiques pour la cellule, l' épissage doit être accompli avec précision, au nucléotide près. Les ARN s pré-messagers sont épissés par deux réactions consécutives de trans-estérification (Figure 1; revue dans Moore et al. 1993; Staley et

Guthrie 1998). Dans un premier temps, l'attaque nucléophilique du groupement 2'0H

Figure 1 : L'épissage des ARNs pré-messagers

est le résultat de deux réactions de trans- de l'adénosine du site de branchement cause estérification consécutives. Tiré de Staley et

Guthrie, 1998 l'hydrolyse du lien phospho-diester au site

d'épissage 5' et la jonction de l'extrémité 5' de l'intron au site de branchement. Dans un second temps, l' exon 5', qui est libéré à la suite de la première réaction, attaque à son tour la liaison phospho-diester au site d'épissage 3' par son groupement 3'0H libre. Cette attaque relâche l'intron sous forme de lasso ainsi qu'un ARN formé des deux exons ligués l'un à l'autre (Figure 1). Chez les eucaryotes supérieurs, le spliceosome est la machinerie responsable de l'épissage des introns et rivalise en complexité avec celle responsable de la traduction, le ribosome. D'une taille comparable à ce dernier (60S), le spliceosome est formé par l'assemblage successif de 5 petites ribonucléoparticules (snRNP Ul, U2, U4/U6•U5 pour « small nuclear RiboNucleoParticle ») et de plus de 70 facteurs protéiques différents (Figure 2; revue dans Kramer 1996; Will et Lührmann 1997). Il est intéressant de noter que, chez les métazoaires, les signaux reconnus par la machinerie

(18)

d' épissage sont hautement dégénérés et que, dans de nombreux cas, le spliceosome doit joindre un site d'épissage 5' à son partenaire 3 ', tous deux séparés par des dizaines de kilobases. Ceci doit s'effectuer en évitant d'utiliser les nombreux sites potentiels contenus à l'intérieur de ces introns. On peut donc prévoir que plusieurs mécanismes complexes seront mis à contribution afin d'identifier les partenaires 5' et 3' qu'utilisera le spliceosome. Aussi, l'épissage alternatif

~-~~

A'fl'

Figure 2: L'assemblage du spliceosome requiert des snRNPs ainsi qu'un grand nombre de facteurs protéiques, dont certains exigent de l'énergie. Tiré de Staley et Guthrie, 1998

repose essentiellement sur la modulation des événements initiaux dans la formation du spliceosome. Chacune des étapes nécessaires à l'identification des sites d'épissage 5' et 3' ainsi qu'à leur entrée dans le complexe seront donc des points de contrôle potentiels pour moduler l'épissage alternatif. Une bonne compréhension de ces événements est donc requise afin de maîtriser les mécanismes moléculaires mis en place par la cellule pour moduler l'épissage alternatif.

La première étape de l'assemblage d'un spliceosome est la formation du complexe d'engagement qui résulte de l'identification des sites d'épissage 5' et 3' respectivement par le snRNP Ul et le facteur protéique U2AF (pour« U2 snRNP Auxiliary Factor»). Suivant l'établissement d'un réseau complexe d'interactions protéine:protéine, le complexe initial permet d'engager la paire de signaux d'épissage qui sera utilisée pour exciser l'intron (Figure 4). Ces interactions protéine:protéine impliquent, entre autres, les

(19)

U2AF"'~~ U2AF"' • SFlp7S -·~-. . . . . . SApSS,852~ SRJ;:40~ SflpSOe/AS!'ISF2 ~ SAp30blPA264/SC!lll ~ il Il $f!P2j)/)(16, AllP1 ~ 00$ . . .

1

membres de la super-famille des protéines SR (Wu et Maniatis 1993; Kohtz et al.

1994). Ces protéines sont caractérisées par la présence d'un domaine contenant de multiples répétitions de résidus arginine et sérine (d'où le nom de domaine RS) et, dans la majorité des cas, par l'existence d'au moins un domaine de liaison à l 'ARN

Figure 3 : Représentation schématique de la (RRM pour « RNA Recognition Motif» ou structure de certains facteurs d' épissage membres de

la super-famille des protéines SR. Tiré de Chabot,

1996. RBD pour « RNA Binding Domain »;

Figure 3 et revue dans Fu 1995; Manley et Tacke 1996).

La reconnaissance du site 5' provient en grande partie d'interactions ARN:ARN entre Ul et l' ARN pré-messager, et peut être facilitée ou stabilisée par de nombreux facteurs protéiques (Figure 4). De par leur nature modulaire, les protéines SR peuvent à la fois lier l' ARN et recruter des facteurs par interactions protéine:protéine entre leurs domaines RS. Il a été démontré que la protéine SR ASF/SF2 favorise l'utilisation d'un site d'épissage 5', en recrutant Ul par le biais d'interactions entre son domaine RS et celui de la sous-unité Dl-spécifique de 70 kDa (Ul-70k; Kohtz et al. 1994).

La liaison de U2AF à la région riche en pyrimidines en amont du dinucléotide invariable AG définit le site d'épissage 3'. U2AF est un hétérodimère composé de deux sous-unités, une de 65 et l'autre de 35 kDa, qui possèdent chacune un domaine RS (U2AF65 et U2AF35 respectivement, Figure 3; Zamore et Green 1989; Zamore et al.

(20)

1992; Zhang et al. 1992). Grâce à ses trois RRM, la sous-unité U2AF65 est responsable de

la liaison à la région riche en pyrimidines (Zamore et al. 1992), tandis que la sous-unité U2AF35 contacterait l' ARN dans la région du

(a)

dinucléotide AG de certains introns par un --j &on2 domaine encore indéterminé (Merendino et al.

1999; Wu et al. 1999; Zorio et Blumenthal 1999). Le rôle et la nécessité de chacune des sous-unités demeurent très controversés. In vivo, chez la drosophile, les deux sous-unités de même que le maintien de leur interaction sont essentiels à sa viabilité (Kanaar et al. 1993; Rudner et al. 1996; Rudner et al. 1998a). De plus, la présence d'un seul domaine RS, sur l'une ou l'autre des sous-unités, est nécessaire à la viabilité, suggérant que ces domaines pourraient avoir des

(b)

>---!

Exon 3 Figure 4 : Un réseau d'interactions protéine:protéine et ARN:protéine est établi lors de la première étape de la formation du spliceosome. L'interaction entre les facteurs liés aux sites d'épissage 3' et 5' peut s'établir aussi bien à travers un exon qu'un intron. Tiré de Will et Lührmann, 1997.

fonctions redondantes, mais essentielles (Rudner et al. 1998b ). In vitro, plusieurs études démontrent que U2AF65 est suffisante pour épisser certains substrats modèles (Zamore et

Green 1991; Zamore et al. 1992; Fleckner et al. 1997; Guth et al. 1999; Kan et Green 1999), et ce, même pour ceux requérant la participation de stimulateurs d' épissage (Kan et Green 1999). On retrouve fréquemment ces derniers dans les exons alternatifs (Lavigueur

et al. 1993; Tian et Maniatis 1993; Watakabe et al. 1993) ou constitutifs (Yeakley et al.

1993; Schaal et Maniatis 1999a). Ils ont pour rôle de favoriser les étapes précoces de la 7

(21)

formation du spliceosome (Lavigueur et al. 1993; Staknis et Reed 1994), incluant la liaison de U2AF (Wang et al. 1995; Zuo et Maniatis 1996). Par contre, d'autres études démontrent clairement que U2AF35 est aussi essentielle à l' épissage de certains ARN s pré-messagers dépendants d'un stimulateur d'épissage (Zuo et Maniatis 1996; Guth et al. 1999). Des différences entre les substrats modèles utilisés, ou entre les techniques employées pour la déplétion de U2AF de l'extrait nucléaire (chromatographie vs immunodéplétion), ainsi que la présence de facteurs similaires à U2AF35 (Tronchere et al.

1997) pourraient expliquer les résultats divergents observés.

La majorité des ARNs pré-messagers comporte plusieurs introns. Bien que les gènes modèles utilisés pour étudier l' épissage ne possèdent en général qu'un seul intron, il a été remarqué très tôt que la présence d'un site 5' stimule l'excision d'un intron placé en amont (Robberson et al. 1990; Hoffman et Grabowski 1992; Berget 1995). Ces observations ont conduit à l'élaboration du modèle de définition de l'exon voulant que l'unité devant être incluse dans l'ARN messager (l'exon) soit comprise entre un site de liaison pour Ul et pour U2AF. La caractérisation des interactions protéine:protéine que peuvent établir les protéines SR a permis de proposer que la liaison de Ul à un site 5' stimulerait celle de U2AF au site 3' amont. Cette activité résulterait de la formation d'un réseau complexe d'interactions protéine:protéine entre les domaines RS de la sous-unité Ul-70k, les protéines SR, liées ou non à l'ARN pré-messager, et le domaine RS de U2AF (Figure 4b). De plus, le modèle de définition de l'exon prédit l'existence d'interactions entre les extrémités des ARNs pré-messagers et les introns terminaux. La reconnaissance des premiers et derniers sites d'épissage est facilitée par la présence d'éléments particuliers aux ARNs pré-messagers. La liaison du facteur CBC à la coiffe méthylée,

(22)

présent chez tous les ARN s pré-messagers, favorise de Ul au premier d'épissage

5' et al. 1 et l ; Lewis et aL î 996a; Lewis et 1

Toutefois, l'identité du facteur responsable du pont entre CBC et Ul demeure inconnue. La formation de l'extrémité 3' des ARNs messagers, est~à-dire le 'extrérnité

3' et l'ajout la polyacîénosine, est par la présence d'un intron

terminal. dernier intron est par la présence

de (Niwa et al. 1 Niwa et Berget l l; Nesic et 1993; W assarman

et Steitz l et ~.1aquat 1994; Nesic et 1 L'identification récente

interaction entre la sous-unité U2AF65 et polyadénosine polymérase (P AP) permet

d'entrevoir comment l'épissage et polyadényfation pourraient être couplés et

2000).

la suite de l'identification des sites d'épissage, le spliceosome associer les partenaires 5' et 3' dans un même complexe. Chez la levure, on a identifié la participation des facteurs Mud2p, l' orthologue U2AE, et

mammals

BBP/ScSFl, qui reconnaît spécifiquement site de branchemenL L'interaction entre Mud2p, BBP/ScSFl et PRP40, une sous-unité

snRNP U l, serait en mesure de définir les

extrémités 5' et 3' de l 'intron 5· Figuire 5 : Modèles d'interactions permettant d'engager les extrémités d'un intron. Tiré de

' Abovich et Rosbash, 1997.

Abovich et Rosbash 1 Berghmd et

entre Ul-70k, les protéines etle U2AF joueraient le même en ce qui a trait

(23)

à la définition de l'intron (Figure 4a; Kohtz et al. 1994; Staknis et Reed 1994). Ces interactions sont accompagnées d'une liaison coopérative entre U2AF et mBBP/SFl, liaison qui permet d'identifier le site de branchement (Figure 5; Berglund et al. 1998a; Berglund et al. 1998b). Certaines évidences laissent croire que les facteurs FBPl 1 et FBP21 pourraient participer à une interaction entre les sites d' épissage 5' et 3' en liant, à la fois, les snRNP Ul et U2 ainsi que mBBP/SFl (Bedford et al. 1997; Bedford et al. 1998).

Nous avons récemment proposé que la présence de sites de liaison optimaux pour les hnRNPs pourrait permettre de rapprocher dans l'espace les extrémités des grands introns fréquemment retrouvés dans les gènes de mammifères (Blanchette et Chabot

-+-1

----+--+---+-li

--1---111---Figure 6: Les interactions entre les molécules de Al liées dans les introns pourraient en raprocher les extrémités et aider le spliceosome à apparier des partenaires d'épissage distants. Tiré de Blanchette et Chabot, 1997

1997). Les sites de liaison potentiels pour la protéine hnRNP Al sont surtout retrouvés dans les introns. De plus, les extrémités 5' et 3' ainsi que la région centrale de certains grands introns semblent emichies pour la présence de ces sites de liaison (Blanchette et Chabot 1997). Il a donc été suggéré que des interactions protéine:protéine entre molécules de Al liées dans certains introns pourraient en rapprocher les extrémités (Figure 6). Ce phénomène n'est pas sans rappeler le rôle joué par des structures secondaires présentes

(24)

dans certains introns de S. cerevisiae (Newman 1987; Libri et al. 1995; Charpentier et Rosbash 1996; Howe et Ares 1997).

À la suite de la formation du complexe d'engagement, un pré-spliceosome est formé par l'interaction ATP-dépendante du snRNP U2 avec la région du site de branchement (Figure 2). La liaison de U2 implique l'établissement d'un appariement entre son snRNA et l' ARN pré-messager. Cette interaction est stabilisée par un certain nombre de facteurs protéiques incluant U2AF65 et mBBP/SFI. Le mécanisme par lequel

mBBP/SFl stabilise l'interaction entre U2 et le site de branchement demeure toujours inconnu. Par contre, les études de V alcârcel et al. permettent de proposer un mécanisme moléculaire qui expliquerait comment U2AF65 stabilise l'appariement entre U2 et le site

de branchement. Leurs travaux ont démontré que la liaison de U2AF65 à la région riche en

pyrimidines en amont du site 3' positionne le domaine RS de U2AF 65, riche en résidus

basiques, au niveau du site de branchement (V alcârcel et al. 1996). La proximité du domaine RS de U2AF65 et de l 'ARN entraîne la neutralisation des charges négatives des

phosphates et favorise l'appariement du snRNA de U2 au site de branchement (V alcârcel

et al. 1996). Parce qu'elles sont de nature basique, on peut penser que certaines protéines

de la super-famille des protéines SR favoriseraient, entre autres activités, certaines interactions ARN:ARN, comme celle décrite entre U2AF65, le site de branchement et

l' ARN de U2. En plus de recruter le snRNP U2 sur le site de branchement, U2AF permet d'incorporer au complexe une ATPase ARN-dépendante, membre de la famille des ATPase à boîte DExD/H (Fleckner et al. 1997). Cette ATPase permet de modifier la conformation des ARNs et, semble-t-il, aurait comme rôle celui d'aider le snRNA de U2 à s'apparier avec le site de branchement. En addition à mBBP/SFl et U2AF, certaines

(25)

protéines associées à U2 participent à la stabilisation du snRNP au site de branchement. Les facteurs SF3a et SF3b, essentiels à l'épissage (Brosi et al. 1993a; Brosi et al. 1993b), lient l' ARN de façon non spécifique dans la région du site de branchement (Gozani et al.

1996). Quoique leurs rôles ne soient pas encore bien compris, la caractérisation des interactions protéine:protéine entre ces facteurs ainsi que l'identification de leur positionnement sur l' ARN permettent d'établir les bases moléculaires de l'architecture des facteurs dans la région du site de branchement (Figure 7; Gozani et al. 1996).

Figure 7: Certains facteurs aident le snRNA de U2 à s'apparier avec le site de branchement et stabilisent l'interaction de U2. Tiré de Will et

T.iihrm::mn 1 QQ7

Le pré-spliceosome est converti en spliceosome mature par l'association du tri-snRNP U4/U6•U5 dans le complexe (Figure 2). De nombreuses restructurations à l'intérieur du spliceosome vont suivre, ce qui mènera à la formation du spliceosome actif et, rapidement, aux deux réactions de trans-estérification (Staley et Guthrie 1998). Brièvement, le snRNA de U6, qui interagissait avec U4 lors de son entrée dans le complexe, va maintenant être apparié au snRNA de U2, ce qui par le fait même libérera le

(26)

snRNP U4 . Le snRNP Ul est aussi dissocié du complexe et une région très conservée en 5' du snRNA de U6 vient établir de nouvelles interactions de base avec le site d'épissage 5'. Ces restructurations placent l'adénosine du site de branchement dans une position favorable à la première attaque nucléophilique (Figure 1). L'ARN du snRNP US établit des interactions avec l'exon 5', interactions qui sont stabilisées par sa sous-unité de 220 kDa (Beggs et al. 1995). L'exon 5', qui s'est retrouvé libéré à la suite de la première réaction de trans-estérification, est maintenu dans le complexe d'épissage grâce à ces interactions. Les étapes suivantes sont très rapides et n'ont été que très peu étudiées. Après la ligation de l'extrémité 5' de l'intron avec le site de branchement, le spliceosome subit de nouvelles restructurations. Ces dernières visent le positionnement de l' exon 5' et son 3'0H libre, de façon à favoriser la seconde réaction de trans-estérification (revue dans Staley et Guthrie 1998). À la fin de ce processus, l'ARN messager et l'intron, sous forme d'un lasso, sont libérés du complexe, et les différentes composantes du spliceosome, récupérées pour une nouvelle ronde d'épissage (Figure 2).

Le spliceosome est une structure hautement dynamique dans laquelle plusieurs réarrangements majeurs de nature ARN:ARN, ARN:protéine et protéine:protéine ont lieu. Pendant l'assemblage du spliceosome et la réaction d'épissage, les ARNs des snRNPs subissent de nombreux ré-appariements structuraux: ils sont vraisemblablement catalysés par des facteurs de la famille des ATPases ARN-dépendantes, caractérisées par la présence du motif DExD/H (revue dans Hamm et Lamond 1998; Staley et Guthrie 1998). Initialement identifiés chez la levure, ces facteurs, dont plusieurs homologues de mammifères existent, ont la capacité de modifier les duplexes d' ARNs en utilisant comme source d'énergie l' ATP. On croit donc que ces facteurs sont responsables des nombreux

(27)

réarrangements observés dans les ARNs du spliceosome (Hamm et Lamond 1998; Staley et Guthrie 1998).

La phosphorylation réversible joue aussi un rôle important dans l' épissage des ARNs pré-messagers. Les protéines SR, hautement phoshorylées (Roth et al. 1990), sont sans doute les cibles majeures de ces événements. Les études initiales utilisant des phosphatases spécifiques et leurs inhibiteurs ont fourni les premières évidences, à savoir qu'un cycle de phosphorylation/déphosphorylation de certaines protéines est requis pour la formation du spliceosome (Mermoud et al. 1992; Tazi et al. 1992; Mermoud et al. 1994). Des études récentes permettent de proposer certains mécanismes moléculaires pour expliquer ces activités. La phosphorylation des protéines SR diminue leur liaison non spécifique à l' ARN (Tacke et al. 1997; Xiao et Manley 1997) et modifie leurs interactions protéine:protéine (Xiao et Manley 1997; Wang et al. 1998; Xiao et Manley 1998; Yeakley et al. 1999). Bien que l'on ne connaisse pas le rôle exact de ces événements dans la formation du spliceosome, il est maintenant établi qu'un cycle de phosphorylation/déphosphorylation des protéines SR est nécessaire à l'épissage in vitro (Cao et al. 1997; Xiao et Manley 1997; Xiao et Manley 1998; Prasad et al. 1999) Plusieurs protéines kinases spécifiques pour le domaine RS de certaines protéines SR ont été identifiées (revue dans Manley et Tacke 1996). Les deux facteurs les plus étudiés sont Clk/Sty (Colwill et al. 1996) et SRPKl (Gui et al. 1994). Ces derniers constituent les prototypes de familles de kinases exprimées de façon différentielle chez les mammifères (Hanes et al. 1994; Duncan et al. 1995; Nayler et al. 1997; Duncan et al. 1998; Nayler et al. 1998; Wang et al. 1998). L'utilisation de protéines SR ou de la sous-unité Ul-70k phosphorylée de façon irréversible bloque l'épissage, indiquant ainsi qu'une étape de

(28)

déphosphorylation est également requise (Tazi et al. 1992; Xiao et Manley 1998). Par fractionnement biochimique conventionnel, une phosphatase membre de la famille PP2C (PP2C _) a récemment été identifiée comme un facteur d' épissage essentiel (Murray et al. 1999) , mais ses substrats naturels demeurent inconnus.

De plus en plus d'évidences tendent à démontrer qu'un lien étroit existe entre les événements transcriptionnels et post-transcriptionnels. La machinerie responsable de la transcription servirait d'échafaudage aux étapes de maturation de l' ARN pré-messager, c'est-à-dire à l'ajout de la coiffe méthylée en 5' et de la queue de poly-adénosine en 3', ainsi qu'à l'excision des introns. Ce lien semble prendre naissance à partir du domaine C-terminal (CTD pour « C-Terminal Domain») de la grosse sous-unité de 220 kDa de l' ARN polymérase IL Le CTD est un domaine essentiel très conservé composé de multiples répétitions de la séquence peptidique YSPTSPS. Chez la souris, ce peptide est présent en 52 copies et chez S. cerevisiae, en 26 ou 27 copies (revue dans Steinmetz

1997). Lors de l'enclenchement de la transcription, le CTD est peu phosphorylé et on dit de la polymérase II qu'elle est sous sa forme Pol Ila. Une fois la transcription amorcée, le CTD devient hautement phophsphorylé et la polymérase II est alors dite sous sa forme Pol IIo. La Pol IIo hyper-phosphorylée est retrouvée physiquement associée au spliceosome (Chabot et al. 1995; Vincent et al. 1996). Ceci serait le résultat d'interactions directes entre le CTD phosphorylé et des facteurs d'épissage contenant des domaines RS (Mortillaro et al. 1996; Yuryev et al. 1996). Les travaux de McCracken et al. ont su démontrer de façon très élégante l'importance jouée par le CID dans les événements de maturation post-transcriptionnelle. Leurs résultats montrent que la troncation du CTD n'affecte que très peu la transcription, mais bloque la formation des extrémités 5' et 3' de

(29)

l 'ARN messager et réduit l'efficacité avec laquelle la machinerie d' épissage enlève les introns (McCracken et al. 1997a; McCracken et al. 1997b). Ces observations laissent donc présager que la formation du spliceosome pourrait être le résultat d'une mécanique encore bien plus complexe que ce qui a été observé jusqu'à présent.

Épissage alternatif

Chez les métazoaires, l'épissage alternatif joue deux rôles principaux: il permet de générer une myriade de protéines différentes à partir d'un seul gène et est un outil de contrôle très efficace de l'expression génique. Chez les mammifères, un exemple frappant

est le gène codant pour les différentes isoformes de CD44. Ces dernières sont des protéines d'adhésion impliquées dans le mouvement cellulaire. Le gène codant pour CD44 contient dix exons cassettes épissés alternativement sur un total de 20. Chacun des 10 exons alternatifs possède la capacité d'être inclus de façon indépendante dans l' ARN messager, ce qui peut générer une famille de 210 protéines différentes (210 = 1024) possédant toutes des activités distinctes (revue dans Sherman et al. 1996). En plus de produire des protéines ayant des activités différentes, l' épissage est un moyen efficace et très répandu pour moduler l'expression d'un gène de façon spatio-temporelle. Par exemple, l'expression des 20 isoformes distinctes produites par le gène de la fibronectine humaine est régulée très précisément pendant le développement et parmi les différents types cellulaires (revue dans Ffrench-Constant 1995; Komblihtt et al. 1996).

Quoique l'on comprenne assez bien les différentes étapes biochimiques de la réaction d'épissage, les facteurs impliqués de même que leurs rôles dans l'assemblage du spliceosome, nos connaissances actuelles en ce qui a trait aux mécanismes contrôlant le

(30)

choix des signaux d'épissage alternatif demeurent relativement limitées. Plusieurs des concepts originaux que l'on observe aujourd'hui chez les mammifères proviennent d'études faites chez la drosophile, dont certains événements cellulaires essentiels sont contrôlés par épissage alternatif. Comme mentionné précédemment, on sait que, chez cet organisme, la détermination du sexe repose sur une cascade d'événements complexes modulée au niveau de la transcription et de l' épissage alternatif. Chez le mâle, en l'absence du facteur Sxl, un site d' épissage 3' fort présent dans l' ARN pré-messager de TRA est utilisé. L' ARN messager obtenu contient un arrêt transcriptionnel prématuré, ce qui résulte en la production d'une protéine TRA tronquée non fonctionnelle. Chez la femelle, l'expression de la protéine Sxl découle de l'activation de la transcription à partir d'un promoteur sensible à la présence de deux chromosomes X. Le facteur Sxl lie l' ARN pré-messager codant pour la protéine TRA. La liaison de Sxl au site d'épissage 3' mâle-spécifique bloque celle de U2AF et la déplace à un site d' épissage 3' femelle-mâle-spécifique situé en aval (Valcârcel et al. 1993). L'utilisation de ce site d'épissage 3' permet l'expression d'une forme complète et active de TRA (Figure 8). Ce dernier, aidé du facteur TRA2 et de la protéine SR RBPl, provoque l'assemblage d'un complexe stimulateur sur une séquence présente dans l'exon alternatif de l'ARN pré-messager codant pour DSX. La formation de ce complexe amène le recrutement de U2 au site d'épissage 3' faible et cause l'expression de DSX (Figure 8a; Tian et Maniatis 1993; Heinrichs et Baker 1995; Lynch et Maniatis 1995). Finalement, la protéine DSX entraîne l'inhibition des événements de différentiation mâle-spécifique chez la drosophile.

(31)

(a)

tra

(b)

9

DSX products b!ook

male ditterentiatlon lemale dillei'entlation OS.X prod!Jcts block

Somalie ce!ls - repressor of transposition

Germ cetls - P etement transposase

Figure 8 : Régulation de l'épissage chez la drosophile. (a) Le facteur d'épissage Sxl, uniquement présent chez les femelles, bloque l'utilisation d'un site d'épissage 3' et provoque l'expression du facteur TRA. Les facteurs TRA, TRA2 et la protéine SR RBPl forment un complexe activateur sur une séquence dans l'exon alternatif de DSX provoquant son expression. La présence de DSX a pour effet de bloquer la différentiation masculine. (b) Dans les cellules somatiques, l'expression du facteur d'épissage PSI provoque la formation d'un complexe comprenant la protéine hnRNP hrp48 et le snRNP Ul sur un pseudo site d'épissage 5' et en vient à empêcher l'utilisation du site 5' authentique. Tiré de Chabot, 1996.

Le gène codant pour la transposase P représente un second modèle qui a permis d'identifier un élément inhibiteur et de comprendre son mécanisme d'action. La transposistion des éléments P se restreint aux cellules germinales et résulte de l'inhibition de l'expression de la transposase dans les cellules somatiques. Ce contrôle provient de la rétention d'un intron (IVS3 pour « Intervening Sequence 3 ») qui amène la production d'un inhibiteur de la transposase P dans les cellules somatiques (Laski et al. 1986). La formation d'un complexe comprenant la protéine hnRNP hrp48, le facteur tissu-spécifique

(32)

PSI et un certain nombre de facteurs non idenfiés permet le positionnement du snRNP Ul sur un pseudo-site d'épissage 5' en amont du site 5' normal. La formation de ce complexe découle du blocage du site d'épissage 5' authentique et de la rétention de l'intron (Figure Sb; Siebel et al. 1992; Siebel et al. 1994; Siebel et al. 1995; Adams et al. 1997).

Les signaux d'épissage des exons alternatifs sont généralement faibles et dérivent souvent des séquences consensus. Ceci, croit-on, permet au spliceosome une plus grande flexibilité dans la sélection des sites à utiliser. Le contrôle de l'épissage alternatif est un événement très précoce dans la formation du spliceosome. La sélection des sites est souvent modulée directement à l'étape de la reconnaissance du signal sur l' ARN ou lors de l'appariement des partenaires d' épissage. Différents éléments modulant l' épissage alternatif ont été identifiés; on les retrouve à la fois dans les introns et les exons. Certains agissent positivement, d'autres, négativement; certains modulent l'épissage par la formation de structures secondaires, tandis que d'autres nécessitent la liaison de facteurs à l'ARN.

À l'origine identifiés dans certains introns de S. cerevisiae (Newman 1987), plusieurs éléments affectent l'épissage par la formation de duplexes d' ARN très stables. Chez S. cerevisiae, ces éléments favorisent l'appariement des partenaires 5' et 3' en les rapprochant dans l'espace (Newman 1987; Libri et al. 1995; Charpentier et Rosbash 1996; Howe et Ares 1997). Chez les mammifères, une des premières démonstrations d'éléments artificiels capables de moduler la sélection des sites d'épissage a été obtenue à la suite de l'insertion de séquences formant des duplexes dans des ARN s modèles (Solnick 1985). Ces résultats démontrent que, in vitro comme in vivo, il est possible de

(33)

moduler l'épissage alternatif, soit en masquant un site d'épissage par la formation d'un duplexe intra-moléculaire, soit en raprochant dans l'espace deux sites d'épissage distants (Solnick 1985; Eperon et al. 1986; Solnick et Lee 1987; Eperon et al. 1988). Par la suite, plusieurs éléments naturels impliqués dans la formation de duplexes et dans la modulation de l' épissage alternatif ont été caractérisés dans certains gènes (Clouet d'Orval et al. 1991; Libri et al. 1991; Blanchette et Chabot 1997; Côté et Chabot 1997; Muro et al. 1998). Dans quelques cas, ces structures affectent directement la formation du spliceosome en bloquant l'accessibilité à un site d'épissage 5' (Blanchette et Chabot 1997) ou en déstabilisant les liaison de Ul et U2AF aux sites d'épissage 5' et 3' respectivement (Côté et Chabot 1997).

Bien que les éléments structuraux jouent un rôle important dans l' épissage alternatif, la majorité des éléments de régulation identifiés semble nécessiter la présence de facteurs nucléaires. La liaison de ces facteurs à des séquences régulatrices permet de stimuler ou d'inhiber l'utilisation d'un site d'épissage. Chez les mammifères, dans certains exons alternatifs, des éléments stimulateurs ont été identifiés (Lavigueur et al. 1993; Sun et al. 1993; Watakabe et al. 1993; Xu et al. 1993), dont plusieurs sont spécifiquement liés par des protéines membres de la famille des SR (Lavigueur et al.

1993; Fu 1995; Manley et Tacke 1996; revue dans Hertel et al. 1997). On croit que la liaison de ces protéines à un élément stimulateur permet de recruter, au moyen d'interactions protéine:protéine, les facteurs d'épissage généraux Ul et U2AF sur les sites avoisinants.

(34)

Grâce au développement de procédures de sélection et d'amplification in vittro (SELEX), il a été possible de mettre au jour plusieurs nouveaux éléments stimulateu:rs. Les sites de liaison optimaux pour certaines protéines SR ont été obtenus par SELEX. Ces séquences agissent comme des éléments stimulateurs et permettent de confirmer que la liaison des protéines SR dans les exons active l'utilisation de sites d'épissage faibli.es (Tacke et Manley 1995; Tacke et al. 1997; Tacke et al. 1998; Cavaloc et al. 1999). Plusieurs groupes ont aussi développé des approches de SELEX fonctionnel 'l_ui permettent d'identifier directement des stimulateurs d' épissage in vitro (Tian et Ko le 1995) et in vivo (Roberts et al. 1996), à partir de séquences dégénérées insérées dans lUil

ARN pré-messager. Ces approches offrent également la possibilité d'identifier dl.es stimulateurs activés spécifiquement par des protéines SR bien précises (Liu et al. l 9S08; Schaal et Maniatis 1999b; Liu et al. 2000). Ces études démontrent la grande diversiité d'éléments stimulateurs identifiés dans les exons, ce qui, par le fait même, pemnet d'accommoder un très large spectre de séquences codantes.

Dans certains cas, on a observé que la présence d'un stimulateur d'épissa!]ge augmente la liaison de U2AF à un site d'épissage 3' (Lavigueur et al. 1993; Wang et al. 1995). Les stimulateurs d' épissage favoriseraient cette liaison par l' établisseme-nt d'interactions entre le domaine RS de la protéine SR, liée au stimulateur d'épissage. et celui de U2AF35 (Figure 9a; Zuo et Manley 1994). Cependant, l'augmentation de la

liaison de U2AF aux sites d'épissage 3' ne semble que qualitative et ne reflète p.as quantitativement l'accroissement de l'efficacité de l'épissage (Lavigueur et al. 199•3; Wang et al. 1995). Récemment, des études ont fait la démonstration que la liaison crle U2AF n'était pas affectée par la présence d'un stimulateur d'épissage (Guth et al. 199•9;

(35)

Kan et Green 1999; Li et Blencowe 1999). Également, un modèle alternatif expliquant la stimulation observée a été proposé par les travaux de Blencowe (Figure 9b; Blencowe et

~~

Figure 9: Modèles expliquant comment un stimulateur active l'épissage d'un site 3' faible (a) U2AF65 est recrutée au site d'épissage 3' par l'interaction entre les domaines RS d'une protéine SR liée à l' ARN et celui de U2AF35 b) L'interaction du complexe co-activateur SRm160/300 avec les protéines SR est stabilisée par la liaison de Ul au site d'épissage 5' et permet de recruter U2 au site de branchement. Tiré de Blencowe, 2000.

al. 2000). Plusieurs nouvelles protéines SR ont été identifiées (Blencowe et al. 1994; Blencowe et al. 2000). Ces dernières, de haut poids moléculaire (SRm 160 : 160 kDa et SRm300: 300 kDa), forment un complexe SRm160/300 requis pour épisser certains substrats (Blencowe et al. 1998). Les protéines SRm160/300 sont caractérisées par la présence de domaines RS et par l'absence de domaines de liaison à l' ARN (Blencowe et al. 1998). Par contre, SRm160/300 peut être trouvée associée à l' ARN. Toutefois, cette interaction nécessite la présence de U 1 et est stabilisée par U2 et par des protéines SR liées sur un stimulateur d'épissage (Blencowe et al. 1998; Eldridge et al. 1999). Ces résultats permettent de proposer que la liaison des protéines SR au stimulateur d'épissage comme celle de Ul au site d'épissage 5' rendraient possible le recrutement du complexe co-activateur SRml60/300 par le biais d'interactions protéine:protéine (Figure 9b ). Cela aurait pour effet de stabiliser la liaison de U2, préalablement recrutée par U2AF, sur le site de branchement (Eldridge et al. 1999; Blencowe 2000) .

(36)

La sélection des sites d'épissage peut aussi être modulée négativement par des facteurs liant des éléments présents dans les introns (Libri et al. 1990; Clouet d'Orval et al. 1991; Libri et al. 1991; Del Gatto et al. 1996; Chan et Black 1997; Perez et al. 1997; Grossman et al. 1998; Jin et al. 1999; Southby et al. 1999; Zhang et al. 1999) ou dans les exons (Guo et al. 1991; Graham et al. 1992; Amendt et al. 1994; Caputi et al. 1994; Amendt et al. 1995; Del Gatto et Breathnach 1995; Staffa et Cochrane 1995; Zheng et al.

1996; Si et al. 1997; Staffa et al. 1997; Konig et al. 1998; Mayeda et al. 1999; Chew et al.

2000). La très grande diversité des séquences composant ces éléments inhibiteurs laisse entrevoir que de nombreux mécanismes seront impliqués. Récemment, différents facteurs associés à des éléments inhibiteurs ont été identifiés. Par exemple, la protéine hnRNP H lie une région dans un intron de la tropomyosine chez le rat (Chen et al. 1999). La protéine hnRNP I/PTB, pour sa part, lie différents sites 3' épissés alternativement. Elle serait donc en compétition directe avec la liaison de U2AF (Lin et Patton 1995), rappelant ainsi l'activité de Sxl chez la drosophile (Figure. 8a). De plus, certains éléments inhibiteurs semblent fonctionner en recrutant des facteurs d'épissage généraux formant des complexes d'épissage non productifs (Gontarek et al. 1993; McNally et McNally 1996; Cook et McNally 1998; Kan et Green 1999; McNally et McNally 1999). Encore une fois, ce mécanisme est similaire à celui utilisé pour empêcher la transposition des éléments P chez la drosophile (Figure 8b ). En plus de leur rôle de stimulation, certaines protéines SR pourraient avoir des activités inhibitrices. Dans l'unité de transcription tardive Ll de !'adénovirus, la liaison de SC35 hyper-phosphoryié à proximité d'un site de branchement bloque l'utilisation du site d'épissage 3' aval tout en activant l'utilisation du site 3' amont (Kanopka et al. 1996). Lors de l'étape tardive de l'infection, la

(37)

déphosphorylation de SC35 par l'induction d'une phosphatase spécifique réduit sa liaison à l' ARN. Ceci a pour conséquences de libérer le site de branchement et de permettre la liaison de U2 ainsi que l'utilisation du site d'épissage 3' aval (Kanopka et al. 1998).

De plus en plus d'évidences nous indiquent que la régulation de l' épissage alternatif est le résultat d'un équilibre très précis entre de multiples éléments positifs et négatifs. Le gène codant pour la protéine src en est un exemple frappant (Modafferi et Black I999) et représente l'un des modèles les mieux caractérisés chez les mammifères. L' ARN pré-messager transcrit à partir du gène src contient un petit exon de I 8 nucléotides (N 1 ), qui est inclus seulement dans l 'ARN messager produit à partir de cellules d'origine neuronale. L'exclusion de l'exon NI des tissus non neuronaux est en partie attribuable à sa faible taille. Ceci aurait comme conséquence de provoquer un phénomène d'encombrement entre les sites d'épissage 3' et 5'. Cependant, l'exclusion de NI est aussi le résultat de la présence d'éléments inhibiteurs le flanquant (Chan et Black I995). L'inclusion de l'exon NI est sous le contrôle d'un élément stimulateur dans l'intron amont (Black I992; Modafferi et Black 1997). Ce dernier provoque la formation d'un complexe neuronal contenant, entre autres, les protéines hnRNP F (Min et al. I 995) et H (Chou et al. 1999), ainsi que le facteur KSRP (Min et al. 1997). Par contre, le mécanisme impliqué demeure mystérieux et l'absence de facteurs spécifiquement neuronaux nourrit la polémique quant à l'existence de protéines histo-spécifiques modulant l' épissage chez les mammifères.

Comme souligné antérieurement, la formation du spliceosome et la transcription sont deux événements interreliés (revue dans Neugebauer et Roth I 997; Steinmetz I 997).

(38)

Cette relation étroite amène l'hypothèse que le contrôle de l'épissage alternatif pourrait être influencé directement au niveau de l'activation de la transcription. Des études récentes indiquent que, dans la cellule, l'identité du promoteur utilisé pour transcrire un gène modèle influence les événements d'épissage alternatif (Cramer et al. 1997; Cramer

et al. 1999). L'inclusion de l'exon EDI de fibronectine requiert la liaison des protéines SR

à un stimulateur d'épissage (Lavigueur et al. 1993). Cette liaison serait directement affectée par la structure du promoteur (Cramer et al. 1999). Donc, dans certains cas, la modulation de l'épissage pourrait être dictée par des facteurs affectant l'activité transcriptionnelle du gène en question.

HnRNPAJ

L'un des premiers événements observés, suivant la transcription par l' ARN polymérase II, est l'empaquetage des ARNs pré-messagers (aussi appelés hnRNA) dans des complexes ribonucléoprotéiques de très grande taille. Chez certains diptères, ces particules hnRNPs, appelées anneaux de Balbiani, sont gigantesques. D'une taille d'environ 50 nm, ils peuvent même être observés en microscopie optique conventionnelle (revue dans Daneholt 1997). Leur étude a apporté une meilleure compréhension de la dynamique des hnRNPs (Skoglund et al. 1983; Wurtz et al. 1990; Alzhanova-Ericsson et al. 1996; Kiseleva et al. 1997). Chez les mammifères, un traitement à la RNAse des complexes hnRNPs engendre des particules qui sédimentent à 40S et qui protègent des fragments d' ARN longs d'environ 700 nucléotides. Ces particules sont enrichies pour les protéines hnRNP Al, A2, B 1, B2, C 1 et C2 (Beyer et al. 1977). Des analyses plus détaillées ont cependant permis d'identifier que ces complexes renferment plus de 20

(39)

protéines différentes (Pifiol-Roma et al. 1988; Dreyfuss et al. 1993). Les observations initiales avaient grandement nourri la croyance que les hnRNPs avaient, à l'image de ce que l'on imaginait pour les histones et l' ADN, un rôle passif, de chaperonne. On pensait que ces protéines s'associaient aux ARNs de façon non spécifique et ne faisaient que les escorter en les protégeant pendant leurs étapes de maturation et de transport (Beyer et Osheim 1988; Am.ero et al. 1992; Matunis et al. 1992; Zu et al. 1998). Toutefois, lorsque la distribution de différentes hnRNPs a été observée à l'aide d'anticorps spécifiques, on a remarqué que leur répartition n'est pas aléatoire sur l 'ARN pré-messager. Certaines hnRNPs se retrouvent concentrées à des endroits bien précis sur les ARNs (Pifiol-Roma et al. 1989; Matunis et al. 1993; Visa et al. 1996; Wurtz et al. 1996). De plus, l'utilisation du SELEX a permis d'identifier sur l' ARN des sites de liaison optimaux pour certaines de ces protéines (Burd et Dreyfuss 1994; Gorlach et al. 1994; Singh et al. 1995), indiquant que plusieurs d'entre-elles peuvent discriminer certaines séquences.

La protéine Al est le prototype des hnRNPs majoritaires et joue plusieurs rôles importants dans la cellule. Al a été impliquée dans la stabilité (Hamilton et al. 1993; Hamilton et al. 1997) et le transport (Izaurralde et al. 1997) des ARNs messagers; dans la biogénese des télomères (LaBranche et al. 1998) ainsi que dans la modulation de l' épissage alternatif (Mayeda et Krainer 1992; Caceres et al. 1994; Yang et al. 1994; Chabot et al. 1997; Blanchette et Chabot 1999). La protéine Al peut être divisée en deux grands domaines: amino-terminal, contenant deux motifs RBD (pour« RNA Binding Domain») responsables de la liaison aux acides nucléiques (Merrill et al. 1988; Buvoli et al. 1990), et carboxy-terminal, riche en glycine et en arginine (domaine GRD pour

(40)

«Glycine Rich Domain») et impliqué dans des interactions protéine:protéine (Cartegni et al. 1996).

Mon projet de recherche visait à comprendre par quels mécanismes moléculaires la protéine Al modulait l'épissage alternatif. En l'absence de substrats connus régulés naturellement par Al, nous avons entrepris d'utiliser comme gène modèle celui codant pour Al et son isoforme Al 8 , produite par inclusion de l'exon alternatif 7B. Par analogie avec ce que l'on connaissait de la drosophile, nous avons émis l'hypothèse que, tout comme les protéines Sxl (Bell et al. 1991) et TRA2 (Mattox et Baker 1991), Al pourrait possiblement moduler l'épissage alternatif de son propre ARN pré-messager.

RRMl RRM2 GRD

Al ~COOH

GRD

AlBNHz-1 $08j~COOH

Figure 10: Les protéines Al et A18 sont des isoformes qui proviennent d'un gène unique

épissé alternativement. Ces protéines possèdent, à leur extrémité N-terminale, deux motifs de liaison à l' ARN (RRM) et, à leur extrémité C-terminale, un domaine riche en glycine.

La première étape aura été d'identifier des éléments faisant partie del' ARN pré-messager qui pouvaient avoir le potentiel d'être impliqués dans la sélection des sites d'épissage. La comparaison des séquences des introns flanquant l'exon alternatif du gène humain à celui de la souris a permis l'identification de plusieurs régions hautement conservées entre les deux espèces (Chabot et al. 1997). La mise au point d'un modèle

(41)

d'étude in vivo a rapidement permis d'identifier plusieurs éléments impliqués dans l'exclusion de l'exon 7B (Chabot et al. 1997). In vivo, en absence de l'élément CE6, les ARNs épissés incluent majoritairement l'exon 7B (Blanchette et Chabot 1997). Grâce au développement de systèmes modèles in vitro constitués de signaux d' épissage en compétition, nous avons montré que CE6 inhibe l'utilisation du site 5' de l'exon alternatif. Cette activité est le résultat d'un appariement très stable entre CE6 et le site d'épissage 5' de l'exon 7B, ce qui empêche la liaison de UI (Blanchette et Chabot 1997). De plus, deux éléments situés de part et d'autre de l'exon 7B, CEla et CE4, sont nécessaires à l'exclusion de l'exon alternatif in vivo. Ces deux éléments contiennent chacun un site de liaison optimal pour Al. In vitro, ces mêmes éléments favorisent l'utilisation d'un site 5' distal (Chabot et al. 1997; Blanchette et Chabot 1999). Leur présence n'affecte pas la liaison de Ul aux sites d'épissage 5', ce qui nous a permis de proposer que la liaison de Al aux éléments CEla et CE4 serait suivie d'une interaction entre A 1 liée à l' ARN. Cette interaction protéine:protéine permettrait de rapprocher les sites d'épissage distants et de favoriser l'exclusion de l'exon 7B sans pour autant affecter la liaison de UI (Blanchette et Chabot 1999). Également, un inhibiteur d'épissage réduisant l'utilisation du site 3' de l'exon 7B a été identifié à l'intérieur de l'élément CE4 (CE4m; Blanchette et Chabot 1999). CE4m ne requiert pas de la présence du site de liaison optimal pour Al UAGAGU. Par chromatographie d'affinité, il a été démontré que Al, A2, BI et Al8 ont la capacité d'interagir spécifiquement avec l'ARN de CE4m.

Cependant, seule la protéine Al 8 a le pouvoir de moduler la sélection d'un site d'épissage

3' de façon CE4m-dépendante. Enfin, nous avons pu établir que Al et Al 8 ont toutes deux la propriété de moduler la sélection des sites 5' et 3 ', une caractéristique unique

(42)

parmi les facteurs d'épissage connus. Ces résultats impliquent donc les protéines Al et Al 8 dans un réseau complexe d'autorégulation nécessaire à leur expression.

(43)

ARTICLE!

Blanchette, M. and Chabot, B. (1997) A Highly Stable Duplex Structure Sequesters the 5'

Splice Site Region ofhnRNP Al Alternative Exon 7B. RNA 3:405-419.

Préambule

Ce manuscrit rapporte la caractérisation d'un premier élément dans l'intron en aval de l'exon alternatif 7B. Les résultats ont permis de caractériser le mécanisme utilisé par CE6 afin de promouvoir l'exclusion de l' exon alternatif. CE6 forme une structure secondaire stable avec le site 5' de l'exon alternatif, ce qui bloque la liaison du snRNP UL J'ai réalisé toutes les expériences présentées dans cet article.

(44)

RNA (1997), 3:405-419. Cambridge University Press. Printed in the USA. Copyright© 1997 RNA Society.

A highly stable duplex structure sequesters

the 5' splice site reg ion of hnRNP A 1

alternative exon 78

MARCO BLANCHETTE and BENOIT CHABOT

Département de Microbiologie et lnfectiologie, Faculté de Médecine, Université de Sherbrooke, Sherbrooke, Québec, Canada J1 H 5N4

A8STRACT

Exon 78 in the hnRNP A 1 pre-mRNA is alternatively spliced to yield A 1 and A 18 , two proteins that differ in their ability to modulate 5' splice site selection. Sequencing the murine intron downstream of exon 78 revealed the existence of several regions of similarity to the corresponding human intron. ln vitro splicing assays indicate that an 84-nt region (CE610) decreases splicing to the proximal 5' splice site in a pre-mRNA carrying the 5' splice sites of exon 7 and 78. ln vivo, the CE610 element promotes exon 78 skipping in pre-mRNAs expressed from a mini-gene containing the hnRNP A1 alternative splicing unit. Using oligonucleotide-targeted RNase H cleavage assays, we provide support for the existence of highly stable base pairing interactions between CE610 and the 5' splice site region of exon 78. Duplex formation occurs in naked pre-mRNA, resists incubation in splicing extracts, and is associated with a reduction in the assembly of U1 snRNP-dependent complexes to the 5' splice site of exon 78. Our results demonstrate that pre-mRNA secondary structure plays an important role in promoting exon 78 skipping in the A1 pre-mRNA.

Keywords: RNA structure; splice site selection; splicing; U1 snRNP

INTRODUCTION

The selection of splice sites in messenger RNA precur-sors (pre-mRNAs) is accomplished through the par-ticipation of several cis and trans-acting elements. Initially, the 5' and 3' splice sites are recognized by Ul

snRNP and U2AF65, respectively. Additional elements

and factors also influence the interactions of Ul snRNP

and U2AF65 with splicing signals (reviewed in Black,

1995; Reed, 1996). Factors that improve splice site rec-ognition include members of the SR family of proteins (reviewed in Fu, 1995; Chabot, 1996; Manley & Tacke, 1996). The SR protein SF2/ ASF stimulates Ul snRNP binding to 5' splice sites (Eperon et al., 1993), a process mediated through an interaction with the Ul snRNP 70K protein (Wu & Maniatis, 1993; Kohtz et al., 1994). Constitutive and regulated splicing enhancers bound by SR proteins can also improve 3' splice site recog-nition by U2AF65 (Lavigueur et al., 1993; Wang et al.,

1995; Zuo & Maniatis, 1996). In this case, the assembly of an enhancer complex containing U2AF35 recruits

Reprint requests to: Benoit Chabot, Département de Microbiolo-gie et InfectioloMicrobiolo-gie, Faculté de Médecine, Université de Sherbrooke, 3001 12e Avenue Nord, Sherbrooke, Québec, Canada JlH 5N4; e-mail: b.chabot@courrier.usherb.ca.

U2AF65 through SR/U2AF35 /U2AF65 protein-protein

interactions (Wu & Maniatis, 1993; Zuo & Maniatis, 1996). SR proteins are also required when a Ul-bound 5' splice site stimulates upstream 3' splice site utiliza-tion through exon-bridging interacutiliza-tions (Robberson et al., 1990; Wang et al., 1995). The best examples doc-umenting the negative regulation of Ul snRNP and U2AF65 binding have been described in Drosophila. In

the case of the P-element pre-mRNA, sequences up-stream of the germ-line-specific 5' splice site promote the assembly of a complex containing Ul snRNP, hrp48, and the soma-specific protein PSI that prevents Ul snRNP binding at the authentic site (Siebel et al., 1994, 1995). In the case of the male-specific 3' splice site of

transformer, U2AF65 binding is down-regulated by sex lethal (Valcarcel et al., 1993). A similar task may be accomplished by the mammalian PTB protein during a-tropomyosin pre-mRNA splicing (Lin & Patton, 1995). Finally, the effect of SR proteins on mammalian 5' splice site selection is counteracted with different efficiencies by the heterogeneous ribonucleoparticle (hnRNP) Al, Al 8 , A2, and Bl proteins (Mayeda & Krainer, 1992; Caceres et al., 1994; Mayeda et al., 1994; Yang et al., 1994). How hnRNP proteins impose distal 5' splice site selection remains to be determined.

Références

Documents relatifs

Cela a permis de réaliser un dosage plasmatique chez des patients atteints d'un cancer médullaire de la thyroïde (CMT) et quelques sujets témoins.. Le CCP II

Figure 5.4: Comparison of the beaconing reception probability when using the CW value currently proposed in the standard, the optimal fixed contention window and the reverse

Pour l'illustrer, je reprends les propos du Subcomisionado Caceres Rivas (2008). Par ces propos, le Subcomisionado vient confirmer ce qui a été avancé

Un tel mécanisme semble de nature à engendrer des mouvements de prix périodiques, mais il n’en est rien, pour une raison très simple : s’il apparaissait un tant soit peu dans

Les commentaires, les recommandations, les votes, la possibilité de participer ou d’interagir en temps réel avec les contenus sont autant de nouveaux usages destinés à rapprocher

Davis’ analysis takes the form of two tests: the individuation test, which is meant to distinguish individuals from each other at any point in time, and the reidentification

Cette €pid€mie ayant s€vit dans l’Oc€an Indien et notamment sur l’ƒle de La R€union a €t€ exceptionnelle „ plusieurs titres : l’apparition d’un virus

One consequence of the machinery developed in the previous section is that we can use it to provide an exact characterization of all of the Martin-L¨of random Turing degrees