• Aucun résultat trouvé

Etude du mécanisme de transposition de la Séquence d'Insertion bactérienne IS608

N/A
N/A
Protected

Academic year: 2021

Partager "Etude du mécanisme de transposition de la Séquence d'Insertion bactérienne IS608"

Copied!
345
0
0

Texte intégral

(1)

T

T

H

H

È

È

S

S

E

E

En vue de l'obtention du

D

D

O

O

C

C

T

T

O

O

R

R

A

A

T

T

D

D

E

E

L

L

U

U

N

N

I

I

V

V

E

E

R

R

S

S

I

I

T

T

É

É

D

D

E

E

T

T

O

O

U

U

L

L

O

O

U

U

S

S

E

E

Délivré par l'Université Toulouse III - Paul Sabatier

Discipline ou spécialité : Microbiologie et Génétique Moléculaires

JURY

Dr. C. GUTIERREZ, Professeur, U.P.S, Toulouse

Dr. J.M. CASACUBERTA, Directeur de Recherche, CSIC-IRTA, Barcelone Dr. D. MAZEL, Directeur de Recherche, Institut Pasteur, Paris

Dr. B. HALLET, Professeur, U.C.L, Louvain-la-Neuve Dr. B. TON-HOANG, Chargée de Recherche, L.M.G.M., Toulouse

Dr. M. CHANDLER, Directeur de Recherche, L.M.G.M., Toulouse

Ecole doctorale : Biologie-Santé-Biotechnologies, Toulouse

Unité de recherche : Laboratoire de Microbiologie et Génétique Moléculaires, UMR5100 CNRS-UPS Directeur(s) de Thèse : Dr. M. CHANDLER et Dr. B. TON-HOANG, L.M.G.M., Toulouse

Rapporteurs : Dr. J.M. CASACUBERTA, Directeur de Recherche, CSIC-IRTA, Barcelone

Présentée et soutenue par Catherine GUYNET Le 30 mai 2008

Titre : Etude du mécanisme de transposition

(2)
(3)

Hallet. Merci pour l’intérêt qu’ils ont porté à mon travail et leur présence à ma soutenance.

Je remercie également mes deux co-directeurs de thèse, Bao Ton-Hoang et Mick Chandler. Un grand merci, Mick, de m’avoir accueillie dans ton laboratoire, pour la confiance que tu m’a accordée tout au long de ces (presque) quatre années. Merci de m’avoir permis de travailler dans des conditions exceptionnelles, avec beaucoup de libertés, et d’avoir partagé ta richesse scientifique et ta rigueur (merci de m’avoir donné le goût des "beaux" gels…). Merci également pour ton soutien quotidien, tes encouragements, ta compréhension, ta patience… et ton impatience aussi, autant de facteurs qui ont été très motivants pour moi. Et puis, je peux l’avouer maintenant, merci de m’avoir permis de commencer cette thèse, malgré avoir constaté très précocement mon caractère (très légèrement) têtu. Merci enfin de m’avoir permis de participer à la collaboration avec le laboratoire de Fred Dyda, qui m’a fortement enrichie scientifiquement et personnellement.

Bao, je ne te remercierai jamais assez de m’avoir appris le métier de la Recherche et d’avoir partagé avec moi cette fameuse IS608. Merci pour ton investissement au quotidien, ta patience, ta disponibilité, ta gentillesse, merci aussi pour les nombreuses discussions et tous tes précieux conseils. Je suis vraiment fière d’avoir été ta première étudiante en thèse ; ta rigueur, ton ingéniosité, ta passion pour la recherche, resteront un modèle pour moi.

Encore un grand merci à Bao et Mick pour toutes ces réunions pleines de gaîté qui vont me manquer. J’aurais encore beaucoup de choses à écrire, alors simplement merci à vous deux de m’avoir permis de "m’amuser" avec IS608 pendant toute ma thèse, tout en me guidant dans mes travaux.

Je remercie vivement les IS608istes outre Atlantique et parisiens: merci Fred, Alison, Don, Orshi, Cécile et Suzanne, avec qui il a été très motivant et plaisant de travailler. Merci Fred et Alison pour votre accueil et votre gentillesse. Un grand merci aussi à la famille Weisberg, Eve, Bojan, Sofia et Philip, Bob et Judy, merci de m’avoir accueillie avec tant de sympathie.

Un grand merci à tous les autres membres de l’équipe, passés et présents, pour leur accueil et leur présence. Merci Philou, d’abord pour tout ce que tu m’as appris pendant mon DEA, puis pendant mon monitorat. Merci pour tes conseils (promis j’essaierai de m’en souvenir, au moins à chacun de mes potentiels futurs séminaires…) et les nombreuses discussions. Merci aussi de m’avoir supportée comme voisine de paillasse, dommage d’ailleurs qu’on n’ait pas continué notre concours de sculptures en agarose. Merci pour les discussions VTT, un jour peut-être, on arrivera à faire une rando ensemble! Je déplore tout de même encore ton choix pour le scooter… Merci Guy pour tes précieux conseils scientifiques

(4)

merci pour tes encouragements, ton soutien, ton sourire, ton aide, tes conseils, en particuliers dans les moments de baisse de forme. C’est un plaisir de travailler à tes côtés. Merci Patricia d’avoir tenté de me faire comprendre au mieux la bioinfo, merci pour ton aide sur IS608, et merci aussi pour les pauses café, les discussions et les délices sucrés et salés dont tu as le secret. Merci Prya pour ta bonne humeur permanente et ta gentillesse. Merci Adeline pour ton aide et ta gentillesse, ça a été un vrai plaisir de travailler avec toi, je te souhaite bon courage et bonne chance pour la suite. Merci Edith, je suis bien contente de t’avoir légué mon bureau, merci pour les salades de riz… et bonne continuation chez les Chandler. Merci Lilia pour tes nombreux services, et toutes les discussions animées (et aussi pour m’avoir confié ton fils pendant quelques minutes). Merci à mes deux collègues du "bureau des jeunes" au début de ma thèse, Erwan et Jonathan, vous êtes partis trop tôt. Merci aussi Céline, pour ta gentillesse, ton accueil quand j’étais encore toute petite, et tes conseils, c’est toi qui m’a appris à apprivoiser mon premier gel séquence (le premier d’une très longue série!). J’espère qu’on aura l’occasion de partager encore une chambre en congrès (mais cette fois, pas de présentation!). Vielen dank Oliver, das war sehr angenehm mit dir zu bearbeiten, viel glück mit IS911. Je remercie et souhaite une très bonne continuation à tous les "plus jeunes" qui sont passés par le labo Chandler : Yoan, Sophie, Mike, Cyrielle, Nathalie, William, Yvan. Merci Natalia de m’avoir supportée comme maître de stage, bonne chance et bon courage pour ta thèse. Bon courage et bonne chance à la future thésarde IS608, Laure.

Un énorme merci à Lulu, Trang, et Danka pour les centaines de litres de LA et les kilos de vaisselle, pour les rires dans les couloirs, pour votre extrême serviabilité. Je tiens à remercier également tous les services de l’IBCG qui ont grandement facilité mon travail au quotidien, merci pour votre gentillesse et pour avoir toujours réparé mes bêtises…: l’administration, Lilia, Sandrine, Brigitte, Michèle, Safi, Christine, le service informatique, Jocelyne Laurent et Sylvain, merci David à la repro pour les posters de dernière minute et les séances photos, technik, Vincent, Yves, François, Gérard, Jean Marc.

Merci les poulettes de l’IBCG, Coralie C., Noëlle, Adeline, Edith (piscine ?), Roxane, Magali, Coralie H., Isa, pour les fous-rires, les "craquages" de fin de journée, les pauses chantantes (Coralie C.)…et comme dirait Noëlle : « à la revoyure ! »…

Un grand merci tout spécial à Noëlle et Coralie C., collègues thésardes, amies et confidentes pendant ces années mouvementées. Merci pour votre patience, votre soutien, vos conseils et votre amitié (merci aussi Noëlle pour la coloc…), merci pour vos encouragements, souvent musicaux, de fin de journée à la paillasse, et merci pour toutes ces longues discussions sur mon IS préférée et tout le reste, ne changez rien.

Je remercie également tous ceux et toutes celles avec qui j’ai partagé une pause café, échangé quelques mots ou juste un sourire dans le couloir ou sur les marches du bâtiment.

Je tiens à remercier mes maîtres de stage successifs, dans l’ordre : Jean-François Eléoüet, qui m’a donné le premier le goût de la paillasse, Hugues Bedouelle, Gilles Meyer,

(5)

concrétiser ce projet.

Merci à Monsieur et Madame Kebab, surtout pour les cigares, merci à Zezette, la célèbre et fidèle R11, qui m’a véhiculée partout pendant plus de 23 ans, les lapinoux, Billy, Suzie, et le petit dernier Eliot, et mon sponsor préféré, Kinder®.

Je tiens à remercier Meselu, pour la préparation et le service de l’excellent repas éthiopien, et merci à Pascal Cornet pour tout et surtout l’organisation de ma soirée de thèse.

Le reste n’aurait pas sa place ici, alors simplement François, merci pour tout. Merci à toute la famille de François, en particulier Anaëlle, Maxime et Lola, pour le soutien et merci d’être aussi adorables.

Merci à ma famille, la liste serait trop longue, alors merci à tous, merci à ma grand-mère, merci en particulier à tout ceux qui ont fait le déplacement à Toulouse : Laurence et Christian, Nadine et Roger mon parrain, Yvette et Jean-Pierre, Fernanda et Gilles (et aussi Angélique et mon filleul Bastien), Titi et Gwen. Un grand merci tout spécial à mes amis (presque) de toujours, Suzanne et Fabrice (et le beau Matteo bien sûr), et Guillaume, merci de m’avoir soutenue pendant toutes ces années, et merci Sébastien.

J’aurais voulu remercier mon père, pour tout ce qu’il a fait pour moi avant de nous quitter, beaucoup trop tôt. Merci à mon grand frère Philippe, alias Titi mon idole, merci pour le soutien, les encouragements, et … tout ce que tu as fait pour moi depuis toujours ; et enfin, merci infiniment à ma mère, qui m’a toujours soutenue, à tous les niveaux, qui m’a permis d’écrire cette thèse, merci de m’avoir encouragée, de m’avoir fait confiance, et merci d’être un modèle pour moi.

(6)
(7)

A mon père,

A mon frère,

(8)
(9)

PREMIERE PARTIE: INTRODUCTION GENERALE ... 6

DEUXIEME PARTIE : LA CATALYSE DE LA TRANSPOSITION... 14

CHAPITRE I : LES TRANSPOSASES A MOTIF CATALYTIQUE DDE... 15

1. La catalyse ... 16

1.1. Structure tridimensionnelle du domaine catalytique ... 16

1.2. Le mécanisme de catalyse ... 18

1.2.1. La réaction de transfert de liaison phosphoryle... 18

1.2.2. Rôle catalytique des cations bivalents... 19

1.2.3. Le modèle de catalyse à deux ions... 20

2. Variété des éléments utilisant une transposase à motif catalytique DDE ... 21

3. Stratégies transpositionnelles... 23

3.1. L’élément est lié au donneur : la transposition réplicative... 23

3.2. L’élément est libéré du donneur : la transposition « couper-coller » ... 24

3.2.1. Formation de structures en « épingle à cheveux » ... 24

3.2.2. Le cas de Mos1 et de la famille Tc/mariner ... 26

3.2.3. Intervention de deux protéines : Tn7 ... 26

3.3. L’élément est libéré du donneur : la transposition « copier-coller » ... 27

3.3.1. Formation d’un intermédiaire circulaire ... 27

3.3.2. Les rétroéléments LTR : rétrovirus et rétrotransposons ... 28

4. Intégration de l’élément ... 28

4.1. Duplication de l’ADN cible ... 28

4.2. Spécificité de la cible ... 29

4.3. Influence de la réplication sur la spécificité d’insertion... 32

5. La catalyse au sein du transpososome... 32

5.1. Les interactions ADN-transposases... 33

5.1.1. Les extrémités des éléments... 33

5.1.2. Les domaines de fixation à l’ADN des transposases à motif DDE... 34

5.2. La stoechiométrie des complexes actifs en transposition... 36

5.3. Facteurs affectant l’assemblage et la stabilité des transpososomes... 38

5.4. Le transpososome de Tn5 : le modèle minimal... 39

Structure du transpososome ... 40

La conformation de l’ADN ... 41

Les interactions ADN-transposase ... 41

La catalyse ... 42

CHAPITRE II : LES TRANSPOSASES A SERINE... 44

1. Les recombinases à sérine... 45

2. La catalyse ... 46

2.1. Structure tridimensionnelle du domaine catalytique ... 46

2.2. La réaction de transfert de liaison phosphoryle... 47

2.3. Un modèle de catalyse... 48

2.4. La réaction de recombinaison : mécanisme général... 49

3. Les recombinases à sérine et la transposition ... 49

3.1. Résolution des intermédiaires de transposition des éléments de la famille Tn3 ... 50

(10)

La séquence d’insertion IS607 ... 52

3.2.2. Mécanisme de transposition : « couper-coller » ... 52

4. Intégration de l’élément : spécificité de la cible ... 53

5. Le contrôle des réactions de recombinaison ... 55

5.1. Les résolvases et les invertases ... 55

5.2. Les intégrases de phages ... 57

5.3. Les transposases à sérine... 58

6. La catalyse au sein de la synapse ... 59

6.1. Structure du complexe synaptique de la résolvase de ... 59

6.2. Les transposases à sérine... 61

CHAPITRE III : LES TRANSPOSASES A TYROSINE... 64

1. Les recombinases a tyrosine ... 65

2. La catalyse ... 66

2.1. Structure tridimensionnelle du domaine catalytique ... 66

2.2. La réaction de transfert de liaison phosphoryle... 68

2.3. Un modèle de catalyse... 68

2.4. La réaction de recombinaison : mécanisme général... 69

3. Les recombinases à tyrosine et la transposition ... 70

3.1. Intégration et excision des transposons conjugatifs : mode "couper-coller"... 70

3.2. Intégration et excision des rétrotransposons : mode "copier-coller" ... 72

4. Intégration de l’élément : spécificité de la cible ... 72

5. Le contrôle des réactions de recombinaison ... 73

5.1. La conformation et l’orientation de l’ADN dans le complexe synaptique... 74

5.2. Utilisation de protéines et de sites accessoires : exemple du bactériophage  ... 74

5.3. Filtre topologique : exemple de Tn4430 ... 75

5.4. Les sites de recombinaison formés par un ADN simple brin ... 75

6. La catalyse au sein de la synapse ... 77

6.1. Structure du complexe synaptique ... 77

6.2. Les intégrases des transposons Tn916 et CTnDOT ... 79

6.2.1. Tn916... 79

6.2.2. CTnDOT ... 80

CHAPITRE IV : LES TRANSPOSASES RC ... 81

1. La superfamille des protéines HUH... 82

2. Les fonctions des protéines de la famille HUH ... 83

2.1. Les protéines RCR ... 83

2.2. Le virus AAV ... 84

2.3. Les protéines Mob... 85

3. La catalyse ... 86

3.1. Structure tridimensionnelle du domaine catalytique ... 86

3.2. Les deux résidus tyrosine ... 87

3.2.1. Le motif YxxxY : la protéine Rep de AAV ... 87

3.2.2. Les deux résidus tyrosine des relaxases ... 88

3.3. La réaction de transfert de liaison phosphoryle... 88

3.4. Le rôle des cations bivalents ... 89

3.5. Un modèle de catalyse... 89

4. Le mécanisme de transposition en cercle roulant ... 90

4.1. Les extrémités des transposons RC ... 91

4.2. La transposition avec une seule extrémité... 92

4.3. Un mécanisme de transposition RC : "copier-coller"... 92

4.4. Un modèle alternatif... 93

5. Intégration de l’élément : spécificité de la cible ... 94

(11)

CHAPITRE V : CARACTERISATION DE LA SEQUENCE D’INSERTION IS608 ... 100

1. Présentation de la publication n°1... 101

1.1. Transposition d’IS608 : excision sous forme circulaire ... 101

1.2. Détermination des séquences requises dans les extrémités pour l’activité de transposition d’IS608 ... 102

1.3. Activité de TnpA in vitro ... 102

2. Un nouveau mécanisme de transposition ? ... 103

3. Publication n°1 ... 104

CHAPITRE VI : MISE AU POINT D’UN SYSTEME DE TRANSPOSITION IN VITRO ... 112

1.1. TnpA, une endonucléase simple brin ... 113

1.2. Excision et intégration in vitro ... 113

2. Publication n°2 ... 114

3. Résultats complémentaires... 123

3.1. Mise au point du système in vitro ... 123

3.2. Essais sur des molécules superenroulées in vitro ... 124

CHAPITRE VII : STRUCTURE DE LA TRANSPOSASE TNPA ... 125

1. Présentation de la publication n°3... 126

1.1. Structure tridimensionnelle de TnpA ... 126

1.2. Un site catalytique partagé entre les deux monomères ... 127

1.3. Une configuration inactive ? ... 128

1.4. Les interactions ADN-protéine ... 128

2. Publication n°3 ... 129

3. Résultats complémentaires... 137

3.1. Les complexes synaptiques ... 137

3.1.1. Nature des complexes synaptiques ... 137

3.1.2. Activité des complexes synaptiques ... 138

3.1.3. Séquences requises pour la formation de complexes synaptiques stables... 138

3.2. Discrimination des deux brins par la base extrudée T17 ?... 139

3.2.1. Formation des complexes synaptiques in vitro... 139

3.2.2. Activités de clivage et transfert de brin in vitro ... 141

3.2.3. Activité de transposition in vivo ... 141

3.3. Importance de la boucle ... 142

CHAPITRE VIII : L’ADN INDUIT L’ASSEMBLAGE DU SITE CATALYTIQUE DE TNPA ... 143

1. Les résultats présentés dans la publication n°4... 144

1.1. Le changement de conformation de TnpA induit par l’ADN... 144

1.2. Le site catalytique de TnpA ... 145

1.3. Un clivage en trans et une résolution en cis ? ... 145

2. Résultats complémentaires... 146

2.1. Rôle des ions métalliques ... 146

(12)

1. Les résultats présentés dans la publication n°4... 150

2. Résultats complémentaires... 151

2.1. Asymétrie de clivage entre les deux extrémités ... 151

2.1.1. Etude du clivage et du transfert de brin in vitro... 151

2.1.2. Etude de la transposition in vivo ... 152

2.2. Mouvement de l’hélice D : étude des résidus glycine 117 et 118 ... 153

2.3. Changement de la spécificité de clivage in vitro... 153

2.4. Le clivage de la jonction in vitro... 154

3. Publication n°4 ... 155

CHAPITRE X : ETUDE DE LA SPECIFICITE D’INSERTION... 167

1. Problématique ... 168

2. Intégration de la jonction in vitro et choix de la cible... 168

QUATRIEME PARTIE : DISCUSSION GENERALE ET PERSPECTIVES ... 171

1. Un modèle du mécanisme de transposition d’IS608... 172

2. La transposition d’IS608 et l’ADN simple brin in vivo ... 174

2.1. Le lien avec la réplication ... 175

2.2. Les autres processus générant de l’ADN simple brin ... 177

2.2.1. La conjugaison et la transformation ... 177

2.2.2. Le surenroulement de l’ADN ... 178

2.2.3. La réponse de Deinococcus radiodurans à l’irradiation ... 179

2.3. L’intermédiaire circulaire... 180

2.4. Conclusions ... 181

3. La régulation de l’expression de tnpA et tnpB ... 181

4. Regulation de la transposition d’IS608 : facteurs de l’hôte ... 182

5. La famille IS200/605 : une position évolutive importante... 182

MATERIELS ET METHODES ... 184

(13)

ABREVIATIONS

3’-OH 3’-hydroxyl 5’-P 5’-phosphate A Alanine Å aa acide aminé

AAV Adeno-Associated Virus

ADN Acide Désoxyribonucléique

ARN Acide Ribonucléique

ASV Avian Sarcome Virus

ATP Adénosine triphosphate

C Cystéine °C Degré Celsius Ca2+ Calcium (ion) Cm Chloramphénicol Co2+ Cobalt (ion) Cu2+ Cuivre (ion) D Acide Aspartique

ds double strand (double brin)

E Acide glutamique

EDTA Ethylène Diamine tetra-acétate de sodium ET Elément transposable F Phénylalanine G Glycine h heure H Histidine

HIV Human Immunodeficiency Virus

HP Hairpin (épingle à cheveux)

HTH Helice-Tour-Hélice

(Helix -Turn- Helix )

HUH Histidine-résidu

hydrophobe-Histidine

IE Inside End

IR Inverted Repeat

IRL Inverted Repeat Left

IRR Inverted Repeat Right

IS Insertion Sequence

K Lysine

kb kilo bases

kDa kilo Dalton

L Leucine

LE Left End (Extrémité gauche)

LZ « Leucine Zipper »

(i.e fermeture éclair à Leucines) LTR Long Terminal Repeat

M Mole par litre

MgCl2 Chlorure de magnésium

Mg2+ Magnésium (ion)

min minute

MITE Miniature Inverted repeat

Transposable Elements Mn2+ Manganèse (ion) Mob Mobilisation μl microlitre N Asparagine Ni2+ Nickel (ion) nt nucléotide OE Outside End

orf open reading frame

(phase ouverte de lecture) P Proline

Pjunc Promoteur formé par la jonction

IRL-IRR

Pb paires de bases

PCR Réaction de polymérisation en chaîne

PCV2 Porcine Circovirus 2

PEC Paired End Complex

Q Glutamine R Arginine

RCR Réplication en Cercle Roulant

RC Cercle Roulant

RDF Facteur de Directionnalité de la

S Sérine

sec seconde

SDS-PAGE électrophorèse en gel de poly-acrylamide - sodium dodecyl sulfate

SN2 Substitution Nucléophile

Bimoléculaire

ss single strand (simple brin)

TBE Tris-Borate-EDTA

TGE Tris-Glycine-EDTA

Tgt Target (cible)

TYLCV Tomato Yellow Leaf Curl Virus

W Tryptophane

WT Wild Type (sauvage)

Y Tyrosine Zn2+ Zinc (ion)

(14)
(15)

INTRODUCTION

GENERALE

(16)

0 50 100 150 200 250 300 350 400 450 IS1 IS

1595 IS3 IS481 IS4 ISH3 IS701

IS 1634 IS5 IS 1182 IS6 IS21 IS30 IS256 IS630 IS982 ISAs 1 IS 66 IS 110 IS91 IS 200/ IS 605 IS 607 IS 1380 ISL3 ISNC Y Tn 3

Histogramme représentant le nombre d'éléments de chaque famille de séquences d'insertion répertoriées à ce jour dans la base de données ISfinder.

En bleu: les éléments codant une transposase à motif catalytique DDE, en rouge les autres éléments.

(17)

Les Eléments Transposables (ETs) jouent un rôle moteur fondamental dans la plasticité et l’évolution des génomes. La transposition est définie comme le mouvement d’un segment discret d’ADN d’un locus à un autre, entre fragments non homologues, au sein du génome qui les abrite. L’existence d’éléments génétiques mobiles a été mise en évidence pour la première fois en 1948 par Barbara Mac Clintock au cours de ses travaux de génétique sur le maïs. La mobilité d’éléments particuliers, qu’elle appela les « controlling elements », était à l’origine d’instabilités génétiques conduisant à des variations de pigmentation de grains de maïs (McClintock, 1948; McClintock, 1962). Ces travaux, qui ont démontré la nature dynamique des génomes, lui ont valu le prix Nobel en 1983. Depuis cette découverte, les mécanismes moléculaires de transposition des éléments transposables ont été largement étudiés, notamment chez les bactéries. Les ETs entraînent de nombreux remaniements à l’origine de modifications structurales des gènes et génomes, de la bactérie à l’homme. Ces réarrangements (délétions, duplications, formation de nouveaux gènes) peuvent être directement liés à la transposition, ou résulter d’évènements de recombinaison homologues catalysés par la machinerie de leur hôte, qui sont favorisés par la présence des ETs dans les génomes. Lors de leurs déplacements, les transposons peuvent activer ou inactiver des gènes, en fonction de la localisation de leur site d’insertion. Certains transposons sont également capables de mobiliser des séquences qui leur sont adjacentes. De nombreux éléments transposables bactériens peuvent se transmettre d’une cellule à une autre directement par conjugaison, ou être mobilisés par des plasmides ou des virus. Ces éléments codent souvent des fonctions accessoires, et contribuent largement à la dissémination de gènes tels que des gènes de résistances aux antibiotiques ou de virulence parmi les espèces bactériennes.

Le séquençage systématique des génomes a permis de mettre en évidence la diversité et le caractère ubiquitaire de ces éléments. Les ETs sont en effet présents dans tous les organismes, procaryotes comme eucaryotes, souvent en haut nombre de copies. Ils représentent plus de 50 % du génome de certains végétaux comme le maïs, 45 % du génome humain, 6,5 % du génome de C. elegans, au moins 3,1 % du génome de D.

melanogaster et 2 % du génome d’E. coli. Plus de 2000 séquences d’insertion (ISs)

bactériennes, qui sont les ETs autonomes dont l’organisation génétique est la plus simple, ont été identifiées. La figure ci-contre montre le nombre et la variété des séquences d’insertion répertoriées dans la base de données ISfinder

(18)

(http://www-Nucléophile: H2O

DDE

Mu, Tn7 Tn3 famille Integrases Retrovirales Tc, mariner element P,Ac Nucléophile: Ser

S (Ser)

Transposons conjugatifs (Tn5397) IS607, IS4451 Intermédiaire covalent 5’- phosphoserine Nucléophile: Tyr (Tn916) Kangaroo DIRS1 Cryptons

Y (Tyr)

Intermediaire covalent 3’- phosphotyrosine Y2 (RC) Nucléophiles: Tyr Famille IS91 Helitrons Y1 Nucléophile: Tyr Pas d’intermédiaire covalent Transposons conjugatifs ISCR Intermediaire covalent 5’- phosphotyrosine Intermediaire covalent 5’- phosphotyrosine Famille IS200/605 (IS608)

Les différentes familles de transposases.

Pour chaque famille de transposases sont indiqués: le nucléophile utilisé pour la catalyse, la formation ou non d'un intermédiaire covalent entre l'enzyme et son substrat pendant le processus de transposition, et des exemples d'éléments qui les codent.

(19)

is.biotoul.fr, P. Siguier, com. pers.). Dans ce mémoire, nous nous intéresserons à une séquence d’insertion bactérienne particulière, IS608, qui représente une famille d’éléments atypiques récemment répertoriée.

Les éléments transposables définis par leur transposase

Les ETs ont été classés selon différents critères, comme par exemple : leur mode de déplacement (via une molécule d’ADN ou d’ARN), leur organisation génétique, les séquences de leurs extrémités. Cependant, grâce au séquençage systématique des génomes, le nombre et la variété des éléments transposables répertoriés sont en constante augmentation, ce qui rend la définition des groupes de plus en plus complexe. La capacité des ETs à se déplacer leur est conférée par leur transposase. Selon les propriétés biochimiques des réactions catalysées par leur transposase, seulement quatre groupes d’ETs, eucaryotes comme procaryotes, peuvent être définis à ce jour : les transposases à motif catalytique DDE, les plus abondantes et les plus étudiées, les transposases à tyrosine, les transposases à sérine, et les transposases Y2 (figure ci-contre). Nous verrons dans ce mémoire que chacune de ces catégories de transposases est caractérisée par un domaine catalytique spécifique, qui est retrouvé dans de nombreux autres types d’enzymes impliqués dans des processus cellulaires très diversifiés. Les transposases peuvent donc être définies comme des machines enzymatiques spécialisées dans la mobilisation de l’ET qui les code. Elles ont pour fonction de catalyser les coupures endonucléolytiques des extrémités de l’ET et leur transfert dans une molécule d’ADN cible.

La multiplication des analyses structurales des protéines au cours de ces dernières années a généré des avancées considérables dans la compréhension des processus enzymatiques. La seconde partie de ce mémoire sera consacrée à une analyse bibliographique du phénomène de la transposition, basée sur une étude structure-fonction des transposases. La seule famille de transposases pour laquelle des structures tridimensionnelles ont été décrites dans la littérature est la famille des transposases à motif catalytique DDE. La plupart des analyses présentées dans ce mémoire seront donc basées sur des données obtenues sur des protéines apparentées aux transposases par la séquence de leur domaine catalytique. Cette analyse ne se veut pas exhaustive, mais, pour chacune des catégories de transposases connues, plusieurs points de comparaison seront dégagés, notamment : le processus biochimique de la catalyse, les mécanismes de

(20)

INTRODUCTION GENERALE

9 transposition dans lesquels elles sont impliquées, et le choix du site cible d’intégration de l’élément. L’étude de ces différents aspects nous permettra de justifier la définition d’une nouvelle catégorie de transposases, révélée par nos travaux sur la transposase d’IS608. Nous verrons également que les réactions catalysées par les transposases sont hautement contrôlées au sein d’un large complexe nucléoprotéique, appelé transpososome, qui rassemble les extrémités du transposon et une forme oligomérique de la transposase. Cette étude illustrera également la grande diversité des éléments transposables et des stratégies qu’ils ont adoptées pour assurer leurs déplacements. Les chapitres de la deuxième partie de ce manuscrit sont indépendants, et sont résumés dans les paragraphes ci-dessous.

Les transposases à motif catalytique DDE

La majorité des ETs connus, procaryotes comme eucaryotes, code des transposases à motif catalytique DDE. Ce type de transposases catalyse les réactions de clivage et transfert de brin nécessaires à la transposition sur des molécules d’ADN double brin sans former d’intermédiaire covalent avec leur substrat. La catalyse de ces réactions ne nécessite pas d’apport énergétique extérieur, mais requiert la présence de cofacteurs métalliques bivalents. Ce type de transposases, appelé « DDE », est caractérisé par la présence d’une triade de résidus acides hautement conservés formant le cœur catalytique : deux résidus acide aspartique (D) et un résidu acide glutamique (E) dans la majorité des cas, mais quelques membres de la famille mariner portent un motif DDD (Robertson and Lampe, 1995). De nombreuses études par mutagenèse dirigée ont montré l’importance de la triade de résidus carboxylates pour l’activité catalytique de ces enzymes (pour revue : Haren et al., 1999). Ces transposases appartiennent à une superfamille de protéines, la famille des nucléotidyl-transférases, caractérisées par un domaine catalytique de structure tridimensionnelle apparentée. Ce type de domaine a été identifié pour la première fois en 1990 dans la protéine RNAse H d’E. coli (Katayanagi et al., 1990; Yang et al., 1990), mais il est retrouvé également dans de nombreuses autres protéines de fonctions variées, dont, la résolvase RuvC, Argonaute, les intégrases de HIV-1 et ASV, ou encore UvrC.

Les transposases à DDE sont des protéines modulaires composées de domaines multiples : généralement un (ou des) domaine(s) de fixation à l’ADN, le plus souvent situé dans la partie amino-terminale (N-terminale), et un domaine catalytique

(21)

carboxy-terminal (C-carboxy-terminal), séparés par des domaines distincts (dont au moins un domaine impliqué dans la multimérisation).

La réaction de transposition catalysée par les transposases à DDE est une succession de clivages et transferts de brin d’ADN. Elle est initiée par un clivage monocaténaire aux bornes de l’élément, qui s’accompagne ou non de la coupure du deuxième brin. Dans un second temps, la transposase catalyse le transfert des extrémités de l’élément dans un ADN cible. Après excision du transposon, la molécule donneuse, qui porte une cassure double brin, est soit perdue soit réparée par la machinerie cellulaire, générant parfois des mutations. Nous verrons que ces transposases sont impliquées dans différents mécanismes de transposition : la transposition réplicative, de type "copier-coller", ou encore de type "couper-coller". Les transposases à motif DDE sont les transposases les mieux caractérisées, tant du point de vue biochimique que structural.

Les transposases à sérine et à tyrosine

Deux autres catégories d’enzymes connues sont capables de catalyser la transposition via un mécanisme de type "couper-coller". Ces transposases sont apparentées à des enzymes impliquées dans la recombinaison spécifique de site. La recombinaison spécifique de site est un processus de recombinaison spécialisé qui consiste en un échange réciproque entre deux segments d’ADN identiques (pour revue : Grindley et al., 2006). Dans sa plus stricte définition, ce processus implique deux partenaires ADN et une recombinase. La recombinase reconnaît spécifiquement les sites de recombinaison et les rassemble dans une synapse pour catalyser la recombinaison. Selon l’arrangement initial des sites de recombinaison, cette réaction peut résulter en une intégration, une excision ou une inversion. Ces trois types d’évènements sont utilisés dans de nombreux processus cellulaires, incluant la ségrégation des chromosomes, la régulation de gènes, l’intégration et l’excision d’éléments génétiques mobiles comme les bactériophages.

Les recombinases spécifiques de site catalysent le clivage de leur substrat ADN double brin via une attaque nucléophile de la chaîne latérale de l’un de leurs acides aminés sur le phosphate scissile. La plupart des recombinases spécifiques de site sont classées dans deux familles selon le type de nucléophile, le groupement hydroxyle de la chaîne latérale d’un résidu tyrosine ou d’un résidu sérine, utilisé pour la catalyse: la famille des intégrases phagiques (recombinases à tyrosine), et la famille des résolvases/invertases

(22)

INTRODUCTION GENERALE

11 (recombinases à sérine). La réaction de recombinaison spécifique de site est conservative, c'est-à-dire qu’elle ne requiert pas de synthèse d’ADN ni de cofacteur énergétique ATP. Cette réaction ne nécessite pas de cofacteur métallique, et génère lien covalent, 5’-phosphosérine ou 3’-phosphotyrosine en fonction du type de recombinase, entre l’enzyme et son substrat ADN.

Plusieurs transposases apparentées à ces deux types de recombinases ont été décrites. Ces transposases sont relativement peu documentées à ce jour, mais les données accumulées sur leurs cousines, les recombinases spécifiques de site, permettent de proposer des modèles adaptés aux mécanismes de transposition. Les deux familles de recombinases ne présentent pas d’homologie de séquence ni de structure et utilisent des mécanismes de recombinaison différents. Pour ces raisons, elles feront l’objet de deux chapitres distincts.

Les transposases RC

Une dernière catégorie d’enzymes décrite catalyse les réactions nécessaires à la transposition en formant un lien covalent phosphotyrosine avec l’ADN. Ces transposases sont appelées Y2 car elles portent deux résidus tyrosine, nécessaires à leur activité catalytique, et strictement conservés dans un motif YxxxY. Elles appartiennent à la superfamille des protéines HUH. A la différence des transposases apparentées aux recombinases à tyrosine, ces enzymes requièrent un cofacteur métallique pour la catalyse et créent un lien 5’-phosphotyrosine avec leur substrat. Les enzymes la famille HUH catalysent le clivage monocaténaire site spécifique de l’ADN, le transfert et la religature des brins. Elles partagent un motif conservé de fixation d’un cation bivalent, le motif HUH (Histidine-résidu hydrophobe encombrant- Histidine).

Les séquences d’insertion procaryotes de la famille IS91 et les transposons eucaryotes

hélitrons codent une transposases Y2, aussi appelée transposase RC. Les hélitrons ont

été mis en évidence par l’étude in silico des séquences d’ADN répétées dans les génomes d’Arabidopsis thaliana et Caenorhabditis elegans et ont été retrouvés dans tous les organismes eucaryotes dans lesquels ils ont été recherchés (Kapitonov and Jurka, 2001). Ils représentent une classe majeure de transposons eucaryotes : ils peuvent représenter jusqu’à 5% de l’ADN génomique de leur hôte, bien que la plupart sont des copies partielles non-autonomes.

(23)

Les données se rapportant aux hélitrons sont issues uniquement d’analyses bioinformatiques. Pour les éléments les mieux caractérisés de la famille IS91 (IS91 et IS1294), une transposase purifiée et active in vitro n’ayant pu être obtenue, la biochimie des réactions impliquées dans la transposition et les propriétés de la protéine n’ont pas été caractérisées. La plupart des informations présentées concernant ce type de transposases proviennent donc de l’étude des protéines de la famille HUH, et ne permettent qu’une analyse très restreinte de la transposition.

La famille de séquences d’insertion atypiques IS200/605

Une nouvelle famille d’ISs, la famille IS200/605, composée d’ISs atypiques a récemment été répertoriée. L’élément IS200 a été mis en évidence il y a 25 ans par un étudiant en thèse dans le laboratoire de John Roth, lors de l’étude d’une mutation particulière de l’opéron histidine de Salmonela (Lam and Roth, 1983a; Lam and Roth, 1983b). Depuis, des éléments IS200 ont été retrouvées dans une variété de bactéries, telles que Salmonella, Escherichia, Shigella, Vibrio, Enterococcus, Clostridium,

Helicobacter, et Actinobacillus. IS200 est une petite IS d’environ 700 pb. Elle ne porte

qu’un seul cadre ouvert de lecture, tnpA, qui code la transposase de l’élément. La transposition de cet élément a cependant rarement été observée, ce qui a rendu son étude difficile. Plus récemment, un nouveau groupe d’ISs, isolées chez Helicobacter pylori, a été décrit. Les éléments de ce groupe, qui inclut les éléments IS605, IS606, IS607, IS608, et IS609 sont très fortement représentés chez les bactéries, les archaebactéries et chez plusieurs virus ADN géants eucaryotes (mimi et phycodnavirus), souvent en haut nombre de copies(Kersulyte et al., 1998; Kersulyte et al., 2000; Kersulyte et al., 2002; Filée et al., 2007). Ces ISs présentent deux cadres ouverts de lecture, en combinaisons et orientations variées : tnpA et tnpB (figure ci-contre). Le produit d’orfB, TnpB, dont la fonction est inconnue à ce jour n’est pas requis pour la transposition de l’élément IS608, du moins chez Escherichia coli. Il est homologue au gène de virulence gipA d’un phage de Salmonella. Des copies isolées de cet orf sont trouvées dans les génomes, dont certaines possèdent des extrémités caractéristiques, et sont définies comme des ISs (IS891, IS1341).

Ce groupe d’ISs se divise en deux familles selon la nature de tnpA. IS607 porte un orf

tnpA, appelé tnpA2, qui code une transposase apparentée aux recombinases spécifiques

(24)

(H . pylor i ) t npA 1 t npB t npA 1 t npB (H . pylor i ) (D. r adiodur ans ) (H alobact er ium ) (B. t her mophile PS 3 ) t npA 1 t npA 1 t npB t npA 1 t npB t npB t npA 1 t npB t npA 1 t npA 1 t npB t npB (A . ambivalens )

IS200 (S . t yphimur ium ) (Y . pes t is) IS605, IS606 IS1541 IS1921 IS608 IS8301 ISH1-8 IS1341 La famille IS200/IS605.

Les éléments de cette famille portent un cadre ouvert de lecture tnpA1 (en rose) qui code la transposase. tnpA1 est souvent associé à un second cadre ouvert de lecture, tnpB (en gris). des copies de tnpB isolées sont également retrouvées. Les extrémités atypiques, qui contiennent des structures secondaires potentielles, de ces éléments sont schématisées.

(25)

une transposase TnpA1, apparentée aux protéines de la superfamille HUH et essentielle pour la transposition de l’élément (chapitre IV). Mon travail de thèse correspond à l’initiation de l’étude d’IS608, qui est devenue l’élément modèle de cette famille d’ISs. Contrairement à la majorité des ISs, les éléments de cette famille ne portent pas d’extrémités inversées répétées, mais des extrémités atypiques contenant des structures secondaires potentielles, et ne génèrent pas de gain ou perte de nucléotides lors de l’insertion dans la cible. Ces caractéristiques sont retrouvées chez les éléments de la famille IS91 et les hélitrons (chapitre IV). Cependant, IS608 fera l’objet d’une partie indépendante, car nos études suggèrent que cet élément utilise un mécanisme de transposition inédit, différent du mécanisme RC d’IS91. De plus, nous avons mené des études structurales, en collaboration avec le laboratoire du Docteur Fred Dyda, Bethesda, Etats-Unis. TnpA est la première transposase n’appartenant pas à la famille DDE dont la structure a été résolue. L’ensemble des résultats obtenus au cours de ma thèse sera présenté dans la troisième partie de ce manuscrit.

(26)
(27)

LA CATALYSE DE LA

TRANSPOSITION

(28)
(29)

Les transposases à motif

catalytique DDE

(30)

N

C

B

A!

B B B B

A"

AD

AE

AC

D10

(E48)

D70

D134

B B B B B

A!

A" AC

AD

AE

(A)

(B)

(C)

Figure 1: Structure tridimensionnelle de la ribonucléase H d'Escherichia coli. (A) Structure cristalline de la RNAse H d'E. coli (PDB ID: 2rn2) (Katayanagi et al., 1992).

(B) Diagramme schématique de la topologie structurale de la RNAse H d'E. coli. Les brins B représentés par des flèches noires, les hélices A

(C) Position des acides aminés de la triade catalytique DDE.

N

(31)

1.

LA CATALYSE

1.1. Structure tridimensionnelle du domaine catalytique

Des études structurales ont montré que de nombreuses transposases à motif DDE et intégrases rétrovirales partagent un domaine catalytique de structure tridimensionnelle apparentée, bien qu’elles ne présentent pas d’homologie forte au niveau de leur séquence primaire (MuA : (Rice and Mizuuchi, 1995) ; IS50 : (Davies et al., 2000) ; hermes : (Hickman et al., 2005) ; Mos1 : (Richardson et al., 2006) ; HIV-1 : (Dyda et al., 1994) ; ASV : (Bujacz et al., 1995)). Ce type de domaine a été observé pour la première fois en 1990 dans la structure cristalline de la nucléase RNAse H d’E.

coli (Katayanagi et al., 1990; Yang et al., 1990). La RNase H est une enzyme

ubiquitaire dans tous les organismes vivants. Elle est impliquée dans l’élimination des fragments d’Okasaki lors de la réplication, en catalysant le clivage du brin d’ARN des duplexes hybrides ARN/ADN. Le repliement de type RNAse H est retrouvé chez de nombreuses autres nucléases (par exemple, RuvC, la résolvase de jonctions de Holliday formées lors de la recombinaison homologue (Ariyoshi et al., 1994) ; Argonaute, composant du complexe RISC (RNA-induced silencing complex, Song et al., 2004) ; UvrC, impliquée dans la système de réparation par excision de nucléotides (Karakas et al., 2007) et probablement de la recombinase RAG1 du système V(D)J (Fugmann et al., 2000)). Cette forte homologie de leur cœur catalytique classe toutes ces protéines dans la grande famille des nucléotidyl-transférases ou nucléases-transposases, qui ont toutes la propriété de catalyser des réactions de transfert de liaison phosphoryle sans former de lien covalent avec leurs substrats (pour revues : Haren et al., 1999; Rice and Baker, 2001; Yang and Steitz, 1995b).

La structure tridimensionnelle de la RNAse H d’E. coli est illustrée dans les figures 1A et 1B. Le domaine catalytique de type RNAse H consiste en un repliement mixte +, composé de trois brins  antiparallèles (1,2 et 3), de deux brins  parallèles (4 et 5) et plusieurs hélices . Une longue hélice A relie les brins 3 et 4, et les brins 4 et 5 sont reliés par plusieurs hélices . La figure 2 montre la conservation de la structure tridimensionnelle du domaine catalytique de quelques enzymes de cette famille. La région située en aval du brin 5 est peu conservée jusqu’à une hélice  terminale. La triade catalytique de l’enzyme RNAse H est composée de trois résidus acide aspartique (D10D70D134), mais le domaine catalytique contient un résidu supplémentaire, un acide

(32)

Mos1

Argonaute

ASV

RNAse H

HIV

UvrC

MuA

Tn5

Hermes

Figure 2: Comparaison de l'architecture du domaine RNAse H de plusieurs protéines. Les éléments structuraux communs sont représentés avec les mêmes couleurs: les trois brin β antiparallèles en bleu foncé, les deux brins β parallèles en violet, les hélices αΑ, αΒ, et αC en jaune, et l'hélice αD en rouge.

Les domaines insérés non conservés sont colorés en vert. Les résidus de la triade catalytique sont montrés en rose. Les structures présentées sont: le domaine catalytique de la protéine RNAse H (E. coli) (PDB ID:2RN2) ; le domaine catalytique des integrases des virus HIV-1 (PDB ID: 2ITG) et ASV (PDB ID: 1ASV) ; le domaine catalytique des transposases MuA (PDB ID:1BCO), Mos1 (PDB ID:2F7T), Hermes (PDB ID:2BW3) et Tn5 (PDB ID:1MUH) ; le domaine PIWI de Argo-naute (PDB ID:1U04) ; le domaine endonucléase d'UvrC (PDB ID:2NRW).

(33)

glutamique (E48), retrouvé également dans le domaine catalytique de l’intégrase HIV-1.

Le premier résidu acide aspartique de la triade catalytique (D10) se trouve au milieu du

brin 1, et le deuxième entre le brin 4 et l’hélice B (D70). Ces résidus sont proches

dans la structure tertiaire par l’alignement parallèle des brins 1 et 4. Le troisième résidu, D134, se situe dans l’hélice  (E) terminale qui passe devant les brins  (figure

1C et figure 2). Les résidus de la triade catalytique sont toujours positionnés sur ces mêmes éléments topologiques dans tous les domaines catalytiques de type RNAse H (figure 3A). Cette organisation rassemble les trois acides aminés dans un coeur catalytique acide avec une haute densité de charges négatives dans lequel sont coordonnés les cations bivalents métalliques nécessaires à la catalyse (voir section 1.2.3 et figure 5). La distance entre les résidus carboxylates de la triade catalytique n’est donc pas nécessairement constante, mais leurs positions sont relativement conservées au sein d’une même famille (Chandler, 2002; Kulkosky et al., 1992; Rezsohazy et al., 1993). La distance séparant les deux derniers résidus de la triade est extrêmement variable, de 24 à 323 résidus (figure 3B). Un alignement de la séquence primaire de plusieurs transposases et intégrases rétrovirales révèle la présence de blocs de résidus conservés autour des acides aminés de la triade DDE (figure 3B, Chandler, 2002). L’hélice  contenant le résidu E constitue la région la mieux conservée. On trouve notamment un résidu K (lysine) ou R (arginine) situé à deux tours d’hélice en aval du résidu E, et des acides aminés moins conservés à un tour, en amont et en aval. Ces résidus seraient impliqués dans des interactions avec le substrat. Les transposases de la famille mariner, comme Mos1, possèdent un motif catalytique atypique DDD (Robertson and Lampe, 1995). Les données structurales montrent que le troisième résidu D est positionné plus près du site actif que dans les enzymes à motif DDE classiques. La présence d’un acide glutamique (E) à cette position conduirait à un manque d’espace pour une bonne coordination des cations (Richardson et al., 2006). Ceci expliquerait pourquoi la substitution du résidu D par un résidu E, dont la chaîne latérale est plus longue, entraîne la perte de l’activité catalytique de l’enzyme (Lohe et al., 1997).

La région située entre le brin 5 et l’hélice  terminale contenant le résidu E est très variable, et semble être relativement flexible. La configuration de cette région, appelée boucle catalytique, est fortement dépendante des conditions de cristallisation (nature du tampon, pH) (Bujacz et al., 1995; Goldgur et al., 1998; Lubkowski et al., 1998a; Lubkowski et al., 1998b; Maignan et al., 1998). Dans la première structure du domaine catalytique de l’intégrase HIV-1, la région 141-153 contenant l’acide aminé E152

(34)

Mos1

MuA

Tn5

Hermes

MuA D269 D336 E392 Hermes 265 - 552 D180 D248 D572 Tn5 212 - 322 D97 D188 E326 Mos1 D156 D249 D284 E392

(A)

(B)

D

vtg ekw flh

D

napsh ayspdlaps

D

yhlfas

Mos1

Tc3 vfs

D

ekk fqq

D

natih arspdlNpi

E

nlwgilv

Hermes ati

D

lwt fvt

D

rganv sipassaas

E

rtfsla

156 249 284 R 144 231 266 180 248 572 (92) (66) (67) (134) (34) (323)

Figure 3: Le motif DDE de différentes transposases.

(A) Position des acides aminés de la triade catalytique sur les éléments topologiques du repliement RNAse H. Les codes couleur sont les mêmes que ceux utilisés dans la figure 2. (B) Alignement de motifs DDE de transposases de différentes familles d'éléments. Les acides aminés appartenant au motif sont indiqués par de grandes lettres majuscules. La distance entre ces résidus est indiquée entre paranthèses.

IS1 aem

D

eqw wmt

D

gwply iskrytqri

E

rhnlnlR

109 166 191

(35)

n’apparaît pas structurée (Dyda et al., 1994). Dans le cas de MuA, le résidu E392 pointe

dans une direction opposée à celle des deux acides aspartiques de la triade DDE, formant probablement un site catalytique inactif (figure 3A, Rice and Mizuuchi, 1995). La flexibilité de cette région aurait un rôle majeur pour l’activité de ces transposases et intégrases, permettant à ces enzymes d’utiliser deux types de nucléophile différents, une molécule d’eau ou un groupement 3’-hydroxyle (3’-OH) (Greenwald et al., 1999). Selon le nucléophile utilisé, la réaction catalytique requiert en effet une configuration spatiale du site actif différente (van den Ent et al., 1998; van Gent et al., 1993). Certaines transposases possèdent de grands domaines insérés dans cette région (figure 3A). Par exemple, la structure de la transposase de l’élément Hermes révèle l’insertion d’un grand domaine en hélices  (Hickman et al., 2005). La transposase de Tn5 possède également un grand domaine inséré qui forme 4 brins  antiparallèles impliqués dans la fixation du substrat ADN (Davies et al., 2000).

1.2. Le mécanisme de catalyse

1.2.1. La réaction de transfert de liaison phosphoryle

Malgré la grande diversité des enzymes de la superfamille des polynucléotidyl-transférases et de leurs substrats respectifs, les réactions chimiques mises en jeu sont similaires. Il s’agit d’un mécanisme de type SN2 (Substitution Nucléophile

bimoléculaire) impliquant un intermédiaire phosphate pentavalent et une inversion chirale du phosphate (Engelman et al., 1991; Mizuuchi et al., 1999). Les réactions de clivage et transfert de brin catalysées par les transposases à motif DDE correspondent à des réactions de transfert de liaison phosphoryle (figures 4A et 4B). La chimie de la réaction de transfert de liaison phosphoryle débute par une déprotonation et une activation d’un nucléophile, et se termine par la protonation d’un groupe partant. La transposition est initiée par un clivage monocaténaire aux deux bornes de l’élément. Ce clivage est réalisé par une hydrolyse de la liaison phosphodiester, qui lie le transposon à l’ADN donneur, par une molécule d’H2O. Cette réaction libère une extrémité 3’-OH à

chacune des extrémités de l’élément. Dans un second temps, la transposase catalyse le transfert de ces extrémités 3’-OH dans un ADN cible, via une réaction de transestérification. Les homologies structurales existant entre les transposases à motif DDE et plusieurs nucléases suggèrent qu’elles pourraient provenir de nucléases

(36)

P O O O O A O O O 5' O3' O H H

..

B O O OH 5' 3' A P O OH O O O3' O B O O OH 5' 3' C 5' P O O O O O O O3' C D O HO O 5' O

..

3' A P O O O O O3' O 5' O D A O

+

+

(A)

(B)

Transestérification Hydrolyse 5' 5' 3' 3' 3' OH 3' HO 5' 5' 3' 3' Coupure de l'ADN (Hydrolyse) Transfert de brin (Transestérification) 5' 5' 3' 3'

D'après Hallet et Sherratt, 1997 et Yang et al., 2006 P O O O O A O O O 5' O3' O B Me A2+ Me B 2+ O O

Asp

(C)

Figure 4: Réactions de clivage et transfert de brin catalysées par les transposases à motif DDE. (A) Rectangles bleus : l'élément transposable ; traits verts : ADN donneur ; traits oranges : ADN de la cible; cercles rouges : extrémités 3'-hydroxyles (3'-OH). Une molécule H20, utilisée comme donneur nucléophile, hydrolyse la liaison phosphodiester (ici en 3' de l'élément transposable). La réaction génère un groupement 3'-OH libre à chaque extrémité de l'élément. Ces extrémités sont utilisées comme donneurs nucléophile dans la réaction de transestérification et sont transférées dans l'ADN cible.

(B) Représentation schématique des réactions de transfert de liaison phosphoryle: la réaction débute par la déprotonation (montrée en rouge) et l'activation d'un nucléophile et se termine par la protona-tion d'un groupe partant. L'attaque nucléophile sur un groupement phosphate du squelette de l'ADN donneur par une molécule H2O conduit à l'hydrolyse de la liaison phosphodiester. L'attaque nucléo-phile, par un groupement 3'-OH d'une molécule d'ADN, sur un groupement phosphate du squelette de l'ADN cible génère une nouvelle liaison phosphodiester entre le nucléophile donneur et le phosphate scissile.

(C) Représentation schématique de l'intermédiaire pentacovalent: les deux cations métalliques (Me2+) sont coordonnés par un oxygène du phosphate et un acide aspartique conservé.

(37)

ancestrales ayant acquis la capacité d’utiliser le groupement hydroxyle d’un ADN aussi bien qu’une molécule d’eau comme groupe nucléophile pour la catalyse.

1.2.2. Rôle catalytique des cations bivalents

Le site actif riche en résidus carboxylates des enzymes de cette famille dépend de la présence de cofacteurs métalliques pour catalyser les réactions de transfert de lien phosphoryle. Les résidus acides du cœur catalytique sont directement impliqués dans la coordination de ces cations bivalents. Il est généralement admis que le cofacteur physiologique de ces réactions est le magnésium, Mg2+, mais d’autres ions peuvent être utilisés in vitro. Par exemple, le manganèse, Mn2+, est un cofacteur souvent plus efficace que Mg2+, probablement parce qu’il altère la spécificité de la réaction, de par sa géométrie de coordination peu stringente. D’autres ions peuvent se fixer dans le site actif in vitro (Ca2+, Zn2+…), mais ils n’autorisent en général que des fonctions catalytiques partielles (Bujacz et al., 1997; Savilahti et al., 1995; Wang et al., 1996). Les réactions de clivage et transfert de brin, qui sont chimiquement équivalentes, supportent en effet différemment les divers ions. Ceci reflète un rôle structural des cations, qui possèdent une géométrie de coordination spécifique, dans la conformation du domaine catalytique de ces protéines. Un modèle de catalyse à deux ions, présenté plus loin, permet d’expliquer ces observations. La détermination de l’organisation des cofacteurs métalliques au sein du site actif, nécessaire pour comprendre le mécanisme de catalyse, a fait l’objet de nombreuses études. Parmi les structures cristallographiques des domaines catalytiques de type RNAse H résolues, le nombre et la position des ions métalliques sont variables. Trois hypothèses ont été proposées : (i) un ion se fixe dans le site actif (ASV : (Bujacz et al., 1997), HIV-1 : (Goldgur et al., 1998; Maignan et al., 1998), RNAse H : (Katayanagi et al., 1993; Tsunaka et al., 2005)). Il est important de noter que toutes ces structures ont été obtenues en l’absence de substrat ; (ii) deux ions peuvent se fixer, l’un activant la catalyse et l’autre ayant un rôle inhibiteur (Goedken and Marqusee, 2001; Keck et al., 1998) ; (iii) ou enfin, deux ions sont coordonnés dans le site actif et sont requis pour la catalyse (RNAse H : (Nowotny et al., 2005), Tn5 : (Lovell et al., 2002; Steiniger-White et al., 2004), Mos1 : (Richardson et al., 2006)). Le nombre de cations observé dépend notamment de la nature de l’ion (pour revue : Wlodawer, 1999), de la concentration en ion, et de la présence ou non du substrat. Par exemple, la fixation de deux ions Mg2+ dans le site catalytique de la RNAse H, en

(38)

(A)

(B)

D'après Nowotni et al., 2005 et Rousseau et Chandler, 2007

+

P O O O O A O O O 5' O3' OH B T H - -O O A O O 5' - -O O O 5' D C O O O 3' P O Libération de l'ADN flanquant Capture de la cible P O O O O A O O O 5' O3' OH B - -T H O O O 5' 3' A P O O O O O3' O B

+

-H T D O O A O O 5' -O O O O 5' C O O O 3' P T H O O A O O 5' -O O O O 5' D C O O O 3' P H T H T

(C)

RNAse H Tn5

Figure 5: La catalyse des réactions de clivage et transfert de brin par deux cations bivalents. (A) Position des cations bivalents dans le site actif de la RNAse H (gauche) et de la transposase de Tn5 (droite). Les résidus carboxylates conservés, les ions (H et T), le phosphate scissile et le nucléophile sont montrés.

(B) et (C) Représentation schématique des réactions de clivage et de transfert de brin. (B) l'ion H active la molécule H2O pour l'hydrolyse. (C) l'ion T active l'extrémité 3'- hydroxyle libérée par la réaction d'hy-drolyse. Les ions H et T sont colorés en gris foncé lorsqu'ils orientent et activent le nucléophile.

L'ADN du transposon est schématisé en bleu, l'ADN flanquant le transposon en vert, et l'ADN cible en orange. La position des ions H (Hydrolyse) et T (Transfert) et leur coordination par le phosphate scissile sont montrées.

(39)

absence de substrat, n’est observée que pour une concentration en ion élevée qui inhibe l’activité catalytique de l’enzyme in vitro (Goedken and Marqusee, 2001). Cette observation a conduit à formuler l’hypothèse (ii). En présence d’un substrat, la concentration requise pour observer les deux ions est beaucoup plus faible (Nowotny et al., 2005). Dans le cas de la transposase de Tn5, deux ions peuvent être observés, mais uniquement en présence d’un substrat ADN (et portant des extrémités P, mais pas 5’-OH) (Steiniger-White et al., 2004). La présence du substrat pourrait donc favoriser un positionnement correct des deux ions et permettre la formation d’un site actif approprié pour la catalyse. Ces observations sont en faveur d’un mécanisme catalytique impliquant deux ions, décrit pour la première fois pour le domaine exonucléase 3’-5’ de l’ADN polymérase I (Beese and Steitz, 1991; Steitz et al., 1993). Selon ce modèle, le premier ion se comporte comme un acide de Lewis. Il active le nucléophile (une molécule d’eau ou un groupe 3’-OH) en favorisant la perte d’un proton. Le second cation stabilise l’état transitoire pentavalent adopté par le phosphate et le produit 3’-OH (figure 4C).

1.2.3. Le modèle de catalyse à deux ions

Des données structurales et biochimiques récentes permettent d’adapter le modèle de catalyse à deux ions aux réactions mises en jeu lors de la transposition catalysées par les transposases à DDE ((Nowotny et al., 2005), pour revue :(Yang et al., 2006)). D’après ce modèle, les fonctions catalytiques sont assurées par les deux ions métalliques divalents. Le rôle des résidus carboxylates du site actif, uniquement structural, serait de fixer et d’orienter correctement les ions, le phosphate scissile et le groupement donneur. La position précise et la géométrie de coordination des deux ions, ainsi que la distance qui les sépare seraient cruciales pour une catalyse efficace. Ces paramètres varient à chaque étape de la réaction de transposition. La comparaison des structures de la RNAse H et de la transposase de Tn5 montre que les deux ions occupent des positions similaires, mais avec une géométrie de coordination différente (figure 5A). Le site catalytique de la RNAse H contient quatre résidus carboxylates conservés impliqués dans la coordination des ions. De ce fait, la géométrie de coordination des ions est asymétrique, contrairement à celle observée pour Tn5, qui est symétrique. Cette propriété permettrait à la transposase de catalyser successivement les réactions de clivage et transfert de brin sans libérer les groupement hydroxyles (voir

(40)

I . Les transposases à motif catalytique DDE

21 section 3). Ces deux types de réactions et le rôle des cations sont schématisés dans les figures 5B et 5C. Lors de l’étape de clivage, les deux ions (appelés H et T pour Hydrolyse et Transfert, respectivement) se positionnent dans le site actif formé par le complexe ADN-protéine. Ils sont coordonnés de manière symétrique par les trois résidus de la triade catalytique et le phosphate scissile. L’ion H oriente et active la molécule d’eau pour l’attaque nucléophile. Il se déplace vers l’ion T, ce qui rapproche le nucléophile du phosphate scissile à une distance appropriée permettant la formation du lien phosphoryle. Le phosphate scissile adopte alors un état transitoire pentavalent stabilisé par l’ion T. La géométrie de coordination de l’ion T est irrégulière, favorisant la dissociation des produits 5’-P et du 3’-OH. La géométrie de coordination de l’ion T dans ce complexe enzyme-produits devient idéale (octahédrale) et favorable d’un point de vue énergétique. Après la séparation des produits, le phosphate scissile ne peut plus coordonner les deux ions simultanément et l’un des ions (H) doit se déplacer ou être relâché. Le cation T reste coordonné à l’extrémité 3’-OH du transposon. La réaction inverse se produit pour l’étape de transfert de brin. Le groupement hydroxyle est activé par l’ion T, et par rapprochement des deux cations, il attaque le phosphate scissile de l’ADN cible. L’ion T est ensuite libéré, et l’extrémité 3’-OH générée reste coordonnée au cation H. Ce mécanisme dynamique est appelé « ping-pong » car les deux cations activent alternativement une molécule d’eau ou un groupement hydroxyle. La clé de ce modèle réside dans l’extrême sensibilité des ions à leur environnement électrostatique de coordination. Cette caractéristique permettrait aux enzymes qui utilisent deux ions pour la catalyse, comme les diverses enzymes de la famille des nucléotidyl-transférases, de convertir des changements conformationnels minimes en de grandes modifications de leurs propriétés catalytiques, et d’assurer une extrême spécificité pour leurs différents substrats.

2.

VARIETE DES ELEMENTS UTILISANT UNE TRANSPOSASE A

MOTIF CATALYTIQUE DDE

Les ETs peuvent être classés selon leur mode de déplacement, via un intermédiaire ADN (classe II) ou via un intermédiaire ARN (classe I, seulement présente chez les eucaryotes). Des ETs utilisant une transposase à motif catalytique DDE sont retrouvés dans les deux classes, chez les organismes procaryotes et eucaryotes.

(41)

Parmi les éléments de la classe II, se trouvent les séquences d’insertion (ISs), les transposons composites, les transposons unitaires, et les bactériophages transposables. Les ISs présentent une organisation génétique compacte, et ne codent que les fonctions nécessaires à leur mobilité : la transposase, et dans certains cas une ou plusieurs protéines régulatrices. Les ISs sont retrouvées chez les procaryotes (voir ISfinder : http://www-is.biotoul.fr) et les eucaryotes (familles Tc/mariner, haT, élément P). Les éléments eucaryotes les plus répandus appartiennent à la famille Tc/mariner (Plasterk et al., 1999). Ils constitueraient 1.5% du génome humain. La plupart de ces éléments seraient inactifs, ne représentant que des fossiles d’ETs (figure 6A). Les MITEs (Miniature Inverted repeat Transposable Elements) décrits chez Arabidopsis thaliana possèdent des extrémités caractéristiques de la famille, mais ne codent aucun gène (Casacuberta et al., 1998; Casacuberta and Santiago, 2003; Smit and Riggs, 1996). Ces MITEs peuvent être mobilisés en trans par les transposases d’autres éléments (Feschotte and Mouches, 2000; Loot et al., 2006). Les transposons composites sont formés par des fragments d’ADN encadrés par des ISs en orientation directe ou inverse capables de les mobiliser. Les fragments peuvent porter par exemple des gènes de résistance aux agents antibactériens (figure 6B, Tn10 : tétracycline ; Tn5 : kanamycine, bléomycine et streptomycine). Les transposons unitaires ne sont pas bordés par des ISs. Ils codent à la fois les fonctions nécessaires à leur mobilité et des gènes accessoires (par exemple des gènes de résistance aux agents antibactériens, ou impliqués dans le catabolisme de substances particulières). Les deux exemples de transposons unitaires traités dans ce chapitre sont Tn3 et Tn7 (figure 6C). Enfin, les bactériophages transposables sont des virus spécifiques des bactéries. Ils sont très grands et complexes, puisqu’ils codent les fonctions nécessaires au cycle lytique (protéines de capside, d’enveloppe, et de lyse de la cellule hôte), mais aussi les fonctions impliquées dans leur propagation dans le génome via la transposition. Le cycle lytique du bactériophage Mu (figure 6D) consiste en l’infection d’une cellule, suivie de l’intégration du phage dans le génome de l’hôte, puis d’une amplification du génome viral par transposition suivie de la lyse de la cellule hôte.

Les éléments de la classe I, aussi appelés rétroéléments, utilisant une transposase de type DDE, font partie de la famille des rétrotransposons à LTR (Long Terminal Repeat). Les rétrotransposons à LTR présentent une organisation génétique ressemblant à celle des rétrovirus (exemple de Ty1, figure 6E). Ils sont bordés par de longues extrémités LTR en orientation directe, et codent au moins deux gènes : gag et pol. Le gène gag

(42)

I . Les transposases à motif catalytique DDE

23 code une protéine de structure de la capside, et le gène pol, plusieurs activités enzymatiques. Le domaine protéase (PR) réalise les clivages protéolytiques des autres domaines pour générer les protéines nécessaires à la transposition: l’intégrase rétrovirale (IN) et la transcriptase inverse présentant l’activité RNAse H (RT-RH). Les rétrovirus, comme HIV-1 (Human Immunedeficiency Virus), se différencient des rétrotransposons à LTR principalement par leur cycle de transposition extracellulaire. Ils portent les gènes env codant les protéines d’enveloppe aussi impliquées dans le tropisme.

3.

STRATEGIES TRANSPOSITIONNELLES

Dans la plupart des cas, le processus de transposition est initié par un clivage aux deux extrémités de l’élément. Ce clivage simple brin résulte en la formation de groupements 3’-OH terminaux dont la localisation dépend du brin qui contenait le phosphate scissile, en 3’ ou en 5’ du transposon. Le type de substrat utilisé pour l’étape de transfert de brin définit deux voies de transposition (pour revue: (Haren et al., 1999)): (i) soit le second brin n’est pas pris en charge, les extrémités 3’-OH sont directement transférées dans l’ADN cible après le clivage. Le transposon reste alors lié à la molécule donneuse lors de son intégration dans la cible, c’est la transposition « réplicative » ; (ii) soit le second brin est coupé aux deux extrémités libérant ainsi complètement l’élément de la molécule donneuse.

Les différents mécanismes de transposition catalysés par les transposases à motif DDE sont schématisés dans la figure 7, et les modèles associés de catalyse à deux ions dans la figure 8.

3.1. L’élément est lié au donneur : la transposition réplicative

La transposition réplicative nécessite une collaboration avec la machinerie de réplication de l’hôte pour générer une nouvelle copie du transposon au niveau du site cible, tout en laissant une copie intacte sur la molécule donneuse. Les éléments de la famille Tn3, IS6 ou encore le bactériophage Mu utilisent ce mécanisme de transposition, qui permet d’éviter le clivage du second brin. Les extrémités 3’-OH libérées lors du premier clivage monocaténaire (en 3’ des bornes de l’élément) sont directement transférées sur les brins opposés de l’ADN cible (figure 7A). Cette réaction génère une structure branchée, appelée « intermédiaire de Shapiro » (Shapiro, 1979),

Figure

Figure 8: Modèle de catalyse à deux cations bivalents adapté aux différents mécanismes  de transposition catalysés par les transposases à motif DDE.
Figure 10: Structure cristalline de la transposase TnsA et comparaison avec une endonu- endonu-cléase de type II.
Figure 13: Exemples de structures tridimensionnelles de motifs de liaison à l'ADN de  transposases à motif DDE.
Figure 14: Structures tridimensionnelles de domaines de multimérisation des transposa- transposa-ses à motif DDE des éléments Tn5 et Hermes.
+7

Références

Documents relatifs

D’après Develay (1992) Savoirs savants. Savoirs

Elle consiste à translater le spectre d'un signal, sans en altérer le contenu, soit vers une fréquence plus basse afin de le traiter plus facilement (down conversion), soit vers

Nous montrons cependant dans ce papier que deux ré- seaux P 1 et P 2 , obtenus à partir de deux séquences dif- férentes de décisions effectuées pendant la résolution d’un réseau

Black can create pivots that White has to remove, until it is Black’s second last turn: Then, Black can choose the final parity by playing either the minimum or the maximum free

Cette tâche prescrite va être ensuite redéfinie, en fonction d’une situation précise, puis, une nouvelle fois transformée, cette fois dans l’activité, en prenant en compte les

Michel Develay (1985, Savoirs scolaires et didactique des disciplines) a illustré ensuite la chaîne de transformations qui d’un « savoir savant et/ou de pratiques sociales » conduit

Après avoir présenté un premier exemple tiré de la perception visuelle, nous appliquons la notion de transposition à deux types de phénomènes linguistiques : l’expression

(1) Le parodonte étant sain, sans perte d’attache, une motivation et un dé- tartrage ont été effectués.. 14,15,16,17,18) Une comparaison des situations avant et