Analyse quantitative des perturbations de déplacement chimique pour la détermination de structures tridimensionnelles de complexes protéine-ligand

(1)

HAL Id: tel-01127237

https://tel.archives-ouvertes.fr/tel-01127237

Submitted on 7 Mar 2015

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

chimique pour la détermination de structures

tridimensionnelles de complexes protéine-ligand

Clémentine Aguirre

To cite this version:

Clémentine Aguirre. Analyse quantitative des perturbations de déplacement chimique pour la détermi-nation de structures tridimensionnelles de complexes protéine-ligand. Chimie analytique. Université Claude Bernard - Lyon I, 2014. Français. �NNT : 2014LYO10217�. �tel-01127237�

(2)

Thèse de doctorat de l’Université Claude Bernard Lyon 1

Ecole Doctorale de Chimie (ED206) N° d’ordre : 217 - 2014

Présentée par : Clémentine AGUIRRE

Pour l’obtention du grade de Docteur en Chimie de l’Université Claude Bernard Lyon 1

Analyse quantitative des perturbations

de déplacement chimique pour la

détermination de structures

tridimensionnelles de complexes

protéine-ligand

Soutenance le 31 Octobre 2014

Thèse dirigée par : Isabelle KRIMM

Céline LANDON, rapporteur François BONTEMS, rapporteur Christophe MORELL, examinateur Jean-François GUICHOU, examinateur Patrice GOUET, examinateur

(3)

(4)

Remerciements

J’aimerais tout d’abord remercier ma directrice de thèse, Isabelle Krimm qui m’a sans cesse épaulée et poussée pour avancer. J’ai énormément gagné en maturité scientiﬁque grâce à elle, et évolué en terme d’écriture et d’organisation. Elle a non seulement été une directrice présente scientiﬁquement mais aussi moralement et je serai toujours reconnaissante du travail accompli ensemble pendant ses 3 années de thèse mais aussi pendant les stages.

Je tiens également à remercier les membres de l’équipe et particulièrement Olivier Cala, toujours prêt à m’aider que ce soit pour des expériences au spectromètre RMN, pour des discussions scientiﬁques, des questions informatiques, mais surtout merci à lui humainement pour son soutien, son humour et nos riches discussions en pause café. Merci également à Tim ten-Brink, expert en programmation, sans qui je n’aurai jamais eu autant de résultats et qui représente la personne la plus patiente et gentille que j’ai jamais connue. Merci à Béatrice Brion pour sa bonne humeur quotidienne et son savoir-vivre.

Je remercie également toutes les personnes que j’ai eu la chance de rencontrer lors de ce projet et qui ont participé à ce travail à leur façon. Je parle notamment de Dany Da-vesne qui m’a patiemment initié au langage de programmation fortan, mais aussi à Virginie Gueguen-Chaignon avec qui j’ai réalisé ma première production de protéine et qui a été d’une gentillesse extraordinaire et merci à son stagiaire Sylvain Vallet pour l’aide qu’il m’a apportée. J’exprimerai également une reconnaissance particulière à Adrien Favier pour les expériences RMN réalisées à Grenoble, à Jean-françois Guichou pour les expériences de cristallographie aux rayons X, à Olivier Walker pour les calculs de RDC et à Florence Guillière pour les protéines qu’elle a produites pour ma thèse. Merci aux stagiaires qui ont apporté leur pierre à l’édiﬁce : Damien Guichon, Cédric Louis, Iklima Erdogan, Paul Epron et Denis Lacabanne.

J’adresse aussi mes remerciements aux membres du Jury qui ont pris le temps de lire mon manuscrit et de participer à ma soutenance de thèse. Merci donc à Christophe Morell, Jean-françois Guichou, Patrice Gouet, François Bontems et Céline Landon avec qui nous avons partagé une riche discussion scientiﬁque et merci pour leur aide à l’amélioration du manuscrit de thèse.

(5)

et supportée pendant ces 3 ans. Leur présence et leurs encouragements sont pour moi les piliers fondateurs de ma personnalité de de ce que je suis aujourd’hui. Merci à mon chéri Gaylord qui comme tout mon entourage à chercher de nombreuses fois à comprendre en quoi consistait mon sujet de thèse et qui a toujours été présent pour moi et merci à sa maman Murielle et à Patrick qui ont toujours été d’une extrême gentillesse et très attentionnés envers moi.

Ces remerciements ne peuvent s’achever, sans une pensée aux copains rencontrés au bou-lot : Laure, Sylvie, Katherine, Julie, Audrey, Josiane, Alexandra, Claire, Aurélie, Laura, Agneta, Florian, Valérian, Jérémy et Deb’s avec qui j’ai passé d’agréables moments mais plus spécialement à mon amie que j’aﬀectionne tout particulièrement, Sophie sans qui je ne serais probablement pas arrivée au bout et qui a été une oreille attentive et patiente. Je suis très reconnaissante de son soutien, de son amitié et de son implication. Un énorme merci à mes amis Barbara, Marion, Flo, Fabrice, Gilles et Charlène qui ont passé beaucoup de temps à m’écouter tergiverser sur mon travail et qui m’ont beaucoup aidé dans cette épreuve.

(6)

UNIVERSITE CLAUDE BERNARD - LYON 1

Président de l’Université

Vice-président du Conseil d’Administration

Vice-président du Conseil des Etudes et de la Vie Universitaire Vice-président du Conseil Scientifique

Directeur Général des Services

M. François-Noël GILLY

M. le Professeur Hamda BEN HADID M. le Professeur Philippe LALLE M. le Professeur Germain GILLET

M. Alain HELLEU

COMPOSANTES SANTE

Faculté de Médecine Lyon Est – Claude Bernard

Faculté de Médecine et de Maïeutique Lyon Sud – Charles Mérieux

Faculté d’Odontologie

Institut des Sciences Pharmaceutiques et Biologiques Institut des Sciences et Techniques de la Réadaptation Département de formation et Centre de Recherche en Biologie Humaine

Directeur : M. le Professeur J. ETIENNE Directeur : Mme la Professeure C. BURILLON Directeur : M. le Professeur D. BOURGEOIS Directeur : Mme la Professeure C. VINCIGUERRA Directeur : M. le Professeur Y. MATILLON Directeur : Mme. la Professeure A-M. SCHOTT

COMPOSANTES ET DEPARTEMENTS DE SCIENCES ET TECHNOLOGIE

Faculté des Sciences et Technologies

Département Biologie

Département Chimie Biochimie Département GEP

Département Informatique Département Mathématiques Département Mécanique Département Physique

UFR Sciences et Techniques des Activités Physiques et Sportives Observatoire des Sciences de l’Univers de Lyon

Polytech Lyon

Ecole Supérieure de Chimie Physique Electronique Institut Universitaire de Technologie de Lyon 1 Ecole Supérieure du Professorat et de l’Education Institut de Science Financière et d'Assurances

Directeur : M. F. DE MARCHI

Directeur : M. le Professeur F. FLEURY Directeur : Mme Caroline FELIX Directeur : M. Hassan HAMMOURI Directeur : M. le Professeur S. AKKOUCHE Directeur : M. Georges TOMANOV

Directeur : M. le Professeur H. BEN HADID Directeur : M. Jean-Claude PLENET Directeur : M. Y.VANPOULLE Directeur : M. B. GUIDERDONI Directeur : M. P. FOURNIER Directeur : M. G. PIGNAULT Directeur : M. C. VITON Directeur : M. A. MOUGNIOTTE Directeur : M. N. LEBOISNE

(7)

(8)

Résumé

Les interactions intermoléculaires entre une protéine et ses différents partenaires (pep-tides, protéines, molécules organiques...) représentent des cibles de plus en plus prisées pour l’élaboration de composés thérapeutiques capables d’intervenir dans des processus biolo-giques. Depuis une quinzaine d’années, des petites molécules organiques très simples (MW < 300 g/mol), appelées fragments, sont utilisées pour sonder les régions clés des interactions protéine-ligand. Plus particulièrement, la méthode FBDD (Fragment-Based Drug Design) permet de concevoir des molécules bioactives tels que des inhibiteurs, à partir de la structure tridimensionnelle du complexe formé entre la protéine et le fragment. Dans le cadre de ce projet de thèse nous proposons d’utiliser le déplacement chimique, un paramètre RMN riche en informations structurales, pour l’étude des structures 3D de ces complexes protéine-ligand. Nous nous focaliserons plus spécifiquement sur la mesure des perturbations de déplace-ment chimique CSP (Chemical Shift Perturbations) des atomes d’une protéine cible, induites par la liaison d’un fragment, qui se révélera être particulièrement informative dans le contexte du FBDD. Nous démontrerons la puissance de cet outil RMN à travers la simulation des CSP induits par l’interaction d’un fragment sur une protéine cible et leur comparaison aux CSP expérimentaux. L’objectif ici sera de calculer les CSP théoriques pour différentes positions virtuelles du ligand sur les protons de la protéine pour déterminer son orientation à l’inté-rieur du site de liaison en comparant pour chaque position virtuelle, les CSP expérimentaux et simulés.

L’analyse sera réalisée sur deux protéines cibles : la protéine Bcl-xL, cible thérapeutique contre le cancer ; et la protéine péroxiredoxine 5 (PRDX5), cible enzymatique impliquée lors d’accidents vasculaires cérébraux. La comparaison des données expérimentales et simulées permettra dans un premier temps de mettre en évidence un réarrangement structural de la protéine Bcl-xL lors de son interaction avec un fragment. Puis, dans un second temps, nous montrerons que cette analyse quantitative des CSP peut permettre de déterminer l’orientation des fragments dans le site d’interaction de la protéine PRDX5. Nous comparerons alors les performances de la méthode pour diﬀérents types de protons (protons amides, protons aliphatiques) proposant ainsi de nouvelles pistes pour la compréhension du comportement des CSP vis-à-vis de leurs contributions électroniques.

Mots-clés

(9)

(10)

Abstract

Intermolecular interactions between protein and its partners (peptides, proteins, organic compounds, ...) represent highly attractive targets for the elaboration of therapeutic com-pounds abble to interfere in biological processes. For 15 years, very simple organic comcom-pounds (MW < 300g/mol), called fragments, are used to probe key interactions of proteligand in-terfaces. In particular, a novel approach in drug design called Fragment-Based Drug Design consists of designing bioactive molecules like inhibitors, from the 3D structure of the protein-fragment complex. Here we suggest to use a parameter which is very sensitive to structural informations, the chemical shift, to study these protein-ligand structures.

We will particularly focus on the measurement of Chemical Shift Perturbations (CSP) induced by the fragment-binding on protein’s nuclei, which are very informative in FBDD context. We will evidence the potency of this NMR tool through simulation of CSP induced by fragment interaction on protein target and the comparison with experimental CSP. Here, the aim is to calculate theoretical protein’s protons CSP for diﬀerent ligand virtual positions to determine the fragment orientation inside the protein binding site by comparing experimental and simulated CSP for each virtual position.

Two protein targets will be used : the Bcl-xL protein, which is a therapeutic target against cancer ; and the peroxiredoxin 5 (PRDX5) protein which is a therapeutic target involved in post-ischemic inflammation in the brain. On one hand, the comparison between experimental and simulated data will evidence the structural rearrangement of the protein Bcl-xL upon fragment-binding. On the other hand, we will demonstrate that this quantitative use of CSP is unable to determinate fragment orientations inside the protein PRDX5 binding site. We will compare the performances of the method for different kinds of protein protons (amide protons, aliphatic protons) and proposing answers to better understand the behaviour of CSP toward their different electronic contributions.

Keywords

(11)

(12)

Abréviations

3D Tridimentionnel(le)

Å Angstöm

AIR Ambiguous Intermolecular Restrains Bcl B-cell lymphoma

BMRB Biological Magnetic Resonance Bank CSI Chemical Shift Index

CSM Chemical Shift Mapping CSP Chemical Shift Perturbation

Da Dalton

DMSO DiMethylSulfOxyde DTT DiThioThréitol

FBDD Fragment-Based Drug Design

HSQC Heteronuclear Single Quantum Coherence HTS High-Troughput Screening

ILOE Inter-Ligand Overhauser Eﬀect ITC Isothermal Titration Calorimetry

INPHARMA INterligand NOE for PHARmacophore MApping LE Ligand Eﬃciency

MD Molecular Dynamic

MW Masse molaire (Molecular Weight) NOE Nuclear Overhauser Eﬀect

NOESY Nuclear Overhauser Eﬀect SpectroscopY PCS Pseudo Contact Shift

PDB Protein Data Bank

PPI Protein-Protein Interaction

PRE Paramagnetic Relaxation Enhancement PRDX PéRoxireDoXine

RCI Random Coil Index RDC Residual Dipolar Coupling RMN Résonance Magnétique Nucléaire RMSD Root Mean Square Deviation SAR Structure-Activity Relationship SPR Surface Plasmon Resonance STD Saturation Transfer Diﬀerence TOCSY TOtal Correlation SpectroscopY

WaterLOGSY Water-Ligand Observed via Gradient SpectroscopY

Amino-acid Abbreviation Alanine Ala (A) Arginine Arg (R) Asparagine Asn (N) Acide Aspartique Asp (D) Cystéine Cys (C) Glutamine Gln (Q) Acide Glutamique Glu (E) Glycine Gly (G) Histidine His (H) Isoleucine Ile (I)

Leucine Leu (L) Lysine Lys (K) Méthionine Met (M) Phénylalanine Phe (F) Proline Pro (P) Sérine Ser (S) Thréonine Thr (T) Tryptophane Trp (W) Tyrosine Tyr (Y) Valine Val (V)

(13)

(14)

Table des matières

I

Introduction

25

1 Conception de molécules bioactives à partir des fragments 27

1.1 Les avantages des fragments en drug design . . . 28

1.1.1 Exploration de l’espace chimique . . . 28

1.1.2 Taux de touches . . . 29

1.1.3 Eﬃcacité de liaison . . . 30

1.2 Méthodes de criblage de fragments . . . 31

1.2.1 Tests biochimiques à haute concentration . . . 32

1.2.2 Cristallographie aux rayons X . . . 32

1.2.3 Spectrométrie de masse . . . 33

1.2.4 Titration Isothermique par mesure de Chaleur (ITC) . . . 33

1.2.5 Résonance Plasmonique de Surface (SPR) . . . 33

1.2.6 Criblage virtuel . . . 34

1.2.7 Résonance Magnétique Nucléaire (RMN) . . . 35

1.2.7.1 Observation des signaux du ligand . . . 35

1.2.7.2 Observation des signaux de la protéine réceptrice . . . 36

1.3 Le besoin de données structurales en FBDD . . . 36

2 Du déplacement chimique à la structure des protéines et vice-versa 39 2.1 Origine du déplacement chimique des protéines en RMN . . . 40

2.1.1 Les contributions à travers les liaisons covalentes . . . 42

2.1.2 Les contributions à travers l’espace . . . 44

2.1.2.1 Le champ électrique . . . 46

2.1.2.2 L’anisotropie de liaison . . . 46

2.1.2.3 Le courant de cycle . . . 49 13

(15)

2.1.2.5 Les angles de torsion des chaînes latérales . . . 50

2.1.2.6 Le solvant . . . 50

2.1.3 Les contributions de la liaison d’un ligand . . . 51

2.2 Prédiction des déplacements chimiques à partir de la structure . . . 51

2.2.1 Prédiction basée sur l’homologie de séquence . . . 52

2.2.2 Méthodes empiriques . . . 53

2.2.3 Méthodes semi-classiques . . . 54

2.2.4 Les programmes de prédiction de déplacement chimique des protéines 61 2.3 Structures 3D à partir du déplacement chimique des protéines . . . 64

2.3.1 Structures secondaires à partir du déplacement chimique . . . 64

2.3.2 Flexibilité de la protéine à partir du déplacement chimique : le RCI . 67 2.3.3 Angles de torsion à partir du déplacement chimique . . . 67

2.3.4 Programmes de détermination de structures à partir du déplacement chimique . . . 69

3 Détermination structure de complexes protéine-ligand 73 3.1 Expériences de Docking . . . 74

3.2 Cristallographie aux rayons X . . . 75

3.3 Résonance Magnétique Nucléaire . . . 77

3.3.1 Contraintes courtes distances via l’eﬀet NOE . . . . 77

3.3.1.1 NOE partiellement ou non attribués . . . 78

3.3.1.2 L’expérience STD . . . 78

3.3.1.3 L’expérience WaterLOGSY . . . 80

3.3.1.4 Les expériences ILOE et INPHARMA . . . 81

3.3.2 Contraintes longues distances via les sondes paramagnétiques . . . . 81

3.3.3 Contraintes d’orientation via les couplages dipolaires résiduels (RDC) 82 3.3.4 Étude des perturbations de déplacement chimique (CSP) . . . 86

3.3.4.1 Mesure des perturbations de déplacements chimiques par RMN 87 3.3.4.2 Aﬃnité de liaison . . . 87

3.3.4.3 Localisation du site de liaison . . . 88

3.3.4.4 Localisation du ligand dans le site de liaison . . . 91 3.3.4.5 Détermination du mode de liaison par simulation des CSP . 92

(16)

4 Description du projet de thèse et modèles biologiques 99

4.1 La protéine Bcl-xL : interface d’interaction protéine-protéine . . . 100

4.2 La protéine péroxiredoxine 5 . . . 102

II

Matériels et Méthodes

105

5 Production et puriﬁcation des protéines 107 6 Expériences RMN 111 6.1 Expériences STD . . . 111

6.2 Expériences HSQC . . . 112

6.3 Mesure des perturbations de déplacement chimique (CSP) . . . 112

6.4 Attribution des spectres HSQC . . . 114

6.5 Mesure des aﬃnités . . . 114

6.6 Couplages Dipolaires Residuels (RDC) . . . 115

7 Expériences complémentaires 117 7.1 Expériences de Docking . . . 117

7.2 Simulation des CSP et ﬁltre des positions virtuelles . . . 117

7.3 Docking guidé par les CSP . . . . 120

7.4 Cristallographie aux rayons X . . . 121

7.5 Dynamique moléculaire . . . 122

III

Résultats et Discussion

125

8 Changements conformationnels de Bcl-xL révélés par les CSP 127 8.1 CSP expérimentaux . . . 128

8.2 Simulation des CSP . . . 130

8.2.1 Expériences de docking . . . . 130

8.2.2 Comparaison entre les CSP expérimentaux et simulés . . . 131

8.3 Couplages Dipolaires Résiduels (RDC) . . . 135

8.4 Bilan de l’analyse des CSP sur la protéine Bcl-xL . . . 139 15

(17)

grâce aux perturbations de déplacement chimique 143

9.1 Étude préliminaire des complexes PRDX5-fragment . . . 144

9.1.1 Liaison spéciﬁque des fragments révélée par STD . . . 144

9.1.2 Aﬃnité et eﬃcacité de liaison . . . 146

9.1.3 Structures de cristallographie aux rayons X . . . 147

9.1.4 Rigidité de la protéine révélée par dynamique moléculaire (MD) . . . 150

9.2 CSP induits sur les protons 1HN . . . 151

9.2.1 CSP expérimentaux . . . 151

9.2.1.1 Cartographie des CSP . . . 151

9.2.1.2 Comparaison des signes des CSP induits par des fragments analogues . . . 155

9.2.2 Simulation des CSP . . . 160

9.2.2.1 Expériences de docking . . . . 161

9.2.2.2 Filtre des positions virtuelles des fragments par RMN . . . . 162

9.2.2.3 Comparaison des résultats de RMN et de cristallographie aux rayons X . . . 164

9.2.2.4 Simulation des CSP pour l’étude comparative de leurs signes 167 9.2.3 Bilan de l’analyse des CSP induits par les protons amides . . . 169

9.3 Comparaison des CSP induits sur les protons aliphatiques et amides . . . 173

9.3.1 Attribution des résonances des protons aliphatiques de la PRDX5 . . 173

9.3.2 CSP expérimentaux des protons aliphatiques . . . 177

9.3.3 Docking guidé par les CSP . . . 181

9.3.3.1 Comparaison du docking guidé par les CSP des protons amides et aliphatiques . . . 183

9.3.3.2 Comparaison du docking guidé par les CSP des diﬀérents types de protons aliphatiques . . . 183

9.3.3.3 Bilan du docking guidé par les CSP des diﬀérents protons de la PRDX5 . . . 186

IV

Conclusion

191

(18)

(19)

(20)

Table des ﬁgures

1.1 Comparaison des molécules "drug-like" et des molécules fragments . . . . 28

1.2 Combinaisons de molécules fragments . . . 29

1.3 Comparaison de la LE d’une molécule "drug-like" et d’un fragment . . . . . 31

1.4 Criblage RMN par observation des signaux de la protéine réceptrice . . . 37

1.5 Étapes de l’élaboration de médicaments à partir de fragments . . . 38

2.1 Échelle de déplacements chimiques en protons . . . 41

2.2 Eﬀet de mésomérie sur le déplacement chimique . . . 44

2.3 Eﬀet du champ électrique sur le déplacement chimique . . . 48

2.4 Eﬀet d’anisotropie sur le déplacement chimique . . . 48

2.5 Eﬀet de courant de cycle sur le déplacement chimique . . . 49

2.6 Hypersurfaces ou contours de déplacement chimique empiriques . . . 55

2.7 Paramètres géométriques pour la prédiction de l’eﬀet de courant de cycle . . 57

2.8 Paramètres géométriques pour la prédiction de l’eﬀet des liaisons hydrogène 60 2.9 Estimation de la structure secondaire d’une protéine grâce au CSI . . . 66

3.1 Principe de l’expérience STD . . . 79

3.2 Paramètres géométriques reliant les spins A et B au champ B0 . . . 83

3.3 Mesure des couplages dipolaires résiduels (RDC) . . . 85

3.4 Séparation des composantes des doublets avec l’expérience IPAP . . . 86

3.5 Équilibre thermodynamique d’un complexe protéine-ligand . . . 89

3.6 Courbes théoriques de titration pour déterminer la constante d’aﬃnité (KD) 89 3.7 Exemple de j-surface sur une protéine cible . . . . 91

3.8 Diﬀérences de CSP observées pour une série de ligands analogues . . . 93

3.9 Comparaison des modes de liaison obtenus par CSP et par cristallographie . 95 4.1 Surface d’interaction PPI de la protéine Bcl-xL . . . 101

(21)

5.1 Séquences peptidiques codant pour les protéines Bcl-xL et PRDX5 . . . 108

7.1 Iso-surfaces de CSP simulés autour du cycle aromatique du benzène . . . 119

8.1 Spectres 15N-HSQC de la protéine Bcl-xL en présence du fragment 1 . . . . 129

8.2 Cartographie des CSP mesurés pour Bcl-xL sur sa structure 3D . . . 129

8.3 Positions virtuelles du fragment 1 dans le site de liaison de Bcl-xL . . . 131

8.4 Comparaison des CSP expérimentaux et simulés sur les 1HN de Bcl-xL . . . 133

8.5 Changements conformationnels de Bcl-xL révélés par RMN . . . 134

8.6 Position des résidus A142 et F97 sur la structure de Bcl-xL . . . 134

8.7 Spectres RMN enregistrés en milieu isotrope et anisotrope . . . 137

8.8 Comparaison des RDC expérimentaux et calculés sur la structure de Bcl-xL 139 8.9 Comparaison des RDCexp et RDCcalc pour les hélicesα2 et α3 de Bcl-xL . . 140

8.10 Cycles aromatiques de Bcl-xL libre et liée à diﬀérents partenaires . . . 142

9.1 Analyse de la liaison des fragments sur la PRDX5 par STD . . . 145

9.2 CSP et détermination du KD du complexe PRDX5-fragment 3 . . . 147

9.3 Densités électroniques obtenues pour les complexes PRDX5-fragment . . . . 148

9.4 Comparaison des diﬀérentes structures de cristallographie de la PRDX5 . . . 149

9.5 Dynamique moléculaire réalisée sur la protéine PRDX5 . . . 151

9.6 Spectres 15N-HSQC de la PRDX5 libre et liée aux fragments . . . 152

9.7 Cartographie des CSPH+N induits par les fragments sur la PRDX5 . . . 153

9.8 Résidus du site actif de la protéine PRDX5 . . . 154

9.9 Proﬁls des valeurs de CSPH+N induits par les fragments sur la PRDX5 . . . 155

9.10 Comparaison des CSP expérimentaux induits par des fragments analogues . 157 9.11 Méthode de comparaison des signes des CSP induits par des ligands analogues 158 9.12 Proﬁls de CSP induits par les fragments sur les 1HN et les 15N de la PRDX5 159 9.13 RMSD des positions virtuelles des fragments sur la PRDX5 . . . 163

9.14 Filtre des positions virtuelles des fragments par CSP et STD . . . 165

9.15 Comparaison des CSPexp et CSPsim induits par 200 positions du fragment 2 166 9.16 Comparaison des structures obtenues par cristallographie et par RMN . . . . 168

9.17 Simulation des différences de signes de CSP pour différents modes de liaison 170 9.18 Simulation des différences de signes de CSP pour les fragments 1 et 5 . . . . 171

(22)

9.19 Extrait des plans F1-F3 des expériences HCCmHm-TOCSY . . . 176

9.20 Bilan de l’attribution des protons aliphatiques de la PRDX5 . . . 178 9.21 Identiﬁcation des protons attribués sur la structure 3D de la PRDX5 . . . . 179 9.22 Évaluation du pourcentage de protons aliphatiques attribués . . . 179 9.23 Superposition des spectres 13C-HSQC de la PRDX5 libre et liée aux fragments 180 9.24 Proﬁls des CSP induits par les fragments sur les1Hali de la PRDX5 . . . 181

9.25 Comparaison schématique du docking guidé et ﬁltré par CSP . . . . 182 9.26 Positions des fragments sur la PRDX5 obtenues par docking guidé par CSP . 184 9.27 RMSD des positions des fragments générées par le docking guidé par CSP . . 185 9.28 Positions des fragments sur la PRDX5 obtenues par le docking guidé par CSP 189

(23)

(24)

Liste des tableaux

1.1 Comparaison de la méthode HTS et de la méthode fragments . . . 28 1.2 Caractéristiques des différentes techniques de criblage de fragments . . . 31 2.1 Influence relative des contributions électroniques sur le déplacement chimique 43 2.2 Influence de l’électronégativité sur le déplacement chimique 13C . . . 44 2.3 Influence de l’électronégativité sur le déplacement chimique 1H . . . 44 2.4 Déplacements chimiques random coil 1H . . . 45 2.5 Influence de la structure secondaire sur les déplacements chimiques des protéines 47 2.6 Valeurs des facteurs d’intensité f pour différents types de cycles aromatiques 58 2.7 Valeurs des paramètres décrivant l’effet des liaisons hydrogène . . . 60 2.8 Caractéristiques des programmes de prédiction de déplacement chimique . . 63 2.9 Performances des programmes de prédiction de déplacement chimique . . . . 64 3.1 Applications publiées concernant la simulation des CSP d’une protéine induits

par la liaison d’un ligand pour déterminer son mode de liaison . . . 97 5.1 Étapes et tampons utilisés pour la puriﬁcation des protéines Bcl-xL et PRDX5 109 6.1 Paramètres expérimentaux des expériences RMN réalisées . . . 113 7.1 Paramètres expérimentaux des expériences de cristallographie aux rayons X . 123 8.1 Structures de la protéine Bcl-xL disponibles dans la PDB . . . 138 9.1 Structures chimiques et aﬃnités des fragments pour la protéine PRDX5 . . . 144 9.2 Liste des structures PDB de la protéine PRDX5 complexée avec des fragments 149

(25)

(26)

Première partie

Introduction

(27)

(28)

Chapitre 1

Conception de molécules bioactives à

partir des molécules fragments

La thèse présentée s’articule autour de détermination de la structure de complexes protéine-ligand dans le cadre de la conception de médicaments. La conception de molécules bioactives peut être définie en 3 étapes clés : l’identification de molécules qui se lient à la protéine cible (le criblage), leur optimisation en molécule de type médicament et le développement clinique. Une des approches dominantes des dix dernières années pour l’identification de com-posés de départ dans le cadre de la recherche de médicaments, a été le criblage haut-débit HTS (High-Troughput Screening) où des centaines de milliers de molécules sont rassemblées et criblées sur une protéine cible d’intérêt. Pour qu’une molécule organique soit considérée comme candidate (molécule "drug-like") et être testée, elle doit respecter la règle dite des 5, établie en 1997 par Lipinski et al. (Lipinski et al. (2001)) (voir Table 1.1). Néanmoins, cette méthode n’ayant pas tout à fait atteint les espérances de l’industrie pharmaceutique à cause de son coût trop élevé, de ses nombreux échecs et de la difficulté à optimiser des molécules

drug-like en médicaments, l’idée d’utiliser des composés de plus petite taille en tant que point

de départ a émergé avec le Fragment-Based Drug Design (FBDD). De la même manière qu’en criblage haut débit classique (HTS), on aboutit à des molécules bioactives en ajoutant des groupements fonctionnels à ces petites molécules appelées fragments. Initialement, le terme "fragment" représente une petite partie ou une portion de quelque chose, et dans ce contexte de chimie médicinale, la méthode fragments inclut le criblage de portions de molécules tradi-tionnelles "drug-like" utilisées en HTS (Figure 1.1). Par analogie à la règle des 5, Congreve

et al. ont proposé la règle des 3 pour ces petits composés (Congreve et al. (2003)) (voir Table

(29)

HTS Méthode fragments

Caractéristiques physico-chimiques

Règle des 5 : Règle des 3 : MW< 500g/mol, MW< 300g/mol,

logP< 5, logP< 3, donneur H< 5, donneur H< 3, accepteur H< 2x5, accepteur H< 3,

torsions< 5 torsions< 3 Taille maximale chimiothèque classique 1 000 000 20 000 Taux de touches (Schuﬀenhauer et al. (2005)) ∼ 0.2% ∼ 3%

Aﬃnité de liaison KD∼ 10 nM-1 μM KD ∼ 100 μM-10 mM

Table1.1 – Comparaison de la méthode HTS (criblage haut-débit avec des molécules

drug-like) et de la méthode fragments.

Figure 1.1 – Comparaison des molécules "drug-like" de départ utilisées en criblage haut-débit HTS et des molécules fragments utilisées en FBDD.

1.1) pour contraindre un peu plus le choix des composés de départ pour la conception de molécules bioactives.

Ce chapitre consacré au FBDD, nous permettra de présenter les avantages de l’utilisation des fragments par rapport aux molécules classiques utilisées en criblage haut débit pour la conception de médicaments. Nous expliciterons ainsi la méthode FBDD et les techniques biophysiques qui peuvent y être associées en nous focalisant plus particulièrement sur le rôle de la RMN.

1.1 Les avantages des fragments en drug design

1.1.1 Exploration de l’espace chimique

L’espace chimique est déﬁni par le nombre théorique de molécules obtenu en tenant compte de toutes les possibilités de combinaison d’atomes et de fonctionnalités disponibles. Si on considère la règle des 5 de Lipinski (Table 1.1), cet espace chimique a été évalué à environ 1063 molécules (Bohacek et al. (1996)). Il y a une dizaine d’années, le nombre de molécules qui respectaient cette règle des 5, appelées molécules "drug-like", (Figure 1.1) disponibles à

(30)

1.1. LES AVANTAGES DES FRAGMENTS EN DRUG DESIGN 29

Figure 1.2 – Combinaisons de molécules fragments pour une meilleure exploration de l’es-pace chimique. 15 combinaisons possibles à partir de 5 fragments aboutissent à des molécules

drug-like utilisées en criblage haut-débit (HTS).

travers le monde a été estimé à 100 millions (Hann et Oprea (2004)). On comprend alors facilement que même si toutes les bibliothèques de molécules du monde étaient testées sur une protéine cible, seule une inﬁme partie de l’espace chimique serait exploré (10−52%). La taille maximale d’une chimiothèque destinée au criblage haut débit HTS étant d’un million de molécules, seulement 10−57% de l’espace chimique pourrait donc techniquement être ex-ploré avec ce type de molécules drug-like. C’est donc en partie sur cette observation que la méthode du Fragment-Based Drug Design a émergé. La taille maximale d’une chimiothèque de molécules fragments s’évalue à 20 000 composés tandis qu’on estime à 107 l’espace chi-mique pour ces molécules (Fink et al. (2005)). Le criblage d’une chimiothèque de petites molécules organiques de type fragment permet donc de tester sur une protéine 0,002% de l’espace chimique, ce qui représente 2×1054 fois plus que pour un criblage haut débit avec des molécules "drug-like".

On peut également illustrer l’avantage des fragments pour l’exploration de l’espace chi-mique en considérant toutes les combinaisons oﬀertes par un panel de ce type de molécules. Par exemple, comme l’illustre la Figure 1.2, cinq molécules fragments peuvent par combinai-son aboutir à 15 molécules drug-like qui seraient utilisées en criblage haut débit HTS. De manière plus générale, N fragments peuvent former par combinaison N(N+1)/2 molécules de type "drug-like". La méthode fragment permet donc d’explorer une plus grande partie de l’espace chimique avec un nombre plus petit de molécules à tester.

1.1.2 Taux de touches

Les fragments, étant par déﬁnition des composés simples (peu de fonctionnalité, masse moléculaire < 300 g/mol), ils ont plus de chance de se lier à une protéine cible que les molécules plus grosses de type "drug-like", plus sujettes aux encombrements stériques à

(31)

cause de leur multiples fonctionnalités (Hann et al. (2001)). Les chimiothèques de molécules complexes ont donc moins de chance de contenir des composés susceptibles de se lier à la protéine cible (appelées touches) qu’une chimiothèque de petites molécules simples tels que les fragments. De ce fait, le criblage de fragments aboutit à de meilleurs taux de touches (voir Table 1.1). En conséquence, il suﬃt de tester la liaison d’un plus faible nombre de composés de type fragments pour identiﬁer de multiples touches. C’est pourquoi les chimiothèques de molécules "drug-like" contiennent au maximum 1 000 000 de molécules contre 20 000 pour les fragments (Table 1.1).

1.1.3 Eﬃcacité de liaison

Le dernier point en faveur de la conception de médicaments à partir des fragments (FBDD), réside dans le concept d’efficacité de liaison (notée LE pour Ligand Efficiency) établie en 2004 par Hopkins et al. (Hopkins et al. (2004)). La LE définie l’énergie de liaison par atome lourd (tous les atomes sauf hydrogène) du ligand (eq. 1.1) et permet donc de relier l’affinité au nombre d’atomes :

LE = ΔG

HAC (1.1)

avec

ΔG = −RT ln(KD) (1.2)

où ΔG représente l’énergie libre de liaison du ligand pour une protéine donnée, HAC (Heavy

Atom Count ) est le nombre d’atomes lourds du ligand et KD son aﬃnité pour la protéine

d’intérêt (constante de dissociation). Plus la valeur LE est élevée, plus la liaison est efficace. À titre d’exemple, la Figure 1.3 illustre la meilleure efficacité de liaison (LE) d’un fragment de 14 atomes lourds en comparaison à une molécule plus grosse de 24 atomes lourds (contenant le même motif que le fragment) pour une même protéine, et ce, malgré la différence d’affinité de liaison en faveur de la molécule drug-like. Cela signifie que certains atomes lourds de la molécule drug-like sont inefficaces en terme d’énergie de liaison. Mieux vaut donc tester la liaison d’une plus petite molécule avec peu de fonctionnalité (fragment) et lui ajouter progres-sivement des atomes lourds (groupements fonctionnels) en mesurant l’impact sur l’efficacité de liaison afin de conserver une LE optimale durant le processus d’optimisation du frag-ment. On aboutira alors à un médicament plus "efficace" qui aura de meilleures propriétés pharmaceutiques (Bembenek et al. (2009); Erlanson (2006); Hajduk (2006)).

(32)

1.2. MÉTHODES DE CRIBLAGE DE FRAGMENTS 31

Figure 1.3 – Comparaison de l’eﬃcacité de liaison (LE) d’une molécule "drug-like" et d’un fragment pour une même protéine cible.

1.2 Méthodes de criblage de fragments

La principale diﬃculté du criblage de molécules fragments est liée à la faible aﬃnité de leur interaction avec leurs partenaires protéiques (typiquement 100μM-10 mM) en

comparai-son aux molécules "drug like" (10 nM-1μM). Détecter ce type de liaison peut se révéler être

un réel challenge (Davis et Erlanson (2013)), cependant, certaines méthodes biophysiques se montrent de plus en plus populaires et efficaces pour identifier les fragments qui se lient aux protéines cibles (Carr et al. (2005); Bartoli et al. (2006); Erlanson et al. (2004a); Erlanson (2012)). La section suivante décrit et compare les différentes techniques les plus largement utilisées pour le criblage de fragments (ces techniques sont résumées en Table 1.2).

Méthodes de criblage Débits (compo-sés/criblage) Structure protéine ? Quantité protéine consommée Informations mode de liaison Tests

10 000 - 50 000 Non Faible (<100 μg) Aucune biochimiques

à haute concentration

SPR 10 000 - 50 000 Non Faible Aucune (Aﬃnité et Cinétique) Cristallographie

500 - 1 000 Oui Importante Structure résolue

rayons X (>>1 mg) RMN 1 000 - 10 000 Non Importante (>2 mg) Identiﬁcation site (mélanges de 2 de liaison à 10 fragments) (voir 1.2.7.2) Spectrométrie

1 - 50 000 Non (sauf Moyen/importante Estimation site de de masse Tethering) (0,5-5 mg) liaison (Tethering)

Table 1.2 – Caractéristiques des diﬀérentes techniques de criblage de fragments (Erlanson

(33)

1.2.1 Tests biochimiques à haute concentration

Au regard de la faible aﬃnité de liaison des fragments avec les protéines, il est diﬃcile de détecter leur liaison par un simple criblage haut débit HTS, où les composés sont le plus souvent criblés à faible concentration (10-30 μM). La manière la plus adaptée au criblage

de fragments est donc de réaliser des tests biochimiques à haute concentration (typiquement 250-1000 μM). C’est une technique rapide, quantitative, sans limitation de débit, capable

d’exploiter une large variété de techniques de détection (Barker et al. (2006); Hesterkamp

et al. (2007); Slack et al. (2009); Boettcher et al. (2010)). De plus, ce type de criblage nécessite

une faible quantité de protéine (typiquement< 100 μg), permet de cibler toutes les tailles de

macromolécules et se fait en général dans des environnements proches d’un environnement physiologique avec des protéines, des substrats ou des bio-membranes. Malgré la rapidité d’exécution de cette technique, de nombreux inconvénients existent : dénaturation de la protéine cible, faux positifs (agrégation des composés) et faux négatifs (manque de solubilité). Pour toutes ces raisons, cette méthode de criblage est de plus en plus délaissée au proﬁt de méthodes biophysiques plus sophistiquées.

1.2.2 Cristallographie aux rayons X

La cristallographie aux rayons X est une des méthodes les plus utilisées pour le criblage de complexes protéine-fragment (Blundell et al. (2002); Leach et al. (2006); Jhoti et al. (2007)). En cristallographie, le criblage haut débit inclut la préparation et l’analyse de centaines de complexes cristallins. Les cristaux des complexes protéine-fragment sont le plus souvent obte-nus par trempage des cristaux de la protéine dans des solutions contenant les fragments (voir détails en Chapitre 3). Dans le cas où le trempage échoue, des expériences de co-cristallisation peuvent être réalisées comme dans le cas des Phosphodistérases décrite par Card et al. (Card

et al. (2005)). Dans les deux cas de ﬁgure, la cristallographie aux rayons X permet à la fois

d’identiﬁer les fragments qui se lient à la protéine mais aussi et surtout, de résoudre la struc-ture résultante du complexe via l’interprétation des cartes de densités électroniques. Même si cette technique fait partie des plus consommatrices en terme de protéine et de fragment, elle reste la seule à fournir directement des informations structurales sur le complexe (Nienaber

(34)

1.2.3 Spectrométrie de masse

La spectrométrie de masse par nano-ESI (nano-ElectroSpray Ionisation) est une tech-nique puissante et émergente pour la détection et la caractérisation d’interactions covalentes et non-covalentes (Hofstadler et Sannes-Lowery (2006); Maple et al. (2012)). Pour ce faire, il est possible de mesurer l’abondance de ligand libre en l’absence et en présence de protéine cible (SAR by Mass Spectroscopy) ou dans certains cas, d’analyser les complexes protéine-fragment en phase gazeuse. En particulier, dans les approches de détection de liaisons cova-lentes telles que le Tethering (Erlanson et al. (2004b)) développé par les chercheurs de Sunesis Pharmaceuticals, un groupement fonctionnel réactif (telle qu’une cystéine) est introduit sur une protéine et utilisé pour capturer les fragments qui se lient à ses alentours, fournissant ainsi des informations sur le site de liaison. Plus récemment, le groupe de Ohlson a couplé la spectrométrie de masse et la chromatographie liquide (LC-MS) permettant le criblage de 3500 fragments par jour (Duong-Thi et al. (2013)). La force du criblage de fragments par spec-trométrie de masse réside dans sa sensibilité, sa faible consommation en produits (de l’ordre du picomole en protéine et en ligand), sa rapidité (30 secondes par analyse) et sa capacité à fournir à la fois la stœchiométrie et l’aﬃnité du complexe (Erlanson et al. (2004a)).

1.2.4 Titration Isothermique par mesure de Chaleur (ITC)

La méthode ITC (Isothermal Titration Calorimetry) est basée sur la mesure de la chaleur libérée lors de la liaison d’un ligand sur une protéine cible, à partir de laquelle on peut déduire l’enthalpie et l’entropie de liaison (Ladbury et al. (2010)). L’ITC nécessite néanmoins une plus grande quantité de protéine que les autres techniques et possède un débit de criblage plus faible c’est pourquoi cette méthode semble plus adaptée à un criblage secondaire et n’a pas été inclus en Table 1.2.

1.2.5 Résonance Plasmonique de Surface (SPR)

La détection via des capteurs biologiques (molécules réceptrices) capables de mesurer la cinétique des interactions grâce à la Résonance Plasmonique de Surface (SPR pour Surface

Plasmon Resonance) fait partie des nouvelles techniques émergentes de criblage de molécules

fragments (Perspicace et al. (2009); Danielson (2009); Neumann et al. (2007); Navratilova et Hopkins (2010, 2011)). La sensibilité et le débit de la nouvelle génération d’appareils SPR permettent à cette technologie d’être utilisée pour le criblage de grandes chimiothèques de

(35)

fragments. Pour ce type de criblage, les fragments s’écoulent sur une surface sur laquelle est immobilisée la protéine cible. Le principe de cette méthode biophysique repose sur la détec-tion de la variadétec-tion de l’indice de réfracdétec-tion entre la phase contenant la cible biologique, et celle contenant le fragment, séparées par un détecteur (typiquement une ﬁne couche d’or). Cette variation étant directement liée au changement de masse à la surface du détecteur, il est possible de déceler des interactions de faible aﬃnité telles que celles des complexes protéine-fragment. Il existe un certain nombre d’avantages liés au criblage de fragments par SPR par rapport aux techniques actuelles de cristallographie aux rayons X ou de RMN. Pre-mièrement, cette technique est peu consommatrice en protéine. Secondement, les méthodes SPR donnent accès à des informations complémentaires pour chaque fragment telles que des données cinétiques et thermodynamiques, que les autres techniques ne fournissent pas.

1.2.6 Criblage virtuel

La liaison d’un fragment à la surface de la protéine est contrainte par des interactions stabilisantes telles que les liaisons hydrogènes, électrostatiques et les interactions de type Van Deer Waals, mais aussi par des contraintes stériques. Pour que la liaison du fragment soit possible, ces interactions doivent compenser les pénalités énergétiques dues au déplacement des molécules de solvant ou à la perte de degrés de liberté. Les concepts développés en chem-informatique et biochem-informatique permettent de modéliser ces contraintes thermodynamiques et stériques pour une protéine cible de structure 3D connue. De ce fait, les liaisons relatives de différents fragments pour une cible peuvent être prédites et classées (en terme d’énergie de liaison), assurant ainsi le dit "criblage virtuel" de cette série de molécules pour isoler les meilleurs ligands (Oprea et Matter (2004); Jad et al. (2013)). L’une des premières mé-thodes proposées fut celle du programme DOCK (Shoichet et al. (1993)) suivit par différents logiciels dédiés à l’ancrage in-silico de molécules sur des protéines dont les plus largement utilisés sont AutoDock, FlexX, GOLD, Glide, ICM, QXP/Flo+ et Surflex. Le criblage vir-tuel est principalement utilisé pour le criblage de protéines rigides puisque la flexibilité du récepteur reste difficile à modéliser, c’est pourquoi cette technique ne fait pas partie des plus utilisée actuellement.

(36)

1.2.7 Résonance Magnétique Nucléaire (RMN)

La RMN fut la première méthode à être utilisée en FBDD comme l’illustre la stratégie SAR (Structure Activity Relationship) par RMN (Shuker et al. (1996)). Même si le criblage par RMN reste une technique de plus faible débit que les expériences de biochimie ou de SPR, elle reste la technique la plus largement utilisée en criblage de fragments dans le domaine pharmaceutique, étant donné qu’elle permet de détecter des interactions protéine-ligand pour un large domaine d’aﬃnité et de taille de protéines (Peng et al. (2004); Meyer et Peters (2003); Stockman et Dalvit (2002); Pellecchia et al. (2008); Goldﬂam et al. (2012)). Les complexes protéine-ligand peuvent être analysés en observant soit les signaux RMN du ligand soit ceux de la protéine réceptrice, par comparaison entre leurs paramètres RMN, dans leur forme libre et liée (Lepre et al. (2004)).

1.2.7.1 Observation des signaux du ligand

C’est parce que les paramètres RMN du ligand sont très sensibles à la diﬀérence entre sa forme liée et libre que la méthode d’observation des signaux du ligand est couramment utilisée pour le criblage. Les ligands utilisés en FBDD sont caractérisés par de faibles temps de corrélation (τC ≈ 0.1 ns), de faibles taux de relaxation (R1=1/T1 ≈ 0.1 s−1, R2=1/T2 ≈

0.1 s−1), des pics de corrélation 2D-NOESY faiblement négatifs voir nuls et des grands coeﬃ-cients de diﬀusion moléculaire (Dt). Lorsqu’un fragment se lie à une protéine cible, il partage

alors les propriétés de relaxation RMN de la macromolécule qui possède une masse molaire typiquement de l’ordre de quelques kDa. De ce fait, le composé qui se lie à la cible protéique est caractérisé par un plus grand τC (≈ 10 ns), R2 (≈ 10 s−1), R1 (≈ 1 s−1), des pics de

corré-lation 2D-NOESY positifs et un faible coefficient de diffusion moléculaire Dt. Cette différence

entre les paramètres de relaxation d’un fragment lié ou libre est donc à la base des techniques de détection de liaisons par RMN. Parmi elles, on trouve les expériences directement basées sur la mesure de la variation des constantes de temps de relaxation transversales et longi-tudinales telles que la détection de l’élargissement de la largeur de raies à mi-hauteur des signaux1H du ligand (1H line-broadening) et la comparaison des hauteurs de pics en absence et en présence du récepteur protéique via les expériences 1D 1H R2 (Hajduk et al. (1997)).

Les expériences de NOE transférés (Fejzo et al. (1999)), NOE pumping (Chen et Shapiro (2000)), STD (Saturation Transfer Diﬀerence) (Mayer et Meyer (1999)) et WaterLOGSY (Water Ligand-Observed by Gradient SpectroscopY ) (Dalvit et al. (2000)) sont elles, basées

(37)

sur le transfert d’aimantation intra ou inter-moléculaire entre la protéine et le ligand (ou les molécules d’eau le cas échéant, voir plus de détails en Chapitre 3, paragraphe 3.3.1). Elles reposent sur la diﬀérence de taux de corrélation τC du ligand lié et libre.

1.2.7.2 Observation des signaux de la protéine réceptrice

La méthode la plus utilisée pour le criblage RMN via l’observation des signaux de la protéine réceptrice est sans conteste l’expérience 2D15N-HSQC (Heteronuclear Single

Quan-tum Coherence). Pour cette expérience, on exploite la variation de déplacement chimique des

atomes de la protéine, induite par la liaison du ligand. L’intérêt principal de cette technique réside dans le fait qu’on obtient un pic de corrélation pour chaque liaison N-H, c’est à dire environ un pic RMN pour chaque acide aminé. L’expérience HSQC permet donc non seule-ment d’identiﬁer les fragseule-ments qui se lient à la protéine cible (présence de signaux perturbés par la liaison), mais aussi de situer le site de liaison en identiﬁant les pics de corrélation des acides aminés perturbés par la présence du ligand sur le spectre 2D et en les reportant sur la structure tridimensionnelle de la protéine (Figure 1.4). Le groupe de Zartler et al. a égale-ment mis en évidence la possibilité de cribler plusieurs protéines en même temps grâce à un protocole appelé RAMPED-UP NMR (Rapid Analysis and Multiplexing of Experimentally

Discrimminated Uniquely Labeled Proteins using NMR) (Zartler et al. (2003)). Le protocole

proposé consiste en un marquage spéciﬁque à chaque protéine criblée (marquage sélectif d’un acide aminé diﬀérent pour chaque protéine) permettant une analyse plus rapide et simple des liaisons.

1.3 Le besoin de données structurales en Fragment-Based

Drug Design (FBDD)

La méthode fragments ou en anglais Fragment-Based Drug Design (FBDD) est un outil utilisé depuis une quinzaine d’années qui connaît un réel succès en chimie médicinale, et qui a abouti à la conception et la validation d’un premier médicament en 2011 (le Zelboraf) (Bollag et al. (2012)). Son principe est basé sur le criblage de quelques centaines de fragments sur une protéine cible (voir paragraphe 1.2) suivit de l’optimisation de ceux qui se lient à la protéine pour aboutir à des molécules lead, c’est à dire des têtes de série, pour la conception du médicament (Figure 1.5).

(38)

1.3. LE BESOIN DE DONNÉES STRUCTURALES EN FBDD 37

Figure 1.4 – Criblage RMN par observation des signaux de la protéine réceptrice. On peut identiﬁer le site de liaison en repérant sur le spectre 2D les acides aminés de la protéine perturbés par la présence du fragment.

(39)

Figure 1.5 – Étapes de l’élaboration de médicaments à partir de fragments.

Pour commencer le processus, il est primordial d’élaborer une chimiothèque de fragments qui seront testés sur la protéine de choix. Les fragments introduits dans une chimiothèque destinée au FBDD sont sélectionnés à partir de leurs propriétés physico-chimiques (règle des 3 de Congreve et al. (Congreve et al. (2003)), voir Table 1.1). À la suite du criblage, les touches (fragments qui se lient à la protéine) sont optimisées par grossissement (ajout de groupements fonctionnels), ou par fusion ou liaison entre plusieurs fragments (Figure 1.5) (Frank et al. (2013)). Cette étape nécessite clairement des informations structurales sur le complexe protéine-fragment mais peu de techniques sont disponibles pour résoudre ce genre de structures, la plus utilisée étant la cristallographie aux rayons X. Nous proposons dans cette thèse d’utiliser le déplacement chimique, paramètre RMN riche en informations structurales, pour déterminer la structure des complexes protéine-ligand dans ce contexte du

Fragment-Based Drug Design. L’objet des chapitres suivants consiste donc à déﬁnir le déplacement

chimique des protéines en RMN et leur utilisation actuelle pour obtenir des informations structurales (Chapitre 2), puis de caractériser les diﬀérentes techniques disponibles pour résoudre les structures de complexes protéine-ligand en discutant plus particulièrement des possibilités oﬀertes par la RMN (Chapitre 3).

(40)

Chapitre 2

Du déplacement chimique à la structure

des protéines et

vice-versa

Déterminer la relation entre les déplacements chimiques et la structure des protéines fait depuis de longues années partie des objectifs à atteindre en biologie structurale, d’autant plus depuis que ce paramètre RMN est mesurable en routine. Cependant, leur dépendance à de multiples contributions électroniques (liaisons hydrogènes, anisotropie de liaison, champ électrique, etc...) rend leur interprétation très difficile. De nombreux groupes travaillent sur la prédiction des déplacements chimiques des atomes des protéines à partir de leur structure et de leur séquence ("de la structure au déplacement chimique"). Ce type d’étude vise prin-cipalement à utiliser les valeurs prédites pour assister le processus d’attribution de spectres RMN pour, par exemple, identifier les erreurs d’attributions ou de référence. Mais ces prédic-tions sont principalement utilisées pour le processus inverse ("du déplacement chimique à la structure") pour optimiser des structures ou pour identifier les différentes contributions élec-troniques et géométriques contenues dans les déplacements chimiques mesurés. Avec de tels outils, il est en effet possible de balayer l’espace conformationnel d’une protéine pour trou-ver des structures avec des déplacements chimiques prédits les plus proches de ceux mesurés expérimentalement.

Dans ce chapitre, nous déterminerons dans un premier temps la relation entre le déplace-ment chimique d’un atome et son environnedéplace-ment électronique, puis nous traiterons à la fois les stratégies permettant de relier la structure au déplacement chimique, mais aussi les stratégies inverses qui relient le déplacement chimique à la structure. Ces informations préliminaires seront essentielles pour la suite de notre étude aﬁn de comprendre comment ce paramètre

(41)

RMN pourra être utiliser pour déterminer la structure de complexes protéine-ligand.

2.1 Origine du déplacement chimique des protéines en

RMN

Le principe de la RMN repose sur le magnétisme des noyaux possédant un spin non nul, c’est à dire avec un nombre de masse et un numéro atomique impair. Chaque noyau résonne à sa propre fréquence de résonance νRM N déﬁnie par :

νRM N = γB0

2π (2.1)

avec γ le rapport gyromagnétique du noyau considéré (en rad.s−1.T−1) qui rend compte du

rapport entre le spin et le magnétisme du noyau, etB0le champ magnétique du spectromètre

(en Tesla).

Au sein d’une molécule, chaque noyau est soumis à l’effet électronique des atomes voisins à travers l’espace ou à travers les liaisons covalentes. Ces effets modifient la fréquence de résonance du noyau considéré d’une quantité appelée déplacement chimique δ, exprimé en

ppm (partie par million). Dans un environnement électronique donné, un noyau résonne donc à une fréquence eﬀectiveνef f qui dépend de l’écrantageσ perçu (eq. 2.2). La Figure 2.1 illustre

cette répartition des déplacements chimiques par rapport à l’environnement électronique, dans le cas des protons.

νef f = γB0(1 − σ)

2π (2.2)

Expérimentalement, on ne mesure pas directement une diﬀérence de constante d’écran mais une diﬀérence de fréquence (le déplacement chimique) entre le signal d’une référence et le signal de l’échantillon. Des références dites internes sont directement introduites dans l’échan-tillon pour ce genre de mesure. On utilise généralement du TMS (tétraméthylsilane) pour l’analyse de biomolécules dissoutes dans des solvants organiques, du DSS (acide 2,2-diméthyl-2-silapentane-5-sulfonique) soluble dans l’eau, ou du TSP (acide triméthylsilylpropanoïque) également soluble dans l’eau mais sensible au pH contrairement au DSS. Ces molécules sont utilisées en tant que référence car elles présentent un pic RMN unique, sont facilement so-lubles et résonnent à des champs forts.

(42)

2.1. ORIGINE DU DÉPLACEMENT CHIMIQUE DES PROTÉINES EN RMN 41

Figure2.1 – Échelle de déplacements chimiques des principaux types de protons.

Il existe 2 principales catégories de déplacement chimique dans les protéines :

— Isotropique : C’est le déplacement chimique mesuré dans un échantillon liquide où les noyaux ont une mobilité sans contrainte. Il représente une valeur moyenne dans le temps du tenseur de déplacement chimique. C’est typiquement celui que l’on mesure pour la plupart des protéines en RMN liquide.

— Anisotropique : Contrairement au déplacement chimique isotropique, le déplacement chimique anisotropique est dépendant de l’orientation du milieu, c’est à dire qu’il reﬂète la direction du tenseur de déplacement chimique d’un noyau donné. Il est mesuré en milieu orienté ou partiellement orienté (bicelles, phages, gels polyacrylamide, ...) où les protéines sont alignées grâce à des interactions stériques ou électrostatiques avec le milieu. Il est en général très diﬀérent des déplacements chimiques isotropiques (Voir plus de détails en Chapitre 3, paragraphe 3.3.3).

La catégorie la plus communément mesurée dans le cas de l’étude de biomolécules en RMN liquide est le déplacement chimique isotrope correspondant aux noyaux 1H,13C et15N trouvés dans les protéines. Ce type de déplacement chimique représente 99% des données de la BMRB (BioMagResBank ) (Ulrich et al. (2008)). Il peut être divisé en contributions

(43)

principales, appelé déplacement chimique random coil (contributions à travers les liaisons), dues au diamagnétisme δdia et au paramagnétisme δpara; et en contributions secondaires

(contributions à travers l’espace) résultant du champ électrique des groupements chargésδe,

de l’anisotropie de susceptibilité magnétique moléculaire ou de la torsion du squelette de la protéine δanis, du courant de cycle des aromatiques δcc, des liaisons hydrogène δLH, des

angles de torsion des chaînes latérales δchaines et de l’eﬀet du solvant et de la température δsolv (équation 2.3).

δtotal = δprincipal+ δsecondaire = δdia+ δpara+ δe+ δanis+ δcc+ δLH+ δchaines+ δsolv (2.3)

Plusieurs études ont permis de quantifier l’influence de ces contributions sur le déplace-ment chimique des différents types de noyaux (Wishart et Case (2001); Neal et al. (2003); Han

et al. (2011); Nielsen et al. (2012)). La Table 2.1 fait un bilan de l’inﬂuence relative de chaque

contribution sur différents types d’atomes qui constituent les protéines (Han et al. (2011)). Par exemple, les liaisons hydrogène à l’intérieur de la structure de la protéine influencent pour 18,4% le déplacement chimique des noyaux1HN tandis qu’elles n’ont quasiment aucune influence sur le déplacement chimique des noyaux 13C’, 13Cα, 13Cβ,1Hα et 15N. De manière

plus générale, les contributions à travers l’espace ont moins d’impact sur les déplacements chimiques des carbones (excepté les carbonyls 13C’), plus sensibles à des réarrangements conformationnels de l’acide aminé auquel ils appartiennent.

L’interprétation des déplacements chimiques mesurés en RMN nécessite la parfaite connais-sance des diﬀérentes sources de contributions électroniques présentes dans les systèmes étudiés et représente l’objectif de ce paragraphe.

2.1.1 Les contributions à travers les liaisons covalentes

Les contributions principales au déplacement chimique (δdia et δpara) proviennent de la

répartition des couches électroniques des noyaux. L’électron peut soit agir par l’intermédiaire de son mouvement orbital (moment orbital) autour du noyau, soit par son mouvement de spin (moment de spin) propre. En premier lieu, la susceptibilité magnétique χ de chaque noyau,

qui représente la faculté d’un matériau à s’aimanter sous l’action d’une excitation magné-tique, détermine sa tendance paramagnétique ou diamagnétique. Lorsque deux électrons sont appariés ils ont alors obligatoirement des spins opposés et c’est alors la contribution

(44)

orbi-2.1. ORIGINE DU DÉPLACEMENT CHIMIQUE DES PROTÉINES EN RMN 43

13_C’ 13_C

α 13Cβ 1HN 1Hα 15N

random coil (δdia+ δpara) 22,5 50,0 58,5 3,0 21,3 35,9

champ électrique (δe) 0,0 0,3 0,0 2,7 12,9 0,0

anisotropie/torsion du squelette (δanis) 51,1 38,9 33,9 42,4 43,3 45,5

courant de cycle (δcc) 0,0 0,5 0,9 11,5 11,2 0,6

liaison hydrogène (δLH)

0,0 0,0 0,0 18,4 0,3 0,0 (7,0) (1,9) (1,4) (11,3) (4,2) (2,8) torsion des chaînes latérales (δchaines) 10,4 6,0 3,6 4,6 3,4 12,2

pH, température, solvatation (δsolv) 7,5 1,8 1,7 5,3 3,0 2,4

non déﬁnis 1,5 0,6 0,0 0,8 0,4 0,6

Table 2.1 – Influence relative (%) des contributions électroniques sur le déplacement chi-mique de différents types de noyaux. Ces valeurs sont utilisées pour la prédiction des dépla-cements chimiques par le programme SHIFTX2 (Han et al. (2011)) et peuvent être trouvées sur le site web de ce programme (plus de détails en paragraphe 2.2). Les valeurs entre paren-thèses représentent l’influence de la nature, la géométrie (angles) et la longueur d’une liaison hydrogène qui aurait lieu sur le noyau lui-même ou sur son voisin.

talaire, dont le moment créé un champ opposé au champ principal −→B0, qui exprimera une

contribution diamagnétique. Un courant diamagnétique a donc tendance à induire un blin-dage. A l’inverse, lorsqu’un électron est non apparié, son eﬀet va essentiellement provenir de son moment de spin (beaucoup plus intense que son moment orbital) qui dépend de l’orienta-tion du spin par rapport au champ magnétique. C’est l’état le plus table qui provoque alors une contribution paramagnétique soit un déblindage. Les noyaux possédant une susceptibilité magnétique positive (respectivement négative) ont une tendance paramagnétique (respecti-vement diamagnétique), c’est à dire qu’ils attirent le champ magnétique appliqué vers eux (respectivement le repoussent).

En second lieu, la répartition des couches électroniques des noyaux peut être influencée par des effets inductifs (effets diamagnétiques) et mésomères (effets paramagnétiques) des noyaux voisins. Les effets inductifs proviennent de l’électronégativité des noyaux et sont transmis à travers les liaisons covalentes. Un substituant électronégatif aura pour effet de déplacer le déplacement chimique de son partenaire vers un champ faible (exemple du 13C lié à un substituant de type halogène en Table 2.2). De plus cet effet est cumulatif comme le montre l’évolution du déplacement chimique des protons des molécules présentées en Table 2.3. Les effets mésomères à travers les liaisons sont, quant à eux, essentiellement ressentis par les atomesβ et γ voisins. Par exemple, comme l’illustre la Figure 2.2, l’effet des groupements

électroattracteurs augmente la densité électronique des atomes voisins provoquant l’expansion de leurs orbitales, c’est à dire un blindage.

(45)

F Cl Br I δ13C (ppm) 75,0 24,9 9,8 -20,8 Electronégativité 3,98 3,19 2,96 2,66

Table 2.2 – Déplacements chimiques13C du composé CH₃X (où X représente un atome de type halogène) en fonction de l’électronégativité de X.

CH4 CH3Cl CH2Cl2 CHCl3

δ1H (ppm) 0,23 3,05 5,30 7,27

Table2.3 – Déplacements chimiques 1H montrant l’eﬀet cumulatif de l’électronégativité du Cl sur le proton auquel il est lié.

Figure 2.2 – Eﬀet de mésomérie (eﬀet paramagnétique) sur le déplacement chimique 13C d’un carbone en para d’un benzène monosubstitué (position représentée par un astérisque). Les étiquettes des pics indiquent la nature du substituant R.

Dans les protéines, les déplacements chimiques qui résultent des contributions à travers les liaisons (δdiaetδpara), sont appelés déplacements chimiques random coil. Le déplacement

chi-mique random coil d’un noyau d’un acide aminé représente le déplacement chichi-mique observé de l’atome dans un peptide non structuré. La Table 2.4 donne les valeurs des déplacements chimiques 1H random coil des 20 acides aminés, déterminées par Wüthrich en 1979 (Bundi et Wüthrich (1979)). Ces valeurs peuvent également être trouvées pour les atomes 13C (Keim

et al. (1973b,a, 1974); Richarz et Wüthrich (1978)) et 15N (Braun et al. (1994)) en solutions

aqueuses. Une étude plus récente, publiée par le groupe de Wishart et al., donne également des tables de déplacements chimiques random coil des atomes 1H,13C et 15N en fonction de leurs atomes voisins (Wishart et al. (1995)).

2.1.2 Les contributions à travers l’espace

Les effets électroniques à travers l’espace sont définis en tant que contributions secon-daires. Ils sont représentés par l’effet de champ électrique, de courant de cycle, d’anisotropie de liaison, d’angles de torsions, de liaisons hydrogène et du solvant. En premier lieu, ces

(46)

2.1. ORIGINE DU DÉPLACEMENT CHIMIQUE DES PROTÉINES EN RMN 45

Acide aminé HN Hα Hβ autres

Gly 8,39 3,97 - -Ala 8,25 4,35 1,39 -Val 8,44 4,18 2,13 γCH3 0,97/0,94 Ile 8,19 4,23 1,90 γCH2 1,48/1,19 γCH3 0,95 δCH30,89 Leu 8,42 4,38 1,65/1,65 γH 1,64 δCH30,94/0,90 Pro - 4,44 2,28/2,02 γCH2 2,03/2,03 δCH23,68/3,65 Ser 8,38 4,50 3,88/3,88 -Thr 8,24 4,35 4,22 γCH3 1,23 Asp 8,41 4,76 2,84/2,75 -Glu 8,37 4,29 2,09/1,97 γCH2 2,31/2,28 Lys 8,41 4,36 1,85/1,76 γCH2 1,45/1,45 δCH21,70/1,70 CH23,02/3,02 NH+3 7,52 Arg 8,27 4,38 1,89/1,79 γCH2 1,70/1,70 δCH23,32/3,32 HN 7,17/6,62 Asn 8,75 4,75 2,83/2,75 γHN27,59/6,91 Gln 8,41 4,37 2,13/2,01 γCH2 2,38/2,38 δHN2 6,87/7,59 Met 8,42 4,52 2,15/2,01 γCH2 2,64/2,64 CH32,13 Cys 8,31 4,69 3,28/2,96 -Trp 8,09 4,70 3,32/3,19 2H 7,24 4H 7,65 5H 7,17 6H 7,24 7H 7,50 HN 10,22 Phe 8,23 4,66 3,22/2,99 2,6H 7,30 3,5H 7,39 4H 7,34 Tyr 8,18 4,60 3,13/2,92 2,6H 7,15 3,5H 6,86 His 8,41 4,63 3,26/3,20 2H 8,12 4H 7,14

Table 2.4 – Déplacements chimiques random coil 1H pour les 20 acides aminés dans un tetrapeptide GGXA à pH 7,0 et 35°C (Bundi et Wüthrich (1979)).

(47)

eﬀets à l’intérieur de la structure secondaire de la protéine inﬂuencent de manière consen-suelle les déplacements chimiques de ses atomes. Par exemple, les déplacements chimiques

1_{H des acides aminés des hélices} _{α sont en moyenne blindés par rapport aux déplacements}

chimiques random coil, et respectivement déblindés dans les feuillets β. L’inﬂuence de la

structure secondaire sur les déplacements chimiques des 20 acides aminés est répertoriée en Table 2.5.

En second lieu, ces contributions électroniques inﬂuencent les déplacements chimiques des atomes proches dans l’espace et ce, peu importe les structures secondaires auxquelles ils appartiennent. Il n’existe pas de table permettant de donner directement les valeurs de dé-placement chimique résultant de tels eﬀets puisqu’il s’agit de contributions à travers l’espace, qui nécessitent l’introduction de paramètres physiques et géométriques pour être modélisés.

2.1.2.1 Le champ électrique

Dans les molécules à groupes fortement polarisés ou chargés, les moments électriques mo-diﬁent la densité de charge de certains protons par la déformation du nuage électronique, sous l’action du champ électrique. Selon la position respective de la liaison et du vecteur de champ, les électrons de liaison seront, soit rapprochés, soit éloignés du proton. En conséquence, il s’ensuivra un renforcement du blindage ou du déblindage. Les charges positives (respecti-vement négatives) auront tendance à déblinder (respecti(respecti-vement blinder) les protons voisins. La Figure 2.3 illustre l’exemple de la pyridine où les moments dipolaires provoquent un dé-blindage sur les protons puisque la charge électrique se déplace le long des lignes de champ vers l’extrémité positive du dipôle. Dans les systèmes protéiques, se sont les Cα (proches

des noyaux N) et tous les types de proton qui peuvent être soumis à l’eﬀet de sources élec-trostatiques causés principalement par les carbonyles, les atomes O, Oδ, Oε et N et par les

groupements chargés des acide aminés Glu, Asp, Lys, Arg et His.

2.1.2.2 L’anisotropie de liaison

L’anisotropie est déﬁnie comme étant la diﬀérence des susceptibilités parallèles et nor-males à l’axe de symétrie d’une liaison (Δχ = χ//− χ⊥). De fortes anisotropies magnétiques

apparaissent dans les liaisons multiples et les composés cycliques suite à la circulation des électrons π (le cas particulier des cycles aromatiques est présenté au paragraphe suivant