• Aucun résultat trouvé

Développement d'une méthode de prédiction de l'orientation et de l'insertion des protéines dans une membrane modèle

N/A
N/A
Protected

Academic year: 2021

Partager "Développement d'une méthode de prédiction de l'orientation et de l'insertion des protéines dans une membrane modèle"

Copied!
84
0
0

Texte intégral

(1)

Développement d'une méthode de prédiction

de l'orientation et de l'insertion des protéines

dans une membrane modèle

Mémoire

Andrei Tudor

Maîtrise en biochimie

Maître ès sciences (M. Sc.)

Québec, Canada

© Andrei Tudor, 2016

(2)
(3)

Résumé

Les protéines membranaires intégrales jouent un rôle indispensable dans la survie des cellules et 20 à 30% des cadres de lectures ouverts codent pour cette classe de protéines. La majorité des protéines membranaires se trouvant sur la Protein Data Bank n’ont pas une orientation et une insertion connue. L’orientation, l’insertion et la conformation que les protéines membranaires ont lorsqu’elles interagissent avec une bicouche lipidique sont importantes pour la compréhension de leur fonction, mais ce sont des caractéristiques difficiles à obtenir par des méthodes expérimentales. Des méthodes computationnelles peuvent réduire le temps et le coût de l'identification des caractéristiques des protéines membranaires. Dans le cadre de ce projet de maîtrise, nous proposons une nouvelle méthode computationnelle qui prédit l’orientation et l’insertion d’une protéine dans une membrane. La méthode est basée sur les potentiels de force moyenne de l’insertion membranaire des chaînes latérales des acides aminés dans une membrane modèle composèe de dioléoylphosphatidylcholine.

(4)
(5)

Abstract

Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames code for this class of proteins. Most of the membrane proteins found on the Protein Data Bank do not have a known membrane orientation and insertion, and such information is not available from the standard PDB format. The orientation, insertion and conformation that the membrane proteins have when interacting with a lipid bilayer are important for understanding their functions, but they are difficult characteristics to obtain experimentally. Computational methods can help reduce the cost and time allocated to determine the characteristics of a membrane protein. In this project, we propose a new computational method that predicts the orientation and the insertion of a protein in a lipid bilayer. The method is based on the potential mean force of the insertion of the amino acid side chain analogs in a dioleoylphosphatidylcholine lipid bilayer.

(6)
(7)

Table des matières

Résumé ... iii

Abstract ... v

Table des matières ... vii

Liste des figures ... ix

Liste des abréviations ... xiii

Remerciements ... xv Chapitre 1 : Introduction ... 1 1.1 Membranes ... 1 1.2 Phospholipides ... 1 1.3 Membranes modèles ... 3 1.4 Protéines membranaires ... 4

1.5 Les méthodes expérimentales ... 7

1.6 Les méthodes computationnelles ... 10

Chapitre 2 : Hypothèse et Objectif ... 15

2.1 Hypothèse ... 15

2.2 Objectif ... 15

Chapitre 3 : Méthodes ... 17

3.1 Théorie ... 17

3.2 Calcul des PMF ... 19

3.2.1 Informations sur les simulations ... 21

3.3 Calcul du score ... 22

3.4 Méthodes utilisées par MemP3 ... 25

3.5 Approximations nécessaires ... 28

3.6 Méthodologie de la validation ... 29

Chapitre 4 : Résultats ... 31

4.1 Peptide modèle ... 32

4.2 Protéines équilibrées par dynamique moléculaire ... 34

4.2.1 Caveoline 1 ... 34

4.2.2 Protéine liant le retinol chez le bovin (PDB: 1KT7) ... 35

4.2.3 Src Homology 3 domain (PDB: 1SHG) ... 38

4.2.4 Canal Potassium KvAP (PDB: 1ORS) ... 39

4.2.5 Outer membrane protein W (PDB: 2F1V) ... 41

4.2.5 Synaptotagmine C2B ... 44

4.2.6 Cytochrome P450 3A4 ... 46

4.2.7 Cytochrome P450 2C9 ... 48

4.2.9 OMPLA (PDB: 1QD6) ... 50

4.3 Limites de la méthode ... 52

4.3.1 Hémoglobine tronquée (trHbN) - simulations de dynamique moléculaire ... 52

4.3.2 Hémoglobine tronquée (trHbN) - PDB 1IDR ... 53

4.3.3 Peptide de fusion du virus de l’influenza (FusPept) - simulations de dynamique moléculaire ... 54

(8)

Chapitre 5 : Discussion ... 57

5.1 Précision de la méthode ... 58

5.2 Limites de la méthode ... 59

5.3 Vitesse de prédiction ... 62

Chapitre 6 : Conclusion et Perspectives ... 63

6.1 Conclusion ... 63

6.2 Perspectives ... 64

(9)

Liste des figures

Figure 1 : Exemple de membrane biologique. La membrane biologique d’une cellule est composée de phospholipides, de protéines membranaires (périphériques et transmembranaires), de cholesterol et

d'oligosaccharides. Image adaptée de WikiCommons

(https://commons.wikimedia.org/wiki/File: CellMembraneDrawing.jpg)...2 Figure 2 : Structure générale d’un phospholipide. La composition d’un

phospholipide dépend de la nature de la molécule liée au groupement phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1 et R2) qui sont liées au glycérol à l’aide des groupements

carbonyles. Image construite à l’aide du logiciel Marvin Sketch,

ChemAxon (http://www.chemaxon.com)...3 Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé est

représentée la phase aqueuse, les sphères rouges représentent les atomes d’oxygène et du glycérol, les sphères orange représentent les atomes de phosphate et les sphères grises représentent les atomes de carbone (les atomes d’hydrogène sont omis pour plus de clarté)...4 Figure 4 : Représentation d’une protéine périphérique et une transmembranaire.

Image adaptée de WikiCommons

( https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png ) ...5 Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale des

acides aminés lysine et alanine en fonction de la position en Z. L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion selon la normale du plan de la membrane est indiquée selon l’axe Z. Une énergie d’insertion positive est défavorable. Le centre de la membrane est situé à Z = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de PMF sont tirées des travaux de MacCallum et Tieleman (18)...14 Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La chaîne

latérale de l’acide aminé valine est tronquée au carbone β et la liaison avec le carbone α est remplacée par un proton...20 Figure 7 : Représentation de la surface exposée au solvant (SASA) de la chaîne

latérale du résidu LEU3 en présence du squelette protéique et le SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4 (gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3. Le squelette de la protéine est représenté en cartoon. Les points bleus représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la chaîne latérale LEU3 complètement immergée dans le

(10)

Figure 8 : Comparaison des prédictions du peptide poly-leucine faites par MemP3 (orange) et par PPM (vert) pour un peptide de poly-leucine formé de 25 résidus. ...33 Figure 9 : Comparaison des prédictions de la calveolin faites par MemP3 (orange)

et par PPM (vert) avec la structure de référence (bleu) fournie par Riu et al. (23). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...35 Figure 10 : Comparaison des prédictions de la protéine liant le rétinol chez le bovin

faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) prise sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...37 Figure 11 : Comparaison des prédictions de la protéine Src Homology 3 domain

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...39 Figure 12 : Comparaison des prédictions du canal potassium KvAP faites par

MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...41 Figure 13 : Comparaison des prédictions de la protéine Outer membrane protein W

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...43 Figure 14 : Comparaison des prédictions de la protéine Synaptotagmine C2B faites

par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Wu et al. (24). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...45 Figure 15 : Comparaison des prédictions de la protéine Cytochrome P450 3A4

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Cojocaru et al. (27). La partie A de la figure

(11)

compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...47 Figure 16 : Comparaison des prédictions de la protéine Cytochrome P450 2C9

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Berka et al. (26). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...49 Figure 17 : Comparaison des prédictions de la protéine OMPLA faites par MemP3

(orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la

structure de référence...51 Figure 18 : Comparaison des prédictions de la protéine trHbN faites par MemP3

(orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...53 Figure 19 : Comparaison des prédictions de la protéine trHbN PDB 1IDR faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...54 Figure 20 : Comparaison des prédictions du peptide de fusion faites par MemP3

(orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...55 Figure 21 : Comparaison des prédictions du peptide de fusion PDB 1IBN faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...56

(12)
(13)

Liste des abréviations

CD Dichroisme circulaire

CGDB Coarse Grained DataBase

DCLE Dichloroethane

DOPC Dioléoyl phosphatidylcholine

DPPC Dipalmitoyl phosphatidylcholine

DVPC Divaléryl phosphatidylcholine

DVPS Divaléryl phosphatidylsérine

EPR Electron Paramagnetic Resonance

GBSW Generalized Born with simple smoothed SWitching

GLY Glycine

HIS Histidine

HMMM Highly Mobile Membrane Mimetic

ILE Isoleucine

LEU Leucine

MemP3 Membrane Protein Prediction and Positioning

MPEx Membrane Protein EXplorer

MSMS Maximal Speed Molecular Surfaces

NOE Nuclear Overhauser Effect

OCD Dichroisme Circulaire Orienté

OPM Orientation of Proteins in Membranes

ORF Cadres de Lecture Ouverts

OBPC Oléoyl diBromosteroyl Phosphatidylcholine

PDB Protein Data Bank

PMF Potentiel de Force Moyenne

(14)

PPM Positioning of Proteins in Membranes

PRO Proline

RMN Résonance Magnétique Nucléaire

RMSD Root Mean Square Deviation

SASA Surface Exposée au Solvant

Tcl Tool Command Language

TMDET DETermine TransMembrane planes

(15)

Remerciements

J'aimerais remercier en premier mon directeur de recherche Patrick Lagüe. Il m'a soutenu et conseillé tout le long de ma maîtrise. Il m'a appris l'importance de la communication et de la rigueur scientifique. Avec son aide je suis devenu un meilleur écrivain et pour ça je le remercie beaucoup.

Ensuite, je remercie les membres de mon comité aviseur qui sont Stéphane Gagné et Christian Salesse. Ils m'ont fourni de précieux commentaires lors des rencontres de ce comité.

Je remercie aussi mes collègues de laboratoire avec lesquels j'ai passé des merveilleux moments, Xavier Barbeau, Sébastien Légaré, Jean-François Rheault et Joël Tremblay-Marchand.

Je remercie mes parents, qui ont su me supporter durant mes études et me pousser toujours plus loin.

J'aimerais remercier ma chère épouse, Andreea Dumitru, qui a toujours été à mes côtés dans les moments les plus durs et qui comprend mieux que nul autre le chemin par lequel je suis passé. Je t'aime!

(16)
(17)

Chapitre 1 : Introduction

1.1 Membranes

Les membranes biologiques sont des composantes cellulaires complexes d’une importance capitale pour la fonction et la structure de la cellule (1). En effet, les membranes cellulaires permettent d’isoler le milieu extracellulaire du milieu intracellulaire. Par conséquent, elles ont la fonction de contrôler les molécules qui peuvent passer de l’intérieur vers l’extérieur de la cellule et vice-versa, ainsi qu’entre l’intérieur de la cellule et l’intérieur de différents organites (1).

Les membranes biologiques sont généralement composées de plusieurs molécules biologiques (1) : plusieurs types de phospholipides et différentes protéines (voir Figure 1). Cette composition varie avec le type de tissus duquel la cellule fait partie, ainsi qu’avec la fonction de la cellule (1). De plus, la composition membranaire peut aussi varier à l’intérieur de la cellule, d’un organite à un autre (voir Figure 1).

1.2 Phospholipides

Les membranes eukariotes sont principalement composées d'un type de lipide appelé phospholipide (Figure 2). Les phospholipides sont des molécules amphiphiles (1), ce qui leur donne un caractère à la fois hydrophobe et hydrophile (1). La partie des chaînes aliphatiques (R1 et R2), les acides gras, forme la partie hydrophobe des phospholipides (1). La partie hydrophile, la tête polaire, est composée par le groupement R3, le groupement phosphate et le glycérol. Ainsi, puisque les phospholipides sont composés d’une partie hydrophile et une autre hydrophobe, ils s’organisent en différentes formes physiques lorsqu’ils sont dans une solution aqueuse (1). La structure dans laquelle les lipides s’organisent dépend essentiellement de la forme des lipides, leur type, leur concentration et la

(18)

température du mélange. La forme physique employée dans les cellules s'appelle une bicouche lipidique (1). En effet, en milieu aqueux la partie hydrophile cherche à être hydratée par les molécules d’eau, tandis que la partie hydrophobe cherche à fuir les molécules d’eau (1). La formation d’une bicouche lipidique permet aux parties hydrophiles de rester en contact avec l’eau et aux parties hydrophobes de rester éloignées de la phase aqueuse (1).

Figure 1 : Exemple de membrane biologique. La membrane biologique d’une cellule est composée de phospholipides, de protéines membranaires (périphériques et transmembranaires), de cholesterol et d'oligosaccharides. Image adaptée de WikiCommons (https://commons .wikimedia.org/wiki/File: CellMembraneDrawing.jpg)

(19)

Figure 2 : Structure générale d’un phospholipide. La composition d’un phospholipide dépend de la nature de la molécule liée au groupement phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1 et R2) qui sont liées au glycérol à l’aide des groupements carbonyles. Image construite à l’aide du logiciel Marvin Sketch, ChemAxon (http://www.chemaxon.com)

1.3 Membranes modèles

La membrane modèle est une version simplifiée d’une membrane biologique. Habituellement, les membranes modèles sont composées d’un seul type de phospholipide, mais plusieurs types de phospholipides peuvent être utilisés pour la même membrane. Par contre, plus on ajoute des phospholipides différents, plus la complexité du système étudié augmente. La structure d’une

(20)

membrane modèle composée par le phospholipide palmitoyl oleoyl phosphatidylcholine (POPC) dans l’état fluide (Lα) est représentée à la Figure 3.

Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé est représentée la phase aqueuse, les sphères rouges représentent les atomes d’oxygène et du glycérol, les sphères orange représentent les atomes de phosphate et les sphères grises représentent les atomes de carbone (les atomes d’hydrogène sont omis pour plus de clarté).

1.4 Protéines membranaires

Pour l'exécution de leur fonction biologique, plusieurs protéines ont besoin d’être liées à la membrane cellulaire. Ces protéines peuvent être divisées en deux catégories, soit les protéines intrinsèques, qui traversent la membrane et les protéines extrinsèques, qui s’accrochent à la surface des membranes cellulaires (1) (voir Figure 4). Les protéines intrinsèques ou transmembranaires sont des protéines qui sont fortement liées aux membranes principalement par des forces hydrophobes. Elles traversent complètement la membrane cellulaire. Les protéines

(21)

extrinsèques ou périphériques sont des protéines qui se lient moins fortement aux membranes que les protéines transmembranaires et lient une seule couche de la membrane cellulaire.

Figure 4 : Représentation d’une protéine périphérique et une

transmembranaire. Image adaptée de WikiCommons (

https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png )

Les protéines transmembranaires représentent seulement 2% des soumissions de structures sur Protein Data Bank (PDB) (2) (http://www.rcsb.org/pdb/statistics/holdings.do - consulté le 14 juillet 2015), alors que 20 à 30 % des cadres de lecture ouverts (ORF) codent pour ces protéines ( 3). Comme cette étude (3) ne prend pas en compte les protéines périphériques, on peut s’attendre que ces pourcentages soient plus élevés. À première vue, on peut conclure que les protéines membranaires sont sous-représentées dans la banque PDB. Par contre, il faut considérer la possibilité que des protéines soient présentes

(22)

dans la banque PDB qui ne sont pas connues comme étant membranaires. Ceci peut être dû au manque de connaissance des caractéristiques physiques de certaines protéines amphipatiques. Dans ce cas, le pourcentage de protéines membranaires présentes dans la banque PDB pourrait être plus élevé. Par exemple, il a été récemment démontré que la protéine hémoglobine tronquée trHbN (PDB 1IDR) est une protéine périphérique (4). Cette protéine était considérée comme étant soluble avant l’étude de Rhéault et al. (4).

Les membranes influencent la fonction et la structure tridimensionnelle des protéines membranaires (5, 6), mais il est difficile d’étudier l'interaction entre ces protéines et les membranes. Compte tenu de la difficulté d’étudier cette interaction en utilisant des méthodes expérimentales, l’orientation, l’insertion membranaire et la conformation en présence des lipides d’une partie des structures se trouvant dans la banque PDB ne sont pas connues. C’est pourquoi le présent projet de maîtrise consiste à développer un outil pouvant prédire l’insertion et l’orientation des protéines dans plusieurs membranes modèles. Dans le cadre de ce projetet dans le but du dévéloppement initial, nous avons utilisé une membrane modèle fait du phospholypide dioléoyl phosphatidylcholine (DOPC).

Présentement, il existe quelques méthodes computationnelles et expérimentales qui peuvent être utilisées pour prédire ou déterminer l’orientation et l’insertion des protéines interagissant avec les membranes. Le texte suivant présente brièvement les différentes méthodes expérimentales courantes et les outils computationnels en mettant en évidence leurs forces et leurs faiblesses. Il sera ensuite question de présenter en détail la théorie et le fonctionnement de l’outil développé (chapitre 3). Suivra la section des résultats (chapitre 4), la discussion (chapitre 5) et finalement la conclusion (chapitre 6).

(23)

1.5 Les méthodes expérimentales

Les méthodes expérimentales les plus utilisées pour déterminer l’insertion et l’orientation des protéines membranaires sont la diffraction par rayons X (7), la résonance magnétique nucléaire (RMN) (8), la fluorescence du tryptophane (8), la résonance magnétique électronique EPR (8), la spectroscopie infrarouge et le dichroisme circulaire orienté (8).

La méthode de diffraction par rayons X est utilisée pour déterminer la structure d’un peptide ou d’une protéine, ainsi que la distribution des lipides les entourant (7). Essentielement, des faisceaux de rayons X frappent un crystal, ce qui produit des rayons X diffractés. Ces dérnières frappent un détecteur, ce qui créé un patron de diffraction. À partir de ce patron, la structure tridimentionelle d'une protéine peut être calculée. Par exemple, la conformation et l'orientation du peptide Ac-18A-NH2 dans une bicouche lipidique de type dioléoyl phosphatidylcholine / oléoyl dibromosteroyl glycero phosphocholine (DOPC/OBPC) ont été déterminées à l'aide de cette méthode (7). Il a été observé que lorsque le peptide est présent, il a tendance à être entouré par des lipides de type OBPC plutôt que DOPC. La méthodologie utilisée consiste dans un premier temps à déterminer l'orientation des microstructures des lipides ainsi que le niveau d'hydratation de celles-ci en absence et en présence d'un peptide ou d’une protéine (7). Dans un deuxième temps, la perturbation de la bicouche lipidique par le peptide est calculée. Lors de cette étape, la perturbation des lipides est indiquée par la distribution des liens marqués au brome (Br) (7). Dans un troisième temps, la position en Z de la paire gaussienne optimale du peptide est calculée. Cette étape permet de trouver la position du peptide par rapport au centre de la membrane. La quatrième et dernière étape est la modélisation de la conformation, la position et l'orientation du peptide. En connaissant la structure du peptide à l'aide de la diffraction des rayons X et les données qui été obtenues à propos de la position sur l’axe z et l'orientation du peptide dans la membrane, les scientifiques ont été capables de positionner, computationnellement, le peptide dans une

(24)

membrane (7). La difficultée de la méthode de diffraction par rayons X est l'étape de la création des crystaux. En effet, dépendant des protéines, la qualitée des cristaux peut varier, ce qui influence la résolution du modèle atomique résultant du patron de difffraction.

Les méthodes de RMN peuvent être divisées en deux catégories, soit la RMN solide et la RMN en solution (8). Les méthodes de RMN solide sont utilisées pour déterminer la localisation d’un peptide dans une bicouche lipidique (8). L’orientation peut être calculée indirectement avec des analyses supplémentaires (8). La bicouche lipidique est orientée avec la normale, donc parallèle à la direction du champ magnétique. La majorité des peptides étudiés par RMN solide sont des hélices alpha (8). Les méthodes de RMN liquide permettent de déterminer la structure d’un petit peptide interagissant avec une micelle, une bicelle ou une vésicule unilamelaire. La RMN liquide ne permet pas la détermination de l’orientation et la localisation d’un peptide dans une membrane (8). Pour cela plusieurs techniques ont été mises au point pour , comme le Nuclear Overhauser Effect (NOE), Residual Dipolar Couplings et Paramagnetic Relaxation Enhancement (8).

La méthode de fluorescence du tryptophane profite de la présence du résidu tryptophane dans les peptides ou les protéines qui se lient aux membranes pour déterminer leur orientation et leur insertion (8). Le tryptophane agit comme point d’ancrage entre une protéine et la membrane cellulaire, puisqu’il interagit avec les molécules d’eau se trouvant à l’interface membranaire (9). Lorsque le résidu tryptophane s'insère dans une bicouche lipidique, l’émission de fluorescence se déplace vers des longueurs d’onde plus courtes, ce qui produit une lumière ultraviolette (8). Le degré d’intensité de la fluorescence peut être corrélé avec l’insertion du peptide ou de la protéine dans la membrane (8). Comme cette méthode a besoin de la présence des résidus tryptophane, elle est restreinte seulement aux peptides et protéines qui en contiennent (8).

La méthode de spectroscopie EPR est utilisée pour observer l’effet d’une bicouche lipidique sur le temps de relaxation d’un peptide auquel a été ajouté un

(25)

marqueue de spin (8). Les résidus du peptide WALP ont été un par un remplacés par une cystéine, sur laquelle un marqueur de spin est ajouté. Comme l’orientation de ce peptide est connue, la profondeur d’insertion des résidus peut être calculée (8). Cette information peut être utilisée pour obtenir l’orientation d’autres peptides. Les résidus doivent être remplacés un par un par une cystéine (8). Le grand désavantage de cette méthode est que les peptides étudiés doivent être modifiés, ce qui est un travail laborieux et les modifications peuvent influencer le comportement du peptide dans un environnement hydrophobe (8).

La méthode de spectroscopie infrarouge permet de déterminer la présence de différentes structures secondaires d’un peptide ou d’une protéine, principalement par l’analyse du groupement carbonyle des lipides (8). En plus de la structure, l’orientation des éléments de structure secondaire ordonnée dans une bicouche lipidique peut être déterminée par ATR-IR (Attenuated Total Reflexion Infrared Spectroscopy) (8).

La méthode de dichroisme circulaire orienté (OCD) est similaire à la méthode classique de dichroisme circulaire (CD) (8). En effet, dans le cas des deux méthodes, l’absorption de la lumière polarisée à gauche et à droite est monitorée. Le CD est utilisé pour déterminer la présence de structures secondaires d’une protéine ou d’un peptide en fonction des changements de son environnement (8). Dans le cas de la méthode OCD la lumière polarisée est envoyée perpendiculairement ou à des angles obliques à la bicouche membranaire (8). Cela permet d’obtenir des informations non seulement sur la structure de la protéine, mais aussi sur son orientation et insertion dans la bicouche lipidique.

Ces méthodes expérimentales requièrent un budget important, beaucoup de temps et ont certaines limitations. Par exemple, les méthodes de RMN solide et liquide permettent d’obtenir des informations que sur des petits peptides (8). Pour cela, les méthodes doivent être combinées, ce qui augmente les coûts et le temps consacré. Pour contrer ce problème et pour étudier les protéines qui sont difficiles, voire, même impossibles à étudier avec des méthodes expérimentales, des

(26)

méthodes de prédiction computationnelles ont été développées.

1.6 Les méthodes computationnelles

Les méthodes computationnelles ont pour objectif de prédire l’insertion et l’orientation d’une protéine dans une membrane. Les méthodes présentement disponibles peuvent être séparées en deux catégories : celles qui utilisent la dynamique moléculaire et celles qui ne l’utilisent pas. Parmi les méthodes utilisant de la dynamique moléculaire, il y a les simulations tout-atome, les simulations à gros grains (10) et les simulations de type Generalized Born with simple smoothed SWitching (GBSW) (11). Parmi les méthodes n’utilisant pas de dynamique moléculaire il y a la méthode Membrane Protein EXplorer (MPEx) (12), la méthode Positioning of Proteins in Membranes (PPM) employée par Orientation of Proteins in Membranes (OPM) (13) et finalement l’algorithme DETermine TransMembrane planes (TMDET) (14).

La dynamique moléculaire tout-atome permet de calculer toutes les interactions entre les atomes, étant ainsi la méthode computationnelle la plus exacte. À cause de la grande quantité de calculs qui doivent être réalisés, cette méthode est aussi la plus lente. Il est possible d’observer l’insertion d’un peptide dans une membrane, mais ce processus est très long et requiért des ordinateurs puissants.

Les modèles à gros grains représentent un petit nombre d’atomes par un seul objet (15), ce qui permet d’accélérer les calculs. Par exemple, pour représenter les lipides membranaires, 4 atomes lourds sont groupés en un seul gros grain (10, 16). En utilisant cette méthode, le nombre d’atomes de la membrane est diminué considérablement, mais il reste que la puissance de calcul nécessaire demeure assez grande.

(27)

(11), qui consiste à remplacer les molécules du solvant (eau et membrane) par un milieu diélectrique. Avec ces simulations, le temps de calcul peut être plus court qu’avec le modèle à gros grains, mais cela n’est pas toujours le cas. Un des désavantages est que la déformation de la membrane causée par la liaison d’une protéine à une membrane ne peut pas être simulée avec cette méthode (11).

Les méthodes présentées jusqu’ici utilisent la dynamique moléculaire, et requièrent une puissance de calcul importante, en plus du temps de préparation des systèmes à simuler, qui requiert beaucoup d’interventions manuelles. Pour accélérer le processus, des méthodes qui n’utilisent pas la dynamique moléculaire ont été mises au point. Par contre, ces méthodes ont leurs propres désavantages. Certaines ne peuvent fonctionner avec des protéines périphériques, comme la méthode TMDET, alors que d’autres fonctionnent seulement avec un type de membrane, comme la méthode PPM.

Un premier outil n’utilisant pas de dynamique moléculaire est le logiciel «Membrane Protein Explorer» (MPEx) (12). Le logiciel offre l’analyse et la prédiction de structure des protéines transmembranaires contenant des hélices α, ainsi que des barils β (12). Tout ce que le logiciel nécessite en entrée est la structure primaire d’une protéine. Dans le cas des hélices α, l’outil calcule l’hydrophobicité de la protéine et l’énergie libre des hélices, pour déterminer la portion membranaire. Pour ce qui est des barils β, MPEx utilise l’algorithme de Wimley (12) pour prédire si des acides aminés formant les feuillets β ou les coudes font partie de la partie transmembranaire (12). Le plus grand désavantage de cette méthode est qu’elle fonctionne seulement avec des protéines transmembranaires. Un autre désavantage est que l’outil ne fournit pas les coordonnées des atomes tel que prédit.

Il existe aussi la méthode «Positionning of Proteins in Membranes» (PPM). Cette méthode est utilisée par «Orientation of Proteins in Membranes» (OPM) pour étudier les protéines membranaires (13). Cette méthode nécessite un fichier PDB de la structure de la protéine d’intérêt. L’insertion et l’orientation de la protéine sont obtenues par la minimisation de l’énergie de transfert de ces atomes d’un milieu

(28)

aqueux vers un milieu hydrophobe (17). La minimisation emploie la méthode de minimisation locale Davidon-Fletcher-Powel combinée avec un balayage de grille (17). Ce balayage permet de déterminer les points de départ de la méthode de minimisation locale (17). La méthode PPM a été testée avec 24 protéines transmembranaires qui sont disponibles sur la banque PDB. Leurs résultats sont plus rapprochés des résultats expérimentaux que ceux des autres méthodes automatiques présentées ici (13). Cette méthode peut différencier avec une bonne précision les protéines solubles et celles transmembranaires. Le désavantage de cette méthode est qu’elle ne tient pas compte de la composition des têtes polaires, ni la composition des chaînes aliphatiques des lipides.

Une troisième méthode est l’algorithme TMDET (14). Cet outil utilise un fichier de coordonnés PDB. La première étape est de prédire la surface de la protéine qui est accessible au solvant. Cela est réalisé par une fonction objective qui utilise la surface accessible au solvant de la protéine et un vecteur normal pour définir la membrane. Cette fonction permet de trouver les parties de la protéine qui se trouvent à l’intérieur de la membrane (14). Ensuite, l’algorithme calcule le meilleur angle du plan de la membrane cellulaire. Cette méthode a été utilisée pour analyser toute la base de données PDB et trouver les protéines transmembranaires, mais elle ne fonctionne pas avec les protéines périphériques.

Ces méthodes rapides (MPEx, PPM et TMDET) ont toutes le même désavantage, soit l’impossibilité de prédire la conformation des protéines en présence des lipides. Cela ne peut être prédit qu’avec la dynamique moléculaire. Lors de ce projet de maîtrise, un outil qui prédit l’orientation et l’insertion des protéines dans une membrane a été développé. Bien que l’outil développé n’utilisera pas la dynamique moléculaire, il sera possible de développer une extension de cet outil qui inclura cette possibilité.

L’outil développé au cours de ce projet de maîtrise est basé sur les PMF (Potential of Mean Force) d’insertion membranaire des chaines latérales des acides aminés. Le PMF d’insertion membranaire des chaines latérales des acides aminés représente la différence d’énergie libre ΔG(z) associée au déplacement

(29)

des chaînes latérales des acides aminés entre le solvant et la membrane, selon un axe normal au plan de la membrane. Dans le cadre de ce projet, les PMF d’insertion membranaire des chaines latérales des acides aminés calculés dans le laboratoire du Dr. Peter Tieleman (18) seront utilisées. Un exemple de courbe de PMF d’insertion membranaire de la chaine latérale de l’alanine se trouve à la Figure 5. Nous avons nommé l’outil ainsi développé MemP3, qui est une abréviation de Membrane Protein Prediction and Positionning.

(30)

Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale

des acides aminés lysine et alanine en fonction de la position en Z.

L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion selon la normale du plan de la membrane est indiquée selon l’axe Z. Une énergie d’insertion positive est défavorable. Le centre de la membrane est situé à Z = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de PMF sont tirées des travaux de MacCallum et Tieleman (18).

(31)

Chapitre 2 : Hypothèse et Objectif

2.1 Hypothèse

L’utilisation des PMF d’insertion des chaînes latérales des acides aminés dans les membranes permettra de prédire l’orientation et l’insertion des protéines lorsqu’elles interagissent avec une membrane. Selon les PMF d’insertion disponibles, les prédictions pourront être effectuées pour différentes compositions lipidiques membranaires.

2.2 Objectif

Mettre au point un outil pour déterminer l’orientation et l’insertion d’une protéine dans une membrane modèle. Cet outil utilisera une structure de protéine rigide, ainsi que des PMF d’insertion membranaire des chaînes latérales des acides aminés. De plus, cet outil sera une preuve de concept que l’approche des PMF fonctionne, et pourra être subséquemment utilisée pour développer une méthode plus complexe incluant la dynamique moléculaire (cette approche sera brièvement décrite dans les perspectives, dans le dernier chapitre).

(32)
(33)

Chapitre 3 : Méthodes

La théorie associée à la méthode développée dans les présents travaux sera décrite dans la première section du chapitre. Ensuite, tous les détails reliés au fonctionnement de la méthode seront exposés dans la section suivante.

3.1 Théorie

La méthode de prédiction de l’insertion membranaire des protéines que nous avons développée est basée sur les PMF d’insertion des chaînes latérales des acides aminés dans les membranes. En effet, l'hypothèse que nous formulons est que l’insertion membranaire d’une protéine est dirigée par l’insertion des acides aminés composant cette dernière. En d’autres mots, l’énergie libre d’insertion membranaire de la protéine est la somme des énergies libres d’insertion de chacun des acides aminés la composant, et la position et l’orientation d’équilibre de la protéine insérée dans la membrane sera celle pour laquelle la somme des énergies libres de chacun des acides aminés sera minimale. Cette hypothèse s’apparente à l’hypothèse thermodynamique qui suppose que la séquence des protéines va diriger naturellement leur repliement dans une configuration native selon les bases de la thermodynamique (19). De plus, cette approche suppose aussi une additivité pour laquelle l’énergie effective de liaison membranaire peut être exprimée selon la somme des énergies individuelles de chacun des acides aminés. Cette hypothèse d’additivité est couramment utilisée avec succès en modélisation moléculaire, avec un des exemples les plus éloquents que sont les champs de forces empiriques (19).

(34)

Les différentes étapes de la méthode sont :

1. Calculer le PMF d’insertion membranaire pour chacun des acides aminés existants. Cette étape n’est effectuée qu’une seule fois, pour une composition membranaire donnée, et les résultats sont réutilisés à chaque prédiction réalisée. Suivant cette étape, nous avons une valeur d’énergie libre d’insertion selon l’insertion membranaire le long de la normale de la bicouche, pour chacun des acides aminés.

2. Obtenir et préparer le fichier contenant la structure de la protéine.

3. Choisir une position et une orientation de départ relatives à la membrane, et calculer l’énergie libre d’insertion, soit la somme des énergies libres de chacun des acides aminés. Cette valeur totale d’énergie libre est associée à un score. La position de départ de la protéine peut dépendre de l’algorithme utilisé. Cette variation n’influence aucunement le résultat final.

4. Rechercher la position et l’orientation d'insertion membranaire ayant l’énergie libre la plus basse, selon les itérations suivantes:

a) Modifier la position et/ou l’orientation d’insertion membranaire de la protéine.

b) Calculer l’énergie libre d’insertion (ou le score) pour la configuration actuelle, et la comparer aux configurations précédentes; si la configuration actuelle possède l’énergie la plus basse, la conserver en mémoire.

(35)

Les étapes de cette section sont générales et peuvent êtres accomplies en utilisant différentes méthodes. La prochaine section détaille la méthode utilisée pour calculer un score associé à l’insertion et l’orientation membranaire d’une protéine.

Cette section est suivie de deux autres sections, avant de présenter en détails la méthodologie utilisée par MemP3. Ces deux sections, soit Calcul des

PMF et Calcul du Score, sont nécessaires pour pouvoir expliquer le concept des

potentiels de force moyenne, ainsi que la méthode utilisée pour déterminer la meilleure position d’une protéine. Par la suite, les méthodes que nous avons choisies pour accomplir chacune des étapes décrites ci-dessus seront détaillées.

3.2 Calcul des PMF

Le potentiel de force moyenne (PMF) est un type de simulation qui peut être fait à l’aide des simulations Monte Carlo ou bien à l’aide des simulations de dynamique moléculaire. Le PMF détermine comment l’énergie libre d'un système change en fonction d’un paramètre spécifique (20).

Par exemple, le PMF peut déterminer comment l’énergie libre d’un système varie en fonction de la distance entre deux résidus, ou bien la variation de l’énergie libre du système au fur et à mesure qu’une protéine est insérée dans une bicouche lipidique (20). Le PMF peut être calculé en fonction d’une coordonnée géométrique, ou bien selons la variation d’une donnée énergétique. Habituellement, les simulations PMF sont exécutées avec une méthode appelée umbrella sampling, pour pouvoir échantillonner tout l’espace du système, même lorsque l’énergie libre touche des niveaux qui ne sont pas physiquement possibles (20).

En utilisant les PMF il est possible de prédire l’orientation et l’insertion d’une protéine dans une membrane, parce qu’ils représentent toutes les forces étant

(36)

appliquées sur un atome à un endroit dans l’espace. Un exemple de PMF de l’insertion membranaire de la chaîne latérale d’un acide aminé se trouve à la Figure 5.

Les potentiels de force moyenne (PMF) d’insertion des chaînes latérales dans une membrane ont été calculés par MacCallum et al. (18) à l’aide des simulations de dynamique moléculaire, utilisant la méthode appelée umbrella sampling. Les acides aminés histidine (HIS), glycine (GLY) et proline (PRO) ont été exclus des calculs de PMF. Les formes neutres et chargées des acides aminés acide glutamique, acide aspartique, lysine et arginine ont été utilisées pour calculer les PMF d’insertion membranaire des chaînes latérales.

Les 17 chaînes latérales des acides aminés utilisés ont été tronquées au carbone β, résultant en des petites molécules analogues. Par exemple, la chaîne latérale de l’acide aminé valine devient une molécule de propane, montrée à la Figure 6. GLY et PRO ne sont pas utilisées pour faire les calculs de PMF d’insertion membranaire des chaînes latérales d’un acide aminé, car GLY et PRO n’ont pas des petites molécules équivalentes à leurs chaînes latérales. Dans le cas de l’histidine, il est difficile de faire des calculs de PMF d’insertion membranaire de sa chaîne latérale, puisque celle-ci a des multiples états de protonation.

Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La chaîne latérale de l’acide aminé valine est tronquée au carbone β et la liaison avec le carbone α est remplacée par un proton.

(37)

3.2.1 Informations sur les simulations

La membrane modèle utilisée pour les calculs de PMF par MacCalum et Tieleman est composée des phospholipides DOPC. Le système simulé contient 64 molécules de DOPC, 32 molécules par couche de la membrane modèle, ainsi que deux chaînes latérales d’un même résidu (18). Tout dépendant du système, le nombre d’atomes est d’environs 11 900. Les simulations ont été exécutées avec le logiciel de dynamique moléculaire GROMACS 3.3.1, avec le champ de forces Berger pour les molécules de DOPC et le champ de forces OPLS-All Atoms pour les analogues des chaînes latérales des acides aminés (18). Comme modèle de molécule d’eau, le Simple Point Charge a été utilisé. La température du système simulé a été gardée à 298 K pendant toute la durée de la simulation en utilisant un algorithme de couplage faible, avec une constante de couplage de 0.1 ps. La pression du système a été gardée constante à 1 bar à l’aide d’un algorithme de couplage faible semi-isotropique, avec une constante de couplage de 1 ps. La longueur des liens, ainsi que les angles des molécules d’eau ont été contraints avec l’algorithme SETTLE (18). Tous les autres liens et angles ont été contraints avec l’algorithme LINCS. Ce dernier algorithme permet d’utiliser un time-step de 2 fs. Les interactions électrostatiques ont été évaluées avec la méthode de smooth particle mesh Ewald avec un seuil de 1 nm (18).

Chaque simulation contient 2 copies du même analogue de la même chaîne latérale d’un acide aminé donné, une de chaque côté de la bicouche lipidique. La méthode de dynamique moléculaire Umbrella sampling a été utilisée avec une force constante de 3000 kJ*mol-1*nm-2 appliquée entre le centre de masse de la chaîne latérale et le centre de la membrane, dans la direction de la normale de la bicouche lipidique (18). Les deux chaînes latérales ont été ajoutées dans le système de façon à ce que lorsqu’une est dans l’eau, l’autre se trouve au centre de la bicouche membranaire. Au total, 38 simulations ont été exécutées pour chaque chaîne latérale pour environ 30 ns par simulation, pour un total de 20 µs de temps de simulation (18).

(38)

Les simulations de la chaîne latérale du tryptophane ainsi que celles des résidus chargés ou polaires ont été simulées pendant 80 ns chacune, afin d’obtenir des marges d’erreur acceptables.

Les valeurs de PMF d’insertion membranaire des chaînes latérales des acides aminés sont utilisées pour calculer l’énergie globale qui est associée à une position de la protéine. Ce calcul est détaillé dans la section suivante (Calcul du score).

3.3 Calcul du score

Le calcul du score associé à une position de la protéine dans la membrane est un point central de la méthode de prédiction. La valeur du score est en quelque sorte une valeur d’énergie libre d’insertion membranaire, qui varie en fonction de la position en z de la protéine et l’orientation � de celle-ci, ce qui est noté ΔGt(z, �).

L’énergie libre ΔGt(z, �) est calculée à l’aide de l’équation 1 :

Équation 1 :

Équation 2 :

Cette énergie libre ΔGt(z, )� correspond à la somme des énergies libres de chaque chaîne latérale d'acides aminés ΔGi(z) normalisé par la valeur relative de surface de la chaîne latérale exposée au solvant (Srel,i).

Dans l’équation 1, l’énergie libre d’une chaîne latérale d’un acide aminé ΔGi(z) est extraite à partir des données PMF d’insertion membranaire des chaînes latérales des acides aminés en fonction de la position en z du centre de masse de

(39)

la chaîne latérale d’un acide aminé, tel que décrit dans la section Calcul des PMF. Le centre de masse est calculé à l’aide de la commande measure com de VMD (Visual Molecular Dynamics). Cette commande permet de calculer le centre de masse d’une sélection d’atomes, et seulement les atomes de la chaîne latérale de chacun des acides aminés sont utilisés dans le calcul.

Le calcul de la surface relative accessible au solvant (Srel,i) est utilisé par la fonction du calcul du score pour normaliser la valeur d’énergie libre de tous les résidus. Pour la méthode de prédiction développée dans les présents travaux, nous faisons l’hypothèse que les acides aminés, lors de la liaison membranaire, vont interagir avec la membrane en fonction de leur surface exposée à celle-ci. En effet, les résidus qui se trouvent à l’intérieur de la protéine ou qui ont leurs chaînes latérales orientées vers l’intérieur de la protéine n'interagissent pas avec les lipides. Il est donc important de considérer la surface exposée au solvant dans le calcul du score, et de normaliser la valeur du PMF d’insertion en proportion de la surface exposée. Puisque les PMF d’insertion correspondent aux chaînes latérales, nous avons considéré la surface exposée au solvant (SASA) des chaînes latérales des acides aminés. La chaîne latérale est composée des atomes en commençant par le carbone β et en excluant les atomes d’hydrogène.

Srel,i est le rapport entre le SASA de la chaîne latérale du résidu i en présence de la protéine (SASAi,prot) et le SASA de la chaîne latérale du résidu i complètement entourée par le solvant (SASAi,solvant). Un exemple de SASAi,prot est montré à la Figure 7A et un exemple de SASAi,solvant est montré à la Figure 7B. Cette relation entre les deux types de SASA est représentée à l’aide de l’équation 2. La valeur que Srel,i peut prendre est comprise entre 0 et 1. Lorsque la chaîne latérale d’un acide aminé est complètement enfouie dans la protéine, la valeur de Srel,i est égale à 0. En d’autres mots, la surface accessible au solvant est 0. Dans le cas où la chaîne latérale d’un acide aminé est complètement entourée du solvant, comme montré à la Figure 7B, le Srel associé est de 1. En d’autres mots, la surface accessible au solvant de la chaîne latérale d’un acide aminé est à son maximum possible, et n’est pas influencé par aucun atome externe.

(40)

L’étape de normalisation est accomplie avec l’aide de la commande measure sasa de VMD. Cette commande permet de calculer le SASA d’une sélection d’atomes en tenant compte des autres atomes qui l’entourent ou en la considérant seule dans le vide. Pour calculer le SASA d’une sélection, VMD utilise l’algorithme Maximal Speed Molecular Surfaces (MSMS) (21). Cet algorithme calcule le SASA d’un atome en considérant le rayon van der Vaals ce celui-ci avec le rayon van der Vaals d’une molécule de solvant, soit 1.4 Å pour une molécule d’eau (21). L’étape de normalisation est exécutée seulement une fois au démarrage du script de prédiction.

Figure 7 : Représentation de la surface exposée au solvant (SASA) de la

chaîne latérale du résidu LEU3 en présence du squelette protéique et le SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne

latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4 (gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3. Le squelette de la protéine est représenté en cartoon. Les points bleus représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la chaîne latérale LEU3 complètement immergée dans le solvant est représenté par les sphères bleues.

(41)

3.4 Méthodes utilisées par MemP3

Cette section expose les détails associés à la réalisation des différentes étapes de la méthode de prédiction d’insertion membranaire des protéines. La méthodologie de MemP3 est implémentée dans un script TCL (Tool Command Language) exécuté par le programme VMD (22). L’utilisation de VMD permet de profiter des fonctions déjà implémentées, par exemple le chargement de la protéine, la sélection des atomes et les calculs de centre de masse. Ceci augmente la vitesse de développement de l’outil.

Voici donc les détails associés à chacune des étapes :

1) Calculer le PMF d’insertion membranaire pour chacun des acides aminés existants.

Le calcul des PMF d’insertion membranaire pour chacun des acides aminés existants est une tâche colossale qui équivaut à un projet complet en lui seul. Nous avons plutôt choisi d’utiliser des résultats déjà publiés dans la littérature, soit les valeurs calculées par MacCallum et Tieleman. (18). Ces valeurs ont été obtenues par simulations de dynamique moléculaire en utilisant une bicouche de DOPC. Les détails du calcul des PMF ont été présentés dans la section Calcul des PMF. Il est intéressant de noter que les valeurs de PMF d’insertion varient généralement selon la composition membranaire. Donc, avec MEMP3, il serait possible d’effectuer des prédictions de liaison pour différentes compositions membranaires selon la disponibilité des PMF d’insertion.

Pour cette étape, MemP3 charge les données des PMF d’insertion membranaire des chaînes latérales des acides aminés dans une structure de données, plus spécifiquement un dictionnaire. Ceci permettra de faire des recherches rapides dans le dictionnaire à l’aide des noms des acides aminés. Il est à noter que les prédictions ne considèrent seulement que les états de protonation à pH physiologique, ce qui implique l’utilisation des PMF correspondant aux états de protonation normales à pH physiologique sera utilisé. ie. le PMF de l’arginine chargée positivement est utilisé pour toutes les arginines, le PMF de la lysine

(42)

chargée positivement est utilisé pour toutes les lysines, le PMF de l'acide glutamique chargé négativement est utilisé pour tous les acides glutamiques et finalement, le PMF de l'acide aspartique chargé négativement est utilisé pour tous les acides aspartiques.

2) Obtenir et préparer le fichier contenant la structure de la protéine.

La deuxième étape de l’algorithme de prédiction est le chargement du fichier pdb d’entrée créé par le script de préparation. Le chargement est fait à l’aide de la commande mol load pdb déjà implémentée dans VMD (22).

Le fichier d’entrée peut être un pdb extrait de la Protein Data Bank (PDB) (2) ou extrait à partir de simulations de dynamique moléculaire. Ensuite, un script TCL, différent du celui faisant la prédiction, prépare la structure de la protéine pour l’étape de prédiction. Deux types de problèmes peuvent être présents dans un fichier pdb provenant de la banque de données PDB. Premièrement, certaines protéines trouvées sur la banque de données PDB ne sont pas complètes. En effet, certains atomes ou même des résidus entiers d’une protéine peuvent parfois être absents dans le fichier pdb. Dans ce cas, ces résidus seront ignorés par MemP3, ce qui signifie que le fichier pdb prédit par MemP3 ne contiendra que les atomes présents dans le fichier pdb d’origine. Dans ce cas, le script de préparation indique à l'utilisateur quels résidus se retrouvent dans cette situation.

Deuxièmement, il arrive parfois que le fichier pdb initial contient également des atomes qui n’appartiennent pas à la protéine (par exemple des atomes de métaux ou des ligands). Dans ce cas, ces atomes ou molécules peuvent être pris en compte dans le calcul de prédiction lors des calculs de surface accessible au solvant (plus de détails à ce sujet plus loin). L’utilisateur peut indiquer au script de prédiction s’il veut garder ou non ces atomes dans le fichier pdb d’entrée.

La protonation des résidus ne sera pas modifié par le script de préparation, ni par l'algorithme de prédiction. Ces derniers considèrent tous les résidus comme étant à pH physiologique.

(43)

3) Déterminer une position et une orientation de départ relative à la membrane, et calculer l’énergie libre d’insertion.

La troisième étape de l’algorithme de prédiction utilisé par l’outil MemP3 est de définir la position de départ et calculer son score. Le score représente la somme des énergies libres de chacune des chaînes latérales des acides aminés. Cette dernière valeur est normalisée par la surface relative exposée au solvant de la chaîne latérale en question.

Une fois le fichier pdb contenant la structure tridimentionnelle de la protéine est chargé, cette dernière est positionnée à 35 Å du centre de la bicouche lipidique, le long de la normale. Si une protéine doit être placée plus loin de la bicouche lipidique, l’usager devra modifier cette valeur de 35 Å avec la bonne. Cette position est considérée comme étant la position initiale. Le score de cette position est calculé et puisque pour l’instant c’est le seul score que nous avons, il est considéré comme étant le meilleur. Plus la recherche systématique avance, d‘autres positions vont donner un meilleur score, donc le score initial ne sera plus considéré comme étant le meilleur.

4) Recherche systématique

L’algorithme de minimisation utilisé est une recherche systématique de l’énergie libre la plus petite, donc le score le plus petit. Cet algorithme applique en boucle des matrices de rotations en x et y et des translations en z sur la protéine, afin de changer son orientation. Les rotations sont de l'ordre de 10° autour de chaque axe, soit x et y et ce jusqu’à atteindre 360°, donc revenir à la position de départ et les incréments en z sont de l'ordre de 1 Å. Nous avons choisi 10° comme valeur d’incrément des rotations, puisqu'elle permet d’obtenir une structure avec l’énergie très près du minimum possible, sans coûter beaucoup de temps. Au contraire, aller avec des incréments plus petits, ne donne pas un résultat éloigné de celui trouvé avec des incréments de 10° pour le coût de temps supplémentaire. Dans le même ordre d’idée, des incréments de 1 Å sur l’axe des z permettent

(44)

d’avoir une structure représentative du minimum d’énergie avec un temps de calcul raisonnable. Après chaque changement de la position de la protéine, que ce les centres de masse de chaque chaîne latérale sont calculés, comme détaillé dans au point 3). Ce centre de masse, plus exactement la position en Z de la chaîne latérale d'un acide aminé, sera utilisé pour chercher l’énergie libre à cette position à partir des valeurs PMF.

Par la suite, l’énergie libre de chacune des chaînes latérales est multipliée par la valeur normalisée de la surface exposée au solvant. Ainsi, on considérera seulement les résidus qui peuvent interagir avec la membrane. La somme de l’énergie libre de chaque chaîne latérale est calculée. Si l’énergie totale est plus petite que celle de l’orientation précédente, l’orientation et la position de la protéine seront sauvegardées. Lorsque toutes les conformations ont été testées, le programme s’arrête.

3.5 Approximations nécessaires

Les approximations suivantes ont été nécessaires et suffisantes pour permettre la prédiction de l’orientation et l’insertion d’une protéine dans une membrane modèle en un temps court :

1. La méthode ne tient pas compte de la déformation possible de la membrane lors de la liaison d’une protéine.

2. Une protéine est considérée comme un corps rigide, i.e. la méthode ne pourra prédire un changement de conformation possible de la protéine lors de la liaison à la membrane.

(45)

3.6 Méthodologie de la validation

Pour vérifier la méthode, un jeu de protéines a été sélectionné dont la structure tridimensionnelle est connue. De plus, l’insertion, l’orientation et la conformation de ces protéines dans une bicouche lipidique ont été étudiées par diverses méthodes de dynamiques moléculaires. Il est donc possible de comparer les prédictions faites par MemP3 avec les résultats des simulations de dynamique moléculaire. Les prédictions faites par MemP3 seront aussi comparées avec les prédictions de l’outil Prediction of Proteins in Membranes (PPM) (13).

Les prédictions faites par MemP3 et PPM seront comparées entre elles et avec les résultats des simulations de dynamique moléculaire. Les comparaisons seront faites du point de vue qualitatif et quantitatif. Pour la partie quantitative, une valeur de root mean square deviation (RMSD), une valeur d’insertion et une déviation angulaire seront utilisées pour comparer la prédiction de MemP3 et PPM avec la référence. Utiliser un RMSD pour comparer la position des structures permet de vérifier avec une seule valeur des variations dans l’insertion et dans l’orientation des prédictions. Le RMSD est calculé à l'aide des atomes formant les chaines latérales, donc commençant par le carbone β, puisque ce sont seulement ces atomes qui participent à la prédiction de l'orientation et de l'insertion. La valeur d’insertion est une distance en Z entre le centre de masse de la protéine et le centre de la membrane. Ce dernier se situe à 0 Å. La déviation angulaire est calculée comme étant les valeurs nécessaires d’angle pour superposer les deux prédictions sur la référence. À l’aide de la commande VMD “measure fit” il est possible d’obtenir une matrice de rotation qui permet de superposer la prédiction du premier outil sur la structure de référence. En utilisant la matrice de rotation, il est possible de calculer les angles d'Euler. Ces derniers sont les angles de rotation autour de l'axe x, y, z nécessaires pour superposer les deux structures.

(46)
(47)

Chapitre 4 : Résultats

Le chapitre est divisé en trois sections : la première section présente les résultats de prédiction pour un peptide modèle. La deuxième section présente les résultats de prédiction pour plusieurs protéines périphériques et transmembranaires dont la structure provient de la dynamique moléculaire. La troisième section présente les limites de la méthode développée à travers le cas de l’hémoglobine tronquée (trHbN) et celui du peptide de fusion du virus de l’influenza.

Pour chacune des sections, les résultats de prédiction faits avec MemP3 sont comparés à ceux obtenus avec la méthode PPM et, lorsque disponibles, aux structures provenant de dynamique moléculaire tout atome ou à gros grains, ces dernières seront considérées comme des structures de référence. Les résultats de prédiction faits avec MemP3 et PPM sont comparés avec la structure de référence.

Toutes les images présentées dans cette section suivent le même code de couleurs. La structure de référence, provenant de simulations de dynamique moléculaire, est colorée en bleu, la structure prédite avec MemP3 est en orange et la structure de la prédiction obtenue à l’aide de l’outil PPM est en vert. Les plans rouge et violet représentent la position de la densité maximale des groupements phosphates des lipides pour une membrane modèle de DOPC dans la couche externe et interne de la membrane cellulaire respectivement, comme présenté dans les travaux de MacCallum et al. (18).

Dans chaque image se trouvent la valeur de RMSD et les valeurs de déviation angulaire (x, y et z) entre la structure prédite et la structure de référence. Pour le calcul du RMSD, les protéines sont fixes. De plus, seulement les atomes lourds des chaînes latérales des acides aminés sont pris en compte dans ce calcul. Les angles de déviation sont calculés à l’aide de VMD. Avec ce programme, on peut obtenir la matrice de rotation nécessaire pour superposer la structure prédite sur la structure de référence. À partir de cette matrice de rotation il est

(48)

possible d’obtenir les angles de déviation autour des axes x, y et z. L'insertion, définie comme la différence entre la valeur en z du centre de masse de la structure de référence et celle prédite, est aussi indiquée pour chacune des structures prédites. Ces valeurs sont utilisées pour quantifier les différences et similarités entre les prédictions.

4.1 Peptide modèle

Les peptides modèles sont des peptides étudiés depuis plusieurs années, et pour lesquels les propriétés physiques sont connues, celles-ci ayants été déterminées par plusieurs chercheurs au courant des années.

Le peptide de poly-leucine a été choisi pour le simple fait qu'il est composé d'un seul type d'acides aminés et il est donc possible de tester l'influence de l'abscence des PMF des termini sur les prédictions faites par MemP3.

La Figure 8 présente et compare le résultat de MemP3 avec celui de PPM pour le peptide de poly-leucine.

Le résultat de la prédiction du peptide de poly-leucine permet de montrer une première limitation de la méthode MemP3. Dans la prédiction de MemP3, le peptide se trouve au centre de la membrane, parallèle au plan de la membrane. Quoi que loin de la position perpendiculaire de la poly-leucine, le résultat de PPM est plus rapproché de ce qui est attendu du point de vue théorique. En théorie, le peptide de poly-leucine devrait traverser la membrane de bord en bord. Le résultat de MemP3 est dû au manque de PMF pour les C-terminal et N-terminal chargés. Par contre, ce manque de PMF influence moins les prédictions de protéines, puisque celles-ci sont composées de plusieurs résidus différents.

(49)

Figure 8 : Comparaison des prédictions du peptide poly-leucine faites par MemP3 (orange) et par PPM (vert) pour un peptide de poly-leucine formé de 25 résidus.

(50)

4.2 Protéines équilibrées par dynamique moléculaire

Les protéines équilibrées par dynamique moléculaire ont été utilisées pour tester l'exactitute de la méthode MemP3, ainsi que comparer les prédictions avec celles de PPM. Les protéines choisies ont été simulées pendant des longues périodes, ce qui permet d'obtenir des structures équilibrèes.

4.2.1 Caveoline 1

La structure de référence de la protéine Caveoline 1 a été fournie par Riu et al. (23). La structure et la position de la protéine ont été caractérisées en présence d’une membrane modèle de dimyristoylphosphatidylcholine (DMPC) par RMN, fluorescence des résidus tryptophane et par dynamique moléculaire tout atomes (23). La structure de référence provient de la partie de production des simulations de dynamiques moléculaire (23).

Dans le cas de cette protéine, MemP3 et PPM ont des prédictions rapprochées de point de vue qualitatif, mais aucune des méthodes n'a réussi à faire des prédictions qui se rapprochent de la structure de référence

Références

Documents relatifs

MOLDOVA - Université de médecine et de pharmacie « Nicolae Testemiteanu » ROUMANIE - Université des Sciences Agricoles et Médecine Vétérinaire de Cluj-Napoca. GEORGIE

La conjonction d’un diagnostic d’assez fort isolement du monde des enseignants de la conduite et de la sécurité routière, par rapport au monde de l’éducation à la

Souvent créées pour répondre à des besoins spécifiques du marché du travail, pour favoriser le rapprochement entre l’enseignement supérieur et l’entreprise, et pour garantir

Dans les hélices et feuillets, les groupements polaires sont engagés dans des liaisons hydrogènes.. 3.6 résidus

Les autorités de concurrence nationales ont également envisagé, pour chaque famille de produits, une segmentation en fonction des types de cultures

Compte tenu des chiffres d’affaires réalisés par les entreprises concernées, les seuils de notification de l’article 1 paragraphe 2 du règlement (CE) 139/2004 sont

Vu la lettre en date du 5 août 1991 , enregistrée sous le numéro F 431 , par laquelle le ministre d'Etat , ministre de l'économie , des finances et du budget , a saisi le Conseil de

464-6 du code de commerce énonce : "Lorsque aucune pratique de nature à porter atteinte à la concurrence sur le marché n’est établie, le Conseil de la concurrence peut