• Aucun résultat trouvé

II. Etude structurale de transporteurs ABC humains

II.3. Modélisation comparative de transporteurs ABC humains

II.3.1. Sélection des templates et alignements de séquences

Alors que les résultats des analyses phylogénétiques indiquent une proximité d’évolution entre la P-gp et les exportateurs ABC bactériens, nous avons procédé à une méthode de confirmation plus classique du choix de nos templates en réalisant un PSI-Blast de la séquence requête (la P-gp humaine ou SUR1) contre la banque de données PDB. PSI-Blast permet d’identifier les séquences protéiques les plus identiques à la séquence de la P-gp et pour lesquelles des structures tridimensionnelles sont déjà disponibles dans la PDB seront révélées.

Hormis la structure de la P-gp de souris parue en 2009 [2] et dont la séquence protéique est à 87% identique à celle de la P-gp humaine, seules les séquences des transporteurs ABC bactériens, MsbA (des trois espèces : Escherichia coli, Vibrio cholerae et

Salmonella typhimurium) et Sav1866 (Staphylococcus aureus) sont détectées par PSI-Blast

avec respectivement des scores d’identité vis-à-vis la séquence de la P-gp humaine de : 31, 28, 31 et 28%. Ces scores, étant proches de 30%, il est communément admis qu’ils sont suffisants pour générer des modèles structuraux fiables par le biais de la modélisation comparative.

Pour ABCC8, les scores d’identité vis-à-vis des séquences bactériennes sont plus faibles mais avoisinent néanmoins les 20%. Le fonctionnement de SUR1 dans le cadre d’un assemblage hétérotétramérique avec des sous-unités Kir, semble difficilement compatible avec le changement conformationnel décrit par la P-gp. Le mouvement d’alternance entre une ouverture vers le milieu intracellulaire puis vers le milieu extracellulaire (Figure-A-5) est imaginé pour des protéines ABC assurant une fonction de transport, fonction ce qui n’a toujours pas été mise en évidence jusqu’à présent pour SUR1.

78 Nous avons analysé en détail ces scores d’identité en observant leur répartition le long des séquences, et plus précisément au niveau des domaines NBD et TMD (Tableau-Ax-2). La séquence protéique de la P-gp de souris a été intégrée dans cette analyse (Tableau-C-1).

TMD

P-gp_Hum SUR1 Sav1866 Ec-MsbA Vc-MsbA St-MsbA P-gp_Mouse TMD1 TMD2 TMD1 TMD2 TMD1 TMD2 P-gp_Hum TMD1 100 TMD2 28 100 SUR1 TMD1 12 9 100 TMD2 8 10 10 100 Sav1866 13 16 11 12 100 Ec-MsbA 17 16 5 12 16 100 Vc-MsbA 16 14 14 11 19 65 100 St-MsbA 18 16 5 11 16 97 65 100 Pgp_Mouse TMD1 76 26 11 8 13 15 16 15 100 TMD2 27 77 11 11 11 14 16 15 24 100

79

NBD

P-gp_Hum SUR1 Sav1866 Ec-MsbA Vc-MsbA St-MsbA P-gp_Mouse NBD1 NBD2 NBD1 NBD2 NBD1 NBD2 P-gp_Hum NBD1 100 NBD2 61 100 SUR1 NBD1 26 24 100 NBD2 29 30 23 100 Sav1866 50 47 27 31 100 Ec-MsbA 53 48 31 31 53 100 Vc-MsbA 45 45 30 31 51 72 100 St-MsbA 54 48 30 32 55 94 73 100 Pgp_Mouse NBD1 92 62 26 29 50 51 46 52 100 NBD2 60 91 25 30 47 47 45 48 61 100

Tableau-C-1 : Les scores d’alignement des domaines TMD et NBD. Les scores ont été obtenus grâce au programme d’alignement multiple ClustalW [10]. Sont présentés en rouge, les scores d’alignement des domaines représentatifs des templates et ceux représentatifs des modèles à construire. P-gp_Hum : la P-gp humaine, Pgp_Mouse : la P-gp de souris, Sa : Staphylococcus aureus, Ec : Escherichia coli, Vc : Vibrio cholerae, St : Salmonella typhimurium

A la lecture du tableau-C-1, nous pouvons constater que les scores d’alignement sont plutôt indépendants des espèces. Ainsi, les domaines TMD et NBD de la P-gp et de SUR1 humaines partagent plus d’identité avec les séquences des exportateurs ABC bactériens qu’entre eux. Ces scores représentent un autre argument supplémentaire en faveur de notre choix de templates. Ils sont aussi en accord avec les résultats issus des analyses phylogénétiques ainsi qu’avec les scores d’alignements globaux des séquences entières (Tableau-Ax-3).

Nous constatons que les scores d’identité sont nettement supérieurs au niveau des domaines NBD en comparaison à ceux des domaines TMD. Ce résultat n’est pas surprenant,

80 les NBD contiennent les motifs conservés entre toutes les protéines ABC. Ils sont impliqués dans la liaison d’un même substrat qui est l’ATP alors que les domaines TMD sont impliqués dans le transport de substrats variables selon la protéine ABC.

Il faut signaler que trois structures de P-gp de souris ont été déposées dans la PDB alors que le travail de modélisation avait été entamé. Ces structures étaient les premières disponibles pour un transporteur ABC de mammifère. La P-gp de souris n’a été cristallisée que dans une seule conformation du cycle de translocation, « Inward-Facing » ouverte vers le milieu cytoplasmique. Une de ces structures représentait la P-gp dans un état dit apo (sans substrat ou nucléotide liés), les deux autres avec deux cyclo-peptides liés [Le cyclic-tris-(R)-valineselenazole (QZ59-RRR) et le cyclic-tris-(S)-cyclic-tris-(R)-valineselenazole (QZ59-SSS)].

II.3.2. Génération et sélection des modèles

Les structures des protéines ABC bactériennes ainsi que celle de la P-gp de souris ont donc été les templates sélectionnés dans notre travail de modélisation comparative. Ces structures ne représentent pas les mêmes conformations, ce qui nous a permis d’entreprendre un travail de construction de modèles structuraux décrivant la P-gp humaine dans trois conformations catalytiques différentes. Pour SUR1, la faiblesse des scores d’identité associée à la disponibilité de deux structures templates dans une même conformation «

Outward-Facing » m’ont contraint à construire un modèle tridimensionnel unique décrivant SUR1 dans

cette conformation (Tableau-C-2).

Templates (Code PDB) Résolution (Å) Modèles (conformation) Ec-MsbA (3B5W) 5.3 Pgp_Hum (open inward-facing) Vc-MsbA (3B5X) 5.5 Pgp_Hum (closed inward-facing)

Sav1866 (2HYD) 3.0 Pgp_Hum (outward-facing) St-MsbA (3B60) 3.7 Pgp_Hum (outward-facing) Pgp-Mouse (3G5U) 3.8 Pgp_Hum (open inward-facing)

Sav1866 (2HYD) 3.0 SUR1 (outward-facing)

St-MsbA (3B60) 3.7 SUR1 (outward-facing)

Tableau-C-2 : Les modèles P-gp et SUR1 construits et leurs templates correspondants.

P-gp_Hum : la P-gp humaine, Pgp_Mouse : la P-gp de souris, Sa : Staphylococcus aureus, Ec : Escherichia coli, Vc : Vibrio cholerae, St : Salmonella typhimurium.

81 Les données du tableau-C-2 indiquent que les structures dans la conformation

Outward-Facing, à priori compétentes pour l’efflux du substrat transporté, sont les plus

nombreuses et les mieux résolues.

Par contre, il n’existe qu’une seule structure template pour la forme intermédiaire dite

Closed Inward-Facing et qui a été résolue à basse résolution, ce qui limite la qualité des

modèles qui peuvent être dérivés. Pour la conformation OpenIinward-Facing, deux structures sont disponibles, dont une à résolution correcte (3.8 Å), ce qui permet de construire des modèles corrects, grâce à l’alignement multiple avec deux templates.

Il faut noter qu’étant donné la méthode d’obtention des structures Ec-MsbA et Vc-Msba (avec St-MsbA comme point de départ et en positionnant manuellement les monomères dans une carte expérimentale de densité électronique) [8], elles ne sont représentées dans la PDB que par le biais de traces de Cα. La chaine principale et les chaines latérales ont été reconstruites respectivement grâce à SABBAC14 [11] et Scit15 [12], deux programmes fournis par le serveur RPBS (Ressource Parisienne en Bioinformatique Structurale).

Pour chaque procédure de modélisation, nous avons utilisé le programme Modeller dans sa version 9v6 [13]. Ce programme de modélisation comparative est le plus utilisé dans la communauté scientifique et il est implémenté par de nombreux serveurs en ligne. Gratuit et à usage académique, Modeller est un programme automatisé : l’utilisateur doit essentiellement fournir un alignement de séquence (réalisé par ses propres soins). Cette étape reste la plus délicate de l’ensemble de la procédure étant donné la faible conservation de séquences observée au niveau des domaines transmembranaires. L’alignement est amélioré manuellement de manière à respecter la topologie membranaire prédite. Un exemple d’un alignement type soumis à Modeller est présenté Figure Ax-4.

Grâce à la procédure « automodel » de ce programme, nous avons généré 10 modèles de chaque conformation étudiée. Les modèles générés ont été affinés grâce à la procédure « refinement slow » de Modeller. Il noter qu’étant donné les absences, d’un domaine TMD0, de la région-linker ainsi que de la première boucle extracellulaire, au niveau des structures templates (bactériennes ou de souris), ces régions n’ont pu être modélisées.

Le meilleur modèle généré a, par la suite, été sélectionné grâce à une combinaison de programmes de scoring fournis par Modeller et qui sont : GA341 et DOPE (Discrete Optimized Protein Energy). Tous les modèles générés, pour la P-gp ou pour SUR1, ont été

14

http://bioserv.rpbs.jussieu.fr/cgi-bin/SABBAC: Reconstruction de la chaine principale

15

82 validés grâce à des scores GA341 > 0,9. Un exemple d’un script type soumis à Modeller décrivant ces étapes de génération et de sélection de modèles est présenté Figure-Ax-5.