Quantitative Structure-Activity Relationship (QSAR) « structure-based »

Dans le document Développement d’outils statistiques d’évaluation de méthodes de criblage virtuel : courbes de prédictivité & Screening Explorer (Page 91-94)

2. Méthodes de criblage virtuel

2.4. Criblage virtuel « structure-based »

2.4.4. Quantitative Structure-Activity Relationship (QSAR) « structure-based »

période pendant laquelle un faible nombre de structure de protéines étaient disponibles. Le logiciel CoMSIA237 fut proposé en 1999 alors que la PDB196 comportait environ 9000 structures cristallographiques. Par la suite, les méthodes QSAR ont été améliorées afin de permettent l’utilisation des données structurales de la cible pour déduire les potentiels modes de liaison des ligands et affiner leurs modèles, permettant ainsi de meilleurs prédiction des propriétés biologiques des composés. Les données structurales utilisées peuvent être des cristallographies ou co-cristallographies à rayons X, en fonction des méthodes utilisées et du nombre de ligands connus. Les méthodes QSAR « structure-based », également dites RD QSAR, sont généralement classées selon trois catégories : 3D, 4D ou 7D-QSAR.36,204 Le terme 7D-QSAR dénomme l’utilisation de méthodes RD 4D-QSAR prenant spécifiquement en compte l’adaptation du récepteur lors de l’accommodation d’un ligand (« induced-fit ») et différents modèles de solvatation des complexes récepteur-ligand simulés.204

2.4.4.1. RD 3D-QSAR

Parmi les premières méthodes RD 3D-QSAR proposées, le logiciel VALIDATE304 permet la prédiction de l’activité biologique de nouveaux composés grâce à un modèle de régression PLS prenant en compte douze mesures des propriétés physico-chimiques et stériques d’un complexe récepteur-ligand : énergie d’interaction électrostatique et stérique, logP, nombre de liaisons rotatives, enthalpie de la formation du complexe récepteur-ligand et six mesures de surfaces

89

hydrophiles et hydrophobes du récepteur lié ou non-lié.304 Les méthodes RD 3D-QSAR telles que VALIDATE304 peuvent être mises en œuvre de manière directe lorsque plusieurs co-cristallisations récepteur-ligand sont disponibles. Il est également possible de réaliser un alignement préalable des ligands connus de la cible, par exemple avec des méthodes RI 3D-QSAR ou pharmacophoriques 3D, puis de positionner cet alignement dans le récepteur soit manuellement, soit sur la base d’une co-cristallisation existante pour l’un des ligands. Une étape de minimisation permettra ensuite de relaxer les conflits stériques, aboutissant généralement à une modélisation des interactions récepteur-ligand suffisamment fiable pour construire des modèles RD 3D-QSAR pertinents.304

Une autre approche proposée par le logiciel COMBINE305 utilise un modèle de régression PLS construit à partir des énergies d’interaction calculées localement. Dans un premier temps, les énergies libres et liées du récepteur et des ligands sont calculées grâce à un champ de force (voir point 2.4.6.3.1). Les données structurales des complexes récepteur-ligand, obtenues par co-cristallographie ou par modélisation, sont décomposées en fragments des ligands et en régions du récepteur.305 Les énergies d’interaction stériques et électrostatiques sont ensuite évaluées entre chacun de ces fragments et chacune de ces régions. Les changements énergétiques internes à chaque fragment et région, induits par la formation du complexe récepteur-ligand, sont également quantifiés par rapport à leurs énergies libres.305 Un modèle de régression PLS est ensuite construit pour corréler l’activité biologique des ligands aux variations énergétiques locales des fragments et régions.

Figure 46. Structures de 46 inhibiteurs liés au récepteur de la beta-secretase 1 (BACE-1) (PDB

1w51196). Visualisation PyMol306 de la surface du récepteur, représentée de manière semi-transparente et colorée selon un spectre correspondant à l’échelle des coefficients d’une régression PLS construite avec gCOMBINE307 pour expliquer l’activité des ligands. (A) Coefficients obtenus pour les interactions stériques entre fragments des ligands et régions du récepteur. (B) Coefficients obtenus pour les interactions électrostatiques.308

90

Le logiciel gCOMBINE307 implémente cette méthode avec une interface qui permet la génération de graphiques pour l’analyse des résultats. Cette approche reposant sur l’évaluation locale des changements énergétiques a l’avantage de permettre une visualisation directe des interactions favorisant l’activité des ligands dans le modèle statistique établi (Figure 46). 2.4.4.2. RD 4D-QSAR

Le formalisme des méthodes RD 4D-QSAR a été proposé en 2003 par Pan et al.309 à l’initiative de Hopfinger, qui introduit précédemment les méthodes RI 4D-QSAR. L’approche proposée repose sur l’utilisation de simulations de dynamique moléculaire pour la modélisation des complexes récepteur-ligand.309 Comme pour les méthodes RI 4D-QSAR (voir point 2.3.4.3), une grille d’occupation permet de détecter les caractéristiques physico-chimiques favorables ou défavorables à l’interaction des ligands (Figure 47A). L’utilisation de simulations de dynamique moléculaire requiert la définition d’un référentiel stable pour le positionnement de la grille d’occupation. L’utilisateur doit donc définir plusieurs points d’interaction fixes entre le récepteur et chacun des ligands, sur la base de données expérimentales obtenues préalablement. Le cas d’application présenté par Pan et al.309 utilise 47 inhibiteurs de la glycogène phosphorylase b (GPb), tous analogues du glucose, permettant de figer spatialement trois points d’interaction communs au glucose au cours des simulations. Les atomes du récepteur situés entre 10 et 12 Å de ces points d’interaction sont également figés afin de maintenir la structure du récepteur au cours des simulations. Après alignement des ligands sur le récepteur, leurs positions sont minimisées avant de procéder à de courtes dynamiques moléculaires. La grille d’occupation est ensuite analysée à chaque étape des simulations grâce à des régressions PLS et MLR, afin de détecter les points d’interactions favorables ou défavorables à l’activité des ligands ainsi que leurs types physico-chimiques (Figure 47B).309

Dans la même étude, Pan et al.309 comparent leur approche RD QSAR à une étude RI 4D-QSAR réalisée à partir d’un alignement initial identique de ces inhibiteurs de la GPb. La qualité prédictive des modèles obtenus est similaire, bien que différents points d’interaction soient identifiés (Figure 47C). Les différences obtenues peuvent être expliquées, notamment, par un alignement plus permissif des composés rigides avec l’approche RI 4D-QSAR, pour lesquels des effets « induced-fit » seront observés avec l’approche RD 4D-QSAR.309

91

Figure 47. Approches 4D-QSAR appliquées à 47 inhibiteurs de la GPb.309 (A) Représentation du positionnement de la grille d’occupation à la surface du récepteur. Les atomes du récepteur présents au bord de la grille sont figés au cours des simulations. (B) Représentation du meilleur modèle RD 4D-QSAR obtenu (bleu : interactions favorables à l’activité des ligands, rouge : défavorables). Plusieurs résidus du récepteur peuvent être réorientés (vert, jaune). (C) Comparaison des meilleurs modèles RD et RI 4D-QSAR obtenus pour ces 47 inhibiteurs à partir d’alignements initiaux identiques (jaune : RD 4D-QSAR, vert : RI 4D-QSAR, rouge : point d’interaction commun aux modèles).309

Dans le document Développement d’outils statistiques d’évaluation de méthodes de criblage virtuel : courbes de prédictivité & Screening Explorer (Page 91-94)