2. Méthodes de criblage virtuel

2.3. Criblage virtuel « ligand-based »

2.3.4. Quantitative Structure-Activity Relationship (QSAR) « ligand-based »

2.3.4.2. RI 3D-QSAR

Les approches 3D-QSAR regroupent toutes les approches QSAR qui corrèlent les propriétés biologiques de ligands de référence à des descripteurs dérivés directement de leurs représentations spatiales.36 En 1979, Cramer & Milne proposent une première approche 3D-QSAR utilisant une grille tridimensionnelle pour la représentation des champs d’interactions de ligands de référence de manière discrète.234 Les développements successifs de cette approche, couplée à l’utilisation de modèles PCA et PLS pour l’analyse des champs d’interaction et la prédiction de propriétés biologiques, aboutissent aux prédécesseurs des logiciels 3D-QSAR actuels : DYLOMMS en 1983 (DYnamic Lattice-Oriented Molecular Modeling System),235 puis CoMFA en 1988 (Comparative Molecular Field Analysis).236 Plusieurs méthodes ont désormais prouvé leur efficacité pour la conduite d’études 3D-QSAR, parmi lesquelles CoMFA,236 CoMSIA,237 COMPASS,238 GERM,239 CoMMA240 et SoMFA.241 Des logiciels commerciaux comme LigandScout,187 MOE,138 HypoGen180 et PHASE186 permettent également de concevoir des modèles 3D-QSAR à partir de pharmacophores. De la même manière que pour la construction de modèles pharmacophoriques, l’alignement pertinent des conformations moléculaires est crucial au succès d’une étude 3D-QSAR (voir point 2.3.3.2.2).36

Lors d’une étude CoMFA,236 les ligands de référence sont alignés et placés dans une grille régulière d’une résolution par défaut de 2 Å. Des sondes sont positionnées à chaque point de cette grille et représentent la présence hypothétique de carbones sp3 de charge +1.0 (d’autres types de sondes peuvent également être utilisés). Les potentiels d’interactions stériques (potentiel de Lennard-Jones 12-6)242 et électrostatiques (Coulomb) sont ensuite calculés entre chaque sonde et chacun des ligands de référence.236 Les données d’interaction ainsi obtenues permettent la construction d’un modèle de régression PLS comprenant un grand nombre de coefficients (Figure 32). Afin de faciliter la compréhension de ce modèle, les résultats sont généralement représentés sous la forme d’aires de contour indiquant les régions favorables et défavorables aux interactions stériques et électrostatiques (Figure 33).236

74

Figure 32. Illustration du processus d’une étude CoMFA.236 Après alignement des ligands, les énergies d’interaction stériques (S) et électrostatiques (E) sont calculées à chaque point de la grille et pour chaque ligand de référence. Un modèle de régression PLS est ensuite mis en œuvre pour corréler ces valeurs d’énergies d’interaction aux valeurs d’activité des ligands.

Figure 33. Représentation d’alignements de ligands réalisés lors d’une étude CoMFA236 avec visualisation des zones de contour des contributions stériques favorables (vert) et défavorables (jaune) à l’activité des ligands. Les zones de contour des contributions électrostatiques favorables (rouge) ou défavorables (bleu) à l’activité des ligands sont représentées à droite.243

Cependant, puisque la méthode CoMFA236 repose sur l’utilisation d’un espace discret, il est fréquent que les potentiels de Lennard-Jones et de Coulomb prennent des valeurs nulles (sonde isolée) ou maximales (sonde à l’intérieur du volume d’un ligand de référence, des valeurs maximales des potentiels sont alors utilisées), ce qui nuit à la précision des modèles.244 Pour pallier ce problème, Klebe et al. proposent la méthode CoMSIA (Comparative Molecular Similarity Indices Analysis),237 qui diffère de CoMFA236 principalement par son estimation des potentiels d’interaction au moyen d’indices de similarité adaptés de l’algorithme SEAL (Steric and Electrostatic ALignment).245 Les ligands de référence sont alignés puis placés dans une

75

grille régulière d’une résolution par défaut de 1 Å. Les indices de similarité sont ensuite calculés, toujours au moyen de sondes à chaque point de la grille, avec une fonction gaussienne approximant les potentiels de Lennard-Jones et Coulomb (Figure 34). Cette définition permet de prendre en compte les propriétés stériques, électrostatiques et hydrophobes des molécules de manière plus progressive et résout le problème des valeurs de potentiels limites trop fréquentes.237 Comme pour la méthode CoMFA,236 un modèle de régression PLS est ensuite mis en œuvre, cette fois à partir des indices de similarité.237

Figure 34. (A) Courbes des potentiels de Lennard-Jones (rouge) et Coulomb (bleu) utilisées

dans les études CoMFA.236 (B) La fonction gaussienne utilisée pour le calcul des indices de similarité (orange) approxime les potentiels de Lennard-Jones et Coulomb de manière plus progressive.246

Parmi les solutions commerciales plus récentes, de nombreux logiciels initialement conçus pour la construction de modèles de pharmacophores ont ensuite été adaptés pour la réalisation d’études 3D-QSAR, dont LigandScout,187 MOE138 et PHASE.186 Ce dernier propose deux approches pour la construction de modèles 3D-QSAR, soit à partir de l’ensemble des atomes des ligands de référence, soit à partir de leurs points pharmacophoriques.

L’approche atomique représente les caractéristiques physico-chimiques localement en utilisant des sphères de van der Waals avec recouvrement, suivant six catégories : donneur ou accepteur de liaisons hydrogènes, charge électrostatique positive ou négative, atome hydrophobe ou autre.186 Les ligands alignés sont placés dans une grille d’une résolution de 1 Å, dont le centre de chaque cube peut être inclus, ou non, dans les sphères de van der Waals définies par les atomes de chaque ligand (Figure 35).186 Pour chaque ligand, un cube peut ainsi être occupé par plus d’un atome et détecter plus d’une caractéristique physico-chimique. Des empreintes binaires sont ensuite construites pour chaque ligand, dont la taille unique est définie de manière

76

dynamique, le nombre de bits étant donné par l’occupation de la grille pour l’ensemble des ligands (un seul bit à 0 pour un cube qui ne recouvre aucun atome des ligands et jusqu’à six bits pour un cube recouvrant les six types physico-chimiques parmi les différents atomes des ligands). Cette représentation permet de traiter chaque bit comme une variable indépendante pour la construction de modèles 3D-QSAR. L’application de régressions PLS permet ainsi d’obtenir des coefficients pour chaque bit, ce qui facilite l’interprétation des résultats et l’identification de caractéristiques physico-chimiques liées, ou non, à l’activité des ligands de référence. Le nombre de coefficients de la régression PLS est limité, au maximum, à 1/5e du nombre de ligands de référence.186

Figure 35. Illustration en 2D de la méthode utilisée par PHASE186 pour la construction d’empreintes binaires à partir de sphères de van der Waals représentant les atomes de chaque ligand. Chaque cube peut donner lieu à la définition de un à six bits. La taille de chaque empreinte et la signification de chaque bit reste constante pour l’ensemble des molécules.186 L’approche pharmacophorique proposée par PHASE186 pour la construction de modèles 3D-QSAR est similaire à son approche atomique concernant la recherche de l’empreinte de chaque ligand et l’élaboration statistique du modèle. Les différences majeures sont l’utilisation des points pharmacophoriques des ligands à la place de sphères de van der Waals atomiques et la différenciation des atomes aromatiques ou hydrophobes. Cette approche s’appuie donc sur la construction préalable d’un pharmacophore (voir point 2.3.3.2.3).

Dans le document Développement d’outils statistiques d’évaluation de méthodes de criblage virtuel : courbes de prédictivité & Screening Explorer (Page 76-79)