• Aucun résultat trouvé

L’évaluation et le classement des différentes conformations du ligand positionné dans le site actif de la protéine constituent le second aspect crucial du docking, après la nature de la recherche conformationnelle. Une fonction de score doit théoriquement pouvoir distinguer, parmi les différentes poses générées pour un ligand, celles qui correspondent aux modes de liaison les plus représentatifs de la reconnaissance moléculaire. Ainsi, elle doit permettre, sur la base d’une pose optimale proposée, de différencier les molécules bioactives des autres composés inactifs vis-à-vis de la protéine.

Des techniques basées sur le calcul d’énergie libre ont été développées et constituent un moyen quantitatif rigoureux pour estimer l’affinité de liaison d’un ligand pour une protéine [204, 205]. Bien qu’elles soient très précises, leur coût (en temps, en contraintes et en expertise) ne les rend pas appropriées pour une application de docking dans le cadre d’un criblage virtuel. Pour représenter le meilleur compromis entre vitesse et précision, les fonctions de score implémentées dans les programmes de docking sont donc basées sur la simplification des phénomènes impliqués dans la

reconnaissance moléculaire, en particulier de ceux qui sont délicats à évaluer en dehors des calculs d’énergie libre (p. ex. l’entropie).

Les différentes fonctions de score implémentées dans les programmes de docking ont fait l’objet de nombreuses publications [167, 206-208]. Elles sont généralement classées suivant trois catégories : les fonctions de score basées sur un champ de force, les fonctions de score empiriques et celles basées sur des connaissances statistiques. Enfin, plusieurs fonctions de score de nature différente peuvent être combinées pour former des fonctions de score dites de consensus.

Les fonctions de score basées sur un champ de force

Les champs de force dans leur forme standard (cf. Partie 2, I. Mécanique moléculaire) évaluent la somme de deux énergies : l’énergie entre atomes liés au sein d’une molécule donnée (énergie interne) et l’énergie entre atomes non-liés. Ce deuxième terme correspond au terme principal de l’énergie d’interaction protéine-ligand dans le cas d’une application à un problème de docking. La plupart du temps, les fonctions de score basées sur un champ de force ne considèrent qu’une conformation donnée de la protéine. Ainsi, si l’on compare l’activité de deux ligands par rapport à cette même conformation, cela permet de faire abstraction du terme d’énergie interne de la protéine qui s’annule dans l’expression de la différence d’énergie libre d’interaction entre les deux ligands.

L’affinité d’un ligand donné pour le site actif, mesuré en tant qu’énergie d’interaction, correspond à la somme des énergies d’interaction de van der Waals (souvent représentée par un potentiel de Lennard-Jones) et électrostatiques (potentiel de Coulomb). On peut ajouter à la fonction de score un terme d’énergie interne du ligand. Tous ces termes peuvent s’exprimer à partir des paramètres du champ de force considéré.

De telles fonctions de score présentent certaines limitations qui s’ajoutent à celles induites par la représentation du système (p. ex. la non représentation explicite du solvant). En particulier, les effets d’entropie, qui peuvent varier d’un ligand à l’autre pour un site actif donné, aussi bien que pour un ligand donné d’un site actif à l’autre, ne sont pas pris en compte. Seule la contribution enthalpique de l’énergie libre d’interaction est ainsi prise en compte.

Les fonctions G-Score [209] (basée sur le champ de force de Tripos [209]) et celle implémentée dans AutoDock [210] (basée sur le champ de force AMBER [68]) sont des exemples de ce type de fonction de score.

Les fonctions de score empiriques

Ce type de fonction de score approxime l’énergie libre de liaison en sommant de façon pondérée différents termes d’interaction dérivés de paramètres structuraux. Les différents poids de la fonction de score sont ajustés pour reproduire en priorité des données expérimentales, telles que les constantes de liaison tirées d’un jeu d’entraînement de complexes protéine-ligand.

La plupart des programmes de docking implémentent ce type de fonction de score témoignant de leur efficacité (en terme de rapport précision/rapidité). Cependant, le principal inconvénient de ces fonctions empiriques est leur forte dépendance aux données utilisées pour les calibrer qui, en cas de mauvaise paramétrisation, peut limiter leur transférabilité sur des systèmes différents. Parmi les principales fonctions de score empiriques, on peut citer : ChemScore [211], PLP [212], et LigScore [213].

Les fonctions de score basées sur des connaissances statistiques

Ces fonctions de score sont construites à partir de règles fondées sur une analyse statistique des complexes protéine-ligand résolus expérimentalement. Elles partent du principe que les distances interatomiques les plus représentées statistiquement dans les complexes constituent des contacts énergétiques favorables et, qu’à l’inverse, les plus rares représentent des interactions moins stables. Ainsi, leur paramétrisation dépend de la quantité d’informations expérimentales disponibles et on doit leur apparition à la profusion de données structurales accessibles dans des bases de données telles que la Protein Data Bank. Les exemples populaires de ces fonctions de scores sont PMF [214], SMoG [215] et DrugScore [216].

Les fonctions consensus

Ces fonctions hybrides combinent les résultats issus de diverses fonctions de score. On estime qu’il est possible de compenser partiellement les faiblesses intrinsèques de chacune des fonctions de score employées, évitant leurs erreurs individuelles et ainsi d'augmenter la probabilité d’identifier des composés actifs [217]. Cependant, si les termes des différentes fonctions de score sont fortement corrélés, l’intérêt du consensus devient limité car il peut entraîner une amplification des erreurs, au lieu de les atténuer. Ces fonctions consensus ont récemment fait l’objet d’une revue [218].

Autres types de fonctions de score

Les méthodes de docking reposant sur des surfaces utilisent des fonctions de score qui sont adaptées et principalement centrées sur la complémentarité géométrique surface-surface et auxquelles il peut être adjoint une estimation d’interactions sur le modèle des fonctions de score plus conventionnelles. Par exemple, LigandFit [219] génère, par Monte Carlo, les conformations du ligand dont les formes sont ensuite comparées à celle du site actif. D’autres programmes, tels que FRED [177, 220] ou SHEF [221], comparent la forme de chacun des conformères, générés au préalable (p. ex. avec OMEGA [177]), à la forme du site actif de la protéine. Cette approche est celle utilisée dans la première étape de la stratégie de la plateforme de criblage VSM-G décrite dans ce travail.

Documents relatifs