Approches de novo - Criblage virtuel

2. Méthodes de criblage virtuel

2.4. Criblage virtuel « structure-based »

2.4.5. Approches de novo

Les méthodes dites de construction de novo reposent sur la connaissance du site actif de la cible étudiée pour construire, de manière incrémentielle ou combinatoire, des composés qui lui seront spécifiquement adaptés.³¹⁰ Ces méthodes ont initialement été développées afin de réaliser des assemblages d’atomes uniques ou de fragments moléculaires (approches « fragment-based »). Si les approches utilisant un assemblage d’atomes permettent d’explorer une plus grande diversité de molécules, elles présentent également le désavantage de générer un très grand nombre de composés dont il peut être difficile d’extraire les « hits » les plus pertinents.310 Le développement des méthodes de novo a donc été focalisé sur l’assemblage de fragments, permettant d’explorer l’espace chimique théorique de manière rationnelle sans recourir à une recherche exhaustive trop exigeante en temps de calcul. La majorité des méthodes reposent sur l’utilisation de chimiothèques de fragments et d’algorithmes stochastiques permettant une optimisation locale à chaque étape de la construction des molécules dans le site de liaison de la cible.310 Une solution de conception de novo doit être efficace en trois points principaux : (i) l’assemblage des différentes fragments moléculaires, (ii) l’échantillonnage de l’espace chimique accessible et (iii) l’évaluation de la qualité des assemblages.310

92 2.4.5.1. Identification des sites d’interaction

La mise en œuvre des approches de novo nécessite, dans un premier temps, l’identification des points d’interaction potentiels du site de liaison de la cible. Les interactions recherchées sont généralement de type liaisons hydrogènes, interactions électrostatiques et hydrophobes.³¹⁰ Après avoir identifié le site de liaison (voir point 2.4.1), celui-ci peut être analysé de différentes manières afin de construire une image négative du récepteur représentant ses points d’interaction potentiels avec un ligand, similairement à ce qui est réalisé pour la construction de pharmacophores « structure-based ». Des méthodes basées sur les règles, dont HSITE,³¹¹ LUDI^296,297 ou HIPPO,³¹² utilisent des critères géométriques dérivés de données expérimentales. D’autres types de méthodes, comme GRID,313 GREEN³¹⁴ ou LigBuilder,³¹⁵ reposent sur l’utilisation de grilles permettant de discrétiser l’espace à la surface du site de liaison. Des sondes représentant la présence hypothétique d’un atome ou d’un groupe fonctionnel à chaque point de la grille permettent ensuite de calculer des potentiels d’interaction à la surface du site de liaison, puis d’identifier les sites d’interaction.

D’une manière similaire, la méthode MCSS (Multiple Copy Simultaneous Search)316 permet également de déterminer les positions et orientations énergétiquement favorables de fragments moléculaires dans le site de liaison. De nombreuses copies de fragments moléculaires fonctionnels sont d’abord positionnées à la surface du récepteur, utilisées comme sondes. Un champ de force permet ensuite de minimiser leurs positions, simultanément et indépendamment (voir point 2.4.6.2.3). Chacun de ces fragments minimisés sera ensuite soit éliminé, soit conservé comme hypothèse de départ pour l’étape d’assemblage, en fonction de son énergie d’interaction avec le récepteur.310,316

2.4.5.2. Assemblage des fragments moléculaires

L’assemblage des fragments peut être réalisé selon différentes stratégies, éventuellement combinées : par croissance (« fragment-growth »), par liaison (« fragment-linking »), à l’aide d’une grille, par l’usage de dynamiques moléculaires ou de méthodes stochastiques.310

L’assemblage par croissance s’initie par le placement d’un premier fragment au niveau d’un site d’interaction du récepteur. Le site d’interaction et le fragment initial peuvent être choisis par l’utilisateur, par exemple lorsque des données expérimentales valident l’importance d’un site d’interaction pour l’inhibition de l’activité de la cible. Le fragment initial sera étendu progressivement par l’ajout d’autres fragments, en maximisant leurs interactions avec le

récepteur (Figure 48A-C).310 Cette approche a été implémentée dernièrement dans les logiciels Contour,317 AutoGrow, BOMB318 et FlexNoVo.319

Figure 48. Illustration du fonctionnement des méthodes « fragment-based » reposant sur la

croissance de fragments et liaison de fragments. (A-C) Croissance des fragments : le fragment (vert) est étendu progressivement en maximisant ses interactions dans le site de liaison. (D, E) Liaison des fragments : les fragments (vert) sont joints par l’ajout d’un connecteur (violet). Les interactions définies par le positionnement sont conservées dans la conception du nouveau ligand.43

Pour un assemblage par liaison, la chimiothèque de fragments est explorée afin de sélectionner et positionner plusieurs fragments complémentaires à chaque site d’interaction du récepteur. Les hypothèses de liaison de ces fragments sont ensuite formulées de manière exhaustive, toujours en satisfaisant aux contraintes stériques du récepteur (Figure 48D-E).³¹⁰ Cette approche est notamment utilisée par les logiciels MED-Hybridise,³²⁰ LigBuilder,³¹⁵ PRO-LIGAND³²¹ et GrowMol.³²²

Il est également possible de réaliser un assemblage de fragments ou d’atomes grâce à une grille de points positionnée entre les sites d’interaction du récepteur.310,323 Après avoir positionné les différents fragments ou atomes adaptés aux sites d’interaction, ceux-ci sont reliés selon les plus courts chemins passant par les points de la grille. Ces données permettent ensuite d’envisager plusieurs hypothèses de liaison covalente des fragments ou atomes porteurs des caractéristiques physico-chimiques nécessaires à l’interaction avec le récepteur. Il est également possible de commencer par la définition d’un squelette moléculaire que l’on rendra fonctionnel dans un

second temps (Figure 49). Ces approches sont notamment implémentées dans les logiciels BUILDER324,325 et Diamond Lattice.323

Figure 49. Illustration d’une conception moléculaire de novo à l’échelle atomique à l’aide

d’une grille de points. Les sites d’interaction sont reliés selon les plus courts chemins passant par les points de la grille. Le chemin obtenu permet la construction de plusieurs squelettes moléculaires, qui sont ensuite rendus fonctionnels par l’ajout d’atomes porteurs des caractéristiques physico-chimiques adaptées au récepteur.310

Enfin, quelques méthodes reposent sur l’utilisation de dynamiques moléculaires pour assurer un positionnement optimal des fragments dans le récepteur avant de procéder à l’assemblage.310 Après avoir placé les fragments aléatoirement dans le site actif, ceux-ci sont liés de manière covalente selon une procédure stochastique, puis une dynamique moléculaire est lancée. A chaque intervalle de temps défini, un ou plusieurs fragments sont sélectionnés, toutes les liaisons précédemment établies sont clivées puis reconstruites aléatoirement et chaque assemblage est enregistré pour évaluation. Cette approche fut proposée pour la première fois en 1996 avec le logiciel CONCERTS³²⁶ et considérait à la fois les interactions fragments-récepteur et fragments-fragments. D’autres approches furent ensuite développées pour prendre exclusivement en compte les interactions fragments-récepteur et proposer différents modèles de clivage et reconstruction des liaisons covalentes entre fragments.^327–330

2.4.5.3. Echantillonnage de l’espace chimique

Quelle que soit la stratégie d’assemblage moléculaire choisie, les méthodes de conception de

novo doivent échantillonner l’espace chimique accessible de manière efficace, malgré le très

grand nombre de molécules pouvant théoriquement s’inscrire dans le récepteur étudié.³¹⁰ Deux approches principales sont distinguées, dites « depth-first search » (ou « recherche en profondeur) et « breadth-first search » (ou « recherche en largeur »).³¹⁰ La recherche en profondeur ne retient que quelques solutions partielles à chaque étape du processus de construction des molécules, en ne considérant qu’un nombre limité d’hypothèses de départ (i.e. fragments initiaux) (Figure 50).

Figure 50. Illustration du processus d’exploration de l’espace chimique réalisé par les

méthodes « fragment-based » utilisant une recherche en profondeur. Seules quelques solutions partielles sont conservées à chaque étape de construction des molécules (représenté au milieu).³¹⁰

Inversement, une recherche en largeur conserve et évalue l’ensemble des solutions partielles générées à chaque étape, permettant une couverture exhaustive de l’espace chimique étudié.³¹⁰ Les logiciels implémentant une recherche en largeur sont généralement ceux qui utilisent un assemblage de fragments par liaison. L’espace de recherche étant initialement restreint par un pré-positionnement optimal des différents fragments, cette procédure intensive en calculs peut alors être mise en oeuvre.310

Il existe également quelques méthodes qui procèdent à un échantillonnage aléatoire de l’espace chimique, dont les logiciels LEGEND³³¹ et CONCEPTS³²⁸ qui emploient une approche de Monte Carlo¹¹⁰ combinée au critère de Metropolis. D’autres logiciels utilisent des algorithmes génétiques ou évolutionnaires qui miment une sélection biologique des composés les plus pertinents. Parmi ceux-ci, LEA³³² et sa nouvelle version LEA3D³³³ représentent les molécules

par leurs codes SMILES sur lesquels des opérateurs génétiques sont appliqués (mutation et recombinaison) (Figure 51).

Figure 51. Représentation d’une étape de recombinaison réalisée par l’algorithme génétique

du logiciel LEA3D.³³³ Les codes SMILES des molécules (A) et (B) sont combinés pour produire la molécule (C).³³³

2.4.5.4. Evaluation de la qualité des assemblages

Lors de l’assemblages des molécules, celles-ci sont évaluées à chaque étape par une fonction de score afin de guider la construction de ligands optimaux.³¹⁰ Les premières approches de novo utilisaient un score calculé uniquement à partir des contraintes stériques du récepteur (BUILDER³²⁵ et NEWLEAD³³⁴). De nombreuses fonctions de score ont ensuite été développées, principalement réparties selon trois catégories : les fonctions de score basées sur les champs de force, sur les connaissances et les fonctions de score empiriques.^27,33,335 Les fonctions de score utilisées par les méthodes de conception de novo, très similaires à celles utilisées par les méthodes de docking, sont détaillées en point 2.4.6.3.

Dans le document Développement d’outils statistiques d’évaluation de méthodes de criblage virtuel : courbes de prédictivité & Screening Explorer (Page 94-99)