CHAPITRE III : Conception de ligands protéiques in silico par transfert de sites actifs
III.2 Méthodes de sélection des protéines hôtes
III.2.2 Comparaison avec les autres méthodes décrites dans la littérature
Plusieurs programmes basés sur la recherche de motifs 3D dans les structures protéiques sont décrits dans la littérature.
Dès 1994, Artymiuk et al. ont décrit un programme appelé ASSAM (Amino acid pattern Search for Substructures and Motifs) qui permet de cribler la PDB à la recherche de motifs constitués par les chaines latérales des résidus (Artymiuk et al., 1994 ; Nadzirin et al., 2012). Chaque résidu est représenté par deux pseudo-atomes dont les positions sont définies sur la chaine latérale. Ainsi, la recherche se fait par superposition des chaines latérales des résidus du motif, indépendamment de la position de la chaine principale des résidus. Le motif est constitué de 2 à 12 résidus. Cependant cette méthode utilise une représentation des résidus utilisant deux pseudo-atomes dont la définition est spécifique de chaque type dacide aminé. Ceci rend donc la recherche de plate-forme dépendante du type dacide aminé. Cette approche est parfaitement adaptée à lidentification de motifs fonctionnels identiques à celui recherché, mais elle nest pas adaptée à lingénierie car le principe de cette recherche pourrait introduire un biais important.
Le programme SPASM (Spatial Arrangements of Side-chains and Main-chain) présente des similitudes avec ASSAM. SPASM a été développé pour rechercher, dans la base de données de protéines, une plate-forme possédant un motif dont larrangement spatial est identique à un motif spécifié par lutilisateur (Kleywegt, 1999). Cependant, comme cest le cas pour ASSAM, SPASM permet de rechercher des résidus de nature identique ou similaire à ceux contenus dans le motif de référence. Le programme STAMPS a été développé dans notre laboratoire dans la perspective spécifique de lingénierie moléculaire. La nature du résidu dans un motif mime peut être différente de celle du résidu correspondant dans le motif de référence. En effet, la recherche dans STAMPS est basée sur des résidus représentés par les atomes Ca et Cb alors que celle réalisée dans SPASM est basée sur les résidus représentés par les atomes Ca et un pseudo-atome CG localisé au centre de gravité des atomes de la chaine latérale du résidu. Ainsi, ce pseudo-atome est caractéristique de la chaine latérale et dépend donc de la nature du résidu. Cette représentation crée un biais important dans la recherche en vue dune substitution de lacide aminé naturellement présent sur la plate-forme par le résidu correspondant dans le motif fonctionnel. Il faut noter cependant que STAMPS, comme SPASM, peut permettre de chercher des motifs de structures secondaires (chaine principale) via la seule prise en compte des atomes Ca uniquement. Par ailleurs, SPASM effectue des recherches à partir de bases de
données restreintes, ce qui nest pas le cas de STAMPS qui peut parcourir lintégralité de la PDB.
Dautres programmes ont été développés dans la perspective de lingénierie en greffant des motifs fonctionnels sur une plate-forme protéique hôte. DEZYMER (Hellinga et Richards, 1991), GRAFTER (Hearst et Cohen, 1994), FITSITE (Hornischer et Blocker, 1996), le programme développé par Liang et al. (Liang et al., 2000) et ScaffoldSelection (Malisi et al., 2009) présentent des similarités entre eux. Ils permettent de greffer des motifs discontinus. La recherche est fondée sur la géométrie des atomes Ca ou Ca et Cb des résidus du motif fonctionnel. Dans certains cas (DEZYMER, ScaffoldSelection), toutes les combinaisons de Ca, Cb qui permettent de reproduire les positions des atomes des groupes fonctionnels présents sur les résidus du motif à greffer sont représentées grâce à des bibliothèques de rotamères. Il est à noter que la dernière version du programme STAMPS (3.1.3) inclut une fonction similaire. Les plates-formes identifiées sont ensuite évaluées en termes de géométrie globale, orientation de la chaine latérale, conflits stériques (et accessibilité pour certaines applications, GRAFTER), ou en termes de complémentarité géométrique du modèle de complexe plateforme-protéine cible (programme développé par Liang et al.). Le programme développé par le groupe de Luhua Lai (Liang et al., 2000) est celui dont le principe présente le plus de similitudes avec le programme STAMPS. Les différences résident dans lajout dune étape de mutation des résidus avoisinant le motif transféré sur les plates-formes identifiées afin doptimiser la complémentarité géométrique.
Récemment, Zhang et Lai ont développé le programme AutoMatch (Zhang et Lai, 2012). Contrairement aux approches utilisées dans les programmes cités précédemment (GRAFTER, FITSITE, le programme développé par Liang et al. et ScaffoldSelection), AutoMatch prend explicitement en compte la possibilité de lexistence de faibles différences de conformations au niveau de la chaine principale entre le motif de référence et la plate-forme. Ceci est réalisé grâce à la génération de bibliothèques de conformations de sites actifs. Les jeux de coordonnées des atomes Ca, Cb des différents conformères ainsi obtenus sont utilisés pour la recherche de protéines plates-formes. Le problème combinatoire complexe dû aux bibliothèques de conformations des résidus du site actif est traité par des étapes de réductions des ensembles. Pour cette raison, le nombre de résidus du site actif est compris entre 3 et 5 au
maximum. Lexamen géométrique est réalisé en comparant la géométrie du site actif de référence avec le site actif identifié et en incluant un filtre stérique grâce à un score de collision géométrique. Finalement, les solutions sont évaluées par le calcul de lénergie de liaison en utilisant un potentiel empirique.
RosettaMatch est un programme développé par le groupe de Baker D. (Zanghellini et
al., 2006), utilisé pour la conception denzymes artificielles grâce à un protocole similaire à ceux utilisés dans dautres méthodes précédemment décrites dans la littérature telles que ORBIT (Dahiyat et Mayo, 1997), DEZYMER (Hellinga et Richards, 1991) et plus récemment
OptGraft (Fazelinia et al., 2009) et ScaffoldSelection (Malisi et al., 2009). Le protocole se
déroule en 3 étapes : la détermination de paramètres géométriques dun site actif permettant de décrire les positions spatiales des résidus de ce site par rapport à létat de transition, la recherche dans une plate-forme protéique de positions où ce site actif peut être placé, et la mutation des résidus entourant ce site actif potentiel afin de stabiliser létat de transition. De manière similaire à AutoMatch, les différentes conformations des sites actifs sont dabord générées puis des positions compatibles avec la reproduction de ces géométries sont recherchées dans une plate-forme protéique. Au cours de cette étape, RosettaMatch emploie des algorithmes de hachage géométrique pour la recherche de lemplacement optimal du site catalytique. Par la suite, le substrat (ou un modèle du substrat à létat de transition) est positionné dans le site actif identifié. Les résultats sont évalués par des méthodes basées sur le calcul de lénergie de liaison entre la plate-forme et létat de transition et sur lajustement géométrique des résidus catalytiques dans le site actif.
III.3 Conclusion
Lapproche de conception in silico de ligands protéiques utilisée dans le cadre de ce travail repose sur le programme STAMPS développé au sein de notre laboratoire. Cette approche permet le greffage dun motif fonctionnel dun ligand naturel de référence, pouvant être continu ou discontinu et constitué des résidus jouant un rôle important dans le phénomène dassociation entre les partenaires protéiques. Lobjectif de ce greffage sur des plates-formes protéiques, généralement de taille plus petite que celle du ligand naturel, est de reproduire la topologie fonctionnelle de ce motif afin de détablir un jeu dinteractions intermoléculaires particulier. La Figure III.6 résume les différentes étapes de cette approche de conception de
ligands protéiques artificiels.
Figure III.6 : Schéma représentant les différentes étapes de conception in silico de ligands protéiques destinés à inhiber une cible dintérêt, ainsi que les différents programmes utilisés.
La recherche des plates-formes hôtes est réalisée sur la totalité des structures contenues dans la PDB (plus de 80000 en 2012), augmentant ainsi la probabilité de trouver des plates- formes adéquates. Létape de criblage de la PDB réalisée par le programme STAMPS et basée sur les paramètres topologiques du motif fonctionnel à transférer prend également en considération la complémentarité géométrique entre la cible et les plates-formes identifiées par lapplication dun filtre stérique. Les potentiels électrostatiques des plates-formes identifiées à lissue de cette première phase sont comparés à celui du ligand protéique naturel de référence. Des modèles moléculaires des plates-formes retenues à lissue de ces étapes, en interaction avec la cible considérée, sont réalisés. La sélection de ces plates-formes inclut la détermination dans les modèles moléculaires obtenus, dune série de paramètres caractéristiques des interactions protéine-protéine et la vérification de la conformité de ces valeurs à celles reportées dans des études de complexes protéine-protéine naturels. Les plates-formes
satisfaisant ces critères sont alors évaluées expérimentalement pour leur capacité à lier la cible dintérêt au site de liaison visé.