Identification du site de liaison

^{206 , 207 , 208}

L’identification du site de liaison est nécessaire et cruciale pour pouvoir réaliser un criblage

virtuel basé sur la structure. Pour cela, deux solutions sont possibles : obtenir une structure 3D

de la protéine co-cristallisée avec un ligand, ou utiliser des outils de prédiction

.

107

4.1.1 Structure co-cristallisée avec un ligand

L’analyse de la structure cristallisée d’une protéine avec un ligand permet de rechercher les

interactions s’établissant entre ces deux partenaires

. Les acides aminés clés, c’est-à-dire

impliqués dans les interactions ligand-protéine, permettent ainsi de guider la définition du site

de liaison. Il s’agit de la méthode la plus sûre pour identifier un site de liaison puisqu’elle

utilise des données expérimentales et non pas des données prédites.

4.1.2 Outils de prédiction de site de liaison

Les outils de prédiction de site de liaison peuvent être divisés en trois catégories, ceux basés

sur la géométrie, ceux basés sur les énergies et ceux basés sur la connaissance

.

4.1.2.1Outils de prédiction basés sur la géométrie

Les outils de prédiction basés sur la géométrie utilisent comme hypothèse de départ

l’assertion que les poches et les cavités sont souvent associées aux sites de liaison. En effet,

diverses études ont suggéré que les sites de liaison sont souvent situés dans la plus grande

poche de la protéine

. De nombreux logiciels s’attachent donc à identifier celles-ci

au sein de la structure protéique. Pour cela, la plupart utilise une grille tridimensionnelle pour

définir la surface moléculaire (MOLCAD

, POCKET

, LIGSITE

et son

implémentation Pocket-Finder

, VolSite

…). Ainsi, le programme MOLCAD

(MOLecular Computer Aided Design)

utilise l’algorithme de Connolly

permettant de

calculer la surface exclue au solvant ou surface de Connolly pour identifier au sein d’une

structure les canaux et les cavités. Pour cela, la surface de Connolly est générée pour la

protéine entière et est placée dans une grille cartésienne. Tous les points de la grille qui se

trouvent dans l’espace défini par la surface de Connolly sont nommés « in » et tous les autres

points de la grille « out ». Pour chaque point de la grille « out », les points voisins de moins

de 12 Å sont étudiés. Si un point de la grille « out » possède des points voisins « in » dans au

moins 2 directions de l’espace, le point « out » est défini comme étant un « point de la

cavité ». Tous les « points de la cavité » sont combinés ensemble pour former des clusters.

Deux opérations de « logique cellulaire » sont effectuées sur ces clusters : la « contraction » et

« l’expansion ». La contraction définit que tout point de la cavité avec un voisin qui n’est pas

un point de la cavité est supprimé alors que l’expansion affirme que tout point de la cavité

avec au moins un voisin défini comme étant un point de la cavité est ajouté au cluster

correspondant. A travers ces opérations, les petits clusters sont éliminés et ceux de taille plus

108

importante sont subdivisés en plus petits clusters. Ceci permet d’obtenir un ou plusieurs

clusters représentants des régions concaves de la protéine. Des algorithmes de surface

moléculaire utilisant des sondes parcourant la surface de la molécule peuvent aussi être

employés (Automatic PROtein POcket Search APROPOS

, CASTp

, SurfNet

). Le

logiciel CASTp (Computed Atlas of Surface Topography of proteins)

utilise un système de

triangulation (dit de Delaunay) pour identifier et mesurer le volume et la surface des poches

accessibles mais aussi les cavités intérieures inaccessibles (Figure 41). Les ouvertures de la

molécule permettant d’accéder aux poches et cavités sont aussi recherchées.

Figure 41. Schématisation de la triangulation de Delaunay pour un modèle simplifié

d’atomes possédant tous le même rayon (a). Lorsque l’on relie le centre de tous les atomes,

un polygone est formé (b) qui peut être triangulé de manière à ce que tout le polygone soit

couvert sans superposition de triangles (c). Selon la méthode « discrete flow », un triangle

agit comme un « puit » pour les triangles voisins et la poche est définie (d). Dans certains

cas, ce « puit » ne peut pas être créé et CASTp ne considère donc pas cette partie comme une

poche. (d’après

)

4.1.2.2Outils de prédiction basés sur les énergies

Les outils de prédiction basés sur les énergies tentent d’estimer les énergies d’interaction entre

une sonde (qui peut être un groupement méthyle, hydroxyle ou amine) et un point donné de la

protéine pour définir des zones favorables d’interaction. Différentes techniques emploient

cette approche (GRID

, méthode de Ruppert et al

), parmi lesquelles le logiciel

Q-SiteFinder. La recherche de sites de liaison avec Q-SiteFinder

est réalisée par liaison de

sondes hydrophobes (CH

) à la protéine puis génération de clusters en regroupant les zones où

les sondes se lient avec les énergies de liaison les plus favorables (Figure 42).