• Aucun résultat trouvé

EROS: A Protein Docking Algorithm Using a Quaternion Pi-Ball Representation for Exhaustive and Accelerated Exploration of 3D Rotational Space

N/A
N/A
Protected

Academic year: 2021

Partager "EROS: A Protein Docking Algorithm Using a Quaternion Pi-Ball Representation for Exhaustive and Accelerated Exploration of 3D Rotational Space"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: hal-01929546

https://hal.inria.fr/hal-01929546

Submitted on 21 Nov 2018

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

EROS: A Protein Docking Algorithm Using a

Quaternion Pi-Ball Representation for Exhaustive and Accelerated Exploration of 3D Rotational Space

Maria Ruiz Echartea, Isaure Chauvot de Beauchêne, David Ritchie

To cite this version:

Maria Ruiz Echartea, Isaure Chauvot de Beauchêne, David Ritchie. EROS: A Protein Docking Algo- rithm Using a Quaternion Pi-Ball Representation for Exhaustive and Accelerated Exploration of 3D Rotational Space. APIL 2018 - Journée d’automne de l’Ecole Doctorale IAEM-Lorraine, Nov 2018, Nancy, France. �hal-01929546�

(2)

References

EROS: A Protein Docking Algorithm Using a Quaternion  - Ball Representation for Exhaustive and Accelerated

Exploration of 3D Rotational Space

Maria Elisa Ruiz­Echartea

[1]

, Isaure Chauvot de Beauchêne

[1]

, David W Ritchie

 [1]

1. Université de Lorraine, CNRS, Inria, LORIA, F­54000 Nancy, France

Proteins  are  involved  in  many  essential  cellular  processes  of  living  organisms. 

Proteins  form  macro  complexes    joining  themselves  to  other  proteins  to  carry  out  these  processes.  Therefore,  to  know  the  3D  structures  of  such  complexes  is  of  biomedical interest.

Protein­protein  docking  algorithms  aim  to  predict  how  two  proteins  interact  with  each other to form a 3D complex. Docking algorithms need to fulfill two main tasks: 

(1) sampling all the possible relative positions of the two proteins and (2) computing  the  interaction  energy  at  each  position  to  find  the  minimum  energy  (=  the  best  solution). Obtaining the interaction energy is a computationally expensive task. We  are developing a new algorithm based on the ATTRACT coarse­grained force­field [1] 

and  using  a  quaternion  ­ball  representation  to  accelerate  the  search  of  the  3D  rotational space.

Maria Elisa Ruiz Echartea is supported by a    doctoral  bursary  (CORDI­S)  from  Inria  Nancy Grand Est.

Acknowledgements

3. Divide and Conquer  

1. Zacharias, M.  Protein Science, 12, 1271­1282 (2003).

( ,  ,  )α β γ

Based on a preliminary study, we found that a large number of protein interfaces contain at least one pair of atoms at almost their optimal distance according to an empirical force field. Therefore, our idea is to  perform a series of restricted docking searches in which a pair of surface beads from each protein is placed  at the coordinate origin (see Fig. 4).

 

       

The 3D rotational space is represented by a  ­ball contained inside a cube. Any point π within  the  ­ball  may  be  mapped  to  an  Euler  rotation  defined  by  the  three  Euler π rotation  angles,  ( ,  ,  ).  Points  within  the  ­ball  may  be  represented  as  a  unit α β γ π quaternion, Q = (cos( /2), sin( /2)u), where u is a unit vector from the origin. θ θ

A series of sample rotations is generated by dividing the cube containing the  ­ball into π 8 sub­cubes, and recursively sub­dividing each such cube into 8 smaller cubes until a  given  threshold  cube  dimension  is  reached.  Each  cell  contains  a  subspace  of  similar  rotations of the rotations space, since they are near each other. 

2.The Quaternion π-Ball

Conclusions

1. Introduction

The set of all possible sample rotations from the  ­ball cube centres π Rc and their radii  may be collected as a set of nodes  in a 3D “search tree” data structure.

 

Each node can be tested to know if such subspace leads to forbidden orientations (i.e. leading to atomic clashes). If yes,  the node leads to a forbidden orientation so it is labeled along with its descendants  as forbidden. 

4. Application to Protein Docking  

Input The docking process Output

Fig 1. The  ­ball representation.π

Fig  2.  a)  Tree  structure  representing  the  cells  of  the  ­ballπ   and  the  ­ball  with  some  shadow  areas  representing  the π forbidden rotations.

RANK 26    RMSD 7.30

RANK 1    RMSD 4.50 RANK 8     RMSD 8.28 RANK 6    RMSD 3.13 RANK 17    RMSD 7.72 RANK 30   RMSD 6.94 RANK 23  RMSD 8.68

The rotational space can be labeled in order to identify unfavorable rotations before computing  any  energy.  Thus,  the  labeled  ­ball  can  be  used  as  a  rotational  map  avoiding  to  compute π energies  at  useless  rotations.  Therefore,  the  exploration  of  the  rotational  space  is  done  is  an  efficient way. The exploration is exhaustive since the complete rotational space is analyzed and  labeled. 

Protein A

Protein B

Protein Complex A­B

Forbidden d

Level 4   d  2

. .

. . . .

. . . .

Level 1­Root  d 2Level 2 

 d  2

Level 3   d  2

   

Lb

Ra

Fig 5. Two beads aligned to find  if they are clashing.

The Root­Mean­Square Deviation (RMSD) is a measure of the average distance between the atoms of two superimposed proteins. In practice, to evaluate the efficiency of a docking algorithm,  the RMSD is used to  evaluate the difference between a calculated and an experimentally determined 3D structure. Above, we show the rank and RMSD of some of the solutions found by our algorithm.

Fig  3.  ATTRACT  force  field  describing  the  interaction energy for a given pair of beads.

Fig  4.  Example  of  an  initial  starting  position  for  a  3D rotational search.

Ligand Bead  Receptor Bead

Ligand 

Mass Centre

Receptor  Mass Centre Optimal 

distance 

Then,  the  tree  is  walked  to  label  as  forbidden  those  rotations  of  the  search  space  that  intersect  some  orientation  of  the  list.  If  a  bead  comes  close  enough  to  receptor  bead  a  to  always  give  a  clash,  then  that  rotation and all the rotations in the cube's descendants are labeled as forbidden (see Fig. 6).

In the last stage, the tree is walked to compute energies in order to find the best solutions. The  ­ball is used π as a rotational map. Therefore, many trial rotations are discarded and the rotational search space is pruned to  achieve an improvement in efficiency. 

In our experiments we use a minimum cell radius of 7.5 degrees, which divides the  ­ballπ   into 299,593 cells. 

We  observe  that  about  96%  of  these  are  forbidden,  leaving  only  4%  of  the  search  space  where  interaction  energies have to be computed.  

In order to detect the bead pairs that can lead to steric clashes  upon ligand rotation, we compute the differences between the  distances. Thus, for all (a, b) in (Receptor, Ligand):

If |Ra − Lb | > σab, where σab is the clashing distance for  atom types a and b, see Fig. 3 and 5,

    then beads a and b will never clash else

      we have to examine in more detail if the beads might  overlap or not (see Fig. 5 and 6).

 = rMin

Results

      

Rc .Lb

Rs .Lb

β ab Lb

 

∆s

ω Rc .Lb

Rs .Lb

β ab Lb

 

∆s ω

Case  1)    <    ­  ∆s    =>  Every  rotation ω β within cube s cause a steric clash. 

 

Case 2)   >   + ∆s  => No rotation within ω β cube s can cause a steric clash.

Fig 6. Possible  cases when a  rotation moves  a bead.

Sub­division 1 Sub­division N

e e e

e

e

Références

Documents relatifs

These can concern the human face and target identity recognition, action unit detection, expression and emotion recognition, face modeling and face morphing (Section 3.1); or they

This paper illustrates the construction and installation of a public piece of art, hidden within which is an enclosed and private meditation space.. In making the piece,

1.3 The neural tracking of speech the representation of streams in the low-level auditory cortex: the cortical tracking of the target stream is enhanced but the masker stream is

En ce qui concerne l’envoi de ces multimédias, il n’y a qu’une faible différence entre les deux sexes, toutefois elle s’inverse par rapport à la réception ; ce sont les

Here, we present a novel docking algorithm called EROS-DOCK (Exhaustive Rotational Search based Docking) [1] to rigidly dock two proteins using a series of exhaustive 3D

In this paper we present a novel algorithm that performs 3D protein struc- ture comparison at the level of C-alpha atoms and aims at detecting similarity between a specific