Mesure de similarité

sommet inclu dans le site de liaison, respectant les deux critère de distance et d’orientation

sommet non inclu,

car le critère d’orientation n’est pas respecté, bien que le critère de distance le soit LigandL

Région siteB

La mesure de similarité entre une région requête Q et une région candidate T superposée consiste

à mettre en correspondance des sommets de chaque région. Une évaluation de similarité est déterminée

pour tous les couples de sommets en fonction des caractéristiques de chaque sommet selon la méthode

présentée dans la prochaine section (3.2.1). Ensuite un sous-ensemble des ces couples est déterminé,

plusieurs méthodes utilisées étant présentées dans la section suivante (3.2.2).

3.2.1 Composantes et score entre deux sommets

Caractéristiques des sommets Quatre caractéristiques sont considérées sur chaque sommetsd’une

région permettant de déﬁnir un score de similarité entre deux sommets :

- La position : La position du sommet est la position de l’atome associé,pos(s)∈R

représenté par

ses trois coordonnées réelles (section2.1).

- Le typage : Le type du sommet correspond au typage de l’atome associé, type(s) prenant ses

valeurs dans un ensemble ﬁni de typages prédéﬁnis (section 2.1).

- La normale : La normale du sommet construite grâce au modèle de la surface comme une variété

union de triangles, nor(s) ∈ S

(vecteur unitaire de la sphère unité) représenté par ses trois

coordonnées réelles (section 2.2.3).

- La courbure : La courbure du sommet construite à partir des normales et des sommets voisins,

curv(s)∈[−1; 1](section 2.2.3).

Pour chacune de ces caractéristiques une mesure de similarité normalisée dans l’intervalle [0,1] est

construite pour chaque couple de valeur. Concernant la position, la normale, et la courbure, cette mesure

normalisée est déﬁnie à partir d’une diﬀérence∆entre deux valeurs, un seuil de tolérance τ, ainsi qu’une

fonction de normalisationσ représentée dans la ﬁgure7 qui transforme le quotient

de la diﬀérence des

valeurs par le seuil de tolérance en une valeur normalisée entre 0 et 1 :

σ

(x, y) =σ

∆pos(x, y)

τ

avec ∆

(x, y) =kpos(x)−pos(y)k

σ

(x, y) =σ

∆

(x, y)

τ

avec ∆

(x, y) =angle(nor(x),nor(y))

σ

(x, y) =σ

∆curv(x, y)

τ

avec ∆curv(x, y) =|curv(x)−curv(y)|

La mesure de similarité normalisée entre deux valeurs de typage des sommets et directement déﬁnie

par une matrice considérant l’ensemble des couples possibles. Cette matrice est déﬁnie de manière interne

àBionext SA

pour l’ensemble des valeurs possibles.

Score d’une composante Pour chaque caractéristiquek, on déﬁnit un score de composante comme

une fonction qui associe à un couple de sommets(q, t) un triplet (ws

,w

,ns

) constitué respectivement

d’un score pondéré ws

(q, t) d’un poids w

(q, t) et d’un score normalisé ns

(q, t). Le score normalisé ns

correspond à la mesure de similarité des caractéristiques précédemment décrites, le poidswest déterminé

en paramètre et le score pondéréws vériﬁe les propriétés suivantes :

ws

(q, t) = w

(q, t)×ns

(q, t)

w

(q, t)∈[0,∞[

ns

(q, t)∈[0,1]

3. Scores entre types atomiques internes à Bionext SA (développés par Pascal Muller

pas-cal.muller@bionext.com).

3. Évaluation de la similarité locale 47

score normalisé

1

0

0 1 2

Egalité des valeurs

∆ = 0

Différence égale au seuil de tolérance

∆ =τ

Différence importante des valeurs

∆≥2τ

Exemples : La fonction constante _∀x, y, inf(x, y) = 1qui ne privilégie aucun couple de sommets. Ou

(q, t) = 1si_kq−tk ≤xetinf

ws(q, t) = inf(q, t)^X

w(q, t) = ^X

ns(q, t) = ^ws(^{q, t}⁾