• Aucun résultat trouvé

C-Cα 1.525 0.018

Cα-N 1.466 0.02

C-N 1.323 0.02

Table 4 – Exemples de valeurs moyennes des diff´erents types de liaisons pr´esents dans la chaˆıne principale des prot´eines [52].

On sait que les longueurs des liaisons entre atomes de la chaˆıne principale sont tr`es stables d’une prot´eine `a l’autre, c’est pourquoi une telle formule peut ˆetre utilis´ee. Ces longueurs standards ont ainsi pu ˆetre d´etermin´ees par une analyse des prot´eines de la PDB [52]. La table 4 reprend ces valeurs pour les diff´erentes liaisons possibles. La valeur de σ permet d’accepter une certaine tol´erance dans la variation de la longueur, nous avons choisi 0.1 qui semblait ˆetre un bon compromis entre p´enalisation des mauvaises structures et tol´erance au niveau de la longueur des liaisons.

On le voit, la valeur de σ utilis´ee est sup´erieure `a la valeur de l’´ecart-type donn´ee par [52]. Ceci est dˆu au fait que les longueurs pr´esent´ees dans la table 4 ne sont pas uniques et peuvent varier en fonction du type d’acide amin´e dans des proportions tr`es faibles. C’est pourquoi une plus grande valeur de σ permet de tenir compte de cette diff´erence naturelle. La valeur de dstandard tient ´egalement compte des diff´erences de longueur de liaisons entre

acides amin´ees puisque celle-ci est la moyenne des diff´erentes valeurs possibles sur l’ensemble des acides amin´es (cf. [52]). La formule (38) peut donc ˆetre calcul´ee pour chaque liaison de la chaˆıne principale. Sa valeur sera proche de 1 si la longueur de la liaison courante est acceptable et sera plus grande si ce n’est pas le cas. Ainsi, pour des prot´eines dont la structure est valide, un offset a ´et´e introduit par cette formule. Pour le corriger, on soustrait 3n − 1 `a la valeur calcul´ee de sorte que, pour des prot´eines dont les longueurs de liaisons se trouvent dans l’intervalle admissible, le score d’´energie donn´e par notre formule soit sensiblement ´egal `a l’´energie donn´ee par Rosetta. Au final, l’´energie est calcul´ee par

E(s) = E(s) + X i∈MC exp (  di− dstandard σ 2) −3n + 1 (39)

o`u MC d´esigne l’ensemble des liaisons de la chaˆıne principale. 6.3 Algorithmes d’optimisation

Nous avons impl´ement´e trois types d’algorithmes simples d’optimisation : algorithme glou- ton, algorithme de Monte-Carlo [65] et l’algorithme de recuit simul´e [47]. Tous ces algorithmes fonctionnent sur le mˆeme principe, `a savoir choisir al´eatoirement un op´erateur, l’appliquer sur la structure courante, ´evaluer son ´energie et puis d´ecider si la nouvelle structure est conserv´ee. La seule diff´erence r´eside dans le crit`ere d’acceptation de la structure.

La politique gloutonne (ou greedy en anglais) conserve une structure que si celle-ci est meilleure que la pr´ec´edente en termes d’´energie. Ce type de politique de d´ecisions peut entra- ver l’optimisation dans un minimum local. La politique Monte-Carlo consiste `a appliquer le crit`ere de Metropolis (cf. ´equation (13)) avec une temp´erature constante. Ici, la politique de

d´ecision permet, dans certains cas, de conserver une structure qui est moins bonne (en termes d’´energie) dans le but de trouver, par la suite, une structure qui est globalement meilleure que pr´ec´edemment. L’influence des minima locaux est ainsi r´eduite. Le recuit simul´e, finalement, utilise une politique de d´ecision qui est expliqu´ee dans la section 5.2.

En vue d’une utilisation dans notre probl`eme, l’algorithme glouton est tout de suite exclu `a cause de sa propension `a trouver des minima locaux. Nous avons donc dˆu choisir entre l’algorithme de Monte-Carlo et le recuit simul´e. Nous avons choisi ce dernier car il permet plus de flexibilit´e, au travers de ses param`etres (temp´erature initiale, temp´erature finale et d´ecroissance de la temp´erature), que l’algorithme de Monte-Carlo. Nous avons bri`evement test´e ces trois algorithmes sur une prot´eine jouet compos´ee de 12 alanines. La figure 18 illustre la structure initiale telle que cr´e´ee par Rosetta. Les figures 19, 20 et 21 repr´esentent respec- tivement les r´esultats de l’optimisation sur un nombre de 105 it´erations de cette structure

au moyen de l’algorithme glouton, de l’algorithme de Monte-Carlo et du recuit simul´e. Une structure est ´egalement illustr´ee pour une optimisation de 106 it´erations par l’algorithme glou-

ton. On remarque directement que l’optimisation gloutonne donne de pi`etres conformations malgr´e un nombre ´elev´e d’it´erations. Par contre, les r´esultats de l’algorithme de Monte-Carlo et du recuit simul´e sont bien meilleurs et fort similaires dans le cas de cette prot´eine tr`es simple. On peut logiquement supposer que les diff´erences apparaissent au fur et `a mesure que la complexit´e de la structure augmente.

Figure 18 – Conformation initiale lors de la cr´eation de la prot´eine compos´ee de 12 alanines.

Les test pr´ec´edents ont ´et´e obtenus sur une prot´eine jouet qui nous a permis d’observer rapidement le comportement des diff´erents algorithmes. Les prot´eines sur lesquelles nous travaillons sont ´evidemment plus grosses et de structure plus complexe. Les param`etres que nous avons utilis´es pour optimiser ces prot´eines sont :

– Temp´erature initiale : kT = 4, – Temp´erature finale : kT = 0.01,

– D´ecroissance de la temp´erature : par paliers, avec 50 paliers.

Ces valeurs ont ´et´e choisies sur base de celles utilis´ees dans certains exemples pr´esent´es dans un tutoriel officiel de Rosetta. Il est ´evident qu’une analyse plus pouss´ee de l’influence de ces param`etres est n´ecessaire afin de les s´electionner au mieux. Cependant, cette analyse d´epasse

Documents relatifs