• Aucun résultat trouvé

1.3 Algorithmes d’optimisation appliqu´es au CPD

1.3.2 M´ethodes stochastiques ou semi-al´eatoire

Les m´ethodes stochastiques, ´echantillonnent al´eatoirement l’espace des s´equences et des structures en se d´epla¸cant d’une solution `a l’autre d’une fa¸con d´ependante du paysage ´energ´etique et des lois impos´ees par l’algorithme d’optimisation. Plus faciles `a impl´ementer, les m´ethodes stochastiques sont aussi beaucoup plus rapides que les m´ethodes exhaustives. Les principaux algorithmes utilis´es en CPD sont le Monte Carlo [152] et l’Algorithme G´en´etique [91], cependant nous d´etaillerons aussi l’algorithme heuristique impl´ement´e par l’´equipe de Wodak [211].

Monte Carlo

Le Monte Carlo est l’une des m´ethodes stochastiques les plus simples `a impl´ementer. Son principe est de proposer it´erativement une modification au mod`ele ´etudi´e puis de d´ecider d’accepter ou rejeter cette modification selon le crit`ere de Metropolis. Cette m´ethode peut ˆetre utilis´ee pour optimiser des s´equences d’acides amin´es, des orientations de chaˆınes lat´erales, des conformations de chaˆınes principales ou encore tous ces crit`eres simultan´ement [87],[43], [78], [92].

Dans le cas du CPD, un acide amin´e dans un rotam`ere donn´e est al´eatoirement modifi´e pour une position choisie au hasard dans toute la s´equence. La nouvelle

´energie du syst`eme Enew est alors mise `a jour. Si cette ´energie est plus faible que

l’´energie Eold de l’´etat pr´ec´edent alors la modification est accept´ee. Si au contraire

cette ´energie se trouve plus ´elev´ee, la perturbation est accept´ee avec la probabilit´e

p = exp(Enew−Eold)/kT. k repr´esente la constante de Boltzmann et T la temp´erature.

Cette op´eration est r´ep´et´ee un grand nombre de fois. La m´ethode de Monte Carlo permet de franchir les barri`eres d’´energies et ainsi surmonter les multiples minima locaux du paysage ´energ´etique.

La temp´erature peut ˆetre ajust´ee pour faciliter le franchissement de barri`eres d’´energie. Le recuit simul´e reprend ce principe en chauffant le syst`eme puis en le refroidissant afin de diminuer graduellement la probabilit´e d’accepter des conforma- tions de haute ´energie.

Algorithme heuristique de Wernisch et coll.

En 2000, Wernisch et coll. impl´ement`erent un algorithme permettant l’identifica- tion de la s´equence de plus basse ´energie mais aussi la collection d’un ensemble de s´equences d’´energie similaires [211]. Dor´enavant, pour plus de lisibilit´e, nous d´esignerons les combinaisons structures/s´equences de basse ´energie par le terme de ‘s´equences de basse ´energie’. Cette approche repose sur le fait que le paysage ´energ´e- tique d´ecrit par nos champs de force ne repr´esente pas le vrai paysage ´energ´etique. Par cons´equent, les ´energies libres obtenues lors des calculs de CPD demeurent une approximation des ´energies r´eelles. Ainsi, la s´equence optimale obtenue ne corres- pond pas n´ecessairement `a la meilleure solution. Wernisch et coll. ont pris pour parti de collecter un ensemble de solutions d’´energie proches de la plus basse ´energie plutˆot que de se limiter `a une seule solution qui ne correspond probablement pas au minimum global r´eel.

L’algorithme utilise un ajustement it´eratif des rotam`eres `a chaque position. Au d´epart, un rotam`ere est impos´e al´eatoirement pour chaque position. Ensuite une position i est choisie au hasard et le rotam`ere optimal pour cette position est d´etermin´e, compte tenu des autres rotam`eres aux autres positions. Le meilleur ro- tam`ere est alors assign´e `a la position i et une nouvelle position j est ensuite choisie au hasard. De nouveau, le meilleur rotam`ere pour cette position est d´etermin´e en tenant compte des chaˆınes lat´erales environnantes. La proc´edure est r´ep´et´ee jusqu’`a convergence de l’´energie.

Cet algorithme, tout comme le Monte Carlo, ne garantit pas de trouver le minimum global mais un minimum local proche du point de d´epart. Toutefois, en multipliant les points de d´epart et en r´ep´etant les cycles, Wernisch et coll. montrent que le minimum global peut facilement ˆetre atteint pour des petits syst`emes autour de 20 r´esidus dans des temps beaucoup plus rapides que le DEE [211].

Algorithme G´en´etique

L’algorithme g´en´etique fut developp´e par Holland et ses coll`egues en 1975 et est largement exploit´e en pr´ediction stucturale ou en CPD depuis le d´ebut des ann´ees 90 [201], [101]. Cette approche a pour but d’optimiser une population de solutions en s’inspirant d’op´erations biologiques tels que la mutation, la recombinaison et la s´election. Les deux premiers sont des op´erations d’exploration de l’espace, tandis que le dernier fait ´evoluer la population vers les optima du probl`eme.

Une population k de solutions est tout d’abord g´en´er´ee au hasard. Des mutations al´eatoires sont alors appliqu´ees avec un taux d´efini au pr´ealable. Les ´energies des mutants sont ensuite mises `a jour, puis les diff´erentes solutions sont class´ees selon leurs ´energies. Op`ere alors le processus de pression de s´election qui va identifier un jeu de solutions de basse ´energie. Ensuite, on recombine les solutions de basse ´energie entre elles afin de privil´egier la reproduction des ‘meilleurs’ individus au d´etriment des moins ‘bons’. Enfin, les meilleures s´equences d’un point de vue ´energ´etique sont gard´ees pour peupler la nouvelle population k + 1. Le nombre de solutions `a conserver d’un cycle `a l’autre peut varier selon les diff´erentes approches. En prenant un nombre trop faible on prend le risque de converger trop rapidement vers des minimas locaux et de se restreindre `a une trop petite r´egion de l’espace. A l’inverse, garder trop de solutions ferait augmenter le temps de calcul. Une des solutions commun´ement adopt´ee est de garder constant le nombre d’individus d’une

g´en´eration `a l’autre. Une fois la nouvelle population obtenue, ce processus est r´eit´er´e jusqu’`a l’obtention d’une population homog`ene dont on peut penser qu’elle se situe `a proximit´e du ou des optima.

Comme dans le Monte Carlo, il existe certaines variantes de l’algorithme g´en´etique analogues au recuit simul´e. Cette fois, c’est le nombre d’individus conserv´es d’une g´en´eration `a l’autre qui d´ecroit au cours des diff´erents cycles. Le principe est de commencer avec une large distribution de solutions dans l’espace des s´equences puis de diminuer le nombre de solutions `a chaque cycle jusqu’`a converger vers une solution unique. On esp`ere ainsi augmenter la probabilit´e de trouver de meilleurs minima.

Un des avantages de l’algorithme g´en´etique est qu’il permet de franchir des barri`eres d’´energies par des d´eplacements dans l’espace des s´equences, d’amplitude beaucoup plus grande que ceux autoris´es par l’algorithme de Monte Carlo. Ceci peut cependant se r´ev´eler ˆetre un inconv´enient pour les syst`emes fortement coupl´es. Par exemple, le m´ecanisme de recombinaison peut s’av´erer probl´ematique dans le cas de la pr´ediction de chaˆınes lat´erales puisque de nombreux r´esidus proches dans la s´equence ne le sont pas n´ecessairement dans la structure et inversement.

Actuellement les algorithmes stochastiques ne garantissent pas la d´etermina- tion du minimum global ni mˆeme le fait d’explorer des solutions proches de ce mi- nimum. Cependant ils ont largement d´emontr´e leurs capacit´es dans le design de nombreux coeurs hydrophobes [54], [126], [87] Voigt et coll. confirment que le DEE reste actuellement l’algorithme le plus appropri´e pour converger vers le minimum global [206]. On peut cependant relativiser l’importance de d´eterminer le minimum global, l’utilit´e d’une r´eponse tr`es pr´ecise n’´etant pas ´evidente. En effet, il faut tout d’abord distinguer le minimum global de l’espace conformationel discret utilis´e dans toutes ces approches, du minimum global r´eel. Le paysage ´energ´etique, d´ecrit par

nos champs de force, ne repr´esente pas le vrai paysage ´energ´etique. Par cons´equent, la n´ecessit´e de trouver le minimum global dans le probl`eme du CPD n’est pas abso- lue, voire mˆeme erron´ee. Rechercher un ensemble de solutions proches du minimum global th´eorique semble donc plus pertinent.

Documents relatifs