• Aucun résultat trouvé

3.2 Les stratégies existantes

3.2.3 Algorithmes sto hastiques ave mé anismes de séle tion sur

Un ertain nombre d'algorithmes implémentent des stratégies de séle tion : le traitement d'une solution dépend maintenant de son tness et lavisite des régions del'espa edephasen'estplusuniquementlefruitduhasard,maisdépendégalement des solutionsantérieurement explorées.

Citons en premier lieula stratégietabous (Glover, 1989; Glover, 1990; Glo-ver et al., 1995) qui se dé line de diérentes façons : la première est basée sur la mar he aléatoire et onsiste àinterdire ertainsmouvements an d'éviter de revisi-ter ertaines régions onnues. Ainsi, sila mar he aléatoire propose un dépla ement

(dθ1, . . . , dθN

ddl

)

, lastratégie tabous peut n'autoriser que les dépla ementsvériant

dθ1 > 0

.Uneautreimplémentationpropose de sto kertemporairementlesdernières

solutions é hantillonnées dans une liste taboue et de réutiliser ette liste an de rejeter ertains mouvements ou ertaines solutions dans des régions onsidérées omme onnues. Bussi et al. (2006) ont utilisé une méta-dynamique qui onsiste à onstruireaufuretàmesure,surlepaysaged'énergie,unenouvelle ontribution pé-nalisantlesrégionsdéjàé hantillonnées(bruitage).Celapermetd'aplanirlepaysage, e qui rend lare her he beau oup plus exploratoire (la fréquen e d'é hantillonnage desétatsdevientthéoriquementlinéaireave l'énergieaulieud'unedépendan e las-siquementexponentielle ommedanslaformuledeBoltzmann),deplus,letermede pénalisation ore une image en négatif de l'énergie libre. De la mème façon, S hug etal.(2005b),ontproposé unestratégie, appeléeenergy lands ape paving, intermé-diaireentre leMonteCarlo(Cf. i-dessous),lesméthodes debruitageetl'utilisation de tabous, appliquée à l'é hantillonnage onformationnel. Elle onsiste à explorer les régions de basses énergies du paysage mais utilise une fon tion ible modiée, prenanten ompteletempspassédans haqueminimumandefor er onstamment lare her he vers de nouvelles régions.

La stratégie de MonteCarlo est également dérivée de la mar he aléatoire mais dière par l'existen e d'un ritère d'a eptation de ha un des pas, dépendant de la température et des énergies des solutions initiale et nale. Ce ritère dit de Metropolis-Hastings peut s'é rire, dans le as d'une minimisation d'une fon tion

f

, omme(équation (3.1)) :

Pr(

a epter un pas de

X

à

Y ) = min



1; exp



f (Y )k− f(X)

BT



,

(3.1)

T

est un paramètre de température autorisantl'exploration ouau ontraire for-çantl'intensi ation.Ilest équivalentà

min1;π(X)π(Y )

lorsqueladensité ible

π

n'est pas expriméesous laforme

1

Zexp− f

kBT



.

Le re uitsimulé (Kirkpatri k et al., 1983) s'inspire de on epts de la physique statistiqueetdu pro édé de fabri ationdu même nom, selonlequel les atomes s'ar-rangent de façon plus stable lorsque la température est augmentée puis diminuée trèsprogressivement.Ainsi,l'algorithmerepose sur un ouplusieurs y les de Monte Carlo ave des montées en température suivies de refroidissements lents (Teghem, 2003; S hug et Wenzel, 2004). Cette stratégie permet, en prin ipe, de sortir des minima lo aux et de fran hir ertaines barrières (lorsque la température est suf-samment haute) et elle assure une onvergen e asymptotique vers le minimum global.En pratique,l'existen e de très fortes barrières énergétiques  omme 'est le as dans le repliement molé ulaire  borne malgré tout la re her he dans des régionsrestreintes de l'espa ede phase; de plus, il est né essaire de disposer d'une solutioninitiale,qui peut inuen e grandement lerésultat nal.

Nayeem et al. (1991) ont utilisé la méthode intermédiaire du Basin Hopping Te hnique etont omparé lesrésultats aure uit simulé : l'appro he BHT semble supérieureaure uitsimulé,enparti ulieren equi on erneladé ouvertedeminima diverses.

S hug et Wenzel (2004a) ont reporté une version parallèle de re uit simulé où plusieurssolutionssontoptimiséesindépendammentsurdiérentspro esseurstandis qu'une ma hine maîtresse gère la onvergen e des solutions et la répartition des tâ hes.

3.2.4 Algorithmes sto hastiques ave mé anismes de séle -tion sur un ensemble de solutions

D'autres algorithmes ayant puisé leur inspiration dans les systèmes biologiques naturels, font appel à un ensemble de solutionsqu'ils gèrent et font évoluer simul-tanément;ledevenird'une solution(appelée individu)ne dépendalors plus simple-ment deson passé oude sontness, maiségalementde l'ensemblede lapopulation. Unpremierexemple est elui duparadigme des fourmis (Teghem,2003),basésur le re rutementd'individusdanslesrégionsintéressantes del'espa edephase. Typique-ment, ela se fait en mémorisant temporairement(notion de phéromones volatiles) les dernières solutions intéressantes visitées, an de tirer parti de leur expérien e

quise traduitpar un ertainnombre de fourmis déambulant aléatoirement,permet d'explorerglobalementle paysage. Ce type de stratégiea été appliqué auproblème de l'é hantillonnage onformationneldans le as du modèle hydrophobe-polaire sur grilles2D et 3D (Shmygelska etHoos,2003, et 2005).

De même, l'heuristique des essaims d'abeilles (Kennedy et Spears, 1998) repro-duit ertains omportementsindividuelsenespérantvoirémergerles omportements olle tifsdesinse tes so iauxquitrouvent inmanquablementlanourrituredansleur paysage propre.

Vengadesan et Gautham (2003) ont proposé d'utiliser un ensemble de  arrés latinsmutuellementorthogonauxand'é hantillonnerl'espa edephase;à haque itération,la onnaissan e du paysage énergétique en

N2

points (où

N

est la taille de l'espa e de phase) leur permet de hoisir

N2

nouvelles solutions potentiellement meilleures.

La stratégie, beau oup plus populaire, des algorithmes génétiques (Holland, 1975) opielesmodes dereprodu tionobservés( roisementde hromosomes, muta-tionsa identelles)etde séle tionnaturelle(laloidu plusfort)andefaireémerger lesmeilleursindividus (Darwin, 1859).De nombreux livresexposent ette stratégie (Goldberg, 1989; Davis, 1991; Mi halewi z, 1994; Renders, 1995; Bä k, 1996, et .) qui ore un véritable adre de développement pour in orporer toutes les heuris-tiques omplémentaires et astu es vues pré édemment. Saprésentation sous forme de squelette algorithmique laissant beau oup de liberté, ainsi que sa fa ilité à les adaptater aux diérents types de problèmes, ont fait la renommée de ette heuris-tique. De plus, la possibilité de les paralléliser à plusieurs niveaux (parallélisation des évaluationsindividuelles,de l'évaluationde la population,modèledes îles,et .) leur apermisun nouvelessor ave l'avènement du al ul distribué.

Les mé anismes utilisés dans les AGs permettent d'éviter le piège des minima lo aux;deplus,lanotiond'héritagedess hémas

1

(fragmentsdesolutions)prendun sens parti ulier ave les notions d'éléments stru turaux (ou stru tures se ondaires pour les protéines, voir Ÿ 1.3.2 p. 31) et de repliement hiérar hique (voir Ÿ 1.3.4.5 p.49).Eneet, dessous-partiesdesolutions orre tementrepliéespeuventêtre pré-servéesàtraverslesmé anismesde roisementetmutationet,ainsi,êtredisséminées àtraverslapopulationenorantunavantage on urrentielauxindividus,qui maxi-misentalors laprobabilité de re ombiner lesélémentsstru turaux pour obtenirune solutionglobale.

Bien qu'ilait été montré que lesalgorithmes génétiques (AGs) ne sont pas bien 1

adaptésàl'optimisationde fon tion (De Jong, 1993)(d'où lesnombreuses hybrida-tions),ilsont malgrétoutété largementutilisés danslesproblèmes de modélisation en himieen général(voirlesréféren esde larevue deLeardide 2001)etde l'é han-tillonnage onformationnel en parti ulier (S hulze-Kremer, 1995; Takahashi et al., 1999;Jin et al., 1999;Damsbo et al., 2004; Djurdjevi etBiggs, 2006).

Vieth et al. (1998b) ont omparé les AGs à deux autres heuristiques pour le do king semi-exible (Monte Carlo et dynamiques molé ulaires); la on lusion de etteétudeest quelesAGsé hantillonnentplussouventdanslesrégionsaberrantes. C'est malheureusement là un des défauts des AGs qui, de plus, n'évitent pas le ré-é hantillonnage de solutions déjà ren ontrées... En onséquen e, les AGs sont très gourmandsen temps de al ul.

Remarquons enn que la stratégie de roisement des AGs peut être omprise et implémentée de plusieurs façons. Contrairement à la méthode lassique, Glover (1997)aproposéd'utiliser, ommere ombinaison,desbary entresdedeux individus séle tionnés parmi les meilleurs (heuristique du s atter sear h). Dans e as, si la population est autour d'un même minimum, on intensie la re her he en n'uti-lisant que des poids positifs (enveloppe onvexe) tandis qu'on tend à diversier si onautorisedes poids négatifs. Sila populationest répartie dans diérents minima, on relie ainsi les puits par des hemins linéaires (en les dépassant éventuellement) pour en dé ouvrir de nouveaux (stratégie dite par re ombinaison de hemins ou path relinking).

Uneautrestratégieévolutionnaireutiliseleprin ipedemutationenréalisantdes perturbationsdes individus selonune loinormalegaussienne dontla matri ede o-varian eest adaptativementajustée : 'estlaCMA:Covarian e Matrix Adaptation (Hansen et Ostermeier, 1996; Hansen et Ostermeier, 2001). Cette heuristique est très en vogue a tuellement (Auger et al., 2004) mais se omporte d'autant mieux quele paysage est peu a identé.

Ladernière stratégieest elledes méthodes parti ulaires appartenantàla lasse des heuristiques de Monte Carlo ave haînes de Markov (Del Moral et Dou et, 2002;Davy et al.,2003;Grassberger,2004).Ellesontété initialementinventées an d'estimer des intégrales omplexes sur des domaines de grandes dimensions (voir la méthode de Monte Carlo Ÿ 2.5.4 p. 85) en générant un

n

-é hantillon selon une densitéde probabilitédite ible, liéeà lafon tion obje tif.Ces méthodes ombinent élégammentlesheuristiquesdere uitsimuléetd'algorithmesgénétiques,puisqu'elles utilisent des mé anismes similaires aux mutations/séle tions pour diversier et

in-au ours de l'algorithme.