• Aucun résultat trouvé

Diff´ erents types de m´ etaheuristiques

Dans le document Modélisation automatique de zones urbaines (Page 89-94)

1.7 Int´ erieurs meubl´ es

2.1.2 Diff´ erents types de m´ etaheuristiques

2.1.2.1 M´ethodes de voisinage

Recuit simul´e (Simulated Annealing) La m´ethode du recuit simul´e [KGV83, MRR+53]

s’inspire d’un ph´enom`ene physique utilis´e en m´etallurgie, le recuit. Afin d’am´eliorer la qualit´e d’un solide, la mati`ere est port´e `a tr`es haute temp´erature, bien au-del`a de la temp´erature de fusion, puis la mati`ere est ramen´ee par palier `a la temp´erature de solidification, en lui laissant le temps de parvenir `a un ´equilibre thermodynamique `a chaque ´etape.

Le m´ecanisme de parcours associ´e `a cette m´ethode consiste `a r´ealiser un tirage al´eatoire au sein du voisinage de la configuration courante. Si la configuration trouv´ee am´eliore (au sens de la fonction de coˆut) la configuration courante, le mouvement est effectu´e. Sinon, le mouvement est

27Plateau : ensemble de configurations de mˆeme coˆut, connexes par voisinage.

effectu´e avec une probabilit´e suivant la loi de probabilit´e d´efinie par p(∆ϕ, T ) = e−∆ϕT o`u T est un param`etre de contrˆole (la temp´erature du syst`eme) et ∆ϕ la diff´erence entre la configuration courante et la configuration tir´ee al´eatoirement au sens de la fonction de coˆut ϕ.

Le recuit simul´e peut ˆetre vu comme une version ´etendue de la m´ethode de descente. L’am´elio- ration principale consiste en la possibilit´e (contrˆol´ee) d’accepter des mouvements qui d´egradent la fonction de coˆut. Cette d´egradation est accept´ee en fonction de son importance et de la temp´erature du syst`eme. La temp´erature est d´efinie par une fonction d´ecroissante qui contrˆole l’´evolution du syst`eme. L’algorithme s’arrˆete lorsque aucune configuration n’a ´et´e accept´ee depuis un certain temps, depuis un certain nombre d’it´erations, ou bien lorsque la temp´erature atteint la valeur de solidification (g´en´eralement z´ero). Il a ´et´e prouv´e qu’`a la limite (i.e. si la temp´erature descend infiniment lentement) cette m´ethode est compl`ete.

Les algorithmes d’acceptation avec seuil (Threshold algorithms) Ces algorithmes [DS90] sont des variantes du recuit simul´e. Ils en diff`erent par la fonction d’acceptation de d´egradation. Pour le recuit simul´e, ce choix est fait selon une loi de probabilit´e. Pour cette m´ethode, il est fait de fa¸con d´eterministe. L’acceptation d’un mouvement est valid´ee par la sa- tisfaction de l’in´egalit´e suivante : r(s, s0) < Tk. Dans le cas le plus simple, r(s, s0) = ∆ϕ et

le seuil Tk a la mˆeme fonction que la temp´erature dans le cas du recuit simul´e. Il est initi´e `a

une valeur ´elev´ee puis d´ecroˆıt progressivement apr`es un certain nombre (variable) d’it´erations. Les seuils forment une suite d´ecroissante avec lim Tk→ 0 afin de diminuer au cours du temps la

possibilit´e d’accepter une configuration qui d´egrade la fonction de coˆut.

M´ethodes de bruitage La m´ethode de bruitage [CH93] s’applique `a des probl`emes dont les configurations portent sur des domaines continus. Elle fait appel `a une notion de bruitage de la donn´ee qui est effectu´e en ajoutant `a chaque r´eel de la donn´ee initiale une composante calcul´ee comme le produit de trois termes :

1. une fonction al´eatoire `a valeur sur l’intervalle [0, 1], 2. un param`etre qui contrˆole le niveau de bruit,

3. le plus grand des r´eels concern´es, dans le but de normaliser le niveau de bruit par rapport `

a la donn´ee.

A chaque ´etape, il est effectu´e une descente par rapport `a la donn´ee bruit´ee et le niveau de bruit est progressivement diminu´e. Il existe des variantes pour cette m´ethode, par exemple il

est possible d’effectuer `a chaque ´etape une descente sur la donn´ee non bruit´ee et de s´electionner le meilleur candidat. Il est ´egalement envisageable de remplacer r´eguli`erement la configuration courante par la meilleure trouv´ee depuis l’initialisation de la m´ethode.

L’utilisation du bruitage permet `a la recherche de ne pas rester bloqu´ee dans le voisinage d’un minimum local (possibilit´e de sortir d’une vall´ee).

Recherche tabou Cette m´ethode [Glo86, Han86] fait appel `a des concepts et m´ecanismes g´en´eraux pour ex´ecuter la recherche dans l’ensemble des configurations de mani`ere plus intelli- gente.

Soit un probl`eme de placement en deux dimensions. L’image de gauche repr´esente l’´etape courante. Le carr´e en noir correspond `a la configuration courante. La caract´eristique choisie pour figurer dans la liste tabou est l’ordonn´ee.

La figure de droite met en ´evidence les configurations interdites par la liste tabou. On constate que quatre configurations non test´ees sont interdites.

Figure 2.2. Importance du choix de la caract´eristique tabou.

Alors que la m´ethode du recuit simul´e tire al´eatoirement une configuration dans le voisinage de la configuration courante, la recherche tabou examine un ´echantillon de configurations du voisinage (potentiellement toutes) et r´ealise le mouvement en direction de la meilleure configuration de cet ´

echantillon. Ce mouvement peut conduire `a d´egrader la fonction de coˆut, ce qui permet de ne pas stopper la recherche sur le premier optimum local rencontr´e. N´eanmoins, cette heuristique de choix est extrˆemement vuln´erable aux cycles : si deux configurations voisines forment un plateau, la recherche ne sortira jamais de ce cycle de longueur 2. Pour lever cette limitation, il a ´

et´e introduit le concept de liste tabou qui m´emorise les k derni`eres configurations visit´ees par la recherche. Comme l’exprime le terme tabou, ces configurations ne pourront pas ˆetre s´electionn´ees `

a nouveau au cours de la recherche. Cette liste permet de s’affranchir des cycles de longueur inf´erieure ou ´egale `a k. La valeur de k doit ˆetre choisie en consid´erant le probl`eme `a r´esoudre, elle peut aussi ˆetre modifi´ee dynamiquement durant la recherche. Comme pour le recuit simul´e, dans le cas limite (i.e. k tend vers le cardinal de l’espace de recherche), la recherche tabou s’apparente `

Dans un probl`eme de placement g´erant un millier d’objets, chacun d´efini par six degr´es de libert´e (trois pour le positionnement, trois pour l’orientation), la sauvegarde dans la liste tabou peut tr`es rapidement ˆetre trop coˆuteuse en espace m´emoire et en temps de calcul. Pour ´eviter ce probl`eme, la liste tabou ne stocke pas les configurations compl`etes mais des caract´eristiques de ces configurations. Concr`etement, apr`es qu’un mouvement ait ´et´e effectu´e, on stocke la variable modifi´ee par ce mouvement, ainsi que son ancienne valeur. Ce couple est m´emoris´e, et devient donc interdit pour les k prochains mouvements. L’ancienne configuration ne pourra plus ˆetre visit´ee, ainsi que toutes les configurations qui affectent la valeur tabou `a la variable tabou. Nous avons vu (cf. Figure 2.2) que la sauvegarde des caract´eristiques interdisait de facto l’acc`es `

a certaines configurations non test´ees. Pour assouplir cette restriction, il a ´et´e d´evelopp´e un m´ecanisme particulier, l’aspiration qui permet de lever un statut tabou sans introduire un risque de cycle dans la recherche. La mani`ere la plus simple consiste `a lever le statut tabou si le mou- vement conduit `a une configuration de qualit´e sup´erieure `a la meilleure configuration courante (au sens de la fonction de coˆut).

Il a ´et´e introduit d’autres techniques pour am´eliorer la recherche tabou, citons :

– l’intensification qui consiste `a m´emoriser les crit`eres communs aux meilleures configurations pour orienter la recherche pr´ef´erentiellement dans leurs directions,

– la diversification, qui, au contraire, tend `a diriger la recherche vers des zones inexplor´ees de l’espace des configurations.

La recherche tabou peut ˆetre caract´eris´ee par une strat´egie agressive de recherche (par la s´election d’un des meilleurs mouvements), ainsi que par les nombreuses techniques d´evelopp´ees pour am´eliorer la recherche. Cette diversit´e a un prix, qui est l’obligation d’adapter la recherche au probl`eme `a r´esoudre.

2.1.2.2 Algorithmes ´evolutifs

Dans cette cat´egorie de m´etaheuristiques, on retrouve tous les algorithmes bas´es sur le pro- cessus naturel (darwiniste) d’´evolution du vivant. Un algorithme ´evolutif typique r´eunit trois composants :

1. une population qui regroupe plusieurs individus (en optimisation combinatoire classique : configuration du probl`eme),

2. une fonction d’adaptation (fitness) qui ´evalue la performance d’un individu par rapport au milieu (en optimisation combinatoire classique : fonction de coˆut),

3. un m´ecanisme d’´evolution, compos´e de plusieurs op´erateurs de modification et de s´election.

Typiquement, un algorithme ´evolutif d´ebute avec une population (g´en´eralement obtenue de fa¸con al´eatoire), puis r´ep`ete la boucle suivante (le terme employ´e est g´en´eration `a la place de celui habituel d’it´eration) :

1. ´evaluer chaque individu de la population, 2. s´electionner des individus,

3. produire des nouveaux individus par recombinaison des individus s´electionn´es.

Les diff´erences principales entre les algorithmes ´evolutifs et les m´ethodes classiques d’optimisa- tion combinatoire sont les phases de s´election et d’´evolution. La s´election permet de choisir les meilleurs individus et c’est `a partir de ceux-ci que l’on construit la g´en´eration suivante. On peut la rapprocher du m´ecanisme d’intensification de la recherche tabou appliqu´e de fa¸con massive- ment parall`ele. L’´evolution repose sur deux principaux op´erateurs, la recombinaison qui combine plusieurs individus parents pour cr´eer des individus enfants pour la g´en´eration suivante, et la mutation qui alt`ere l´eg`erement certains individus.

Les algorithmes ´evolutifs les plus souvent rencontr´es sont les algorithmes g´en´etiques (pr´esent´es en 1.7.3.2.0) et les strat´egies d’´evolution [Rec73].

2.1.2.3 M´ethodes hybrides

Les m´ethodes hybrides combinent des m´ethodes issues de la recherche locale classique (descente), des m´etaheuristiques locales et des algorithmes d’´evolution.

Algorithmes m´em´etiques La m´em´etique est l’´etude des m`emes, autrement dit d’entit´es r´eplicatives d’information. Le terme de m´em´etique a ´et´e propos´e pour la premi`ere fois par Richard Dawkins dans son œuvre The Selfish Gene (1976), et provient d’une association entre g`ene et mimesis (du grec ”imitation”).

Cette approche [Mos89] combine la puissance de recherche des m´ethodes de voisinage avec celle de recombinaison des algorithmes ´evolutifs. Un algorithme m´em´etique utilise des m´ethodes de voisinage sur les individus d’une population pendant un certain nombre d’it´erations ou jusqu’`a la d´ecouverte d’un ensemble d’optima locaux, puis utilise un m´ecanisme de recombinaison adapt´e au probl`eme pour cr´eer une nouvelle population.

Cette m´ethode, bien que tr`es puissante, souffre de d´efauts r´edhibitoires : les temps de calcul peuvent devenir prohibitifs lors de l’utilisation de population de grande taille, ce probl`eme pouvant ˆetre contourn´e par l’utilisation de machines distribu´ees qui sont bien adapt´ees aux algorithmes m´em´etiques.

GRASP (Greedy Randomized Adaptive Search Procedure) Cette m´ethode hybride [FR89] cherche `a combiner les avantages des heuristiques gloutonnes, de la recherche al´eatoire et des m´ethodes de voisinage. Un algorithme GRASP peut ˆetre d´efini comme une boucle com- portant deux ´etapes :

1. la construction d’une configuration de fa¸con it´erative (cf. 2.1.1.1), en choisissant `a chaque ´

etape la valeur `a instancier dans le voisinage de fa¸con al´eatoire,

2. une descente (cf. 2.1.1.2) est effectu´ee pour am´eliorer cette configuration.

Ces deux ´etapes sont r´ep´et´ees jusqu’`a satisfaction de la condition d’arrˆet. Une fois cette condi- tion satisfaite, la proc´edure retourne la meilleure configuration trouv´ee. Les param`etres de cette m´ethode sont la m´ethode de d´etermination du voisinage ainsi que le nombre d’it´erations auto- ris´ees.

Dans le document Modélisation automatique de zones urbaines (Page 89-94)