Diff´ erents types de m´ etaheuristiques

1.7 Int´ erieurs meubl´ es

2.1.2 Diff´ erents types de m´ etaheuristiques

2.1.2.1 M´ethodes de voisinage

Recuit simulé (Simulated Annealing) La méthode du recuit simulé [KGV83, MRR+_53]

s’inspire d’un phénomène physique utilisé en métallurgie, le recuit. Afin d’améliorer la qualité d’un solide, la matière est porté à très haute température, bien au-delà de la température de fusion, puis la matière est ramenée par palier à la température de solidification, en lui laissant le temps de parvenir à un équilibre thermodynamique à chaque étape.

Le mécanisme de parcours associé à cette méthode consiste à réaliser un tirage aléatoire au sein du voisinage de la configuration courante. Si la configuration trouvée améliore (au sens de la fonction de coût) la configuration courante, le mouvement est effectué. Sinon, le mouvement est

27_{Plateau : ensemble de configurations de mˆ}_{eme coˆ}_{ut, connexes par voisinage.}

effectué avec une probabilité suivant la loi de probabilité définie par p(∆ϕ, T ) = e−∆ϕT où T est un paramètre de contrôle (la température du système) et ∆ϕ la différence entre la configuration courante et la configuration tirée aléatoirement au sens de la fonction de coût ϕ.

Le recuit simulé peut être vu comme une version étendue de la méthode de descente. L’amélio- ration principale consiste en la possibilité (contrôlée) d’accepter des mouvements qui dégradent la fonction de coût. Cette dégradation est acceptée en fonction de son importance et de la température du système. La température est définie par une fonction décroissante qui contrôle l’évolution du système. L’algorithme s’arrête lorsque aucune configuration n’a été acceptée depuis un certain temps, depuis un certain nombre d’itérations, ou bien lorsque la température atteint la valeur de solidification (généralement zéro). Il a été prouvé qu’à la limite (i.e. si la température descend infiniment lentement) cette méthode est complète.

Les algorithmes d’acceptation avec seuil (Threshold algorithms) Ces algorithmes [DS90] sont des variantes du recuit simulé. Ils en diffèrent par la fonction d’acceptation de dégradation. Pour le recuit simulé, ce choix est fait selon une loi de probabilité. Pour cette méthode, il est fait de fa¸con déterministe. L’acceptation d’un mouvement est validée par la satisfaction de l’inégalité suivante : r(s, s0) < Tk. Dans le cas le plus simple, r(s, s0) = ∆ϕ et

le seuil Tk a la même fonction que la température dans le cas du recuit simulé. Il est initié à

une valeur élevée puis décroˆıt progressivement après un certain nombre (variable) d’itérations. Les seuils forment une suite décroissante avec lim Tk→ 0 afin de diminuer au cours du temps la

possibilité d’accepter une configuration qui dégrade la fonction de coût.

Méthodes de bruitage La méthode de bruitage [CH93] s’applique à des problèmes dont les configurations portent sur des domaines continus. Elle fait appel à une notion de bruitage de la donnée qui est effectué en ajoutant à chaque réel de la donnée initiale une composante calculée comme le produit de trois termes :

1. une fonction aléatoire à valeur sur l’intervalle [0, 1], 2. un paramètre qui contrôle le niveau de bruit,

3. le plus grand des r´eels concern´es, dans le but de normaliser le niveau de bruit par rapport `

a la donn´ee.

A chaque étape, il est effectué une descente par rapport à la donnée bruitée et le niveau de bruit est progressivement diminué. Il existe des variantes pour cette méthode, par exemple il

est possible d’effectuer à chaque étape une descente sur la donnée non bruitée et de sélectionner le meilleur candidat. Il est également envisageable de remplacer régulièrement la configuration courante par la meilleure trouvée depuis l’initialisation de la méthode.

L’utilisation du bruitage permet à la recherche de ne pas rester bloquée dans le voisinage d’un minimum local (possibilité de sortir d’une vallée).

Recherche tabou Cette méthode [Glo86, Han86] fait appel à des concepts et mécanismes généraux pour exécuter la recherche dans l’ensemble des configurations de manière plus intelli- gente.

Soit un problème de placement en deux dimensions. L’image de gauche représente l’étape courante. Le carré en noir correspond à la configuration courante. La caractéristique choisie pour figurer dans la liste tabou est l’ordonnée.

La figure de droite met en ´evidence les configurations interdites par la liste tabou. On constate que quatre configurations non test´ees sont interdites.

Figure 2.2. Importance du choix de la caract´eristique tabou.

Alors que la méthode du recuit simulé tire aléatoirement une configuration dans le voisinage de la configuration courante, la recherche tabou examine un échantillon de configurations du voisinage (potentiellement toutes) et réalise le mouvement en direction de la meilleure configuration de cet ´

echantillon. Ce mouvement peut conduire à dégrader la fonction de coût, ce qui permet de ne pas stopper la recherche sur le premier optimum local rencontré. Néanmoins, cette heuristique de choix est extrêmement vulnérable aux cycles : si deux configurations voisines forment un plateau, la recherche ne sortira jamais de ce cycle de longueur 2. Pour lever cette limitation, il a ´

eté introduit le concept de liste tabou qui mémorise les k dernières configurations visitées par la recherche. Comme l’exprime le terme tabou, ces configurations ne pourront pas être sélectionnées `

a nouveau au cours de la recherche. Cette liste permet de s’affranchir des cycles de longueur inférieure ou égale à k. La valeur de k doit être choisie en considérant le problème à résoudre, elle peut aussi être modifiée dynamiquement durant la recherche. Comme pour le recuit simulé, dans le cas limite (i.e. k tend vers le cardinal de l’espace de recherche), la recherche tabou s’apparente `

Dans un problème de placement gérant un millier d’objets, chacun défini par six degrés de liberté (trois pour le positionnement, trois pour l’orientation), la sauvegarde dans la liste tabou peut très rapidement être trop coûteuse en espace mémoire et en temps de calcul. Pour éviter ce problème, la liste tabou ne stocke pas les configurations complètes mais des caractéristiques de ces configurations. Concrètement, après qu’un mouvement ait été effectué, on stocke la variable modifiée par ce mouvement, ainsi que son ancienne valeur. Ce couple est mémorisé, et devient donc interdit pour les k prochains mouvements. L’ancienne configuration ne pourra plus être visitée, ainsi que toutes les configurations qui affectent la valeur tabou à la variable tabou. Nous avons vu (cf. Figure 2.2) que la sauvegarde des caractéristiques interdisait de facto l’accès `

a certaines configurations non testées. Pour assouplir cette restriction, il a été développé un mécanisme particulier, l’aspiration qui permet de lever un statut tabou sans introduire un risque de cycle dans la recherche. La manière la plus simple consiste à lever le statut tabou si le mouvement conduit à une configuration de qualité supérieure à la meilleure configuration courante (au sens de la fonction de coût).

Il a été introduit d’autres techniques pour améliorer la recherche tabou, citons :

– l’intensification qui consiste à mémoriser les critères communs aux meilleures configurations pour orienter la recherche préférentiellement dans leurs directions,

– la diversification, qui, au contraire, tend `a diriger la recherche vers des zones inexplor´ees de l’espace des configurations.

La recherche tabou peut être caractérisée par une stratégie agressive de recherche (par la sélection d’un des meilleurs mouvements), ainsi que par les nombreuses techniques développées pour améliorer la recherche. Cette diversité a un prix, qui est l’obligation d’adapter la recherche au problème à résoudre.

2.1.2.2 Algorithmes ´evolutifs

Dans cette catégorie de métaheuristiques, on retrouve tous les algorithmes basés sur le pro- cessus naturel (darwiniste) d’évolution du vivant. Un algorithme évolutif typique réunit trois composants :

1. une population qui regroupe plusieurs individus (en optimisation combinatoire classique : configuration du probl`eme),

2. une fonction d’adaptation (fitness) qui ´evalue la performance d’un individu par rapport au milieu (en optimisation combinatoire classique : fonction de coˆut),

3. un mécanisme d’évolution, composé de plusieurs opérateurs de modification et de sélection.

Typiquement, un algorithme évolutif débute avec une population (généralement obtenue de fa¸con aléatoire), puis répète la boucle suivante (le terme employé est génération à la place de celui habituel d’itération) :

1. ´evaluer chaque individu de la population, 2. s´electionner des individus,

3. produire des nouveaux individus par recombinaison des individus s´electionn´es.

Les différences principales entre les algorithmes évolutifs et les méthodes classiques d’optimisation combinatoire sont les phases de sélection et d’évolution. La sélection permet de choisir les meilleurs individus et c’est à partir de ceux-ci que l’on construit la génération suivante. On peut la rapprocher du mécanisme d’intensification de la recherche tabou appliqué de fa¸con massive- ment parallèle. L’évolution repose sur deux principaux opérateurs, la recombinaison qui combine plusieurs individus parents pour créer des individus enfants pour la génération suivante, et la mutation qui altère légèrement certains individus.

Les algorithmes évolutifs les plus souvent rencontrés sont les algorithmes génétiques (présentés en 1.7.3.2.0) et les stratégies d’évolution [Rec73].

2.1.2.3 M´ethodes hybrides

Les méthodes hybrides combinent des méthodes issues de la recherche locale classique (descente), des métaheuristiques locales et des algorithmes d’évolution.

Algorithmes mémétiques La mémétique est l’étude des mèmes, autrement dit d’entités réplicatives d’information. Le terme de mémétique a été proposé pour la première fois par Richard Dawkins dans son œuvre The Selfish Gene (1976), et provient d’une association entre gène et mimesis (du grec ”imitation”).

Cette approche [Mos89] combine la puissance de recherche des méthodes de voisinage avec celle de recombinaison des algorithmes évolutifs. Un algorithme mémétique utilise des méthodes de voisinage sur les individus d’une population pendant un certain nombre d’itérations ou jusqu’à la découverte d’un ensemble d’optima locaux, puis utilise un mécanisme de recombinaison adapté au problème pour créer une nouvelle population.

Cette méthode, bien que très puissante, souffre de défauts rédhibitoires : les temps de calcul peuvent devenir prohibitifs lors de l’utilisation de population de grande taille, ce problème pouvant être contourné par l’utilisation de machines distribuées qui sont bien adaptées aux algorithmes mémétiques.

GRASP (Greedy Randomized Adaptive Search Procedure) Cette méthode hybride [FR89] cherche à combiner les avantages des heuristiques gloutonnes, de la recherche aléatoire et des méthodes de voisinage. Un algorithme GRASP peut être défini comme une boucle com- portant deux étapes :

1. la construction d’une configuration de fa¸con it´erative (cf. 2.1.1.1), en choisissant `a chaque ´

etape la valeur `a instancier dans le voisinage de fa¸con al´eatoire,

2. une descente (cf. 2.1.1.2) est effectu´ee pour am´eliorer cette configuration.

Ces deux étapes sont répétées jusqu’à satisfaction de la condition d’arrêt. Une fois cette condition satisfaite, la procédure retourne la meilleure configuration trouvée. Les paramètres de cette méthode sont la méthode de détermination du voisinage ainsi que le nombre d’itérations auto- risées.

Dans le document Modélisation automatique de zones urbaines (Page 89-94)