Les algorithmes ´evolutionnaires - M´etaheuristiques ` a base de population

2.5 M´etaheuristiques pour l’optimisation combinatoire

2.5.5 M´etaheuristiques ` a base de population

2.5.5.1 Les algorithmes ´evolutionnaires

Les algorithmes évolutionnaires (ou évolutionnistes) sont inspirés de la théorie de l’évolution des espèces vivantes initiée par C. Darwin [Darw 76] dans la seconde moitié du XIXe

siècle. C’est en réalité une grande famille d’algorithmes, car de nombreux chercheurs se sont indépendamment lancés dans l’adaptation des principes de la génétique à partir du milieu des années 50. Pour de plus amples détails, un historique et une classification très complète de ces travaux sont établis dans [Foge 06].

C’est à partir de 1965 et les travaux de I. Rechenberg [Rech 65, Rech 73] qu’apparaissent les premières méthodes d’optimisation stochastiques, basées sur des stratégies d’évolution. Con¸cues pour résoudre des problèmes d’optimisation continue, elle sont souvent considérées comme la première métaheuristique à avoir vu le jour [Beye 02]. L’idée de base de ces méthodes consiste à tout d’abord échantillonner une population d’individus (un ensemble de solutions), aléatoirement ou non. Dans le cas continu, une solution est définie comme un vecteur de valeurs réelles (qui sont les variables du problème). De ces individus parents, on ne va retenir que les meilleurs par une étape de sélection. Afin de générer une nouvelle génération d’individus (appelés enfants), ces individus subissent une mutation dans laquelle on va ajouter ou retrancher une valeur aléatoire (tirée selon une loi de distribution normale par exemple) à chaque variable qui les compose. Ce processus est répété itérativement jusqu’à un critère d’arrêt, les individus enfants devenant les parents de la génération suivante.

Parallèlement aux stratégies d’évolution, apparaissent les premiers travaux qui aboutiront à une autre branche d’algorithmes évolutionnaires : la programmation génétique, ou programmation évolutionnaire [Lang 02, Poli 08]. Elle s’applique au domaine du Machine Learning dans lequel on tente d’apprendre à un ordinateur à résoudre un problème de manière autonome, ou plus précisément à définir un programme répondant au mieux à une tâche demandée par l’uti- lisateur. Les premiers travaux en programmation génétique débutent dès la fin des années 1950 [Frie 58, Frie 59, Samu 63, Samu 67], mais le terme de programmation évolutionnaire apparaˆıt au sein des travaux de L. Fogel et al. [Foge 66]. Il faut attendre la fin des années 80 pour qu’un paradigme « standard » de la programmation génétique soit établi [Koza 92], formalisant les mé- canismes issus de travaux préliminaires : sélection, mutation, croisement (crossover en anglais) [Cram 85], paramétrage... Les premières applications sont cantonnées à des problèmes simples, car les algorithmes sont gourmands en temps de calcul. Il faut faire évoluer une population de solutions, qui sont des programmes dont les instructions peuvent être soit ajoutées, soit reti- rées, soit recombinées. En évoluant, ils deviennent en outre généralement plus volumineux et le calcul de la fitness — c’est-à-dire la qualité de la solution au regard du résultat attendu — monopolise alors davantage de temps CPU. La programmation génétique a donc dû attendre

l’avènement des ordinateurs modernes, rapides et capables de calculs parallèles (ce dernier cri- tère étant très intéressant dans les métaheuristiques à base de population, lorsque ses individus évoluent indépendamment) pour donner des résultats probants.

La troisième branche d’algorithmes évolutionnaires est celle des algorithmes génétiques. Elle est appliquée aux problèmes d’optimisation combinatoire (bien que des travaux aient adapté cette méthode aux problèmes continus [Chel 00, Haup 04]). Il s’agit de l’analogie la plus fidèle à la génétique réelle, puisqu’une solution est le plus souvent définie sous forme d’un chromosome ou génotype, qui est le vecteur de valeurs correspondant aux variables de décision du problème. Le phénotype associé est donc le résultat de l’instanciation de ces variables, qui se traduit par la qualité de la solution au problème d’optimisation. Au cours des générations, c’est directement sur le génotype que vont être appliquées les opérations de croisement et de mutation afin de faire évoluer la population. La sélection faite à l’issue des évolutions se fait sur l’analyse de la qualité du phénotype. Historiquement, les algorithmes génétiques sont apparus en 1975 avec les travaux de J.H. Holland [Holl 75], et se sont diversifiés par différentes méthodes. Le premier ouvrage de référence, qui jette les bases de l’algorithme génétique « standard », est le livre de D.E. Goldberg [Gold 89]. La section suivante synthétise l’approche classique de ces algorithmes. 2.5.5.1.b Les algorithmes génétiques

La figure 2.17 illustre le fonctionnement de base d’un algorithme g´en´etique.

Phase d’initialisation Dans un premier temps, on initialise l’algorithme en échantillonnant, de manière aléatoire ou non, une population de solutions (ou individus) de taille paramétrée. Ces individus sont ensuite évalués à l’aide d’une fonction de performance (ou fitness en anglais), pour déterminer leur qualité. A cet effet, on calcule généralement le coût des solutions. Cependant, si la taille de la population est grande ou si le nombre de générations est important, la phase d’évaluation peut se révéler coûteuse en temps de calcul (car répétée à chaque génération par la suite). Dans ce cas, le programmeur devra trouver une alternative en trouvant une fonction plus simple pour estimer la qualité d’un individu. A l’issue de cette évaluation, le processus d’évolution commence.

Reproduction Une boucle générationnelle commence par la phase de reproduction, en deux étapes. Dans un premier temps (phase de « duplication ») on sélectionne les meilleurs individus, qui sont recopiés d’autant plus souvent que leur performance est bonne. Puis ces solutions sont recombinées à l’aide d’un opérateur de croisement, en intervertissant par exemple une section commune de leur génotype (voir figure 2.18) afin de donner naissance à de nouveaux individus. Avec le croisement, on espère qu’au moins une solution fille tirera le meilleur parti des solutions parentes. Il est à noter qu’il est possible, à la différence de la génétique réelle, de croiser entre eux plus de deux individus.

Mutation Après le croisement, les solutions filles sont susceptibles de subir des mutations, c’est-à-dire des modifications libres de la solution. Cette phase a pour but de diversifier la recherche. Cependant, le taux d’individus subissant une mutation est généralement faible (par exemple 10%) afin de ne pas pénaliser l’apprentissage de l’algorithme.

Phase de remplacement Enfin, on va ´evaluer les individus de la nouvelle population et s´electionner les meilleurs individus dans l’ensemble de la population (parents et enfants) dans une

Figure_{2.17 – Schéma d’approche de l’algorithme génétique. Les étapes de croisements} et de mutations constituent la phase d’évolution des individus.

phase de remplacement afin d’en retirer les individus les moins performants. Sauf cas particulier, on veille à ce que la population des individus soit de taille constante au cours des générations (après remplacement). A l’issue d’une génération, si le critère d’arrêt n’est pas atteint (en général un nombre de générations défini comme paramètre de l’algorithme), le processus recommence.

Les algorithmes génétiques ont, comme les métaheuristiques précédemment présentées, fait l’objet d’hybridations avec d’autres méthodes d’optimisation, comme les méthodes de recherche locale. L’article [El M 06] dresse une liste assez complète de ces méthodes. Afin de traiter plus rapidement des problèmes de grande taille, ils ont également fait l’objet de travaux de paral- lélisation sur cartes graphiques, grâce aux technologies GP-GPU (General-Purpose Processing on Graphics Processing Units) permettant de programmer en C les processeurs graphiques. Une bibliographie complète de ces travaux est disponible en ligne [Hard 11].

2.5.5.1.c Application au TSP

Les algorithmes génétiques sont bien adaptés pour résoudre le problème du voyageur de commerce, et de nombreux travaux ont été menés sur le sujet. Le premier algorithme à avoir vu le jour est celui de R.M. Brady en 1985 [Brad 85], rapidement suivi par la communauté [Gold 85, Gref 85, Oliv 87]. Parallèlement, d’autres approches évolutionnaires ont également été appliquées au problème [Foge 88, Banz 90, Amba 91].

Pour ce problème, différentes modélisations ont été définies. La plus répandue utilise une représentation en chemin (où un tour est modélisé par un vecteur des villes qui seront succes- sivement empruntées). Cependant, cette modélisation pose des problèmes quant à la mise en œuvre de l’opération de croisement. Prenons un exemple simple : si S1 = {1, 5, 6, 3, 2, 4, 7} et

S2 = {1, 4, 7, 3, 2, 6, 5} sont croisées à l’aide d’un point de coupure après la troisième ville, alors

les solutions filles seront S₁′ = {1, 5, 6, 3, 2, 6, 5} et S′₂ = {1, 4, 7, 3, 2, 4, 7}. On remarque que ces solutions sont invalides, car elles passent deux fois par certaines villes, et en excluent d’autres. Différents opérateurs de croisement ont donc été imaginés. Une liste complète de ces derniers est présentée dans [Larr 99], qui dresse un comparatif expérimental. Cet article décrit également

Figure _{2.18 – Illustration d’une ´etape de croisement entre deux individus. (a) Croise-} ment simple. (b) Croisement double.

différents opérateurs de mutations, et les autres représentations possibles (et leurs opérateurs associés), comme la représentation par adjacence [Gref 85], qui consiste en un vecteur dans lequel la position des villes (autrement dit leur index) détermine la ville précédente dans le tour. Par exemple, la solution S = {(3, 5, 7, 6, 4, 8, 2, 1} désigne le tour 1 → 3 → 7 → 2 → 5 → 4 → 6 → 8. Partant de 1 (nécessairement), on vient lire la 1e

valeur de S qui est 3 : la ville suivant 1 dans le tour est donc 3. Puis on va lire la 3e

valeur de S qui est 7 : 7 est donc le successeur de 3 dans le tour. Puis on lit la 7e

valeur qui est 2... La modélisation par adjacence a une particularité : un même tour ne peut être représenté que de deux fa¸cons différentes (un par sens de parcours) car on part toujours de la ville 1. Dans une représentation en chemin, un même tour peut être représenté de 2n manières différentes (n étant le nombre de villes du problème).

Aujourd’hui, les algorithmes génétiques sont capables de résoudre des instances de TSP de plusieurs milliers de nœuds.

Dans le document Des métaheuristiques pour le guidage d’un solveur de contraintes dédié à la planification automatisée de véhicules (Page 66-69)