• Aucun résultat trouvé

5.4 Pr´ eservation et cr´ eation continue de diversit´ e

5.4.4 Id´ ees similaires dans la litt´ erature

5.4.4.1 Strat´egies de diversification en optimisation combinatoire

Des strat´egies permettant d’assurer la diversit´e peuvent ˆetre trouv´es dans de nom- breuses directions de recherche. Dans les algorithmes g´en´etiques “diversity-guided” ou “diversity-controlling” [Ursem, 2002; Shimodaira, 1997; Zhu, 2003], on emploie un indi- cateur global de diversit´e afin de choisir les op´erateurs g´en´etiques et leur probabilit´e d’ap- plication. Par exemple, [Zhu, 2003] utilise un indicateur bas´e sur la distance moyenne de Hamming afin de r´egler les taux de mutation et de croisement. [Ursem, 2002] em- ploie des op´erateurs d’intensification (s´election et recombinaison) quand un indicateur de diversit´e est ´elev´e, ou des op´erateurs de diversification (mutation) quand la diversit´e est faible. Dans cette piste de recherche, il n’y a pas vraiment besoin d’une mesure de distance entre les individus, mais seulement d’un indicateur global de diversit´e de la population. Par exemple, [Ursem, 2002] utilise un indicateur de dispersion statistique autour de la valeur moyenne sur chaque variable. Cela s’est r´ev´el´e particuli`erement efficace en optimi- sation continue. En g´en´eral, la diversit´e de population peut ˆetre mesur´ee par de nombreux indicateurs, selon le champ d’application (voir les r´ef´erences dans [Zhu, 2003, p. 1]).

Une ´etude `a base de distances est l’algorithme MA|PM [S¨orensen and Sevaux, 2006], qui utilise aussi une proc´edure de rejet d’enfants. Dans MA|PM, si un enfant ne respecte pas les crit`eres de diversit´e, il est imm´ediatement mut´e. Pour Evo–Div, l’approche est diff´erente : nous pr´ef´erons r´ep´eter le processus naturel de reproduction jusqu’`a ce qu’il apporte une diversit´e “naturelle” `a la population. Dans Evo–Div, la qualit´e n’´etant pas sacrifi´ee au profit de la diversit´e, notre approche permet aussi de faire de la concurrence aux meilleurs algorithmes pour notre probl`eme de coloration.

Nous mentionnons aussi que, dans les algorithmes m´em´etiques, il est classique d’accor- der de l’attention au fait que l’enfant doit ˆetre suffisamment diff´erent de ses parents. Puis- qu’une recherche locale est employ´ee, il y a un risque ´elev´e que la combinaison de deux pa- rents proches m`ene `a des solutions semblables. Pour ´eviter cela, une id´ee pertinente consiste `

a toujours croiser des parents suffisamment ´eloign´es. De plus, on peut ´egalement souhai- ter g´en´erer l’enfant `a ´egale distance de ses deux parents – voir [Galinier and Hao, 1999; Tagawa et al., 1999] pour des applications de ce principe en coloration. Des techniques de ce type peuvent ˆetre trouv´ees dans de nombreux probl`emes d’optimisation combinatoires, e.g. le probl`eme de voyageur de commerce, voir le Distance Preserving Crossover [Freis- leben and Merz, 1996]. Cependant, notre croisement n’est pas pr´evu pour assurer des distances ´egales entre l’enfant et ses parents.

La “distance crowding” introduite dans [Deb et al., 2002] est utilis´ee pour trier les individus en optimisation combinatoire multi-objectif. Une diff´erence essentielle est que cette “distance crowding” est mesur´ee dans l’espace de la fonction objectif, i.e. elle est

5.4 Pr´eservation et cr´eation continue de diversit´e

fond´ee sur les diff´erences entre les valeurs de la fonction d’adaptation [Deb et al., 2002; Coello et al., 2004; Rajagopalan et al., 2008].

5.4.4.2 Formation de niches en optimisation continue multimodale

L’optimisation continue multimodale a pour objectif de trouver tous les optima globaux d’une fonction. Dans ce contexte, plusieurs m´ethodes de niche (e.g. “crowding” ou “fitness sharing” [Mahfoud, 1995a; Mahfoud, 1995b; Smith et al., 1993; Deb and Goldberg, 1989; Miller and Shaw, 1996; Goldberg and Richardson, 1987; Beasley et al., 1993; De Jong, 1975; Cede˜no and Vemuri, 1999; Smith et al., 1993]) ont ´et´e introduites pour la « formation et la pr´eservation de sous-populations » stables [Mahfoud, 1995a; Mahfoud, 1995b]. Chaque sous-population est concern´ee par un pic de la fonction multimodale et peut ˆetre interpr´et´ee intuitivement comme une sous-esp`ece qui exploite une “niche ´ecologique”.

Par rapport `a cette vision, en optimisation discr`ete il nous semble d´elicat d’encourager la population `a se sp´ecialiser sur des niches fixes, le processus de recherche devrait pas- ser en permanence d’une r´egion `a une autre. Pour les fonctions multimodales, les niches correspondent aux quelques pics de la fonction objectif. De cette fa¸con, le croisement `

a l’int´erieur d’une seule sous-population est mˆeme encourag´e [Miller and Shaw, 1996; Cede˜no and Vemuri, 1999] (croisement intra-niche). Dans un algorithme m´em´etique, le croisement “intra-niche” est pr´ef`erable, car il permet de d´ecouvrir de nouvelles r´egions. Notre but est de faire ´evoluer la distribution d’une petite population tr`es rapidement afin d’explorer de nombreuses “niches” diff´erentes au fil du temps, i.e. pour cr´eer continuelle- ment de la diversit´e tout au long de la recherche.

Le “Fitness sharing” [Goldberg and Richardson, 1987] est une technique de niche tr`es populaire bas´ee sur le principe suivant : si deux individus sont distants d’au moins σshare(le rayon de niche, ou “sharing parameter”), alors leurs valeurs d’adaptation sont mutuellement p´enalis´ees [Goldberg and Richardson, 1987; Miller and Shaw, 1996; Smith et al., 1993; Deb and Goldberg, 1989; Beasley et al., 1993]. Bien que cette approche soit diff´erente de notre strat´egie, un point commun est la d´efinition d’un rayon de niche appropri´e – similaire `

a notre ´ecart minimum cible R. Si notre strat´egie refuse l’insertion d’enfants sur un rayon de R autour de tout individu, le “fitness sharing” ne fait que p´enaliser les valeurs de la fonction d’adaptation pour des individus distants de moins de R. Dans les deux cas, si un rayon inappropri´e est utilis´e, l’efficacit´e est consid´erablement diminu´ee. Nous avons trouv´e une bonne valeur de rayon en utilisant une analyse du groupement des meilleurs individus ; en “fitness sharing”, des th´eories sur le rayon sont disponibles (voir [Beasley et al., 1993, §5.1]) et elles s’appuient souvent sur des hypoth`eses sur la fonction continue multimodale (disant, par exemple, qu’il y a un nombre a-priori connu de pics uniform´ement r´epartis).

Une autre m´ethode de niche est le “crowding” (e.g. de Jong’s crowding [De Jong, 1975], Mahfoud’s deterministic crowding [Mahfoud, 1995a], voir aussi [Cede˜no and Vemuri, 1999]) o`u l’on essaie de construire des sous-populations de niche « en for¸cant de nouveaux individus `a remplacer ceux qui sont similaires g´en´etiquement » [Smith et al., 1993]. De cette mani`ere, un nouvel individu remplace toujours un individu de sa propre sous-population et il minimise le changement sur la population existante, i.e. il pr´eserve la diversit´e d´ej`a existante. Cela peut rappeler notre remplacement direct. Mais, tandis que notre op´eration

induit ´egalement des niches, les niches stables ne sont pas recommand´ees dans un espace discret. Le remplacement standard d’Evo–Div choisit l’individu ´elimin´e ind´ependamment de la position de l’enfant dans l’espace de recherche ; la distribution de la population encourage de niches en niches `a ´evoluer en permanence .

Pour conclure, le contrˆole explicite de population utilisant des mesures de distance semble avoir re¸cu relativement peu d’attention en optimisation discr`ete mono objectif. Cependant, cette id´ee peut ˆetre tr`es utile pour am´eliorer les algorithmes m´em´etiques avec de petites populations. Cette approche est d´ej`a consid´er´ee parmi les plus efficaces pour de nombreux probl`emes d’optimisation combinatoire. Le calcul de |P op|2 distances par g´en´eration est une limitation dans les algorithmes de niche [Miller and Shaw, 1996; Smith et al., 1993], mais cela ne pose pas de probl`emes dans l’approche m´em´etique, o`u la recherche locale est la phase qui consomme le plus de temps. Dans un algorithme multi- modal, les techniques de niche sont ´egalement utilis´ees pour faire de l’intensification (car on garde des sous-populations stables sur les niches), mais, dans l’algorithme m´em´etique, l’intensification peut ˆetre assur´ee efficacement par la recherche locale. Dans notre cas, la politique de diversification peut se concentrer uniquement sur le guidage de la recherche vers de nouvelles r´egions.

5.5

R´esultats et discussions