• Aucun résultat trouvé

5.4 Pr´ eservation et cr´ eation continue de diversit´ e

5.4.2 Rejet des enfants

Puisque le premier objectif de la strat´egie de diversit´e est de maintenir un ´ecart mini- mum cible, nous ins´erons un nouveau individu dans la population seulement si sa distance `

R-sph`ere d’un individu existant). Par cons´equent, si un enfant O est situ´e `a une distance inf´erieure `a R d’un individu existant I, la proc´edure de rejet d´etecte ce probl`eme (la rou- tine acceptEnfant retourne False en Algorithme 5.1) et, de plus, elle effectue une des actions suivantes :

1. rejeter O, si f (O) > f (I) – i.e. si O est plus mauvais que I ; 2. remplacer directement I avec O, si f (O) ≤ f (I).

Toutefois, dans les deux cas, nous consid´erons que O n’est pas satisfaisant car il n’ap- porte pas de diversit´e `a la population. Dans cette situation, Evo–Div ne passe pas `a la g´en´eration suivante et reprend tout le processus de reproduction – voir la boucle Repeat- Until `a l’´etape 2.B. d’Algorithme 5.1. Ce processus de reproduction est r´ep´et´e jusqu’`a ce que l’enfant r´esultant soit suffisamment distant de tous les individus existants, voir ´

egalement la Section 5.4.2.2.

5.4.2.1 D´etermination de l’´ecart minimum cible

Une question d´elicate dans cette proc´edure est de d´eterminer une valeur appropri´ee de l’´ecart minimum cible – not´e R. Rappelons que SR(I) repr´esente la sph`ere de rayon R centr´ee en I, i.e. l’ensemble d’individus I0 ∈ Ω tels que d(I, I0) ≤ R – voir Definition 4.1. Si I est un individu de qualit´e, une valeur pertinente de R devrait impliquer que tous les autres individus de qualit´e deSR(I) partagent avec I des classes importantes de couleur. Ainsi, ces individus ne pourraient pas apporter de nouvelles informations (e.g. classes essentielles de couleurs) dans la population. Nous devons d´eterminer la valeur maximum de R telle que tous les individus structurellement ind´ependants de I soient situ´es en dehors de SR(I).

Comme tous les individus de la population sont des minima locaux obtenus avec la recherche Tabou, nous utilisons la valeur de R d´etermin´ee `a partir de l’analyse de chemin d’exploration de la recherche Tabou. Rappelons (Chapitre 3) ce sc´enario classique : partant d’un minimum local initial I0, la recherche Tabou visite une s´equence de colorations de qualit´e I0, I1, I2, . . . IN (i.e. nous ne comptabilisons que les individus qui v´erifient f (Ii) ≤ f (I0), ∀i ∈ [1..N ]). Apr`es l’enregistrement de tous ces individus jusqu’`a N = 40000, nous avons calcul´e la distance pour chaque paire (Ii, Ij) avec 1 ≤ i, j ≤ N et nous avons construit un histogramme pour examiner le nombre d’occurrences de chaque valeur de distance.

Cet histogramme a montr´e (voir Section 3.3.4) que la distribution de la valeur de distance est bimodale, avec de nombreuses valeurs tr`es petites (i.e. environ 5%|V |) et avec beaucoup de valeurs ´elev´ees. Cela met en ´evidence une structuration des meilleurs individus en clusters : les valeurs plus petites correspondent `a des distances intra-cluster et les valeurs ´elev´ees `a des distances inter-cluster. Si on note un “diam`etre de cluster” par Cd, on peut dire que Cd varie de 7%|V | `a 10 %|V |, selon le graphe. Pour d´eterminer une valeur appropri´ee de R, il suffit de noter que deux individus distants de plus de 10%|V | (la valeur la plus ´elev´ee de Cd) ne sont pas dans le mˆeme groupe – parce que (id´ealement), ils contiennent des classes essentielles tr`es diff´erentes. En conformit´e avec la Section 3.3.4, nous consid´erons que deux individus distants de moins de R = 10%|V | sont tr`es proches.

5.4 Pr´eservation et cr´eation continue de diversit´e

5.4.2.2 Dispersion r´eactive de la population avec des mutations

Dans le meilleur des cas, la diversit´e est assur´ee uniquement par le processus “naturel” de reproduction, i.e. `a l’aide du croisement et de la recherche locale. En effet, si l’enfant r´esultant est rejet´e `a cause du manque de diversit´e, Evo–Div essaie d’abord le processus naturel de reproduction encore une fois, voir la boucle Repeat-Until de l’Algorithme 5.1. Si besoin, Evo–Div peut aussi introduire de la diversit´e avec des mutations “artificielles”, i.e. en perturbant certains sommets avant la recherche locale. Plus rigoureusement, la mutation efface d’abord les couleurs de R sommets (choisis al´eatoirement) et elle les re- affecte une couleur avec une proc´edure gloutonne. Si l’enfant r´esultant apr`es la recherche locale est toujours rejet´e (voir la boucle Repeat-Until), un nouvel enfant est produit et l’intensit´e de la mutation est ´egalement augment´ee `a 2R sommets, 3R . . . . Si le nombre de sommets perturb´es atteint |V |, la mutation revient `a g´en´erer une coloration compl`etement nouvelle.

Rappelons (Algorithme 5.1) que la mutation est appliqu´ee uniquement quand le pro- cessus naturel de reproduction a ´echou´e maxRejets fois. La question suivante est impor- tante : combien de rejets autorise-t-on, avant de recourir aux mutations pour assurer le seuil d’´ecart minimum R ? En conformit´e avec le principe “assurer la diversit´e sans sacri- fier la qualit´e”, la mutation doit ˆetre uniquement un outil de dernier recours. Pour cela, le param`etre maxRejets (voir l’Algorithme 5.1) doit ˆetre affect´e une valeur d’un ordre de grandeur plus ´elev´ee que le nombre moyen d’enfants rejet´es par g´en´eration.1 Cependant, les mutations peuvent devenir plus fr´equentes pour imposer de la diversit´e dans certaines situations sp´ecifiques, en particulier quand le processus de recherche est bloqu´e sur des structures difficiles de l’espace de recherche.

Hausse du seuil d’´ecart minimum R pour disperser la population La population peut converger vers un ´etat stable dans lequel : (i) l’´ecart moyen est de moins de 2R et (ii) tous les individus ont la mˆeme valeur de la fonction d’adaptation (qui est aussi la meilleure trouv´ee). Cela indique qu’une grande partie de la population peut ˆetre confin´ee dans une sph`ere de rayon 2R qui contient de nombreux optima locaux distants de plus de R. Cette situation peut ˆetre associ´ee `a une structure particuli`ere de l’espace de recherche : de nombreux plateaux confin´es dans un puits profond. Nos techniques d’´ecart ne peuvent plus diriger le processus de recherche en dehors de cette sph`ere, et ainsi, un m´ecanisme de dispersion est propos´e.

L’objectif de ce m´ecanisme est de d´eclencher de nombreuses mutations `a la suite, et d’aider une partie de la population `a quitter cette 2R-sph`ere probl´ematique. `A cette fin, on peut ´egalement recourir `a un autre outil tr`es utile pour maintenir l’´equilibre diversi- fication/intensification : le rayon de sph`ere R – qui indique aussi notre ´ecart minimum cible. En doublant sa valeur dans cette situation, la plupart des enfants g´en´er´es dans la 2R-sph`ere sont rejet´es. De plus, en divisant maxRejection par dix, on permet moins d’es- 1. Ce nombre moyen d’enfants rejet´es par g´en´eration peut ˆetre facilement d´etermin´e en pratique, car il est indiqu´e par croisements–g´en´erationsen´erations dans le Tableau 5.2, i.e. il est entre 0 et 3 selon le graphe. On a remarqu´e qu’une valeur maxRejets = 50  3 assure un taux de mutation en dessous de 0.1% dans la plupart des cas (voir aussi Section 5.5.1.1).

sais de reproduction naturelle (croisement et recherche locale) ; ceci a comme cons´equence des mutations plus fr´equentes et cela conduit `a des enfants en dehors de la 2R-sph`ere.

La mˆeme strat´egie de dispersion est employ´ee dans une autre situation tr`es d´elicate : quand il y a trop d’enfants rejet´es pendant une tr`es longue p´eriode. Cette situation peut indiquer que la population est distribu´ee autour de quelques optima locaux avec des bassins d’attraction tr`es grands qui font que le processus de reproduction naturelle g´en`ere des enfants toujours dans les mˆemes bassins d’attraction. En d´eclenchant la proc´edure de dispersion, les mutations sont appliqu´ees plus rapidement et une partie de la population quitte rapidement les positions actuelles. En pratique, la condition “trop d’enfants rejet´es pendant une longue p´eriode” se d´efinit simplement si nous prenons en consid´eration le fait que le nombre moyen d’enfants rejet´es par g´en´eration est entre 0 et 3 (voir Section 5.5.1.1). Ainsi, s’il atteint 5 pour toute l’ex´ecution, le m´ecanisme de dispersion est appliqu´e.