L’algorithme ACO(Ant Colony Optimization)

o`u δ_m est un paramètre fixant l’amplitude de la mutation effectu´ee et r est une variable aléatoire dans{0, 1} représentant la direction de la mutation.

Un certain nombre d’extensions de PBIL ont été proposées :

– au lieu d’utiliser la meilleure chaˆıne générée à chaque itération on peut utiliser les

m meilleures. La mise `a jour du vecteur V demande alors quelques ajustements : il y principalement deux solutions :

1. le vecteur V est d´eplac´e de la mˆeme mani`ere vers les m meilleures chaˆınes, 2. le vecteur V est d´eplac´e vers les valeurs des bits communs aux m meilleures

chaˆınes.

– le vecteur V peut aussi ˆetre (( éloigné )) de la plus mauvaise chaˆıne (notée s−₎ génér´ee dans P :

p_i ← pi(1− LRneg) + s⁺(i)LR_neg si s⁺(i)= s−_(i) _(6.5) Dans ce cas, LR_neg est appel´e taux d’apprentissage n´egatif (Negative Learning

Rate). Cette formule signiﬁe que p_i est rapproch´e de s⁺(i) si les bits `a la position

i de s+ et s⁻ sont diﬀ´erents.

L’algorithme PBIL a été étudié empiriquement sur plusieurs problèmes (Jobshop, voyageur de commerce, bin-packing, optimisation de fonctions numériques) avec les valeurs de paramètres suivants (Baluja, 1994) :

– n = 100 ; – LR = 0.1 ; – p_m = 0.02 ; – δ_m = 0.05 ;

– LR_neg ∈ {0.0, 0.025, 0.075, 0.1}.

Une comparaison est proposée avec un algorithme génétique standard et avec un al-gorithme de descente stochastique (Multiple Restart, Next-Step Hill Climbing ). Les résultats obtenus montrent que l’apprentissage négatif joue un rôle important mais que sa valeur dépend du problème. De plus PBIL obtient des performances supérieures aux autres méthodes que ce soit en terme de qualité que de rapidité (Baluja, 1994; Baluja, 1995).

Plusieurs extensions ont été proposées et abandonnent l’espace de recherche binaire pour des espaces à variables continues (Rudlof and Koeppen, 1996; Sebag and Ducou-lombier, 1998). Dans ce cas, V est utilis´e pour générer des valeurs réelles suivant des distributions gaussiennes autour de chaque valeur p_i.

6.5 L’algorithme ACO(Ant Colony Optimization )

La capacité des fourmis à trouver le plus court chemin entre une source de nourriture et leur nid a été utilisée pour résoudre des problèmes d’optimisation combinatoire. Les traces de phéromones représentent une attirance pour un arc du graphe modélisant le problème. Chaque fourmi construit une solution du problème et l’évaluation de chaque solution est utilisée pour mettre à jour les traces de phéromones. Ces principes ont été appliqués en premier au problème du voyageur de commerce (Colorni et al., 1991) puis

a d’autres problèmes combinatoires comme le problème de l’affectation quadratique (Maniezzo and Colorni, 1999). Nous renvoyons le lecteur au chapitre 2 pour le détail de ces heuristiques inspirées des fourmis qui sont rassemblées sous l’acronyme ACO (Ant Colony Optimization).

Nous avons reformulé le problème d’optimisation considéré dans ce chapitre pour proposer une heuristique basée sur ACO. Plus précisément, nous nous inspirons des développements d’ACO qui ont été appliqués au problème du voyageur de commerce, `

a savoir les heuristiques AS (Ant System) (Dorigo et al., 1996) et ACS (Ant Colony

Sys-tem) (Dorigo and Gambardella, 1997b). Nous appelerons respectivement AS_b et ACS_b les deux adaptations que nous proposons de AS et ACS pour le probl`eme d’optimisation binaire.

Nous pouvons montrer que si nous adaptons les principes d’ACO au problème d’optimization binaire, cela diffère de BSC et PBIL principalement sur l’étape de mise `

a jour de l’algorithme 6.1. Le problème d’optimisation a été reformulé de la fa¸con suivante : nous construisons un graphe où chaque sommet correspond à la position d’un bit et où les arcs correspondent au choix de la valeur du bit. La figure 6.1.a représente le graphe contenant les différents sommets qu’une fourmi doit parcourir pour construire une solution. La fourmi part du premier sommet sur la gauche et choisit un arc, soit

(( 1 )) ou (( 0 )), pour atteindre le sommet suivant. La d´ecision de choisir l’arc (( 1 )) ou

l’arc (( 0 )) suit une distribution de probabilit´e que l’on appelle trace de ph´eromones

dans ACO mais qui peut être ramenée à une seule valeur correspondant à la probabilité de suivre l’arc (( 1 )). Notons par 0i et 1_i les deux arcs correspondant `a la position i de la chaˆıne de bits. Les quantités de ph´eromones de chaque arc sont τ₀_i et τ₁_i. Ces deux valeurs réelles peuvent être utilisées pour d´efinir une unique valeur p_i, la probabilité de générer un (( 1 )) :

p_i = ^τ¹ⁱ

τ₁_i + τ₀_i ^(6.6)

Les traces de phéromones sont donc ´equivalentes au vecteur V utilis´e par les deux précédentes m´ethodes. La figure 6.1.b illustre la solution s = 010 . . . 00 g´enérée par une fourmi.

Initialement, dans ACO, chaque arc 0_i et 1_i (i ∈ {1, . . . , l}) a une quantit´e de

ph´eromone τ₀_i et τ₁_i ﬁx´ee `a une valeur positive τ⁰.

Il est assez évident que cette modélisation de la recherche d’une chaˆıne binaire sous la forme d’un graphe aussi peu élaboré représente une simplification assez forte de ce que les algorithmes de type ACO étaient habitués à traiter : pour un problème de voyageur de commerce `a l villes, à chaque sommet, la fourmi doit choisir parmi l−k arcs

(k repr´esentant le nombre de villes déjà explorées) alors que pour notre modélisation, elle ne possède à chaque sommet qu’une alternative entre deux chemins. Cependant, et `

a notre connaissance, cela n’avait pas été proposé alors que ce problème compte parmi les problèmes classiques en informatique.

102 6.5 L’algorithme ACO(Ant Colony Optimization ) (a) 1 1 1 1 0 0 0 0 1 0 (b) 1 1 1 1 0 0 0 0 1 0

Fig. 6.1 – Adaptation de ACO au probl`eme d’optimization binaire. Le choix des l bits est mod´elis´e par le choix d’un arc (( 0 )) ou (( 1 )) entre les l + 1 sommets.

6.5.1 L’algorithme AS

(Ant System )

Selon la règle de mise `a jour de AS, τ_k_i (k ∈ {0, 1}, i ∈ {1 . . . l}), est modifié de la

fa¸con suivante : τ_k_i ← (1 − ρ)τki+ n j=1 ∆^j_k_i (6.7)

o`u ρ ∈ [0, 1] est un paramètre représentant l’évaporation des phéromones et ∆j ki cor-respond à la quantité de phéromone dépos´ee par la fourmi j sur l’arc ki :

∆^j_k_i =

₁

1+f (sj) si s_j(i) = k

0 sinon ^(6.8)

Comme f est d´efinie surR+, au dénominateur, nous avons ajouté 1 `a f (s_j) pour éviter les probl`emes survenant lorsque f (x) = 0.

Il existe une extension de l’algorithme AS : AS-Rank où toutes les solutions sont utilisées de fa¸con proportionnelle à leur performance (Bullnheimer et al., 1997b). Ceci est comparable `a l’utilisation des m meilleures chaˆınes dans PBIL.

6.5.2 L’algorithme ACS

(Ant Colony System )

Une variante d’AS, ACS, a apporté des changements importants à la règle de mise à jour. ACS utilise uniquement la meilleure chaˆıne générée depuis le début de l’algorithme (not´ee s++) : τ_k_i ← (1 − ρ)τki+ ρ∆_k_i (6.9) où : ∆_k_i = ₁ 1+f (s⁺⁺) si s++(i) = k 0 sinon ^(6.10)

On peut remarquer que cette règle est assez proche de celle utilisée par PBIL (for-mule 6.3) à la différence qu’elle s’applique ici sur les phéromones et non pas direc-tement sur les probabilit´es p_i du vecteur V . Comme pour AS_b, ρ sert de coefficient d’évaporation des phéromones.

ACS introduit un moyen de contrôler le compromis entre l’exploration et l’exploi-tation 3. Pour chaque bit génér´e pour la solution i `a l’étape 3 de l’algorithme 6.1 :

– diversiﬁer avec la probabilit´e 1 − q0 : le bit j prend la valeur (( 1 )) avec la

probabilit´e p_j;

– intensiﬁer avec la probabilit´e q₀ : le bit j prend la valeur suivante

s_i(j) =

1 si p_i > 0.5

0 sinon ^(6.11)

De plus, ACS utilise une règle de mise à jour locale mise en œuvre à l’étape 3 de génération de la population dans l’algorithme 6.1 :

τ_k_i ← (1 − α)τki+ ατ⁰ si l’arc k_i a été choisi (6.12) o`u α ∈ [0, 1] est un paramètre. Cette mise à jour locale a pour but de modifier très

légèrement la quantité de phéromones sur l’arc choisi par une fourmi afin de pousser les autres à explorer les autres arcs, cela afin d’éviter que toutes les fourmis se suivent. Ainsi, si la quantité de ph´eromones sur l’arc k_i est supérieure `a τ0, aprés le passage d’une fourmi, la quantité de phéromone aura diminué. Par contre, si la quantit´e τki

est inférieure `a τ0, la formule 6.12 augmente la quantité de phéromone. Cette mise `

a jour locale agit statistiquement de la mˆeme fa¸con que la mutation de BSC sur les composantes de V . En eﬀet, si τi0 < τi1, apr`es le passage des n fourmis, τi0 sera augment´e et τ_i₁ sera diminu´e ce qui implique que p_i sera rapproch´ee de 0.5.

Dans le document Algorithmes de fourmis artificielles : applications à la classification et à l'optimisation (Page 113-116)