• Aucun résultat trouvé

3.1.1

D´efinition

Introduit par Sewall Wright [106] en 1931, le concept de paysage de fit- ness est un des plus importants en biologie de l’´evolution. Il est bas´e sur l’hypoth`ese qu’`a chaque organisme, c’est-`a-dire `a chaque g´enotype, peut-ˆetre associ´ee une valeur indiquant son adaptation, appel´ee fitness. Un arrange- ment des g´enotypes d´ecrit alors l’espace dans lequel ´evolue une population soumise `a la s´election naturelle. L’int´erˆet de cette m´etaphore pour les biolo- gistes est que la topologie de tels paysages refl`ete directement la possibilit´e pour une population d’atteindre certains g´enotypes (ou ph´enotypes).

Le concept de paysage de fitness a ´et´e ´egalement utilis´e en EA [46]. Dans ce cas, une fonction d´efinit la fitness de chaque g´enotype et ceux-ci sont arran- g´es dans un ordre topologique, appel´e espace des configurations, qui d´epend des op´erateurs g´en´etiques utilis´es (approche “un op´erateur - un paysage” [44]). On consid`ere souvent que deux g´enotypes sont voisins dans l’espace des confi- gurations si l’on peut passer de l’un `a l’autre en une seule mutation, mais certains travaux ont ´egalement ´etudi´e l’espace des configurations li´e `a l’op´e- rateur de recombinaison [33]. Formellement, on d´efinit un paysage de fitness comme un triplet (G,V, f), avec :

– l’ensemble des g´enotypes G, c’est-`a-dire l’ensemble des configurations, – la fonction de voisinage V : G → P(G). ∀x, y ∈ G, V(x) est appel´e

voisinage de x et on dira que y est voisin de x si y ∈ V(x).

– f : la fonction de fitness qui associe une valeur r´eelle `a chaque ´el´ement de G.

Dans le cadre de nos travaux, nous nous int´eressons aux paysages de fitness en EA-TV et plus particuli`erement en PGL dont la sp´ecificit´e r´eside dans la fonction de voisinage qui doit ˆetre d´efinie sur des chaˆınes de taille variable. Nous d´efinissons le voisinage par rapport `a l’op´erateur de mutation, donc aux trois op´erations ´el´ementaires qu’il r´ealise (insertion, d´el´etion et substitution). Nous avons d´ej`a vu que la distance d’´edition D rend compte du nombre d’op´erations ´el´ementaires permettant de transformer un g´enotype en un autre, on prendra donc V(x) = {y ∈ G|D(x, y) = 1}.

On note qu’un g´enotype de longueur λ d´efini sur un alphabet Σ de taille N poss`ede au plus (2λ + 1)× N voisins. En effet, une borne sup´erieure de la taille du voisinage peut ˆetre obtenue en comptant le nombre de mutations M qu’il est possible d’effectuer sur un individu et en supposant que toutes ces mutations donnent un g´enotype diff´erent. On a donc :

M = λ × (N − 1) (nombre de substitutions) + λ (nombre de d´el´etions) + (λ + 1)× N (nombre d’insertions) = (2λ + 1)× N

3.1.2

Mesures sur les paysages

Plusieurs mesures ont ´et´e propos´ees et largement utilis´ees pour d´ecrire les paysages de fitness en terme de “difficult´e”. Ici, la difficult´e fait r´ef´erence `a la capacit´e pour une heuristique de recherche locale d’atteindre un optimum, c’est-`a-dire que ces mesures ne sont pas con¸cues pour directement rendre compte de la difficult´e de l’optimisation par un algorithme manipulant une population de solutions et utilisant un op´erateur de recombinaison. Nous verrons par la suite si ces mesures sont, dans la pratique, adapt´ees `a la PG. Marches Al´eatoires

Soit G, l’ensemble des g´enotypes d´efinis sur un alphabet Σ de taille N . Une marche al´eatoire{g1, g2, . . .} sur un paysage de fitness est une s´erie dans

G dont g1 est le g´enotype initial et o`u gi+1 ∈ V(gi) est choisi al´eatoirement.

Dans [104], Weinberger d´efinit la fonction d’auto-corr´elation et la longueur de corr´elation d’une marche al´eatoire dans le but de mesurer l’´epistasie, i.e. le degr´e d’interaction entre les g`enes, dans un paysages de fitness.

La fonction d’auto-corr´elation ρ d’une fonction de fitness f est la fonction d’auto-corr´elation de la s´erie {f(g1), f (g2), . . . , f (gl)} telle que :

ρ(s) = Pl−s

t=1(f (gt)− f)(f(gt+s)− f)

Pl

t=1(f (gt)− f)2

avec l la longueur de la marche, s∈ [1, l] et f = (1/l)Pl

t=1f (gt). On consi-

quand elle n’est pas comprise dans l’intervalle [−2/√l, +2/√l] et donc que la fonction de fitness f n’est pas al´eatoire.

La longueur de corr´elation τ d’une marche al´eatoire permet de mesurer comment la corr´elation d´ecroˆıt avec la distance et donc d’estimer la rugosit´e2

d’un paysage. Plus un paysage est rugueux plus la longueur de corr´elation est faible. A titre de comparaison, on pourra utiliser dans cette ´etude la Table 3.1 qui indique la longueur de corr´elation τ pour diff´erents Paysages-NK (qui seront d´ecrits Section 3.2.3) en fonction du param`etre K qui contrˆole la rugosit´e du paysage.

Tab. 3.1 – Paysages-NK, N =100 : Longueur de corr´elation τ d’une marche al´eatoire. K τ Rugosit´e 0 > 50 Tr`es faible 5 47 Faible 25 17 Elev´ee´ 95 1 Tr`es ´elev´ee

Pour calculer τ , on fait varier s de 0 `a l, et la valeur de τ est donn´ee par s − 1 quand pour la premi`ere fois ρ(s) est comprise dans l’intervalle [−2/√l, +2/√l]. Autrement dit, il s’agit de la plus grande valeur de s pour laquelle l’auto-corr´elation est significative.

Marches Adaptatives

Contrairement aux marches al´eatoires, o`u seule la notion de voisinage est retenue pour choisir le g´enotype suivant de la s´erie, dans le cas des marches adaptatives un crit`ere de performance suppl´ementaire est appliqu´e, tel que seuls des d´eplacements am´eliorant la fitness soient accept´es. Il existe plusieurs variantes de marches adaptatives ([52]) avec diff´erents crit`eres de s´election, comme par exemple un des meilleurs voisins ou le premier voisin meilleur trouv´e.

2

Traduction libre de l’anglais ruggedness qui signifie accident´e, ayant une surface irr´e- guli`ere.

Soit G, l’ensemble des g´enotypes d´efinis sur un alphabet Σ de taille N . Dans notre cas, une marche adaptative est une s´erie {g1, g2, . . . , gt+l} dans

G dont g1 est le g´enotype initial et o`u gi+1 est le premier ´el´ement de V(gi)

trouv´e qui soit plus performant que gi. Contrairement aux marches classiques,

la recherche n’est pas effectu´ee de mani`ere exhaustive parmi tous les voisins de gi mais au plus parmi (2λ + 1)×N g´enotypes, avec λ la taille de gi, choisis

al´eatoirement avec remise dans V(gi). Ceci permet de rendre compte de la

difficult´e de d´ecouvrir un des voisins meilleurs dans le cas o`u leur densit´e est faible et correspond mieux au comportement d’un syst`eme PG o`u la recherche locale est effectu´ee “en aveugle”.

Une marche adaptative s’arrˆete donc quand aucun voisin meilleur n’est d´ecouvert parmi les (2λ + 1)× N g´enotypes test´es, c’est-`a-dire que gt+l est

un optimum local. En calculant plusieurs marches, on peut donc estimer : – la distribution de la fitness des optima locaux `a partir de la distribution

des fitness finales f (gt+l).

– la distance moyenne aux optima locaux `a partir de la longueur l des marches adaptatives.

3.2

Probl`emes synth´etiques pour l’EA-TV

Documents relatifs