• Aucun résultat trouvé

Le paysage de fitness est un concept pour la suite des travaux présentés. Cette section expose les origines du concept et propose une classification des méthodes et des finalités de l’analyse des paysages de fitness. Tout d’abord, on défini une notion importante pour la suite, qui est la notion de distance entre deux solutions et qui peut être définie de plusieurs manières. Les solutions peuvent être vues comme des points de l’espace de recherche et une première idée consiste donc à considérer la distance d’un point de vue géométrique (notée d2), par la racine carré de la somme des différences au carré entre composantes. La distance entre deux solutions x et x0 s’écrit : d2(x, x0) = v u u t n X i=1 (xi− x0i)2

Une seconde idée consiste, dans le cas des problèmes combinatoires, à compter le nombre de composantes différentes entre les deux solutions. On a ainsi :

dH(x, x0) = n X i=1 δ(xi, x0i) avec δ(a, b) = ( 1 si a = b 0 sinon

4.2.1 Origine et définition

Le concept de paysage de fitness a été introduit par S. Wright [109] en 1932 dans le domaine de la biologie. L’idée de Wright est de donner une idée intuitive et cependant riche de l’adaptation des espèces. Le modèle est un espace abstrait constitué de l’espace des génotypes et d’une dimension supplémentaire qui représente la valeur d’adaptation (la valeur de fitness). Wright projette l’espace des génotypes dans un espace à deux dimensions ce qui lui permet de représenter à la fois la géométrie des surfaces possibles (pics, vallées, etc.) et les dynamiques possibles d’adaptation sur le paysage de fitness : marche adaptative vers un pic, transition entre deux pics selon le taux de mutation et la pression de sélection, etc. En optimisation stochastique, les génotypes possibles sont remplacés par les solutions potentielles au problème d’optimisation et la valeur d’adaptation par la fonction objectif (fonction de fitness) [103]. Un paysage de fitness [98] est un triplet (X, N , f), où X est l’ensemble des solutions potentielles au problème d’optimisation appelé espace de recherche, N : X → 2X est une relation de

voisinage entre les solutions qui associe à chaque solution un ensemble de solutions dites voisines et f : X → R est la fonction d’évaluation à optimiser. Dans la suite, sans perte de généralité, on supposera que la fonction objectif doit être minimisée. Les définitions sont données dans le cas mono-objectif. Pour le cas multiobjectif, on peut changer la fonction d’évaluation pour étendre la définition [103]. Chaque élément du triplet constituant le paysage de fitness doit être défini en fonction du problème à résoudre et de la classe d’algorithmes que l’on désire étudier. Naturellement, l’espace de recherche X et la fonction de fitness f doivent être ceux qui définissent le problème d’optimisation et qui sont utilisés par les algorithmes de recherche. La relation de voisinage en revanche doit être définie selon l’opérateur utilisé dans les algorithmes d’optimisation, ou selon une distance liée aux opérateurs. Typiquement, lorsque l’espace de recherche est l’ensemble des chaines binaires d’une longueur donnée, le voisinage est l’ensemble des solutions a une distance de Hamming inférieure à un entier k, représentant le nombre de bits changés par l’opérateur.

La spécificité d’un paysage de fitness peut être perçue comme une limitation : l’étude d’un paysage de fitness pour un problème et un algorithme d’optimisation ne pouvant pas directement apporter d’information pour un autre algorithme d’optimisation. Cependant, de même que la difficulté d’optimisation d’un problème dépend de l’algorithme considéré, la structure du paysage de fitness dépend également de certaines propriétés particulières de l’algorithme et du problème. L’étude d’un paysage de fitness permet ainsi d’analyser et de comparer différentes représentations, différentes fonctions objectif ou différents opérateurs de recherche locale. De manière générale, les buts sont alors de mieux comprendre l’interaction entre le problème et l’algorithme et de sélectionner les composants d’algorithme les plus adaptés selon la classe de problèmes à résoudre.

4.2.2 Buts de l’analyse des paysages de fitness

Le but principal de l’analyse de paysages de fitness est la compréhension de la structure de l’espace de recherche du point de vue de l’algorithme d’optimisation. Cette compréhension permet de repérer les écueils et les avantages des algorithmes d’optimisation, typiquement des métaheuristiques, afin de sélectionner ou d’améliorer ensuite ces algorithmes d’optimisation selon le problème d’optimisation à résoudre. Il existe deux types d’analyse de paysage de fitness [103]. La première est algébrique et s’inscrit dans un scénario d’optimisation boite grise, la seconde est statistique et s’inscrit dans un scénario d’optimisation boite noire où seuls le codage et la qualité des solutions sont accessibles et connus. Nous nous bornons ici à la

CHAPITRE 4. ÉTAT DE L’ART - PRINCIPES DE L’OPTIMISATION

seconde. À partir d’un échantillonnage du paysage de fitness constitué de solutions de l’espace de recherche et de la valeur correspondante de la fonction objectif, des propriétés statistiques sont extraites et utilisées pour caractériser le paysage de fitness. Ce type d’approche est de loin celui le plus utilisé en pratique.

L’étude des paysage de fitness permet ainsi plusieurs niveaux d’ajustement des algo- rithmes. Premièrement, il s’inscrit parfaitement dans la problématique de la sélection d’al- gorithmes de Rice [88], détaillé dans [103], qui consiste à déterminer le ou les algorithmes les plus adaptés à la résolution d’un problème donné parmi un portefeuille d’algorithmes. La compréhension de la structure du paysage de fitness peut également servir à concevoir un algorithme adapté à la forme à ce paysage. On ne concevra pas le même type d’algorithme selon que le paysage est très multimodal avec de petits bassins d’attraction ou très «plat» avec beaucoup de grands plateaux qui dominent la forme générale. L’analyse de paysage de fitness est enfin utilisée pour sélectionner certains composants importants des algorithmes de recherche. Le principe consiste à comparer les mé- triques de deux paysages de fitness relatifs à un même problème d’optimisation où plusieurs choix de représentations, fonctions de fitness, ou de voisinages sont possibles. La sélection et sa justification d’une composante de l’algorithme sont alors effectuées avant l’optimisation et non pas seulement a posteriori par l’observation de performance sur un benchmark. Ce type de travaux est sans doute le cas le plus courant et le plus simple d’utilisation de l’analyse de paysage de fitness et l’on peut trouver de nombreux travaux de comparaison dont il n’est pas possible de dresser la liste exhaustive [103].

Deux approches sont possibles selon la classification établie par Eiben et al. [40]. La première approche consiste en un ajustement en ligne (appelé contrôle), les paramètres étant choisis et modifiés en fonction des performances qu’ils donnent. Au contraire, dans la deuxième approche, un ajustement hors ligne (appelé réglage) est adopté, et les valeurs de paramètres sont choisies au début de la simulation, et sont conservées durant tout le processus. De nom- breuses méthodes ont été proposées pour le réglage automatique hors line des algorithmes, dont le principe repose sur une optimisation de la valeur des paramètres. Une méthode très simple à mettre en place (méthode paramétrique) consiste à réaliser une étude paramétrique des paramètres. Pour chaque paramètre, un certain nombre de valeurs sont ainsi choisies, for- mant un plan d’expérience, et chaque point de cette grille correspond à une simulation qui soit être réalisée. Cette méthodologie est simple, mais requiert un budget important de ressources de calcul, puisque toutes les configurations possibles sont évaluées. D’autres méthodes, comme par exemple l’environnement irace [72], s’appuient sur une technique intelligente d’essais pour le choix des paramètres. Ces méthodes nécessitent cependant toujours un grand nombre de simulations, et peuvent également s’avérer coûteuses en temps de calcul surtout dans le cas de fonctions associées à des temps de calcul longs. L’étude des paysages de fitness finalement per- met de se substituer à ces méthodes coûteuses. Le principe est d’extraire les caractéristiques du problème posé, et d’utiliser la connaissance de ce paysage de fitness pour ajuster les para- mètres de l’algorithme. Les études mentionnées ci-dessus ont montré que les propriétés telles que le taux de neutralité ou la longueur d’autocorrélation permettent d’étudier la forme du paysage de fitness. Des travaux théoriques [21] ont également montré la pertinence de l’étude des paysages de fitness pour ajuster les paramètres tels que ceux de l’opérateur de mutation. Les premiers travaux sur le réglage de paramètres basés sur l’analyse de paysage de fitness sont contemporains de l’essor du domaine de l’évolution artificielle et se poursuivent encore aujourd’hui [103]. À notre connaissance, il n’existe pas cependant de travaux appliquant une telle méthodologie à des algorithmes d’optimisation se basant sur des problèmes réels dont le

coût d’évaluation de la fonction objetcif est important.

4.2.3 Géométries associées aux paysages de fitness

Deux principales géométries sont utilisées lors de ce type d’analyse pour décrire les pay- sages de fitness.

Une géométrie multimodale correspond à un espace objectif constitué en grande par-

tie de "vallées" et de "pics", c’est-à-dire de maxima et de minima locaux (les minima locaux sont des solutions pour lesquels il n’existe pas de solution dans le voisinage dont la valeur de critère est inférieure). Cette géométrie est associée à un paysage accidenté, pour lequel on peut définir un paramètre d’irrégularité ou de rugosité caractéristique. Plus ce paramètre est important, c’est-à-dire plus le paysage est accidenté, plus il est multimodal. Il est possible d’estimer ce paramètre en déterminant l’autocorrélation de la fonction objectif [107] par une marche aléatoire à travers le paysage. Une marche aléatoire est une séquence (x1, . . . , x`) de solutions telles que pour tout t ∈ [2, `], xt

est une solution choisie de façon aléatoire dans le voisinage de xt−1, ou choisie par l’opérateur de recherche locale. La fonction d’autocorrélation ˆρ est alors définie par la corrélation entre les valeurs de critères obtenues lors de la marche aléatoire :

ˆρ(k) = `−k X t=1 (f(xt) − ¯f) · (f(xt+k) − ¯f) ` X t=1 (f(xt) − ¯f)2

avec ¯f la valeur moyenne de la fonction f. Plus les valeurs de critère des solutions sont proches après k pas de la marche aléatoire, plus la corrélation ˆρ(k) entre elles est importante. La caractéristique principale de cette fonction, appelée longueur d’auto- corrélation [53], et notée τ, correspond à la longueur (ou au nombre de générations) entre deux solutions, à partir de laquelle la corrélation entre leurs valeurs de critère devient inférieure à un certain seuil  :

τ = min{k : |ˆρ(k)| < }

Plus un paysage est régulier, plus la longueur d’autocorrélation est grande, inversement, plus un paysage est multimodal plus cette longueur est faible.

Une géométrie neutre correspond au contraire à un paysage de fitness fait de plateaux

très importants, où de très nombreuses solutions sont équivalentes. La dynamique de recherche des algorithmes évolutionnaires sur ce type de paysage est constituée d’équilibres ponctués durant lesquels l’algorithme se déplace sur ces plateaux sans trouver de solutions améliorant la valeur du critère, ces équilibres étant interrompus par des améliorations isolées avant de poursuivre sur un autre plateau. La caractéristique principale de ce type de structure est le taux de neutralité ν. Formellement, ce taux est défini [102] comme la proportion de solutions voisines ayant la même valeur de critère :

ν =

]ny ∈ N(x) | f(y) = f(x)o ]N(x)

CHAPITRE 4. ÉTAT DE L’ART - PRINCIPES DE L’OPTIMISATION

où la notation ]A représente la cardinalité de l’ensemble A. Dans le but de réduire les temps de calcul et éviter d’évaluer de façon exhaustive le voisinage des solutions courantes, il est possible [69] d’estimer le taux de neutralité à l’aide d’une marche aléatoire : lors de la marche aléatoire, les solutions successives qui présentent la même valeur de critère sont comptées et rapportées au nombre de pas, c’est-à-dire au nombre de mutations) :

ν=

]nt ∈ {1, ` − 1} | f(xt+1) = f(xt) o

` −1

L’étude conjointe des deux grandeurs caractéristiques de ces représentation permet ainsi l’analyse des paysages de fitness, et l’identification de paramètres correspondants.