Méthode paramétrique - Ajustement des paramètres de mutation

5.3 Ajustement des paramètres de mutation

5.3.1 Méthode paramétrique

Pour réaliser cette étude paramétrique, quatre valeurs de taux de mutation p et de lar- geur de plage aléatoire r sont considérées : p ∈ {0.1, 0.2, 0.3, 0.4} et r ∈ {0.05, 0.1, 0.2, 0.5}. Toutes les combinaisons possibles sont évaluées donnant au total seize configurations. Afin de

CHAPITRE 5. OPTIMISATION MONO-OBJECTIVE 0 50 100 150 0 2 4 6 8 Distance de Hamming count 0 10 20 30 40 0 2 4 6 8 Distance de Hamming count 0 5000 10000 15000 20000 0 2 4 6 8 Distance de Hamming count 0 5000 10000 15000 20000 0 2 4 6 8 Distance de Hamming count

Figure 5.5 – Distribution des distances de Hamming entre une solution mutée et la solution mutante dans le cas où la solution mutante améliore la valeur du critère (haut) et dans le cas où la valeur de critère est identique (bas). Les résultats de la simulation avec 3072 processeurs sont à gauche et ceux de la simulation avec 1024 processeurs à droite.

réduire l’effet aléatoire inhérent à l’opérateur de mutation, pour chaque configuration (p, r), cinq processus d’optimisation sont exécutés avec différentes populations initiales. Les cinq populations sont de mêmes tailles et identiques pour les seize jeux de paramètres. Le nombre de cinq processus par jeu de paramètre est choisi pour garantir une statistique significative minimale (mais néanmoins trop faible pour la réalisation de tests statistiques) compte tenu des ressources de calcul (les 80 simulations représentent plus d’un million d’heures de calcul en séquentiel). La Fig. 5.6 présente les dynamiques de recherche des optimisations, avec de gauche à droite les valeurs de r croissantes, et de bas en haut les valeurs de p croissantes. Pour chaque configuration (p, r), les 5 simulations correspondantes aux différentes populations initiales sont tracées.

Avant de commenter les évolutions en fonction des paramètres, on remarque dans un premier temps la dépendance des dynamiques en fonction de la population initiale. Comme attendu avec un algorithme glouton, la qualité finale dépend effectivement de la population initiale. On peut toutefois noter que les écarts entre les différentes populations initiales se réduisent lorsque r augmente. En effet, plus la valeur de r augmente, plus l’opérateur de mutation devient aléatoire, et plus la solution mutante peut être éloignée (en termes de distance euclidienne) de la solution mutée. Pour la valeur maximale de r considérée (r = 0.5), les nouvelles valeurs des variables modifiées sont uniformément réparties entre les bornes de la variable, ce qui a pour effet d’homogénéiser les différences de performances entre les populations initiales. Cet effet n’est cependant pas observé en augmentant la valeur du taux

de mutation p. Dans ce cas, la distance au sens de Hamming est augmentée en moyenne, les valeurs des variables pouvant être proches par ailleurs.

0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05 0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05

0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05 0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05

0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05 0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05

0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05 Init. pop. 1 2 3 4 5 0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05 0.3 0.4 0.5 0.6 0.7 0.8

1e+02 1e+03 1e+04 1e+05

Figure 5.6 – Dynamique de la recherche pour les différentes configurations testées, et pour les cinq populations initiales. De gauche à droite : r = 0.05, 0.1, 0.2, 0.5 et de bas en haut : p = 0.1, 0.2, 0.3, 0.4. Le nombre de solutions évaluées est en abscisse et la valeur du critère axial offset normalisée en ordonnée. Noter les échelles logarithmiques.

Les effets des paramètres de mutation sur les performances de l’algorithme sont néanmoins peu visibles sur la Fig. 5.6, et nous définissons donc des critères permettant de mesurer les performances de l’algorithme exécuté avec les différents paramètres de mutation. Un jeu de paramètre pour être performant doit obtenir des solutions performantes. Plusieurs critères de mesure de performance sont possibles :

CHAPITRE 5. OPTIMISATION MONO-OBJECTIVE

mean est un premier critère égal à la moyenne des fitness des meilleures solutions sur les cinq exécutions d’un jeu de paramètre donné ;

sd est la variance associée à la moyenne des fitness des meilleures solutions et est utilisée pour caractériser la notion de performance vis-à-vis de la robustesse, qui peut être vue comme un critère de qualité ;

rank est un critère de rang, correspondant à la moyenne des rangs de chaque configuration de paramètre sur les cinq exécutions. Les seize configurations sont pour cela ordonnées par rapport à la meilleure valeur de fitness atteinte pour chaque population initiale ;

● ● ● ● 0.450 0.475 0.500 0.525 0.550 0.575 0.1 0.2 0.3 0.4 0.5

Plage de variation aléatoire (r)

Cr itère nor malisé mo y en Tx de mut. (p)_● 0.1 0.2 0.3 0.4 ● ● ● ● 5.0 7.5 10.0 12.5 0.1 0.2 0.3 0.4 0.5

Plage de variation aléatoire (r)

Rang mo y en ● ● ● ● 0.06 0.08 0.10 0.1 0.2 0.3 0.4 0.5

Plage de variation aléatoire (r)

Dé

viation standard

Figure 5.7 – Tracé des critères mean (critère normalisé moyen), rank (rang moyen), et sd (variance) des configurations en fonction des plages de variation aléatoire r et des taux de mutation p.

Les jeux de paramètres sont ainsi comparés les uns aux autres suivant deux critères de performance des solutions obtenues et un critère de robustesse. La figure 5.7 représente ces trois valeurs en fonction de la plage de variation aléatoire et du taux de mutation. De façon générale, les courbes montrent que les indicateurs de performance sont meilleurs lorsque r augmente. C’est clairement le cas des critères mean et rank bien que les valeurs du critère rank soient similaires pour les deux dernières valeurs de r. En outre, les valeurs de ces deux critères dépendent peu du taux de mutation p. Le constat est différent pour le critère sd, qui présente des variations importantes à la fois avec le taux de mutation et la plage de variation, sans qu’une tendance particulière se dégage. Ainsi, pour les critères mean et rank, les meilleurs jeux de paramètres sont ceux pour lesquels le paramètre r est maximal et ceux pour lesquels r est minimal sont moins bons. La faible influence du taux de mutation sur ces critères rend difficile le choix d’une configuration à partir de ces courbes. Cependant, lorsque la plage de

variation aléatoire est grande, un taux de mutation trop élevé n’est pas recommandé. En effet, combiner un fort taux de mutation et une grande plage de variation aléatoire peut conduire à augmenter les capacités de diversification de l’algorithme, au prix de réduire la capacité d’exploitation et mener à des performances moindres. Il s’agit donc de trouver un compromis entre ces deux capacités.

Les performances des jeux de paramètres au regard des critères mean et rank sont très proches, puisque le coefficient de corrélation de Spearman entre eux est de 0.91. Cette forte corrélation entre ces deux critères indique que les meilleurs jeux de paramètres vis-à-vis d’un critère sont susceptibles de l’être vis-à-vis du second. Par exemple, les cinq premières confi- gurations (p, r) par rapport au critère mean sont dans l’ordre : (0.2, 0.5), (0.3, 0.5), (0.4, 0.5), (0.3, 0.2), (0.2, 0.2), et ces solutions se retrouvent respectivement en troisième, première, sixième, seconde et quatrième place par rapport au critère rank. Concernant le coefficient de corrélation entre les critères mean et sd, il est beaucoup plus faible (0.48), et les configurations précédentes se retrouvent donc respectivement en première, neuvième, seconde, cinquième et treizième places par rapport au critère sd. Nous faisons le choix de préférer plutôt les configu- rations donnant de bons résultats par rapport aux valeurs de critère mean et rank plutôt que par rapport au critère sd dans la mesure où d’autres études seraient nécessaires pour affiner l’évolution de ce critère en fonction des paramètres. Cette problématique de la robustesse de l’algorithme est néanmoins présente dans la suite de ce rapport, où d’autres méthodes sont appliquées pour réduire ce critère, et ainsi augmenter la robustesse des algorithmes utilisés.

Le jeu de paramètres sélectionné grâce à cette méthode correspond donc à un taux de mutation élevé p = 0.3, et une plage de variation aléatoire maximale r = 0.5. Cette confi- guration correspond au meilleur jeu de paramètre (respectivement le second) par rapport au critère rank (respectivement mean). Le premier jeu de paramètre par rapport au critère mean (p = 0.2 et r = 0.5) n’étant que troisième vis-à-vis du critère rank il n’est pas retenu. Dans le cadre de notre étude se basant sur un algorithme glouton, utilisant un nombre de ressources en parallèle important, et avec un nombre d’itérations (de générations) faible, il semble donc qu’une plage de variation aléatoire et un taux de mutation élevés soient recommandés.

La dynamique de recherche utilisant ces paramètres optimaux est donnée sur la figure 5.6 (dernière colonne, deuxième ligne en partant du haut). Sur cette figure, la meilleure solution est obtenue avec une population initiale différente de celle donnant la meilleure solution pour les paramètres de référence (Fig. 5.6 en bas à gauche), montrant que les meilleures solutions peuvent être obtenues à partir de populations initiales différentes. La différence entre la configuration de référence et celle optimisée réside dans les paramètres de l’opérateur de mutation. Contrairement à la dynamique de la recherche correspondante au jeu de paramètres de réfé- rence, la recherche avec les paramètres optimaux n’est cette fois plus autant bloquée sur des plateaux et la valeur du critère normalisé ne cesse de décroitre tout au long de l’optimisation. Le nombre d’améliorations est donc élevé et la meilleure solution trouvée présente cette une valeur de critère réduite de 65% par rapport à la valeur de la gestion actuelle, contrairement aux 40% obtenus avec les paramètres de mutation choisis initialement, cette amélioration se faisant en seulement 5 heures, c’est-à-dire environ un cinquième du temps de calcul de la pre- mière optimisation. Cette méthode montre l’importance des paramètres de l’algorithme pour trouver des solutions encore meilleures que celle obtenue avec les paramètres de référence, au prix d’un budget de calcul important. La seconde méthode de réglage propose de réduire ce coût.

CHAPITRE 5. OPTIMISATION MONO-OBJECTIVE

Dans le document Optimisation du pilotage d'un Réacteur à Eau Pressurisée dans le cadre de la transition énergétique à l'aide d'algorithmes évolutionnaires (Page 179-184)