7 . 4 Modèles parallèles pour l'exécution de l'algorithme génétiquegénétique

Plusieurs applications des AG aux domaines de la robotique, de l'intelligence artificielles ont été étudiées. Cependant leur coût d'exécution important reste un obstacle majeur pour leur développement. L'apparition des architectures parallèles a permis d'obtenir des résultats très satisfaisants en parallélisant ces algorithmes.

On distingue plusieurs modèles pour une exécution en parallèle de l'algorithme génétique :

(1) Le modèle ferme de processeurs, où un processeur maître effectue la sélection des paires d'individus et les envoie aux processeurs esclaves qui se chargent de la reproduction et de l'évaluation. Ce modèle est assez coûteux en communications, et n'est pas entièrement parallèle en effet l'étape de sélection est souvent séquentielle. Il est peu adapté à des machines parallèles, où les communications doivent être réduites si l'on veut garantir de bonnes performances.

(2) Le modèle à décomposition où la population est divisée en sous-populations, chacune placée sur un processeur. A notre avis, ce modèle est plus adapté que le précédent aux machines parallèles. Il est intéressant quand le nombre de processeurs est inférieur à la taille de la population. Toutefois, le parallélisme inhérent à une sous-population n'est pas exploité.

(3) Le modèle massivement parallèle où un individu est placé sur un processeur. Cette approche nous paraît la meilleure pour des machines parallèles où le nombre de processeurs ne cesse de croître. Cette approche est adoptée dans [Talb93]. Ainsi toutes les étapes se font en parallèle. La sélection est faîte après échange des individus entre processeurs.

Afin d'éviter que l'échange ne soit coûteux en communications, il est restreint au voisinage immédiat du processeur, à savoir les processeurs avec lesquels il est directement connecté.

La description de l'algorithme génétique exécuté par chaque processeur est la suivante :

104

• Générer individu initial local

• ordonner et évaluer pénalité individu local

• Tant que (nombre d'itérations ≤ maximum-itérations) faire

phase de communication (chaque processeur envoie son individu et attend ceux des autres)

sélection du meilleur individu parmi ceux reçus phase de reproduction

appliquer le croisement à (individu local et individu choisi) ordonner et évaluer pénalité individu local

appliquer la mutation aux individus fils générés

ordonner et évaluer la fonction coût si la pénalité est nulle phase de remplacement

fin faire

Figure n° 7.6 L'algorithme génétique parallèle

Il est à signaler que la fonction coût n'est pas souvent évaluée, en effet nous sommes particulièrement préoccupés par des allocations à pénalités nulles. La longueur de l'ordonnancement et le coût des communications ne deviennent des éléments de mesure qu'une fois qu'une pénalité nulle a été trouvée.

7.5 Evaluation des performances de l'algorithme

L'algorithme génétique a été implémenté sur la machine SuperNode. C'est une machine à mémoire distribuée composée de transputers reliés par un réseau d'interconnexion. L'algorithme a été implémenté sur une topologie en grille torique composée de 120 processeurs. Des mesures ont été prises pour des ensembles composés de huit et 30 tâches.

L'évaluation de cet algorithme est une tâche délicate, en effet la fonction coût est formée de plusieurs critères antagonistes. Prenons les paramètres pénalités accordés pour les tâches dépassant leurs échéances et celles répliquées. L'algorithme peut rapidement trouver une pénalité nulle et la perdre en essayant de réduire la réplication. Pour mettre en évidence l'influence des réplications sur les performances de l'algorithme, nous

présentons des mesures du nombre d'itérations moyen pour trouver le résultat quand l'ensemble de tâches n'est pas soumis à des duplications et par la suite quand certaines tâches doivent être dupliquées.

Les cas de figure pour lesquelles l'algorithme a été appliqué sont résumés dans les quatre benchmarks qui suivent :

• benchmark1 : un graphe de huit tâches sans duplication à placer sur deux processeurs,

• benchmark2 : un graphe de huit tâches dont trois ont été dupliquées à placer sur deux processeurs,

• benchmark3 : un graphe de 30 tâches sans duplication à placer sur deux processeurs,

• benchmark4 : un graphe de 30 tâches dont cinq ont été dupliquées à placer sur deux processeurs.

Pour chaque benchmark, 20 exécutions de l'algorithmes ont été réalisées.

7.5.1 Influence de la duplication des tâches

L'ensemble des tâches des benchmarks 3 et 4 ont des dates R_i assez proches, en effet la moyenne de l'écart entre les dates au plus tôt est de 3 ms. Les temps d'exécution varient entre 1ms et 40 ms. Ceci pour préciser que l'algorithme d'ordonnancement appliqué se retrouve fréquemment à réordonnancer les tâches. Les durées d'exécution de l'algorithme sont données en secondes.

La figure 7.7 résume les temps de calcul pour les quatre benchmarks suivants :

un ensemble de 8 tâches sans duplication

un ensemble de 8 tâches dont 3 sont dupliquées temps itérations temps itérations min max moyenne min max moyenne 1 2 0,5 1 1 20 0,6 1 1 0,75 9 0.85 un ensemble de 30 tâches sans duplication un ensemble de 30 tâches dont 5 sont dupliquées temps itérations temps itérations min max moyenne min max moyenne 2 33 0,8 3 4 100 1 15 13 1.25 40 9

106

Pour les deux ensembles de tâches on observe que l'algorithme converge rapidement vers une allocation correcte quand aucune tâche n'est dupliquée. Par contre, le nombre d'itérations est plus important quand certaines tâches sont dupliquées. Ceci s'explique par le fait que l'algorithme n'a aucun moyen de préserver le résultat obtenu quand il reste des tâches répliquées. Que ce résultat soit une pénalité nulle ou une réplication améliorée, l'opérateur de mutation va échanger deux tâches choisies aléatoirement (tout en veillant à créer des individus légaux). Même dans le cas où l'algorithme est modifié pour déplacer la tâche qui cause la réplication, rien ne garantit que l'individu obtenu aura une pénalité nulle.

On remarque également que le coût d'exécution ainsi que le nombre d'itérations croissent proportionnellement avec la taille du problème. En effet la qualité du résultat dépend de la taille de la population. Une taille de 120 individus est encore raisonnable pour l'ensemble des 30 tâches à placer, ce qui explique la rapidité de convergence. Toutefois, il faut s'attendre à ce que les performances de l'algorithme se dégradent pour des ensembles de tailles beaucoup plus importantes.

7 . 5 . 2 Influence des paramètres de l'algorithme

En ce qui concerne les probabilités d'application des opérateurs de croisement et de mutation, seule la mutation est appliquée avec une certaine probabilité et uniquement dans le cas où la pénalité et la réplication sont non nulles. L'opérateur de croisement que nous avons proposé pour notre algorithme ne nécessite pas de probabilité pour son application, en effet la recherche de points de croisement peut échouer (il n'existe pas de points de coupure permettant de générer des individus légaux).

En revanche, nous avons remarqué que l'opérateur de mutation a une influence sur la rapidité de convergence. Elle doit être fréquemment appliquée. Ceci s'explique par la manière dont il a été conçu. Dans la section 7.2.1, nous avons expliqué que la pénalité d'un processeur peut être considérablement réduite en retirant la première tâche qui dépasse son échéance. On observe d'ailleurs que dès la deuxième itération de l'algorithme, la pénalité est réduite considérablement.

1 0.9 0.7 0.5 0.3 0.1 20 40 60 80 100 120 ◊ ^◊ ◊ ◊ B2 B1 B3 B4

• • ^•

x x x x Probabilité de mutation nombre d'itérations moyen

Figure n° 7.8 Influence de la probabilité de mutation sur la qualité de la solution

Dans le document Un mécanisme d'ordonnancement distribué de tâches temps réel (Page 115-119)