Mod´elisation d’une grille de bureau xx - DYNAMIC LOAD BALANCING FOR ACTIVE OBJECTS ON COMPUTER

Dans les études des algorithmes d’équilibrage de charge, une des plus importantes car- actéristiques des nœuds est leur capacité de traitement. Une fonction, utilisant cette capacité et la quantité de travail qu’un nœud doit effectuer, détermine si un nœud est surchargé ou sous-chargé.

Un modèle fiable de la capacité de traitement est nécessaire pour une correcte modélisation des réseaux de bureau. Donc, un étude statistique des ordinateurs de bureau enregistrés au projet Seti@home [98] a été réalisé. Le projet Seti@home analyse les données obtenues du radio-télescope d’Arecibo, distribuant des unités des données parmi des ordinateurs et profitant la capacité de traitement de plus de200, 000 processeurs distribués autour du monde pour analyser les données. Nous analysons les Mega flops (Mflops) utilisés pour Seti@home qui on été rapportés par BOINC [3]. Nous considérons que Mflops est une bonne métrique pour déterminer la capacité de traitement dans ce calcul scientifique par- allèle, car nous sommes intéressés en traiter l’équilibrage de processus, pas des données.

4. MOD ´ELISATION xxix

Nous avons group´e les Mflops (dr) dans30 groupes avec la formule suivante:

dr ∈ Ctsi

j r 106

= t (1.4)

et nous avons fait l’histogramme de fr´equence, visible dans la Figure iv En d´efinissant une function de distribution normale

N (x) = 16000 × exp −(x − 1300)2 2 × 4002 (1.5) nous avons comparé la vraie distribution contre notre fonction modèle (N (x)) et nous avons une valeur des statistiques d’essai de Kolmogorov-Smirnov (KST) de KST = 0.0605 (voir l’Annexe C). Par conséquent, nous pouvons déduire avec un niveau de confi- ance de0.01 que la capacité de processeurs des réseaux à grand échelle peut être modelée par une distribution normale.

0 2000 4000 6000 8000 10000 12000 14000 16000 18000 0 500 1000 1500 2000 2500 3000 F r e q u e n c y M f l o p s

Figure iv: Distribution des fréquences des Mflops des 200,000 processeurs enregistrés dans Seti@home et la distribution normale qui fait la modélisation.

Pour obtenir les liens de notre grille de bureau, nous utilisons l’algorithme de l’infrastructure Pair-`a-Pair de ProActive [24], c’est-`a-dire:

1. Un nouveau pair doit avoir une liste d’adresses de ”serveur”. Les serveurs sont des pairs qui ont un potentiel élevé d’être disponibles et d’être dans le réseau de P2P, ces sont d’une certaine manière le noyau du réseau Pair-à-Pair.

2. En utilisant cette liste, le nouveau pair essaye de se communiquer avec le plus proche serveur. Quand un serveur est accessible, le nouveau pair l’ajoute dans sa liste de pairs connus (connaissances). Les serveurs sont les responsables de maintenir dans ses listes aux autres serveurs.

xxx EQUILIBRAGE DE CHARGE POUR DES OBJETS ACTIFS DANS LES GRILLES DE CALCUL´

3. Le nouveau pair doit découvrir de nouvelles connaissances par l’infrastructure Pair- à-Pair, en envoyant des messages d’exploration à ses connaissances. Chaque pair a la capacité de décider quand il veut arrêter le transfert du message: quand un pair reçoit le message, il doit décider s’il veut être une connaissance avec une probabilité donnée (expérimentalement définie entre0.66 et 0.75), s’il accepte, le message est transmis.

4. Chaque pair doit répéter le processus d’exploration pour avertir aux autres pairs qu’il est encore vivant et connecté.

Nous avons utilisé notre modèle pour simuler un logiciel développé avec ProActive et pour déterminer si notre algorithme d’équilibrage de charge peut présenter des problèmes s’il est utilisé dans une réseau à grand échelle.

Passage `a l’´echelle

Dans un réseau simulé, nous avons organisé les nœuds par ordre de capacité de traitement, de la plus haute à plus basse, et nous avons défini le sous-ensemble optimal comme les premiers OPT nœuds qui satisfont la condition:

OPT

i=1

µi > m × λ (1.6)

Après une simulation d’une application avec 100 objets actifs et en utilisant différente taille de réseau (n × n), nous avons découvert que:

• OPT(n = 10) = 13, • OPT(n = 20, 30) = 11, • OPT(n = 40) = 10, • OPT(n ∈ [50, 90]) = 9

Les résultats de la taille optimale de sous-ensemble (OPT) sont justifiés par le modèle de la capacité de traitement (une distribution normale): plus grande est la taille du réseau, plus haute est la capacité de traitement des meilleurs nœuds, et plus bas est le nombre de nœuds dans le sous-ensemble optimal.

Afin de mesurer l’exécution de notre algorithme dans les réseaux à grande échelle, nous définissons le rapport optimum d’algorithme (ALOP) comme:

ALOP= Nombre de nœuds utilis´es pour l’algorithme

OP T (1.7)

En même temps, nous calculons le nombre moyen de migrations accumulées effectuées par tous les objets actifs depuis le temps 0 jusqu’au temps t. Une augmentation de la taille du sous-ensemble de connaissances a comme conséquence une augmentation de la probabilité de trouver un nœud pour migrer, et par conséquent une augmentation de la probabilité d’atteindre l’état optimal. Recherchant le plus mauvais scénario traitable, et suivant les recommandations de [24], nous montrons seulement les résultats pour un sous-ensemble de taille3.

4. MOD ´ELISATION xxxi

La figure v montre les résultats de notre algorithme dans des réseaux den × n nodes, avecn = 10, 20, ..., 90. Notez que dans les premières unités du temps, notre algorithme augmente le nombre de nœuds employés, car les objets actifs sont placés dans un pe- tit sous-ensemble du réseau, produisant une surcharge élevée dans ce sous-ensemble. Puis, l’algorithme effectue rapidement des migrations pour réduire la surcharge. Puis, seulement l’étape de vol-des-travaux de notre algorithme groupe les objets actifs sur les meilleurs nœuds, réduisant le nombre de nœuds employés par l’algorithme. Les expériences ne rapportent aucun nœud surchargé au-delà du temps30.

La figure 6.9 pr´esente deux comportements au mˆeme temps:

1. Nombre de nœuds employés par l’algorithme, car le nombre de nœuds optimaux employés par une distribution statique (OP T ) est constant pour chaque nombre de nœuds (n×n). Nous voulons grouper tous les objets actifs dans un ensemble minimal de nœuds pour éviter les retards de communication.

2. Le rapport d’ALOP (nombre de nœuds employés par l’algorithme contre le nombre de nœuds employés par une distribution statique optimale OP T ); c’est-à-dire, la qualité des sous-ensembles minimaux trouvés par l’algorithme.

1 2 3 4 5 6 7 8 9 10 0 200 400 600 800 1000 n o d e s u se d : a lg o ri th m/ o p ti ma l time n=10x10 n=20x20 n=30x30 n=40x40 n=50x50 n=60x60 n=70x70 n=80x80 n=90x90

Figure v: Passage `a l’´echelle

La figure v montre comment dans un premier temps l’algorithme réagit contre une surcharge en distribuant les objets actifs dans le réseau et puis, il montre aussi comment un état stable est atteint en groupant des objets actifs. Un comportement ressemblant peut être vu dans la figure vi, avec un nombre élevé des migrations accumulées au début et après le système devient stable, ou ils existent quelques migrations afin de grouper les

xxxii ´EQUILIBRAGE DE CHARGE POUR DES OBJETS ACTIFS DANS LES GRILLES DE CALCUL

objets actifs sur les meilleurs processeurs. Pour toute taille de réseau étudiée, les courbes restent au-dessous de 6.5 migrations par objet actif. D’ailleurs, considérant seulement le temps 1000, nous pouvons voir que le nombre de migrations de notre algorithme est de l’ordreO(log(n)). Ces deux résultats sont prometteurs en termes de le passage à l’échelle de notre algorithme. 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 0 200 400 600 800 1000 n u m b e r o f m ig ra ti o n s time n=10x10 n=20x20 n=30x30 n=40x40 n=50x50 n=60x60 n=70x70 n=80x80 n=90x90

Figure vi: Migrations

Dans le document DYNAMIC LOAD BALANCING FOR ACTIVE OBJECTS ON COMPUTER GRIDS (Page 31-35)