• Aucun résultat trouvé

Mod´elisation d’une grille de bureau xx

Dans les ´etudes des algorithmes d’´equilibrage de charge, une des plus importantes car- act´eristiques des nœuds est leur capacit´e de traitement. Une fonction, utilisant cette capacit´e et la quantit´e de travail qu’un nœud doit effectuer, d´etermine si un nœud est surcharg´e ou sous-charg´e.

Un mod`ele fiable de la capacit´e de traitement est n´ecessaire pour une correcte mod´elisation des r´eseaux de bureau. Donc, un ´etude statistique des ordinateurs de bureau enregistr´es au projet Seti@home [98] a ´et´e r´ealis´e. Le projet Seti@home analyse les donn´ees obtenues du radio-t´elescope d’Arecibo, distribuant des unit´es des donn´ees parmi des ordinateurs et profitant la capacit´e de traitement de plus de200, 000 processeurs distribu´es autour du monde pour analyser les donn´ees. Nous analysons les Mega flops (Mflops) utilis´es pour Seti@home qui on ´et´e rapport´es par BOINC [3]. Nous consid´erons que Mflops est une bonne m´etrique pour d´eterminer la capacit´e de traitement dans ce calcul scientifique par- all`ele, car nous sommes int´eress´es en traiter l’´equilibrage de processus, pas des donn´ees.

4. MOD ´ELISATION xxix

Nous avons group´e les Mflops (dr) dans30 groupes avec la formule suivante:

dr ∈ Ctsi

j r 106

k

= t (1.4)

et nous avons fait l’histogramme de fr´equence, visible dans la Figure iv En d´efinissant une function de distribution normale

N (x) = 16000 × exp  −(x − 1300)2 2 × 4002  (1.5) nous avons compar´e la vraie distribution contre notre fonction mod`ele (N (x)) et nous avons une valeur des statistiques d’essai de Kolmogorov-Smirnov (KST) de KST = 0.0605 (voir l’Annexe C). Par cons´equent, nous pouvons d´eduire avec un niveau de confi- ance de0.01 que la capacit´e de processeurs des r´eseaux `a grand ´echelle peut ˆetre model´ee par une distribution normale.

0 2000 4000 6000 8000 10000 12000 14000 16000 18000 0 500 1000 1500 2000 2500 3000 F r e q u e n c y M f l o p s

Figure iv: Distribution des fr´equences des Mflops des 200,000 processeurs enregistr´es dans Seti@home et la distribution normale qui fait la mod´elisation.

Pour obtenir les liens de notre grille de bureau, nous utilisons l’algorithme de l’infras- tructure Pair-`a-Pair de ProActive [24], c’est-`a-dire:

1. Un nouveau pair doit avoir une liste d’adresses de ”serveur”. Les serveurs sont des pairs qui ont un potentiel ´elev´e d’ˆetre disponibles et d’ˆetre dans le r´eseau de P2P, ces sont d’une certaine mani`ere le noyau du r´eseau Pair-`a-Pair.

2. En utilisant cette liste, le nouveau pair essaye de se communiquer avec le plus proche serveur. Quand un serveur est accessible, le nouveau pair l’ajoute dans sa liste de pairs connus (connaissances). Les serveurs sont les responsables de maintenir dans ses listes aux autres serveurs.

xxx EQUILIBRAGE DE CHARGE POUR DES OBJETS ACTIFS DANS LES GRILLES DE CALCUL´

3. Le nouveau pair doit d´ecouvrir de nouvelles connaissances par l’infrastructure Pair- `a-Pair, en envoyant des messages d’exploration `a ses connaissances. Chaque pair a la capacit´e de d´ecider quand il veut arrˆeter le transfert du message: quand un pair rec¸oit le message, il doit d´ecider s’il veut ˆetre une connaissance avec une probabilit´e donn´ee (exp´erimentalement d´efinie entre0.66 et 0.75), s’il accepte, le message est transmis.

4. Chaque pair doit r´ep´eter le processus d’exploration pour avertir aux autres pairs qu’il est encore vivant et connect´e.

Nous avons utilis´e notre mod`ele pour simuler un logiciel d´evelopp´e avec ProActive et pour d´eterminer si notre algorithme d’´equilibrage de charge peut pr´esenter des probl`emes s’il est utilis´e dans une r´eseau `a grand ´echelle.

Passage `a l’´echelle

Dans un r´eseau simul´e, nous avons organis´e les nœuds par ordre de capacit´e de traitement, de la plus haute `a plus basse, et nous avons d´efini le sous-ensemble optimal comme les premiers OPT nœuds qui satisfont la condition:

OPT

X

i=1

µi > m × λ (1.6)

Apr`es une simulation d’une application avec 100 objets actifs et en utilisant diff´erente taille de r´eseau (n × n), nous avons d´ecouvert que:

• OPT(n = 10) = 13, • OPT(n = 20, 30) = 11, • OPT(n = 40) = 10, • OPT(n ∈ [50, 90]) = 9

Les r´esultats de la taille optimale de sous-ensemble (OPT) sont justifi´es par le mod`ele de la capacit´e de traitement (une distribution normale): plus grande est la taille du r´eseau, plus haute est la capacit´e de traitement des meilleurs nœuds, et plus bas est le nombre de nœuds dans le sous-ensemble optimal.

Afin de mesurer l’ex´ecution de notre algorithme dans les r´eseaux `a grande ´echelle, nous d´efinissons le rapport optimum d’algorithme (ALOP) comme:

ALOP= Nombre de nœuds utilis´es pour l’algorithme

OP T (1.7)

En mˆeme temps, nous calculons le nombre moyen de migrations accumul´ees effectu´ees par tous les objets actifs depuis le temps 0 jusqu’au temps t. Une augmentation de la taille du sous-ensemble de connaissances a comme cons´equence une augmentation de la probabilit´e de trouver un nœud pour migrer, et par cons´equent une augmentation de la probabilit´e d’atteindre l’´etat optimal. Recherchant le plus mauvais sc´enario traitable, et suivant les recommandations de [24], nous montrons seulement les r´esultats pour un sous-ensemble de taille3.

4. MOD ´ELISATION xxxi

La figure v montre les r´esultats de notre algorithme dans des r´eseaux den × n nodes, avecn = 10, 20, ..., 90. Notez que dans les premi`eres unit´es du temps, notre algorithme augmente le nombre de nœuds employ´es, car les objets actifs sont plac´es dans un pe- tit sous-ensemble du r´eseau, produisant une surcharge ´elev´ee dans ce sous-ensemble. Puis, l’algorithme effectue rapidement des migrations pour r´eduire la surcharge. Puis, seulement l’´etape de vol-des-travaux de notre algorithme groupe les objets actifs sur les meilleurs nœuds, r´eduisant le nombre de nœuds employ´es par l’algorithme. Les exp´eriences ne rapportent aucun nœud surcharg´e au-del`a du temps30.

La figure 6.9 pr´esente deux comportements au mˆeme temps:

1. Nombre de nœuds employ´es par l’algorithme, car le nombre de nœuds optimaux employ´es par une distribution statique (OP T ) est constant pour chaque nombre de nœuds (n×n). Nous voulons grouper tous les objets actifs dans un ensemble minimal de nœuds pour ´eviter les retards de communication.

2. Le rapport d’ALOP (nombre de nœuds employ´es par l’algorithme contre le nombre de nœuds employ´es par une distribution statique optimale OP T ); c’est-`a-dire, la qualit´e des sous-ensembles minimaux trouv´es par l’algorithme.

1 2 3 4 5 6 7 8 9 10 0 200 400 600 800 1000 n o d e s u se d : a lg o ri th m/ o p ti ma l time n=10x10 n=20x20 n=30x30 n=40x40 n=50x50 n=60x60 n=70x70 n=80x80 n=90x90

Figure v: Passage `a l’´echelle

La figure v montre comment dans un premier temps l’algorithme r´eagit contre une surcharge en distribuant les objets actifs dans le r´eseau et puis, il montre aussi comment un ´etat stable est atteint en groupant des objets actifs. Un comportement ressemblant peut ˆetre vu dans la figure vi, avec un nombre ´elev´e des migrations accumul´ees au d´ebut et apr`es le syst`eme devient stable, ou ils existent quelques migrations afin de grouper les

xxxii ´EQUILIBRAGE DE CHARGE POUR DES OBJETS ACTIFS DANS LES GRILLES DE CALCUL

objets actifs sur les meilleurs processeurs. Pour toute taille de r´eseau ´etudi´ee, les courbes restent au-dessous de 6.5 migrations par objet actif. D’ailleurs, consid´erant seulement le temps 1000, nous pouvons voir que le nombre de migrations de notre algorithme est de l’ordreO(log(n)). Ces deux r´esultats sont prometteurs en termes de le passage `a l’´echelle de notre algorithme. 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 0 200 400 600 800 1000 n u m b e r o f m ig ra ti o n s time n=10x10 n=20x20 n=30x30 n=40x40 n=50x50 n=60x60 n=70x70 n=80x80 n=90x90

Figure vi: Migrations

Documents relatifs