Adaptation dynamique du nombre de threads

8.5 Exemple 2 : serveur web

8.5.3 Adaptation dynamique du nombre de threads

Puisque Comanche ne supporte que les requêtes statiques correspondant à des fichiers, ses performances sont limitées essentiellement par les entrées-sorties, qui bloquent le traitement d’une requête le temps de lire les données sur le disque. Pour pallier ce problème, Comanche délègue l’ordonnancement des requêtes à un composant scheduler, qui peut avoir plusieurs implémentations : traitement séquentiel, un thread par requête, ou utilisation d’un pool de threads. Chaque implémentation a des avantages et inconvénients, mais l’utilisation d’un pool de threads déjà créés est le meilleur compromis entre temps de réponse et ressources utilisées. Cependant, les performances d’un tel composant d’ordonnancement dépendent de la taille pour le pool, c’est-à-dire du nombre de threads utilisables.

Notre dernier scénario d’adaptation va consister à modifier dynamiquement le nombre de threads alloués à l’ordonnanceur. Plus le nombre de requêtes qui peuvent effectivement être traitées en parallèle est important, plus il est intéressant d’allouer de threads pour pouvoir tirer partie de ce parallélisme. En revanche, allouer trop de threads par rapport à ce qui peut effectivement être utilisé par le système nuit aux performances, car les threads eux-mêmes sont gourmands en ressources (mémoire et changements

En pratique, un tel événement n’est pas généré à chaque fois que la mémoire libre change, mais à chaque fois qu’un tel changement est détecté par WildCAT. La granularité temporelle des mesures (et donc les performances) dépendent donc de la configuration de la sonde WildCAT correspondante.

de contexte). Le degré de parallélisme dépend quant à lui : (i) du nombre total de processeurs présents sur la machine, et (ii) de la proportion des requêtes qui nécessitent un accès au disque, obligatoirement séquentiel.

Informations contextuelles. Les informations dont nous avons besoin pour ´ecrire la politique d’adaptation sont les suivantes :

– Le nombre de processeurs présents sur la machine hôte, qui détermine le nombre maximum de threads qui peuvent réellement s’exécuter en parallèle (en supposant qu’ils ne soient pas bloqués par des entrées / sorties). Ce nombre inclut à la fois les processeurs physiques et les processeurs virtuels présents sur les dernières générations de puces (Hyper-Threading). Le nombre de processeurs physiques peut être obtenu de WildCAT grâce à l’expression count(sys ://cpus/*), et pour chacun de ces processeurs physiques, l’attribut @flag_ht (pour Hyper-Threading) indique que la puce contient en fait deux processeurs. Le langage des expressions WildCAT n’est actuellement pas assez puissant pour permettre d’écrire une expression telle que sum(sys ://cpus/*@virtual_cpus), où virtual_cpusserait un attribut synthétique valant 1 ou 2 suivant la valeur du drapeau @flag_ht. Actuellement, toutes les machines qui supporte l’Hyper-Threading sont homogènes, c’est-à-dire que si elles ont plusieurs processeurs physiques, ces derniers sont tous du même type. Nous utiliserons cette limitation pour définir un attribut synthétique sys ://cpus@virtual_cpus de la manière suivante :

sys://cpus@virtual_cpus = count(sys://cpus/*) * if(sys://cpus/cpu0@flag_ht, 2, 1) Ce nouvel attribut indique le nombre total de processeurs disponibles sur la machine hˆote.

– Le taux de réussite du composant cache, c’est-à-dire le pourcentage de requêtes qui sont traitées directement par le cache sans accéder au disque. Plus ce taux est élevé, plus le nombre de requêtes qu’il est possible de traiter en parallèle est grand. Cette valeur est accessible sous la forme d’un paramètre en lecteur seule (hitRate) du composant cache décrit dans le scénario précédent. Politique d’adaptation. Ce scénario d’adaptation nécessite deux politiques d’adaptation, car il fait interagir des composants « éloignés » dans l’architecture de l’application (le cache et l’ordonnanceur). La politique principale, destinée au composite frontend qui encapsule l’ordonnanceur, est très simple :

policy adaptive-scheduling = { rule{

when a:parameter-changed($target/child::*[contains(name(.), ’cache’)]/@hitRate) do { procs := sys://cpus@virtual_cpus; rate := $a.new-value; set-value($target/scheduler/@poolSize, (2 + 4*$rate)*$procs; } } }

Son unique règle détecte les événements endogènes correspondant aux variations du taux de réussite du cache11_{. Lorsque ce taux change, l’action de reconfiguration consiste simplement `}_{a ajuster le nombre}

de threads alloués à l’ordonnanceur en tenant compte à la fois du nombre de processeurs disponibles et du taux de réussite du cache. Chaque processeur se voit allouer initialement deux threads, et ce nombre est augmenté proportionnellement au taux de réussite du cache (exprimé en pourcentages). Ainsi, une machine quadri-processeur dont le cache fonctionne répond directement à 50% des requêtes se verra allouer (2 + 4 ∗ 0.5) ∗ 4 = 16 threads.

Cette premi`ere politique acc`ede au composant cache en utilisant le chemin FPath $target/child: :*[contains(name(.), ’cache’)]/@hitRate. Or, dans l’architecture initiale, le composant cache fait partie du composite handler et non du composant cible de cette politique (frontend, aka $target),

Si la machine hôte supporte l’ajout et le retrait dynamique de processeurs, il suffit de changer le descripteur d’événement pour prendre en compte ce nouveau paramètre : parameter-changed(...) or changed(sys ://cpus@virtual_cpus).

Fig. 8.6 – Architecture globale de Comanche.

comme le montre la figure 8.6. Cependant, puisque Fractal supporte le partage de composants, rien n’empˆeche le cache de faire aussi partie de frontend. C’est ce que permet d’obtenir la seconde politique de notre sc´enario : policy adaptive-scheduling-helper = { rule { when b:binding-created($target/dispatcher/interface::*) if ($b.server-interface/component::*[contains(name(.), ’cache’)]) do { new-cache := $b.server-interface/component::*; frontend := $target/ancestor::comanche/frontend; old-cache := $frontend/cache;

if (old-cache != new-cache) then { remove($frontend, $old-cache); add($frontend, $new-cache); } } } }

Celle-ci est destinée au composant handler, tout comme la politique de gestion du cache du premier scénario. Elle réagit à l’activation du cache en détectant la création d’une connexion entre le composant dispatcheret un composant dont le nom contient cache. De cette manière, à chaque fois que la politique d’adaptation du scénario précédent ré-active le cache (action enable-cache), cette règle est déclenchée. Sa réaction consiste à ajouter le nouveau composant cache au composite frontend (après avoir éventuel- lement supprimé l’ancien). Le cache actif est ainsi toujours disponible localement dans frontend, ce qui permet le bon fonctionnement de la première politique.

Cette manipulation est rendue obligatoire par l’implémentation actuelle de safran, car pour des raisons de performances la détection des événements endogènes (dont bindingcreated et parameter- changed) est limitée en terme de portée au composant source de l’événement et à ses parents directs. Si cette limitation n’existait pas, la première politique, adaptive-scheduling, pourrait référencer directement le composant cache par $target/parent::*/backend/handler/cache/@hitRate dans son descripteur d’événement12_.

Cette solution aurait cependant le désavantage de rendre la politique directement dépendante de la localisation du cache, information qui est actuellement encapsulée dans la politique adaptive-scheduling-helper.

Déploiement. Le déploiement de la politique adaptive-scheduling peut se faire à n’importe quel moment, mais ce n’est pas le cas de adaptive-scheduling-helper. En effet, cette dernière réagit à un événement endogène (l’activation du cache) qui est déclenché par une autre politique attachée au même composant. Étant données les règles de composition qui s’appliquent lorsque plusieurs politiques sont attachées à un même composant (cf. Section 7.4.4), adaptive-scheduling-helper doit donc être attachée après la politique adaptive-cache du premier scénario. Une fois toutes les politiques déployées, le nombre de threads alloués à l’ordonnanceur sera ajusté automatiquement au nombre de processeurs présents et au taux de réussite du cache, à chaque fois que ce taux change ou qu’un nouveau cache est activé.

Dans le document Développement de composants Fractal adaptatifs : un langage dédié à l'aspect d'adaptation (Page 180-183)