Gestion du parall´ elisme dans les cas `a faible nombre de ressources

code SML

Chapitre 4 SKiPPER-II : une solution `a l’imbrication

4.6.3 Gestion du parall´ elisme dans les cas `a faible nombre de ressources

Comme nous l’avons vu, un atout majeur de SKiPPER-II est de pouvoir gérer indifférem-ment les cas où le nombre de ressources pour l’exécution de l’application est suffisant et ceux dans lesquels il ne l’est pas, notamment celui où une unique ressource est disponible (émulation séquentielle).

Malheureusement cette souplesse se paie lorsque le nombre de processeurs physiquement disponibles est faible (de l’ordre de 2 à 4) et qu’ils ne disposent pas de possibilités de multi-tâche. En effet, dans ce cas, certains processus maˆıtres vont monopoliser des unités de traite-ment pour leur seul fonctionnetraite-ment sans que celles-ci puissent être affectées à un traitetraite-ment réel (fonction utilisateur de calcul). La figure 4.14 montre ainsi ce qui se passe sur un petit exemple. L’arbre qui y est représenté est le schéma de l’application. Deux squelettes TF/II y sont imbri-qués (les deux instances du squelette imbriqué ont été distinguées par des numeros différents pour plus de lisibilité). L’architecture proposée est constituée de seulement 4 processeurs. Sur chacun d’eux est installée une unique copie du noyau. Le schéma montre, sous chaque proces-seur symbolisé, la liste des processus affectés à chaque copie du noyau. On a supposé pour les besoins de l’exemple que l’exécution de l’esclave S2A est presque aussi longue que l’exécution des esclaves S3A et S3B réunis (cas le plus défavorable). S2B est mis entre parenthèses pour indiquer que son exécution n’a pas lieu en même temps que les trois autres esclaves : S2A, S3A et S3B ont une exécution quasi-simultanée, alors que S2B est pratiquement seul a s’exécuter au moment de son activation. La figure 4.15 donne le diagramme temporel de l’activation de ces processus. Ces figures montrent clairement que les deux processeurs auquels sont affectés les processus maˆıtres (Mx) passent leur temps à attendre la fin d’exécution de leurs esclaves, et donc ne participent pas véritablement au travail proprement dit ; alors que dans le même temps l’exécution des esclaves (Sxy) en vient à être, en partie, séquentialisée.

Dans le cas de processeurs disposant de capacités de multi-tâche, le problème persiste mais ne se pose pas dans les mêmes termes. Ici l’exécution d’un maˆıtre peut être recouverte par l’exécution d’un esclave, mais dans ce cas le point délicat est le choix du nombre d’esclaves qu’on souhaite pouvoir affecter à chaque processeur et du nombre de ressources qui lui sont affectées. Normalement, un seul esclave devrait être autorisé à s’exécuter sur un même proces-seur, ce qui peut être décidé par le PLServer, mais il n’en reste pas moins que la distribution optimum des esclaves et des maˆıtres sur les processeurs disposants de plusieurs ressources est un problème difficile, non pris en compte actuellement par SKiPPER-II. De ce fait, le nombre de ressources allouées à chaque processeur est laissé à la discrétion de l’utilisateur qui peut la modifier directement au moment de l’exécution de son application (sans recompilation ou modi-fication du code). Mais cette possibilité reste cependant un paramètre délicat à régler. La figure 4.16 illustre le cas du multi-tâche sur le même schéma d’application que pour l’exemple précé-dent. Ici aussi les deux instances du TF/II imbriqué sont numérotées différemment afin de les distinguer. L’utilisation dans cet exemple du même nombre de processeurs que précédemment, mais de deux copies du noyau par processeur, fait qu’il y a suffisamment de copies disponibles pour que tous les squelettes (3 au total) puissent se déployer complètement et simultanément. Ainsi, sur la figure, on peut voir que trois copies jouent le rôle des trois processus maˆıtres, et que quatre autres servent d’esclaves. Les esclaves sont ici affectés à des copies qui se trouvent sur des processeurs dont les autres copies ne supportent pas l’exécution d’autres esclaves, tout au plus celles de processus maˆıtres. La figure 4.17 donne quant à elle le diagramme d’activation des processus en question pour la configuration choisie.

Liste des processus affectes a chaque copie du noyau M1

M2 M3

S2A S2B S3A S3B

Architecture utilisee : 4 processeurs

Configuration du noyau : 1 copie par processeur

M1 M2 M3 S2A

S3A S3B

( S2B ) Sxy : processus esclave Mx : processus maitre Schema de l’application

Temps M1 M1 M2 M3 S3A S2A M1 M3 M3 M2 M2 S2B S3B

Copie Copie Copie Copie

processeur 1 processeur 2 processeur 3 processeur 4

FIG. 4.15 – Diagramme temporel d’activation des processus pour un nombre de ressources tr`es

Schema de l’application M1

M2 M3

S2A S2B S3A S3B

Architecture utilisee : 4 processeurs

Configuration du noyau : 2 copies par processeur

Sxy : processus esclave Mx : processus maitre

M1 M2 M3 S2A

S3B

S3A S2B

FIG. 4.16 – Placement des processus pour un nombre de processeurs limit´es, mais avec

M3

M1

Temps

S3A

M1

M2

S2B

M3

S3B

S2A

M2

copie 1

copie 5 copie 6 copie 7 copie 8

copie 4

copie 3

copie 2

processeur 1 processeur 2 processeur 3 processeur 4

FIG. 4.17 – Diagramme temporel d’activation des processus pour un nombre de processeurs

4.7 Conclusion

Le développement de SKiPPER-II découle de la volonté de proposer une version de l’en-vironnement pouvant prendre en charge l’imbrication de squelettes algorithmiques. Pour ce faire, le modèle d’exécution essentiellement statique de la version précédente a été aban-donné au profit d’un modèle complètement dynamique. En effet, SKiPPER-I différenciait les squelettes statiques des squelettes dynamiques parce qu’il fonctionnait avec un modèle sta-tique d’exécution, alors que certains des squelettes ont un comportement par nature dynamique. SKiPPER-II élimine cet aspect pour ne gérer qu’un seul et unique modèle d’exécution : le mo-dèle dynamique. Nous avons choisi ce momo-dèle car le momo-dèle statique ne permettait pas à lui seul de rendre compte du comportement de tous nos squelettes, et empêchait de ce fait l’obtention d’une représentation homogène des squelettes. Or cette représentation est nécessaire pour au-toriser une composition régulière des squelettes, c’est-à-dire se faisant toujours de la même fa¸con quelles que soient la composition et les types de squelettes qui interviennent, en l’absence de toute exception dans la description d’une composition particulière.

Un méta-squelette (TF/II) a ainsi été proposé afin de facilité l’imbrication en rendant les aspects de composition plus homogènes. SKiPPER-II se fonde de ce fait sur un noyau chargé d’exécuter les squelettes des applications après leur mise sous la forme de TF/II.

Bien entendu le revers de cette approche est d’ajouter aux squelettes intrinséquement sta-tiques (comme le SCM) un certain coût dû à leur gestion à la volée qui pourrait être supprimée puisque leur comportement au cours du temps (et spatialement) peut être complètement prédit. Mais cette surcharge peut être réduite en utilisant un schéma de communication adéquat comme cela est fait dans SKiPPER-II.

Les avantages principaux de cette approche sont donc :

- une gestion identique de tous les squelettes ( statiques et dynamiques), - des possibilit´es de composition syst´ematiques des squelettes,

- la gestion dynamique des processeurs disponibles¹⁴,

- une émulation séquentielle directe (plus de distinction avec une exécution parallèle), - une grande portabilité de l’environnement,

- une extensibilit´e de la base des squelettes facilit´e,

- la compatibilité avec la version précédente de SKiPPER.

Le chapitre suivant illustre et valide l’approche retenue pour SKiPPER-II à travers l’ex-périmentation d’applications de complexité variable. Le comportement de SKiPPER-II y est quantifié et comparé à celui de SKiPPER-I.

Cette caractéristique offre notamment, par l’intermédiaire du PLServer (voir la section 4.3.4.1 page 103), la possibilité d’envisager à terme un certain niveau de tolérance aux fautes pour SKiPPER-II.

Chapitre 5

Dans le document Composition de squelettes algorithmiques : application au prototypage rapide d'applications de vision (Page 97-104)