Classification des applications parall` eles

Ap A+σ/2(p−1)

Ap σ(A−1/2)+n(1−σ/2)

Classification des applications parall` eles

a faible coˆut. Des grilles se d´eveloppent de plus en plus par l’interconnexion de ces grappes

homogènes. C’est le cas de la grille expérimentale Grid’5000 [25, 55] répartie sur le territoire

fran¸cais et destinée aux expérimentations des chercheurs en informatique. Dans cette thèse nous

nous intéresserons à cette forme particulière de supercalculateur virtuel peu hétérogène : les

agrégations hétérogènes de grappes homogènes. Ce type de plate-forme peut être hétérogène

entre les grappes (diff´erents types et nombre de processeurs, etc.) mais est homog`ene au sein

d’une grappe (processeurs de même vitesse, réseau local homogène, etc.). Aucune topologie

spécifique n’est imposée, mais le réseau d’interconnexion est souvent hiérarchique et rapide. Ces

plates-formes peu hétérogènes sont devenues très attrayantes car elles peuvent permettre de

déployer des applications parallèles à des échelles sans précédent.

2.3 Classification des applications parall`eles

Une application parallèle est composée soit d’une tâche pouvant s’exécuter sur plusieurs

processeurs, soit de plusieurs tˆaches (par exemple des sous-routines ou des boucles) dont certaines

peuvent s’exécuter en parallèle sur des ensembles de processeurs distincts. La modélisation d’une

application parallèle dépend aussi bien des tâches qui la composent que des interactions entre

ces tˆaches.

Il existe deux principales catégories de tâches : les tâches séquentielles et les tâches parallèles.

Une tâche séquentielle est une tâche qui ne s’exécute que sur un seul processeur. À l’inverse,

une tâche parallèle est telle que les données à traiter peuvent être réparties sur plusieurs

proces-2.3. Classification des applications parall`eles

seurs afin de s’exécuter concurremment. On parle alors de parallélisme de données. Les tâches

parallèles se déclinent également en diverses classes. Pour l’ordonnancement d’applications de

tâches parallèles, il est courant d’associer des modèles d’accélération aux tâches afin d’estimer

leurs temps d’ex´ecution en fonction des ressources allou´ees.

Dans les sections suivantes, nous présenterons différents types de tâches parallèles, des

mo-dèles d’accélérations de tâches parallèles avant de détailler diverses catégories d’applications

parall`eles.

2.3.1 Catégories de tâches parallèles

Il est possible de distinguer trois principales classes de tˆaches parall`eles selon leur

flexibi-lité [49]. En premier lieu, nous pouvons citer les tâches rigides où le nombre de processeurs

exécutant la tâche parallèle est fixée à priori. Ensuite, il y a lestâches modelables pour lesquelles

le nombre de processeurs n’est pas fixé mais est déterminé avant l’exécution. Après avoir été

fixé, ce nombre de processeurs ne change pas jusqu’à la fin de l’exécution. Enfin, lestâches

mal-léables peuvent voir le nombre de processeurs qui leur est alloué changer en cours d’exécution

(par préemption des tâches ou par redistribution des données).

Pour des raisons historiques, la plupart des applications soumises aux plates-formes de calcul

parallèle sont traitées comme étant des tâches rigides. Pourtant la plupart des tâches

paral-lèles sont intrinsèquement modelables puisqu’un programmeur ne connaˆıt pas nécessairement à

l’avance le nombre de processeurs qui seront disponibles à l’exécution. Le caractère malléable

d’une tˆache est plus facilement utilisable du point de vue de l’ordonnancement mais requiert

des fonctionnalités avancées (pouvoir préempter une tâche à tout moment de son exécution,

continuer ult´erieurement cette ex´ecution sur un ensemble de processeurs quelconque, ...) de la

part de l’environnement d’ex´ecution qui sont rarement disponibles.

Dans cette thèse nous nous intéresserons à l’ordonnancement d’applications composées de

tâches modelables. L’ordonnancement d’une application parallèle nécessite la prédiction du

temps d’exécution de chaque tâche en fonction des ressources utilisées. Cette prédiction peut

s’effectuer en utilisant des modèles d’accélération qui décrivent l’évolution du temps d’exécution

de chaque tâche parallèle en fonction du nombre de processeurs alloués à l’exécution. La section

suivante présente quelques uns de ces modèles d’accélération et discute du choix que nous allons

op´erer pour la suite de cette th`ese.

2.3.2 Modèles d’accélération

De nombreux modèles d’accélération [10, 15, 41, 46, 88] ont été proposés pour la prédiction

du temps d’exécution de tâches parallèles. Ces modèles supposent en général que l’ensemble de

processeurs utilisé est homogène et sont une fonction qui dépend du nombre de processeurs (p)

alloués à la tâche et de quelques paramètres liés à cette tâche. En pratique, les paramètres de

ces modèles sont déterminés pour être adaptés à chaque tâche soit analytiquement soit

expé-rimentalement. L’accélération S se définit comme étant le rapport entre le temps d’exécution

d’une tâche parallèle sur un processeur et son temps d’exécution sur p processeurs.

L’un des modèles les plus utilisés dans la littérature est la loi d’Amdahl [10]. Ce modèle

permet d’estimer le temps d’exécution d’une application parallèle sur une grappe homogène

(en termes de r´eseaux et de caract´eristiques des nœuds de calcul). Selon cette loi, le temps

d’exécution d’une tâche parallèlet est donné par :

T(t, p) =

α+1−α

p

·T(t,1), (2.1)

Chapitre 2. Plates-formes, applications parall`eles et ordonnancement

pétant le nombre de processeurs alloués àt,T(t,1) son temps d’exécution sur un seul processeur

(temps d’exécution séquentiel) et α sa portion non parallélisable. Cette loi stipule donc qu’une

tâche parallèle peut se décomposer en une partie parallélisable et une partie non parallélisable.

Le temps d’ex´ecution de la partie parall´elisable est inversement proportionnel aux nombre de

processeurs tandis que le temps d’ex´ecution de la partie non parall´elisable ne varie pas quelque

soit le nombre de processeurs disponibles (elle ne s’ex´ecute que sur un processeur). On peut

remarquer que ce modèle ne tient pas explicitement compte d’éventuels coûts de communications

entre les processeurs exécutant une même tâche. Ce modèle est donc plutôt adapté aux tâches

pour lesquelles les communications internes sont n´egligeables ou celles dont les calculs recouvrent

totalement les communications.

Un autre modèle d’accélération pour un ensemble homogène de processeurs est celui proposé

par Downey [41]. Ce modèle est une fonction non linéaire dépendant de deux paramètres A et

α+¹−α

A p≥A+Aσ−σ ^(2.3)

(t, p) = ^V

⁽^t⁾

v×p ^. ^(2.5)