• Aucun résultat trouvé

APPORT DE LA GRILLE DE CALCUL SUR LES TEMPS DE SIMULATION

Grille de calcul et gestion des simulations Monte-Carlo GATE

CHAPITRE 4. GRILLE DE CALCUL ET GESTION DES SIMULATIONS MONTE-CARLO GATE

4.3. APPORT DE LA GRILLE DE CALCUL SUR LES TEMPS DE SIMULATION

Fig.4.6:Comparaison des temps pour différents états des jobs sur la grille (Juin-2007)

CHAPITRE 4. GRILLE DE CALCUL ET GESTION DES SIMULATIONS MONTE-CARLO GATE Nous pouvons observer que les temps correspondants aux états "Submitted", "Waiting", et "Ready" (voir la section 4.2.2) sont négligeables par rapport aux temps totaux correspondants aux vies des jobs sur la grille. Par contre, le temps correspondant à l’état "Scheduled" (temps passé en file d’attente sur le CE) peut être très important. Cela dépend directement de la charge du CE et de la performance des machines qui constituent les nœuds.

Temps réels de calcul des simulations sur la grille

La figure 4.7 représente une comparaison des temps de calcul sur une machine locale (exé-cution sur 1 CPU, Intel Xeon 3 GHz ) par rapport aux temps de calculs totaux des simulations repartis sur la grille pour chaque série de test. Nous observons sur la figure 4.7 que le plus petit temps de calcul sur la grille EGEE dans le cas de ces tests est obtenu pour une répartition en 50 jobs sur la grille avec un gain maximum de 25 environ. Le nombre de CPUs libres sur la grille au moment des soumissions est un facteur très influent sur les temps en file d’attente et donc sur les temps totaux des travaux sur la grille.

Influence de la répartition d’une simulation sur la grille

Lorsqu’on repartit une simulation en une série de plusieurs simulations par exemple 100 sur la grille, la soumission également se fait en série, c’est à dire que la commande de soumission de l’intergiciel d’exploitation de la grille ne peut soumettre qu’un seul job à la fois. Les 100 tâches seront donc soumis l’une après l’autre. Cela induit un temps de lancement des tâches qui est illustré ici dans le cas de nos tests, par la figure 4.8.

Fig.4.8:Temps de lancement des jobs sur la grille (Juin-2007)

Ces temps de lancements comme aussi les temps de rapatriements des résultats, doivent être négligeables par rapport aux temps de calcul totaux. Cependant, ils peuvent être significatifs lorqu’on répartit un grand nombre de tâches sur la grille. Il est important de faire une estimation des temps de calcul totaux sur la grille et de faire ensuite une répartition optimal.

4.3. APPORT DE LA GRILLE DE CALCUL SUR LES TEMPS DE SIMULATION

Influence de la stabilité des ressources de la grille sur une période donnée

Afin d’examiner la stabilité de la grille et la fiabilité de nos tests de temps de calcul ils ont été répétés sur une période de 30 jours. La figure 4.9 représente les fluctuations obtenues pour une série de 50 jobs.

Fig.4.9:Comparaison de temps pour différents états des jobs sur la grille (Juin-2007)

Les chiffres obtenus dans nos tests montrent que la division d’une simulation Monte-Carlo en un très grand nombre de petits jobs n’est pas forcément la meilleure solution pour parallé-liser une simulation Monte-Carlo GATE. Il est nécessaire de tenir compte de plusieurs facteurs notamment le nombre de ressources disponibles pour l’application, la charge des machines et leurs performances. Les gains de temps obtenus (de l’ordre de 30) sur la grille pourraient être améliorés si les travaux soumis étaient longs en temps d’exécution. Cependant, pour les applica-tions de GATE impliquant les calculs de dose notamment dans l’eau, nous sommes relativement limité par la taille des fichiers de sorties ROOT générés durant la simulation. Effet ces fichiers ne peuvent actuellement dépasser 2 Giga octets de taille. Cela peut limiter donc le nombres de particules initialement simulés dans la tâche. La figure (4.9) montre une stabilité très satisfai-sante de la grille sur une période de 1 mois. On peut conclure que la charge de travail sur la grille est relativement bien reparti et que les temps d’attentes sont optimisés. Cependant ces types de tests devraient être étendus à tous les ressources de la VO "biomed" et sur une longue période pour mieux estimer les performances de la grille à une grande échelle.

4.3.2.2 Tests de temps pour une application en l’imagerie médicale

Dans le cadre d’une application de l’imagerie TEMP avec la plate-forme de simulation Monte-Carlo GATE, les simulations exécutées pour le calcul du projecteur dans les cas des données réelles ont nécessité un recours aux ressources de calcul et de stockage très importantes de la grille EGEE. 1813 simulations ont été exécutées sur la grille, la figure (4.10) présente les temps de

CHAPITRE 4. GRILLE DE CALCUL ET GESTION DES SIMULATIONS MONTE-CARLO GATE calcul moyens pour les 1813 simulations [El-Bitar, 2007]. Les barres représentées dans le graphe correspondent (de gauche à droite) respectivement au temps écoulé pendant que le tâche est en : soumission, attente, "ready", "scheduled", "running" (voir section 4.2.3). La barre à droite correspond au temps total nécessaire pour le traitement de la tâche sur la grille.

Fig. 4.10:Temps de calcul moyen pour 1813 simulations exécutées sur la grille (Application imagerie TEMP)

Le temps de calcul qui serait nécessaire pour exécuter 1813 simulations sur un processeur lo-cal serait d’environ 21756 heures CPU (≈ 907 jours) alors que cela nécessite une durée moyenne de 72 heures CPU (≈ 3 jours) sur la grille de calcul en utilisant en moyenne 600 processeurs sur les 3000 processeurs disponibles à l’époque des tests sur la grille. Ceci représente un facteur de gain de l’ordre de 300. Ce facteur de gain pourrait être plus important si l’on avait plus de ressources disponibles, ce qui réduirait le temps écoulé pendant que le Job est en scheduled. Le nombre limité de processeurs est dû au fait que le logiciel GATE n’est pas encore installé sur tous les processeurs de la grille, du fait des droits d’installation et de gestion des systèmes et de l’appartenance à une organisation virtuelle "biomed" qui dispose seulement d’une fraction de processeurs et non de la totalité.

Discussion et conclusion Aujourd’hui les méthodes de Monte-Carlo deviennent de plus en plus performantes et leur utilisation dans la planification des traitements clinique de radiothé-rapie est de plus en plus envisagée afin d’améliorer la précision des traitements. Cependant, les temps de calcul de ces méthodes doivent rivaliser avec ceux des méthodes analytiques utilisées. Les résultats obtenus par le calcul en parallèle sont très significatifs en termes de réduction des temps de calcul et valident la méthode de parallélisation utilisée. Les gains de temps sont très encourageants (de l’ordre de 25 à 30 pour nos applications dosimétriques et de l’ordre de 300 pour les applications en imagerie médicale) peuvent être très importants avec l’augmentation des ressources de la grille. La grille EGEE qui est actuellement dans sa phase de production offre donc une grande perspective pour l’utilisation des méthodes Monte-Carlo pour le calcul rapide de dose en radiothérapie.