Calcul de l’incertitude dans les simulations Monte Carlo

Tel que présenté précédemment, les simulations Monte Carlo reposent sur un générateur de nombres aléatoires et nécessitent beaucoup de photons pour obtenir des résultats justes et précis. Un aspect presque aussi important que le résultat de la simulation lui-même consiste en un calcul de l’erreur due à la nature aléatoire de la simulation. En effet, le résultat de la simulation peut être en accord avec certaines valeurs de références mais si l’incertitude est ´

enorme, la simulation ne veut plus vraiment rien dire. Une première fa¸con d’estimer l’incertitude et utilisée par le code BEAM [35] consiste à séparer chaque simulation complète en N simulations identiques plus petites, avec N = 10 habituellement. L’incertitude sur une quantité X est alors calculée avec

s_X¯ = s PN i=1 Xi− ¯X N (N − 1) (2.6)

avec Xi le r´esultat obtenu lors de la simulation ni, i ∈ [1, N ]. Trois probl`emes sont toutefois

pointés par Walter et al. [36]. Tout d’abord, le petit nombre de simulations N amène lui- même une incertitude sur le calcul de l’erreur statistique. Ensuite, aucune corrélation entre les photons lancés ne peut être tenue en compte comme c’est le cas lors de l’utilisation répétée d’un

espace de phase. Finalement, cette technique nécessite beaucoup de mémoire sur l’ordinateur car les résultats de plusieurs simulations doivent être conservés. C’est pourquoi le calcul de l’incertitude histoire par histoire a été développé par Walter et al. en se basant sur les travaux de Sempau et al. [37]. Avec cette technique, c’est le nombre total d’histoires, donc de photons simulés, qui est utilisé pour trouver l’incertitude en calculant

s_Y¯ = v u u u t 1 N − 1   PN i=1Yi2 N + PN i=1Yi N !2  (2.7)

avec N maintenant le nombre de photons simulés. Cette nouvelle technique nécessite maintenant d’emmagasiner Y_i, la quantité déposée dans un voxel, en même temps que Y_i2, ce qui requiert moins de mémoire que la méthode précédente. Aussi, comme le nombre de photons simulés est très élevé, le problème d’imprécision sur le calcul d’incertitude en raison d’un petit échantillonnage ne tient plus. Finalement, la corrélation entre les photons est directement prise en compte dans la valeur de N utilisé. Par exemple, si un espace de phase de N photons, produit par la simulation de N0 particules, est réutilisé M fois, seulement N0 est utilisé pour calculer l’incertitude et non M · N0.

L’algorithme Monte Carlo demeure toujours pour l’instant l’outil de calcul par excellence de distributions de doses en physique médicale. Malgré les techniques d’optimisation présentées, les temps de calcul demeurent encore trop lent pour une application clinique en curiethérapie. Plusieurs algorithmes Monte Carlo ont été développés en utilisant diverses approximations ou techniques qui n’ont pas été présentées précédemment. Mentionnons entres autres les codes ALGEBRA [38], MCPI [39] ou BrachyDose [40]. Ces trois codes fonctionnent sur des ordinateurs standards (CPU). Toutefois, depuis 2007, la compagnie de cartes graphiques (GPU) NVidia développe un langage de programmation permettant d’exploiter le parallélisme de calcul des composantes des GPU. Il s’agit d’une voie d’avenir pour le calcul haute performance et son application au Monte Carlo en physique médicale est déjà bien commencée.

Chapitre 3

Calculs parall`eles sur processeurs

graphiques

Les cartes pour l’affichage graphique présentes dans les ordinateurs modernes ont été con¸cu principalement afin de satisfaire les besoins de l’industrie du jeu vidéo. En effet, avec l’aug- mentation de la compléxité de l’affichage graphique de ces jeux, la puissance des cartes a augmenté de fa¸con importante au cours des dernières années. Cependant, il n’y a pas que l’industrie des jeux vidéos qui profitent de ces développement. En effet, le haut niveau de pa- rallélisation des opérations sur les cartes graphiques attire aussi l’attention des programmeurs. Ceux-ci voyaient un moyen compact et abordable pour effectuer des calculs plus généraux en parallèle sans la nécessité d’avoir accès à une grappe de calcul. C’est toutefois en 2007 avec le lancement de l’architecture CUDA [41], pour Compute Unified Device Architecture, par la compagnie NVIDIA que le calcul sur processeurs graphiques a gagné en popularité. Avec quelques ajouts simples au langage informatique C, le calcul sur carte graphique est maintenant de- venu accessible pour les programmeurs plus ou moins aguerris. Les applications scientifiques du calcul sur processeur graphique est dorénavant très répandu comme en témoigne la figure

3.1 [42].

Dans ce chapitre, le calcul sur carte graphique avec la plate-forme CUDA est brièvement présenté. Bien qu’assez techniques, les éléments présentés permettront de mieux comprendre comment a été con¸cu l’algorithme Monte Carlo sur processeur graphique décrit au prochain chapitre. Aussi, même si différentes alternatives se présentent aux programmeurs désirant effectuer des calculs sur processeurs graphiques, la plate-forme CUDA est considérée ici en raison de sa facilité d’utilisation du point de vue de la programmation. Plusieurs concepts nécessaires à la compréhension d’un algorithme utilisant les processeurs graphiques seront présentés dans les prochaines sections.

Figure 3.1: Différents secteurs d’applications du calcul sur carte graphique présentés sur le site web de NVIDIA [42].

Figure 3.2: Diff´erence structurelle entre les processeurs standards et graphiques [41].

3.1 Architecture d’une carte graphique

Tout comme les processeurs standards à l’intérieur des ordinateurs de bureau, les processeurs graphiques sont composés de plusieurs millions ou milliards de transistors. L’utilisation de ces transistors diffère cependant : pour un processeur standard, une bonne partie est consacrée au contrôle et à la gestion des données alors que sur une carte graphique, la majorité s’occupent des opérations à effectuer comme le montre la figure3.2[41]. C’est d’ailleurs la raison faisant en sorte que les processeurs graphiques sont aptes à calculer de fa¸con intensive sur des données en parallèle. Sur la figure, ce sont les composantes vertes, les unités d’arithmétique et de logique (arithmetic logic unit ou ALU en anglais), qui se chargent d’effectuer les opérations sur les données.

Une connaissance approfondie de la structure interne d’une carte graphique est loin d’être nécessaire afin de programmer avec la plate-forme CUDA. Cependant, certaines caractéristiques de son architecture permettent de comprendre ce qui se passe lorsque des instructions sont envoyées. La figure3.3[43] montre l’aspect d’un multi-processeur (Streaming Multiprocessor ou SM) moderne qu’on trouve sur une carte graphique. Il apparaˆıt évident qu’il s’agit d’une structure complexe possédant beaucoup de composantes. Celles d’intérêt pour le moment sont

Figure 3.3: Allure g´en´erale d’un multi-processeur sur une carte graphique [43]. carte # SM # coeurs/SM GFLOPS

8800 GT (2007) 16 8 504 GTX 580 (2010) 16 32 1581 GTX Titan (2013) 14 192 4500

Table 3.1: Puissance de calcul pour diff´erentes cartes graphiques [44].

les stuctures en vert qui s’appellent coeur CUDA. Ce sont ces composantes qui effectuent les calculs en parallèle sur la carte graphique. De fa¸con simple, plus il y a de coeurs CUDA pour un multi-processeur, plus il y a de données traitées en même temps en parallèle. La figure 3.3

montre que ces coeurs CUDA sont nombreux. Étant donné que plusieurs multi-processeurs comme celui de la figure 3.3se trouvent sur la carte graphique, la puissance de calcul et le niveau de parallélisation augmentent très rapidement. D’ailleurs, le nombre de coeurs CUDA par multi-processeur est la composante principale qui fait augmenter la performance des calculs comme le montre le tableau3.1[44]. Pour évaluer la puissance d’une carte graphique, le nombre d’opérations effectuées par seconde sur des nombres décimals est déterminé en GFLOPS pour Billion(G) floating-point (FL) operations (O) per second (S). Le tableau 3.1 montre qu’avec l’évolution et le développement de la technologie des cartes graphiques au cours des années, la puissance de calcul s’est accrue très rapidement. La figure 3.4 [41] présente quant à elle

Figure 3.4: Évolution de la puissance de calcul en GFLOPS avec les années selon le modèle de carte graphique [41].

l’évolution avec les années de la puissance de calcul des processeurs standards comparative- ment à celle des cartes graphiques.

Dans le document Simulations Monte Carlo sur processeur graphique en curiethérapie à bas débit de dose pour le cancer de la prostate (Page 38-44)