• Aucun résultat trouvé

Résultats des expériences numériques parallèles sur HPC@LR

6.2 Expériences numériques parallèles

6.2.1 Résultats des expériences numériques parallèles sur HPC@LR

Les expériences de calcul parallèles ont été e¤ectuées sur HPC@LR à Montpelier (France). Le cluster du HPC@LR est composé de nœuds selon l’architecture SMP avec une bande passante réseau de 40 Gb/s. Chaque nœud contient deux processeurs Intel Xeon Westmere avec six cœurs chacun qui partagent une mémoire de 24Gb.

Dé…nition 6.2.1 L’accélération ( speed-up) est dé…nie comme le rapport du temps d’éxécution sur p processeurs par le temps séquentiel selon la formule suivante

Sp = T1=Tp

avec :

p nombre de processeurs

T1 temps d’exécution de l’algorithme séquentiel

Tp temps d’exécution de l’algorithme sur une machine a p processeurs.

nb. nb. synchrone asynchrone

nœuds cores temps accélération e¢ cacité temps accélération e¢ cacité

1 1 50413 - - - - - 1 6 14549 3.46 0.57 15695 3.21 0.50 1 12 7433 6.78 0.56 8564 5.88 0.49 2 24 4778 10.55 0.43 4153 12.13 0.50 4 48 1911 26.38 0.54 2073 24.31 0.50 6 72 1291 39.04 0.54 1421 35.47 0.49 8 96 1321 38.16 0.39 1053 47.87 0.49 10 120 1130 44.61 0.37 840 60.01 0.50

Tableau 7 : Temps écoulé(sec), accélération et e¢ cacité des algorithmes parallèles pour la résolution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec HPC@LR.

Les e¢ cacités parallèles illustrées dans le tableau 7 ne sont pas bonnes en raison de la décomposition du domaine et la transmission de messages n’étant pas optimisée.

Cette situation est très intéressante pour l’étude des algorithmes itératifs asynchrones. Le tableau 7 montre que les relaxations asynchrones sont intéressantes avec plus de

8 nœuds. En dessous de 8 nœuds, les relaxations synchrones ont tendance à être plus performantes car il y a moins de communication et de synchronisations.

Tableau 8 suggére que la chute d’e¢ cacité observée pour l’algorithme synchrone est due à l’augmentation du nombre total de relaxations. En e¤et, ce comportement bien connu et lié à la parallèlisation du schéma de relaxation de Gauss-Seidel.

nb. nb. synchrone asynchrone nœuds cores relaxations iter. lin. relaxations iter. lin.

1 1 68972 25 - - 1 6 69253 25 71859 25 1 12 69491 25 76225 26 2 24 69701 25 78343 27 4 48 69941 25 77033 28 6 72 70104 25 78940 28 8 96 70321 25 79416 29 10 120 70466 25 80171 28

Tableau 8 : Nombre total de relaxations de Gauss-Seidel et nombre d’itérations de linéarisation pour la résolution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec HPC@LR.

nb. nb. E¢ cacité moyenne par relaxation nœuds cores synchrone asynchrone

1 6 0.57 0.55 1 12 0.56 0.54 2 24 0.44 0.57 4 48 0.55 0.56 6 72 0.55 0.56 8 96 0.40 0.57 10 120 0.37 0.58

Tableau 9 : E¢ cacité moyenne par relaxation parallèle pour la résolution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec HPC@LR.

Le tableau 9 montre que la baisse d’e¢ cacité est principalement due au des passage de messages. En e¤et, dans le cas synchrone, les e¢ cacités moyennes par relaxation sont proches des e¢ cacités globales.

6.2.2

Résultats des expériences numériques parallèles sur la

Grid5000

Des essais ont été e¤ectués sur la plateforme Grid05000(France). Le cluster utilisé se

situe à Sophia Antipolis. Les nœuds du cluster utilisent deux processeurs SMP connec- tés par un réseau Gigabit Ethernet. Chaque nœud détient deux processeurs Intel Xeon Nehalem avec quatre cœurs chacun et partagent 32 Gb de mémoire. Durant ces essais seulement deux cœurs par nœuds ont été utilisés.

Le tableau 10 montre que les relaxations asynchrones sont intéressantes avec plus de 6 nœuds. En-dessous de 6 nœuds, les relaxations synchrones ont tendance à être plus

e¢ caces.

nb. nb. synchrone asynchrone

nœuds cores temps accéliration e¢ cacité temps accélération e¢ cacité

1 1 63780 - - - - - 1 2 31004 2.05 1.02 32608 1.95 0.97 2 4 16744 3.80 0.95 17001 3.75 0.93 4 8 8885 7.17 0.89 8953 7.12 0.89 6 12 6980 9.13 0.76 5745 11.10 0.92 8 16 5680 11.22 0.70 4433 14.38 0.89 10 20 5560 11.47 0.57 3472 18.36 0.91 12 24 3502 18.20 0.75 2988 21.34 0.88 14 28 3087 20.65 0.73 2593 24.59 0.87 16 32 2744 23.24 0.72 2257 28.25 0.88 18 36 2952 21.60 0.60 2042 31.23 0.86

Tableau 10 : Temps écoulés (sec) accélération et e¢ cacité pour la solution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec la Grid05000.

nb. nb. synchrone asynchrone nœuds cores relaxations iter. lin. relaxations iter. lin.

1 1 68972 25 - - 1 2 69039 25 73294 25 2 4 69107 25 74232 25 4 8 69326 25 76795 25 6 12 69491 25 77029 25 8 16 69551 25 77468 26 10 20 69588 25 77316 26 12 24 69701 25 78508 26 14 28 69739 25 79829 27 16 32 69789 25 79070 26 18 36 69841 25 79494 27

Tableau 11 : Nombre total de relaxations de Gauss-Seidel et nombre d’itérations

de linéarisation pour la résolution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec la Grid05000.

Le tableau 11 indique que la chute d’e¢ cacité observée dans l’algorithme synchrone est due à l’augmentation du nombre total de relaxations. En e¤et, ce comportement bien connu est lié à la parallèlisation du schéma de relaxation de Gauss-Seidel.

nb. nb. E¢ cacité moyenne par relaxation nœuds cores synchrone asynchrone

1 2 1.02 1.03 2 4 0.95 1.00 4 8 0.90 0.99 6 12 0.76 1.03 8 16 0.70 1.01 10 20 0.57 1.02 12 24 0.76 1.01 14 28 0.74 1.01 16 32 0.83 1.01 18 36 0.60 0.99

Tableau 12 : E¢ cacité moyenne par relaxation pour la résolution de la G-équation de la chaleur en 3D (300 300 300) sur 5 pas de temps, avec la Grid05000.

Le tableau 12 montre que la baisse d’e¢ cacité est principalement due à des problèmes de passage des messages. En e¤et, dans le cas synchrone les e¢ cacités moyennes d’une relaxation sont proches de l’e¢ cacité globale. En outre, les tableaux 11 et 12 montrent que l’utilisation de la méthode asynchrone conduit à une convergence plus lente avec un nombre de relaxations plus élevé ; mais cette baisse de la vitesse de convergence est compensée par de relaxations parallèles plus e¢ caces. L’e¢ cacité moyenne d’une relaxation parallèle est plus élevée dans le cas asynchrone au-dessus de deux nœuds ; en outre, pour les relaxations parallèles asynchrones le passage de message altère moins les perfermances au-dessus de 6 nœuds.

Bibliographie

[1] Avellaneda, M., Levy, A. and Paras, A. Pricing and hedging derivatives ecurities in markets with uncertain volatilities. Appl. Math Finance, 1995, 2 ,73–88.

[2] Bahi J. , Asynchronous iterative algorithms for nonexpansive linear systems, Parallel And Distributed Computing, 2000, vol. 60, no. 1, pp. 92-112.

[3] Barbu V. Non linear semi-groups and di¤erential equations in Banach spaces. Noord- ho¤ international publishing, Groningen, 1976.

[4] Barenblatt,G.I., Similarity, self-similarity and intermediate asymptotics, Consultants Bureau, New York, 1978. (there exists a revised second Russian edition, Leningrad Gidrometeoizdat, 1982).

[5] Barenblatt,G.I. and Sivashinski,G.I., Self-similar solutions of the second kind in non- linear …ltration, Applied Math. Mech, 1969, 33, 836-845, (translated from Russian, PMM, pages 861-870).

[6] Baudet G. , Asynchronous iterative methods for multiprocessor, Journal of A.C.M., 1978, 25-2, 226-244.

[7] Benilan P. . Semi-groupes non-linéaires, Cours DEA, institut de Mathématiques de l’Université de Besançon, 1975.

[8] Chau M. , El Baz D. , Guivarch R. and Spiteri P. , MPI implementation of parallel subdomain methods for linear and nonlinear convection-di¤usion problems, Journal of Parallel and Distributed Computing, 2007, 67, 581-591.

[9] Chazan D. and Miranker W., Chaotic relaxation, Linear Algebra Appl., 1969, 2 , pp. 199–222.

[10] Crandall M. G. , Ishii H. , and Lions P. L., User’s guide to viscosity solutions of second order partial di¤erential equations, Bulletin Of The American Mathematical Society, 1992, 27(1), 1-67.

[11] Denis,L., Hu,M. and Peng,S., Function spaces and capacity related to a sublinear Expectation : application to G-Brownian Motion paths, in arXiv :math.PR/0802.1240vl, 2008.

[12] El Tarazi M. N., Some convergence results for asynchronous algorithms, Num. Math., 1982, 39, 325-340.

[13] Evans D.J. and Deren W., An asynchronous parallel algorithm for solving a class of nonlinear simultaneous equations, Parallel Computing, 1991, 17, 165 - 180.

[14] Giraud L. and Spitèri P., Résolution parallèle de problèmes aux limites nonlinéaires. M2AN, 1991, 25, 73-100.

[15] Gong X. and Yang S., The numerical properties of G-heat equation and related application, to appear, arXiv : 1304.1599V1 [math.NA], 2013.

[16] Ho¤man K.H. and Zou J., Parallel e¢ ciency of domain decomposition methods, Parallel Computing, 1993, 19, pp. 1375–1391.

[17] Hu,M. and Peng,S., On Representation Theorem of G-Expectations and Paths of G-Brownian Motion, Acta Mathematicae Applicatae Sinica, English Series, 2009, 25(3), 539-546.

[18] Jaillet P. , Lamberton D. and Lapeyre B., Variational inequalities and the pricing of American options, Acta Applicandae Mathematicae, 1990, 21, 263 - 289.

[19] Kamin,S., Peletier,L.A. and Vazquez,J.L., On the Barenblatt equation of elasto- plastic …ltration, Indiana Univ. Math. J. 40, 1333-1362, 1991.

[20] Kaszkurewicz E. and Bhaya A. , Matrix diagonal stability in systems and computa- tion, Birkhauser, 1999.

[21] Krylov,N.V., Nonlinear Parabolic and Elliptic Equations of the Second Order, Reidel Publishing Company, 1987. (Original Russian Version by Nauka, Moscow, 1985). [22] Lascaux P. et Théodor R. - Analyse numérique matricielle appliquée à l’art de l’in-

génieur. Tomes 1 et 2, Masson (1986).

[23] Lions P. L. Formule de Trotter et équatiosn de Hamilton-Jacobi-Bellman, 1979, 321- 331.

[24] Miellou J.C. , Algorithmes de relaxation chaotiques à retards,1975, RAIRO-R1, 55- 82.

[25] Miellou J.C. and Spiteri P., Un critère de convergence pour des méthodes générales de point …xe, M.2.A.N., 1985, 19-4, 645 - 669.

[26] Miellou J.C. , El Baz D. and Spiteri P. , A new class of iterative algorithms with order intervals, Mathematics of Computation, 1998, 67, 237 - 255.

[27] Miellou J. C., Itérations chaotique à retard, C.R.A.S. Paris, 1974, 278, pp. 957-960. [28] Mingshang H. , Explicit solutions of G-heat equation with a class of initial conditions by G-Brownian motion, School of Mathematics, Shandong University, Jinan, 250100, 2009, 1-12.

[29] Ortega J. M. and Rheinboldt W. C., Iterative Solution of Nonlinear Equations in Several Variables, Academic Press, New York, 1970.

[30] Peng S.„ A generalized dynamic programming principle and Hamilton-Jacobi- Bellman equation, Stochastics and Stochastic Reports, 1992, 38(2), 119-134.

[31] Peng,S., A New Central Limit Theorem under Sublinear Expectations, in arXiv :math.PR/0803.2656vl, 2008.

[32] Peng,S., Filtration Consistent Nonliear Expectations and Evaluations of Contingent Claims, Acta Mathematicae Applicatae Sinica, English Series, 2004, 20(2), 1-24. [33] Peng,S., G-Brownian Motion and Dynamic Risk Measure under Volatility Uncer-

[34] Peng S., G-expectation, G-Brownian motion and related stochastic calculus of Ito type, in Stochastic Analysis and Applications, The Abel Symposium , Abel Symposia 2, Edit. Benth et al, Springer-Verlag, 2005, 541-567.

[35] Peng,S., Law of Large Numbers and Central Limit Theorem under Nonlinear Ex- pectations, in arXiv :math.PR/0702358vl, 2007.

[36] Peng S., Multi-dimensional G-Brownian motion and related stochastic calculus under G-expectation, Stochastic Processes and their Applications, 2008, 118(12), 2223- 2253.

[37] Peng,S.,Nonlinear expectations and nonlinear Markov chains, Chin. Ann. Math. 2005, 26B(2), 159-184.

[38] Peng S., Nonlinear Expectations and Stochastic Calculus under Uncer- tainty with Robust Central Limit Theorem and G-Brownian Motion, in arXi :math.PR/1002.4546v1, 2010.

[39] Peng S., Survey on normal distributions, central limit theorem, Brownian motion and the related stochastic calculus under sublinear expectations. Sci China Ser A, 2009, 52,1391-1411.

[40] Rebert F. , Charny M., and Musy.F. Itérations chaotiques série-paralléle pour dés équations non-linéaires de point …xe. Aplikace Matematiky, 1975, Vol. 20, No. 1, 1-38.

[41] Robert F., Convergence locale d’itération chaotique non-linéaire, C.R.A.S. série A, 1977, 284 , pp. 679–682.

[42] Song,Y., A general Central Limit Theorem under Peng’s G-normal distribution, Preprint, 2007.

[43] Spitèri P., A new characterization of M-matrices and H-matrices, BIT numerical Mathematics, 2003, 43, 1019 - 1032.

[44] Spitèri P., Contribution a l’étude de grands systèmes non linéaires. Thèse de Doc- torat es Sciences, Faculté des Sciences et des Techniques de l’Université de Franche- Comté, 1984.

[45] Spiteri P., Miellou J.C., El Baz D., Asynchronous Schwarz alternating methods with exible communication for the obstacle problem, Calculateurs Parallèles, Réseaux et Systèmes Répartis, 2001, 13, 47-66.

[46] Spiteri P., Miellou J.C., El Baz D., Parallel asynchronous Schwarz and multisplitting methods for a non linear difusion problem, Numerical Algorithms, 2003, 33, 461-474. [47] Varga R.S., Matrix iterative analysis, Prentice Hall, 1962.

[48] Wang,L., On the regularity of fully nonlinear parabolic equations :II, Comm. Pure Appl. Math., 1992, 45, 141-178.

[49] Yong J., Zhou X., Stochastic Controls : Hamiltonian Systems and HJB Equations, Springer-Verlag, 1999.

Documents relatifs