Int´egration multidimensionnelle sur des domaines compliqu´es

4.11 Les m´ethodes de Monte-Carlo

4.11.5 Int´egration multidimensionnelle sur des domaines compliqu´es

4.11.5.1 Principes

Au chapitre 4.3.2, on a vu des m´ethodes d’int´egrations

a une dimension comme la m´ethode des trap`ezes. Celle-ci

se généralise sans difficulté à des intégrales multidimen-sionnelles du type :

Z b1

Z b2

. . . Z bn

f(x1, x2, . . . , xn)dxn. . . dx2dx1

Ce type d’intégrale correspond en fait à des domaines d’intégration de géométrie simple (rectangle à deux dimen-sions, parallélépipède à trois dimensions, etc.) ; on peut dans une certaine mesure, par des changements de vari-ables appropriés (coordonnées cylindriques ou sphériques) adapter l’intégration à d’autres géométries. Il y a toutefois des limites.

Figure 4.41 – Un domaine d’int´egration un peu com-pliqu´e. . .

Imaginons, par exemple, que l’on veuille calculer la fig-ure d’interférences donnée par deux fentes d’Young, mais la source lumineuse, au lieu d’être ponctuelle, est un fila-ment d’ampoule électrique épais, torsadé et courbé (figure 4.41), ou, pire, une galaxie vue à travers un télescope : comme la source est incohérente, il faut donc intégrer les intensités lumineuses issues de chaque point de la source.

Le domaine d’int´egration est donc la source : il n’y a gu`ere d’habile changement de variable qui saute aux yeux !

Il existe une première solution qui consiste à intégrer sur un volume de géométrie simple qui englobe la source, en fixant la valeur de l’intensité lumineuse à zéro en dehors de la source.

L’autre solution consiste à tirer au sort des points dans ce volume (figure 4.42), d’ignorer les points qui sont en dehors de la source et de ne compter que ceux qui sont sur la source. Cette deuxième solution, si elle peut paraˆıtre un peu absurde, a au moins deux mérites : 1ôelle est simple à mettre en œuvre, et 2ôelle permet de tracer le graphe du résultat en fonction du nombre de tirages au sort, de sorte que lorsque le résultat ne fluctue que d’une valeur inférieure à un certain seuil, on peut considérer que l’intégrale est calculée avec cette précision (c’est un peu comme sur la figure 4.37 où l’on peut considérer que π est calculé à partir du moment où les fluctuations sont inférieures à la précision souhaitée).

90 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

Figure 4.42 – Si l’on veut calculer l’intégrale d’une fonc-tion dans un espace compliqué, on peut englober cet es-pace dans un (hyper)cube, ici un carréd×d, tirer au sort des points dans ce carré, c’est-à-dire, pour chaque point, tirer deux nombres compris entre 0 et d et n’ajouter la valeur de la fonction en ce point que s’il se trouve dans l’espace d’intégration. Sinon, on l’ignore et on fait un nou-veau tirage.

4.11.5.2 Tentative ^≪ na¨ıve ^≫.

Prenons un autre exemple : on veut calculer, I_D=

sin(xy)dx dy o`uDest le domaine d’int´egration. Si

D={(x, y), tels quex²+y²< π} c’est facile :I_D= 0 ; mais si (figure 4.43)

D={(x, y), tels que 4 tanh(x−y) e⁻^(x²^+y²⁾>0.4} (4.31) c’est nettement plus compliqu´e ! Il suffit toutefois de tirer

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −2

−1.5

−1

−0.5 0 0.5 1 1.5 2 1

0.8 0.6 0.4 0.2 −0.2 −0.4 −0.6 −0.8 −1 0.0

Figure 4.43 – Le domaine d’intégration D défini par l’équation (4.31) est délimité par la courbe continue rouge. . .

au sort des nombresxetydans l’intervalle [−2,2], et, si la condition de l’équation (4.31) est vérifiée, additionner la

quantité sin(xy) à toutes celles déjà obtenues. Il faut alors normaliser le résultat en multipliant cette somme S par VD

où VD est le volume (ici, avec deux variables seule-ment, c’est en fait une surface) deD et nc est le nombre de^≪coups au but^≫c’est-à-dire le nombre de fois où l’on est tombé dansD. Que vaut alorsVD? Il suffit de repren-dre le raisonnement utilisé pour calculerπ par le rapport de la surface du cercle à celle du carré : c’est le volume totalVt dans lequel on a fait des tirages multiplié par la proportion de coups au but :

VD =Vt

o`u nt est le nombre total de tirages. Ainsi, en fin de compte,

I_D =SVt

Le programme qui fait cela est extrˆemement simple : program integr

implicit none real :: x, y, s

integer :: i, imax = 100000000, n s = 0. ; n = 0

open(10,file=’integr_sin.out’) do i = 1, imax

x = 4*(rand()-0.5) ; y = 4*(rand()-0.5) ! [-2,2]

if ( 4*tanh(x-y)*exp(-(x**2 + y**2)) > 0.4 ) &

s = s + sin(x*y) if ( mod(i,5000) == 0 ) write(10,*) i, 16*s/i enddo

write(*,*) 16*s/imax end

Ç a donne -8.9420289E-02 pour 10⁸ tirages et quelques secondes de calcul. Le résultat en fonction du nombre de tirages est representé sur la figure 4.44. Les huit chiffres

-0.092 -0.09175 -0.0915 -0.09125 -0.091 -0.09075 -0.0905 -0.09025 -0.09 -0.08975 -0.0895 -0.08925 -0.089 -0.08875 -0.0885

100000 1e+06 1e+07 1e+08

n_t

Figure4.44 – Valeurs obtenues pourI_D avec le domaine (4.31) en fonction du nombre de tirages (l’axe desxa une

´echelle logarithmique).

≪significatifs^≫du résultat ci-dessus ne sont évidemment pas tous significatifs ! On constate aisément sur la figure qu’avec tous ces tirages, on en a au plus 3, soit I_D ≃

−0.0894. . . Peut-on ˆetre plus efficace ?

4.11.5.3 Marche au hasard dans D

Dans le calcul précédent, on a tiré au sort des nombres dans un domaine plus grand que le domaine d’intégration

Det on a simplement éliminé tous les tirages qui tombaient en-dehors deD. On est en droit de se dire que c’est ineffi-cace et qu’il vaudrait mieux tenter de ne tirer des nombres que dans le bon domaine : c’est en toute rigueur impossi-ble, mais, si, partant d’un point choisi dansD(par exem-ple (0.5,−0.5) dans la figure 4.43), au lieu de tirer d’autres nombres de fa¸con indépendante, on se borne à se déplacer au hasard dans le domaine, soit tirer au sort, non pas un point, mais un petit déplacement (dx, dy), quitte à rejet-ter les déplacements qui font sortir du domaine, on devrait passer l’essentiel du temps (ou plutôt des tirages au sort) dans le bon domaine.

Ainsi, on peut commencer par fixer un point de d´epart dansD:

x0 = 0.5 ; y0 = -0.5 dans l’exemple ci-dessus, puis calculer des d´eplacements −δx< dx < δx et −δy < dy <

δy :

dx = 2*delta_x*(rand()-0.5) dy = 2*delta_y*(rand()-0.5)

et ajouter cela aux anciennes valeurs de xet y. Si le nou-veau point obtenu est dansDle déplacement est conservé, sinon, il est rejetté (c’est-à-dire que l’on revient à la po-sition précédente). Dans tous les cas (voir une discussion détaillée de ce point dans la réf. [21]), on ajoute la valeur de la fonction à la somme que l’on aura déjà initiée.

En divisant cette somme par le nombre de tirages, on ob-tient la valeur moyenne de la fonction dans le domaine : il

≪suffit^≫de multiplier par le volume du domaineVDpour obtenir le résultat. Si on connait ce volume, c’est en effet assez facile, sinon, par exemple dans le cas de l’équation (4.31), il faut le calculer. . . par une méthode Monte-Carlo ! C’est ce qui est fait fig. 4.45 et l’on obtient des résultats assez similaires à ce qu’on avait précédemment.

-0.09 -0.0898 -0.0896 -0.0894 -0.0892 -0.089 -0.0888 -0.0886 -0.0884 -0.0882 -0.088

1e+07 2e+07 4e+07 8e+07

Figure 4.45 – Valeurs obtenues pourI_D avec le domaine (4.31) en fonction du nombre de tirages (l’axe desxa une

´echelle logarithmique) comme dans la figure 4.44, mais cette fois-ci par une marche au hasard dans le domaine d’int´egration D.

Qu’a-t-on gagné en faisant tout cela ? Pas grand-chose, il faut le reconnaˆıtre, en termes de performances de calcul ; toutefois, on est rassuré que cela^≪marche ^≫, ce qui sera précieux quand on n’aura plus le choix. . .

4.11.5.4 Echantillonnage par l’importance (im-´ portance sampling)

Pourrait-on, pour ainsi dire, ^≪ guider ^≫ le hasard ? Il faudrait pouvoir^≪dire^≫au hasard quand ¸ca vaut le coup de faire le calcul, car calculer l’intégrale d’une fonction en sommant au hasard partout, y compris là où elle est nulle ou presque n’a pas grand intérêt. Autrement dit, il serait peut-être habile d’utiliser des tirages au sort, non pas avec des distributions uniformes comme jusqu’à présent, mais avec des distributions qui favorisent les endroits où la fonc-tion a des contribufonc-tions non négligeables. Formellement, cela donne, avec l’exemple du calcul^≪na¨ıf^≫ ci-dessus (§

4.11.5.2) :

I_D= Z

sin(xy)dx dy= Z

sin(xy)

p(x, y) p(x, y)dx dy où p(x, y) est une densité de probabilité choisie de fa¸con

a avoir des valeurs plus importantes là où la fonction a elle-même des valeurs plus importantes.On sommera alors les valeurs prises par sin(xy)

p(x, y), où maintenantxet y sont choisis avec la densité de probabilitép(x, y). On pourrait

évidemment choisir comme distribution la fonction elle-même, toutefois produire des nombres aléatoires avec une distribution de probabilité sin(xy) comme ici n’est peut-être pas si facile que cela. Une approximation de la fonc-tion peut suffire : ici, il suffit de poser,

p(x, y)∝ |xy|

puisqu’une approximation de sin(xy) quand x et y ne sont pas trop grands est xy (on prend la valeur absolue, puisqu’une densit´e de probabilit´e est toujours positive).

En utilisant la m´ethode du§ 4.11.4, supposons que l’on tire au sort des nombres X et Y avec des distributions uniformes, on a alors

p(x, y)dx dy=dX dY soit, en s´eparant

x dx=dX et y dy =dY et

x=√

2X y=√

où l’on a oublié les problèmes de signe. . . On peut s’ar-ranger pour queX et Y soient dans l’intervalle [−1,1] et remultiplier par le coefficient qui va bien pour que x et ysoient dans l’intervalle [−2,2] comme auparavant. C’est plus simple que ¸ca en a l’air :

program importance implicit none

double precision :: x, y, xx, yy, s, z integer :: i, imax = 10000000

s = 0. ; n = 0

open(10,file=’import_sampling.out’) do i = 1, imax

xx = 2.*rand()-1. ; yy = 2.*rand()-1.

x = 2.*sign(sqrt(abs(xx)),xx) y = 2.*sign(sqrt(abs(yy)),yy)

if ( 4*tanh(x-y)*exp(-(x**2+y**2)) > 0.4 ) then z = x*y

92 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

if ( abs(z) > 1.e-10 ) then ! no zero divide s = s + sin(z)/abs(z)

else

s = s + 1.

endif endif

if ( mod(i,10000) == 0 ) write(10,*) i, 4.*s/i enddo

close(10)

write(*,*) 4.*s/imax end

On obtient la courbe de la figure 4.46. Pour des r´esultats

-0.092 -0.0915 -0.091 -0.0905 -0.09 -0.0895 -0.089 -0.0885 -0.088 -0.0875 -0.087 -0.0865 -0.086 -0.0855 -0.085

100000 1e+06 1e+07

Figure 4.46 – Valeurs obtenues pourI_D avec le domaine (4.31) en fonction du nombre de tirages (l’axe desxa une

échelle logarithmique) par une méthode d’échantillonnage par l’importance. L’échelle de l’axe desy est la même que pour la figure 4.44.

très comparables, voire meilleurs que ceux de la figure 4.44, on a fait dix fois moins de tirages au sort (10⁷ au lieu de 10⁸) : on a gagné un ordre de grandeur en temps de calcul ! Ç a méritait un petit effort. . .

4.11.6 Simulation de

Dans le document Licence de physique L3 PHYTEM (Page 89-92)