• Aucun résultat trouvé

La cr´eation de notre outil de simulation permet d’introduire des sp´ecificit´es dans l’approche de type DSMC que nous d´eveloppons. Elles concernent notamment le trai-tement des conditions limites `a l’entr´ee et `a la sortie du microdispositif par la cr´eation

3.5 Sp´ecificit´e de notre notre simulation

de r´eservoir, la mise au point d’une fonction zoom et l’am´elioration de l’efficacit´e de la parall´elisation.

3.5.1 R´eservoirs d’entr´ee et de sortie

Notre approche sp´ecifique de Monte-Carlo permet de simuler directement le com-portement des particules plutˆot que d’appliquer des formules analytiques qui supposent qu’`a l’entr´ee du microcanal les conditions d’´equilibre thermodynamique sont r´ealis´ees en permanence (Nance et al.(1997),Wu & Tseng(2001)). Nous inspirant de la m´ethode deAlexeenko et al.(2003), nous faisons une analogie de l’exp´erience. L’avantage de cette m´ethode est qu’elle d´ecrit une situation au plus proche de la r´ealit´e du mouvement des particules. Dans notre simulation, un microdispostif est fix´e entre deux r´eservoirs pa-rall´el´epip`e-diques (ou cylindriques) o`u la pression est suppos´ee constante. Ces r´eservoirs respectent deux conditions :

– Les tailles des r´eservoirs sont minimis´ees et choisies de l’ordre de quelques libres parcours moyens de fa¸con `a ne pas augmenter exag´er´ement le temps de calcul. – La pression doit rester constante quelque soit la situation.

Sur le premier point, la taille des r´eservoirs a ´evolu´e dans une gamme s’´etendant de 15 `

a 2.5 fois le libre parcours moyen. Cette a ´et´e minimis´ee pour les nombres de Knudsen les plus ´elev´es de mani`ere a ´eviter une trop grande diff´erence entre le NR du r´eservoir et celui de la premi`ere cellule du conduit. On a observ´e que dans cette gamme les va-riations de taille n’avaient pas d’incidences significatives sur les r´esultats. D’un point de vue g´eom´etrique ces distances correspondent au minimum `a 2 fois la longueur ca-ract´eristique H du microdispositif.

Sur le deuxi`eme point, la conservation de la pression est bas´ee sur un algorithme simple : lors de l’initialisation les r´eservoirs sont mis sous pression constante ce qui correspond `a un nombre initial de particules de simulation NS(0). A la fin de chaque pas de temps le nombre de particule NS(t) est compt´e dans les r´eservoirs. Si la diff´erence entre NS(0) et NS(t) est positive, nous perdons des particules, il faut en cr´eer de fa¸con `

a compl´eter ce manque. A l’oppos´e, si ce nombre est n´egatif, nous avons un surplus de particules, il faut en d´etruire. La cr´eation et la destruction de particules se font dans la premi`ere cellule du r´eservoir pour le r´eservoir d’entr´ee, dans la derni`ere cellule du r´eservoir pour le r´eservoir de sortie. Les particules cr´e´ees sont initialis´ees avec une position uniform´ement r´epartie dans ces cellules et avec une distribution de vitesse dont le module est ´egal `a la vitesse thermique correspondant `a la temp´erature du r´eservoir consid´er´e et dont les directions sont isotropes.

On peut noter que cette adjonction au cours du processus permet d’obtenir des r´eservoirs de taille g´eom´etrique r´eduite par rapport `a ce qui ce passe r´eellement en laboratoire.

3.5.2 Fonction zoom

Dans la section 3.4.1, nous avons d´ecrit le lien entre les particules de simulation et les mol´ecules r´eelles. Ce lien a ´et´e ´etabli au niveau de chaque cellule. Nous avons donc

choisi de ne pas imposer un nombre NRconstant pour toutes les cellules. Au contraire il en r´esulte un nombre de particule simul´ee NS qui lui reste constant d’une cellule `

a l’autre. A cot´e des avantages ´enum´er´es plus haut ce choix entraˆıne aussi quelques difficult´es. En effet consid´erons deux cellules (1 et 2) caract´eris´ees par NR1 et NR2. Lorsqu’une particule va de la cellule 1 `a la cellule 2, ce sont NR1 mol´ecules qui vont dans la cellule 2. Mais dans la cellule 2 NR1 mol´ecules devraient ˆetre repr´esent´ees par NR1/NR2 particules. Trois possibilit´es sont `a envisager :

– NR1 = NR2, il suffit de d´eterminer son nouveau num´ero de cellule et de sous cellule et de la ranger.

– NR1/NR2 < 1, la particule peut ˆetre d´etruite selon la m´ethode de r´ejection. Si la particule est conserv´ee, alors elle est class´ee comme pr´ec´edemment.

– NR1/NR2 > 1, on classe la particule entrante et on cr´ee autant de particules simul´ees que la valeur du rapport le permet. Les particules cr´e´ees le sont dans le mˆeme cellule et sous cellule avec des positions diff´erentes et la vitesse est conserv´ee pour satisfaire la conservation de l’´energie et de l’impulsion.

L’avantage de cette m´ethode est que nous pouvons ordonner les cellules suivant la grandeur physique que nous voulons mesurer. Par exemple dans notre microcanal, si nous souhaitons mesurer le d´ebit, il suffit de disposer des cellules adjacentes qui occupent toutes la section du microcanal. Inversement si nous voulons mesurer les profils de vitesses dans des sections du microcanal, nous aurons besoin de plusieurs cellules dans ces sections et chacune de ces cellules devra avoir un nombre de particules suffisant pour diminuer le bruit statistique. L’obtention de l’ensemble des profils de vitesse est donc tr`es long en temps de calcul. C’est pourquoi, nous nous contenterons de calculer le profil de vitesse pour une unique section. Pour ce faire les cellules seront dispos´ees dans le sens de la hauteur suivant une progression g´eom´etrique. Ce proc´ed´e permet de mettre au point un maillage local de plus en plus fin i.e. une fonction zoom. Ainsi, nous pouvons d´ecomposer les sections suivant deux sch´emas (figure 3.4) :

1. Le premier est la d´ecomposition du domaine en cellules adjacentes avec un nombre de sous cellule fixe (figure 3.4a).

2. La deuxi`eme consiste `a d’augmenter progressivement le nombre de cellules suivant une suite g´eom´etrique lorsque l’on change de section, tout en diminuant le nombre des sous cellules (figure3.4b).

L’avantage de la m´ethodezoom est qu’elle permet de d´eterminer des profils en tout point, en limitant le plus possible le bruit statistique tout en conservant un temps de calcul raisonnable.

En effet il faut remarquer que

3.5.3 Optimisation de la parall´elisation

La parall´elisation de notre code bien que difficile est une n´ecessit´e pour obtenir des r´esultats d’une pr´ecision comparable `a celle de nos r´esultats exp´erimentaux. La pa-rall´elisation n’est efficace que si nous sommes capables d’´equilibrer le temps de calcul de chaque processeur. Cela est relativement facile `a faire dans un code aux diff´erences

3.5 Sp´ecificit´e de notre notre simulation

b) a)

Figure 3.4 – Sur la figure a) le nombre de sous cellule (trait pointill´e) est fixe (16) pour chaque cellule (trait plein) tandis que sur la figure b) le nombre de cellules croit et le nombre de sous-cellules d´ecroit suivant une suite g´eom´etrique 2n. Dans les deux cas le produit des cellules et des sous cellules est ´egal `a 16 pour chaque tranche

finies car il suffit de diviser le domaine de calcul avec un maillage r´egulier. En DSMC, nous avons deux contraintes : l’une est le type de d´ecoupage en cellules, impos´e par les quantit´es que nous souhaitons mesurer, l’autre directement li´ee au temps de calcul, est le nombre de particules trait´ees par le processeur. L’utilisation de NRvariable offre des possibilit´es suppl´ementaires de satisfaire ces imp´eratifs. En effet on peut mainte-nir ainsi un nombre de particules `a peu pr`es constant par cellule, i.e. dans le cadre de la d´ecomposition de la figure 3.4a une charge `a peu pr`es ´equivalente pour chaque processeur.

Ensuite, pour ´evaluer l’efficacit´e de la parall´elisation, nous calculons le speed up Sn= Ts/(Tnn), o`u Ts est le temps de calcul pour un seul processeur, et Tn et le temps du calcul parall`ele pour n processeurs. Les r´esulats de l’efficacit´e de la paral´elisation sont montr´es sur la figure.3.5. On peut ˆetre surpris par le comportement de l’efficacit´e qui croit quand le nombre de processeur croit. En fait ce ph´enom`ene porte un nom, il s’agit du super linear speedup. Il est dˆu `a la gestion des donn´ees dans la m´emoire cache int´egr´ee (L1,L2). Lors d’un calcul parall`ele, la taille totale de la cache augmente avec le nombre de processeurs. Avec une taille de la cache plus importante, les donn´ees du programme peuvent quasiment se maintenir `a l’int´erieur de la cache ; c’est pourquoi le temps de calcul d´ecroˆıt alors fortement (Akl (2004), Fischer(1991)).

Enfin dans l’optique de calculs lourds n´ecessitant un tr`es grand nombre de parti-cules (2 `a 100 millions de particules), la part des communications entre les processeurs deviennent pr´edominantes avec l’API MPI. Il faut alors envisager une structure d’or-dinateur o`u plusieurs processeurs peuvent g´erer une m´emoire partag´ee. Elle permet d’´etendre `a l’ensemble des processeurs la manipulation des objets par leur adresse y compris lors du passage d’un processeur `a l’autre. Cette structure va consid´erablement acc´el´erer les ´echanges d’informations. Nous avons donc adapt´e notre programme `a cette architecture en utilisant l’API OpenMP (multi thread)OpenMP(2002). Toutefois cette structure `a elle seule ne permet d’accroˆıtre ind´efiniment ni le nombre de processeur ni

80 90 100 110 120 0 4 8 12 16 20 24 28 32 E [%] n 100%

Figure 3.5 – Calcul d’efficacit´e du code parall`ele.

la taille de la m´emoire partag´ee, si bien que la combinaison des API OpenMP/MPI est la plus adapt´ee `a l’architecture des calculateurs modernes. Le couplage des deux types d’API nous a permis d’obtenir pour l’instant 25% de gain de temps par rapport `a une ex´ecution n’utilisant que l’API MPI.