Sp´ecificit´e de notre notre simulation - Etude des écoulements gazeux isothermes en microcondu

La création de notre outil de simulation permet d’introduire des spécificités dans l’approche de type DSMC que nous développons. Elles concernent notamment le trai-tement des conditions limites à l’entrée et à la sortie du microdispositif par la création

3.5 Sp´ecificit´e de notre notre simulation

de réservoir, la mise au point d’une fonction ≪zoom≫ et l’amélioration de l’efficacité de la parallélisation.

3.5.1 R´eservoirs d’entr´ee et de sortie

Notre approche spécifique de Monte-Carlo permet de simuler directement le com-portement des particules plutôt que d’appliquer des formules analytiques qui supposent qu’à l’entrée du microcanal les conditions d’équilibre thermodynamique sont réalisées en permanence (Nance et al.(1997),Wu & Tseng(2001)). Nous inspirant de la méthode deAlexeenko et al.(2003), nous faisons une analogie de l’expérience. L’avantage de cette méthode est qu’elle décrit une situation au plus proche de la réalité du mouvement des particules. Dans notre simulation, un microdispostif est fixé entre deux réservoirs pa-rallélépipè-diques (ou cylindriques) où la pression est supposée constante. Ces réservoirs respectent deux conditions :

– Les tailles des réservoirs sont minimisées et choisies de l’ordre de quelques libres parcours moyens de fa¸con à ne pas augmenter exagérément le temps de calcul. – La pression doit rester constante quelque soit la situation.

Sur le premier point, la taille des réservoirs a évolué dans une gamme s’étendant de 15 `

a 2.5 fois le libre parcours moyen. Cette a été minimisée pour les nombres de Knudsen les plus élevés de manière a éviter une trop grande différence entre le NR du réservoir et celui de la première cellule du conduit. On a observé que dans cette gamme les va-riations de taille n’avaient pas d’incidences significatives sur les résultats. D’un point de vue géométrique ces distances correspondent au minimum à 2 fois la longueur ca-ractéristique H du microdispositif.

Sur le deuxième point, la conservation de la pression est basée sur un algorithme simple : lors de l’initialisation les réservoirs sont mis sous pression constante ce qui correspond à un nombre initial de particules de simulation N_S(0). A la fin de chaque pas de temps le nombre de particule NS(t) est compté dans les réservoirs. Si la différence entre N_S(0) et N_S(t) est positive, nous perdons des particules, il faut en créer de fa¸con `

a compléter ce manque. A l’opposé, si ce nombre est négatif, nous avons un surplus de particules, il faut en détruire. La création et la destruction de particules se font dans la première cellule du réservoir pour le réservoir d’entrée, dans la dernière cellule du réservoir pour le réservoir de sortie. Les particules créées sont initialisées avec une position uniformément répartie dans ces cellules et avec une distribution de vitesse dont le module est égal à la vitesse thermique correspondant à la température du réservoir considéré et dont les directions sont isotropes.

On peut noter que cette adjonction au cours du processus permet d’obtenir des réservoirs de taille géométrique réduite par rapport à ce qui ce passe réellement en laboratoire.

3.5.2 Fonction zoom

Dans la section 3.4.1, nous avons décrit le lien entre les particules de simulation et les molécules réelles. Ce lien a été établi au niveau de chaque cellule. Nous avons donc

choisi de ne pas imposer un nombre NRconstant pour toutes les cellules. Au contraire il en r´esulte un nombre de particule simul´ee N_S qui lui reste constant d’une cellule `

a l’autre. A coté des avantages énumérés plus haut ce choix entraˆıne aussi quelques difficultés. En effet considérons deux cellules (1 et 2) caractérisées par N_R1 et N_R2. Lorsqu’une particule va de la cellule 1 à la cellule 2, ce sont N_R1 molécules qui vont dans la cellule 2. Mais dans la cellule 2 N_R1 molécules devraient être représentées par N_R1/N_R2 particules. Trois possibilités sont à envisager :

– N_R1 = N_R2, il suffit de d´eterminer son nouveau num´ero de cellule et de sous cellule et de la ranger.

– N_R1/N_R2 < 1, la particule peut être détruite selon la méthode de réjection. Si la particule est conservée, alors elle est classée comme précédemment.

– N_R1/N_R2 > 1, on classe la particule entrante et on crée autant de particules simulées que la valeur du rapport le permet. Les particules créées le sont dans le même cellule et sous cellule avec des positions différentes et la vitesse est conservée pour satisfaire la conservation de l’énergie et de l’impulsion.

L’avantage de cette méthode est que nous pouvons ordonner les cellules suivant la grandeur physique que nous voulons mesurer. Par exemple dans notre microcanal, si nous souhaitons mesurer le débit, il suffit de disposer des cellules adjacentes qui occupent toutes la section du microcanal. Inversement si nous voulons mesurer les profils de vitesses dans des sections du microcanal, nous aurons besoin de plusieurs cellules dans ces sections et chacune de ces cellules devra avoir un nombre de particules suffisant pour diminuer le bruit statistique. L’obtention de l’ensemble des profils de vitesse est donc très long en temps de calcul. C’est pourquoi, nous nous contenterons de calculer le profil de vitesse pour une unique section. Pour ce faire les cellules seront disposées dans le sens de la hauteur suivant une progression géométrique. Ce procédé permet de mettre au point un maillage local de plus en plus fin i.e. une fonction zoom. Ainsi, nous pouvons décomposer les sections suivant deux schémas (figure 3.4) :

1. Le premier est la d´ecomposition du domaine en cellules adjacentes avec un nombre de sous cellule fixe (figure 3.4a).

2. La deuxième consiste à d’augmenter progressivement le nombre de cellules suivant une suite géométrique lorsque l’on change de section, tout en diminuant le nombre des sous cellules (figure3.4b).

L’avantage de la m´ethode≪zoom≫ est qu’elle permet de d´eterminer des profils en tout point, en limitant le plus possible le bruit statistique tout en conservant un temps de calcul raisonnable.

En effet il faut remarquer que

3.5.3 Optimisation de la parall´elisation

La parallélisation de notre code bien que difficile est une nécessité pour obtenir des résultats d’une précision comparable à celle de nos résultats expérimentaux. La pa-rallélisation n’est efficace que si nous sommes capables d’équilibrer le temps de calcul de chaque processeur. Cela est relativement facile à faire dans un code aux différences

3.5 Sp´ecificit´e de notre notre simulation

b) a)

Figure 3.4 – Sur la figure a) le nombre de sous cellule (trait pointillé) est fixe (16) pour chaque cellule (trait plein) tandis que sur la figure b) le nombre de cellules croit et le nombre de sous-cellules décroit suivant une suite géométrique 2ⁿ. Dans les deux cas le produit des cellules et des sous cellules est égal à 16 pour chaque tranche

finies car il suffit de diviser le domaine de calcul avec un maillage régulier. En DSMC, nous avons deux contraintes : l’une est le type de découpage en cellules, imposé par les quantités que nous souhaitons mesurer, l’autre directement liée au temps de calcul, est le nombre de particules traitées par le processeur. L’utilisation de N_Rvariable offre des possibilités supplémentaires de satisfaire ces impératifs. En effet on peut mainte-nir ainsi un nombre de particules `a peu près constant par cellule, i.e. dans le cadre de la décomposition de la figure 3.4a une charge à peu près équivalente pour chaque processeur.

Ensuite, pour évaluer l’efficacité de la parallélisation, nous calculons le ≪speed up≫ S_n= T_s/(T_nn), où T_s est le temps de calcul pour un seul processeur, et T_n et le temps du calcul parallèle pour n processeurs. Les résulats de l’efficacité de la paralélisation sont montrés sur la figure.3.5. On peut être surpris par le comportement de l’efficacité qui croit quand le nombre de processeur croit. En fait ce phénomène porte un nom, il s’agit du ≪super linear speedup≫. Il est dû à la gestion des données dans la mémoire cache intégrée (L1,L2). Lors d’un calcul parallèle, la taille totale de la cache augmente avec le nombre de processeurs. Avec une taille de la cache plus importante, les données du programme peuvent quasiment se maintenir à l’intérieur de la cache ; c’est pourquoi le temps de calcul décroˆıt alors fortement (Akl (2004), Fischer(1991)).

Enfin dans l’optique de calculs lourds nécessitant un très grand nombre de parti-cules (2 à 100 millions de particules), la part des communications entre les processeurs deviennent prédominantes avec l’API MPI. Il faut alors envisager une structure d’or-dinateur où plusieurs processeurs peuvent gérer une mémoire partagée. Elle permet d’étendre à l’ensemble des processeurs la manipulation des objets par leur adresse y compris lors du passage d’un processeur à l’autre. Cette structure va considérablement accélérer les échanges d’informations. Nous avons donc adapté notre programme à cette architecture en utilisant l’API OpenMP (multi thread)OpenMP(2002). Toutefois cette structure à elle seule ne permet d’accroˆıtre indéfiniment ni le nombre de processeur ni

80 90 100 110 120 0 4 8 12 16 20 24 28 32 E [%] n 100%

Figure 3.5 – Calcul d’efficacit´e du code parall`ele.

la taille de la mémoire partagée, si bien que la combinaison des API OpenMP/MPI est la plus adaptée à l’architecture des calculateurs modernes. Le couplage des deux types d’API nous a permis d’obtenir pour l’instant 25% de gain de temps par rapport à une exécution n’utilisant que l’API MPI.

Dans le document Etude des écoulements gazeux isothermes en microconduit : du régime hydrodynamique au proche régime moléculaire libre (Page 53-57)