Techniques de renum´erotation - Etude et optimisation du comportement ´ m´ emoire dans les m´ e

1 2

3 4

(a) arbre A – profond

1 2 3

4 5

(b) arbre B – large

Fig. 2.1 – Exemples d’arbres d’assemblage.

Puis la matrice frontale est assemblée à partir des valeurs de la matrice initiale et des blocs de contribution des nœuds fils. L’espace occupé par les blocs de contribution peut alors être libéré (“Étape d’assemblage pour le nœud 3” dans la figure 2.2(a)). Ensuite, la matrice frontale est factorisée (“Factorisation du nœud 3” dans la figure 2.2(a)). Les facteurs sont alors stockés dans l’espace de gauche et le nouveau bloc de contribution est empilé (“Stockage du bloc de contribution du nœud 3” dans la figure2.2(a)). Le processus continue jusqu’à la factorisation du (des) nœud (s) racine. On observe clairement un comportement mémoire différent entre un arbre large (Figure 2.2(b)) et un arbre profond (2.2(a)) : le pic de mémoire active (voir figure 2.2(b)) est plus grand pour des arbres larges.

Il faut noter que dans notre description, tous les blocs de contribution pour un nœud sont assemblés en même temps (dans le cas séquentiel). Une autre approche serait de pré-allouer la matrice frontale du nœud père et d’effectuer l’assemblage chaque fois qu’un bloc de contribution est produit. Cette approche qui n’est en général pas employée dans les solveurs multifrontaux implique une gestion plus complexe de la mémoire, surtout en cas de pivotage numérique. Ce dernier point sera rediscuté dans le chapitre 3dans lequel une étude détaillée des algorithmes d’optimisation de la mémoire est présentée.

Dans la suite, nous distinguons seulement deux zones mémoire principales : les facteurs et la mémoire active, où la mémoire active inclue la pile des blocs de contribution et l’espace de stockage pour la matrice frontale courante.

2.3 Techniques de renum´ erotation

Renuméroter les variables d’un système linéaire creux, c’est-à-dire permuter les lignes et les colonnes a pour objectif principal de réduire le remplissage (fill-in). Ici, nous

consi-Mémoire

Étape d’assemblage pour le noeud 3

Étape de factorisation du noeud 3 +

Stockage du bloc de contribution du noeud 3

espace mémoire inutilisé

espace mémoire des facteurs mémoire utiliséepile des blocs de contribution (a) Occupation m´emoire pour l’arbre A

Mémoire

espace mémoire des facteurs mémoire utiliséepile des blocs de contribution

(b) Occupation m´emoire pour l’arbre B

Fig. 2.2 – Évolution de la mémoire pour les arbres présentés dans la figure 2.1.

2.3. TECHNIQUES DE RENUM ´EROTATION 21

dérons les techniques de renumérotation symétrique qui peuvent aussi être appliquées à une matrice non-symétriqueAen considérant la structure deA+A^T (après permutation de colonnes dans le cas de matrices très asymétriques [25]). Remarquons qu’en cas de pivotage numérique, la permutation symétrique peut ne pas être respectée totalement, induisant un remplissage supplémentaire.

Deux schémas populaires de renumérotations symétriques sont les heuristiques locales telle que le degré minimum (AMD [6], MMD [39]) ou le remplissage minimum (AMF, MMF) [44,48] et les heuristiques globales basées sur le partitionnement du graphe de la matrice, comme les dissections emboˆıtées [30]. Une autre classe d’algorithmes a aussi été con¸cue qui combine les heuristiques locales avec les heuristiques globales.

Dans une étude théorique [54] sur différentes topologies d’arbres en particulier cor-respondant à des problèmes 2D ou 3D réordonnés avec des dissections emboˆıtées, les auteurs ont donné des bornes théoriques de l’occupation mémoire des différentes familles d’algorithmes de factorisation de matrices creuses. Leurs travaux se sont arrêtés à l’étude des topologies simples et à des problèmes réguliers. Dans le cas des problèmes irréguliers, l’étude théorique devient plus complexe du fait de la diversité et de l’irrégularité des topo-logies. Dans les sections suivantes nous étudierons de manière expérimentale la topologie et le comportement mémoire de la méthode multifrontale sur des problèmes irréguliers avec différentes techniques de renumérotation.

Dans ce qui suit, nous utiliserons simplement les termes AMD, AMF, METIS, SCOTCH et PORD pour identifier les heuristiques présentées dans dans le chapitre 1 et dans l’annexeC. Il faut aussi noter que pour AMD, AMF, SCOTCH et PORD, l’arbre d’assemblage et construit en même temps par les algorithmes de renumérotation, tandis que pour METIS, seule la permutation est retournée et nous utilisons la factorisation symbolique du logiciel MUMPS pour construire l’arbre d’assemblage.

Nous avons aussi étudié une heuristique purement globale, les dissections emboˆıtées [30], mais il s’est avéré qu’elle n’était en fait efficace que sur des exemples bien précis, et seulement pour des problèmes très réguliers, aussi nous avons décidé de ne pas la considérer dans ce qui suit.

Matrice Ordre NZ Type BMWCRA 1 148770 5396386 SYM GRID 109744 1174048 SYM GUPTA3 16783 4670105 SYM MSDOOR 415863 10328399 SYM SHIP 003 121728 4103881 SYM PRE2 659033 5959282 NS RMA10 46835 2374001 NS TWOTONE 120750 1224224 NS XENON2 157464 3866688 NS

Tab. 2.1 – Description des problèmes de test. “SYM” signifie que la matrice est symé-trique, “NS” signifie que la matrice est non-symétrique.

La figure 2.4 donne le rapport entre le pic de la mémoire active et la taille finale des facteurs dans le cas séquentiel (la taille finale des facteurs pour tous les problèmes

étudiés et pour toutes les techniques de renumérotation est donnée dans figure 2.3.) Les matrices considérées sont présentées dans le tableau 2.1 et sont décrites plus en détails dans l’annexe C. Nous pouvons observer que le pic de mémoire active peut être significatif en comparaison de la taille des facteurs (le ratio est proche de 1). De plus, pour certains problèmes comme la matrice GUPTA3, le pic de la mémoire active est largement supérieur à la taille des facteurs. Cela illustre parfaitement qu’il faut aussi tenir compte de la gestion de la mémoire active lors de l’évaluation de la consommation mémoire des solveurs multifrontaux, séquentiels ou parallèles.

Taille des facteurs (en millions de réels)

METIS SCOTCH PORD AMF AMD

Fig. 2.3 – Taille des facteurs (millions de r´eels).

Pic de mémoire active / Taille des facteurs

METIS

Pic de mémoire active / Taille des facteurs

(b)

Fig. 2.4 – Rapport entre la taille de la m´emoire active et la taille des facteurs.

2.4 Impact des techniques de renum´ erotation sur la structure des arbres d’assemblage

Dans cette section, nous étudions l’impact des techniques de renumérotation sur la structure de l’arbre d’assemblage correspondant. Nous considérons les problèmes tests décrits par le tableau 2.1 et les techniques de renumérotation introduites dans la section précédente 2.3 (METIS, SCOTCH, PORD, AMF et AMD).

Dans le document Etude et optimisation du comportement ´ m´ emoire dans les m´ ethodes parall` eles de (Page 27-31)