M ´ ETHODES IT ERATIVES PARALL ´ ELES ` - LIN EAIRES CREUX DES PROBL ´ EMES DE `

LIN EAIRES CREUX DES PROBL ´ EMES DE `

4.2/ M ´ ETHODES IT ERATIVES PARALL ´ ELES `

       

Trouver U^∗∈ RM tels que (A + δI)U^∗− G ≥ 0, U^∗≥ ¯Φ, ((A + δI)U^∗− G)T(U^∗− ¯Φ) = 0,

(4.5)

o ù A est une matrice obtenue apr ès la discr étisation spatiale par la m éthode des diff érences finies, G est issu de la d ériv ée partielle de premier ordre du sch éma à pas de temps implicite par la m éthode d’Euler et de la discr étisation du vecteur second membre du probl ème de l’obstacle, δ est l’inverse du pas de temps k et I est la matrice identit é. La matrice A est sym étrique dans le cas d’un op érateur autoadjoint et asym étrique dans le cas contraire.

En fonction du sch éma de discr étisation du Laplacien choisi, A est une M-matrice (irr éductiblement diagonale dominante, voir [76]) et, par cons équent, la matrice (A+δI) est aussi une M-matrice. Cette propri ét é est importante pour la convergence des m éthodes it ératives de r ésolution.

4.2/ M ´

ETHODES ITERATIVES PARALL

´

ELES

`

De nombreux auteurs [44, 52, 8, 72, 74, 73, 7, 54, 24] ont d éj à étudi é l’ana-lyse num érique et la r ésolution des équations non lin éaires issues des probl èmes de l’obstacle, par des m éthodes de r ésolution s équentielles ou parall èles synchrones/a-synchrones sur des calculateurs CPU. Cependant, dans ce document, nous nous

int éressons à la r ésolution de probl èmes compl émentaires (4.5) issus de la discr étisation de probl èmes de l’obstacle de grandes dimensions. Pour cela, nous nous int éressons à deux m éthodes it ératives parall èles synchrones ou asynchrones (voir [25, 57, 12, 15, 9]),

`a savoir :

– la m éthode Richardson projet ée pour la r ésolution du probl ème de diffusion et, – la m éthode de relaxation par blocs projet ée pour la r ésolution du probl ème de

convection-diffusion.

Dans cette section, nous pr ésentons le principe g én éral de la parall élisation de ces deux m éthodes de r ésolution.

4.2.1/ PRELIMINAIRES´

Soient E = RM un espace de Hilbert et α ∈ N un entier naturel. De plus, E = Qα i=1Ei

est un produit de α sous-espaces de Hilbert E_i = R^mi, tel que M =Pα

i=1m_i. Chaque sous-espace Eiest muni d’un produit scalaire h . , . ii et d’une norme | . |i pour tout i ∈ {1, . . . , α}. Enﬁn, pour tout U, V ∈ E, hU , Vi = Pα

i=1hU_i, Vii_i et k . k d ´eﬁnissent, respectivement, le produit scalaire et la norme dans E.

Dans ce qui suit, nous consid érons le probl ème de point fixe g én éral suivant : (

Trouver U∗∈ Etel que

U^∗= F(U^∗) (4.6)

o ù U 7→ F(U) est une application de E dans E. Soit U ∈ E, les d écompositions par blocs de U et de F sont pr ésent ées comme suit :

U = (U1, . . . , Uα) F(U) = (F1(U), . . . , Fα(U))

Les it érations parall èles asynchrones (voir section 2.3.3) pour la r ésolution du probl ème (4.6) sont d éfinies comme suit : soit U0 ∈ E une solution initiale donn ée, alors pour tout p ∈ N, Up+1est d éfini r écursivement par :

U_i^p+1=        F_i(U^ρ1(p) 1 , . . . , U^ρj(p) j , . . . , U^ρα(p) α )si i ∈ s(p) U_i^psinon ^(4.7) o `u ( ∀p ∈ N, s(p) ⊂ {1, . . . , α}et s(p) , ∅

∀i ∈ {1, . . . , α}, {p | i ∈ s(p)}est d ´enombrable ^(4.8) et ∀ j ∈ {1, . . . , α},        ∀p ∈ N, ρ_j(p) ∈ N, 0 ≤ ρj(p) ≤ pet ρj(p) = p si j ∈ s(p) lim p→∞ρ_j(p) = +∞. ^(4.9)

Le sch éma it ératif asynchrone, pr ésent é ci-dessus, mod élise des calculs parall èles effectu és sans un ordre pr écis ni synchronisation et il d écrit une m éthode de sous-domaines sans recouvrement. Plus pr écis ément, il permet de d éfinir des calculs dis-tribu és dans lesquels les processeurs calculent à leurs propres rythmes en fonction de leurs caract éristiques intrins èques et de leurs charges de calcul. Le parall élisme entre les processeurs est bien d éfini par l’ensemble s(p) qui contient à chaque étape p l’indice

des él éments de vecteur relax és en parall èle par chaque processeur. De plus, l’utilisa-tion des él éments reçus en retard dans (4.7) permet de d éfinir un comportement non d éterministe et non celui d’une inefficacit é du sch éma de calcul distribu é. Il est à noter que th éoriquement, d’apr ès [57], chaque él ément de vecteur doit être relax é une infinit é de fois. Le choix des él éments relax és peut être guid é par un crit ère quelconque. Ce-pendant, le crit ère de choix le plus évident consiste à utiliser les él éments de vecteur disponibles et r écemment calcul és par les processeurs.

Ce sch éma it ératif asynchrone (pr ésent é ci-dessus) permet de d écrire le mod èle g én éral des algorithmes it ératifs parall èles, entre autres, celui des it érations synchrones si :

∀ j ∈ {1, . . . , α}, ∀p ∈ N, ρ_j(p) = p.

Dans ce mod èle, l’erreur absolue e_i^p du bloc i est d éfinie par la norme euclidienne de la diff érence entre les deux valeurs du bloc Ui calcul ées par le processeur i aux deux it érations successives p − 1 et p comme suit :

e_i^p = kU_i^p− U_i^p−1k₂, (4.10)

o ù U_i^pest le bloc i du vecteur U calcul é à l’it ération p.

Afin d’ évaluer la quantit é de calcul n écessaire pour atteindre la convergence, nous prenons en consid ération dans les exp érimentations (voir section 4.4) le nombre de re-laxations au lieu de celui des it érations. En effet, une relaxation peut être d éfinie comme la mise à jour locale des él éments d’un bloc i du vecteur it ér é U en fonction de l’application Fi (voir formule (4.7)). Cette d éfinition s’applique aux deux cas : s équentiel et parall èle synchrone ou asynchrone. Par contre, une it ération est la mise à jour des él éments de tous les blocs i du vecteur it ér é U en fonction des applications F_i, o ù i ∈ {1, . . . , α}, de façon s équentielle ou parall èle synchrone. Donc, puisque cette derni ère d éfinition ne peut pas être appliqu ée au cas parall èle asynchrone, nous utilisons le nombre de re-laxations comme indicateur du nombre d’op érations flottantes n écessaires pour atteindre la convergence.

4.2.2/ M ´ETHODE PARALLELE DE` RICHARDSON PROJETEE´

Dans cette section, nous pr ésentons un algorithme it ératif parall èle pour la r ésolution du probl ème aux limites d éfini par un op érateur de diffusion (4.4) et associ é à un probl ème d’optimisation avec des contraintes sur la solution. Soit K un ensemble convexe ferm é d éfini comme suit :

K = {U | U ≥ ¯Φ partout dans E}

o ù ¯Φ est la fonction d’obstacle discr ète. En fait, le probl ème de l’obstacle (4.5) peut être d éfini comme un probl ème d’optimisation avec contraintes suivant :

(

Trouver U^∗∈ Ktel que ∀V ∈ K, J(U∗) ≤ J(V) o ù la fonction de co ût est donn ée comme suit :

J(U) = ¹

o ù h. , .i d éfinit un produit scalaire dans E, A = A + δI est une matrice sym étrique positive d éfinie et A est la matrice de discr étisation associ ée à l’op érateur autoadjoint (4.4) apr ès changement de variables.

Dans ce document, nous consid érons des probl èmes de l’obstacle de tr ès grandes tailles. Donc, afin de r éduire les temps de calcul, le probl ème d’optimisation (pr ésent é ci-dessus) peut être r ésolu en utilisant une m éthode parall èle asynchrone projet ée sur l’ensemble convexe K. Plus pr écis ément, nous utilisons un algorithme parall èle asyn-chrone de la m éthode Richardson projet ée [61].

Nous étendons le formalisme pr ésent é dans la section 4.2.1 pour d éfinir la m éthode Richardson parall èle asynchrone projet ée comme suit. Soient ∀i ∈ {1, . . . , α}, Ki ⊂ E_i, K_i est un ensemble convexe ferm é, K = Qα

i=1K_i et G = (G1, . . . , Gα) ∈ E. Pour tout U ∈ E, soit P_K(U) une projection de U sur K tel que P_k(U) = (PK1(U1), . . . , P_K_α(U_α)) o `u ∀i ∈ {1, . . . , α}, P_K_i est une projection de Ei sur Ki.

Pour tout γ ∈ R, γ > 0 param ètre de relaxation, soit un sch éma de point fixe F_γ d éfini par :

U^⋆= PK(U^⋆− γ(AU^⋆− G)) = Fγ(U^⋆), (4.11) qui peut être aussi d éfini comme suit, tel que Fγ(U) = (F1,γ(U), . . . , Fα,γ(U)):

∀U ∈ E, F_i,γ(U) = PKi(U_i− γ(A_iU − G_i)).

4.2.3/ M ´ETHODE PARALLELE DE RELAXATION PAR BLOCS PROJET` EE´

Dans cette section, nous utilisons la m éthode parall èle asynchrone de relaxation par blocs projet ée, qui est li ée directement à la d écomposition naturelle par blocs de l’op érateur discr étis é avec la m ême notation utilis ée dans la section 4.2.2. Cette m éthode peut être appliqu ée dans les deux cas o ù la matrice A est sym étrique ou asym étrique. Ceci signifie qu’elle peut être utilis ée pour r ésoudre les probl èmes discr étis és de diffusion ou ceux de convection-diffusion. C’est une m éthode parall èle de sous-domaines sans re-couvrement.

L’algorithme de relaxation par blocs projet ée est associ é au sch éma de point fixe sui-vant :

U_i^⋆= PKi(A⁻¹_i,i(Gi−^X

j,i

A_{i, j}U^⋆_j)) = FBi(U^⋆), ∀i ∈ {1, . . . , α}. (4.12)

Nous pouvons associer à ce sch éma de point fixe FB une m éthode par blocs parall èle asynchrone d éfinie par (4.7), (4.8) et (4.9).

4.2.4/ CONVERGENCE DES METHODES´

La propri ét é la plus importante pour assurer la convergence des deux m éthodes, d éfinies ci-dessous, est le fait que la matrice A soit une M-matrice [23]. De plus, la convergence de la m éthode Richardson projet ée est assur ée selon les travaux pr ésent és dans [61, 24] alors que, celle de la m éthode de relaxation par blocs projet ée peut être établie en utilisant, par exemple, des techniques de contraction [43, 62] ou d’ordre par-tiel [59, 60, 58].

Donc, il existe une valeur γ0 > 0, tel que ∀γ ∈]0, γ0[, les it érations synchrones et asyn-chrones (4.7), (4.8) et (4.9) de la m éthode Richardson projet ée, associ ées au sch éma de point fixe Fγ (4.11), convergent vers une solution unique U⋆du probl ème discr étis é pour toute solution initiale U0.

Nous supposons que le syst ème alg ébrique, issu de la discr étisation du probl ème de l’obstacle, est d écompos é en q blocs, q ≥ α, sans recouvrement. Les it érations syn-chrones et asynsyn-chrones de la m éthode de relaxation par blocs projet ée (4.7), (4.8) et (4.9), associ ées au sch éma de point fixe FB(4.12), convergent vers la solution unique U⋆

et ce, pour les deux types de d ´ecomposition : par blocs ou par points (α = M).

Dans le document Résolution de systèmes linéaires et non linéaires creux sur grappes de GPUs (Page 104-108)