Un résultat de convergence des algorithmes parallèles asynchrones. Application aux opérateurs maximaux fortement monotones

(1)

HAL Id: tel-00134642

https://tel.archives-ouvertes.fr/tel-00134642v2

Submitted on 5 Mar 2007

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

asynchrones. Application aux opérateurs maximaux

fortement monotones

Abdenasser Benahmed

To cite this version:

Abdenasser Benahmed. Un résultat de convergence des algorithmes parallèles asynchrones. Applica-tion aux opérateurs maximaux fortement monotones. Mathématiques [math]. Faculté des Sciences d’Oujda, 2005. Français. �tel-00134642v2�

(2)

UNIVERSITE MOHAMED PREMIER

FACULTE DES SCIENCES

OUJDA

No d'ordre : 80/05

THESE

Pour l'obtention du Doctorat en Sciences Discipline : Mathematiques

Specialite : Analyse Numerique et Informatique

Un resultat de convergence des algorithmes paralleles asynchrones. Application aux operateurs maximaux fortement monotones.

Par

abdenasser benahmed

Soutenue publiquement le 28 juillet 2005 devant le jury :

President :

M. E. M. DAOUDI Faculte des sciences Oujda

Examinateurs :

M. A. ADDOU Faculte des sciences Oujda M. O. CHAKRONE Faculte des sciences Oujda M. A. LIDOUH Faculte des sciences Oujda

(3)

(4)

Remerciements

Tout au long de ces annees de these, certaines personnes m'ont soutenu et aide. Je tiens a les remercier tout particulierement.

Je voudrais tout dabord te remercier Ahmed ADDOU, pour avoir dirige cette these. Merci pour ta disponibilite, ton soutien permanent et ton aide qui m'ont permis de mener a bien ces travaux. Aussi, je tiens a t'assurer ma profonde gratitude pour m'avoir initie a la recherche.

Je tiens egalement a remercier El Mostapha DAOUDI et Omar CHAKRONE de la faculte des sciences d'Oujda et Ahmed ROUBI de la faculte des sci-ences et techniques de Settat de m'avoir fait l'honneur d'accepter d'^etre rap-porteurs de cette these, ainsi que Abdelouahab LIDOUH de la faculte des sciences d'oujda pour avoir accepte d'^etre membre de mon jury.

Merci a tous mes proches, famille et amis, qui m'ont soutenu et encourage tout au long de ces annees de these.

(5)

Dans ce travail, nous avons considere des algorithmes paralleles asyn-chrones associes a des applications non lineaires non-expansives de nies sur Rn. Nous avons montre le resultat de convergence concernant ces algorithmes vers un point xe de ces applications relativement a la norme uniforme sur Rn. Ce theoreme etend le resultat donne par Bahi[3] au cas non lineaire. Nous avons ensuite montre comment ces algorithmes sont bien adaptes au calcul de la solution d'un operateur maximal fortement monotone de ni sur Rn et au calcul des solutions d'un operateur maximal monotone dans le cas de l'algorithme parallele synchrone de Jacobi. Ensuite, nous avons applique ces resultats aux calculs du minimum de fonctionnelles, du point selle, de la solution des programmes convexes et en n de la solution du probleme de l'inegalite variationnelle.

(6)

4 A. Benahmed

Abstract

A convergence result for parallel asynchronous

algo-rithms. Application to maximal strongly monotone

op-erators

In this work, we have considered a parallel asynchronous algorithms as-sociated with nonlinear and nonexpansive mapping de ned in Rn_{. We have}

shown the convergence result for this algorithms to a xed point of such mapping with respect to the uniform norm. This result extends the result published by Bahi[3] to the nonlinear case. We have then proved how this algorithms can be used to calculate the solution of a maximal strongly mono-tone operator in Rn_{and calculate the solutions of a maximal monotone}

oper-ator in the special case of parallel synchronous algorithm of Jacobi. Finally, this results are applied to calculate a minimum of functionals, a saddle point, a solution of convex programming and a solution of variational inequality problem.

(7)

Remerciements 2

Resume 3

Introduction 6

1 Notions et resultats preliminaires 14

1.1 Notions d'analyse convexe . . . 14

1.2 Notions d'operateurs maximaux monotones . . . 19

1.3 Algorithmes asynchrones . . . 23

2 Convergence de l'algorithme general 29 2.1 Introduction . . . 29

2.2 Le cas asynchrone . . . 29

2.3 Algorithme synchrone de Jacobi . . . 35

2.4 Solution des operateurs maximaux monotones . . . 35

3 Applications 40 3.1 Minimum d'une fonctionnelle . . . 40

3.2 Point selle . . . 42 3.3 Programme convexe . . . 45 3.4 Inegalite variationnelle . . . 46 Conclusion 49 References 50 5

(8)

Introduction

Lors de la modelisation d'un grand nombre de problemes mathematiques, physiques, economiques ou sociaux, nous sommes confronte a la resolution d'une equation de la forme :

f (x) = 0 (0.1)

ou x_{2 E espace vectoriel, et f une application de E vers E. Cette equation} peut ^etre ecrite sous la forme :

F (x) = x (0.2)

si nous posons F (x) = x f (x), equation connue sous le nom de probleme de point xe, etant donne que les solutions de l'equation (0.2) sont appelees points xes de F .

Pour resoudre ce type de probleme, nous pouvons utiliser deux principales methodes numeriques :

{ Les methodes directes qui se de nissent sous forme d'equations de recurrence et conduisent a la solution en un nombre ni d'etapes. Ces methodes ont l'inconvenient de ne pas prendre en consideration les particularites de l'application F .

{ Les methodes iteratives qui evaluent la solution du probleme par ap-proximations successives en engendrant une suite de vecteurs qui doit tendre

(9)

vers la solution. Elles ont l'avantage d'utiliser les particularites de F, mais la convergence de ces methodes vers la solution exige des conditions plus ou moins severes.

De nombreux algorithmes iteratifs ont ete developpes pour le calcul de la solution du probleme (0.1). On peut citer par exemple, les methodes de substitutions successives (methode de Jacobi, methode de Gauss-Seidel), les methodes de Newton et ses derivees, les methodes de minimisation de fonc-tionnelles (gradient, gradient conjugue, Levenberg-Marquardt, Powell...) et bien d'autres plus au moins anciennes.

Ces algorithmes rentrent dans le cadre de ce qu'on appelle algorithmes sequentiels, c'est-a-dire des algorithmes qui pourront ^etre implementes sur des machines mono-processeur qui les executera sequentiellement (instruc-tion apres instruc(instruc-tion). La parallelisa(instruc-tion de ces algorithmes consiste a les reecrire en les divisant en des t^aches independantes, chacune executee par un processeur. Ces algorithmes paralleles s'implementent sur des machines multi-processeurs appelees machines paralleles.

Si les processeurs commencent chaque iteration en m^eme temps, et atten-dent d'avoir recu les donnees necessaires mises a jour a l'iteration preceatten-dente pour commencer l'iteration suivante, on parle alors d'algorithmes synchrones. Avec les algorithmes asynchrones, les processeurs e ectuent leurs ietrations sans tenir compte de l'avancement des autres. Il n'y a plus d'attente des donnees venant d'autres processeurs pour commencer une iteration.

L'idee des iterations chaotiques a ete introduite par Chazan et Miranker dans [10] en 1969 pour resoudre le systeme lineaire

Ax = b

ou A est une matrice symetrique de nie positive dans Rn n, x et b sont des vecteurs de Rn.

En decomposant la matrice A sous la forme A = D E, on obtient l'equation

(10)

8 A. Benahmed

ou F (x) = Bx + C, B = D 1_{E et C = D} 1_b.

Ils ont propose le modele suivant 8 > > > > > > < > > > > > > : x0 2 Rn xp+1_i = ( xp_i si i_{6= l(p)} Fi(x p r1(p) 1 ; :::; x p rn(p) n ) si i = l(p) i = 1; :::; n p = 0; 1; :: (0.4)

ou pour tout p_{2 N, x}p denote le vecteur itere a l'etape p, l(p)_{2 f1; :::; ng et} R =_f(r1(p); :::; rn(p))g_p2N est une suite de Nn veri ant :

Pour s_{2 N ;}

(a) 0 ri(p) < s 8i 2 f1; :::; ng ; 8p 2 N:

(b) _{8i 2 f1; :::; ng l}0_ensemble _{fp 2 N; i = l(p)g est infini:}

Ce modele doit ^etre interprete comme suit : A chaque iteration p+1, seule-ment la composante l(p) qui est mise a jour, les autres restent inchangees. La condition (a) a rme que les retards ri(p) (1 i n) dus aux

communica-tions entre processeurs et aux di erents calculs sont bornes, et la condition (b) signi e qu'aucun bloc de composante ou aucune composante n'est aban-donnee de nitivement lors du processus iteratif ; on doit reactualiser chaque composante une in nite de fois et donc toutes les composantes sont mises a jour de maniere equitable. Notons que les methodes de Gauss-Seidel et de Jacobi sont des cas particuliers du modele (0.4), en e et :

{ dans le cas ou r1(p) = r2(p) = ::: = rn(p) = 0 et l(p) (p mod n) + 1, on

tombe sur les relaxations de Gauss-Seidel.

{ et si nous prenons r1(p) = r2(p) = ::: = rn(p) = (l(p) 1) et l(p)

(p mod n) + 1 alors on aura les relaxations de Jacobi.

Dans [10] Chazan et Miranker ont etabli le resultat suivant :

Theoreme 0.1 Les iteration _fxp

g_p2N de nies par (0.4) convergent vers la solution de (0.3) ssi (_{jBj) < 1.}

(11)

ou_{jBj est la matrice dont les elements sont les valeurs absolues des elements} de B, (A) est le rayon spectrale de la matrice A.

Les travaux de Chazan et Miranker ont ete etendu dans le cas de systemes non lineaires par F. Robert et al. [21],[22], dans une situation ou les pro-cesseurs communiquent entre eux de maniere synchrone. Dans un m^eme temps, en 1974 (et 1975) Miellou dans [16] et [17] a etendu le modele (0.4) dans deux sens : le premier est qu'a chaque iteration, la mise a jour peut toucher plus qu'une composante (un ensemble de composantes), le deuxieme est que l'application F peut ^etre non lineaire. Il a alors propose le modele suivant a retards bornes :

8 > > > > > > < > > > > > > : x0 2 Rn xp+1_i = ( xp_i si i =_{2 J(p)} Fi(x p r1(p) 1 ; :::; x p rn(p) n ) si i2 J(p) i = 1; :::; n p = 0; 1; :: (0.5)

ou_fJ(p)g_p2N est une suite de sous-ensembles non vides de_{f1; :::; ng appelee} strategie et R =_f(r1(p); :::; rn(p))g_p2N est une suite de Nn de nissant la suite

des retards veri ant :

(a) _{8i 2 f1; :::; ng ; 0} ri(p) p.

(b) _{8i 2 f1; :::; ng l'ensemble fp 2 N; i 2 J(p)g est in ni.}

La notion de strategie correspond aux numeros des composantes sur lesquelles on travaille et rend bien compte du parallelisme ; a l'iteration p on traitera en prallele les composantes i telles que i _{2 J(p). La notion de} retards rend compte de l'asynchronisme avec lequel est traitee chacune des composantes.

Dans la demonstration de son resultat, Miellou a utilise une technique de contraction en norme vectorielle de nie comme suit :

(12)

10 A. Benahmed

De nition 0.1

Une application F de Rn _{vers lui-m^}_{eme est dite contractive par rapport a}

x _{2 R}n

s'il existe une matrice T dans Rn n _{non-negative telle que :}

(i) (T ) < 1

(ii) _{jF (x)} F (x )_j T_jx x _{j 8x 2 R}n

ou _{jxj est le vecteur a composantes les valeurs absolues des composantes} du vecteur x, et l'inegalite dans (ii) est vectorielle, c'est-a-dire verifee com-posante par comcom-posante.

Il a suppose l'hypothese suivante traduisant les retards bornes :

(c) Toute composante est mise a jour au moins une fois apres chaque s iterations consecutives (s_{2 N ).}

Il a alors montre le resultat suivant :

Theoreme 0.2

Si F admet un point xe x et si elle est contractive par rapport a x , alors les iterations (0.5) convergent vers le point xe x de F .

Il est facile de veri er que les conditions de Chazan-Miranker entra^nent celles de Miellou et donc ce modele est plus general que celui propose par Chazan-Miranker. En e et, on a la proposition suivante :

Proposition 0.3

Soit l'application F (x) = Bx + C de Rn

vers Rn _{telle que (}

jBj) < 1. Alors 1. F admet un point xe unique x .

2. F est contractive par rapport a x au sens de la de nition 0.1.

En 1978 Baudet dans [5] a generalise les iterations chaotiques de Chazan-Miranker et de Miellou par des iterations qu'il a nommees iterations asyn-chrones. Il a propose le modele suivant ou les retards consideres peuvent ^etre in nis :

(13)

8 > > > > > > < > > > > > > : x0 2 Rn xp+1_i = ( xp_i si i =_{2 J(p)} Fi(x s1(p) 1 ; :::; x sn(p) n ) si i2 J(p) i = 1; :::; n p = 0; 1; :: (0.6)

ou_fJ(p)g_p2N est une suite de sous-ensembles non vides de _{f1; :::; ng et} S =_f(s1(p); :::; sn(p))g est une suite de Nn veri ant pour tout i2 f1; :::; ng :

(a) si(p) p; 8p 2 N.

(b) l'ensemble _{fp 2 N; i 2 J(p)g est infini.} (c) lim

p!1si(p) =1.

J (p) est l'ensemble des composantes relaxees a l'iteration p.

p si(p) correspond au retard eventuel d^u au ieme processeur lors du calcul

du ieme _{bloc a l'iteration p.}

La condition (a) a rme que les valeurs du vecteur itere utilisees a l'iteration p + 1 proviennent aux maximum de l'iteration p. La condition (c) indique que les valeurs trop anciennes sont ecartees au fur et a mesure que les calculs progressent.

Baudet a suppose que F est contractive sur D _Rn _c'est-a-dire

contrac-tive par rapport a chaque x_{2 D condition plus forte que celle proposee par} Miellou et a montre le resultat de convergence suivant :

Theoreme 0.4

Si F est contractive sur un ensemble ferme D _Rn _{et si F (D)} _{D alors}

tout algorithme asynchrone (0.6) converge vers l'unique point xe de F dans D.

Citons egalement les travaux de Bertsekas et Tsitsiklis [7],[8] et [9], ou les iteres successifs appartiennent a des espaces emboites ce qui assure la con-vergence, ce dernier travail ayant ete repris par Miellou, Cortey-Dumont et Boulbrach^ene dans [19] en prenant en compte la propagation d'erreur d'ar-rondi. Dans un context di erent, El Tarazi[13] a egalement etabli un resultat

(14)

12 A. Benahmed

de convergence des algorithmes asynchrones par des techniques de contrac-tion selon une norme scalaire appropriee.

La quasi-totalite des resultats de convergence concernant ces algorithmes utilisent des techniques de contraction [5], [10], [13], [17], [21] ou des tech-niques d'ordre partiel [12], [18]. Bahi dans [3] a donne un resultat de conver-gence concernant les algorithmes paralleles asynchrones pour des problemes lineaires de point xe utilisant des operateurs non-expansifs relativement a une norme uniforme avec poids. Dans son travail, il a utilise un processus iteratif non stationnaire, c'est-a-dire qu'il a pris une matrice Tp _{qui varie a}

chaque iteration p, utilisant les hypotheses : ( 9K 2 N ; 8p 2 N : p K + 1 si(p) p (retards bornes) (0.7) 8 > > > < > > > :

La suite de matrices _fTp_g_p2N converge vers une matrice Q paracontractante

par rapport a la norme uniforme ponderee, i.e. x_{6= Qx , kQxk}_1; <_kxk_1; ; _{8x 2 R}n

(0.8)

Notre travail (voir Addou et Benahmed [1] et [2]), consiste a etudier la convergence des algorithmes paralleles asynchrones associes a des operateurs non lineaires non-expansifs de nis sur Rn_{. Dans notre approche, nous avons}

suivi les etapes traitees par Miellou dans [17] et par Bahi dans [3] et avons donc suppose que les retards dus aux communications et aux di erents calculs sont bornes. Cependant, a la place de la condition (0.8) nous avons suppose que l'application F veri e l'hypothese suivante :

8x; x0 2 Rn; _{kF (x)} F (x0)_k2 _{hF (x)} F (x0); x x0_i (0.9) ou _{h:; :i est le produit scalaire euclidien sur R}n _et

k::k designe la norme euclidienne (associee), hypothese verifee par une large classe d'operateurs comme nous allons le voir dans la section 2.2.

Nous montrerons dans un premier temps qu'etant donnee une applica-tion F non lineaire de Rn

(15)

F , l'algorithme parallele asynchrone a retards bornes associe a l'applica-tion F converge vers un point xe de F . Ensuite, dans un deuxieme temps, nous montrerons comment ces algorithmes sont bien adaptes au calcul des solutions d'un operateur T maximal fortement monotone de ni sur Rn _et

au calcul des solutions d'un operateur T maximal monotone dans le cas de l'algorithme parallele synchrone (sans retards) de Jacobi utilisant dans les deux cas l'application F = (I + cT ) 1 _{ou c est un reel strictement}

posi-tif bien choisi. Nous appliquerons en n ces derniers resultats aux calculs de minimum de fonctionnelles, des points selle, des solutions des programmes convexes et en n des solutions du probleme de l'inegalite variationnelle.

Le reste du travail est organise comme suit :

Dans le chapitre 1, nous presenterons les objets et resultats que nous al-lons utiliser dans la suite. Nous citerons dans un premier temps des notions d'analyse convexe, notamment concernant les fonctions convexes, fonctions concaves et fonctions selle comme elles ont ete de nies dans Rockafellar[23]. Ensuite dans un deuxieme temps, nous parlerons des operateurs maximaux monotones et leurs proprietes notamment celles qui nous interessent dans ce travail, et nous terminerons le chapitre par une description plus ou moins detaillee des algorithmes paralleles asynchrones associes a un operateur F de Rn vers Rn dans son cadre general.

Dans le chapitre 2, nous demontrerons le resultat principal concernant la convergence de l'algorithme general vers un point xe d'un operateur non lineaire F de Rn vers Rn. Nous montrerons ensuite la convergence de cet al-gorithme vers la solution d'un operateur maximal fortement monotone de ni sur Rn et la convergence de l'algorithme parallele synchrone de Jacobi vers la solution d'un operateur maximal monotone de ni sur Rn.

Dans le chapitre 3, nous appliquerons les resultats du chapitre 2 aux calculs du minimum d'une fonctionnelle, du point selle d'une fonction selle, de la solution des programmes convexes et en n de la solution du probleme de l'inegalite variationnelle.

(16)

Chapitre 1

Notions et resultats

preliminaires

Dans tout le chapitre, H designe un espace de Hilbert reel muni du produit scalaire note_{h:; :i et de la norme associee notee k::k.}

L'ensemble des parties de H sera note 2H_.

1.1 Notions d'analyse convexe

Toutes les de nitions et proprietes citees dans cette section peuvent ^etre consultees dans Rockafellar[23].

(a) Fonctions convexes

Considerons une fonction f de nie sur H a valeurs dans ] _{1; +1].} Donc f peut prendre la valeur +_1.

(a1) Le domaine de f est l'ensemble

dom(f ) =_{fx 2 H; f(x) < +1g}

(a2) L'epigraphe de f est l'ensemble

epif =_{f(x; c) 2 H} _{R; f(x)} c_g

(17)

(a3) La fonction f est dite { convexe si : f (tx + (1 t)x0) tf (x) + (1 t)f (x0) _{8x; x}0 _{2 H; 8t 2 [0; 1]} { a-fortement convexe (a > 0) si : ( f (tx + (1 t)x0₎ _{tf (x) + (1} _{t)f (x}0₎ 1 2at(1 t)kx x0k 2 8x; x0 _{2 H; 8t 2 [0; 1]}

(a4) La fonction convexe f est dite propre si son domaine dom(f ) est un ensemble non vide. Nous utiliserons aussi l'ecriture f ₆ +_{1 pour} dire que f est propre.

(a5) La fonction f est dite semi-continue inferieurement (s.c.i.) si pour tout c_{2 R, l'ensemble}

fx 2 H; f(x) c_g

est un ensemble ferme.

Des exemples et proprietes des fonctions convexes et s.c.i. peuvent ^

etre trouves dans les cours de topologie generale.

(a6) Soit f une fonction convexe et propre. Si f est s.c.i. alors on dit que f est fermee.

(a7) Un element x de H est dit sous-gradient de f au point x0 2 H si

f (x0) f (x0) +hx; x0 x0i ; 8x0 2 H

L'ensemble des sous-gradients de f en x0 est appele sous-di erentiel

de f au point x0 et est note par @f (x0). L'operateur multivoque1

@f : x0 ! @f(x0) est appele sous-di erentiel de f . L'ensemble

@f (x0) est un convexe ferme qui peut ^etre vide, et si @f (x0) 6= ,

alors f est dite sous-di erentiable en x0.

(18)

16 A. Benahmed

(b) Fonctions concaves

Soit maintenant une fonction g : H _{! [ 1; +1[.}

La valeur +_{1 est exclue alors que la valeur 1 est possible.}

(b1) Le domaine de g est l'ensemble

dom(g) =_{fx 2 H; g(x) > 1g}

(b2) L'epigraphe de g est l'ensemble

epig =_{f(x; c) 2 H} _{R; g(x)} c_g

(b3) La fonction g est dite

{ concave si la fonction g : H _!] _{1; +1] est convexe.}

{ a-fortement concave (a > 0) si la fonction g est a-fortement convexe.

(b4) La fonction concave g est dite propre si la fonction convexe g est propre, c'est-a-dire s'il existe x_{2 H tel que g(x) > 1 (dom(g) 6=}

).

(b5) La fonction g est dite semi-continue superieurement (s.c.s.) si g est s.c.i., autrement dit, si pour tout c_{2 R, l'ensemble}

fx 2 H; g(x) c_g

est un ensemble ferme.

(b6) Soit f une fonction concave et propre. Si f est s.c.s. alors on dit que f est fermee.

(b7) Pour chaque y0 2 H, l'ensemble @g(y0) est de ni comme etant

l'ensemble des y _{2 H tels que :}

(19)

Les elements y de @g(y0) sont appeles sous-gradients de g au point

y0, et la multifonction y0 ! @g(y0) est appelee sous-di erentiel de

g, bien qu'on aurait pu utiliser les termes gradients et super-di erentiel.

Remarquons que @g(y) = @( g)(y)

(c) Fonctions selle

Considerons deux espaces de Hilbert H1 et H2, chacun muni d'un produit

scalaire que nous notons_{h; i pour simpli er et L une fonction de H}1 H2

a valeurs dans [ _{1; +1].}

(c1) Un point selle de L est un point (x0; y0) de H1 H2 caracterise par

L(x0; y) L(x0; y0) L(x; y0); 8(x; y) 2 H1 H2 c'est-a-dire : L(x0; y0) = inf x2H1 L(x; y0) = sup y2H2 L(x0; y)

(c2) On dit que L est une fonction selle si elle est convexe-concave, c'est-a-dire si,

la fonction Ly : x! L(x; y) est convexe 8y 2 H2 et

la fonction Lx : y ! L(x; y) est concave 8x 2 H1.

(c3) On dit que L est une fonction a-fortement convexe-concave (a > 0), si L(x; y) est a-fortement convexe en x et a-fortement concave en y.

(c4) Soit L une fonction selle sur H1 H2. De nisons

dom1(L) = fx 2 H1 : L(x; y) < +1; 8y 2 H2g = \ y2H2 dom(Ly) dom2(L) =fy 2 H2 : L(x; y) > 1; 8x 2 H1g = \ x2H1 dom(Lx)

dom1(L) est une partie convexe de H1.

(20)

18 A. Benahmed

Le produit cartesien (convexe)

dom(L) = dom1(L) dom2(L)

est appele domaine e ectif de L, puisque

8x 2 dom1(L); 8y 2 dom2(L); 1 < L(x; y) < +1

et donc L est nie partout sur dom(L).

(c5) La fonction L est dite propre si dom(L)_{6= .}

(c6) Soit L une fonction selle propre sur H1 H2. On dit que L est

fermee si,

la fonction x_{! L(x; y) est s.c.i. sur H}1 8y 2 H2,

et la fonction y _{! L(x; y) est s.c.s. sur H}2 8x 2 H1.

(c7) Soit L une fonction selle sur H1 H2 et (x0; y0) un element de

H1 H2. De nissons

@1L(x0; y0) = @xL(x0; y0)

comme etant l'ensemble des sous-gradients de la fonction convexe L(:; y0) en x, i.e. l'ensemble des vecteurs x de H1 tels que

L(x0; y0) L(x0; y0) +hx; x0 x0i ; 8x0 2 H1

De facons similaire, nous de nissons

@2L(x0; y0) = @yL(x0; y0)

= _{fy 2 H}2 : L(x0; y0) L(x0; y0) +hy; y0 y0i ; 8y0 2 H2g

comme etant l'ensemble des sous-gradients de la fonction concave L(x0; :) en y.

Les elements de l'ensemble

(21)

sont alors de nis comme etant les sous-gradients de L en (x0; y0).

Et l'application multivoque @L : (x0; y0) ! @L(x0; y0) est appelee

sous-di erentiel de L. Les elements de @L(x0; y0) sont les vecteurs

(x; y)_{2 H}1 H2 veri ants : ( L(x0_{; y} 0) hx; x0 x0i L(x0; y0) L(x0; y0) hy; y0 y0i 8(x0_{; y}0₎_{2 H} 1 H2

Notons que pour tout (x0; y0)2 H1 H2, @L(x0; y0) est un ensemble

convexe ferme de H1 H2 qui peut ^etre vide.

1.2 Notions d'operateurs maximaux monotones

Beaucoup de problemes (problemes de minimisation de fonctionnelles, problemes de minimax, problemes des inegalites variationnelles...) peuvent se ramener a la determination des solutions (ou zeros) d'un operateur mul-tivoque maximal monotone A, c'est-a-dire des elements x de H satisfaisant 0_{2 Ax, d'ou l'utilite de ces operateurs.}

Les de nitions et proprietes que nous allons citer dans cette section, le lecteur pourra les retrouver dans Brezis[6] et Deimling[11].

(a) Un operateur multivoque sur H est une application A : H _{! 2}H_.

Donc, pour chaque x_{2 H, Ax represente une partie de H qui peut ^etre} vide.

Le domaine de A est l'ensemble

D(A) =_{fx 2 H : Ax 6= g}

L'image de A est l'ensemble

R(A) =_{fAx; x 2 D(A)g =} [

x2D(A)

(22)

20 A. Benahmed

Le graphe de A est l'ensemble

G(A) =_{f(x; y) : x 2 D(A) et y 2 Axg} H H

qui sera identi e a l'operateur A.

Si pour tout x_{2 H, l'ensemble Ax contient au plus un element, on dira} que A est univoque.

L'inverse de A est l'operateur A 1 dont le graphe est le symetrique du graphe de A, i.e.

(x; y)_{2 G(A} 1) _{() (y; x) 2 G(A)} et on a

D(A 1) = R(A):

Si A et B sont deux operateurs de H, et deux reels, alors on de nit A + B comme etant l'operateur

x_{! Ax + By = f u + v : u 2 Ax et v 2 Byg}

(b) Un operateur univoque A sur H est dit k-lipschitzien ou lipschitzien de rapport k (k > 0) par rapport a une norme _{k::k si}

8x; y 2 D(A); kAx Ay_k k_kx y_k

{ si k = 1, alors A est dit non-expansif.

{ si k < 1, on dit que A est contractif ou contraction de rapport k.

(c) Un operateur lineaire A de ni sur H est dit : { symetrique si

8x; y 2 H; hy; Axi = hAy; xi : { semi-de ni positive ou tout simplement positif si

(23)

(d) Un operateur multivoque A de H est dit : { monotone si 8x; x0 2 D(A); hy y0; x x0_i 0 _{8y 2 Ax; 8y}0 _{2 Ax}0 { strictement monotone si 8x; x0 2 D(A); hy y0; x x0_{i > 0 8y 2 Ax; 8y}0 _{2 Ax}0 { a-fortement monotone (a > 0) si 8x; x0 2 D(A); hy y0; x x0_i a_kx x0_k2 _{8y 2 Ax; 8y}0 _{2 Ax}0 Exemples d'operateurs monotones :

(d1) Si A est un operateur monotone, alors les operateurs A ( > 0) et A 1 _{sont monotones.}

(d2) Si F est une application non-expansive sur H, alors l'operateur I F est monotone (I etant l'identite de H).

(d3) Si A et B sont deux operateurs monotones alors la somme A + B est un operateur monotone.

(d4) Si f : H _!] _{1; +1] est une fonction convexe propre, alors le} sous-di erentiel @f est monotone dans H.

(d5) T est a-fortement monotone (a > 0) _{() l'operateur T}0 = T aI est monotone.

(e) Soient A et B deux operateurs monotones de H. Alors

G(A) G(B) ₍₎ (

D(A) D(B)

8x 2 D(A); Ax Bx

(f) Un operateur A monotone est dit maximal monotone s'il est maximal dans l'ensemble des graphes monotones par l'inclusion, c'est-a-dire si le graphe G(A) n'est contenu dans le graphe d'aucun autre operateur mono-tone B : H _{! 2}H_.

(24)

22 A. Benahmed

En general, pour montrer qu'un operateur monotone A est maximal, nous prenons un (x; y) _{2 H} H tel que _hy ; x _i 0; _{8( ; ) 2 G(A)} et nous montrons que x_{2 D(A) et y 2 Ax.}

Exemples d'operateurs maximaux monotones :

(f1) Si A est un operateur maximal monotone, alors les operateurs A 1

et A ( > 0) sont maximaux monotones.

(f2) La somme de deux operateurs A et B maximaux monotones n'est pas forcement maximal monotone.

(f3) Le sous-di erentiel @f d'une fonction convexe propre et s.c.i. sur H est un operateur maximal monotone (Rockafellar[23]).

(f4) Un operateur univoque A monotone et hemi-continue2 est maximal monotone.

La proposition suivante donne une caracterisation des operateurs maxi-maux monotones.

Proposition 1.1

Soit A un operateur de H. Alors les trois proprietes suivantes sont equivalentes : (i) A est maximal monotone.

(ii) A est monotone et R(I + A) = H.

(iii) _{8 > 0, l'application A = (I + A)} 1 est non-expansive de nie sur H tout entier.

Preuve. Voir Brezis[6].

Nous verrons dans le chapitre 3 d'autres exemples fondamentaux d'operateurs maximaux monotones que nous allons utiliser comme applications. Ces operateurs sont construits pour resoudre les problemes de minimisation

2 _{C'est-a-dire veri ant lim}

(25)

de fonctionnelle et bien d'autres problemes lies a l'analyse convexe. Le lecteur interesse trouvera ces exemples dans Rockafellar[24], [25] et [26].

1.3 Algorithmes asynchrones

Les algorithmes asynchrones sont utilises pour traiter de facon parallele des problemes qui prennent en consideration l'interaction de plusieurs pro-cesseurs. Ces algorithmes apparaissent comme une extension naturelle de la methode des approximations successives :

xp+1= g(xp); x0 _{2 R}n; p = 0; 1; :::

ou chaque xp _{est un vecteur a n composantes et g est une fonction de R}nvers lui-m^eme.

Dans le calcul iteratif parallele, au cours d'une iteration chaque processeur execute la tache qui lui a ete con ee (phase de calcul ou d'activite) pour ensuite communiquer ses resultats aux autres processeurs a n de les utiliser dans le calcul de l'iteration suivante (phase de communication). Selon le mode utilise pour e ectuer ses deux phases, on distingue trois classes d'algorithmes iteratifs paralleles (voir Bahi et al.[4]) :

1. Algorithmes avec iterations synchrones et communications synchrones (ISCS) :

Pour cette classe d'algorithmes, les processeurs commencent leurs iterations en même temps et les echanges de donnees sont realises a la n d'une iteration. Le principal inconvenient de ces algorithmes vient des com-munications synchrones qui penalisent fortement les performances. Comme on peut le voir sur la gure 1.1, il peut y avoir beaucoup de temps morts entre les iterations selon les performances des processeurs et la vitesse des communications. Apres parallelisation, les iterations de ces algo-rithmes sont identiques a celles realisees par les algoalgo-rithmes sequentiels. La convergence est egalement la même que dans le cas sequentiel. Par contre les communications synchrones representees par des eches sur la gure precedente peuvent être fortement penalisantes.

(26)

24 A. Benahmed

Fig. 1.1: Exemple d'algorithme ISCS.

2. Les algorithmes avec iterations synchrones et communications asyn-chrones (ISCA) :

Pour cette classes d'algorithme, les processeurs attendent d'avoir recu les donnees necessaires mises a jour a l'iteration precedente pour com-mencer la suivante. Par contre, les donnees (ou groupes de donnees) necessaires a un autre processeur sont envoyees des que possible de maniere asynchrone pour obtenir un recouvrement des communications par les calculs restants a faire dans l'iteration courante. Ce schema compte sur une bonne probabilite que les donnees soient recues sur le processeur destination avant qu'il ait ni son iteration courante. Ainsi, il n'aura pas de delai d'attente pour commencer son iteration suivante. Ce recouvrement partiel des communications par du calcul implique moins de temps morts entre les iterations et donc de meilleures perfor-mances globales. Ce systeme de communication implique aussi que les processeurs peuvent ne pas commencer leurs iterations tous en même temps. Neanmoins, la notion de synchronisme reste valable en termes d'iterations puisqu'a tout instant t, il n'est pas possible d'avoir deux processeurs e ectuant des iterations di erentes. Ils sont soient en train de calculer la même iteration, soit en train d'attendre les donnees pour la suivante. Malgre tout, ce schema n'elimine pas tous les temps morts (voir gure 1.2) puisque le recouvrement n'est pas possible pour les dernieres donnees calculees sur le processeur le plus en retard. En n, comme la precedente, cette classe d'algorithmes a aussi le même com-portement que l'equivalent synchrone en ce qui concerne les calculs e ectues et donc les mêmes proprietes de convergence.

(27)

Fig. 1.2: Exemple d'algorithme ISCA.

3. Les algorithmes avec iterations asynchrones et communications asyn-chrones (IACA) :

Dans cette troisieme et derniere classes d'algorithme, qui est la plus generale, les processeurs e ectuent leurs iterations sans tenir compte de l'avancement des autres. Il n'y a plus d'attente des donnees venant d'autres processeurs pour commencer une iteration, chaque processeur e ectue ses calculs en utilisant les dernieres valeurs connues de chaque donnee. Comme il n'y a plus d'attente dues aux communications, il n'y a plus non plus de temps morts entre les iterations, comme on peut le voir sur la gure 1.3. Contrairement aux deux classes precedentes, les iterations e ectuees ne sont plus forcement les mêmes que dans l'equivalent sequentiel puisque celles-ci vont dependre des instants ou sont recues et prises en compte les donnees. La gure 1.3 montre bien ce phenomene : il n'y a plus aucune periode d'inactivite en terme de calcul et on remarque egalement qu'a un même instant t, les deux pro-cesseurs peuvent être en train de calculer une iteration di erente. Certains problemes speci ques apparaissent alors tels que la detection de convergence et la procedure d'arrêt de l'algorithme. Il y a aussi des problemes lies a l'implantation qui implique l'utilisation d'un en-vironnement de programmation adequat. Neanmoins, ces algorithmes restent assez pratiques a mettre en oeuvre et se revelent surtout les plus performants particulierement dans un contexte de calcul sur la grille.

Notons par le nombre de processeurs utilises ( _{2 N ), et decomposons} l'espace Rn _{sous forme de produit} Q

i=1R

ni _{ou n}

(28)

26 A. Benahmed

Fig. 1.3: Exemple d'algorithme IACA

non nuls et n = P

i=1

ni. Tous les vecteurs x 2 Rn consideres seront alors

decomposes sous la forme

x = (x1; :::; x ) avec xi 2 Rni

Comme exemple, supposons qu'on travaille avec des vecteurs de R10 _a

dix composantes sur une machine comportant seulement quatre processeurs. Alors une decomposition possible de R10

est R10

= R3

R3

R2

R2_.

Et donc chaque vecteur x de R10 _{s'ecrira comme x = (x}

1; x2; x3; x4) ou

x1 2 R3; x2 2 R3; x3 2 R2 et x4 2 R2.

Munissons chaque Rni _{du produit scalaire euclidien} _{h:; :i}

i et de la norme

associee _k::ki =h:; :i1=2_i de telle facon que l'espace Rn soit muni du produit

scalaire hx; yi =X i=1 hxi; yiii ou x; y2 R n et de la norme associee kxk = hx; xi1=2 = (X i=1 kxik2i) 1=2_{; x} 2 Rn

Nous munissons aussi l'espace Rn _{de la norme uniforme de nie par}

kxk1 = max

1 i kxiki ; x2 R n

Considerons une application F de Rn

vers Rn_.

Pour chaque x_{2 R}n

, F (x) est donc un vecteur de Rn_{qui s'ecrit sous la forme}

(29)

avec Fi(x)2 Rni pour i = 1; 2; :::;

Les iterations asynchrones telles qu'elles sont proposees par Baudet[5] sont alors de nies de la facon suivante :

Soient, J = _fJ(p)g_p2N une suite de sous ensembles non vides de _{f1; :::; g} appelee strategie et S = _f(s1(p); :::; s (p))g_p2N une suite de N de nissant

les retards.

Pour un vecteur initial x0 = (x0₁; :::; x0)_{2 R}n, la suite _fxp_g_p2N est de ni par, 8 > > > > < > > > > : xp+1_i = ( Fi(x s1(p) 1 ; :::; x s (p) ) si i_{2 J(p)} xp_i si i =_{2 J(p)} i = 1; :::; p = 0; 1; :: (1.1)

(Voir Baudet[5], El Tarazi[13] et introduction).

On l'appelle algorithme asynchrone associe a F et il sera note (F; x0_{; J; S).}

(a) Cet algorithme decrit le comportement d'un processus iteratif execute de facon asynchrone sur une machine parallele comportant processeurs. A chaque iteration p + 1, le ieme _{processeur calcule x}p+1

i en utilisant (1.1).

J (p) est l'ensemble des composantes relaxees a l'iteration p.

p si(p) correspond au retard eventuel d^u au ieme processeur lors du

calcul du ieme bloc a l'iteration p. (b) Dans le cas des retards nuls :

si(p) = p; 8p 2 N; 8i 2 f1; :::; g

(1.1) decrit le comportement d'un algorithme synchrone (sans retard). Pendant chaque iteration p + 1, chaque processeur execute un nombre

(30)

28 A. Benahmed

de calculs qui depend des resultats des calculs des autres processeurs a l'iteration p. A l'interieur de chaque iteration, chaque processeur n'entre pas en interaction avec les autres processeurs, toutes les interactions au-ront lieu a la n des iterations.

Si de plus, _{8p 2 N :}

(b1) J (p) = _{f1; :::; g alors (1.1) modelise l'algorithme de Jacobi par} blocs.

(b2) J (p) = _{fp mod} + 1_{g alors (1.1) modelise l'algorithme de} Gauss-Seidel par blocs.

Pour plus de details sur les algorithmes asynchrones voir [3], [5], [18], [13] et [9]. Le lecteur trouvera dans [19] une collection d'un grand nombre de papiers traitant des iterations asynchrones (resultats theoriques et applica-tions).

(31)

Convergence de l'algorithme

general

2.1 Introduction

Ce chapitre est consacre a l'etude de la convergence des algorithmes iteratifs de relaxation asynchrones pour resoudre un probleme general de point xe. La modelisation de ces algorithmes asynchrones a ete developpee successivement par Chazan et Miranker [10] dans le cadre lineaire, Miellou [17], Baudet [5], Bertsekas et Tsitsiklis [8] dans le cadre non lineaire ; citons egalement les travaux de F. Robert ([21],[22]) dans le cas synchrone. La modelisation de ces algorithmes est e ectuee en introduisant une strategie de choix des composantes pour rendre compte du prallelisme ainsi qu'une no-tion de retards pour rendre compte de l'asynchronisme entre les processeurs (voir introduction).

2.2 Le cas asynchrone

Dans cette section, nous allons demontrer la convergence de l'algorithme parallele asynchrone (1.1) avec des retards bornes vers un point xe d'un operateur F non lineaire non-expansif de Rn

vers Rn _{relativement a la norme}

uniforme _k::k₁ _{sur R}n_.

(32)

30 A. Benahmed

Theoreme 2.1 Supposons

(h0)9 une sous-suite fpkgk2Ntelle que, J (pk) = f1; :::; g et 8i 2 f1; :::; g si(pk) =

pk

(h1)9s 2 N; tel que, 8i 2 f1; :::; g ; 8p 2 N; p s si(p) p

(h2)9u 2 Rn; F (u) = u

(h3)8x; x0 2 Rn; kF (x) F (x0)k1 kx x0k1

(h4)8x; x0 2 Rn;kF (x) F (x0)k2 hF (x) F (x0); x x0i

Alors pour tout x0

2 Rn_{, les iterations (1.1) convergent vers x point xe de}

F.

Preuve.

Nous procedons en trois etapes :

(i) Nous montrons en premier lieu que la suite_fkxp _u

k1g_p2N est

conver-gente. Pour cela, pour p _{2 N, considerons les (s+1) iteres x}p_{; x}p 1_{; :::; x}p s

du processus et posons zp = max 0 l skx p l _u k1 = max_{p s l p}kxl uk1 Alors, _{8i 2 f1; :::; g on a :} ou bien i =_{2 J(p) et donc} kxp+1i uiki = kxpi uiki kxp _u k1 max 0 l skx p l _u k1 = zp

(33)

ou bien i_{2 J(p) et donc} kxp+1i uiki = kFi(x s1(p) 1 ; :::; x s (p) ) Fi(u)ki kF (xs1(p) 1 ; :::; x s (p) ) F (u)_k₁ k(xs1(p) 1 ; :::; x s (p) ) u_k₁ (gr^ace a (h3)) = _kxsj(p) j ujkj (1 j ) kxsj(p) _u_k 1 max p s l pkx l _u k1 (car p s sj(p) p) = zp donc 8i 2 f1; :::; g ; kxp+1i uiki zp c'est-a-dire kxp+1 u_k₁ zp par consequent zp+1 ₌ _max 0 l skx p+1 l _u k1 = M ax max 0 l s 1kx p l _u k1 ; kxp+1 uk1 zp

ce qui prouve que la suite_fzp

g_p2N est decroissante (positive) donc con-vergente. Sa limite est

lim p!1z p ₌ _lim p!10 l smaxkx p l _u k1 = lim p!1kx p j(p) _u k1 (0 j(p) s) = lim p!1kx p _u k1

(34)

32 A. Benahmed

ceci prouve que la suite _fkxp _u

k1g_p2N est convergente.

(ii) Dans (i) nous avons montre en particulier que la suite _fxp

g_p2N est bornee. Prenons alors la sous-suite _fpkg_k2N de nie par (h0). Comme la

suite_fxpk_g

k2Nest bornee, elle admet une sous-suite notee aussifx pk_g

k2N

qui converge vers un x de Rn_{. Montrons alors que x est un point xe}

de F . Pour cela considerons la suite

yp = xp F (xp); p _{2 N} et montrons que lim

k!1y pk _{= 0.} kxpk _u k2 = _kypk_{+ F (x}pk₎ _u k2 = _kypk k2+_{kF (x}pk₎ _u k2+ 2_{hF (x}pk₎ _{u; y}pk i d'ou kypk k2 =_kxpk _u k2 kF (xpk₎ _u k2 2_{hF (x}pk₎ _{u; y}pk i or hF (xpk₎ _{u; y}pk_{i = hF (x}pk₎ _{F (u); x}pk _{F (x}pk₎_i

= _{hF (x}pk₎ _{F (u); [x}pk _{F (u)]} _{[F (x}pk₎ _{F (u)]}_i = _{hF (x}pk₎ _{F (u); x}pk _u_i _{kF (x}pk₎ _{F (u)}_k2 0 (gr^ace a (h4)) d'ou, kypk_k2 _kxpk _u_k2 _{kF (x}pk₎ _u_k2 = _kxpk _u_k2 _kxpk+1 _u_k2 _(gr^_{ace a (h} 0)) Or d'apres (i ) la suite _fkxp _u

k1g_p2N est convergente, donc la suite

fkxp _u

kg_p2N est aussi convergente (normes equivalentes). Par con-sequent, toute sous-suite de _fkxp _u

kg_p2N est convergente et vers la m^eme limite. D'ou,

lim p!1kx p _u k = lim k!1kx pk+1 _u_k = lim k!1kx pk _u_k = _kx u_k

(35)

d'ou on tire lim k!1ky pk k = 0 c'est-a-dire lim k!1y pk _{= 0} par consequent x F (x ) = 0 et donc x est bien un point xe de F .

(iii) On demontre comme dans (i ) que la suite_fkxp x _k₁_g_p2N est conver-gente, sa limite est

lim p!1kx p x _k₁= lim k!1kx pk _x k1 = 0

Ce qui prouve bien que xp

! x pour la norme k::k1.

Remarque 2.1

L'hypothese (h0) signi e que de temps a autre (apres quelques iterations)

les processeurs se synchronisent et mettent a jours leurs donnees en les echangeant. Cette sous-suite peut tres bien ^etre programmee par l'utilisateur.

Remarque 2.2

L'hypothese (h1) signi e que les retards dus aux communications entre

pro-cesseurs et aux di erents temps de calcul sont bornes, ce qui revient a sup-poser qu'au bout d'au plus (s + 1) iterations, tous les processeurs nissent par mettre a jour leurs donnees.

Remarque 2.3

L'hypothese (h4) est veri ee par une large classe d'operateurs, nous citons

par exemple la resolvante F = (I + T ) 1 _(ou _{> 0) associee a un operateur}

T maximal monotone (voir lemme 2.3 ci-dessous). Aussi, la projection pc d'un

espace de Hilbert reel H sur un convexe ferme non vide C, c'est-a-dire pour x_{2 H, p}c(x) est l'unique element de C satisfaisant :

kx pc(x)k = inf

(36)

34 A. Benahmed

Pour la preuve, voir Phelps[20], Examples 1.2.(f) et Deimling[11], proposi-tion 9.2. Dans le cas lineaire, nous pouvons citer par exemple les operateurs lineaires symetriques positifs et non-expansifs, comme le montre la proposi-tion suivante :

Proposition 2.2

Soit A un operateur lineaire symetrique positif et non-expansif de ni sur un espace de Hilbert reel H. Alors A veri e l'hypothese (h4).

Preuve.

(i) L'operateur B = I A est symetrique. En e et, _{8x; y 2 H}

hBx; yi = hx Ax; y_{i = hx; yi} _{hAx; yi} = _{hx; yi} _{hx; Ayi = hx; y} Ay_i = _{hx; Byi}

(ii) L'operateur B est positif. En e et,_{8x 2 H}

hBx; xi = hx Ax; x_{i = kxk}2 _{hAx; xi} 0 car _{hAx; xi} _kAxkkxk _kxk2_.

(iii) Les operateurs A et B commutent. En e et,

AB = A(I A) = A A2 = (I A)A = BA (iv) L'operateur AB est symetrique. En e et, _{8x; y 2 H}

hABx; yi = hBx; Ayi = hx; BAyi = hx; AByi

(v) L'operateur AB est positif (voir preuve dans [15], theoreme 10.7). (vi) L'operateur A veri e l'hypothese (h4). En e et,8x 2 H

(37)

2.3 Algorithme synchrone de Jacobi

Dans ce cas, nous supposons que pour tout p_{2 N} (

si(p) = p; 8i 2 f1; :::; g

J (p) = _{f1; :::; g}

qui decrit un algorithme parallele synchrone sans retards. Nous pouvons alors nous passer de l'hypothese (h3) comme le montre le theoreme suivant :

Theoreme 2.3

Sous les hypotheses (h2), (h4) et

(h0₀) _{8p 2 N; J(p) = f1; :::; g et s}i(p) = p; 8i 2 f1; :::; g

l'algorithme parallele synchrone de Jacobi de ni par 8 > > > < > > > : x0 = (x0₁; :::; x0)_{2 R}n xp+1_i = Fi(x p 1; :::; xp) i = 1; :::; p = 1; 2::: (2.1)

converge dans Rn _{vers x point xe de F .}

Preuve.

(i ) Gr^ace a (h4), l'application F est non-expansive par rapport a la norme

euclidienne. En utilisant (2.1), nous obtenons

kxp+1 u_{k = kF (x}p) F (u)_k _kxp u_k Ce qui prouve que la suite _fkxp _u

kgp2N est decroissante (positive) donc

convergente, donc la suite_fkxp _u

k1gp2N est convergente. La suite (bornee)

fxp

gp2N admet alors uns sous-suite notee fxpkgk2N qui converge vers x de

Rn_.

Les etapes (ii) et (iii) sont similaires a celles du theoreme 2.1.

2.4 Solution des operateurs maximaux

mono-tones

Les operateurs maximaux monotones ont ete etudies de maniere exten-sive pour leurs r^oles dans l'analyse convexe (minimisation de fonctionnelles,

(38)

36 A. Benahmed

problemes de minimax, ...) et dans quelques equations aux derivees partielles.

Dans cette section, nous appliquerons l'algorithme parallele asynchrone au calcul des solutions des operateurs maximaux fortement monotones et l'al-gorithme parallele synchrone de Jacobi au calcul des solutions des operateurs maximaux monotones. Ces resultats generaux concernant ces operateurs, vont ^etre appliques dans le chapitre suivant lors de la resolution de quelques problemes lies a l'analyse convexe.

Theoreme 2.4

Soit T un operateur multivoque maximal a-fortement monotone sur Rn _{(a >}

0). Alors

1. T admet une unique solution x .

2. Tout algorithme parallele asynchrone (1.1) a retards bornes associe a l'application univoque F = (I + cT ) 1 _{ou c} p 1

a converge dans R n

vers la solution x de l'operateur T . Preuve.

Elle est donnee sous forme de lemmes :

Lemme 2.1

Soit T un operateur maximal monotone sur Rn _{et F = (I + cT )} 1_{, (c > 0).}

Alors les solutions de T sont exactement les points xes de F sur Rn_.

Preuve du lemme 2.1.

0_{2 T x} ₍₎ x_{2 (I + cT )x} () x = (I + cT ) 1_x

() x = F x

Lemme 2.2

Soit T un operateur maximal a-fortement monotone sur Rn (a > 0) et F = (I + cT ) 1 (c > 0). Alors

(39)

(b) Pour c p_a 1, l'application F est non-expansive par rapport a la norme k::k1 sur Rn.

(a) Considerons T0 = T aI, = _1+ac1 et F0 = (I + cT0) 1. Pour x; y _{2 R}n, nous avons y = F (x) ₍₎ x_{2 y + cT y} () x_{2 (1 + ac)y + c(T} aI)y () x_{2 (1 + ac)y + cT}0_y () x_{2 (I + cT}0_)y () y = F0_{( x)} c'est-a-dire , _{8x 2 R}n, F (x) = F0( x).

Comme T est a-fortement monotone (maximal), l'operateur T0 est maxi-mal monotone et donc l'application F0 = (I + cT0) 1 est non-expansive par rapport a la norme euclidienne _{k::k sur R}n (proposition 1.1) . D'ou 8x; x0 2 Rn

kF (x) F (x0)_{k = kF}0( x) F0( x0)_k _kx x0_k

Comme = _1+ac1 _{< 1, l'application F est une contraction sur R}net donc admet un point xe unique x (theoreme du point xe de Banach) qui sera la solution de l'operateur T d'apres le lemme 2.1.

(b) La norme euclidienne et la norme uniforme sur Rn_{sont equivalentes}

suiv-ant la relation : kxk1 kxk p kxk1 ; 8x 2 Rn Alors, _{8x; x}0 _{2 R}n kF (x) F (x0)_k _kx x0_k entra^ne kF (x) F (x0₎_k 1 p kx x0k1 = _1+acp _kx x0_k 1

(40)

38 A. Benahmed

Il su t donc de choisir c tel que p 1 + ac 1 c'est-a-dire c p 1 a (2.2) Lemme 2.3

Soit T un operateur maximal monotone et F = (I + cT ) 1 _{(c > 0). Alors F}

veri e l'hypothese (h4).

Prenons x; x0 _{dans R}n et montrons que

kF (x) F (x0)_k2 _{hF (x)} F (x0); x x0_i Soient y = F (x) et y0 _{= F (x}0_{) donc,} ( x_{2 y + cT y} x0 _{2 y}0_{+ cT y}0 c'est-a-dire ₍ x y_{2 cT y} x0 _y0 _{2 cT y}0

Comme c > 0, l'operateur cT est monotone, et donc

h(x y) (x0 y0); y y0_i 0 d'ou

hx x0; y y0_i _ky y0_k2 0 c'est-a-dire

kF (x) F (x0)_k2 _{hF (x)} F (x0); x x0_i et le theoreme est entierement demontre.

(41)

Remarque 2.4

Pour x_{2 R}n_{, l'image F (x) = (I + cT )} 1_{x doit ^}_{etre vue comme etant l'unique}

element y de Rn _{veri ant x}

2 y + cT y, c'est-a-dire veri ant c 1_(x _y)

2 T y.

Remarque 2.5

La condition de monotonie forte sur l'operateur T a assure l'existence d'un point xe de F et la non-expansivite de l'application F = (I + cT ) 1 (c > 0) par rapport a la norme_k::k₁. Dans le cas de l'algorithme parallele de Jacobi, on peut se passer de cette hypothese et ajouter l'hypothese (h2) d'existence

de solutions. Nous pouvons alors enoncer :

Theoreme 2.5

Soit T un operateur multivoque maximal monotone sur Rn _{tel que T} 1₀

6= . Alors tout algorithme parallele synchrone de Jacobi (2.1) associe a l'applica-tion univoque F = (I + cT ) 1

ou c > 0 quelconque, converge dans Rn _vers

(42)

Chapitre 3

Applications

Dans ce chapitre, nous appliquerons les resultats du chapitre precedent, notamment les theoremes 2.4 et 2.5 a quelques problemes lies a l'analyse convexe.

3.1 Minimum d'une fonctionnelle

Commencons par cette proposition qui fournit une caracterisation des fonctions fortement convexes.

Proposition 3.1 Soit f : Rn

! R[f+1g convexe propre et s.c.i. Alors les conditions suivantes sont equivalentes :

(a) f est a-fortement convexe.

(b) @f est a-fortement monotone (a > 0). (c) pour y _{2 @f(x) on a pour tout x}0 _{2 R}n _:

f (x0) f (x) +_{hy; x}0 x_{i +} 1 2akx

0 _x_k2

Preuve.

Voir Rockafellar[26], proposition 6. Nous pouvons alors enoncer :

(43)

Corollaire 3.2 Soit f : Rn

! R [ f+1g a-fortement convexe propre et s.c.i.1 _Alors

1. f admet un minimum unique x .

2. Tout algorithme parallele asynchrone (1.1) a retards bornes associe a l'application F = (I + c@f ) 1 _{ou c} p 1

a converge vers x le point de

minimum de f sur Rn_. Preuve. En remarquant que 0_{2 @f(x}0) () f (x) f (x0) 8x 2 Rn () f (x0) = min x2Rnf (x)

nous deduisons que les solutions de l'operateur @f sont exactement les points de minimum globaux de f .

Le sous-di erentiel @f est maximal (voir exemple (f3) page 22) a-fortement monotone (proposition 3.1). On applique alors le theoreme 2.4 a l'operateur @f pour conclure.

Remarque 3.1

Dans le cas ou f est convexe (non necessairement fortement convexe) propre et s.c.i., le sous-di erentiel @f est maximal monotone. On peut alors appliquer le theoreme 2.5 a l'application F = (I + c@f ) 1 _{(c > 0 quelconque), nous}

obtenons alors,

Corollaire 3.3 Soit f : Rn

! R [ f+1g convexe propre et s.c.i. telle que le probleme de minimisation min

Rn f (x) admette une solution. Alors tout algorithme parallele synchrone de Jacobi (2.1) associe a l'application F = (I + c@f ) 1 (ou c > 0 quleconque) converge vers x point de minimum de f sur Rn.

(44)

42 A. Benahmed

3.2 Point selle

Dans ce paragraphe, nous allons appliquer le theoreme 2.4 au calcul de point selle d'une fonction selle L : Rn

Rm

! [ 1; +1]: Nous rappelons qu'un point selle de L est un point (x ; y ) de Rn

Rm _{caracterise par :}

L(x ; y) L(x ; y ) L(x; y ); _{8(x; y) 2 R}n _Rm c'est-a-dire :

L(x ; y ) = min

x2RnL(x; y ) = max_y2RmL(x ; y)

Nous associons a la fonctionnelle L l'operateur multivoque TLde ni sur Rn

Rm par, (z; t)_{2 T}L(x; y) () ( L(x; y0_{) +}_{ht; y}0 _y_i _{L(x; y)} _L(x0_{; y)} _{hz; x}0 _x_i 8(x0_{; y}0₎_{2 R}n Rm (3.1) Autrement dit TL(x; y) =f(z; t) 2 Rn Rm : (z; t)2 @L(x; y)g Et donc (0; 0)_{2 T}L(x; y) () ( L(x; y0₎ _{L(x; y)} _L(x0_{; y)} 8(x0_{; y}0₎_{2 R}n Rm

() (x; y) est un point selle de L

(3.2)

Ce qui signi e que les points selle globaux de L (par rapport a la min-imisation en x et la maxmin-imisation en y) sont les elements (x ; y ) solutions du probleme (0; 0)_{2 T}L(x ; y ). Autrement ecrit :

(0; 0) _{2 T}L(x ; y ) () (x ; y ) = arg min

x2Rn_y2RmaxmL(x; y)

Le resultat suivant du a Rockafellar[24] fournit des conditions su santes pour la maximal monotonie de l'operateur TL.

(45)

Proposition 3.4

Soit L une fonction selle propre et fermee2

sur Rn

Rm_{. Alors T}

L est un

operateur maximal monotone.

Lemme 3.1

Si la fonction L est a-fortement convexe-concave3, alors TL est un operateur

a-fortement monotone. Preuve.

De nissons le produit scalaire et la norme sur Rn

Rm _{comme suit : Soit}

(x; y); (x0_{; y}0₎_{2 R}n Rm _: ( h(x; y); (x0_{; y}0₎_i Rn _Rm =hx; x0i_Rn +hy; y0i_Rm k(x; y)kRn _Rm = p kxk2 Rn +kyk2_Rm ce que nous ecrivons simplement comme

(

h(x; y); (x0; y0)_{i = hx; x}0_{i + hy; y}0_i k(x; y)k =pkxk2₊_kyk2

pour ne pas alourdir le texte.

Prenons alors (x; y) et (x0; y0_{) dans R}n _Rm, (z; t)_{2 T}L(x; y) et (z0; t0)2

TL(x0; y0) et montrons que

h(x; y) (x0; y0); (z; t) (z0; t0)_i a_{k(x; y)} (x0; y0)_k2:

Nous avons (z; t) _{2 @L(x; y) et (z}0; t0) _{2 @L(x}0; y0). La fonction L(x; y) est a-fortement convexe par rapport a x, donc en utilisant la proposition 3.1, on conclut que l'operateur @1L (voir la de nition (c7) a la page 18)

est a-fortement monotone par rapport a x, et comme z _{2 @}1L(x; y) et z0 2

@1L(x0; y0), on a :

hz z0; x x0_i a_kx x0_k2

de m^eme, t _{2 @}2L(x; y) et t0 2 @2L(x0; y0), donc t 2 @2( L(x; y)) et

t0 _{2 @}

2( L(x0; y0)) et comme @2( L) est a-fortement monotone par rapport

2 _{Voir les de nitions a la page 18.} 3 _{Voir de nition (c3) a la page 17.}

(46)

44 A. Benahmed

a y (utiliser la proposition 3.1 avec f (y) = L(x; y)), on a :

ht t0; y y0_i a_ky y0_k2 d'ou

hz z0; x x0_{i + ht} t0; y y0_i a(_kx x0_k2+_ky y0_k2) c'est-a-dire

h(z; t) (z0; t0); (x; y) (x0; y0)_i a_{k(x; y)} (x0; y0)_k2 ce qui prouve que TL est a-fortement monotone sur Rn Rm.

Si L est une fonction a-fortement convexe-concave propre et fermee, alors l'operateur TL est maximal (proposition 3.4) a-fortement monotone (lemme

3.1). En appliquant (3.2) et le theoreme 2.4 a l'operateur TL, nous pouvons

alors enoncer :

Corollaire 3.5

Soit L une fonction a-fortement convexe-concave propre et fermee de Rn

Rm

vers [ _{1; +1]. Alors}

1. L admet un point selle unique (x ; y ).

2. Tout algorithme parallele asynchrone (1.1) a retards bornes associe a l'application univoque F = (I + cTL) 1 de Rn Rm vers Rn Rm ou

c p_a 1 converge vers le point selle (x ; y ) de L.

En se basant sur la remarque 2.5, nous pouvons enoncer le resultat suiv-ant concernsuiv-ant l'algorithme parallele de Jacobi par application du theoreme 2.5.

Corollaire 3.6

Soit L une fonction selle fermee et propre de Rn Rm vers [ _{1; +1]} admet-tant un point selle. Alors tout algorithme parallele synchrone de Jacobi (2.1) associe a l'application univoque F = (I + cTL) 1 de Rn Rm vers Rn Rm

(47)

3.3 Programme convexe

Considerons le programme convexe :

(P ) 8 > < > : M in f0(x) x_{2 C} fi(x) 0; (1 i m) (3.3)

ou C un convexe ferme non vide de Rn _{et f}

i : C ! R sont des fonctions

( nies) convexes s.c.i. pour 0 i m.

Le probleme (P ) est dit a contraintes quali ees si,

(CQ) _9x0 2 C tel que fi(x0) < 0; 8i 2 f1; :::; mg :

Le Lagrangien associe au probleme (P ) dans sa forme etendue est la fonc-tionnelle L de nie sur Rn

Rm _par, L(x; y) = 8 > > < > > : f0(x) + m P i=1 yifi(x) si x2 C et y 2 Rm+ 1 si x_{2 C et y =}_{2 R}m + +₁ si x =_{2 C} Voir Rockafellar[27].

Le probleme dual associe a (P ) est,

(D) ( M ax g0(y) y_{2 R}m + (3.4)

ou g0 : Rm ! R [ f 1g est la fonction concave de nie par,

g0(y) = inf

x2CL(x; y)

Si (x ; y ) est un point selle du lagrangien L sur Rn

Rm_{, alors x est}

une solution optimale du probleme primal (P ) et y est une solution op-timale du probleme dual (D). Inversement, si le probleme (P) admet une solution x et si les contraintes sont quali ees (condition (CQ )) alors il ex-iste y _{2 R}m

(48)

46 A. Benahmed

et Rockafellar[23] Cor. 28.3.1).

Supposons que le programme (P ) admette une solution. Comme les fonc-tions fi, (0 i m) sont convexes et s.c.i., la fonctionnelle L est une

fonction selle propre et fermee. Nous pouvons alors appliquer le corollaire 3.6 a la fonctionnelle L. Nous obtenons,

Corollaire 3.7

Supposons que le programme convexe (P ) de ni par (3.3) soit a contraintes quali ees et admette une solution. Alors tout algorithme parallele synchrone de Jacobi (2.1) associe a l'application univoque F = (I + cTL) 1 (ou c > 0

quelconque) de Rn

Rm

vers Rn

Rm _{converge vers (x ; y ) point selle de}

L, et donc x est une solution du primal (P ) et y solution du dual (D).

3.4 Inegalite variationnelle

Soit C un convexe ferme non vide de Rn, et A un operateur multivoque maximal monotone sur Rn tel que D(A) = C.

Le probleme de l'inegalite variationnelle dans sa forme generale consiste a trouver un element x de C satisfaisant

9 y 2 Ax ; hy ; x x _i 0; _{8x 2 C:} (3.5) Pour x_{2 R}n_{, notons par N}

c(x) le c^one normal de C en x de ni par

Nc(x) =fy 2 Rn:hy; x zi 0; 8z 2 Cg :

L'operateur multivoque T de ni sur Rn _par,

T x = (

Ax + Nc(x) si x2 C

si x =_{2 C} (3.6) est un operateur maximal monotone (Rockafellar[25]).

Lemme 3.2

Les solutions de l'operateur T sont exactement les solutions du probleme de l'inegalite variationnelle (3.5).

(49)

Preuve. 0_{2 T x} ₍₎ 0_{2 Ax + N}c(x ) () 9y 2 Ax : 0 2 y + Nc(x ) () 9y 2 Ax : y 2 Nc(x ) () 9y 2 Ax : h y ; x z_i 0 _{8z 2 C} () 9y 2 Ax : hy ; z x _i 0 _{8z 2 C} () x est solution de (3:5) Lemme 3.3

Si A est a-fortement monotone alors T est un operateur a-fortement mono-tone. Preuve. Soient x; x0 _{2 D(T ) = C, y 2 T x et y}0 _{2 T x}0 donc ₍ y = y1+ y2; y1 2 Ax; y2 2 Nc(x) y0 _{= y}0 1+ y02; y10 2 Ax0; y02 2 Nc(x0) or ₍ y2 2 Nc(x)) hy2; x zi 0; 8z 2 C y0 2 2 Nc(x0)) hy20; x0 zi 0; 8z 2 C d'ou hy y0; x x0_{i = hy}1 y01; x x0i + hy2 y02; x x0i = _hy1 y01; x x0i | {z } akx x0_k2 +_hy2; x x0i | {z } 0 +_hy₂0; x0 x_i | {z } 0 a_kx x0_k2

En utilisant les lemmes 3.2, 3.3 et le theoreme 2.4 nous pouvons alors enoncer :

Corollaire 3.8

Soit C un convexe ferme non vide de Rn _{et A un operateur multivoque}

(50)

48 A. Benahmed

1. Le probleme de l'inegalite variationnelle (3.5) admet une solution unique x .

2. Tout algorithme parallele asynchrone (1.1) a retards bornes associe a l'application F = (I + cT ) 1 ou T est de ni par (3.6) et c p_a 1 converge vers la solution x du probleme (3.5).

Nous pouvons aussi enoncer son equivalent synchrone pour A maximal monotone (non necessairement fortement monotone) et c > 0 quelconque obtenu en utilisant le theoreme 2.5.

Corollaire 3.9

Soit C un convexe ferme non vide de Rn et A un operateur multivoque max-imal monotone de ni sur C tel que le probleme (3.5) admette une solution. Alors tout algorithme parallele synchrone de Jacobi (2.1) associe a l'applica-tion F = (I + cT ) 1 ou T est de ni par (3.6) et c > 0 quelconque converge vers x solution du probleme (3.5).

(51)

Dans ce travail, nous avons considere des algorithmes paralleles asyn-chrones associes a des operateurs F non lineaires non-expansifs de nis sur Rn. Nous avons donne le resultat de convergence concernant ces algorithmes vers un point xe de F relativement a la norme uniforme sur Rn, resultat qui etend celui de Bahi[3] au cas non lineaire. Nous avons montre comment ces algorithmes sont bien adaptes au calcul des solutions d'un operateur maxi-mal fortement monotone de ni sur Rn et d'un operateur maximal monotone dans le cas de l'algorithme parallele de Jacobi. Ensuite, nous avons applique ces resultats pour les calculs du minimum d'une fonctionnelle, du point selle d'une fonction selle, de la solution des programmes convexes et en n de la solution du probleme de l'inegalite variationnelle.

(52)

References

[1] A. Addou, A. Benahmed, Parallel synchronous algorithm for nonlin-ear xed point problems, Proyecciones, vol. 23, no. 3, pp. 241-252 (2004). [2] A. Addou, A. Benahmed, Parallel asynchronous iterations for

non-linear xed point problems, (to appear).

[3] J. Bahi, Asynchronous iterative algorithms for nonexpansive linear sys-tems, Parallel And Distributed Computing, vol. 60, no. 1, pp. 92-112 (2000).

[4] J. Bahi, S. Contrassot-Vivier, R. Couturier, Coupling dynamic load balancing with asynchronism in iterative algorithms on the compu-tational grid, In 17th IEEE and ACM int. conf. on International Parallel and Distributed Processing Symposium, IPDPS03, pages 40a, 9 pages (2003).

[5] G. M. Baudet, Asynchronous iterative methods for multiprocessors, J. ACM, 25, pp. 226-244 (1978).

[6] H. Brezis, Operateurs maximaux monotones et semi-groupes de con-tractions dans les espaces de Hilbert, North Holland (1973).

[7] D. P. Bertsekas, Distributed asynchronous computation of xed points, Math. Prog., vol. 27, pp. 107-120 (1983).

[8] D. P. Bertsekas, J. Tsitsiklis, Parallel and Distributed Computa-tion : Numerical Methods, Prentice-Hall (1989).

[9] D. P. Bertsekas, J. Tsitsiklis, Some aspects of parallel and dis-tributed iterative algorihms-A survey, Automatica, vol. 27, no.1, pp. 3-21 (1991).

[10] D. Chazan, W. L. Miranker, Chaotic relaxation, Lin. Alg. Appl. 2, pp. 199-222 (1969).

(53)

[11] K. Deimling, Nonlinear Functional Analysis, Springer-Verlag Berlin (1985).

[12] M.N. El Tarazi, Contraction et ordre partiel pour l'etude d'algo-rithmes synchrones et asynchrones en analyse numerique, Thesis. Univ. Franche-comt. (1981).

[13] M.N. El Tarazi, Somme convergence results for asynchronous algo-rithms, Numer. Math. 39, pp. 325-340 (1982).

[14] P. Faure, Analyse numerique. Notes d'optimisation, (1988). [15] D. H. Griffel, Applied Functional Analysis, Wiley (1981).

[16] J. C. Miellou, Iterations chaotique a retard, C.R.A.S. Paris, 278 pp. 957-960 (1974).

[17] J. C. Miellou, Algorithmes de relaxation chaotiques a retard, RAIRO (R1), pp. 55-82 (1975).

[18] J. C. Miellou, Iterations chaotique a retard, etude de la convergence dans le cas d'espaces partiellement ordonnes, C.R.A.S. Paris, serie A, 280 pp. 233-236 (1975).

[19] J. C. Miellou, P. Cortey-Dumont, M. Boulbrach^ene, Pertur-bation of xed-point iterative methods, Advances in Parallel Computing, Vol. 1, pp. 81-122 (1990).

[20] R. R. Phelps, Lectures on maximal monotone operators, arXiv :math.FA/9302209 v1 (4 Feb 1993).

[21] F. Robert, M. Charnay, F. Musy, Iterations chaotiques serie-parallele pour des equations non-lineaires de point xe, Apl. Mat., 20, pp. 1-38 (1975).

[22] F. Robert, Convergence locale d'iteration chaotique non-lineaire, C.R.A.S. serie A, 284 pp. 679-682 (1977).

[23] R.T. Rockafellar, Convex Analysis, Princeton University Press. (1970).

[24] R. T. Rockafellar, Monotone operators associated with saddle-functions and minimax problems, Proc. Symp. Pure Math. 18, 241-250 (1970).

(54)

52 A. Benahmed

[25] R.T. Rockafellar, On the maximality of sums of nonlinear mono-tone operators, Trans. Amer. Math. Soc., 149, pp. 75-88 (1970).

[26] R.T. Rockafellar, Monotone operators and the proximal point algo-rithm, SIAM J. Control And Optimization, Vol. 14, No. 5, pp. 877-898 (1976).

[27] R.T. Rockafellar, Augmented Lagrangians and Applications of the Proximal Point Algorithm in Convex Programming, Math. Oper. Res., 1, pp. 97-116 (1976).