M´ethode primale-duale des points-int´erieurs

type points-intérieurs avec une approche primale-duale. Ces méthodes sont efficaces pour des problèmes de petite taille mais leur complexité algorithmique les rend inutilisables en grandes di- mensions. Le but est de discuter l’approche qui consiste à modifier cette méthode de sorte à réduire sa complexité arithmétique et adapter sa structure algorithmique pour pouvoir l’implémenter ef- ficacement sur des processeurs de cartes graphiques (GPUs), sans altérer les propriétés de convergence.

3.1 M´ethode primale-duale des points-int´erieurs

Il existe principalement trois grandes familles de méthodes d’optimisation sous contraintes [Nocedal 99] : les méthodes de pénalité extérieure, les méthodes de contraintes actives et les méthodes de points-intérieurs. On s’intéressera particulièrement à cette dernière famille de méthodes. Les méthodes de points-intérieurs (qualifiés aussi de méthodes de pénalité intérieure) ont la spécificité de garantir le respect des contraintes d’inégalité strictement (d’o ù le qualificatif intérieurs).

Le principe d’optimisation par points intérieurs est apparu dans les années cinquante, grâce à la définition de la fonction barrière logarithmique, en 1955, par Frisch [Frisch 55]. C’est dans le livre de Fiacco et McCormick [Fiacco 68] que le terme de points intérieurs a été introduit. Les travaux de Karmakar [Karmarkar 84] en 1984 f ûrent à l’origine de la proposition d’un algorithme à convergence polynomiale, ce qui a ouvert la voie au développement de plusieurs techniques telles que le suivi de chemin central, la barrière logarithmique et la méthode primale-duale [Nocedal 99].

Dans ce qui suit, la résolution du problème d’optimisation sous contraintes se fera par un algorithme itératif de type points-intérieurs avec une approche primale-duale [Mehrotra 92,Armand 00]. D’une façon générale, pour la construction des algorithmes de points-intérieurs, il y a deux points de vue complémentaires qui conduisent au même résultat : la pénalisation logarithmique et la pertur- bation des conditions d’optimalité. L’approche primale-duale consiste à estimer conjointement les variables primales (variables d’intérêt) et duales (multiplicateurs de Lagrange) par la résolution d’une séquence de problèmes correspondants à des versions perturbées des conditions d’optima- lité, dites de Karush-Kuhn-Tucker (KKT), pondérées par une suite de paramètres positifs {µk}

convergeant vers 0. De plus, à chaque itération, la satisfaction stricte des contraintes est assurée par la minimisation d’une fonction de mérite présentant une barrière logarithmique à la frontière du domaine admissible des solutions [Wright 91].

3.1.1 Prise en compte de la contrainte d’´egalit´e

Tout d’abord, à l’aide d’un changement de variable, le problème (3.1) peut être transformé en un nouveau problème faisant apparaˆıtre des contraintes d’inégalité uniquement. Comme sou- ligné dans [Armand 00], pour tout vecteur initial x(1) tel que C0x(1) = c0, le vecteur défini par

3.1. M ´ETHODE PRIMALE-DUALE DES POINTS-INT ´ERIEURS 45

a = x(1) _{+ Za, avec a} _{∈ R}N−1_{, satisfait également cette contrainte égalité si Z} _{∈ R}N×(N −1)

est une matrice dont les colonnes forment l’espace nul de C0. La possibilit´e de calcul de l’espace

nul de la matrice des contraintes d’égalité est une condition nécessaire pour l’emploi d’une telle approche.

Par conséquent, le problème (3.1) est réécrit sous la forme d’un problème d’optimisation sous des contraintes d’inégalités uniquement,

min

a∈R(N −1)Φ a

s. c. T a+ t > 0. (3.2)

o ù le critère Φ(·) se déduit de F (·) par Φ(a) = F (x(1)_{+ Za), T = C}

1Zet t = C1x(1)+ c1.

Les conditions de KKT permettant de caractériser l’optimalité de la solution a∗ de (3.2) et les multiplicateurs de Lagrange associés λ∗sont : (1)∇Φ(a∗₎_{− T}t_λ∗ _{= 0, (2) Diag(λ)(T a}∗_{+ t) = 0,}

(3) T a∗+ t > 0 et (4) λ∗ >_0.

La perturbation de ces conditions permet de caract´eriser une solution interm´ediaire (ak, λk),

solution du syst`eme d’´equations            ∇Φ(a) − Tt_λ_{= 0,} Λ (T a + t) = µ_k, T a+ t > 0, λ >0. (3.3)

o `u Λ = Diag(λ) et µk = µk1(N −1)×1. Ainsi, chaque it´eration k de l’algorithme primal-dual (PDIP)

pour la résolution du problème (3.2) se décompose en deux étapes. Tout d’abord, un couple (ak+1, λk+1) est calculé en fonction de (ak, λk) en résolvant (3.3). Ensuite, le paramètre de per-

turbation µk+1est réduit selon une règle de mise à jour permettant de garantir la convergence de

l’algorithme.

3.1.2 Résolution du problème perturbé

Dans le cadre des problèmes de grande taille, il n’est pas possible de résoudre (3.3) de façon exacte. En pratique, une solution approchée de (3.3) est obtenue par quelques itérations de Newton couplées avec une recherche de pas [Boyd 04, Chap.11], selon le schéma général

(ak+1, λk+1) = (ak+ αkdka, λk+ αkdλk). (3.4)

avec des directions primale da

ket duale dλk qui correspondent `a un pas de Newton appliqu´e aux

46 3.1. M ÉTHODE PRIMALE-DUALE DES POINTS-INT ÉRIEURS système linéaire ∇2_Φ(a k) −Tt ΛkT Diag(T ak+ t) ! da_k dλ_k ! =_−rµk(ak, λk), (3.5)

o `u rµ(a, λ) est le r´esidu primal-dual,

rµ(a, λ) = ∇Φ(a) − T t_λ Λ(T a + t)_{− µ} ! = r prim µ (a, λ) rdual_µ (a, λ) ! . (3.6)

3.1.2.1 Calcul des directions primale et duale

Le système (3.5) n’est pas inversé de façon directe. En effet, il est souligné dans [Wright 94, Wright 98] que ce système devient très mal conditionné, notamment à l’approche de la convergence de l’algorithme, dès lors qu’une des contraintes est active. De plus, celui-ci ne vérifie pas les propriétés de symétrie et de définie positivité, souhaitables dès lors que l’on applique une stratégie d’inversion itérative. Plusieurs stratégies de résolution de (3.5), présentées dans [Forsgren 02, Sec.5.1], permettent de pallier ces difficultés. Nous utilisons la technique de [Conn 96,Armand 00, Segalat 02], consistant à effectuer le calcul des directions en deux étapes : la direction primale da k

est d’abord obtenue par inversion du syst`eme r´eduit

Hkdak =−gk (3.7) avec _   gk =∇Φ(ak) + TtDiag(T ak+ t)−1µk, Hk =∇2Φ(ak) + TtDiag(T ak+ t)−1ΛkT. (3.8)

Rappelons que ce système réduit s’obtient par substitution de dλkdans la première équation de (3.5)

par son expression d´eduite de la seconde partie de ce syst`eme,

dλ_k = Diag(T ak+ t)−1[µk− ΛkT(ak+ dak)− Λkt] . (3.9)

Finalement, après obtention de la direction primale, l’expression (3.9) est utilisée pour déterminer la direction duale dλ

3.1.2.2 Recherche de pas

Le pas αkest déterminé de façon à garantir la convergence de l’algorithme et à vérifier les deux

contraintes d’inégalité de (3.3). La convergence de l’algorithme est garantie sous réserve que le pas entraˆıne une décroissance suffisante d’une fonction de mérite primale-duale Ψµ(a, λ) liée aux

3.1. M ´ETHODE PRIMALE-DUALE DES POINTS-INT ´ERIEURS 47

primale-duale [Anstreicher 94,Forsgren 98,Armand 00] d´efinir par

Ψµ(a, λ) = Φ(a)− µ N X i=1 ln([T a + t]i) + λt(T a + t)− µ N X i=1 ln(λi[T a + t]i). (3.10)

On peut constater la présence des deux fonctions barrières logarithmiques pour satisfaire strictement les contraintes d’inégalités de (3.3). Une technique de rebroussement associée à la règle d’Armijo est utilisée pour la recherche de pas. Ainsi, une décroissance suffisante de la fonction de mérite se traduit par exemple par la vérification de la condition d’Armijo

ψµk(αk)− ψµk(0) 6 c αk∇ψµk(0), c∈ (0, 1), (3.11)

o `u ψµk(α) = Ψµk(ak+αd

k, λk+αdλk). Nous avons montr´e dans [Chouzenoux 11b] qu’une strat´egie

de recherche de pas plus sophistiquée, telle que par exemple l’approche MMLQ 1D, ne semble pas nécessaire dans le cadre des méthodes primales-duales des points-intérieurs.

3.1.3 Contr ˆole de convergence de l’algorithme primal-dual

L’arrêt de la boucle interne, liée au calcul des directions primale et duale, est régi par deux conditions [Conn 96,Johnson 00]

krµprimk (ak, λk)k∞6ǫ

prim

k et krµdualk (ak, λk)k1/N 6 ǫ

dual

k , (3.12)

avec ǫprim_k = ηprimµk, ǫ_kdual= ηdualµko `u ηprimet ηdualsont deux param`etres positifs.

Le paramètre de perturbation µkest mis à jour selon la règle de µ-criticité définie dans [El-Bakry 96]

µk= θ N(T ak+ t) t_λ k, (3.13) o `u θ∈ (0, 1).

Enfin, les itérations de l’algorithme PDIP sont contr ôlées par un test d’arrêt global [Boyd 04, Chap.11] portant sur la valeur minimale de la perturbation ou sur la norme du résidu primal-dual

µk6µmin, et kr0(ak, λk)k 6 ǫ0. (3.14)

Les propriétés de convergence de cette méthode primale-duale des points intérieurs dans le cas de critères fortement convexes sont données dans le théorème (4).

Théorème 4([Armand 00]). Supposons que la fonction Φ(a) soit fortement convexe et différentiable sur RN−1. Si les séquences{µk},

ǫprim_k oetǫdual_k tendent vers 0 lorsque k tend vers l’infini, alors la suite {(ak, λk)} générée par l’algorithme PDIP est bornée et chacun de ses points d’adhérence est une solution

48 3.2. ACC ÉL ÉRATION ALGORITHMIQUE POUR DES PROBL ÈMES DE GRANDE TAILLE

Dans le document Contributions à la résolution de problèmes inverses de grande taille en traitement du signal et de l'image (Page 55-59)