Mise en œuvre de la m´ethode de programmation quadratique successive . 124

qua-dratique successive

Dans cette section, nous allons appliquer la méthode SQP à la résolution du problème de tomographie (P_EI) (les résultats généraux concernant cette méthode sont décrits à la

non-Section 6.2 125

Fig. 6.1 Pourcentage du temps CPU pass´e dans le probl`eme direct/solveur sans contrainte

linéaire en la résolution d’une suite de Problèmes Quadratiques Tangents (PQT). Lorsque l’on souhaite utiliser une méthode SQP, les 2 premières questions à se poser sont : com-ment définir les problèmes quadratiques successifs ? Peut-on les résoudre (en un temps raisonnable) ? Dans les trois sous-sections suivantes nous donnerons des réponses à ces questions. Dans la dernière sous-section nous développerons notre algorithme SQP local et présenterons ses spécificités.

6.2.1 Approximation gauss-newtonienne du Probl`eme Quadratique

Tangent

Dans la section 4.2.3 sur les rappels de la méthode SQP, nous avons vu que l’ex-pression du PQT fait intervenir le hessien du lagrangien du problème original (voir équation (4.10)). Du fait que notre problème (P_EI) ne fait intervenir que des contraintes

lin´eaires le hessien de ces derni`eres n’intervient pas dans le PQT :

∇2

mmL_(P_EI₎ = ∇²_mmf.

Comme l’approximation gauss-newtonienne H_k calcul´ee dans la partie I est une bonne approximation de ∇²_mmf , elle est aussi une bonne approximation du hessien du

lagran-gien du problème (P_EI). Ainsi, pour des raisons identiques à celles développées à la

section2.5.3on prendra l’approximation GN de ∇²_mmf : ∇2

mmf (m_k) ≈ H_k := J_k^>J_k+ σ²R,

Les contraintes (5.1) doivent aussi être exprimées en fonction de la perturbation du modèle δm en m_k. Pour les contraintes d’égalité on a

cE(mk+ δm) = CE.(mk+ δm),

qui peut se r´ecrire comme

C_E.δm = e_k, (6.1)

o`u e_k = e − C_E.m_k. On obtient, par un calcul similaire,

l_k≤ C_I.δm ≤ u_k, (6.2)

pour les contraintes d’in´egalit´e, avec

(

l_k= l − C_Im_k,

u_k = u − C_Im_k. ^(6.3)

Le Problème Quadratique Tangent (PQT) à l’itération k de Gauss-Newton se formule donc comme la minimisation de l’approximation quadratique F_k de δm 7→ f (m_k+ δm)

soumise aux contraintes lin´eaires (6.1) et (6.2) :

(P QT )_k        min δm∈Rn F_k(δm) = ¹₂δm^>H_kδm + g^>_kδm C_E.δm = e_k l_k ≤ C_I.δm ≤ u_k, (6.4) où g_k = J_k^>(T_k− Tobs) + σ²Rm_k. Définition 6.2.1 On note δM_C(m_k) := {δm ∈ M : C_E.δm = e_k, l_k ≤ C_I.δm ≤ u_k} l’ensemble des perturbations de modèle δm respectant les contraintes d’égalité et

d’inégalité du problème (6.4).

On vérifie aisément que δm ∈ δM_C(m_k) si et seulement si m_k+ δm ∈ M_C. Dès lors on a la relation

δM_C(m_k) = M_C − m_k. (6.5)

En particulier, on a δMC(mk) 6= 0 si et seuleument si MC 6= 0.

Le (P QT )k est un problème convexe (voir définition 4.1.5) car Hk est semi-définie positive. Il sera donc possible d’appliquer une méthode de lagrangien augmenté pour le résoudre (voir chapitre7).

Section 6.2 127

6.2.2 Existence et unicit´e de la solution du Probl`eme Quadratique

Tangent

Sans les contraintes linéaires, le PQT (6.4) est équivalent au problème régularisé linéarisé (Plin) (cf. (2.16)) de la tomographie de réflexion. Nous avons vu à la sec-tion 2.5.3, l’existence et l’unicité du problème linéarisé (P_lin). La question ici est de

savoir si ce résultat est toujours valable lorsque l’on ajoute des contraintes linéaires. On a le résultat d’existence et d’unicité suivant.

Proposition 6.2.2 On suppose que les contraintes de (PEI) sont compatibles (M_C 6= ∅),

alors (P QT )_ka une solution. Si, en plus, H_kest d´efinie positive alors il existe une et une

seule solution au probl`eme (P QT )_k.

D ´EMONSTRATION. On utilise les 2 arguments suivants.

1) Le probl`eme (P QT )kest r´ealisable car δMC(m_k) 6= ∅ (car M_C 6= ∅).

2) F_k est born´e car

F_k(δm) = ¹ 2||J_kδm + T (m_k) − T^obs||2 2+ ^σ 2 2 ^(m^k^{+ δm)} >R(m_k+ δm) ≥ 0.

On sait que F_kest une fonction quadratique convexe (H_kest semi-définie positive). Ainsi, par le théorème 17.1 de [18] il existe une solution au problème (P QT )k. Si on suppose, en plus, que H_k est définie positive alors cette solution est unique car, dans ce

cas, F_kest strictement convexe. ut

6.2.3 Conditions nécessaires et suffisantes d’optimalité du Problème

Quadratique Tangent

Soit L_{(P QT )}_k : Rⁿ× RnE × RnI → R le lagrangien associ´e au probl`eme quadratique

tangent (6.4) d´efini par

L_{(P QT )}_k(δm, λ_E, λ_u, λ_l) = F_k(δm)+λ^>_E(C_Eδm−e_k)+λ^>_u(C_Iδm−u_k)−λ^>_l(C_Iδm−l_k),

(6.6) où le vecteur µ_E (resp. µ_l et µ_u) est appelé le multiplicateur de Lagrange associé aux contraintes d’égalité (resp. aux contraintes d’inégalité).

Soit cδm_k un minimum de (P QT )_k. Comme F_k est r´eguli`ere (F_k ∈ C∞

de Rn → R) et que les contraintes sont affines (donc qualifi´ees (QC-A) voir la d´efinition 4.1.9

et la proposition 4.1.10), on peut appliquer le théorème de Karush-Kuhn-Tucker (cf. théorème 4.1.11). Il existe bλ_E,k ∈ RnE, bλ_l,k ∈ RnI et bλ_u,k ∈ RnI tels que les condi-tions nécessaires d’optimalité suivantes soient vérifiées :

         (a) ∇F_k( cδm_k) + C_E^>bλ_E,k − C> I(bλ_l,k− bλ_u,k) = 0 (b) C_Eδmc_k = e_k, l_k≤ C_Iδmc_k≤ u_k (c) (bλ_l,k, bλ_u,k) ≥ 0 (d) bλ^>_l,k(C_Iδmc_k− l_k) = 0, bλ^>_u,k(C_Iδmc_k− u_k) = 0. (6.7)

On note bλ_k = (bλ_E,k, bλ_I,k) avec bλ_I,k = bλ_l,k − bλ_u,k. Ces conditions sont aussi suffisante pour avoir l’optimalit´e de cδm_k(voir proposition4.1.13).

6.2.4 Algorithme SQP local

On peut à présent schématiser l’algorithme local de programmation quadratique suc-cessive que nous utilisons pour résoudre le problème non-linéaire (P_EI).

Data : Choisir un mod`ele initial m₀.

begin k = 0

Evaluer f₀, g₀, J₀par la résolution du problème direct (algorithme de tracé de rayons).

while (5.5) n’est pas satisfaite do ((1)) R´esoudre le (P QT )_k(6.4) :

on obtient une solution primale-duale ( cδm_k, bλ_k).

((2)) Mettre `a jour le mod`ele par :

m_k+1 = m_k+ cδm_k.

((3)) Mettre `a jour les multiplicateurs de Lagrange par :

µ_k+1 = bλ_k.

((4)) Évaluer f_k+1, g_k+1, J_k+1 par la résolution du problème direct (algorithme de tracé de rayons).

((5)) Passer `a l’it´eration de Gauss-Newton suivante : k := k + 1.

endw end

Algorithme II.2 Algorithme SQP local appliqué à la résolution de (PEI)

Quelques commentaires :

1. Les commentaires de l’algorithme généralII.1s’appliquent à cet algorithme. 2. L’algorithmeII.2est un algorithme local. Il ne converge que pour m₀proche d’une

solution locale m de (P_b _EI) (voir proposition 4.2.4). Si l’on commence à itérer à partir d’un modèle initial m₀ “trop éloigné” de la solutionm, il faut alors forcer la_b

convergence en utilisant une méthode de globalisation de l’algorithme local . Nous développerons en détail une méthode de globalisation dans la section 6.3. Cette méthode met à jour le modèle et les multiplicateurs de Lagrange aux étapes ((2)) et ((3)) de l’algorithme.

Section 6.3 129

Fig. 6.2 Pourcentage du temps CPU pass´e dans le probl`eme direct/solveur avec contraintes

3. Comme nous l’avons déjà remarqué dans la figure6.2, la résolution du problème direct à l’étape ((4)) de l’algorithme représente plus de 80% du temps total de cal-cul (hors parallélisation et sans contrainte). La figure 6.2 confirme cette tendance lorsque l’on utilise notre optimiseur avec contraintes. En effet, on remarque que le temps CPU passé à résoudre le problème direct reste supérieur à 70% sur l’ensemble des modèles de notre bibliothèque de tomographie (voir annexeD). Il faut rester très prudent sur ces valeurs car le temps passé dans l’optimiseur avec contraintes dépend de beaucoup de paramètres : nombre de contraintes, type des contraintes, activité des contraintes en la solution, dimension du problème, etc... Ces valeurs valident notre choix pour la méthode SQP.

Dans le document Problèmes d’Optimisation Non Linéaire avec Contraintes en Tomographie de Réflexion 3D (Page 141-146)