qua-dratique successive
Dans cette section, nous allons appliquer la m´ethode SQP `a la r´esolution du probl`eme de tomographie (PEI) (les r´esultats g´en´eraux concernant cette m´ethode sont d´ecrits `a la
non-Section 6.2 125
Fig. 6.1 Pourcentage du temps CPU pass´e dans le probl`eme direct/solveur sans contrainte
lin´eaire en la r´esolution d’une suite de Probl`emes Quadratiques Tangents (PQT). Lorsque l’on souhaite utiliser une m´ethode SQP, les 2 premi`eres questions `a se poser sont : com-ment d´efinir les probl`emes quadratiques successifs ? Peut-on les r´esoudre (en un temps raisonnable) ? Dans les trois sous-sections suivantes nous donnerons des r´eponses `a ces questions. Dans la derni`ere sous-section nous d´evelopperons notre algorithme SQP local et pr´esenterons ses sp´ecificit´es.
6.2.1 Approximation gauss-newtonienne du Probl`eme Quadratique
Tangent
Dans la section 4.2.3 sur les rappels de la m´ethode SQP, nous avons vu que l’ex-pression du PQT fait intervenir le hessien du lagrangien du probl`eme original (voir ´equation (4.10)). Du fait que notre probl`eme (PEI) ne fait intervenir que des contraintes
lin´eaires le hessien de ces derni`eres n’intervient pas dans le PQT :
∇2
mmL(PEI) = ∇2mmf.
Comme l’approximation gauss-newtonienne Hk calcul´ee dans la partie I est une bonne approximation de ∇2mmf , elle est aussi une bonne approximation du hessien du
lagran-gien du probl`eme (PEI). Ainsi, pour des raisons identiques `a celles d´evelopp´ees `a la
section2.5.3on prendra l’approximation GN de ∇2mmf : ∇2
mmf (mk) ≈ Hk := Jk>Jk+ σ2R,
Les contraintes (5.1) doivent aussi ˆetre exprim´ees en fonction de la perturbation du mod`ele δm en mk. Pour les contraintes d’´egalit´e on a
cE(mk+ δm) = CE.(mk+ δm),
qui peut se r´ecrire comme
CE.δm = ek, (6.1)
o`u ek = e − CE.mk. On obtient, par un calcul similaire,
lk≤ CI.δm ≤ uk, (6.2)
pour les contraintes d’in´egalit´e, avec
(
lk= l − CImk,
uk = u − CImk. (6.3)
Le Probl`eme Quadratique Tangent (PQT) `a l’it´eration k de Gauss-Newton se formule donc comme la minimisation de l’approximation quadratique Fk de δm 7→ f (mk+ δm)
soumise aux contraintes lin´eaires (6.1) et (6.2) :
(P QT )k min δm∈Rn Fk(δm) = 12δm>Hkδm + g>kδm CE.δm = ek lk ≤ CI.δm ≤ uk, (6.4) o`u gk = Jk>(Tk− Tobs) + σ2Rmk. D´efinition 6.2.1 On note δMC(mk) := {δm ∈ M : CE.δm = ek, lk ≤ CI.δm ≤ uk} l’ensemble des perturbations de mod`ele δm respectant les contraintes d’´egalit´e et
d’in´egalit´e du probl`eme (6.4).
On v´erifie ais´ement que δm ∈ δMC(mk) si et seulement si mk+ δm ∈ MC. D`es lors on a la relation
δMC(mk) = MC − mk. (6.5)
En particulier, on a δMC(mk) 6= 0 si et seuleument si MC 6= 0.
Le (P QT )k est un probl`eme convexe (voir d´efinition 4.1.5) car Hk est semi-d´efinie positive. Il sera donc possible d’appliquer une m´ethode de lagrangien augment´e pour le r´esoudre (voir chapitre7).
Section 6.2 127
6.2.2 Existence et unicit´e de la solution du Probl`eme Quadratique
Tangent
Sans les contraintes lin´eaires, le PQT (6.4) est ´equivalent au probl`eme r´egularis´e lin´earis´e (Plin) (cf. (2.16)) de la tomographie de r´eflexion. Nous avons vu `a la sec-tion 2.5.3, l’existence et l’unicit´e du probl`eme lin´earis´e (Plin). La question ici est de
savoir si ce r´esultat est toujours valable lorsque l’on ajoute des contraintes lin´eaires. On a le r´esultat d’existence et d’unicit´e suivant.
Proposition 6.2.2 On suppose que les contraintes de (PEI) sont compatibles (MC 6= ∅),
alors (P QT )ka une solution. Si, en plus, Hkest d´efinie positive alors il existe une et une
seule solution au probl`eme (P QT )k.
D ´EMONSTRATION. On utilise les 2 arguments suivants.
1) Le probl`eme (P QT )kest r´ealisable car δMC(mk) 6= ∅ (car MC 6= ∅).
2) Fk est born´e car
Fk(δm) = 1 2||Jkδm + T (mk) − Tobs||2 2+ σ 2 2 (mk+ δm) >R(mk+ δm) ≥ 0.
On sait que Fkest une fonction quadratique convexe (Hkest semi-d´efinie positive). Ainsi, par le th´eor`eme 17.1 de [18] il existe une solution au probl`eme (P QT )k. Si on suppose, en plus, que Hk est d´efinie positive alors cette solution est unique car, dans ce
cas, Fkest strictement convexe. ut
6.2.3 Conditions n´ecessaires et suffisantes d’optimalit´e du Probl`eme
Quadratique Tangent
Soit L(P QT )k : Rn× RnE × RnI → R le lagrangien associ´e au probl`eme quadratique
tangent (6.4) d´efini par
L(P QT )k(δm, λE, λu, λl) = Fk(δm)+λ>E(CEδm−ek)+λ>u(CIδm−uk)−λ>l(CIδm−lk),
(6.6) o`u le vecteur µE (resp. µl et µu) est appel´e le multiplicateur de Lagrange associ´e aux contraintes d’´egalit´e (resp. aux contraintes d’in´egalit´e).
Soit cδmk un minimum de (P QT )k. Comme Fk est r´eguli`ere (Fk ∈ C∞
de Rn → R) et que les contraintes sont affines (donc qualifi´ees (QC-A) voir la d´efinition 4.1.9
et la proposition 4.1.10), on peut appliquer le th´eor`eme de Karush-Kuhn-Tucker (cf. th´eor`eme 4.1.11). Il existe bλE,k ∈ RnE, bλl,k ∈ RnI et bλu,k ∈ RnI tels que les condi-tions n´ecessaires d’optimalit´e suivantes soient v´erifi´ees :
(a) ∇Fk( cδmk) + CE>bλE,k − C> I(bλl,k− bλu,k) = 0 (b) CEδmck = ek, lk≤ CIδmck≤ uk (c) (bλl,k, bλu,k) ≥ 0 (d) bλ>l,k(CIδmck− lk) = 0, bλ>u,k(CIδmck− uk) = 0. (6.7)
On note bλk = (bλE,k, bλI,k) avec bλI,k = bλl,k − bλu,k. Ces conditions sont aussi suffisante pour avoir l’optimalit´e de cδmk(voir proposition4.1.13).
6.2.4 Algorithme SQP local
On peut `a pr´esent sch´ematiser l’algorithme local de programmation quadratique suc-cessive que nous utilisons pour r´esoudre le probl`eme non-lin´eaire (PEI).
Data : Choisir un mod`ele initial m0.
begin k = 0
´
Evaluer f0, g0, J0par la r´esolution du probl`eme direct (algorithme de trac´e de rayons).
while (5.5) n’est pas satisfaite do ((1)) R´esoudre le (P QT )k(6.4) :
on obtient une solution primale-duale ( cδmk, bλk).
((2)) Mettre `a jour le mod`ele par :
mk+1 = mk+ cδmk.
((3)) Mettre `a jour les multiplicateurs de Lagrange par :
µk+1 = bλk.
((4)) ´Evaluer fk+1, gk+1, Jk+1 par la r´esolution du probl`eme direct (algorithme de trac´e de rayons).
((5)) Passer `a l’it´eration de Gauss-Newton suivante : k := k + 1.
endw end
Algorithme II.2 Algorithme SQP local appliqu´e `a la r´esolution de (PEI)
Quelques commentaires :
1. Les commentaires de l’algorithme g´en´eralII.1s’appliquent `a cet algorithme. 2. L’algorithmeII.2est un algorithme local. Il ne converge que pour m0proche d’une
solution locale m de (Pb EI) (voir proposition 4.2.4). Si l’on commence `a it´erer `a partir d’un mod`ele initial m0 “trop ´eloign´e” de la solutionm, il faut alors forcer lab
convergence en utilisant une m´ethode de globalisation de l’algorithme local . Nous d´evelopperons en d´etail une m´ethode de globalisation dans la section 6.3. Cette m´ethode met `a jour le mod`ele et les multiplicateurs de Lagrange aux ´etapes ((2)) et ((3)) de l’algorithme.
Section 6.3 129
Fig. 6.2 Pourcentage du temps CPU pass´e dans le probl`eme direct/solveur avec contraintes
3. Comme nous l’avons d´ej`a remarqu´e dans la figure6.2, la r´esolution du probl`eme direct `a l’´etape ((4)) de l’algorithme repr´esente plus de 80% du temps total de cal-cul (hors parall´elisation et sans contrainte). La figure 6.2 confirme cette tendance lorsque l’on utilise notre optimiseur avec contraintes. En effet, on remarque que le temps CPU pass´e `a r´esoudre le probl`eme direct reste sup´erieur `a 70% sur l’ensemble des mod`eles de notre biblioth`eque de tomographie (voir annexeD). Il faut rester tr`es prudent sur ces valeurs car le temps pass´e dans l’optimiseur avec contraintes d´epend de beaucoup de param`etres : nombre de contraintes, type des contraintes, activit´e des contraintes en la solution, dimension du probl`eme, etc... Ces valeurs valident notre choix pour la m´ethode SQP.