Méthode de Gauss-Newton - Problèmes de moindres-carrés non-linéaires

1.3 Problèmes de moindres-carrés non-linéaires

1.3.3 M´ethode de Gauss-Newton

où v_min (resp. v_max) est un vecteur propre de H associé à la valeur propre λ_min (resp.

λ_max)

A chaque it´eration de gradient conjugu´e (voir algorithmeI.1), le scalaire

p^>_kJ^>J p_k p^>_kp_k ⁼ ||q_k||2 2 ||p_k||2 2 ,

peut-être calculé facilement (ce calcul nécessite un seul produit scalaire supplémentaire pour obtenir ||pk||2

2). Or, ce scalaire n’est autre que le quotient de Rayleigh

Q_rayleigh(J^>J, p_k). On peut alors se servir des ces quotients pour ´evaluer rapidement le

conditionnement de la matrice J^>J au cours des it´erations de gradient conjugu´e. Il s’agit

de calculer les scalaires suivant :

λ_max = max

k=1,...,Niter

Q_rayleigh(J^>J, d_k) et ˜λ_min = min

k=1,...,Niter

Q_rayleigh(J^>J, d_k),

où N_iter est la dernière itération de gradient conjugué. On obtient alors une borne inférieure du conditionnement de J^>J par le quotient des deux quantités précédentes :

Cond(J^>J ) ≥ ^λ^˜^max ˜

λ_min^. ^(1.16)

1.3.3 M´ethode de Gauss-Newton

Nous allons décrire dans cette sous-section la méthode de Gauss-Newton pour résoudre le problème de moindres-carrés non linéaires (1.8). Cette méthode consiste à minimiser

f en tentant d’annuler son gradient. Pour ce faire, elle utilise l’algorithme de Newton sur

l’équation ∇f (x) = 0 en prenant garde de retirer les dérivées secondes de r dans le calcul de la hessienne de f (voir équation (1.12)). On approche donc ∇2f (x) par J (x)^>J (x),

puis on calcule en x_kune direction d_ken résolvant le système linéaire

J_k^>J_kd_k = −J_k^>r_k = −g_k, (1.17) o`u on note J_k = J (x_k) et r_k = r(x_k).

La méthode de Gauss-Newton s’interprète aussi comme une méthode de quasi-linéarisation. En effet, par linéarisation du résidu en xkdans l’équation (1.8) on définir le problème linéarisé de (1.8).

Définition 1.3.9 On appelle problème linéarisé du problème (1.8) le problème de

moindres-carr´es lin´eaire suivant :

min

Section 1.3 27

En écrivant l’équation d’optimalité de ce problème on retrouve aisément que la direction

d_k définie par ce problème n’est autre que celle trouvée par le système (1.17). Cette in-terprétation est intéressante car comme (1.18) est convexe, on en déduit que l’équation d’optimalité est nécessaire et suffisante (voir théorème1.2.4).

Le résultat suivant, repris du lemme 10.3 de [68], montre que la direction d_k obtenue en (1.17) est une direction de descente en xk et qu’elle peut donc être utilisée dans le cadre d’une globalisation de l’algorithme par recherche linéaire.

Lemme 1.3.10 Il existe toujours une direction dkv´erifiant (1.17). Si xkn’est pas un point

stationnaire du problème de moindres-carrés non linéaire (1.8), d_k est une direction de

descente de f en x_k.

En résumé, voici les principaux arguments conduisant à l’utilisation de la méthode de Gauss-Newton pour résoudre (1.8) :

1. L’approximation du hessien de f par J (x)^>J (x) est int´eressante car elle utilise

uniquement le calcul de la jacobienne J (x), le coût de calcul des dérivées secondes des residus pouvant être important.

2. Dans de nombreuses applications le terme J^>J approchant le hessien de f est

do-minant par rapport aux termes regroupant les dérivées secondes des résidus. Cela se produit plus particulièrement dans le cas d’applications où :

• les r´esidus sont petits (ri ≈ 0),

• les r´esidus sont quasi-lin´eaires (||∇2r_i|| ≈ 0).

3. Le lemme1.3.10assure que la direction de Gauss-Newton d_ktrouv´ee par r´esolution de (1.17) est bien une direction de descente de f .

4. L’interprétation de l’algorithme de Gauss-Newton par une méthode de quasi-linéarisation fait le lien avec les méthodes utilisables dans le cas de problèmes de moindres-carrés linéaires. La méthode de Gauss-Newton peut alors se voir comme la transformation d’un problème de moindres-carrés non linéaires en la résolution d’une suite de problèmes de moindres-carrés linéaires. Ainsi, on peut appliquer les méthodes de la section1.3.1pour résoudre le problème (1.18).

Data : Choix d’un it´er´e initial x1. Initialisation : k = 1. Constante 0 < ω₁ < ¹₂.

begin

while J (x_k)^>r(x_k) 6= 0 do

((1)) Calcul de la direction de descente : prendre pour d_kune solution de (1.17).

((2)) D´eterminer le pas α_kpar “rebroussement”, i.e. en prenant le plus grand α_kdans {1,¹₂,¹₄, ...} tel que

f (x_k+ α_kd_k) ≤ f (x_k) + ω₁α_k(g_k, d_k).

((3)) Mettre à jour l’itéré :

xk+1 = xk+ αkdk.

((3)) Accroˆıtre k de 1 : k := k + 1.

endw end

Algorithme I.2 Algorithme de Gauss-Newton globalis´e par recherche lin´eaire

Quelques remarques sur cet algorithme :

1. L’étape la plus délicate de l’algorithme est l’étape ((1)) qui consiste à résoudre le système linéaire (1.17). Pour ce faire, suivant la taille du système à résoudre on pourra soit faire appel à des méthodes de factorisation (petit et moyen système) soit à des méthodes itératives de type gradient conjugué (grand système).

2. L’étape ((2)) de l’algorithme permet d’assurer la convergence lorsque l’itéré initial est “loin” de la solution. La technique de recherche linéaire permet d’assurer la décroissance de f à chaque itération.

3. La proposition suivante, reprise de la proposition 10.5 de [68], donne un r´esultat de convergence de l’algorithme de Gauss-Newton.

Proposition 1.3.11 Soit {x_k} une suite générée par l’algorithme de

Gauss-Newton. Si {J (x_k)} est born´ee et uniform´ement injective, alors J (x_k)^>r(x_k) → 0.

4. L’algorithme de Gauss-Newton s’interprète presque comme un algorithme de New-ton avec recherche linéaire. La différence entre ces 2 algorithmes réside dans l’ap-proximation du hessien de f et dans le fait qu’on sur içi d’avoir une direction de descente.

Dans la sous-section suivante nous nous intéresserons à la méthode de Levenberg-Marquardt qui est le pendant de la méthode de Gauss-Newton mais cette fois-ci avec une globalisation par région de confiance.

Section 1.3 29

Dans le document Problèmes d’Optimisation Non Linéaire avec Contraintes en Tomographie de Réflexion 3D (Page 43-46)