M´ethode de Gauss-Newton en tomographie de r´eflexion

2.5 Le probl`eme inverse

2.5.3 M´ethode de Gauss-Newton en tomographie de r´eflexion

. (2.14)

Le respect du principe de Fermat pour la trajectoire (P) implique que l’équation (2.9) est satisfaite. En injectant l’équation (2.9) dans (2.14), on aboutit à la formule suivante :

J (m)_ij = N −1 X n=1 ∂(tⁱ_n+ tⁱ_n+1) ∂mj . (2.15)

Comme les interfaces et les vitesses du modèle m sont définies par des fonctions B-spline cubiques, les éléments J (m)_ij de la matrice jacobienne peuvent être calculés explicite-ment (voir [97] pour plus de détails sur ces calculs).

Les cons´equences importantes de l’´equation (2.15) sont :

1. une fois que les temps de trajet T_i ont été calculés par la méthode de bending, le calcul explicite des éléments de la matrice jacobienne ne coûte pas cher en temps CPU (pas de nouveau rayon à calculer),

2. la matrice jacobienne J est creuse ; en effet, chaque temps de trajet (ti n + ti

n+1)

s’exprime comme une somme de fonctions B-spline pondérée par des paramètres B-spline ; et, comme les fonctions B-spline sont nulles partout sauf sur quatres in-tervalles de noeuds (voir annexeA) les temps de trajet (ti

n+ ti

n+1) ne d´ependent que

d’un nombre restreint de param`etres B-spline.

2.5.3 M´ethode de Gauss-Newton en tomographie de r´eflexion

1. les résidus des temps de trajet sont relativement faibles en la solution (inférieur à

10 milli-secondes),

2. la matrice jacobienne J est facilement accessible (voir section pr´ec´edente).

Ainsi, d’après les arguments développés dans la section 1.3, la méthode de Gauss-Newton est bien adaptée pour résoudre le problème (2.12). Dans la suite, nous appliquons spécifiquement au problème (2.12) la méthode de Gauss-Newton présentée dans la sec-tion1.3.3du chapitre théorique.

On obtient le problème inverse linéarisé (voir définition1.3.9) en linéarisant la fonction

T autour du mod`ele m_kcourant :

T (m_k+ δm) ≈ T_k+ J_kδm,

où T_k:= T (m_k), J_k= J (m_k), et δm = m − m_kreprésente la perturbation de modèle. En injectant cette approximation linéaire de T dans l’équation2.12, on obtient le problème

lin´earis´e en m_ksuivant : (P_lin) : min δm F_k(m) := ¹₂ T_k+ J_kδm − Tobs 2 2 + ^σ₂²(m_k+ δm)^>R(m_k+ δm). (2.16)

A part quelques cas pathologiques (voir section2.4) le problème linéarisé (2.16) est bien posé (pour plus de détails sur ce sujet, nous renvoyons le lecteur aux travaux de [48] et au chapitre 3 de [47]). Une conséquence importante de ce résultat est que la solution de (2.16) ne dépend pas de la discrétisation choisie sur le modèle (à partir d’un certain seuil sur le pas de discrétisaton).

La fonction Fk est une approximation quadratique en mk de la fonction coût non-linéaire f , on peut l’écrire sous la forme standard suivante :

F_k(δm) = ¹ 2^δm > H_kδm + g^>_kδm + f_k, o`u f_k= f (m_k), g_k = J_k^>(T_k− Tobs) + σ²Rm_k est le gradient de f en m_ket H_k = J_k^>J_k+ σ²R

est une approximation semi définie positive du hessien de f (en général définie positive, notons que le noyau de R est caractérisé par l’ensemble des modèle “plat”) obtenue en négligeant les dérivées secondes des temps de trajet.

Dans la figure 2.7 nous pouvons observer le spectre de la matrice H_k associé à un modèle relativement simple de sous-sol (une seule vitesse et une seule interface). Il ressort de cette figure que l’ajout de la partie régularisation (σ²R) à J_k^>J_kest crucial pour rendre la matrice H_k définie positive. De plus on observe que le conditionnement de H_k est très mauvais (≈ 10⁹) pour une matrice d’ordre seulement 500.

Section 2.5 49

Fig. 2.7 Spectre de H (en rouge), de J^>J (en bleu) et de R (en vert) pour exemple simple : le modèle est composé d’une seule vitesse (discrétisée par 400 paramètres B-spline) et d’une seule interface (discrétisée par 100 paramètres B-spline). Cette figure est reprise de la figure 1 de [30].

L’équation d’optimalié de (2.16) (voir section1.3.1) s’écrit :

H_kδm = −g_k. (2.17)

Comme H_k est définie positive, le problème de moindres-carrés linéaires (2.16) peut être résolu en utilisant l’algorithme du gradient conjugué sur l’équation normale (2.17) (voir l’algorithme CGLS de la section 1.3.2). Cet algorithme est d’autant plus efficace (notamment sur des problèmes de grande taille mal conditionnés) qu’il est couplé à un préconditionneur adapté à la structure de Hk. Dans la figure2.8, nous pouvons observer les éléments non nuls de la matrice hessienne pour un modèle complexe de sous-sol : la structure de H_k est délimitée par des blocs (vitesses / interface) et les éléments non nuls à l’intérieur d’un même bloc sont disposés en bandes. Nous pouvons aussi remarquer sur cette figure que la matrice H_kest très creuse.

L’algorithme de Gauss-Newton appliqué à la résolution de 2.12 s’écrit (voir l’algo-rithme théoriqueI.2) :

Fig. 2.8 Eléments non nuls de la matrice hessienne H(m) pour un exemple complexe : le modèle est composé de 3 vitesses (discrétisées par 2634 paramètres B-spline) et de 10 interfaces (discrétisées par 8514 paramètres B-spline). Cette figure est reprise de la figure 2 de [30].

Section 2.5 51

Data : Choix d’un mod`ele initial m0.

Choix d’un poids de p´enalisation : σ > 0.

Constante 0 < ω₁ < ¹₂ (typiquement ω₁ = 10⁻⁴ ).

begin k = 0

Evaluer f₀, g₀, J₀par la résolution du problème direct (algorithme de tracé de rayons).

while ||g_k||₂ 6= 0 do

((1)) Calcul de la direction de descente : prendre pour δm_kune solution de (2.17).

((2)) D´eterminer le pas α_kpar “rebroussement”, i.e., en prenant le plus grand α_kdans {1,¹₂,¹₄, ...} tel que

f (x_k+ α_kδm_k) ≤ f (x_k) + ω₁α_k(g_k, δm_k).

((3)) Mettre `a jour le mod`ele :

mk+1 = mk+ αkδmk.

((4)) Évaluer f_k+1, g_k+1, J_k+1 par la résolution du problème direct (algorithme de tracé de rayons).

((5)) Accroˆıtre k de 1 : k := k + 1.

endw end

Algorithme I.4 Algorithme de Gauss-Newton en tomographie de r´eflexion

Quelques commentaires sur cet algorithme :

Remarques 2.5.1

1. Les commentaires de l’algorithme généralI.2s’appliquent à cet algorithme.

2. L’étape ((1)) de l’algorithme est importante : il faut résoudre rapidement l’équation

normale (2.17) pour que l’algorithme de Gauss-Newton soit efficace. Etant donn´e

la dimension des systèmes à résoudre dans nos applications, une méthode itérative

doit être préférée à une méthode directe pour résoudre le système (2.17) : c’est

un algorithme du gradient conjugué préconditionné, adapté de l’algorithme CGLS

(voir section 1.3.2), qui a été choisi pour le résoudre. Les travaux de [30] ont

montr´e que :

(i) l’utilisation de préconditionneurs Jacobi ou Gauss-Seidel par blocs permet d’accélérer la convergence de l’algorithme du gradient conjugué et d’obtenir

des solutions plus pr´ecises de (2.17).

(ii) l’algorithme du gradient conjugué peut être développé de manière à ne pas

peu précis et coûteux des éléments de H_k(voir le point 1. de la remarque1.3.6). Les produits matrices vecteurs sont alors réalisés grâce au stockage optimisé

des matrices Jk(stockage morse) et R (stockage bande).

3. Remarquons que la solution obtenue par l’algorithmeI.4est fortement d´ependante

du choix initial du poids de p´enalisation σ. Dans la section suivante nous verrons comment nous choisissons ce poids en pratique.

4. En théorie, l’arrêt des itérations de Gauss-Newton doit s’effectuer lorsque la norme

du gradient gk est plus petite qu’un certain seuil. Cependant, ce crit`ere n’est pas

suffisant car le seuil qui lui est associé est difficile à évaluer. En pratique, l’utilisa-teur dispose de trois critères permettant d’arrêter l’algorithme de Gauss-Newton. Ces critères, plus proches des préoccupations de la géophysique, comparent les temps de trajet calculés aux temps de trajet observés. On distingue les critères sui-vants :

(i) le r´esidu maximal :

||T (m) − T^obs||∞,

où N_obs représente le nombre de temps de trajet observés,

(ii) le r´esidu moyen (ou rms pour “root mean square”) :

rms = s PN T i=1(T_i(m) − Tobs i )2 N T ^,

(iii) la distribution des résidus (histogrammes des résidus, répartition des résidus en fonction des points d’impact, etc ...).

L’analyse comparative de ces trois critères permet de déterminer si la solution d’une inversion est acceptable. Dans le cas d’une solution non acceptable il faut soit, prolonger les itérations de Gauss-Newton, soit relancer une inversion en par-tant d’un poids de régularisation plus faible.

En pratique, dans nos applications en tomographie de réflexion, l’algorithme I.4 est très efficace : il permet de trouver une solution du problème (2.15) en très peu d’itérations de Gauss-Newton (de l’ordre de 5-10 itérations). Cependant, dans certains cas difficiles, la recherche linéaire (voir l’étape ((2)) de l’algorithme I.4) ne parvient pas à forcer la convergence de la suite {m_k}_k≥0 vers une solution du problème (2.15). Cette diffi-culté, qui apparaˆıt notamment lorsque la matrice H_k est très mal conditionnée, peut être contournée en utilisant une globalisation par régions de confiance (voir [35]) au lieu de la recherche linéaire. Notons que cela revient en fait à remplacer l’algorithme de Gauss-Newton précédent par un algorithme proche de celui de Levenberg-Marquardt (voir l’al-gorithme I.3 du chapitre théorique). Dans le chapitre suivant, nous verrons que l’utili-sation en tomographie de réflexion de l’algorithme de Gauss-Nexton globalisé par des régions de confiance permet de résoudre des cas où l’algorithmeI.4a échoué.

Section 2.5 53

Dans le document Problèmes d’Optimisation Non Linéaire avec Contraintes en Tomographie de Réflexion 3D (Page 64-70)