Algorithme de minimisation sous contrainte

II.2 Mise en oeuvre pratique de la m´ethode des vecteurs singuliers non-

II.2.3 Algorithme de minimisation sous contrainte

Nous avons vu dans le chapitre précédent que la méthode des vecteurs singuliers non-linéaires se réduisait à la résolution d’un problème classique d’optimisation non-

lin´eaire de type :

x∗ tel que f (x∗) = max

x∈R,kxk=E0 f (x) = min x∈R,c(x)=kxk−E0=0 1 f (x) (II.4) avec ∇xf (x) connu.

La résolution de ce type de problème nécessite la prise en compte des contraintes matérielles suivantes :

– Le temps CPU nécessaire devait être raisonnable. Pour une méthode itérative, il est à peu près proportionnel au nombre d’itérations effectuées par la méthode avant de converger. En effet, l’efficacité de nombreuses méthodes diminue de fa¸con importante avec la dimension du problème.

– La mémoire utilisée. Certains algorithmes utilisent des matrices de travail de dimension n2 _{(en prenant n = 10}7_{, ceci équivaudrait à un espace mémoire de}

l’ordre du To bien évidemment indisponible sur un calculateur de bureau.) L’assimilation variationelle d’observations recourt aussi à l’utilisation d’algorithmes d’optimisation adaptés à des problèmes de grande dimension. Cependant ces pro- blèmes mathématiques sont non-contraints et s’appliquent principalement à des formes quadratiques ce qui ne permet pas l’utilisation des mêmes algorithmes. De grands progrès ont été effectués au cours des vingt dernières années dans le domaine de l’optimisation non-contraintes, citons entre autres Le Dimet and Talagrand (1986) qui montrèrent la viabilité en termes de coût numérique des méthodes d’optimisation non-linéaires pour l’assimilation d’observations, Navon and Legler (1987) qui com- parèrent l’efficacité des différents méthodes à gradient-conjugué pour diffférentes applications météorologiques et plus récemment les travaux de Zou et al. (1993) sur les performances de différentes méthodes quasi-newtoniennes à mémoire limitée. La méthode quasi-newtonienne fondée sur la variante L-BFGS de Liu and Nocedal (1988) s’avère d’après eux être la plus efficace.

L’algorithme ayant donné pour les problèmes que nous avons considéré les ré- sultats les plus satisfaisants est IPOPT (Wächter and Biegler, 2006) qui est un algorithme de point intérieur à recherche linéaire basé sur une méthode BFGS quasi- newtonienne. L’utilisation pratique de cet algorithme nécessitant de nombreux ré- glages afin d’obtenir une convergence rapide, nous allons en préciser les grandes lignes du fonctionnement sans toutefois traiter le cadre théorique de la convergence de la méthode. Le lecteur intéressé pourra se référer à Wächter and Biegler (2006) pour de plus amples détails.

Les conditions d’optimalité de premier ordre (conditions d’annulation de la dé- rivée première) s’écrivent pour la solution x∗ _{du problème d’optimisation (II.4) :}

∇f(x∗) + λ∇c(x∗) = 0 (II.5) c(x∗) = 0 (II.6) où λ est le multiplicateur de Lagrange associé à la contrainte c.

Etant donn´e (xk, λk) les valeurs de la variable et du multiplicateur de Lagrange

à la k-ième itération, l’algorithme va chercher les variables suivantes (xk+1, λk+1)

48II.2 Mise en oeuvre pratique de la m´ethode des vecteurs singuliers non-lin´eaires.

dans la direction (dx

k+1, dλk+1) obtenue par lin´earisation de (II.5) et (II.6) autour de

(xk, λk) : Wk ∇c(xk) ∇c(xk)T 0 dx k dλ k = − ∇f(xk) + λk∇c(xk) c(xk) (II.7)

o`u Wk est la hessienne du lagrangien du probl`eme f + λc : Wk = ∂x∂xf (xk) +

λ∂x∂xc(xk)

Le système II.7 est résolu à l’aide d’un solveur linéaire. Une fois la direction (dx k, dλk)

calculée, il reste à déterminer la longueur du pas αk ∈ [01] telle que xk+1 = xk+αkdxk.

Afin qu’une valeur de α soit acceptée, au moins l’une des deux conditions suivantes doit être vérifiée :

|c(xk+1)| ≤ (1 − γc)|c(xk)| (II.8)

avec γc ∈ [01]. Cette condition impose `a la contrainte de diminuer d’un facteur

(1 − γc) entre les it´erations k et (k+1).

f (xk+1) ≤ f(xk) − γf|c(xk)| (II.9)

avec γf ∈ [01] afin d’imposer `a la fonction de coˆut de diminuer.

Si αk ne satisfait aucune de ces deux conditions, alors les valeurs des pas (α₂k,α₄k,

....) sont essay´ees jusqu’`a atteindre une longueur critique αc auquel cas l’algorithme

a recours à une procédure de “restoration” qui vise à minimiser la contrainte jusqu’à ce que la condition II.8 soit vérifiée afin de pouvoir passer à l’itération suivante en résolvant le problème suivant :

min

x tel que c(x)=0 k x − xk k 2

2 (II.10)

La direction de recherche ˜dx

k correspondant à ce problème est ajoutée à dxk et la

procédure de restoration est itérée jusqu’à ce que (II.8) soit vérifiée.

Une fois le nouveau point xk déterminé l’algorithme recherche à nouveau une

direction de descente jusqu’à ce que la condition d’arrêt suffisante soit vérifiée :

ǫopt = max {k ∇f(x)) + λk∇c(xk) k∞, α k c(x) k∞} < ǫstop (II.11)

où ǫstop est un paramètre fourni par l’utilisateur idéalement de l’ordre de la précision

machine.

En pratique, la méthode de Newton utilisée pour déterminer la direction de descente de l’algorithme requiert l’expression de la hessienne du lagrangien Wk qui

n’est pas fournie explicitement par l’utilisateur et qui ne peut non plus être stockée explicitement pour des raisons de mémoire. La hessienne est estimée à partir de la méthode BFGS de Liu and Nocedal (1988) qui approxime cette dernière grâce à une procédure itérative ne nécessitant que le stockage de vecteurs.

Initialisation

L’algorithme a-t-il converg´e ?

Non

Sortie

Oui

Calcul de la direction de descente

d

Recherche lin´eaire : calcul de la taille du pas

α

Test des conditions II.9 ou II.8

Oui

Non

α

=

α₂k

Fig. _{II.3 – Schéma simplifié de l’algorithme de minimisation sous contraintes utilisé}

Dans le document Predictability of atmospheric flow at synoptic scales :influence of moisture and non-linear processes (Page 47-50)