Activation rapide de contraintes entre deux ´etapes cons´ecutives

8.3 Algorithme GP-AC-GC am´elior´e

8.3.3 Activation rapide de contraintes entre deux ´etapes cons´ecutives

La majorité des étapes de GC ne servent principalement qu’à activer des contraintes de borne inactives (le GC s’arrêtant dès qu’une contrainte de borne non active est ren-contrée), jusqu’à convergence vers un ensemble de travail W stable (cf. définition8.3.1

suivante) où on minimisera complètement (P L)^j_W(ou partiellement avec le test d’arrêt de Rosen).

D´efinition 8.3.1 On dit qu’un ensemble de travail W est stable lorsque le chemin suivi

par le GC pour minimiser compl`etement (ou partiellement avec le test d’arrˆet de Rosen)

le probl`eme (P L)^j_W est admissible pour les contraintes de borne inactives de J .

Comme l’algorithme II.6 de GP-AC-GC classique n’active qu’une seule contrainte de borne à la fois entre deux étapes consécutives de GC, un nombre important d’étapes de GC risquent d’être générées afin de parvenir à un ensemble de travail W stable. Ces étapes consécutives de GC sont chères en temps CPU pour deux raisons. La première raison est que, indépendamment du nombre d’itérations de GC effectuées, chaque étape de GC a un coût fixe relativement important dû à l’initialisation du préconditionneur de HW (cf. section8.2.3). La deuxième raison est que chaque itération de GC nécessite un produit matrice-vecteur relativement coûteux dans notre application. De plus, on observe souvent que peu d’itérations de GC sont nécessaires avant de rencontrer une borne et donc, que le critère quadratique du problème (P L)^j_W n’est que très légèrement minimisé. Ainsi, le coût cumulé en temps CPU engendré par l’identification d’un ensemble de travail W stable dans l’algorithme II.6 peut s’avérer très rapidement important (dans le pire des cas il faudra n_I étapes de GC pour converger vers un ensemble W stable : après un changement de phase GP =⇒ GC, on démarre le premier GC avec aucune contrainte de bornes actives W = ∅, puis on les active toutes une par une par des étapes de GC consécutives). En pratique, on a déjà observé ce problème où beaucoup d’étapes de GC

Section 8.3 173

sont généralement nécessaires pour parvenir à un ensemble de travail W stable. Afin de remédier d’y remedier, nous avons mis au point une technique d’activation rapide de contraintes entre chaque étape de GC. Pour ce faire, après chaque étape de GC, nous avons choisi d’utiliser une méthode de descente avec projection sur l’ensemble des contraintes inactives J . On l’appellera par la suite méthode de direction projetée (DP). La méthode DP est similaire à la méthode GP sauf que l’on s’autorise ici à projeter une direction qui peut être différente de celle formée par l’opposé du gradient. Comme la projection d’une direction autre que l’opposée du gradient n’est pas nécessairement une direction de descente, pour s’assurer que le chemin projeté est de descente on veillera à ce que

d = (d_δm, d_y) satisfasse :     

(a) Pour α petit, P_[l,u](y + αd_y) = y + αd_y

(b) La direction d est une direction de descente du crit`ere quadratique de (P L)^j (c) (d_y)_i > 0 si y_i = l_i et (d_y)_i < 0 si y_i = u_i

(8.25) Quelques remarques sur ces propri´et´es :

1. Les conditions (a) et (b) assurent que l’on fait bien décroˆıtre le critère quadratique de (P L)^j en se déplaçant dans la direction projetée de d.

2. La condition (c) assure que l’on se déplace dans l’ensemble de travail W courant et donc que l’on ne va pas désactiver des contraintes par projection de la direction d. En général cette condition n’est pas indispensable. Dans notre cas elle est utile car nous voulons utiliser la méthode DP pour activer des contraintes sans en désactiver après une étape de GC (étape dans laquelle yJ sort des bornes).

Afin d’appliquer la méthode DP, après une minimisation par GC du problème (P L)^j_W, on a besoin de choisir un point de départ XJ admissible et une direction d à projeter (la direction de descente devant vérifier les propriétés de (8.25)). Pour ce faire, trois types d’approches différentes sont envisageables.

Première possibilité (non testée). On résout complètement (8.12) par GC sans tenir compte des bornes sur yJ et on note bXJ sa solution. Si le point bXJ =

c δm b y n’est pas admissible, i.e.y /_b∈ [l, u], alors on applique la m´ethode DP avec pour point de d´epart le

point XJ₀ qui correspond au point XJ initialisant l’´etape de GC et avec pour direction

d = bXJ − XJ0. Cette approche revient à modifier légèrement la première possibilité du GC décrite dans la section 8.2.2. Or nous avons déjà rejeté cette approche car elle est très coûteuse en temps CPU : un grand nombre d’itérations de GC est nécessaire avant d’obtenir la solution XJ du système (8.12).

Deuxième possibilité (la possibilité retenue). On choisit d’utiliser la deuxième possi-bilité du GC décrite dans la section8.2.2. Si yJ sort des bornes au cours des itérations de GC on note XJ_iborne la solution obtenue par GC tronqué juste avant la sortie des bornes et de même on note XJiborne+1 la solution obtenue par GC tronqué juste après la sortie des bornes (iborne représente l’indice d’itération de GC obtenue juste avant la sortie des bornes). Ensuite on applique la méthode DP avec pour point de départ le point XJ_iborne et

avec pour direction d = XJ_iborne+1− XJ_iborne (notons qu’il existe une variante ou on pren-dra d = XJ_iborne+1− XJ0). Cette possibilité permet de minimiser le nombre d’itérations de GC à effectuer à chaque étape de GC.

Troisième possibilité (non testée). On résout partiellement (8.12) par GC avec le critère de Rosen, tout en faisant évoluer yJ de manière à minimiser le critère quadratique de

(P L)^j_W. Si yJ ne sort pas des bornes alors tout se passe comme dans la deuxième possi-bilité du GC décrite dans la section8.2.2. Sinon, si yJ sort des bornes, alors on désactive le critère de Rosen, et on pousse les itérations de GC jusqu’à satisfaction d’un nouveau critère :

k(g_δm, g_(y_J₎)k ≤ γDPkQWg_(y_W₎k.

Ce nouveau critère, que l’on appellera critère de la Direction Projetée, est semblable au critère de Rosen sauf que, cette fois-ci, la constante γDP du critère doit être choisie supérieure à 1 : γDP ≥ 1 (on peut voir ce nouveau critère comme le critère de Rosen

“re-laxé”, nous prenons en pratique γDP = 10²). Une fois le critère de la Direction Projetée satisfait on note XJ_DP la solution obtenue par le GC. Puis on applique la méthode DP avec pour point de départ le point XJ₀ qui correspond au point XJ initialisant l’étape de GC et avec pour direction d = XJ_DP − XJ0. Cette approche permet de trouver une direction de projection pour l’étape DP mieux équilibrée que la direction choisie dans la deuxième possibilité précédente. Elle devrait donc permettre d’activer des contraintes qui ont potentiellement plus de chance de figurer dans l’ensemble des contraintes actives en la solution du problème (P L)^j. En d’autre termes, cette approche permet de diminuer le nombre total de phases de GC générées par l’algorithme GP-AC-GC. Reste mainte-nant à savoir si cette diminution compense l’augmentation du nombre d’itérations de GC provoquées par l’équilibrage de la direction .

Une remarque sur la m´ethode DP :

1. On peut se demander pourquoi dans les possibilités précédentes on n’a pas utilisé la technique de la section 8.3.1qui consiste à projeter d en y seulement. En fait, la direction formée par le vecteur

0 d_y

n’a aucune garantie d’être une direction de descente du critère quadratique de (P L)^j. Comme cela contredit la propriété

(b) de (8.25), on ne peut donc pas envisager cette technique dans le cadre de notre m´ethode DP.

Comme pour le critère d’arrêt de Rosen, l’étape supplémentaire de DP à l’intérieur du code GP-AC-GC a été mise en œuvre pour diminuer le nombre d’itérations de GC. Parmi les trois possibilité différentes pour programmer une étape de DP (voir ci-dessus) nous avons retenue la seconde possibilité. Ainsi, en pratique, pour savoir si cette étape supplémentaire de DP est efficace, on réalise un profil de performance (voir l’article [50] et l’annexeEpour la construction et l’interprétation d’un profil de performance) dans le-quel on compare le nombre d’itérations de GC effectuées avec ou sans cette étape. Dans la figure8.2, nous avons tracé ce profil de performance : il compare le nombre d’itérations de GC réalisées par le code GP-AC-GC sans l’étape supplémentaire de DP (courbe rouge) et celui avec cette étape supplémentaire (courbe verte en pointillé). Ce profil de performance

Section 8.3 175 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 x

Fig. 8.2 Profil de performance sur les itérations de GC : Avec (courbe verte en pointillé) ou sans (courbe rouge) l’étape de DP

a été obtenu en testant tous les exemples de notre bibliothèque de modèles en tomogra-phie de réflexion (cf. annexeDpour la description de cette bibliothèque de modèles). Pour chaque exemple testé, nous avons noté le nombre total d’itérations de GC effectuées lors de la première itération de GN. Cette figure montre clairement que le code GP-AC-GC avec l’étape de DP (seconde possibilité) est le plus performant : la courbe verte est située au-dessus de la courbe rouge. Pour environ 85% des exemples testés (voir valeur obtenue pour τ = 1), le nombre d’itérations de GC obtenu par le code GP-AC-GC avec l’étape de DP est inférieur à celui obtenu par le code sans cette étape. De plus, pour chaque problème le code avec l’étape de DP n’est jamais moins bon que 1, 9 fois ce qu’a fait le code sans cette étape alors que le code sans l’étape de DP est parfois 2, 2 fois moins bon que le code avec cette étape (i.e., le code sans l’étape de DP demande parfois 2, 2 fois plus d’itérations de GC).

Dans le document Problèmes d’Optimisation Non Linéaire avec Contraintes en Tomographie de Réflexion 3D (Page 189-193)