R´ ehabilitation de l’algorithme 3B - Contributions en programmation par contraintes sur interv

Contributions en programmation par contraintes sur intervalles

3.2 R´ ehabilitation de l’algorithme 3B

(Travail en collaboration avec Gilles Chabert, et plus r´ecemment aussi avec Ignacio Araya et Bertrand Neveu ; article repris au chapitre B.)

Nous avons apporté plusieurs améliorations à l’algorithme 3B décrit à la section 2.4.4 (cf. algo-rithme 2 page 33). Celles décrites à la section 3.2.4 relèvent de détails d’implémentation qui ont une incidence sur les performances ; les autres sont plus importantes. Ces améliorations seront

a la base des trois algorithmes CID, 3BCID et ACID dont les deux derniers (voire le dernier) remplaceront l’actuel 3B disponible dans la bibliothèque Ibex. Les principales améliorations sont décrites dans l’article [283] quoique plusieurs expérimentations n’y figurent pas. Le travail de contraction permet aussi à 3BCID, par effet de bord, de sélectionner une prochaine variable pertinente à bissecter dans l’arbre de recherche (cf. section 3.2.3), et le critère retenu dans l’implantation courante a légèrement évolué depuis sa publication. L’amélioration décrite à la section 3.2.2 relève en partie d’une perspective à moyen terme qui produira l’algorithme ACID (Adaptive CID).

3.2.1 Disjonction constructive sur intervalles (CID)

La première idée qui nous a motivés à nous intéresser à l’algorithme3Best basée sur ladisjonction constructive, initialement introduite par Pascal Van Hentenryck et al. dans les années 1990 [294]

pour traiter l’extension du mod`ele des CSP aux disjonctions de contraintes. Cette id´ee s’applique

egalement à un domaine fini dans un CSP classique, où chaque domaine peut se voir comme une disjonction de contraintes unaires imposant une valeur parmi les différentes valeurs possibles : x=v1∨...∨x=vi∨...∨x=vs, oùxdésigne une variable discrète etv1, ..., vssont les différentes valeurs du domaine. Le principe de cette disjonction constructive de domaine a des similarités avec celui du rognage utilisé dans la3B :

1. Chaque valeur v_i est assignée à x à tour de rôle, les autres étant temporairement sup-primées. On applique un algorithme de filtrage au sous-problème Px=vi correspondant.

2. Une fois cette boucle terminée, pour ne pas provoquer d’explosion combinatoire, l’espace de recherche est remplacé par l’uniondes différents espaces de recherche obtenus pour chaque sous-problème. Autrement dit, une valeurvi est définitivement supprimée du domaine de x si elle est enlevée par sous-filtrage dans chacun des sous-problèmes.

Cette idée peut s’appliquer presque directement à un domaine continu en divisant un intervalle en stranches, comme l’illustre la figure 3.2.1. L’exemple en deux dimensions montre un découpage ens= 4 tranches sur [x]. A chaque tranchei, une contraction sur le sous-problème, par exemple avec HC4, conduit à la boˆıte contractée [Bi]. La contraction finale obtenue par construction disjonctive sur intervalles (en anglais : CID) est l’enveloppe de {[B₁], ...,[B₄]} (le rectangle en pointillés).

Cette procédure appliquée à un intervalle est appelée VarCID et peut remplacer VarShaving dans l’algorithme 2, page 33.VarCIDest paramétré par un nombre de tranchess_cid traitées pour chaque variable. Elle a le même coût dans le pire cas que VarShaving (le coût de l’enveloppe

3.2. R´ehabilitation de l’algorithme 3B 49

B

₃

B

₂

x

etant négligeable devant les appels au sous-contracteur), mais peut apporter une contraction potentiellement dans toutes les dimensions. Notons que le nombre d’itérations dans VarCID peut être strictement inférieur às_cid si l’enveloppe courante des boˆıtes [B_i] (calculée donc au fur et à mesure) est égale à la boˆıte initiale sur toutes les autres variables que x.

Cette dernière remarque m’a conduit à la variante3BCIDqui est le contracteur généraliste utilisé par défaut par Ignacio Araya, Bertrand Neveu et moi depuis plusieurs années pour son efficacité.

L’algorithme 3BCID utilise une procédure Var3BCID qui est une hybridation de VarShaving et de VarCID. Elle est paramétrée par une précision relative _inner (pour la partie rognage) et par un nombre de tranchesscid (pour la partie CID). Le principe est décrit ci-dessous et illustré par la figure 3.3 :

1. L’intervalle [x] est d’abord rogné à gauche et à droite par un processus de rognage pa-ramétré par inner. La seule différence est que nous conservons les deux premières boˆıtes [B_g] (à gauche) et [B_d] (à droite) qui ne sont pas exclues par le sous-contracteur.

2. L’intervalle restant [x]⁰est alors découpé en au pluss_cidtranches de diamètre égal, qui sont traitées par le sous-contracteur (voir plus haut). La procédure VarCIDrenvoie l’enveloppe [Bhull] desscid boˆıtes contractées.

3. On retourne finalement l’enveloppe de [Bg], [Bhull] et [Bd].

3BCID est le fruit de l’expérimentation de quelques dizaines de variantes de CID, dont deux seulement s’avèrent être aussi efficaces que3BCID.3BCIDa été retenu pour sa simplicité.

3B:

[x]’

CID:

Fig. 3.3 – Travail de 3BCIDsur une variable (Var3BCID)._inner vaut 10% ets_cid vaut 1.

Le paramétrage par défaut de3BCIDsouligne une petite déception : inner est fixé à 10%, mais s_cidest fixé à 1, ce qui conduit à un seul appel supplémentaire lié à la partie CID et à l’enveloppe de 3 boˆıtes seulement. Choisir s_cid = 1 a certes un impact significatif sur les performances par rapport à l’algorithme3B(scid = 0), mais augmenter encorescidest très souvent contre-productif, sauf pour quelques instances avec un grand nombre de variables commeMechanism [222]. Cette observation empirique souligne que CID ne contracte pas beaucoup plus que 3B, mais atteint un point quasi-fixe plus vite, à cause de la contraction en plusieurs dimensions de VarCID.

Autrement dit, s’il est certain que CID contracte mieux que 3B en th´eorie, le gain en pratique semble ˆetre souvent marginal.

3.2.2 Quelles variables rogner

L’obtention de la propriété théorique (3B-consistance) justifie l’utilisation de la boucle extérieure repeat (cf. algorithme 2, page 33) et du paramètre outer contrôlant l’arrêt de cette boucle pour atteindre un point quasi-fixe. Après maintes expérimentations cherchant à trouver un critère adaptatif de relance de l’itération suivante, je me suis rendu compte que les performances optimales étaient souvent atteintes en une seule itération, voire moins ! C’est-à-dire qu’il ne faut pas raisonner en nombre d’itérations sur toutes les variables, mais en nombre n⁰ de variables

a rogner au total, ce nombre étant souvent inférieur ou égal au nombre n de variables dans le système.

Une première amélioration revient donc à supprimer cette boucle extérieure, ainsi que le pa-ramètre correspondant _outer, et à lancer la boucle intérieure sur n⁰ variables (à tour de rôle si n⁰ > n),n⁰ étant un paramètre utilisateur fixé par défaut à n.

Une amélioration plus ambitieuse consiste à régler de manière adaptative le paramètre n⁰

c’est-`

a-dire automatiquement et dynamiquement pendant la recherche combinatoire. Si les critères présentés à la section suivante ne sont pas pertinents pour déterminern⁰, les heuristiques de choix de bissection “intelligentes” semblent prometteuses, en particulier la très reconnue heuristique utilisant la fonction smear [167] basée sur le diamètre des intervalles courants et la valeur des dérivées partielles (reflétant l’impact d’une variable dans une fonction). Cela s’explique intuiti-vement par le fait que le rognage peut se voir comme une bissection polynomiale et repose aussi sur la diminution artificielle de la taille des intervalles pour limiter le problème des occurrences multiples et pour accroˆıtre le nombre de fonctions continues dans la boˆıte courante.

Pour résumer l’algorithme ACID (AdaptiveCID), il s’agit de l’algorithme3BCID où le nombren⁰ d’appels à Var3BCID n’est pas connu à l’avance : après chaque appel à Var3BCID, on estime si on a atteint un point quasi-fixe en termes de gain en contraction (périmètre des boˆıtes) sur les derniers appels. Dans le cas contraire, la fonction smearpermet de sélectionner la prochaine variable à rogner. Ainsi, en plus des paramètres de son sous-contracteur (notamment HC4 ou Mohc), ACID ne gère que deux paramètres utilisateur : le ratio inner et le nombre de tranches s_cid. De plus, la valeur par défautinner = 10% est robuste (les espoirs de gain d’un réglage fin sont faibles) et la valeurs_cid= 1 est très robuste (espoirs très faibles).

3.2. Réhabilitation de l’algorithme 3B 51 3.2.3 Heuristique de choix de variable à bissecter basée sur CID

En plus de sa vitesse élevée de convergence vers une boˆıte quasi-fixe, la disjonction construc-tive sur intervalles permet de fournir une heuristique efficace de choix de prochaine variable à bissecter.

Le principe consiste à calculer un ratioratioCID[i]pour chaque variable rognée et à sélectionner la variable x_i qui possède le ratio le plus petit. Le critère simple retenu actuellement pour 3BCIDest quelque peu différent de celui décrit dans [283]. Il semble pertinent même quand scid

vaut 1. Pour la variable xi, soit [B_gⁱ], [Bⁱ_d] les boˆıtes renvoy´ees par le processus de rognage et [B₁ⁱ], ...,[B_sⁱ_cid] les boˆıtes contract´ees par la construction disjonctive sur intervalles. On calcule :

ratioBis[i] = Perim([B_gⁱ]) +Perim([B_dⁱ]) +Pscid

j=1Perim([B_jⁱ]) (s_cid+ 2)×Perim(Hull([B_gⁱ],[B_dⁱ],[B₁ⁱ], ...,[B_sⁱ_cid]))

Ce ratio quantifie en quelque sorte la perte en “taille” de boˆıte causée par l’enveloppe effectuée parVar3BCIDpour éviter l’explosion combinatoire. Si le ratio est très petit, cela signifie qu’une grande partie du travail de contraction obtenu dans chaque boˆıte [B_gⁱ], [B_dⁱ], [B₁ⁱ], ...,[Bⁱ_s_cid] est perdue par l’opérateur d’enveloppe et qu’il vaudrait mieux à la place effectuer un “vrai”

point de choix sur ces boˆıtes. Le fait qu’une bissection s’effectue en coupant l’intervalle en deux sous-intervalles, et non pas s_cid+ 2, ne semble rien enlever en pratique à la pertinence du critère donné ci-dessus. Les expérimentations montrent que cette heuristique de choix de variable (à bissecter) est un peu meilleure que les heuristiques à tour de rôle et plus large domaine d’abord. L’heuristique semble de plus être relativement robuste, c’est-à-dire qu’elle provoque moins souvent d’explosion combinatoire que ses concurrentes. Elle est en revanche probablement un peu moins efficace que la fonction smearquoique nous n’ayons pas effectué de comparaisons systématiques entre les deux heuristiques.

3.2.4 Gestion des tranches dans la proc´edure VarShaving

L’algorithme 3B décrit dans la littérature [186] utilise un paramètre _inner qui est un nombre fixe de flottants. Le paramètre implanté dans les outils existants est un diamètre d’intervalle absolu (taille fixe). Nous proposons un paramètre inner qui est un pourcentage de la taille des intervalles, autrement dit, dont l’inverse est un nombre fixé de tranches pour chaque intervalle traité par VarShaving. Ce détail d’implémentation permet de bien mieux contrôler l’effort de rognage indépendamment du diamètre de l’intervalle traité, et on a observé que le rognage d’un petit intervalle peut parfois entraˆıner la contraction de domaines plus larges. Si l’on veut continuer à spécifier une référence absolue, mieux vaut ajouter un autre paramètre permettant de ne pas déclencher le processus de rognage quand l’intervalle excède le diamètre spécifié (par défaut sous la précision des solutions).

Un autre aspect est la manière de découper les tranches dans la procédure de rognage. La littérature utilise un processus dichotomique, généralement par tranches de taille décroissante, et parfois par tranches de taille croissante, c’est-à-dire en partant de la borne avec une petite tranche de diamètre ^Diam([x])

inner , comme dans l’outil ALIAS [201]. Nous proposons en fait une technique de

découpage hybride dépendant de la valeur du paramètre inner. Un simple découpage linéaire en tranches de taille ^Diam([x])

inner est effectué quand la précision demandée (_inner) n’est pas trop grande, le processus dichotomique étant réservé aux précisions fines demandant la création de nombreuses tranches.

3.2.5 3B : l’algorithme sous-estim´e

Autant HC4 (ou l’algorithme 2B) a réussi à faire consensus dans les communautés d’optimisa-tion globale et d’analyse par intervalles, autant l’algorithme3B reste méconnu. Pire encore, 3B ne fait même pas consensus au sein de la mini-communauté de programmation par contraintes sur intervalles. En fait, seuls deux sous-groupes de l’équipe COPRIN de manière relativement indépendante rapportent des résultats expérimentaux montrant la supériorité de l’algorithme 3B : les roboticiens (Jean-Pierre Merlet, David Daney) avec ALIAS et les informaticiens (Igna-cio Araya, Gilles Chabert, Bertrand Neveu et moi) avec Ibex. Le sentiment des informati-ciens de COPRIN repose sur de nombreuses expérimentations sur la plupart des instances z´ ero-dimensionnelles de la page Web de COPRIN [204]. Pour résumer,Box, en tout cas l’algorithme BC4 implanté dans Ibex ou l’algorithme Polybox présenté plus loin, ne semble pas concur-rentiel par rapport à 3BCID(HC4). Pour confirmer nos premières expérimentations, il faudrait comparer 3BCID(HC4) à des versions avancées de Box, développées notamment à Nantes [104].

Nous sommes aussi relativement confiants pour affirmer qu’un schéma de résolution basé sur HC4 (+ Newton) n’est généralement pas concurrentiel par rapport au même schéma utilisant 3BCID(HC4), comme le suggère l’annexe C.

Même si nos résultats étaient trop optimistes ou biaisés par un jeu de tests insuffisant, le mi-nimum serait de doter de 3BCID tous les outils de résolution disposant de HC4 (ou d’un autre algorithme de 2B) ou deMohc décrit ci-après.

3.3 Mohc : un algorithme de propagation de contraintes

Dans le document Résolution de systèmes d'équations : l'essor de la programmation par contraintes sur intervalles (Page 48-52)