Autres contributions - Contributions en programmation par contraintes sur intervalles

Contributions en programmation par contraintes sur intervalles

3.4 Autres contributions

3.4.1 PolyBox : un algorithme de Box utilisant les fonctions extrˆemes

(Travail en collaboration avec Yves Papegay, Gilles Chabert et Odile Pourtallier ; résumé accepté et présenté à SCAN 2008 [286] ; article court soumis et accepté à CP 2010 [287].)

Motivation

Rappelons d’abord que la procédureBoxNarrowdu contracteurBoxtravaille sur une paire (f, x), c’est-à-dire avec une contrainte univariéec_[Y_]:f_[Y_](x) =f(x,[y₁], ...,[y_a]) = 0, où chaque occur-rence des variablesY def autre quexest remplacée par son intervalle courant (cf. section 2.4.3).

BoxNarrowcontracte [x] en un nouvel intervalle [l, r] oùlest le zéro le plus à gauche def_[Y_](x) = 0 etr est le zéro le plus à droite. Un défaut de cette procédure est de parfois converger lentement pour trouverl etr du fait que f_[Y_] est une fonction intervalle, “épaisse”.

L’idée derrière PolyBox consiste à transformerf_[Y_] en une nouvelle forme analytique g_[Y_] telle que les fonctions extrêmes g_[Y_] etg_[Y_] de g_[Y_] peuvent être extraites rapidement. On définit les fonctions extrêmes comme suit :

– Fonction minimale :g_[Y_]= min_Y_s_∈[Y_]f(Y_s, x) – Fonction maximale :g_[Y_]= max_Y_s∈[Y]f(Ys, x)

Les fonctions extrêmes sont tout simplement les courbes qui encadrent la fonction intervalle de la figure 2.2, page 32. Les travaux de Odile Pourtallier sur les polynômes dans l’équipe COPRIN ont eu comme effets de bord positifs d’identifier une forme “développée” favorable à l’extraction des fonctions extrêmes :

g_[Y_](x) =

i=k

i=0

fi([Y])×hi(x) o`u :

– h_i(x) d´epend seulement de x, et non pas de Y.

– h_i(x) a un signe qui ne change pas “trop souvent” comme :xⁱ (i entier),log(x),e^x.

Dans ce cas en effet, g_[Y_](x) and g_[Y_](x) sont des fonctions par morceaux avec des coefficients ponctuels pris aux bornes desfi([Y]), c’est-`a-dire dans{f_i([Y]), fi([Y])}.

Notre première implémentation dansIbex se limite aux polynômes. f_[Y_](x) est un polynôme et g_[Y_](x) =Pi=d

i=0fi([Y])×xⁱ,détant le degré du polynôme. Notons que si iest pair alors xⁱ est positif. Si iest impair alors le signe de xⁱ peut changer une seule fois en x= 0.

Consid´erons par exemple f(x,{y, z}) = (y +z) ×x² + (2yz) ×x+sin(z) et g_{[y],[z]}(x) = [−2,3]x²+ [−4,−2]x+ [−1,1]. Les fonctions extrˆemes sont alors :

– x≥0 :g_{[y],[z]}(x) = 3x²−2x+ 1

– x≤0 :g_{[y],[z]}(x) = 3x²−4x+ 1

– x≥0 :g_{[y],[z]}(x) =−2x²−4x−1

3.4. Autres contributions 61

– x≤0 :g{[y],[z]}(x) =−2x²−2x−1

L’id´ee principale est de produire une variante deBoxNarrow, appel´eepolyBoxRevisequi travaille avec ces fonctions ponctuelles.

L’algorithme PolyBox

Le cœur de la procédurePolyBoxRevisedétermine un intervalle [l, r] obtenu par contraction de [x]. Sans perte de généralité, détaillons le principe de détermination de la borne gauche l.

Une première étape triviale détermine avec quelle fonction extrême travailler. Trois cas peuvent se présenter :

1. Sig_[Y_](x)≤0 et 0≤g_[Y_](x) : l=x (pas de contraction).

2. Sig_[Y_](x)>0 : on travaille avecg_[Y_]. 3. Sig_[Y_](x)<0 : on travaille avecg_[Y_].

Le cas 2 (ou 3) est intéressant et requiert un dernier test du degré du polynôme.

Si le degré dde g_[Y_] est supérieur à 4 (dans notre implémentation : d≥4), alors la plus petite racine l de g_[Y_](x) = 0 dans [x] est calculée avec la procédure BoxNarrow (ou LeftNarrow) classique, la différence étant que la convergence est plus rapide puisque la fonction est ponctuelle.

Si au contraire d≤ 4 (dans notre implémentation : d < 4), alors on calcule toutes les racines réelles de manière analytique/formelle et on retourne la plus petite solution dans [x]. Le cas d= 2 est trivial et fait appel aux souvenirs de collège ou lycée. Il faut simplement veiller à rendre les évaluations successives conservatives, à cause des problèmes d’arrondis sur les flottants, en prenant initialement un intervalle dégénéré autour de chaque coefficient.⁵ Le casd= 3 est plus compliqué et il fallu quelques heures et la polyvalence de mon collègue Yves Papegay pour choisir la célèbre méthode de Cardano et la transformer en une procédure informatique.

Au final, nous proposons une procédurePolyBoxRevisebâtie sur le modèle de l’algorithmeBox nantais, appelé BC4 [28]. Si f_[Y_](x) ne contient pas d’occurrence multiple de x, la procédure fait un simple appel àHC4-Revise (comme BC4). Dans le cas contraire,Mathematicaessaie de transformer f_[Y_](x) eng_[Y_](x) =Pi=d

i=0fi([Y])×xⁱ. Quatre cas peuvent se pr´esenter : 1. Mathematica´echoue, ce qui signifie quef_[Y_] n’est pas polynomiale :

la proc´edure fait un simple appel `aBoxNarrow(ouHC4-Revisedans une version hybride).

2. g_[Y_](x) contient une seule occurrence de x : HC4-Reviseest appliqu´ee `a g_[Y_](x).

3. g_[Y_](x) a des occurrences multiples et d <4 :

d´etermination analytique de la plus petite racine de g_[a](x) = 0.

4. g_[Y_](x) a des occurrences multiples et d≥4 :

d´etermination num´erique (avec BoxNarrow) de la plus petite racine deg_[Y_](x) = 0.

5La version intervalles de la détermination des solutions réelles souligne le raisonnement ensembliste permis par les intervalles. Il suffit en effet de tester que la racine carrée du discriminant est “vide” (au sens inter-valle/ensembliste) pour détecter l’absence de solutions réelles.

Remarques

Le deuxi`eme cas ci-dessus s’illustre par exemple sur l’une des ´equations de l’instanceCaprasse :

−2x+ 2txy−z+y²z= 0 queMathematicaréécrit sous la forme :x(−2 + 2ty) + (−1 +y²)z= 0 (pour la contraction de [x] ou [z]). On voit bien que la forme réécrite a fait disparaˆıtre les occurrences multiples dex etz.

L’utilisation d’un outil de calcul formel a plusieurs vertus. D’abord, la nouvelle forme produite n’est pas à proprement parlée une forme entièrement développée. Il s’agit bien d’une forme développée par rapport àx, mais la procédure de calcul formel cherche au contraire une forme des coefficients f_i([Y]) qui limite les occurrences multiples des variables de Y et donc généralement la surestimation de [f_i]_N([Y]). L’exemple de l’équation dans l’instance Caprasse montre une transformation réussie qui se traduit au final par un gain en temps. Une équation de l’instance 6body montre au contraire une transformation contreproductive de 5(B −D) + 3(b−d)(B + D−2F) = 0 en B(5 + 3(b−d)) + (−5 + 3b−3d)D+ 6(−b+d)F = 0 (pour la contraction de [B] ou [D]) qui augmente la surestimation à cause des occurrences multiples additionnelles des variables a, b et d. Cet exemple souligne que la contraction obtenue au final dépend de la forme utilisée. Si PolyBoxRevise obtient cette contraction rapidement grâce aux fonctions extrêmes (ponctuelles), la contraction obtenue est en revanche incomparable à celle obtenue par BoxNarrow sur la forme initiale. (C’est pourquoi notre implantation ajoute systématiquement au début dePolyBoxReviseun appel àHC4-Revise sur la forme initiale.)

Notons aussi qu’un outil de calcul formel permet de produire une forme spécifique pour chaque paire (f, x) considérée dansPolyBoxRevise.

Comparaison avec la Box de Numerica

Van Hentenryck, Michel et Deville ont également utilisé l’idée des polynômes extrêmes (sans utiliser ce vocabulaire) dans leur outil de résolution à intervalles Numerica. L’idée n’est pas décrite dans leur célèbre livre [293] mais introduite en deux pages dans un article technique [291].

L’intégration de cette idée dans leur outil est sensiblement différente de la nôtre.Numericautilise différentes formes des équations : une forme “naturelle”, une forme de Taylor (pour y appliquer un Newton intervalles sans préconditionnement) et une forme développée qui permet d’utiliser les fonctions extrêmes. Une propagation séparée est lancée sur le système sous forme développée.

PolyBox suit au contraire un schéma proche de BC4 en gérant un unique système avec des procédures de révision adaptées à chaque paire (f, x). Notons queBC4a en quelque sorte oublié les polynômes extrêmes deNumericaet quePolyBox peut donc se voir comme un moyen de les réhabiliter dans un schéma moderne.PolyBoxapporte quelques améliorations par rapport à son prédécesseur dansNumerica :

– Il peut utiliser une forme adaptée à la contraction de chaque variable, alors qu’une forme entièrement développée, par rapport à toutes les variables, entraˆıne souvent une forte sures-timation, ce qui souligne l’intérêt d’utiliser un outil de calcul formel (voir les remarques plus haut).

– CommeBC4,PolyBox utilise aussiHC4-Revise quandx apparaˆıt une seule fois dansf.

3.4. Autres contributions 63 – La résolution analytique des polynômes de bas degré est ajoutée.

R´esultats obtenus

On trouve à l’annexe F des résultats expérimentaux qui montrent des gains intéressants d’une stratégie de recherche basée sur PolyBox+Newton par rapport aux stratégies Box + Newton etHC4+Newton. Malheureusement, à quelques exceptions près,PolyBoxn’est pas concurrentiel avec 3BCID(HC4) et surtout avec 3BCID(Mohc)(voir les commentaires à la section 3.3.7 sur la comparaison entreBoxNarrowetMohcRevise). A cause du coût très peu élevé dePolyBoxRevise quand la contraction est obtenue de manière analytique (polynômes de degrés 2 et 3 dans notre implantation), une idée à retenir peut-être serait de garder uniquement ces procédures comme des contracteurs spécifiques, similaires à des contraintes globales[241, 1, 183], et de les ajouter automatiquement dans une stratégie de recherche.

3.4.2 Domaines repr´esent´es par des unions d’intervalles

(Travail en collaboration avec Gilles Chabert et Bertrand Neveu ; Cf. la th`ese de Gilles Chabert, ainsi que les articles `a SAC 2005 [53] et JFPC 2005 [54])

La motivation de ce travail est d’essayer de réduire les domaines des variables non pas seulement sur les bornes, mais aussi à l’intérieur, dans les “trous”, en gérant non pas de simples intervalles mais des domaines représentés par des unions d’intervalles. Un algorithme de propagation de contraintes qui travaillerait avec des unions d’intervalles et essaierait de calculer l’arc-cohérence du système pourrait malheureusement parfois générer une infinité d’intervalles dans les domaines dans un modèle théorique sur les réels. En utilisant les nombres flottants, cela signifie qu’un algorithme de propagation pourrait générer très rapidement un nombre d’intervalles dans les domaines égal au nombre de flottants. Un exemple dû à Chabert et soulignant cette explosion est illustré à la figure 3.6. Il est formé des deux contraintes c1 :x = y et c2 : (³₄(x−5)²) = y dans la boˆıte [1,9]×[1,9].

La première projection sur x de la contrainte c2 (avec TAC-Revise, la variante combinatoire de HC4-Revise qui ne calcule pas d’enveloppe) produit un premier “trou” dans [x]. La pro-jection sur y de c1 produit un trou dans [y], etc. On obtient ainsi, au bout de k itérations, des unions d’intervalles contenant 2^k intervalles. C’est précisément ce que calcule l’algorithme de Hyvönen [140] en effectuant un point de choix à chaque découpage naturel, c’est-à-dire au niveau d’un trou découvert dans une projection. Nous avons proposé deux algorithmes de propa-gation de contraintes permettant d’éviter cette explosion combinatoire en pratique et permettant de calculer une consistance partielle plus forte que l’arc-cohérence.

Algorithme I-coh´erence globale (IGC)

L’idée derrière IGC consiste à enrichir la structure d’union d’intervalles en étiquetant chaque intervalle avec une information indiquant sur quelles boˆıtes arc-cohérentes il prend support. Cette vue macroscopique est mise en œuvre par un ensemble d’étiquettesattachées à chaque intervalle

Fig. 3.6 – Filtrage sur des unions d’intervalles

et propagées au fil des projections. Illustrons ce principe sur notre exemple. Lors de la première projection sur x (quadrant en haut à droite), IGC attache l’étiquette x⁻ (correspondant à la projection−√

) à l’intervalle le plus petit et l’étiquettex⁺(correspondant à la projection +√ ) au plus grand. Lors de la première projection sur y (quadrant en bas à gauche), l’intervalle le plus petit dey “hérite” de l’étiquettex⁻, alors que l’intervalle le plus grand hérite dex⁺. Ainsi, la situation décrite dans le quadrant en bas à droite ne peut pas se produire. L’intervalle de x le plus petit est éliminé car il est étiquetéx⁻ mais provient d’une projection d’un intervalle de yétiqueté x⁺, ce qui est contradictoire. Le troisième intervalle de xest également éliminé car il est étiqueté x⁺ alors qu’il provient d’une projection de yétiquetéex⁻.

Les étiquettes permettent ainsi de maintenir au fil des projections l’ensemble des intervalles qui sont compatibles entre eux. Cette vue macroscopique permet d’éliminer simplement les faux supports, c’est-à-dire les intervalles qui ne forment pas une clique dans cette structure supplémentaire (d’où le terme de cohérence globale - au niveau macroscopique - dans le nom de l’algorithme). L’implantation de l’algorithme correspondant fait appel à une structure so-phistiquée, apparentée au BDD de Bryant [44], qui permet de stocker de manière concise pour chaque variable un ensemble d’étiquettes compatibles entre elles. Chaque projection consulte alors cette structure pour éliminer parfois un intervalle donné du domaine de la variable consi-derée. Cet algorithme est limité aux systèmes polynomiaux (pour lesquels il suffit de gérer deux parties monotones), mais est théoriquement extensible aux systèmes quelconques en gérant un nombre arbitraire de parties monotones, lors d’une projection d’une fonctionsinus par exemple.

IGC calcule une consistance partielle plus forte que l’arc-cohérence du système ternarisé, ce qui est une contribution académique appréciable. L’explosion combinatoire liée à ces faux supports

3.4. Autres contributions 65 est effectivement maˆıtrisée en pratique. En théorie, en utilisant les slogans à la mode, on peut considérer cet algorithme comme un algorithme à paramètres fixes (fixed-parameter algorithm), c’est-à-dire qu’il troque un facteur exponentiel en le nombre de flottants (qui produit parfois une explosion en pratique) contre un facteur exponentiel en le nombre de fonctions élémentaires pouvant créer un trou. Même si nous n’avons pas observé d’explosion liée à ce dernier facteur, le surcoût du maintien de la structure de données sophistiquée ne rend pas l’approche concur-rentielle avec l’algorithme suivant.

Algorithme Lazy BoxSet

Pour le décrire simplement, Lazy BoxSet peut se voir comme l’assemblage d’une variante de l’algorithme de 2B-cohérence (commeHC4) et d’une stratégie de découpagenaturelqui s’applique sur un domaine formé d’une union d’intervalles dans un trou entre deux intervalles consécutifs.

Trois ´etapes principales constituent cet algorithme :

1. L’algorithme HC4est d’abord appelé. L’algorithmeHC4 est en fait modifié, sans pratique-ment aucun surcoût, de manière à mémoriser une contrainte susceptible de produire un trou.

2. Une fois le point-fixe de HC4 atteint, cette contrainte est alors trait´ee par l’algorithme TAC-Revise, la variante combinatoire deHC4-Revise (cf. section 2.4.3).

3. Le branchement suivant dans l’arbre de recherche effectue alors un d´ecoupage naturel sur l’une de ces variables.

Ce processus est itéré jusqu’à l’obtention en chaque feuille de cet arbre d’une boˆıte arc-cohérente.

Vue comme une consistance partielle, la propriété obtenue est plus forte que l’IGC-cohérence.

Autrement dit, l’ensemble des feuilles arc-cohérentes (obtenu par Lazy BoxSet) est plus restreint que l’ensemble des boˆıtes obtenues par produit cartésien des domaines (union d’intervalles) IGC-cohérents.

Un algorithme similaire àLazy Box-seta été obtenu (par des voies différentes) par Heikel Batnini dans sa thèse [22, 23].

Les premiers résultats expérimentaux de Chabert comme de Batnini sont décevants. Si Lazy Box-set ne produit pratiquement aucun surcoût, les exemples de gain produits par le découpage naturel restent à identifier. Les gains sont généralement marginaux voire négatifs puisque le découpage naturel empêche en quelque sorte l’utilisation d’une autre heuristique de choix de variable. Dans les rares cas d’amélioration sensible, il semble que cela soit dû à un choix précoce d’une seule variable qui permette de résoudre rapidement le problème indépendamment des trous dans son domaine, bref à un heureux effet de bord. Pourtant une étude plus exhaustive mériterait d’être menée, simplement à cause d’une perspective possible liée à l’algorithmeMohc (introduit à la section 3.3).

Perspective : une variante de Lazy BoxSet en amont de l’algorithme Mohc ?

Une variante de Lazy BoxSet permettrait d’augmenter les cas de monotonie que Mohc pourrait exploiter. Lors de la projection d’une fonction élémentaire, il suffirait de mettre dans le domaine du nœud correspondant l’union dechaqueintervalle correspondant à une partie monotone de la fonction. (La version actuelle peut rassembler en un seul intervalle non monotone deux parties monotones qui sont simplement continues sur l’intervalle englobant.) Un découpage naturel augmenterait alors les cas de monotonie que l’algorithme de contractionMohcpourrait exploiter.

Cette idée séduisante mérite approfondissement mais ne me paraˆıt pas prometteuse à première vue. Un découpage naturel sur les variables comme sur les nœuds intermédiaires est en effet coûteux et calcule une propriété bien trop forte. Pour obtenir une fonction monotone, il n’est en effet pas nécessaire d’obtenir la monotonie sur tous ses opérateurs élémentaires (les nœuds intermédiaires)...

3.4.3 Ibex

Interval-Based EXplorer est un outil de résolution de systèmes de contraintes utilisant des méthodes à intervalles [52, 50]. Ibex est essentiellement l’œuvre de Gilles Chabert qu’il a com-mencée pendant sa thèse (appelée alorsIcosAlias). Après sa thèse, Chabert a fait de Ibexune bibliothèque libre et invite depuis les contributeurs à se joindre à cette micro-communauté. Lors de son post-doctorat avec Luc Jaulin à Brest, il a également produit avec celui-ci une couche au dessus deIbex, nomméeQuimper, qui masque la hiérarchie de classes et offre un petit interprète et une interface graphique facilitant l’accès de l’outil aux utilisateurs non informaticiens issus de l’ingéniérie (physique, automatique, robotique, traitement du signal, etc). Bertrand Neveu et moi-même sommes responsables des algorithmes de programmation par contraintes inclus dans Ibex et, avec Ignacio Araya, utilisons Ibex pour développer l’ensemble de nos méthodes à in-tervalles. Nous participons également aux discussions sur l’architecture générale et la hiérarchie de classes.

Cette bibliothèque en C++ permet de trouver l’ensemble des solutions d’un système mais ne permet pas (encore) d’optimiser une fonction objectif. En plus d’un système classique, Ibex permet de définir facilement un système quantifié contenant des paramètres existentiels ou uni-versels ou de générer des boˆıtes intérieures (ne contenant que des solutions). L’arithmétique des intervalles est mise en œuvre par la bibliothèque BIAS/PROFIL (corrigée). Ibex a comme priorités la flexibilité, afin de facilement piloter les différentes briques algorithmiques incluses, et l’extensibilité. En particulier, une liste de contracteurs (de boˆıtes intérieures ou extérieures) est appliquée entre chaque branchement. Cela permet, entre autres, de mettre en œuvre des sous-systèmes filtrants qui me semblent importants en pratique. Similaires à des contraintes globales [241, 1, 183], ces contracteurs filtrent un sous-système (déterminé manuellement ou automatiquement) à l’aide d’un algorithme dédié et propagent les réductions obtenues dans le reste du système. Un exemple d’application est l’algorithme Box-kdécrit au chapitre J.

Un autre atout de Ibex est sa robustesse, c’est-à-dire une absence de perte de solution en utilisant les contracteurs présents dans la distribution actuelle (à ma connaissance).Ibexpossède

3.5. Perspectives 67

egalement des limites, notamment la non-utilisation de briques de programmation linéaire fiable, comme dans l’algorithmeQuad deIcos[183]. Soulignons aussi, contrairement à ALIAS [201], la non-utilisation des dérivées secondes des fonctions qui permettraient une évaluation plus fine des dérivées premières et l’appel à d’autres algorithmes d’analyse numérique, comme Kantorovitch.

Pour conclure,Ibexa été et demeure toujours un outil indispensable pour développer la plupart des méthodes à intervalles décrites dans ce mémoire. Certains choix d’architecture et la hiérarchie de classes maintenant plus stable méritent dorénavant d’être présentés à la communauté. L’ar-chitecture d’Ibexest aujourd’hui suffisamment mûre pour que des spécialistes enrichissent cette bibliothèque. Ibex a le potentiel pour fédérer une partie des contributions sur les méthodes à intervalles, notamment celles issues de PPCI et des applicatifs (cf. sections 2.7 et 2.9). La section suivante placeIbexdans un cadre plus large et souhaitable d’évolution des logiciels de résolution de systèmes de contraintes.

3.5 Perspectives

En plus des perspectives à court terme mentionnées dans les sections correspondantes, les para-graphes suivants donnent quelques perspectives de recherche à plus long terme.

Apports de la PPCI

Dans les années 1960 et 1970, la communauté d’analyse par intervalles proposait schématiquement un modèle de résolution comprenant entre chaque point de choix un appel à un test d’existence basé sur la monotonie et un appel à un Newton intervalles. La communauté de programmation par contraintes a proposé notamment d’ajouter à ce schéma le contracteur HC4ou Box(parfois 3B).

Notre première contribution en PPCI est de proposer un schéma sensiblement différent, à savoir :

Dans le document Résolution de systèmes d'équations : l'essor de la programmation par contraintes sur intervalles (Page 60-73)