Probl` eme de satisfaction de contraintes : CSP

Les probl` emes CSP, #CSP et WCSP

2.2 Probl` eme de satisfaction de contraintes : CSP

Le problème de satisfaction de contraintes (CSP) est suffisamment expressif et général pour pouvoir avoir des domaines d’application très vastes comme l’ordonnancement de tâches avec ou sans ressources, l’élaboration d’emplois du temps, la planification, la confi-guration, le raisonnement, la résolution des jeux et de nombreux autres problèmes réels ou académiques. La brique de base à l’origine de sa puissance est la notion de contrainte. Une contrainte est un critère ou une propriété portant sur certains objets appelés va-riables et les mettant en relation. Cette contrainte limite les valeurs que peuvent prendre simultanément ces variables. Ces valeurs sont sélectionnées parmi l’ensemble des valeurs possibles d’une variable appelé, son domaine. Le but du problème est d’attribuer à chaque variable du problème une valeur de son domaine de sorte que toutes les contraintes soient satisfaites, c’est-à-dire que, pour chaque contrainte, les valeurs de ses variables sont com-patibles vis-à-vis de la propriété qu’elle définit. La place que ce problème occupe à la fois en intelligence artificielle et en recherche opérationnelle est dûe à la grande variété de types de contraintes existantes algébriques, temporelles, géométriques. . . Cela lui offre un pou-voir de modélisation important. Le problème le plus connu parmi les problèmes associés `

a une instance CSP consiste à dire si une telle attribution de valeurs est possible. Il s’agit d’un problème de décision qui est NP-complet. C’est ainsi le prix à payer pour avoir ce niveau d’expressivité. Heureusement, ce problème admet, de nos jours, des méthodes de résolution efficaces grâce à l’essor qu’il a connu ces 40 dernières années. Nous regardons ainsi, de plus près, ce problème dans cette partie.

2.2.1 Formalisme

Nous donnons maintenant la d´efinition formelle d’une instance du probl`eme de satis-faction de contraintes (CSP) [Montanari, 1974].

Définition 32 Une instance du problème de satisfaction de contraintes CSP est définie par la donnée d’un triplet P = (X, D, C) où :

• X = {x1, x₂, . . . , x_n} est un ensemble de n variables,

• D = {Dx1, D_x₂, . . . , D_x_n} est un ensemble de domaines finis tel que chaque Dxi

• C = {c1, c₂, . . . , c_m} est un ensemble de m contraintes. Chaque contrainte ci est un couple (S(ci), R(ci)) o`u :

– S(c_i) = {xi1, x_i₂, . . . , x_i_q} ⊆ X est la port´ee de ci avec |S(ci)| l’arit´e de la contrainte ci,

– R(c_i)⊆ Dx_i1 × Dx_i2 × · · · × Dx_iq est sa relation de compatibilit´e.

L’arité maximale des contraintes r est égale à maxci∈C|S(ci)|. La taille maximum des domaines d est max_x_i∈X|Dxi|.

Les instances CSP considérées dans cette thèse sont dites normalisées.

Définition 33 [Apt, 2003; Bessiere, 2006] Une instance CSP P est dite normalisée ssi il n’existe pas deux contraintes différentes c_i et c_j dans C telles que S(c_i) = S(c_j).

Une instance CSP peut ˆetre binaire ou n-aire.

Définition 34 Une instance CSP est dite binaire si l’arité de chaque contrainte c_i ∈ C est égale au plus à 2. Si l’arité d’une contrainte est supérieure à 2, l’instance CSP est dite n-aire.

Notons qu’une contrainte portant uniquement sur deux variables est dite binaire. Une contrainte binaire portant sur les variables xi et xj sera not´ee cij. Au contraire, une contrainte dont la port´ee contient plus que deux variables est dite n-aire.

Les relations associées à ces contraintes peuvent être représentées en extension ou en intention. Pour représenter la relation d’une contrainte en extension, les tuples des va-leurs autorisés (supports) ou interdits (conflits) sont énumérés. Par exemple, (X, D, C) avec X = {x1, x₂}, D = {{1, 2}, {1, 2}} et C = {c1 = ({x1, x₂}, {(1, 1), (2, 1), (2, 2)})} est une instance CSP contenant une seule contrainte c1 dont la relation est exprimée en extension. Il s’agit de la contrainte ≪x₁ est plus grand ou égal à x₂ ≫. La même rela-tion peut être représentée en intenrela-tion en utilisant des propriétés mathématiques connues comme le prédicat x1 ≥ x2. Une contrainte exprimée initialement en intention peut être exprimée en extension. En pratique, l’utilisation d’une représentation ou l’autre n’est pas sans conséquences. La représentation des contraintes en extension peut induire des coûts en espace mémoire très importants du fait du nombre de tuples énumérés qui peut être très élevé. Une représentation en intention peut réduire significativement l’espace mémoire re-quis. Le test de satisfaction d’une contrainte par un tuple a, à son tour, un coût en temps différent selon que les contraintes soient représentées en extension ou en intention. Par exemple, Si les contraintes sont représentées en extension, le test de satisfaction se ramène `

a la recherche du tuple dans la table des tuples correspondante. Ce test peut ainsi être fait en temps constant grâce à une implémentation judicieuse. Sinon, ce test consiste à vérifier la formule ou le prédicat en question. Par conséquent, ce coût peut ne pas être constant.

Une contrainte globale est l’une des meilleures représentations d’une contrainte ayant un nombre trop important de tuples. Cette contrainte a une signification implicite. Sa définition telle qu’évoquée dans [Lecoutre, 2013] est :

Définition 35 Une contrainte globale est un modèle de contrainte qui capture des rela-tions ayant une sémantique précise et qui peut impliquer un nombre quelconque de va-riables.

Nous pouvons citer par exemple la contrainte allDifferent qui signifie que toutes les va-riables entrant en jeu doivent imp´erativement avoir des valeurs diff´erentes. Il est facile de

voir que cette contrainte peut porter sur un nombre quelconque de variables. Pour plus d’informations sur les contraintes globales, le lecteur peut se référer à [Beldiceanu et al., 2005; van Hoeve and Katriel, 2006] par exemple.

La structure d’une instance CSP P = (X, D, C) est donn´ee par un hypergraphe appel´e hypergraphe de contraintes, tel que :

• chaque sommet repr´esente une variable de X,

• chaque hyperarête correspond à la portée S(ci) d’une contrainte c_i de C. Notons que, dans le cas d’une instance CSP binaire, l’hypergraphe est un graphe.

Exemple 1 Considérons maintenant l’exemple suivant. Robert est un père de famille qui a 6 enfants. Il dispose des billets de 5, 10, 20 et 50 euros et des pièces de 1 ou 2 euros. Il veut donner de l’argent à ses enfants à raison d’un billet ou d’une pièce par enfant. Comme il est un peu maniaque des mathématiques, il élabore un ensemble de contraintes algébriques pour la distribution de l’argent. Les contraintes expriment des relations algébriques relati-vement simples comme le fait qu’un fils recevra plus d’argent qu’un autre ou que la somme de l’argent de 3 fils devra être inférieure à une somme donnée. Ce problème peut être représenté sous forme d’une instance CSP P comme suit :

• X = {x1, x2, x3, x4, x5, x6}, • D = {Dx1, Dx2, Dx3, Dx4, Dx5, Dx6} avec Dxi ={1, 2, 5, 10, 20, 50}, ∀1 ≤ i ≤ 6, • C = {c1, c₂, c₃, c₄} avec : – c₁= ({x1, x₂}, x2 ≥ x1), – c₂= ({x1, x₅}, 3x1+ x₅> 50), – c3= ({x3, x4, x5}, x3+ x4+ x5< 8), – c₄= ({x4, x₅, x₆}, 2x4+ x₅ = x₆).

Dans cet exemple, X est l’ensemble des 6 enfants avec une variable par enfant. Chaque variable xi peut prendre une valeur parmi les valeurs de Dxi représentant les valeurs des billets et des pièces dont dispose Robert. d est alors égal à 6. Les relations associées aux contraintes sont représentées en intention par des équations et des inéquations. Elles peuvent aussi être représentées par des tables de compatibilité. R(c3) est alors représentée par la table 2.1. Les contraintes c₃ et c₄ portent sur le plus grand nombre de variables (3 variables). D’où, r est égal à 3. Ce problème peut être représenté par l’hypergraphe de contraintes de la figure 2.2 contenant 6 sommets et 4 hyperarêtes.

2.2.2 S´emantique

Maintenant que nous avons défini formellement le problème de satisfaction de con-traintes (CSP), nous allons nous intéresser à sa sémantique.

Une notion pr´eliminaire est la notion d’affectation. On emploie ´egalement les termes d’instanciation ou d’assignation.

Définition 36 Soit P = (X, D, C) une instance CSP. L’ affectation d’une variable x_i de X est l’attribution d’une valeur vi à xi telle que vi ∈ Dxi. Elle est notée xi ← vi. Elle est également définie pour X_⊆ sous-ensemble de X avec X_⊆ = {xi1, x_i₂, . . . , x_i_q}. A est appelée affectation de X_⊆ si elle associe à chaque variable x_i_p de X_⊆ avec 1≤ p ≤ q, une valeur vip ∈ Dx_ip.

R(c₃) : x₃+ x₄+ x₅< 8 x3 x4 x5 1 1 1 1 1 2 1 1 5 1 2 1 1 2 2 1 5 1 2 1 1 2 1 2 2 2 1 2 2 2 5 1 1

Figure 2.1 – La relation associée à la contrainte c₃ donnée en extension (supports).

x1 x₂ x₃ x₄ x₅ x₆ c1 c2 c₃ c₄

Figure 2.2 – L’hypergraphe de contraintes correspondant `a l’instance P .

Une affectationA peut être représentée sous forme d’une association variable/valeur, c’est-`

a-dire : A = {xi1 ← vi1, x_i₂ ← vi2, . . . , x_i_q ← viq} ou simplement comme une séquence de valeurs (v_i₁, v_i₂, . . . , v_i_q). L’ordre des variables de X_⊆ est implicite. Une affectation qui porte sur toutes les variables de X est dite complète, elle est dite partielle sinon. Ainsi, si X_A note l’ensemble de variables sur lesquelles porte l’affectation A, A est dite complète si X_A= X et partielle sinon.

Nous pouvons aussi restreindre l’affectationA `a un sous-ensemble de XA.

D´efinition 37 Soit A une affectation et X⊆ ⊆ XA. La projection de A sur X_⊆, not´ee A[X⊆], est la restriction de A aux variables de X⊆.

Dans l’exemple 1, une affectationA compl`ete de X peut ˆetre : A = {x1← 1, x2 ← 5, x3 ← 50, x₄← 10, x5 ← 20, x6← 50}. A[{x1, x₂}] = {x1 ← 1, x2 ← 5}.

Une contrainte peut être satisfaite, violée ou ni l’un, ni l’autre par une affectation. Définition 38 Soient P une instance CSP et A une affectation donnée. A satisfait la contrainte c_i = (S(c_i), R(c_i)) de C si S(c_i) ⊆ XA et A[S(ci)] ∈ R(ci). Au contraire, A viole ci si S(ci)⊆ XA etA[S(ci)] /∈ R(ci).

Dans l’exemple 1, l’affectation A satisfait la contrainte c1 vu que A[{x1, x₂}] = (1, 5) ∈ R(c1) (5≥ 1) mais viole c2 puisque A[{x1, x5}] = (1, 20) /∈ R(c2) (3.1 + 20 = 23 < 50).

Nous d´efinissons maintenant la notion d’affectation coh´erente.

Définition 39 Étant donnée une instance CSP P = (X, D, C), une affectation A d’un sous-ensemble de variables de X est cohérente ssi :

∀ci∈ C telle que S(ci)⊆ XA, A satisfait ci.

En d’autres termes, une affectation est cohérente si elle ne viole aucune contrainte. La vérification de la cohérence d’une affectation s’effectue en temps polynomial.

Cette définition nous mène à la définition d’une solution d’une instance CSP.

Définition 40 Une solution d’une instance CSP P = (X, D, C) est une affectation complète cohérente. L’affectation satisfait alors toutes les contraintes de P . L’ensemble de solutions de P est noté Sol_P.

Il est à noter que vérifier si une affectation complète est une solution est un problème traitable en temps polynomial. Dans l’exemple 1, l’affectation complèteA spécifiée n’est pas une solution puisqu’elle viole c2. Nous pouvons facilement vérifier dans l’exemple 1 que l’affectationA = {x1 ← 20, x2 ← 50, x3 ← 2, x4 ← 2, x5← 1, x6 ← 5} est une solution du problème.

Finalement, nous d´efinissons une instance CSP coh´erente.

D´efinition 41 Une instance CSP P = (X, D, C) est dite coh´erente ssi Sol_P 6= ∅

Autrement dit, une instance CSP P est cohérente si elle admet au moins une solution et incohérente sinon. L’instance de l’exemple 1 est ainsi cohérente car elle admet au moins une solution.

Une propriété importante sur les affectations est la cohérence globale.

Définition 42 Étant donnée une instance CSP P = (X, D, C), une affectation A sur un sous-ensemble de variables de X est dite globalement cohérente ssi il existe une solution S de SolP telle que A ⊆ S.

Dans l’exemple 1, A = {x1 ← 20, x2 ← 50} est une affectation globalement coh´erente car S = {x1 ← 20, x2 ← 50, x3 ← 2, x4 ← 2, x5 ← 1, x6 ← 5} est une solution de cette instance.

Nous fournissons également la définition de l’équivalence des instances CSP.

D´efinition 43 Deux instances CSP P = (X, D, C) et P^′ = (X^′, D^′, C^′) sont dites ´equi-valentes ssi SolP = Sol^′_P.

D’après cette définition, résoudre P est équivalent à résoudre P′ puisqu’elles ont le même ensemble de solutions. Cette équivalence est d’une grande importance. Grâce à l’équivalence des instances CSP, nous pouvons, pour la résolution de P , considérer le problème P^′ dont la résolution est éventuellement plus simple. Dans l’exemple 1, en constatant que la somme des variables x3, x4 et x5 doit être inférieure à 8, nous pouvons facilement déduire que ces variables ne peuvent pas avoir les valeurs 10, 20 ou 50. Ainsi, la suppression de ces 3 valeurs des domaines D_x₃, D_x₄ et D_x₅ résultent en une nouvelle instance CSP équivalente `

a la première parce qu’elle ne modifie pas l’ensemble des solutions de P . Or, comme la taille des domaines est désormais plus petite, la résolution du nouveau problème est a priori plus simple vu que le nombre d’affectations complètes possibles est plus faible.

• Une instance CSP est elle cohérente ? : il s’agit d’un problème de décision qui est NP-complet,

• Calculer le nombre de solutions, • Rechercher une ou toutes les solutions,

• Trouver un ensemble des valeurs qui figure dans l’ensemble de solutions, • . . .

La difficulté théorique et pratique varie d’un problème à l’autre. Ainsi, dire si une instance CSP possède une solution est sûrement moins difficile que le fait de compter toutes les solutions de cette dernière. Ce fait est constaté en pratique, mais est aussi prouvé en théorie vu que le premier est NP-complet tandis que le deuxième est #P-complet. Dans cette thèse, nous nous intéressons aux questions de l’existence d’une solution et du dénombrement des solutions d’une instance.

2.2.3 Solveurs modernes

La résolution du problème CSP a considérablement évolué durant la dernière décennie. Si nous parlions avant d’une méthode de résolution, aujourd’hui la méthode de résolution employée n’est plus qu’une instanciation possible d’un solveur. Notons d’ailleurs que ce fait peut être facilement constaté dans les compétitions CSP organisées. Les solveurs modernes rassemblent des techniques et des mécanismes diversifiés plus ou moins sophistiqués. Ils témoignent d’une efficacité remarquable, ce qui a permis de mettre en valeur davantage le cadre CSP. Le point de vue nouvellement adopté par certains travaux comme [Puget, 2004; Gent et al., 2006] au sein de la communauté consiste à considérer le solveur comme une boˆıte noire. Selon les partisans de ce point de vue, le principal défi qui se pose à la programmation par contraintes est la simplicité de l’utilisation. L’enjeu ne se limite pas à la résolution de l’instance en question mais s’étend à la modélisation de l’instance elle-même. D’une part, la prise en compte de contraintes hétérogènes a enrichi le cadre CSP et lui a fait gagné en pouvoir de modélisation et en intérêt pratique depuis les années 90. D’autre part, la modélisation d’un problème est devenue plus difficile et pourrait nécessiter une expertise afin de profiter pleinement des algorithmes liés à chaque type de contrainte (les contraintes globales par exemple) [Lecoutre, 2013]. Au-delà de la modélisation, idéalement, l’utilisateur ne doit pas être conscient des techniques et des algorithmes employés pour la résolution de l’instance. Au contraire, seules les entrées et les sorties du solveur lui seront visibles. Il n’est pas ainsi responsable de modifier, d’étendre ou d’adapter le solveur `

a l’instance à résoudre. En effet, un bon solveur est capable de s’adapter à l’instance à résoudre par le biais des techniques sophistiquées qui y sont implémentées. Ce faisant, le solveur permet de compenser les défauts de la modélisation tout en gagnant en robustesse. Par conséquent, l’efficacité du solveur est améliorée. Se rapprocher davantage d’un solveur boˆıte noire, faciliterait son emploi par des non experts ce qui augmenterait potentiellement l’impact de la programmation par contraintes dans le monde industriel et académique.

Dans la suite de cette section, nous examinerons les différents éléments constitutifs d’un solveur montrés dans la figure 2.3. Les principales briques de base sont :

• le type de branchement, • le filtrage,

SOLVEUR filtrage branchement heuristique var/val enregistrement redémarrage retour-arrière structure choix racine heuristique cluster choix décomposition

Figure2.3 – Les principales techniques int´egr´ees dans un solveur.

• les enregistrements,

• les heuristiques de choix de variables/valeurs, • les red´emarrages,

• l’exploitation de la structure.

Nous nous intéressons donc au type de branchement exploité (binaire ou d-aire), aux tech-niques de filtrage éventuellement utilisées en prétraitement et pendant la résolution, et aux retours-arrière chronologiques ou non chronologiques employés. Nous nous focalisons également sur les enregistrements pouvant être réalisés, sur les heuristiques de choix de variables et de valeurs employées et sur les redémarrages qui seront probablement ex-ploités. Finalement, nous nous concentrons sur l’exploitation de la structure à laquelle nous accorderons un intérêt particulier vu que l’objectif principal de cette thèse consiste à améliorer les méthodes structurelles. Malheureusement, les solveurs actuels exploitent

rarement cette brique qui est le plus souvent absente. Sa présence dans un solveur est l’une des ambitions de ce travail. Un algorithme de résolution est une configuration précise de ces différents paramètres.

2.2.4 Résolution dans le cas général

Différentes techniques de résolution du problème CSP ont été développées. Elles peu-vent être classées en méthodes complètes ou incomplètes. Les méthodes complètes ga-rantissent de vérifier l’existence d’une solution ou à en détecter l’absence sinon. Si la méthode n’est pas complète, elle est dite incomplète. Les méthodes incomplètes sont connues par leur efficacité vu qu’elles sacrifient la complétude. Les algorithmes de re-cherche locale [Hoos and Stützle, 2004; Hoos and Tsang, 2006] sont qualifiés d’incomplets. Ils permettent généralement de trouver une solution dans un≪temps raisonnable≫, mais ne permettent pas d’en déduire l’absence. Dans cette thèse, nous nous intéressons unique-ment aux méthodes complètes.

Les méthodes complètes mettent en avant deux catégories d’algorithmes : • les algorithmes de recherche énumératifs1 classiques [Beek, 2006],

• les algorithmes bas´es sur la programmation dynamique [Bertele and Brioschi, 1972; Dechter, 2006].

Les algorithmes énumératifs entrelacent recherche arborescente et simplification du problè-me par le biais des méthodes de filtrage. Le problèproblè-me CSP est connu pour être NP-complet. C’est ainsi que les méthodes de résolution énumératives existantes sont exponentielles en n en temps. Nous nous intéressons dans un premier temps aux algorithmes énumératifs classiques qui n’exploitent pas la structure du problème, du moins explicitement.

Dans un second temps, nous nous focalisons sur les méthodes dites structurelles. Ces méthodes ont suscité l’engouement de la communauté en raison de leur complexité théorique temporelle avantageuse par rapport aux autres méthodes énumératives clas-siques. Pour y parvenir, ces méthodes exploitent la structure de l’(hyper)graphe de con-traintes représentant le problème CSP en question. Nous nous concentrons sur les méthodes `

a base de la décomposition arborescente dont nous avons déjà vu la définition dans la partie 1.3.1 et les méthodes de calcul dans la partie 1.3.2. En effet, l’objectif de cette thèse est de faire évoluer les méthodes de résolution à base d’une décomposition arborescente que ce soit pour le problème CSP, #CSP ou le problème WCSP. Derrière cet intérêt se cache la notion des classes polynomiales. Comme tout problème NP-complet, la NP-complétude du problème CSP ne signifie pas forcément qu’il n’existe pas de classes d’instances pouvant être résolues en temps polynomial. Une classe polynomiale est un ensemble d’instances qui admettent un algorithme capable de les résoudre en temps polynomial. Nous expliquons le lien entre les classes polynomiales et les décompositions arborescentes dans la partie dédiée aux méthodes structurelles.

Dans ce qui suit, nous détaillons d’abord les différentes briques d’un solveur avant de nous focaliser sur l’exploitation de la structure. Tous les algorithmes de résolution se basent sur l’algorithme na¨ıf Generate and test. Il consiste à générer toutes les affectations complètes possibles en visitant la totalité de l’espace de recherche. Il procède ensuite `

a la vérification de la cohérence de ces affectations. Évidemment, cet algorithme explose

Dans le document Résolution des problèmes (W)CSP et #CSP par approches structurelles : Calcul et exploitation dynamique de décompositions arborescentes (Page 68-102)