des clauses apprises - Quatorzièmes Journées Francophones de Programmation par Contraintes

Dans cette section, nous présentons quelques me-sures de pertinence des clauses apprises exploitées par la plupart des solveurs SAT de la littérature.

Le solveur SAT CDCL le plus populaire Minisat [13]

considère comme pertinentes les clauses les plus impli-quées dans les récentes analyses de conflits et élimine les clauses apprises dont l’implication dans les récentes analyses de conflits est marginale. Une autre stratégie appelée LBD pour Literal Block Distance fut

propo-sée dans [5]. La mesure LBD dont l’efficacité a été

prouvée empiriquement est aussi exploitée par la plu-part des meilleurs solveurs SAT de l’état de l’art

(Glu-cose, Lingeling [8] ). Cette mesure utilise le nombre de

niveaux différents impliqués dans une clause apprise donnée pour quantifier la qualité des clauses apprises. Ainsi, les clauses apprises avec les plus petites valeurs de LBD sont considérées comme les plus pertinentes.

Dans [4], une nouvelle police de gestion dynamique de

la base des clauses apprises est proposée. Elle est fon-dée sur un principe d’activation et de gel dynamique des clauses apprises. A un état de recherche donné, en utilisant une fonction de sélection fondée sur une sau-vegarde progréssive des polarités des littéraux appelée PSM (Progress Saving Measure), elle active les clauses apprises les plus prometteuses tout en gélant celles

ju-gées non pertinentes. L’idée est alors de geler certaines clauses au lieu de les supprimer définitivement afin de les réactiver plus tard. La valeur PSM d’une clause est le nombre de littéraux ayant la même polarité que la phase saving (dernières polarités choisies pendant la recherche par l’heuristique de polarité) apparaissant dans cette clause.

Dans [18], un nouveau crit`ere pour quantifier la

per-tinence d’une clause apprise en utilisant son niveau de retour-arrière appelé BTL pour BackTrack Level est proposé. A partir des expérimentations, les auteurs ob-servent que les clauses apprises avec les petites valeurs de BTL sont plus souvent utilisées dans le processus de propagation unitaire que celles ayant des grandes valeurs BTL. Plus précisément, les auteurs observent que les clauses apprises ayant les valeurs BTL

infé-rieures à 3 sont toujours plus utilisées dans la

propa-gation unitaire que le reste des clauses. A partir de cette observation, et motivés par le fait qu’une clause apprise avec une petite valeur BTL contient plus de lit-téraux du sommet de l’arbre de recherche, les auteurs déduisent que les clauses apprises les plus pertinentes sont celles permettant un retour-arrière plus haut dans l’arbre de recherche (clauses ayant de petites valeurs BTL). Plus récemment, plusieurs autres stratégies de gestion de la base des clauses apprises furent

propo-s´ees dans [22, 3]. Dans [22], les auteurs explorent un

nombre varié de stratégies de réduction de la base des clauses apprises, et les performances des différentes ex-tensions du solveur Minisat intégrant leurs stratégies sont evaluées sur les instances SAT prises des compé-titions SAT 2013 et 2014, et comparées aux autres sol-veurs SAT de la littérature (Glucose, Lingeling) ainsi qu’au solveur original Minisat.

A partir des performances obtenues avec leurs

stra-t´egies, les auteurs de [22] ont montr´e que les

straté-gies d’apprentissage fondées sur la mise en place d’une borne supérieure sur la taille des clauses proposées il y a plus d’une quinzaine d’années restent également de bonnes mesures pour prédire la qualité des clauses

ap-prises. Ils montrent que l’ajout de la randomisation `a

l’apprentissage fond´ee sur la mise en place d’une borne sup´erieure sur la taille des clauses est un bon moyen de

parvenir à une diversification contrôlée, permet de

fa-voriser les clauses de petites tailles tout en maintenant une petite fraction de clauses de grande taille néces-saires pour la dérivation des preuves par résolution sur certaines instances difficiles.

Dans [3], les auteurs utilisent la structure de

commu-naut´e des instances SAT industrielles pour identifier un ensemble de clauses apprises fortement utiles. Ils montrent que l’augmentation d’une instance SAT avec les clauses apprises par le solveur pendant son ex´ecu-tion n’est pas toujours un moyen de rendre facile la

r´esolution de l’instance. Les auteurs montrent

cepen-dant qu’en ajoutant `a la formule originale un ensemble

de clauses fondé sur la structure de communauté de la formule améliore les performances du solveur dans beaucoup de cas. Les différentes performances obte-nues par chaque stratégie suggèrent que la question de prédire efficacemment les meilleures clauses apprises `

a maintenir pour la suite de la recherche est toujours ouverte et m´erite de fortes investigations.

D’autre part, il est important de noter que l’effi-cacité de la plupart de ces stratégies de gestion des clauses apprises de létat de l’art depend fortement de la fréquence de nettoyage et de la quantité de clauses `

a supprimer à chaque nettoyage. Généralement, tous

les solveurs SAT CDCL utilisant ces strat´egies

sup-priment exactement la moiti´e des clauses apprises `a

chaque ´etape de nettoyage de la base des clauses ap-prises. Par exemple, les solveurs SAT CDCL Minisat

[13] et Glucose [5] suppriment la moiti´e des clauses

ap-prises `a chaque ´etape de nettoyage. Cependant,

l’effi-cacité de cette quantité de clauses apprises à supprimer

(c’est à dire la moitié) à chaque étape de nettoyage de

la base de clauses apprises n’a pas été démontrée

théo-riquement, mais plutôt expérimentalement. A notre

connaissance, il n’existe pas beaucoup d’études dans la littérature sur comment déterminer la quantité de

clauses `a supprimer `a chaque nettoyage. Ce papier

pro-pose une approche pour identifier les clauses apprises les plus pertinentes au cours du processus de résolu-tion sans favoriser auncune des mesures de qualité de la littérature, de plus, cette approche s’affranchit du problème de la determination de la quantité de clauses `

a supprimer `a chaque nettoyage de la base des clauses

apprises : la quantit´e de clauses apprises `a supprimer

correspond `a chaque fois au nombre de clauses apprises

dominées par au moins l’une des top-k clauses apprises (ensemble des clauses apprises de référence courantes). Les top-k clauses apprises seront appelées dans les sec-tions suivantes clauses apprises de référence.

4 D´etection des clauses apprises non

do-min´ees

Nous pr´esentons maintenant notre mesure de perti-nence des clauses apprises fond´ee sur la relation de do-minance. Nous motivons tout d’abord cette approche `

a partir d’un simple exemple, et proposons ensuite un algorithme permettant d’identifier les clauses apprises les plus pertinentes avec quelques d´etails techniques.

4.1 Motivation

Consid´erons les strat´egies de pertinence suivantes :

LBD [5], SIZE ( strat´egie qui consid`ere comme

pertinence utilis´ee par minisat [13] que nous appelons ici CVSIDS. Supposons que nous ayons dans la base

des clauses apprises, les clauses c1, c2 et c3avec :

— SIZE(c1) = 8, LBD(c1) = 3, CV SIDS(c1) = 1e100; — SIZE(c2) = 6, LBD(c2) = 5, CV SIDS(c2) = 1e200; — SIZE(c3) = 5, LBD(c3) = 4, CV SIDS(c3) = 1e300.

La question que nous posons est la suivante : laquelle

des clauses est la plus pertinente ? Dans [5], les

au-teurs consid`erent la clause c1 qui a le plus petit LBD

comme la plus pertinente. Par contre, les auteurs de

[22] et [15] pr´ef`erent la clause c3 tandis que la

préfé-rence des auteurs de Minisat [13] va à la clause c3.

Notre approche s’affranchit de cette pr´ef´erence

parti-culi`ere `a une mesure en cherchant un compromis entre

les diff´erentes mesures de pertinence `a travers une

re-lation de dominance. Ainsi, pour la situation d´ecrite

plus haut, seule la clause c2est non pertinente, elle est

domin´ee par la clause c3sur les trois mesures donn´ees.

4.2 Formalisation

Au cours de la recherche, les solveurs SAT CDCL ap-prennent un ensemble de clauses qui sont stock´ees dans

une base des clauses apprises ∆, ∆ = {c1, c2, ..., cn}.

A chaque étape de réduction de la base des clauses apprises, nous évaluons ces clauses sur un ensemble de

mesures de pertinence M = {m1, m2, ..., mk}. Nous

notons m(c) la valeur de la mesure m pour la clause

c, c∈ ∆, m ∈ M.

Comme l’´evaluation des clauses apprises varie d’une

mesure `a une autre, l’utilisation de plusieurs mesures

pourrait conduire à différents résultats (clauses

perti-nentes par rapport `a une mesure de pertinence). Par

exemple, si nous consid´erons l’exemple ci-dessus, c1est

la meilleure clause par rapport `a la mesure LBD, ce qui

n’est pas le cas par rapport `a la mesure d’´evaluation

SIZE qui favorise c3. Cette diff´erence d’´evaluation

rend difficile le choix d’une mesure lors du processus de selection des clauses apprises. Ainsi, nous pouvons uti-liser la notion de dominance entre clauses apprises afin de selectionner les clauses les plus pertinentes. Avant la formulation de la relation de dominance entre clauses apprises, il est nécessaire de la définir au niveau des valeurs des mesures de pertinence. Pour ce faire, nous définissons la valeur de dominance comme suit : Definition 1 (Valeur de dominance) Etant don-née une mesure de pertinence de clauses apprises m

et deux clauses apprises c et c0, nous disons que m(c)

domine m(c0), et notons m(c) m(c0), si et

seule-ment si m(c) est préférée à m(c0). Si m(c) m(c0)

et m(c) 6= m(c0) alors nous disons que m(c) domine

strictement m(c)0 et notons m(c) m(c0).

Definition 2 (Dominance entre clauses) Etant

donn´ees deux clauses apprises c et c0, la relation de

dominance entre c et c0 par rapport `a un ensemble de

mesures de pertinenceM est d´efinie comme suit :

— c domine c0, not´e c c0, si et seulement si

m(c) m(c0), ∀m ∈ M.

— si c domine c0 et∃m ∈ M tel que m(c) m(c0),

alors c domine strictement c0 et nous notons c

c⁰.

Pour découvrir les clauses apprises pertinentes, une approche na¨ıve consiste à comparer chaque clause ap-prise avec toutes les autres clauses apap-prises. Cepen-dant, le nombre de clauses apprises est prouvé être exponentiel, ce qui rend les comparaisons par paire

tr`es coˆuteuses. Dans la suite, nous montrons comment

r´soudre ce problème en définissant à chaque étape de

réduction de la base de clauses apprises, un ensemble de clauses apprises particulier (top-k clauses apprises) que nous appelons dans ce papier clauses apprises de référence (en abrégé RLC) qui est un ensemble de

clauses apprises non domin´ees de ∆ par rapport `a

l’en-semble des mesures de pertinence de clauses apprises M

A chaque étape de nettoyage de la base des clauses apprises, toutes les clauses apprises dominées par au moins l’une des k clauses apprises de référence (top-k clauses apprises) seront considérées comme étant ds clauses apprises non pertinentes et ainsi supprimées de la base des clauses apprises.

Pour définir les clauses apprises de référence, nous avons besoin de définir une nouvelle mesure de qualité de clauses fondée sur toutes les mesures de qualité des

clauses apprises de M. Nous appelons cette nouvelle

mesure ”Dégré de compromis”, en court DegComp. Elle est définie comme suit :

Definition 3 (Degr´e de compromis) Etant

don-n´ee une clause apprise c, le degr´e de compromis de

c par rapport `a l’ensemble des mesures de pertinence

de clauses apprises M est d´efini par DegComp(c) =

i=1m\i(c)

|M| , où \mi(c) correspond à la valeur normalisée

de la mesure mi pour la clause c.

Dans le même ordre d’idée, et afin d’éviter de conser-ver un grand nombre de clauses apprises dans la base

de clauses apprises à chaque étape de réduction, nous

proposons une stratégie de dominance qui considère k Clauses Apprises de Référence (en court k-RLC) au lieu d’une seule clause clause apprise de référence ap-pelée ici 1-RLC. Plus précisément, la stratégie k-RLC

est définie comme suit : à chaque étape de réduction,

nous supprimons de la base des clauses apprises toutes les clauses dominées par au moins l’une des k prémières clauses apprises non dominées (top-k clauses apprises)

par rapport `a l’ensemble de mesures de pertinence de

En effet, en pratique, les mesures sont hétérogènes et

sont définies à différentes échelles. Par exemple, les

va-leurs de la mesure de qualit´e des clauses apprises dans

[13] sont des tr`es grandes valeurs, alors que les valeurs

de la mesure de pertinence dans [5] sont des petites

valeurs. Ainsi, afin d’éviter que des mesures avec des grandes valeurs rendent marginales les mesures avec de petites valeurs dans le calcul du dégré de compro-mis d’une clause apprise donnée, il est nécessaire de normaliser les valeurs des différentes mesures de perti-nence. Dans notre cas, nous choisissons de normaliser toutes les mesures dans l’intervalle [0, 1].

Plus précisément, chaque valeur de mesure m(c) de toute clause apprise c doit être normalisée dans [0, 1]. La normalisation d’une mesure donnée m est effectuée en fonction du domaine de ces valeurs et de la distribution statistique de son domaine actif. Nous rappelons que le domaine actif d’une mesure m est l’ensemble de ses valeurs possibles. Il convient de mentionner que la normalisation d’une mesure ne modifie pas la relation de dominance entre deux

clauses donn´ees. Consid´erons la clause apprise c1

don-n´ee dans l’exemple de motivation `a la section 4.1,

avec ses valeurs sur les trois mesures consid´er´ees :

DegComp(c1) = ^{CV SIDS(c}^\ 1)+LBD(c\1)+SIZE(c\1)

3 , then, we have, DegComp(c1) = 1 1e100+ 3 nV ars()+ 8 nV ars() 3 , avec

nV ars() le nombre de variables de la formule boo-l´eenne.

Il est important de pr´eciser que, le domaine des valeurs de toutes les mesures de pertinence devrait

ˆetre conforme, c’est-`a-dire, soient les plus petites

leurs sont meilleures ou soient les plus grandes va-leurs sont meilleures. Par exemple, si nous

consid´e-rons la clause apprise c1, et les 3 mesures de

perti-nence LBD, SIZE et CV SIDS, nous prenons la

va-leur 1

CV SIDS(c1) comme valeur normalis´ee de la clause

c1 sur la mesure CV SDIS. En effet, les plus grandes

valeurs CV SIDS sont meilleures alors que les plus pe-tites valeurs LBD et SIZE sont meilleures. De cette mani`ere, les mesures deviennent comparables sur les clauses.

Apès avoir donné les définitions néecessaires (clause apprise de référence et dégré de compromis), le lemme suivant offre une solution plus rapide que des com-paraisons de clauses par paires, pour rechercher les clauses apprises pertinentes fondées sur la relation de dominance.

Lemme 1 Soit c une clause apprise ayant le d´egr´e de

compromis minimalpar rapport `a l’ensemble des

me-sures de pertinence des clauses apprises M, alors c

est une clause apprise non domin´ee.

Dans notre strat´gie k-RLC, les k pr´emi`eres clauses

apprises non dominées sont les k prémières clauses

ap-prises classées dans l’ordre croissant de leur dégré de

compromis. Il est important de souligner qu’`a chaque

étape de réduction, les k prémières clauses apprises non dominées ne sont pas toujours les k prémières clauses apprises classées dans l’ordre croissant de leur dégré de compromis.

Propri´et´e 1 Soit M l’ensemble des mesures de

per-tinence des clauses apprises,∀c, c0, c” trois clauses

ap-prises, si c c0 et c0 c” alors c c”.

Rechercher toutes les clauses apprises non domin´ees `

a chaque étape de réduction peut être tr‘es couteux en temps, de ce fait, nous cherchons uniquement les clauses apprises non dominées par rapport aux k clause

apprises de référence (top-k clauses apprises) à chaque

´etape de r´eduction de la base des clauses apprises.

Au cours de la recherche, `a chaque ´etape de

net-toyage de la base des clauses apprises, nous cherchons d’abord la clause apprise cM in ayant le d´egr´e de

com-promis minimal par rapport `a l’ensemble des mesures

de pertinence consod´er´ees M. Nous supprimons

en-suite de la base des clauses apprises toutes les clauses domin´ees par cM in.

Au cours de la recherche, `a chaque ´etape de

net-toyage de la base des clauses apprises, nous comparons toutes les autres clauses apprises avec chacune des top-k clauses apprises. Ainsi, pour chaque clause apprise, nous éffectuons au moins une comparaison et au plus k comparaisons avec les top-k clauses apprises pour sa-voir si la clause est dominée et ensuite supprimée ou si la clause n’est pas dominée et donc conservée.

Propri´et´e 2 Soient ∆ = {c1, c2, ..., cn}, une base

de clauses apprises, k le nombre de clauses apprises de réf´rence (top-k clauses apprises), la complexité de notre approche de dominance k-RLC est linéaire dans le pire des cas.

4.3 Algorithme

Dans cette section, après avoir présenté le schéma général d’une stratégie de suppression des clauses ap-prises (reduceDB(∆)) adoptée par la plupart des sol-veurs SAT de la littérature, nous proposons un algo-ritme permettant de découvrir les clauses apprises per-tinentes en utilisant la relation de dominance.

L’algorithme 1 présente le schéma général

d’une stratégie de suppression des clauses ap-prises (reduceDB(∆)). Cet algorithme trie dans un premier temps l’ensemble des clauses apprises sur le critère défini et supprime ensuite la moitié des clauses apprises. En effet, cet algorithme prend en entrée une base de clauses apprises de taille n et retourne en

sortie une base de clauses apprises de taille n

diff´erent de notre approche qui trie dans un premier

temps l’ensemble des clauses apprises par rapport `a

leur dégré de compromis et supprime ensuite toutes les clauses qui sont dominées par au moins l’une des k prémières clauses apprises non dominées (top-k clauses apprises).

L’algorithme 2 pr´esente notre strat´egie de

suppres-sion des clauses apprises. Il faut noter que les clauses apprises dont la taille (en nombre de litt´eraux) ou le

LBD est plus petit ou ´egal `a 2 ne sont pas

concer-nées par la relation de dominance. Ces clauses apprises sont considérées comme pertinentes et sont maintenues dans la base des clauses apprises.

Algorithm 1: Strat´egie de suppression : fonction reduceDB

Donn´ees: ∆ : La base des clauses apprises de

taille n

R´esultat: ∆ : La nouvelle base des clauses

apprises de taille n/2

sortLearntClauses(); /* sur le crit`ere

1 d´efini */ limit = n/2; 2 ind = 0; 3

tant que ind < limit faire

clause = ∆[ind] ;

si clause.size() > 2 && clause.lbd() > 2 alors

6 removeClause(); 7 sinon 8 saveClause(); 9 ind + +; 10 retourner ∆ ; 11

Proposition 1 Les k clauses apprises de r´ef´erence

consid´er´ees par l’algorithme 2 correspondent aux k

prémières clauses apprises non dominées classées dans l’ordre croissant de leur dégré de compromis.

Propri´et´e 3 Soient ∆ = {c1, c2, ..., cn} une base de

clauses apprises et k le nombre de clauses apprises de référence considérées. Soit u le nombre de clauses ap-prises non dominées après avoir appliqué l’algorithme

2. Nous avons k≤ u ≤ |∆|.

5 Exp´erimentationss

Pour nos expérimentations, nous utilisons trois me-sures de pertinence pour la relation de dominance afin d’évaluer l’efficacité de notre approche. Il faut noter que l’utilisateur peut choisir de combiner dif-férentes autres mesures de pertinence. Nous utilisons

pour notre ´etude, les mesures SIZE [15], LBD [5] et

Algorithm 2:

reduceDB-Dominance_Relationship

Donn´ees: ∆ : La base des clauses apprises ;M :

un ensemble de mesure de pertinence de clauses apprises ; k : le nombre de clauses apprises de r´ef´rence

R´esultat: ∆ : La nouvelle base des clauses

apprises

sortLearntClauses(); /* par rapport au

1 d´egr´e de compromis */ ind = 1; 2 j = 1; 3

undoC = 1 ; /* le nombre de clauses non

Dans le document Quatorzièmes Journées Francophones de Programmation par Contraintes (Page 110-120)