Choix d’une bonne décomposition arborescente

3.2 Exploitation de la structure d’un réseau

3.2.3 Choix d’une bonne décomposition arborescente

(Travail en collaboration avec Mathieu Fontaine et Patrice Boizumault ; Cf. la thèse de Ma-thieu Fontaine, ainsi que l’article à JFPC’13 [Fontaine et al., 2013b]).

Une étude plus approfondie sur les décompositions arborescentes utilisées montre que les performances de DGVNS dépendent fortement de la qualité de la décomposition. En effet, les per-formances sont d’autant meilleures que lorsque le problème se décompose en clusters de tailles raisonnables avec des petits séparateurs. Les heuristiques de décomposition arborescente habi-tuellement utilisées (MCS, min-fill) ont montré leurs limites pour identifier ce type de structures (i.e. présence de clusters faiblement reliés entre eux) en particulier sur les instances tagSNP. En

18. IDW (Intensification Diversification Walk) est une autre méta-heuristique, introduite dans [Neveu et al., 2004], dédiée aux WCSP et qui propose une gestion de voisinage ressemblant aux listes de mouvements candidats (candidats lists) proposées dans [Glover et Laguna, 1997].

19. Temps de calcul moyen nécessaire à la méthode pour atteindre l’optimum sur l’instance considérée. 20. Le nombre d’essais avec succès (pour attendre l’optimum) obtenue par la méthode sur l’instance considérée.

(a) décomposition initiale (b) décomposition après fusion par absorption

Figure 3.4 – Instance scen07 de RLFAP.

effet, pour la plupart de ces instances, les décompositions obtenues comportent de nombreux clus-ters qui se chevauchent très fortement. De plus, ces clusclus-ters contiennent peu ou pas de variables propres. Cette forme de redondance entre clusters limite l’effort de diversification de DGVNS, en considérant plusieurs fois des voisinages très proches.

En s’appuyant sur ce constat, nous avons étudié deux schémas complémentaires permettant d’améliorer la décomposition arborescente. Le premier schéma, noté TDTD (Tightness Dependent Tree Decomposition), consiste à ne considérer au moment de la décomposition que les fonctions de coûts les plus dures (c’est-à-dire, celles ayant une proportion d’affectations valides inférieure à un seuil de dureté minimalλ). L’idée ici est d’essayer d’identifier les structures de voisinage portant sur les sous-parties du problème contenant des fonctions de coût les plus difficile à satisfaire, c’est-à-dire, toutes celles ayant une dureté supérieure au seuilλ. Notons que l’idée d’exploiter les coûts des fonctions a été aussi exploitée par [Kitching et Bacchus, 2009] dans le cadre des méthodes de recherche arborescente. Le second schéma, noté abs (fusion par absorption), consiste à fusionner les clusters partageant une grande proportion de variables. Dans ce qui suit, je vais détailler le second schéma.

Raffinement basé sur la fusion de clusters. Afin de limiter la redondance entre clusters et donc de renforcer la qualité des structures de voisinage explorées par DGVNS, nous avons proposé de fusionner les clusters qui sont redondants dans la décomposition arborescente. L’idée sous-jacente est d’augmenter la proportion de variables propres dans les clusters. À cet effet, nous avons introduit un nouveau critère appelé absorption [Fontaine et al., 2013b] :

Définition 3.7 (Absorption)

Soit (CT, T ) une décomposition arborescente, Ci et Cj deux clusters de C. L’absorption de Ci

parC_j, notée abs(C_i, C_j), est définie par :

abs(Ci, Cj) = ^|sep(Cⁱ^{, C}^j^)| |C_i|

Soit abs_max le taux d’absorption maximal autorisé, et min_size la taille minimale autorisée pour un cluster. La fusion s’effectue sur la décomposition initiale. En partant des feuilles de cette décomposition, tous les clusters < Ci, parent(Ci) > ayant un taux d’absorption supérieur à abs_max ou tels que |C_i| < min_size sont fusionnés. Pour nos expérimentations, min_size a été fixée à la valeur 5 et abs_max à 70%. Ainsi, les clusters partageant un peu plus de 2/3 de leurs variables seront fusionnés.

La figure 3.4a montre un exemple de décomposition arborescente de largeur 23 obtenue par MCS sur l’instance CELAR scen07. Cette décomposition est constituée de110 clusters et la taille de son plus grand séparateur vaut 18. Comme on peut le remarquer, la plupart des clusters ont plus de 90% de leurs variables partagées (cf. ellipses²¹ en rouge). La figure 3.4b donne la nouvelle décomposition obtenue après fusion par absorption. Comme on peut le constater, la fusion par absorption permet de supprimer la plupart des clusters redondants et de générer une décomposition contenant au moins 50% de variables propres. Par ailleurs, la taille du plus grand cluster (resp. séparateur) est égale à 49 (resp. 8). Ainsi, la fusion par absorption permet de produire des décompositions de bonne qualité : des clusters de tailles raisonnables avec une forte proportion de variables propres.

Dans [Jégou et al., 2006, Sánchez et al., 2009], les auteurs proposent de fusionner les clusters partageant plus de variables qu’un seuil maximal fixésmax : en partant des feuilles de la décom-position initiale, fusionner les clustersCi qui partagent plus de smax variables avec leur parent. On obtient ainsi une nouvelle décomposition, dans laquelle aucun séparateur ne contient plus de smax variables. Nous avons pu observer, qu’en pratique, le réglage du paramètre smax dépend du gain en réduction de la taille des séparateurs et donc du nombre de variables partagés par rapport à la perte en augmentation de la taille des clusters résultants. En effet, pour des valeurs de smax élevées, la fusion modifie peu la décomposition initiale. En revanche, pour des valeurs de smax faibles, les décompositions produites ont peu de clusters et possèdent des largeurs de décomposition très élevées.

Bilan des expérimentations. Pour mesurer l’apport de la fusion de clusters, nous avons com-paré les performances de DGVNS-1, DGVNS-2 sur les décompositions initiales (sans fusion) ainsi que sur les décompositions raffinées obtenues par fusion de clusters selon les deux critèressmaxetabs. Nous avons considéré différentes valeurs poursmax :4, 8, 12, 16, 24 et 32. Sur l’ensemble des ins-tances, la fusion de clusters par absorption procure des gains substantiels comparés aux résultats obtenus par DGVNS-1 et DGVNS-2 sur la décomposition initiale de MCS. Ces résultats confirment l’intérêt de réduire la redondance entre clusters pour identifier des structures de voisinage plus pertinentes et ainsi renforcer l’effort de diversification de DGVNS. Par ailleurs, la fusion par ab-sorption permet de produire des décompositions ayant une forte proportion de variables propres. De plus, la taille des clusters reste raisonnablement élevée. En effet, sur la plupart des instances, la taille des clusters est en moyenne2 fois plus grande comparée à la décomposition initiale. De plus, le nombre de clusters reste relativement petit.

Vers une approche exploitant une décomposition dynamique. Une piste prometteuse qui mériterait d’être étudiée est de changer dynamiquement de décomposition durant la recherche. Notre idée est d’adapter la décomposition arborescente en fusionnant dynamiquement certains

21. Chaque ellipse contient un numéro de la forme x_y, avec x le numéro de la variable et y son numéro du cluster.

clusters en fonction de critères qui peuvent dépendre de l’état de la recherche ou des informations apprises lors des précédentes explorations.

Dans le document Contributions à la résolution des WCSP et approches déclaratives pour la fouille de données (Page 41-44)