• Aucun résultat trouvé

3.4 Approximation

3.4.6 Une 2-approximation

δ)δ1 .

On parle parfois de schéma d’approximation polynomial, car le facteur d’approxi-mation 1 +ε peut-être choisit arbitrairement proche de 1 tout en gardant un temps polynomial,εetδétant ici des constantes.

Notons que, par exemple, pour δ = 2 et ε = 0.1 (soit le plan avec au plus 10% de l’optimal), la complexité en temps est de seulement n·(logn)O(1) ce qui est moins que le nombre de distances soitΘ(n2).[Question. Pourquoi ?] Ce résultat a valu à Arora et Mitchell le Prix Gödelen . L’algorithme est réputé très difficile à implémenter, et en pratique on continue à utiliser des heuristiques.

3.4.6 Une 2-approximation

On va montrer que l’algorithme suivant est une 2-approximation. Il est plus général que l’algorithme d’Arora-Mitchell car il s’applique non seulement au cas de la distance euclidienne, mais aussi à toute fonctiond vérifiant l’inégalité triangulaire. Il est aussi très simple à implémenter.

L’algorithme ApproxMST est basé sur le calcul d’un « arbre couvrant de poids mi-nimum » que se dit Minimum Spanning Tree (MST) en Anglais. Rappelons qu’il s’agit de trouver un arbre couvrant dont la somme des poids de ses arêtes est la plus petite possible.

AlgorithmeApproxMST(V , d)

Entrée: Une instance (V , d) duVoyageur de commerce(métrique).

Sortie: Une tournée, c’est-à-dire un ordre sur les points deV.

1. Calculer un arbre couvrant de poids minimumT sur le graphe complet dé-fini parV et les arêtes valuées pard.

2. La tournée est définie par l’ordre de visite des sommets selon un parcours en profondeur d’abord deT.

112 CHAPITRE 3. VOYAGEUR DE COMMERCE Le graphe complet (on parle parfois de clique) est un graphe où il existe une arête entre chaque paire de sommets. Voir la figure3.27pour un exemple. Le graphe complet à n sommets possède donc autant arêtes qu’il y a de paires de sommets, soit, d’après l’équation (2.4) :

Figure3.27 – Graphe complet surn= 6 points et ses 15 arêtes valuées par la distance euclidienne. Le sommeti contribue pour n−1−i nouvelles arêtes (celles pointant vers les sommetsj > i), les arêtes vers les sommets< i étant déjà comptées. Au total, il possède Pn1

i=0(n−1−i) = n−1 +n−2 +· · ·+ 1 = Pn1

i=1i =n(n−1)/2 arêtes.

Exemple d’exécution. Voir la figure3.28.

(a)

Figure 3.28 – (a) Ensemble de points sur lequel est appliqué ApproxMST; (b) L’arbre couvrant de poids minimum et un parcours en profondeur ; (c) La tournée correspondante.[Question. Au moins deux flips peuvent être réalisés sur la tournée (c). Lesquels ?]

[Exercice. Montrez qu’il existe toujours un arbreT dont le parcours en profondeur d’abord produit la tournée optimale.]

Il est clair que l’algorithmeApproxMSTrenvoie une tournée puisque, dans l’ordre de première visite, les points sont précisément visités une et une seule fois. Pour montrer que l’algorithme est une 2-approximation, il nous faut démontrer deux points :

3.4. APPROXIMATION 113 1. sa complexité est polynomiale ; et

2. son facteur d’approximation est au plus 2.

Complexité. Calculer un arbre couvrant de poids minimum prend un temps de O(mlogn) pour un graphe connexe ayant m arêtes et n sommets, en utilisant l’algo-rithme de Kruskal qui a l’avantage d’être assez simple à programmer. Avec l’algol’algo-rithme de Prim (et une bonne structure de données) c’estO(m+nlogn). Ici, le graphe est com-plet, donc m = Θ(n2). Ainsi, la première étape prend un temps O(n2) avec Prim ou O(n2logn) avecKruskal.

Le parcours en profondeur prend un temps linéaire en le nombre de sommets et d’arêtes du graphe. Ici le graphe est un arbre surnsommets, et doncn−1 arêtes. Cette étape prend donc un tempsO(n).

On a donc montré que :

Proposition 3.1 L’algorithmeApproxMSTa pour complexitéO(n2).

Parenthèse. Il existe des algorithmes plus efficaces quePrimet Kruskal pour calculer un arbre couvrant (ou forêt couvrante) de poids minimum pour un graphe ànsommets etm arêtes. Les plus rapides, dus à [Cha00] et [Pet99], ont une complexité enO(n+m·α(m, n))où α(m, n)est la fonction inverse d’Ackermann26. Cette fonction croît extrêmement lentement.

Pour toutes valeurs raisonnables de m et n (disons inférieures au nombre de particules de l’Univers),α(m, n)64. Plus précisément27,α(m, n) = min

i:A(i,dm/ne)>log2n A(i, j)est la fonction d’Ackermann définie par :

A(1, j) = 2j, pour toutj>1;

A(i,1) =A(i−1,2), pour touti >1;

A(i, j) =A(i−1, A(i, j−1)), pour touti, j >1.

L’algorithme résultant est réputé pour être terriblement compliqué. Il existe aussi des algo-rithmes probabilistes dont le temps moyen estO(m+n).

Classiquement, la fonction d’Ackermann est plutôt définie ainsi :

A(0, j) =j+ 1, pour toutj>0;

A(i,0) =A(i−1,1), pour touti >0;

A(i, j) =A(i−1, A(i, j−1)), pour touti, j >0.

On a alors :

A(1, j) = 2 + (j+ 3)−3

A(2, j) = 2×(j+ 3)−3

A(3, j) = 2(j+ 3)−3

A(4, j) = 2· · ·2−3avecj+ 3puissances de2empilés

• ...

La variante sur la fonction présentée au-dessus évite un terme additif −3 de la version classique deA(i, j).

26. Voir aussi ici pour une définition alternative plus simple de la fonction inverse d’Ackermann.

27. Il y a parfois des variantes dans les définitions deα(m, n) :bm/ncau lieu dedm/ne, ou encorenau lieu de log2n. Ces variantes simplifient souvent les démonstrations, c’est-à-dire les calculs, mais au final toutes les définitions restent équivalentes à un terme additif près.

114 CHAPITRE 3. VOYAGEUR DE COMMERCE Facteur d’approximation. C’est le point difficile en général. Il faut relier la longueur de la tournée optimale à la tournée construite par l’algorithme. Si on connaît l’algo-rithme, la compréhension de la tournée optimale, elle, nous échappe.

Rappelons que le poids d’un graphe arête-valué (G, ω) est la valeur notée ω(G) = P

eE(G)ω(e), c’est-à-dire la somme des poids de ses arêtes.

Soit T l’arbre couvrant de poids minimum calculé à l’étape 1 de l’algorithme. Le poids de T, vu comme un graphe arête-valué (T , d), vaut d(T) puisque le poids de chaque arête deT est la distance donnée pard entre ses extrémités.

Proposition 3.2 La longueur de la tournée optimale pour l’instance (V , d)est plus grande que le poids le l’arbre de poids minimum couvrantV. Dit autrement,opt(V , d)> d(T).

Preuve.À partir de n’importe quelle tournée pour (V , d), on peut former un cycle arête-valué (C, d) dont le poids d(C) correspond précisément à la longueur de la tournée. Si on supprime une arête e quelconque de C, alors on obtient un chemin C\ {e}passant par tous les sommets et qui n’a pas de cycle. Le chemin C\ {e} est un arbre couvrant particulier.

Considérons le cycleC correspondant à la tournée optimale. D’après la discussion précédente :

eE(C), opt(V , d) =d(C) > d(C\ {e}) > d(T)

puisqueC\ {e} est un arbre couvrant particulier et queT est un arbre de poids mini-mum. On a donc montré queopt(V , d)> d(T).

Parenthèse. On peut raffiner un peu plus cette inégalité et donner une meilleure borne inférieure suropt(V , d), ce qui est toujours intéressant pour évaluer les performances des heuristiques :

opt(V , d) > d(T) +d(e+) (3.3) oùe+est l’arête juste plus lourde que l’arête la plus lourde deT. Autrement dit, dans l’ordre croissant des arêtes du graphe (ici une clique), sieiétait la dernière arête ajoutée àT, alors e+=ei+1. En effet, lorsqu’on forme un arbre à partir deC, plutôt que de choisir n’importe qu’elle arêtee, on peut choisir d’enlever l’arêteela plus lourde deC. L’arêteene peut être dans le MST[Question. Pourquoi ?]. Elle est aussi forcément plus lourde que la plus lourde du MST, c’est-à-dired(e)>d(e+). [Question. Pourquoi ?]On a vu (en posante=e) que opt(V , d)−d(e)>d(T), ce qui impliqueopt(V , d)>d(T) +d(e)>d(T) +d(e+)et prouve l’équation3.3. Évidemmentd(T) +d(e)est une meilleure borne inférieure, maiseest par essence difficile à calculer (il faudrait connaîtreC), contrairement àe+.

2 Il reste à majorer la longueur de la tournée renvoyée par l’algorithme en fonction de d(T). Pour cela, on a besoin de l’inégalité triangulaire.

Proposition 3.3 La tournée obtenue par le parcours deT est de longueur au plus2d(T). Dit autrement,ApproxMST(V , d)62d(T).

3.4. APPROXIMATION 115 Preuve.Soitv0v1− · · · −vn1v0la tournée renvoyée par l’algorithme. Sa longueur est doncApproxMST(V , d) =Pn1

i=0d(vi, vi+1), les indices étant pris modulon.

NotonsPi le chemin dansT entrevi et son suivantvi+1. L’inégalité triangulaire per-met d’affirmer que la longueur du segmentvivi+1vaut au plusd(Pi), le poids du chemin Pi. Dit autrement,d(vi, vi+1)6d(Pi), et doncApproxMST(V , d) =P

id(vi, vi+1)6P

id(Pi).

Pour montrer que cette dernière somme vaut en fait 2d(T), il suffit d’observer que chaque arêtee deT appartient à exactement deux chemins parmiP0, . . . , Pn1.

2

3 5 1

7 8

0

9

6 4

Figure3.29 – Parcours de la face extérieure de l’arbreT, chaque arête étant parcourue exactement deux fois. L’arête 0−4 appartient aux chemins P3 et P7.

Pour le voir (cf. figure 3.29), on peut d’abord redessiner l’arbre T, éventuellement en réordonnant les fils autour de certains sommets, de sorte que le parcours DFS28de T corresponde à un parcours de sa face extérieure. Cela ne change évidemment pas la longueur des cheminsPi dansT. La suite des chemins P0, . . . , Pn1 constitue alors un simple parcours de la face extérieure deT, chaque arête étant visitée exactement deux fois.

Pour résumer, on a donc montré que ApproxMST(V , d) = X

i

d(vi, vi+1) 6 X

i

d(Pi) = 2d(T).

2 La combinaison des propositions 3.2et 3.3 permet de conclure que la longueur de la tournée produite par l’algorithme est au plus deux fois l’optimale. En effet, on vient de voir queApproxMST(V , d)62d(T) et qued(T)<opt(V , d). On en déduit donc que ApproxMST(V , d)<2opt(V , d). Avec la proposition3.1, on a donc montré que :

Proposition 3.4 L’algorithmeApproxMSTest une2-approximation.

28. PourDepth First Search, « parcours en profondeur » en français.

116 CHAPITRE 3. VOYAGEUR DE COMMERCE [Exercice. En réutilisant l’instance de la figure 3.13, montrez que le facteur d’ap-proximation de l’algorithmeApproxMSTpeut être aussi grand que 1.5−O(1/n). Peut-on dépasser le facteur 1.5 en utilisant l’exemple de la figure 3.14 pourn= 46 ?]

[Exercice. En plaçantn= 7 points aux sommets d’un hexagone régulier dont un point en son centre, montrez que le facteur d’approximation d’ApproxMSTpeut être>1.63.]

[Exercice. En s’inspirant de la généralisation de l’hexagone régulier, montrez que le facteur d’approximation d’ApproxMST tend vers 2, lorsque n tends vers l’infini, si la seule contrainte sur la fonction de distanced est de respecter l’inégalité triangulaire.]