4 Probl` emes NP-Complet

(1)

Optimisation discr`ete, s´eance 3 : cours TH´ EORIE de la COMPLEXIT ´ E

Objectifs

La solution d’un problème combinatoire, quand elle existe, peut être déterminée par l’énumération d’un ensemble fini E de possibilités. S’il y a un algorithme simple pour tester si un élément de cet ensemble est une solution, on dispose d’un algorithme pour trouver une solution au problème en testant toutes les possibilités. Mais le cardinal de E est souvent exponentiel par rapport à la taille des données, ce qui rend l’énumération impossible dans un temps raisonnable.

Il existe de très nombreux problèmes d’un grand intérêt pratique pour lesquel on ne connaˆıt pas d’algorithme plus efficace qu’un test portant sur tous les sous ensembles d’un ensemble, ce qui implique un temps de calcul exponentiel par rapport à la taille de l’ensemble. Nous verrons que, en un certain sens, ces problèmes qui sont dits NP- complets, sont équivalents entre eux : un algorithme efficace pour l’un le serait pour tous.

Curieusement on ne sait pas démontrer que ces problèmes n’admettent pas d’algorithme polynômiaux, c’est la conjectureP6=N P.

1 La notion d’algorithme

1.1 Exemples d’algorithmes

• Opérations élémentaires sur les entiers. On apprend à l’école élémentaire à faire ces opérations en n’utilisant que les chiffres du développement décimal, ce qui fait un algo- rithlme très efficace même pour de grands entiers.

• Valeur d’un polynˆome : le sch´ema de Horner.

n

X

k=0

a_kx^k= ((...((anx+a_n−1)x+a_n−2)x...)x+a₁)x+a₀ permet un calcul en nmultiplications etn−1 additions.

• Multiplication de deux matrices (n, n) : L’algorithme usuel enn³ op´erations n’est pas optimal, voir ci-dessous en annexe l’algorithme de Strassen.

• Résolution d’un système linéaire : algorithme de Gauss.

L’algorithme usuel pour trianguler une matrice pleine fait ⁿ₃³ opérations élémentaires.

(2)

• Test de primalité relative : on peut déterminer si deux entiers sont premiers entre eux par l’algorithme d’Euclide (PGCD), c’est un algorithme très efficace même pour des entiers grands.

• Construction d’un arbre minimal recouvrant un graphe.

On a vu un algorithme très efficace à la séance 1.

• Connexit´e d’un graphe.

La construction d’un arbre de recouvrement peut servir d’algorithme, voir la s´eance 1.

Pour tous les problèmes suivants (désignés par une abréviation conventionnelle) il existe un algorithme simple, mais peu efficace : l’énumération de toutes les possibilités d’un ensemble très grand.

PRIM : Test de primalit´e.

Il s’agit de tester si un entier n est premier. Ce qui peut se faire en testant si l’entier n est divisible par tous les entiers plus petits. Noter que si l’entier s’écrit en décimal avec 50 chiffres, il est de l’ordre de 10⁵⁰. Ce qui interdit en pratique de le diviser par tous les entiers inférieurs même si par la division n’est pas une opération très coûteuse en temps de calcul. Certains entiers premiers célèbres sont des “nombres de Mersenne”

(2^p+ 1), ils sont donc très très grands par rapport à leur représentation (l’entier pécrit en décimal). Ce problème, historiquement très important, a de nombreuses applications (cryptographie).

k-COL : k-coloration d’un graphe.

Est-il possible de colorier avec k couleurs les noeuds d’un graphe de fa¸con à ce que deux noeuds adjacents n’ait jamais la même couleur ? Le problème d’optimisation correspondant est de trouver un entier k cas minimal. Pourk= 2 on a un algorithme très rapide, voir exercices.

EUL : Circuit eul´erien : existe-t-il sur un graphe un circuit eul´erien ?

HAM : Circuit hamiltonien : existe-t-il sur un graphe un cycle passant par tous les sommets d’un graphe ?

TSP : Le problème du voyageur de commerce : existe-t-il un cycle hamiltonien de longueur inférieure à un entierksur un graphe valué. ? Le problème d’optimisation correspondant est de trouver un entier cask minimal.

SAT : Satisfiabilit´e d’un ensembe de clauses¹.

Un ensemble denclauses (P1∨ ¬P2∨...∨Pk) àpsymboles est-il satisfiable, i.e. peut-on donner des valeurs “Vrai”, “Faux” aux symboles P_i pour que toutes les clauses soient vraies ? (Des propositions quelconques peuvent être écrites comme une conjonction de clauses, leur satisfiabilité est ramenée à celle de chaque clause). On peut tester toutes les valeurs des symboles de proposition, mais cela fait 2^p tests à effectuer.

1voir annexe 1

(3)

k-SAT : Satisfiabilit´e d’un ensemble de clauses de longueur au plusk.

ILP : La programmation lin´eaire en nombres entiers : chercher s’il existe des vecteurs deR^p

à composantes entières qui vérifient un ensemble d’inéquations linéaires. Le problème d’optimisation correspondant est de trouver parmi ces solutions le minimum d’une forme linéaire (en fait on montre qu’un algorithme pour le problème d’optimisation peut s’adapter en un critère d’existence de la solution d’un système d’inéquations).

1.2 Rappel sur la notion d’algorithme

La notion d’algorithme que nous utiliserons est stritement déterministe, ce qui exclut les opérations en “virgule flottante”. On suppose donnés un langage de programmationLet une classe d’objets C définis par des chaˆınes de caractères (nous dirons un mot). Un algorithme est une fonction définie par un programme écrit dans le langage L qui, si on lui donne en entrée un objet n ∈ C, fournit en sortie un objet f(n). Comme à une chaˆıne de caractères on peut associer un entier et réciproquement, nous pouvons considérer tout aussi bien qu’un programme opére sur les entiers.

Notation

Nous notons |n| le nombre de “bits” n´ecessaires pour repr´esenter l’objet n.

− Il y a plusieurs fa¸cons de coder un entier sous forme de chaˆınes de caract`eres, nous y reviendrons.

− Un n-uple d’entiers peut être représenté par un seul entier, moyennant un codage adéquat, nous nous limiterons donc aux fonctions à un argument.

− Tous les langages de programmations usuels (Assembleur, C, Pascal, CAML, Mathemat- ica...) sont équivalents en ce sens qu’une fonction calculable par l’un est calculable par tous les autres. Pour être équivalent à ceux-ci un langage doit comprendre, outre les opérations

élémentaires, les test (IF...) et les boucles “WHILE”, ou bien les tests et les “GO TO”, ou, c’est équivalent, la composition des fonctions et la récursivité (langages fonctionnels), ou encore la possibilité de reconnaˆıtre une chaˆıne de caractères et la remplacer par une autre (Mathematica).

− L’ex´ecution d’un algorithme ne se fait pas toujours en un temps fini : certains algorithmes

“bouclent” indéfiniment. Nous supposerons que pour toutes les valeurs de n l’algorithme s’arrête en un nombre fini d’étapes.

(Rappel : le problème de l’arrêt d’un algorithme est indécidable, mais c’est un autre problème...)

− Nous distinguerons dans la liste d’exemples ci-dessus les “problèmes” (comme la primalité) des algorithmes particuliers pour les résoudre (tester toutes les divisions).

1.3 Algorithme de reconnaissance

Nous nous limiterons dans cette étude aux fonctions à valeurs {0,1}. On peut considérer ces fonctionsn→f(n) comme des tests d’appartenance des objets n∈ C à un certain sous- ensemble (correspondant à la valeur 1). On dit aussi que ces fonctions acceptent un motou reconnaissentle sous langage deLqui est formé par les mots acceptés. Cela définit une classe particulière d’algorithme, mais notons que, à une fonction quelconque n→ f(n) définie sur les entiers, on peut associer la fonction de reconnaissance dont les données sont (n, m) qui

(4)

renvoie 1 si et seulement sim=f(n). On peut donc ramener le calcul def(n) aux probl`emes de reconnaissances successifsf(n) =p pour des valeurs croissantes dep.

Ainsi au problème du voyageur de commerce nous associerons le problème de reconnaissance (TSP) qui consiste à chercher si il existe un circuit hamiltonien de longueur égale ou c’est

équivalent, inférieure à un entierk.

1.4 Différentes notions de complexité d’un algorithme La complexité d’un algorithme présente plusieurs aspects :

Complexité en nombre d’opérations algébriques : notion utile pour des algorithmes qui définissent des fonction algébriques, elle est surtout utilisée pour des calculs en virgule flottante.

Complexit´e en temps : “temps de calcul”. C’est celle que nous allons d´evelopper.

Complexité en espace : “encombrement mémoire”. Elle est toujours inférieure la com- plexité en temps car lire ou écrire un bit est une opération.

Complexité algorithmique : “longueur du programme”. Elle sert à définir la complexité d’un objet comme la longueur du plus court programme qui peut le calculer : une définition précise de cette complexité, la complexité au sens de Cha¨ıtin-Kolmogorova permis de donner une définition précise de la notion de suite aléatoire.

2 La complexit´ e en temps

2.1 Introduction

Notre objectif est de mesurer le “temps de calcul”. Il dépend bien sûr de l’ordinateur sur lequel le programme est exécuté. En première approximation nous pouvons considérer que le temps de calcul est proportionnel aux “nombres d’opérations élémentaires” effectuées par l’algorithme.

Il dépend de la complexité des données, représentée par|n|, la lecture des données est d’ailleurs une borne inférieure de la complexité.

On peut pr´eciser cette notion en remarquant que les ordinateurs op´erant en pratique sur des

“bits” on peut considérer qu’une opération élémentaire est une opération sur les bits. On mesurera donc la complexité en temps par le nombre d’opérations sur les bits, ce qui exige de décomposer les opérations des langages usuels en opérations proches de celles effectueées par des langages de très bas niveau. Bien sûr cela entraˆıne toujours une dépendance vis à vis de l’ordinateur, par exemple du fait de l’utilisation du parallélisme. Pour fixer les idées nous choisirons pour mesurer la complexité une écriture de l’algorithme sous la forme d’une

“Machine de Turing”. Nous supposons donc qu’un algorithme est écrit dans le langage des machines de Turing et nous en déduirons une définition de la complexité

(5)

2.2 Le codage des donn´ees

Nous avons supposé plus haut qu’un algorithme opérait sur des objets appartenant à une certaine classe C définie par des chaˆınes de caractères, ou, c’est équivalent des entiers. Don- nons quelques exemples de codage des données d’un problème sous cette forme en précisant les conséquences de ce codage sur la complexité des algorithmes qui l’utilisent.

• Codage d’un entier n

Il peut être un-aire(une suite de n bâtons), binaire, décimal... Utiliser un codage un- airesignifie en pratique que l’on rapporte la complexité d’un algorithme sur les entiers

`a la valeur de l’entier. Le codage en basek≥2 implique entre l’entiernet la longueur

|n| de sa représentation une relation n ∼ k^|n|. Donc le simple balayage des entiers inférieurs àndéfinit un nombre exponentiel d’opérations par rapport à la longueur |n|

des donn´ees.

• Codage d’un graphe (G, A)

On peut représenter un graphe à n noeuds par sa matrice booléenne, soit n² bits au plus.

• Codage d’un ensemble de clauses ²

On peut représenter un ensemble denclauses (P₁∨ ¬P₂∨...∨Pk) àp variablesPi, i= 1, ..., p par une matrice (n, p) à coefficients dans (1,−1,0) pour représenter la présence d’un symbole de proposition, l’absence de celui-ci ou la présence de sa négation (on peut supposer qu’une variable n’apparaˆıt qu’au plus une fois dans chaque clause, puisque si P_i et ¬P_i figure dans la même clause, celle-ci est toujours vraie , et si P_i ou ¬P_i apparaissent plusieurs fois on peut supprimer les occurences multiples sans changer la valeur de la clause).

Nous verrons d’autres exemples en exercice.

2.3 Les machines de Turing

Le lecteur trouvera sur le WEB de nombreux sites d´ecrivant les machines de Turing. Voir les liens du site du cours.

2.4 Définition précise de la complexité

Définition 1 La complexité d’un algorithme est le nombre d’opérations effectuées par la machine de Turing associée à cet algorithme qui est supposée s’arrêter toujours.

Remarquer que sur une machine de Turing le simple accès à un objet rangé en mémoire (quelque part sur le ruban) est une opération polynomiale. C’est une grande différence avec les ordinateurs actuels pour lesquels une copie d’un élément|n|de la mémoire dans un registre correspond au pire à un nombre d’opérations de l’odre de |n|.

2voir annexe 1 ci-dessous

(6)

3 Les probl` emes P et NP

3.1 Exemples de complexité Un entier nest supposé codé avec |n|bits.

+,*,/ : Les opérations élémentaires sur les entiers (additions, multiplications...). Si les entiers sont représentés en binaire ce sont des opérations dont la complexité est linéaire par rapport à|n|.

PGCD : Entiers premiers entre eux.

L’algorithme d’Euclide appliqué à deux nombres n etm < n réduit à chaque étape le plus grand des deux entiers d’un facteur au moins 2 par une division euclidienne. Il se termine donc en au plus log₂n∼ |n|opérations algébriques. Ce qui fait de l’ordre de

|n|³ opérations élémentaires.

PRIM : Test de primalit´e.

D’après un résultat récent (2002) la complexité est inférieure à C|n|¹². SAT : Satisfiabilité d’un ensemble de clause.

L’algorithme qui teste toutes les valeurs possibles des symboles de propositions (soit 2ⁿ) est exponentiel par rapport aux nombres de symboles, et donc par rapport `a la longueur des donn´ees.

CLIQUE : Etant donn´e un graphe n noeuds existe-t-il une clique (i.e. un sous graphe complet) `a knoeuds ?

L’énumération de tous les sous-graphes àknoeuds exigeC_n^ktests sur ces sous-graphes.

Il existe donc une constante ctelle que le nombre d’op´erations pour cet algorithme est de l’ordre decn^k.

3.2 D´efinitions

Définition 2 La complexité d’un algorithme est polynomial (On dit de classe P) si, il existe une constante C et un entier k tels que le nombre d’opérations effectuées par la machine de Turing associée à cet algorithme pour une données n est inférieur à C|n|^k.

Comme nous l’avons vu au paragraphe précédent, la primalité relative de deux entiers, par l’algorithme d’Euclide, la connexité d’un graphe, par la construction d’un arbre de recouvrement, sont des problèmes qui ont des algorithmes polynomiaux. Il existe un algorithme polynômial pour PRIM, mais, nous l’avons dit plus haut, que ce résultat n’est pas évident.

Nous verrons en exercice qu’il existe une algorithme polynômial pour 2−SAT. Pour CLIQUE, l’algorithme d’énumération des sous-graphe d’ordrekest polynômial si on supposekfixé, mais on considère quek fait partie des données, l’algorithme n’est plus polynômial.

Définition 3 La complexité d’un algorithme est exponentielle (On dit de classe EXP) si, il existe une constante C telle que le nombre d’opérations effectuées par la machine de Turing associée à cet algorithme pour une données nest inférieur à C2^|n|.

(7)

On a donc P ⊂EXP.

Ainsi SAT par énumération des valeurs est exponentiel. Il en est de même de CLIQUE, k-COL, HAM, TSP par les algorithmes d’énumération (et d’ailleurs par tous les algorithmes connus). On ignore s’ils sont dans P. Le test des divisions par tous les entiers inférieurs est un algorithme exponentiel pour PRIM.

3.3 Probl`emes NP

Il est facile de vérifier qu’un sous graphe est une clique d’ordre n, mais il est difficile de trouver cette clique sans parcourir tous les sous-graphes. De même, si on se donne la valeur des symboles de proposition P₁, P₂, ..., Pp il est facile de vérifier qu’un ensemble de clauses construit avec ces symboles est satisfait, mais trouver les bonnes valeurs pour les symboles P_i est difficile.

Tous les algorithmes que nous avons étudiés ci-dessus ont la caractéristique suivante : il est

“facile” de vérifier qu’un objet est solution du problème, mais il est souvent “difficile” de le trouver. Soit, plus précisément, une fonctionf(n) calculable par un algorithme (par exemple n est le code d’un ensemble de clauses et f(n) = 1 si l’ensemble est satisfiable, 0 sinon) on peut dans les exemples ci-dessus associer à un objetnun autre objetm(par exemplemcode un ensemble de valeurs de vérité des symboles P_i) tel que

f(n) = 1 ⇔ g(m) = 1

oùg(m) est une fonction calculable facilement (par exemple le calcul des valeurs des clauses pour des valeurs de vérité définies parm).

Le terme “facile” désigne pour nous un calcul polynômial par rappot à la taille des données ; il y a cependant une petite difficulté : il ne faut pas que l’objet soit trop “gros” sinon un calcul polynômial par rapport à |m| pourrait être exponentiel par rapport à |n| (dans les exemples précédentsnetm sont des objets de même taille (|n| ∼ |m|)).

Cela nous conduit `a poser la d´efinition suivante

Définition 4 Un algorithme pour calculer une fonction f(n) (oùf(n) = 0ou1) est declasse NP (en anglais : non-deterministic polynomial) si il existe une constante C, un entier k, et une fonction g(m) calculable par un algorithme polynomial telle que à toute donnée n on puisse associer une donnée (le “témoin”) m=φ(n) en entrée de g telle que

|m| ≤C|n|^k et queg(m) = 1 si et seulement si f(n) = 1

Il y a beaucoup de variantes dans l’écriture de cette définition, mais la classe NP ne change pas ! Notons que la définition n’exige pas que l’on sache “construire” le témoin φ(n), mais seulement qu’il existe.

Définition 5 Un problème de reconnaissance est de classe P, EXP ou NP si il existe un algorithme de cette classe pour le résoudre.

(8)

3.4 Exemples de probl`emes NP

La totalité des problèmes de reconnaissance définis plus haut sont de classe NP. Un des rares algorithmes pour lequel ce résultat n’est pas trivial (PRIM) s’est révélé être de classe P !

SAT : le probl`eme de la satisfiabilit´e d’un ensemble de clauses.

L’entier m est donc un couple (n, p) où n est le code de l’ensemble des clauses et p le code d’un ensemble de valeurs des symboles. La fonction g(m) est la fonction qui calcule la valeur des clauses avec pour données les clauses et un ensemble de valeurs des symboles ; Le calcul deg(m), par les règles usuelles du calcul booléen, a un nombre d’opérations de l’ordre de la somme des longueurs des clauses, c’est donc un algorithme linéaire vis à vis des donnéesm de g.

k-COL : le probl`eme du coloriage d’un graphe avec kcouleurs.

L’entier m est la donnée du couple (n, p) ou n est le codage du graphe g(m) est une fonction qui teste si deux noeuds adjacents ont la même couleur, et p le codage d’un coloriage des noeuds. Tester la propriété revient à balayer toutes les arêtes, c’est à dire la matrice du graphe, c’est donc un algorithme linéaire.

CLIQUE : le problème de l’existence d’un sous-graphe complet d’ordre k dans un graphe codé par n (les données sont donc n et k). L’entier m est la donnée du couple (n, p) ounest le codage du graphe etp le codage d’un sous-ensemble de noeuds. La fonction g(m) est une fonction qui teste si un sous graphe est complet, . Tester la propriété revient à balayer toutes les arêtes du sous-graphe associé à p, c’est donc un algorithme linéaire (car le codage d’une arête représente un au moins un bit).

3.5 Robustesse de ces d´efinitions

Toutes les opérations algébriques (addition, multiplication...) sont polynomiales. De même les tests, les recopies d’éléments en mémoire, ce qui fait que la classe P ne dépend pas du type d’ordinateur utilisé. Le parallélisme ne fait que modifier la constanteC, l’utilisation de machines de Turing très peu sophistiquées change la valeur de k seulement. Les classes P, EXP, NP sont donc indépendantes des types d’ordinateur utilisés, dès lors que l’algorithme est décomposé en opérations sur des bits.

3.6 Problèmes NP : définitions équivalentes

Un problème NP est par définition tel que f(n) = 1 si et seulement si il existe un entierφ(n) tel queg(φ(n)) = 1, on peut donc aussi écrire que

f(n) = 1 ⇔ ∃mtel queg(m) = 1 sans oublier qu’il doit exister C, k∈N tels que|m| ≤C|n|^k.

Avec avec une légère modification des notations antérieures, on peut considérer que l’objet

(9)

mqui dépend denest le couplem= (n, φ(n))), on peut donc aussi écrire, en modifiant aussi la définition de g, que

f(n) = 1 ⇔ ∃ptel queg(n, p) = 1

Cet entier (ou chaˆıne de caractères)ppeut aussi représenter unkupled’entiers (en plus d’autre chose). Si bien que on peut supposer que le problème associé à la fonctiong a pour données k entiers supplémentaires. Ces entiers ne sont pas connus, mais d’après la définition des problème NP, on suppose qu’il existem, et donc ici des entiers, queg(m) = 1. Cela revient

à dire qu’il existe un “oracle” qui donne les entiers qui permettent de vérifier que le résultat est 1. Comme ces entiers peuvent , par exemple, définir des “GO TO” on peut considérer que ces entiers servent à définir l’ordre de déroulement des instructions du programme : c’est le côté “non détermiste” des algorithmes associés à des problèmes NP.

Définition 6 Un problème de reconnaissance, défini par une fonction f(n), est declasse NP si il existe un programme polynômial mais non déterministe pour tester si f(n) = 1 .

4 Probl` emes NP-Complet

4.1 Repr´esentation d’un probl`eme par un autre

4.1.1 D´efinitions

Définition 7 Un problème de reconnaissance P₁ (données n, fonction f(n)) est polynomialement représentable dans le problème P₂ (données m, fonction g(m)) si, il existe une constante C, un entier k, et une fonctionφ(m) telle que à toutes données nde P₁ on puisse associer une donnéem=φ(n) en entrée de P₂ telle que

|m| ≤C|n|^k et queg(m) = 1 si et seulement si f(n) = 1 On ´ecrit

P₁≤^P P₂ Remarque :

− On n’exige pas de “construire”φ(n).

− La relation P₁ ≤^P P₂ est transitive.

− Si on a un algorithme polynomial pour P₂ on a un algorithme polynomial pour P₁. 4.1.2 Exemples

− Repr´esentation de SAT dans ILP

A chaque symbole de propositionP_i on associe sa valeur de véritéx_i= 0 oux_i = 1. La valeur de¬Pi est donc 1−xi. A une clause, par exemple : Pi∨ ¬Pj∨...∨P_k, on associe l’inégalité

xi+ 1−xj+...+xk ≥1

qui est satisfaite si et seulement si la clause est satisfaite. A un ensemble de nclauses pour psymboles de propositionPi est associé par ce procédé un ensemble de ninégalités linéaires

à p variables, auxquelles on ajoute x_i ≥0 et x_i ≤1. La satisfiabilité des clauses équivaut à

(10)

l’existence d’une solution à ce système d’inéquations linéaires en nombres entiers.

− Repr´esentation de k-COL dans SAT Voir les exercices.

− Repr´esentation de SAT dans 3-SAT Voir les exercices.

− Repr´esentation de 3-SAT dans 3-SATsym Voir annexe 4 ci-dessous.

4.2 Le th´eor`eme de Cook

Théorème 1 Tous les problèmes de classe NP sont polynomialement représentables dans SAT.

Notons qu’il est souvent facile de démontrer qu’un problème est polynomialement représentable dans SAT sans passer par le théorème de Cook (voir en exercice le cas de 3-SAT). Nous ne démontrons pas ce théorème. Sa démonstration repose sur une description du déroulement du programme d’une machine de Turing à l’aide de propositions³ de fa¸con à ce que la donnée de l’ensemble des états du ruban soit équivalente à la donnée d’un ensemble de valeurs satifaisant ces propositions.

4.3 Les probl`emes NP-Complet

Définition 8 Un problème de reconnaissance de classe NP estNP-complet si tout problème de classe NP est polynomialement représentable dans ce problème.

Définition 9 Un problème d’optimisation (ou de calcul d’une fonction) estNP-difficile si le problème de reconnaissance qui lui est associé est NP-complet.

Comme tout problème NP est représentable dans SAT, il suffit de montrer que SAT est représentable dans un problème NP pour montrer que ce problème est NP-complet. En pratique on procède souvent par complexité croissante, par exemple on montre que

SAT ≤^P 3−SAT ≤^P 3−SAT sym≤^P 3−COL SAT ≤^P CLIQU E ≤^P HAM ≤^P T SP 4.4 Exemples de probl`emes NP-complets

SAT : d’après le théorème de Cook.

CLIQUE : parce que SAT est repr´esentable dans CLIQUE (voir annexe 3).

3-SAT : (voir exercices).

3Ex. : “La valeur de la caseiest 0”,“Ecrire 1”, “Déplacer la tête de lecture à gauche”...

(11)

3-SATsym : Nous aurons besoin de ce probl`eme comme interm´ediaire entre 3-SAT et 3-COL (voir annexe 4 ci-dessous).

3-COL : (voir exercices).

HAM : Le probl`eme de l’existence d’un circuit hamiltonien (admis).

TSP : Le probl`eme du voyageur de commerce (admis).

ILP : La programmmation lin´eaire en nombre entiers : nous avons vu ci-dessus que SAT est repr´esentable dans ILP.

Un très grand nombre de problèmes d’une grande utilité pratique (ordonnancement, logis- tique, transport, graphe) sont NP-complets. Si on connaissait un algorithme polynomial pour l’un d’entre eux, on en aurait un pour tous. Pour certains de ces problèmes (comme CLIQUE) il semble naturel qu’il n’y ait pas de méthode plus efficace que l’énumération, d’où

“l’intuition” que ces probl`emes devraient ˆetre dans EXP.

En pratique la notion de problème NP-Complet correspond à des problèmes qui sont aujourd’hui effectivement difficiles ; on ne connaˆıt pas d’algorithmes efficaces pour traiter ces problèmes dans des situations tout à fait usuelles. Or un tel algorithme pour, par exemple, SAT étendrait considérablement les applications de “l’intelligence artificielle”.

4.5 La conjecture P 6=N P

Toute l’expérience acquise laisse penser que les problèmes NP-complet ont une complexité non polynômiale, or la situation étrange aujourd’hui est que on ne sait pas démontrer que ces problèmes NP-complet ne sont pas polynômiaux, c’est la conjecture

P6=NP

?

5 Annexes

5.1 Annexe 1 : une présentation simplifiée du calcul propositionnel, point de vue “sémantique”

− Unevariable (appelée aussi “symbole de proposition”, ou “proposition atomique”, notée P,Pi,Q...)du calcul propositionnel peut prendre deux valeurs (dites de vérité) : Vrai (1) et Faux (0).

− Une formule du calcul propositionel est construite à partir des variables à l’aide des opérateurs (“connecteurs”) négation (¬), disjonction (i.e. le “ou”, noté ∨), conjonction (i.e.

le “et”,∧), exemple : ¬((P₁∨ ¬P₂)∧(P₁∨P₃)) .

− La valeur d’une formule pour des valeurs donn´ees des variables se calcule selon les r`egles bien connues : en notant x, y les valeurs ( 0 ou 1) des variables, on a v(¬x) = 1−x, v(x∧y) = min(x, y) =xy etv(x∨y) = sup(x, y) =x+y−xy).

− L’implication(⇒) etl’équivalence(⇔) sont des symboles dérivés : P ⇒Qsignifie¬P∨Q,

(12)

P ⇔Q signifieP ⇒QetQ⇒P.

− Uneclauseest une formule disjonctive :(P₁∨ ¬P₂∨...∨P_k).

−R`egle de De Morgan :

¬(P ∨Q)⇔ ¬P ∧ ¬Q

¬(P ∧Q)⇔ ¬P ∨ ¬Q

− Distributivit´e:

(P ∨Q)∧R⇔(P ∧R)∨(Q∧R) (P ∧Q)∨R⇔(P ∨R)∧(Q∨R)

− Forme normale :

En utilisant les r`egles ci-dessus on montre que toute formule peut ˆetre mise sous une forme normale conjonctive (P₁∨ ¬P₂∨...∨Pk)∧...∧(¬Pi∨Pj∨...∨Pn) ou disjonctive (P₁∧ ¬P₂∧ ...∧P_k)∨...∨(∧P_i∧P_j∧...∧P_n).

−Un ensemble de formules estsatisfiablesi on peut donner des valeurs de vérité aux variables qui rendent vraies toutes les formules de l’ensemble. Noter que si une formule s’écritC₁∧C₂ elle est satisfiable si et seulement si C₁ et C₂ le sont ; en mettant les formules sous forme normale conjonctive on peut donc toujours considérer que l’ensemble des formules à satisfaire est composé de clauses.

− Une formule est une tautologie si elle est vraie pour toutes les valeurs possibles de ses variables, c’est `a dire aussi si sa n´egation n’est pas satisfiable.

− Unedémonstrationde la formuleCà partir des formules (appelées hypothèses ou axiomes) C_i, i= 1, ..., péquivaut à montrer que la formule (C₁∧...∧C_p)⇒Cest une tautologie. Ce qui revient aussi à démontrer que l’ensemble des formules (C1, ..., C_p,¬C) n’est pas satisfiable, d’où l’importance du problème de la satisfiabilité.

5.2 Annexe 2 : L’algorithme de multiplication matricielle de Strassen Un exemple classique de r´eduction de la complexit´e d’un calcul en virgule flottante par partition.

•Combien de multiplications et additions sont n´ecessaires pour effectuer la multiplication de deux matrices par la formule classique ?

•Montrer que la multiplicationC=ABde deux matrices de dimension 2npartitionn´ees en 4 blocs (n, n) peut s’´ecrire

m₁ = (A₁₂−A₂₂)(B₂₁+B₂₂) m₂ = (A₁₁+A₂₂)(B₁₁+B₂₂) m₃ = (A11−A₂₁)(B11+B₁₂) m₄ = (A₁₁+A₁₂)B₂₂

m₅ = A₁₁(B₁₂−B₂₂) m₆ = A₂₂(B₂₁−B₁₁) m₇ = (A₂₁+A₂₂)B₁₁

(13)

puis :

C₁₁ = m₁+m₂−m₄+m₆ C₁₂ = m₄+m₅

C₂₁ = m₆+m₇

C₂₂ = m₂−m₃+m₅−m₇

Noter qu’il y a 7 multiplications et 18 additions de blocs.

•Supposons que les matrices soient de dimensionn= 2^p (sinon on complète les matrices par des zéros jusqu’à obtenirn= 2^p). On effectue récursivement la multiplication des blocs, montrer que le nombre d’opérations (additions et multiplications)T(n) nécessaires pour calculer le produit est solution de la récurrence

T(n) = 7T(n

2) + 18(n

2)², T(1) = 1 Corr. Comptez...

• Soit² >0. Montrer qu’il existe une constanteC >0 telle que n^log²⁷≤T(n)≤Cn^log²^(7+²) Le calcul exact montre que T(n)< n³ pour n≥2¹⁵.

Corr. On a

T(n)≥7T(n 2)

et doncT(n)≥n^log²⁷. Soit² >0, comme log₂7>2 il existep₀ tel que sin >2^p⁰ on a 18(n

2)²≤²(n

2)^log²⁷ ≤²T(n 2) et doncT(n)≤(7 +²)T(ⁿ₂) d’o`u

T(2^p)≤(7 +²)^p−p⁰T(2^p⁰) et doncT(n)≤C(7 +²)^p avec C = (7 +²)^−p⁰T(2^p⁰), d’o`u

T(n)≤C(7 +²)^log²ⁿ=Cn^log²^(7+²) 5.3 Annexe 3 : CLIQUE est NP-complet

Nous avons vu que CLIQUE est NP, il nous reste donc à montrer que SAT est représentable dans CLIQUE ; SAT étant NP-complet d’après le théorème de Cook, nous aurons donc montré que CLIQUE est NP-complet.

Soit un ensemble de n clauses avec p symboles de proposition. Nous pouvons associer un graphe `a ces clauses de la mani`ere suivante :

− Pour chaque clause (P₁∨ ¬P₂∨...∨P_k) on cr´eeknoeuds et nous appellerons pour chacun de ces noeuds la propositionPi ou¬Pi, la “proposition associ´ee”.

− On crée une arête entre deux noeuds si les deux conditions suivantes sont vérifiées :

(14)

1. les deux noeuds ne sont pas associés à des propositions qui sont la négation l’une de l’autre (i.e. P_i et ¬P_i)

2. les deux noeuds n’appartiennent pas `a la mˆeme clause.

Nous allons montrer

Lemme 1 L’ensemble des clauses est satisfiable si et seulement il existe une clique⁴ `a n noeuds dans le graphe.

⇒) Montrons que si il existe une clique (i.e. un sous-graphe complet) à n éléments dans ce graphe, on peut donner des valeurs aux symbolesPi, i= 1, ..., pqui rendent toutes les clauses vraies.

Les n noeuds de cette clique appartiennent à différentes clauses (d’après 2) et la clique ne contient pas simultanément une proposition et sa négation (d’après 1). Si on attribue la valeur “Vrai” à toutes les propositions associées aux noeuds de cette clique toutes les clauses seront vraies ( donc si c’est P_i, P_i sera vraie, et si c’est ¬Pj, P_j sera fausse, c’est possible puisque Pi et ¬Pi ne figure pas ensemble dans les noeuds de la clique) . Si un symbole Pj

ne figure pas dans la clique on lui attribue une valeur quelconque ; ainsi tous les symboles P_i, i= 1, ..., pont une valeur et toutes les clauses sont vraies.

⇐) Montrons que si il existe des valeurs des symbolesPi qui rendent lesnclauses vraies alors il existe une clique `a nnoeuds dans le graphe.

Chosissons dans chacune des nclauses une proposition P_i ou ¬Pi qui est vraie. On obtient ainsi une liste de n noeuds associés à des propositions vraies, appartenant à des clauses différentes, et dans cette liste ne peuvent donc figurer à la fois une proposition et sa négation.

Cesnnoeuds v´erifient donc 1 et 2 et forment donc une clique.

5.4 Annexe 4 : 3-SATsym est NP-complet Soit un ensemble E de nclauses L¹_i ∨L²_i ∨L³_i à 3 éléments.

Définition 10 On note 3-SATsym le problème consistant à décider la propriétéΠ :

il existe un ensemble de valeurs de véritéP_j =V rai ouP_j =F auxtelles que dans toutes les clauses il y ait (au moins) un élément vrai et (au moins) un élément faux.

Nous voulons d´emontrer le

Th´eor`eme 2 3-SATsym est NP-complet.

Il suffit de montrer que 3-SATsym ≤^P 3-SAT et 3-SAT ≤^P 3-SATsym. Or 3-SATsym est clairement un problème NP, mais il n’est pas nécessaire de faire appel au théorème de Cook pour montrer la

Proposition 1 3-SATsym est polynˆomialement repr´esentable dans 3- SAT.

4Rappelons qu’une clique est un sous-graphe complet

(15)

En effet considérons un ensembleE de nclauses de 3-SATsym et l’ensembleF desnclauses obtenues en rempla¸cant chaque symbole par sa négation. L’ensembleE a la propriété Π si et seulement si l’ensemble E∪F est satisfiable. Or le codage de E∪F est d’un encombrement au plus double de celui de E.

Montrons dans l’autre sens la

Proposition 2 3-SAT est polynˆomialement repr´esentable dans 3- SATsym.

Ajoutons une symbole de proposition Qi, i = 1, ..., n pour chaque clause de E, qui nous servira à “donner un nom” à L¹_i ∨L²_i, et un symbole R qui nous servira à “allonger” toutes les clauses de longueur 2 pour n’avoir que des clauses de longueur 3. Il suffit de montrer le Lemme 2 Lesn clauses L¹_i ∨L²_i ∨L³_i, i= 1, ..., n sont satisfiables si et seulement si les 4n clauses

L¹_i ∨L²_i ∨ ¬Qi (1)

¬L¹_i ∨Q_i∨R (2)

¬L²_i ∨Qi∨R (3)

L³_i ∨Qi∨R (4)

ont la propri´et´e Π.

Notons que la signification des 4 clauses apparaˆıt plus clairement en les r´e´ecrivant sous la forme

Q_i ⇒L¹_i ∨L²_i (5)

L¹_i ⇒Q_i∨R (6)

L²_i ⇒Q_i∨R (7)

L³_i ∨Q_i∨R (8)

Cela montre que, si on supposeR faux (nous montrerons que l’on peut se ramener à ce cas), les trois premières clauses signifient que Q_i⇔L¹_i ∨L²_i (Le symboleQ_i n’est donc qu’un nom pour L¹_i ∨L²_i) et que la dernière clause n’est autre que L¹_i ∨L²_i ∨L³_i.

⇐) Par hypothèse l’ensemble E des clausesL¹_i ∨L²_i ∨L³_i, i= 1, ..., n est satisfait par un jeu de valeurs des symboles L^j_i. Donnons à Qi la même valeur qu’à L¹_i ∨L²_i et à R la valeur

“Faux”. Il y a alors deux possibilit´es :

− Q_i a la valeur “Vrai”, c’est donc aussi la valeur de L¹_i ∨L²_i, on vérifie par inspection que l’ensemble des 4 clauses (4) a la propriété Π.

− Q_i a la valeur “Faux”, c’est donc aussi la valeur de L¹_i ∨L_i² donc L¹_i et L²_i ont la valeur

“Faux”, on vérifie de nouveau par inspection que l’ensemble des 4 clauses (4) a la propriété Π.

⇒) Par hypothèse l’ensemble des clauses (8) est satisfait par un jeu de valeurs des symboles L^j_i, Q_i, R. Supposons que R ait la valeur “Faux”. Des trois premières propositions de (8) on déduit queL¹_i∨L²_i a la même valeur de vérité queQi et, commeQi∨L³_i est vrai,L¹_i∨L²_i∨L³_i est vrai.

Sinon, si R est faux, en changeant la valeur de vérité de tous les symboles L^j_i, Q_i, R en la valeur complémentaire l’ensemble des clauses (8) est toujours satisfait d’après la propriété Π etR a la valeur “Faux”, nous sommes donc ramenés au cas précédent.

(16)

5.5 Bibliographie

C. Papadimitriou, K. Steiglitz, Combinatorial Optimization: Algorithms and Complexity, Prentice-Hall, 1983.

M.R. Garey, D.S. Johnson, Computers and Intractibility: A Guide to the theory of NP- Completeness. San Francisco: W.H. Freeman & Company, Publishers 1979.

Voir aussi sur le WEB les liens du site du cours, www.etudes.ecp.fr.

S.L

4 Probl` emes NP-Complet

Optimisation discr`ete, s´eance 3 : cours TH´ EORIE de la COMPLEXIT ´ E

1 La notion d’algorithme

2 La complexit´ e en temps

3 Les probl` emes P et NP

4 Probl` emes NP-Complet

?

5 Annexes

CENTRALE