Complexité en temps

Plan

Définitions
Accélération
Changement de modèle
Classes de complexité en temps
Exemples de problèmes dans P et dans NP
Classe NP et vérification en temps polynomial
Réductions polynomiales
NP-complétude
NP-complétude de SAT et de 3-SAT
Autres problèmes NP-complets

On s'intéresse ici à la complexité des problèmes c'est-à-dire aux ressources nécessaires pour les résoudre. Les ressources essentielles sont le temps et l'espace. On ne considère ici que des problèmes décidables. On suppose donc que toutes les machines de Turing considérées s'arrêtent toujours. On commence par étudier le temps de calcul des machines de Turing.

Définitions

Soit M une machine de Turing (a priori non déterministe) et soit w un mot sur l'alphabet d'entrée de M. On suppose que la machine M n'a pas de calcul infini. La longueur d'un calcul de M sur w est le nombre d'étape de calcul pour atteindre une configuration bloquante. Le temps de calcul t_M(w) de la machine M sur l'entrée est la longueur du plus long calcul ayant w comme entrée. Si la machine M est déterministe, il n'y a qu'un seul calcul d'entrée w et le temps t_M(w) est la longueur de cet unique calcul. Si la machine est non déterministe, le temps de calcul prend en compte le cas le pire, c'est-à-dire le calcul le plus long.

En fait, on s'intéresse moins au temps de calcul sur une entrée fixée qu'au comportement de la machine pour une taille d'entrée donnée. On définit la fonction de complexité en temps t_M de M de la manière suivante.

t_M(n) = max_|w|=n t_M(w).

La valeur t_M(n) représente la longueur du plus long calcul de M avec une entrée de taille n. C'est encore une fois le cas le pire qui est considéré. L'essentiel n'est pas la valeur de t_M(n) pour des valeurs précises de n mais le comportement de la fonction t_M lorsque n devient grand. On s'intéresse plus au comportement asymptotique de t_M qu'à des valeurs particulières.

Pour comparer les comportements asymptotiques des fonctions, on utilise la notation O (grand O). Soit t une fonction de N dans R⁺. On dit qu'une machine M décide un langage L (et par extension un problème codé par L) en temps t(n) si L est le langage accepté par M et si la fonction de complexité de M vérifie t_M = O(t).

Accélération

Dans la suite, on s'intéresse à la complexité d'un problème à une constante près. En effet, les comportement asymptotiques des fonctions sont comparés à l'aide de la notation O. Ce choix est motivé par le résultat suivant qui dit qu'on peut toujours diviser le temps de calcul par une constante.

Proposition. Soit f une fonction de N dans R⁺ telle que n = O(t(n)) et soit M une machine de Turing en temps t(n). Pour tout constante k, il existe une machine de Turing M' équivalente à M et en temps t(n)/k.

Changement de modèle

On a vu que les différentes variantes de machines de Turing sont équivalentes dans le sens où toute machine d'un modèle peut être simulée par une machine d'un autre modèle. Par contre ces simulations ont une incidence sur les temps de calcul. On étudie ici le coût du passage d'un modèle à un autre.

Machines à plusieurs bandes

On a montré que toute machine à plusieurs bandes peut être simulée par une machine à une seule bande. L'idée de la simulation consiste à regrouper toutes les bandes en une seule bande. Pour simuler une seule transition de la machine à plusieurs bandes, la machine à une bande doit parcourir entièrement toute la bande. Comme le nombre de cellules de la bande contenant un symbole différent du symbole blanc est borné par le temps de calcul de la machine, on obtient le résultat suivant.

Proposition. Soit t une fonction de N dans R⁺ telle que t(n) ⩾ n pour tout n ⩾ 0. Une machine à plusieurs bandes qui fonctionne en temps t(n) est équivalente à une machine à une seule bande qui fonctionne en temps t²(n).

Machines non déterministes

On a également montré que toute machine non déterministe peut être simulée par une machine déterministe. La simulation consiste alors à essayer successivement tous les calculs de la machine non déterministe. Si la machine non déterministe fonctionne en temps t(n), le nombre de calculs possibles pour une entrée de taille n est borné par k^t(n) où k est le nombre maximal de transitions qui peuvent être effectuées à partir d'une configuration. L'entier k est le cardinal maximal des ensembles δ(p, a) = { (q, b, x) | p, a → q, b, x ∈ E } pour tout p et tout a. La temps de simulation d'un calcul est proportionnel à la longueur de ce calcul. Le temps nécessaire pour simuler tous les calculs est donc de l'ordre de t(n)k^t(n). Comme on a la relation t(n)k^t(n) = 2^O(t(n)) si t(n) ⩾ n, on obtient le résultat suivant.

Proposition. Soit t une fonction de N dans R⁺ telle que t(n) ⩾ n pour tout n ⩾ 0. Une machine non déterministe qui fonctionne en temps t(n) est équivalente à une machine déterministe qui fonctionne en temps 2^O(t(n)).

Classes de complexité en temps

Pour les complexité en temps, on distingue les machines déterministes des machines non déterministes. Soit t une fonction de N dans R⁺. Pour les machines déterministes, on définit la classe TIME(t(n)) des problèmes qui peuvent être résolus en temps t(n).

TIME(t(n)) = { L | L peut être décidé en temps t(n) par une machine de Turing déterministe }

Pour les machines non déterministes, on définit la classe NTIME(t(n)) des problèmes qui peuvent être résolus en temps t(n).

NTIME(t(n)) = { L | L peut être décidé en temps t(n) par une machine de Turing }

La classe importante est celle des problèmes qui peuvent être résolus en temps polynomial par une machine déterministe. On définit la classe P de la manière suivante.

P = ⋃_k⩾0 TIME(n^k)

De manière analogue, on définit la classe des problèmes qui peuvent être résolus en temps polynomial par une machine non déterministe.

NP = ⋃_k⩾0 NTIME(n^k)

On a bien sûr l'inclusion triviale P ⊆ NP. Le problème de savoir s'il y a égalité ou non est un problème ouvert extrêmement difficile.

On considère aussi la classe EXPTIME des problèmes qui peuvent être résolus en temps exponentiel par une machine déterministe.

EXPTIME = ⋃_k⩾0 TIME(2^{n^k})

Les relations entre les différents modèles de machines montrent qu'on a les inclusions suivantes.

P ⊆ NP ⊆ EXPTIME

Exemples de problèmes dans P et dans NP

Accessibilité dans un graphe

Le problème d'accessibilité dans un graphe orienté est de savoir si un graphe G donné contient un chemin de s à t pour deux sommets s et t également donnés.

L = { ⟨G, s, t⟩ | G contient un chemin de s à t }

Ce problème peut être résolu par un parcours en largeur du graphe qui s'effectue en temps linéaire dans un langage de programmation classique. Le langage L peut donc être décidé en temps polynomial par une machine de Turing déterministe. Le problème d'accessibilité appartient par conséquent à la classe P.

Clique d'un graphe

Une clique de taille k d'un graphe non orienté G = (V, E) est un sous-ensemble { v₁, …, v_k } de sommets de G tels que toutes les arêtes (v_i, v_j) pour tout 1 ⩽ i < j ⩽ k sont présentes dans G.

Le problème CLIQUE est de savoir si un graphe G donné contient une clique d'une taille k également donnée. Ce problème est donc codé par le langage suivant.

L = { ⟨G, k⟩ | G possède une clique de taille k }

Un algorithme non déterministe pour décider ce langage L peut fonctionner de la manière suivante. L'algorithme commence par choisir de façon non déterministe k sommets v₁, …, v_k de G. Ce choix se fait en temps linéaire en la taille du graphe. Ensuite, l'algorithme vérifie que les toutes les arêtes (v_i, v_j) pour tout 1 ⩽ i < j ⩽ k sont présentes dans G et il accepte si c'est le cas. Cette vérification peut se faire en temps polynomial puiqu'il y a de l'ordre de k² arêtes à tester. Cet algorithme décide si le graphe G possède une clique de taille k. En effet, il y a un calcul de l'algorithme pour chaque choix possible de k sommets. Un de ces calculs est acceptant si G contient une clique. Le problème de la clique appartient donc à la classe NP.

Satisfiabilité d'une formule

On introduit ici le problème SAT de satisfiabilité d'une formule et sa variante 3-SAT.

Une formule est formée à partir de variables booléennes en utilisant les trois opérateurs de négation (noté par le symbole ¬), du et logique (noté par le symbole ∧) et du ou logique (noté par le symbole ∨). Par exemple, la formule φ = (x ∨ ¬y ∨ z) ∧ (¬x ∨ t) utilise les quatre variables x, y, z, et t.

Un littéral est soit une variable soit la négation d'une variable comme x ou ¬x. La négation d'une variable x est souvent notée en mettant une barre au dessus de la variable. Une clause est la disjonction (c'est-à-dire le ou) de un ou plusieurs littéraux comme x ∨ ¬y ∨ z. Une formule est dite en forme normale conjonctive si elle est la conjonction (c'est-à-dire le et) de une ou plusieurs clauses comme la formule φ ci-dessus.

Une formule est dite satisfiable s'il est possible d'affecter une valeur vrai (noté 1) ou faux (noté 0) à chacune des variables de telle façon que la formule ait la valeur vrai. La formule φ ci-dessus est satisfiable car elle prend la valeur 1 lorsqu'on affecte les valeurs x = 1, y = 0, z = 0 et t = 1, par exemple. Par contre la formule x ∧ ¬x ∧ y n'est pas satisfiable.

Le problème de satisfiabilité SAT est de savoir si une formule donnée est satisfiable. Le problème de satisfiabilité 3-SAT est de savoir si une formule donnée en forme normale conjonctive avec trois littéraux par clause est satisfiable. Le problème 3-SAT est donc un cas particulier de SAT.

Une instance du problème 3-SAT est une formule de la forme

φ = (a₁ ∨ b₁ ∨ c₁) ∧ (a₂ ∨ b₂ ∨ c₂) ∧ … ∧ (a_k ∨ b_k ∨ c_k)

où chacun des a_i, b_i et c_i est un littéral x_j ou ¬x_j pour une variable x_j.

Les problèmes SAT et 3-SAT sont décidés par l'algorithme non déterministe suivant. L'algorithme commence par choisir de façon non déterministe la valeur affectée à chacune des variables. Ensuite l'algorithme calcule la valeur de la formule et vérifie que cette valeur est bien 1. Ce calcul de la valeur se fait bien sûr en temps linéaire. Les problèmes SAT et 3-SAT sont donc dans la classe NP.

Classe NP et vérification en temps polynomial

Les deux algorithmes ci-dessus pour le problème de la clique et le problème de satisfiabilité d'une formule ont la même structure. Ils sont tous les deux formés de deux parties. Dans une première partie, l'algorithme choisit de façon on déterministe un objet et dans une seconde partie, il vérifie que cet objet satisfait une certaine propriété. Pour le problème de la clique, l'objet choisi est un sous-ensemble de sommets et il est vérifié que ce sous-ensemble de sommets constitue effectivement une clique. Pour le problème de satisfiabilité, l'objet choisi est une affectation aux variables et il est vérifié que cette affectation donne la valeur vrai à la formule. Dans les deux cas, la vérification se fait en temps polynomial. Ceci est un principe général. Tout problème de la classe NP est équivalent à un problème de vérification en temps polynomial.

Un vérificateur en temps polynomial pour un langage L est une machine de Turing V déterministe qui prend des entrées de la forme ⟨w, c⟩ avec un temps de calcul polynomial en la taille de w et tel que :

L = { w | ∃ c tel que V accepte ⟨w, c⟩ }

On a la proposition suivante qui établit que les problèmes de la classe NP sont ceux qu'on peut vérifier en temps polynomial.

Proposition. Un langage L est dans la classe NP si et seulement si il existe un vérificateur en temps polynomial pour L.

S'il existe un vérificateur V pour L, on peut construire, de la manière suivante une machine M non déterministe qui décide L et qui fonctionne en temps polynomial. La machine commence par choisir de façon non déterministe c puis simule le vérificateur V sur ⟨w, c⟩ pour vérifier que V accepte cette entrée. Puisque V fonctionne en temps polynomial, c doit être de taille polynomiale et donc tout le calcul de M se fait en temps polynomial.

Réciproquement, supposons que la machine M non déterministe décide le langage L. On associe à chaque w, la suite c des transitions effectuées par la machine M pour accepter w. Par définition, cette suite est de longueur polynomiale. Le vérificateur V simule la machine M sur w le long du calcul c pour vérifier que c'est effectivement un calcul acceptant w. Cette vérification se fait en temps proportionnel à c et donc en temps polynomial.

Réductions polynomiales

Dans le cadre des problèmes décidables, une réduction permet de ramener la décidabilité d'un problème à celle d'un autre problème. On introduit des réductions qui prennent en compte le temps de calcul de la fonction qui fait passer d'un problème A à un autre problème B. Une réduction polynomiale fait correspondre à une instance du problème A une instance du problème B qui a la même réponse et qui est calculable en temps polynomial.

On suppose que les problèmes A et B sont codés par les langages L_A et L_B sur des alphabets Σ_A et Σ_B. Une réduction polynomiale de A à B est une fonction f de Σ_A^* dans Σ_B^* calculable en temps polynomial par une machine de Turing telle que

w ∈ L_A ⇔ f(w) ∈ L_B

On note A ⩽_P B lorsqu'il existe une réduction polynomiale du problème A au problème B.

Exemple de réduction

Pour illustrer la notion de réduction polynomiale, nous allons montrer une réduction du problème 3-SAT au problème CLIQUE. Soit φ une instance de 3-SAT, c'est-à-dire une formule en forme conjonctive telle que chaque clause de φ contienne trois littéraux.

φ = (l₁ ∨ l₂ ∨ l₃) ∧ (l₄ ∨ l₅ ∨ l₆) ∧ … ∧ (l_3k-2 ∨ l_3k-1 ∨ l_3k)

On introduit alors le graphe non orienté G dont l'ensemble des sommets est l'ensemble V = { l₁, …, l_3k } de tous les littéraux de φ. Deux sommets de G sont reliés par une arête s'ils n'appartiennent pas à la même clause et s'ils ne sont pas contradictoires. Par non contradictoire, on entend que l'un n'est pas égal à la négation de l'autre. L'ensemble E des arêtes est donc défini de la manière suivante.

E = { (l_i, l_j) | ⌊(i-1)/3⌋ ≠ ⌊(j-1)/3⌋ et l_i ≠ ¬l_j }

En effet, le numéro de la clause d'un littéral l_i est égal à ⌊(i-1)/3⌋ si les clauses sont numérotées à partir de 0.

Pour la formule φ = (x₁ ∨ x₂ ∨ x₃) ∧ (¬x₁ ∨ ¬x₂ ∨ x₃) ∧ (x₁ ∨ x₂ ∨ ¬x₃), on obtient le graphe représenté à la figure ci-dessous.

Fig. 1 : graphe associé à la formule φ

Nous allons voir que la formule φ est satisfiable si et seulement si le graphe G contient une clique de taille k. On remarque que deux littéraux d'une même clause ne sont jamais reliés par une arête. Une clique peut donc contenir au plus un littéral par clause et elle est de taille au plus k.

Supposons d'abord que la formule φ est satisfiable. Il existe donc une affectation des variables telle que φ vaille 1. Ceci signifie qu'au moins un littéral par clause vaut la valeur 1. Choisissons un tel littéral dans chacune des clauses pour former un ensemble de k littéraux. Comme tous ces littéraux valent 1, deux d'entre eux ne peuvent pas être contradictoires et ils sont donc reliés par des arêtes. C'est donc une clique de taille k dans G.

Supposons maintenant que G contienne une clique de taille k. Comme les littéraux d'une même clause ne sont pas reliés, cette clique contient un littéral exactement dans chaque clause. Montrons alors qu'il existe une affectation qui rend tous ces littéraux égaux à 1. Chaque littéral de cette clique est égal à x_i ou à ¬x_i. Pour que ce littéral vaille 1, on impose la valeur 1 ou 0 à la variable correspondante x_i. Comme tous les littéraux de la clique sont reliés par une arête, ils ne sont pas contradictoires deux à deux. Ceci signifie que deux littéraux quelconques de la clique concernent deux variables distinctes x_i et x_j avec i ≠ j ou alors ils concernent la même variable x_i mais ils imposent la même valeur à la variable x_i. On obtient alors une affectation cohérente des variables apparaissant dans la clique. En affectant n'importe quelle valeur à chacune des autres variables, on obtient une affectation qui donne la valeur 1 à la formule φ.

NP-complétude

De manière intuitive, un problème est NP-complet s'il est parmi les problèmes les plus difficiles de la classe NP. Plus formellement un problème A est dit NP-complet si les deux conditions suivantes sont remplies.

le problème A est dans la classe NP, c'est-à-dire A ∈ NP,
tout problème NP se réduit polynomialement à A, c'est-à-dire B ⩽_P A pour tout B ∈ NP.

Si seule la seconde condition est vérifiée, on dit que le problème A est NP-difficile.

L'intérêt des problèmes NP-complets est double. D'un point de vue théorique, ces problèmes sont des candidats potentiels pour être des problèmes de la classe NP qui ne sont pas dans P si NP est différent de P. En effet, il suffit qu'un seul problème NP-complet soit dans P pour qu'on ait l'égalité P = NP. D'une point de vue pratique, le fait qu'un problème est NP-complet montre qu'il est utopique de chercher un algorithme polynomial résolvant ce problème puisque cet algorithme résoudrait du même coup des centaines d'autres d'autres problèmes qui ont fait l'objet de recherches intensives.

NP-complétude de SAT et de 3-SAT

Un résultat important est qu'il existe effectivement des problèmes qui sont NP-complets. Le résultat suivant est dû à Cook et Levin.

Théorème (Cook et Levin). Les problèmes SAT et 3-SAT sont NP-complets.

Il a déjà été vu que les deux problèmes SAT et 3-SAT sont dans la classe NP. Pour montrer qu'ils sont en outre NP-complets, il reste à montrer que tout problème de la classe NP se réduit polynomialement à SAT et à 3-SAT. Dans une première étape, on réduit un problème quelconque de NP à SAT. Ceci montre que SAT est NP-complet. Dans une seconde étape, on réduit SAT à 3-SAT. En composant les deux réductions, on obtient que 3-SAT est également NP-complet.

Soit A un problème de la classe NP. Il est donc accepté par une machine de Turing M a priori non déterministe. Nous allons montrer que pour toute entrée w de M, il existe une formule φ_w de taille polynomiale en la taille de w qui est satisfiable si et seulement si w est acceptée par M. L'idée est que la formule φ_w code d'une certaine manière l'existence d'une calcul acceptant de M sur l'entrée w.

On note n = |w| la taille de l'entrée w. Puisque la machine M fonctionne en temps polynomial, il un entier fixe k tel que tout calcul sur w soit de longueur au plus n^k. Quitte à modifier M en ajoutant une boucle d'attente, on peut supposer que tout calcul acceptant sur w est de longueur n^k exactement. Comme la machine M fonctionne en temps n^k, elle utilise au plus n^k cellules de la bande. Les configurations d'un calcul acceptant sont donc de longueur au plus n^k. Quitte à écrire quelques symboles blancs implicites à la fin de la configuration, on peut supposer que toutes les configurations sont exactement de tailles n^k. En écrivant toutes ces configurations les unes au-dessus des autres, on obtient un tableau de symboles (pris dans Γ ∪ Q) de taille n^k × n^k (cf. figure ci-dessous). On écrit alors une formule φ_w qui code l'existence d'un tel tableau de symboles formé par les configurations successives d'un calcul acceptant sur w.

Tableau formé par les configurations.
Conf.	0	1	2	3	…	n^k
C₀ =	q₀	w₁	w₂	w₃	…	#
C₁ =	w'₁	q₁	w₂	w₃	…	#
C₂ =	w'₁	w'₂	q₂	w₃	…	#
C₃ =	…	…	…	…	…	#
…	…	…	…	…	…	…
C_n^k	…	…	…	…	…	…

Pour chaque case (i, j) du tableau avec 0 ⩽ i, j ⩽ n^k et pour chaque symbole a de l'alphabet A = Γ ∪ Q, on introduit une variable x_{i, j, a} qui code le fait que la case (i, j) du tableau contienne ou non le symbole a. Le nombre de ces variables |A| × n^2k qui est bien polynomial en n.

La formule φ_w se décompose en la conjonction φ_cell ∧ φ_start ∧ φ_move ∧ φ_accept où chacune des quatre formules φ_cell, φ_start, φ_move et φ_accept code un des aspects de l'existence d'un chemin acceptant. La formule φ_cell code le fait que chaque cellule du tableau contient un et un seul symbole de A. Ceci signifie que pour chaque i et j fixés une seule des variables x_{i, j, a} reçoit la valeur 1. La formule φ_start code le fait que la première ligne du tableau est bien la configuration initiale q₀w. La formule φ_move code le fait que chaque ligne du tableau est obtenue à partir de la précédente en appliquant une des transitions de la machine M. Cette formule assure que le tableau est bien issu d'un calcul. La dernière formule φ_accept code le fait que ce calcul est acceptant, c'est-à-dire que l'état de la dernière configuration est acceptant. La seule formule délicate à écrire est la formule φ_move.

La formule φ_cell est la conjonction d'une formule pour chaque cellule (i, j). Cette dernière garantit qu'au moins une des variables x_{i, j, a} a la valeur 1 mais que deux variables x_{i,
j, a} et x_{i, j, b} pour a ≠ b ne peuvent avoir la valeur 1 simultanément. La formule φ_cell s'écrit de la façon suivante.

φ_cell = ∧_{0 ⩽ i, j ⩽ n^k} [(∨_{a ∈ A} x_{i, j, a}) ∧ (∧_{a ≠ b} ¬(x_{i, j, a} ∧ x_{i, j, b})) ]

La formule φ_start s'écrit directement de la façon suivante.

φ_start = x_{0, 0, q₀} ∧ x_{0, 1, w₁} ∧ x_{0, 2, w₂} ∧ … ∧ x_{0, n, w_n} ∧ x_{0, n+1, #} ∧ … ∧ x_{0, n^k, #}

La formule φ_accept assure qu'au moins une des cases de la dernière ligne du tableau contient un état final. Elle s'écrit simplement de la façon suivante.

φ_accept = ∨_{0 ⩽ j ⩽ n^k et q ∈ F} x_{n^k, j, q}

La formule φ_move mérite un peu plus d'attention. Il faut remarquer que le contenu d'une case (i, j) dépend uniquement des contenus des trois cases au-dessus (i-1, j-1), (i-1, j) et (i-1, j+1) et de la transition qui a été effectuée par la machine pour passer de la configuration C_i-1 à la configuration C_i. En fait, il est seulement nécessaire de connaître la transition effectuée lorsqu'une des trois cases au-dessus contient l'état de la configuration C_i-1. Si les trois symboles contenus dans les trois cases au-dessus sont des symboles de bande, alors le symbole de la case (i, j) est identique au symbole de la case (i-1, j). Ces remarques impliquent qu'il est possible de vérifier que la ligne i est bien obtenue à partir de la ligne i-1 uniquement en regardant les contenus des fenêtres de taille 2 × 3. La machine M étant fixée, on considère tous les contenus possibles des fenêtres de taille 2 × 3. Le nombre de ces contenus possibles ne dépend que de l'alphabet et des transitions de la machine. C'est donc un nombre fixe qui ne dépend pas de n. Le fait que six cases du tableau correspondent s'écrit comme une conjonction de six variables x_{i, j,
a}. Le fait que toutes les parties de six cases du tableaux correspondent à un des contenus possibles des fenêtre s'exprime par la conjonction pour 0 ⩽ i, j ⩽ n^k d'une disjonction sur les différents contenus. Ceci est une formule de taille polynomiale en n.

Réduction de SAT à 3-SAT

Nous montrons maintenant que le problème SAT se réduit polynomialement au problème 3-SAT. Nous montrons que pour toute formule quelconque φ, il existe une formule φ' en forme normale conjonctive avec trois littéraux par clause et calculable en temps polynomial telle que φ est satisfiable si et seulement si φ' est satisfiable. Le calcul de φ' se fait en trois étapes. La première étape consiste à ramener toutes les négations devant les variables pour obtenir une formule sans négation autre que dans les littéraux. La seconde étape consiste à obtenir une formule en forme normale conjonctive mais avec des clauses ayant des nombres quelconques de littéraux. La troisième et dernière étape produit finalement la formule φ' en forme normale conjonctive avec trois littéraux par clause. Les première et troisième étapes sont faciles. Par contre la deuxième étape recèle une difficulté.

Première étape

La première étape fait descendre les négations à l'intérieur de la formule en utilisant les lois de De Morgan : ¬(A ∨ B) ≡ ¬A ∧ ¬B et ¬(A ∧ B) ≡ ¬A ∨ ¬B où le symbole ≡ signifie que deux formules sont équivalentes. Cette descente des négations s'arête lorsque toutes celles-ci se trouvent devant des variables. La formule obtenue est équivalent à la formule de départ. Cette transformation des formules se fait en temps linéaire si les formules sont représentées sous formes d'arbres et donc en temps polynomial sur une machine de Turing.

Deuxième étape

La formule de départ n'utilise plus de négation hormis dans les littéraux. La formule est donc uniquement constituée des opérateurs ∧ et ∨. Une première idée naïve serait d'utiliser la distributivité de chacun de ces opérateurs par rapport à l'autre pour obtenir une formule équivalente en forme normale conjonctive. Cette approche ne marche pas car la formule obtenu peut avoir une taille exponentielle en la formule de départ. La formule φ ci-dessous est un exemple pathologique.

φ = (x₁ ∧ y₁) ∨ (x₂ ∧ y₂) ∨ … ∨ (x_n ∧ y_n)

Si la formule φ est développée, on obtient la conjonction de tous les monômes de la forme z₁ ∨ z₂ ∨ … ∨ z_n où chaque z_i est soit x_i soit y_i. Comme il y a 2ⁿ monômes de cette forme, la formule développée a une taille de l'ordre n2ⁿ alors que la taille de φ est de l'ordre de n.

L'idée pour éviter ce problème est de calculer une formule φ'' qui n'est pas nécessairement équivalente à la formule de départ. Par contre la propriété d'être satisfiable reste préservée par la formule φ''. L'idée est que les affectations de la formule φ se prolongent en plusieurs affectations de la formule φ''.

Le calcul de la formule se fait par induction sur la forme de la formule φ.

Si φ est de la forme φ = E ∧ F, on calcule récursivement des formules E' et F' en forme normale conjonctive pour E et F et on prend comme formule φ' = E' ∧ F'.
Si φ est de la forme φ = E ∨ F, on calcule récursivement des formules E' et F' en forme normal conjonctive. Supposons que ces deux formules sont respectivement donnée par E' = E₁ ∧ … ∧ E_k et F' = F₁ ∧ … ∧ F_m où les formules E_i et F_i sont des disjonctions de littéraux. On prend alors la formule φ'' donnée par
φ'' = (y ∨ E₁) ∧ … ∧ (y ∨ E_k) ∧ (¬y ∨ F₁) ∧ … ∧ (¬y ∨ F_m)
où y est une nouvelle variable qui est introduite.

Dans les deux cas, la formule φ'' est satisfiable si et seulement si la formule φ est satisfiable. On vérifie également que la taille de φ'' est au plus quadratique en la taille de φ et que φ'' se calcule effectivement en temps quadratique.

Troisième étape

Cette dernière étape consiste à remplacer les clauses n'ayant pas trois littéraux par une ou plusieurs clauses ayant exactement trois littéraux.

Si une clause a seulement un ou deux littéraux, on peut facilement la transformer en une clause à trois littéraux en répétant plusieurs fois le même littéral. Ainsi la clause x₁ ∨ x₂ devient la clause x₁ ∨ x₂ ∨ x₂ qui est bien sûr équivalente.

Si au contraire une clause a plus de trois littéraux, on effectue la transformation suivante. Supposons que la clause soit égale à la disjonction l₁ ∨ … ∨ l_k des k littéraux l₁, …,l_k. On la remplace par la conjonction suivante de k-2 clauses à trois littéraux.

(l₁ ∨ l₂ ∨ y₁) ∧ (¬y₁ ∨ l₃ ∨ y₂) ∧ (¬y₂ ∨ l₄ ∨ y₃) ∧ … ∧ (¬y_k-4 ∨ l_k-2 ∨ y_k-3) ∧ (¬y_k-3 ∨ l_k-1 ∨ l_k)

où les variables y₁, …,y_k-3 sont nouvellement introduites. On vérifie que toute affectation qui rend vraie la clause l₁ ∨ … ∨ l_k se prolonge en une affectation aux variables y₁, …,y_k-3 qui rend vraie la conjonction. Réciproquement, toute affectation qui rend vraie la conjonction rend vraie la clause initiale. Cette dernière tranformation se fait en temps linéaire en la taille de la formule et donc en temps polynomial sur une machine de Turing.

Autres problèmes NP-complets

Pour montrer qu'un problème A est NP-complet, if faut d'abord montrer qu'il est dans la classe NP et qu'ensuite tout autre problème B de NP se réduit polynomialement à A. Pour la seconde partie, il n'est pas nécessaire de le faire pour tous les problèmes B de NP. Il suffit en effet de montrer qu'un seul problème B qui est NP-complet se réduit à A. On a en effet la proposition suivante.

Proposition. Si B est NP-complet et si B ⩽_P A, alors A est NP-difficile.

Puisque B est NP-complet, on a C ⩽_P B pour tout problème C de NP. Si on a aussi B ⩽_P A, on obtient C ⩽_P A en combinant les deux relations.

Grâce à la proposition précédente, montrer qu'un problème A est NP-complet consiste à montrer qu'il est dans la classe NP et ensuite à montrer qu'un problème B qu'on sait être déjà NP-complet se réduit à A. Nous allons appliquer cette technique à plusieurs problèmes classiques.

Clique

Nous avons déjà vu que CLIQUE est dans la classe NP. Nous avons aussi montré que le problème 3-SAT se réduit polynomialement au problème CLIQUE. Il découle de la proposition précédente que le problème CLIQUE est NP-complet.

Couverture de sommets

Une arête (u, v) d'un graphe est dite adjacente à un sommet s si s est égal à u ou à v. Une couverture de taille k d'un graphe G = (V, E) est un sous-ensemble C de k sommets tel que toute arête de G est adjacente à au moins un des sommets de C.

Le problème de la couverture (appelé VERTEX-COVER) est de savoir si un graphe G donné contient une couverture d'une taille k également donnée.

Proposition. Le problème VERTEX-COVER est NP-complet.

Le problème VERTEX-COVER est dans NP. Un algorithme pour résoudre ce problème commence par choisir de façon non déterministe les k sommets u₁, …, u_k puis vérifie que chaque arête du graphe est bien adjacente à un de ces sommets.

Pour montrer que le problème VERTEX-COVER est NP-difficile, on va réduire polynomialement le problème 3-SAT à VERTEX-COVER. À chaque instance de 3-SAT, on associe une instance de VERTEX-COVER qui a une solution si et seulement si l'instance de 3-SAT en a une. Soit φ une instance de 3-SAT, c'est-à-dire une formule en forme conjonctive telle que chaque clause de φ contienne trois littéraux. On note k le nombre de clauses de φ et m le nombre de variables apparaissant dans φ.

À cette formule φ, on associe un graphe non orienté ayant 3k+2m sommets. Chaque sommet du graphe est en outre étiqueté par un littéral. À chaque variable x_i correspondent deux sommets étiquetés par les littéraux x_i et ¬x_i. Ces deux sommets sont reliés par une arête. Cette partie du graphe est appelée le gadget de la variable x_i. À chaque clause correspondent trois sommets, un étiqueté par chaque littéral de la clause. Ces trois sommets sont reliés entre eux par trois arêtes. On ajoute en outre une arête entre chacun des trois sommets d'une clause et le sommet de la variable qui étiqueté par le même littéral. Cette partie du graphe est appelée le gadget de la clause.

La construction est illustrée sur la formule φ = (x₀ ∨ x₁ ∨ x₂) ∧ (¬x₀ ∨ ¬x₂ ∨ x₃) ∧ (x₁ ∨ x₂ ∨ ¬x₃). Les entiers k et m sont égaux à 3 et 4 et on obtient le graphe représenté à la figure ci-dessous.

Fig. 2 : graphe associé à la formule φ

Nous allons voir que la formule φ est satisfiable si et seulement si le graphe G contient une couverture de taille 2k+m. Pour chaque variable x_i, il faut qu'un des deux sommets associés soit dans la couverture pour couvrir l'arête entre ces deux sommets. De même pour chaque clause, il faut que deux des trois sommets associés soient dans la couverture pour couvrir les trois arêtes entre ces sommets. Ceci montre qu'une couverture du graphe doit contenir au moins 2k+m sommets.

Supposons d'abord que la formule φ est satisfiable. Il existe donc une affectation des variables telle que φ vaille 1. Ceci signifie qu'au moins un littéral par clause vaut la valeur 1. Pour chaque variable x_i, on met dans la couverture le sommet x_i ou le sommet ¬x_i suivant que x_i vaille 1 ou 0 dans l'affectation. Pour chaque clause, on met dans la couverture deux sommets du gadget correspondant en prenant au moins les littéraux qui ont la valeur 0 et d'autres pour compléter. Ces choix construisent une couverture. Toutes les arêtes à l'intérieur des gadgets sont couvertes. Chaque arête entre les gadgets des variables et des clauses, relie une variable au littéral correspondant. Si la variable vaut 1, le sommet dans le gadget de la variable a été choisi et si la variable vaut 0,le sommet dans le gadget de la clause a été choisi. Dans les deux cas, l'arête est couverte.

Supposons maintenant que G possède une couverture de taille 2k+m. Il est clair que cette couverture a exactement un sommet dans chaque gadget associé à une variable et deux sommets dans chaque gadget associé à une clause. Il est facile de vérifier que le choix des sommets dans les gadgets des variables définit une affectation qui donne la valeur 1 à la formule φ.

Chemin hamiltonien

Un chemin hamiltonien dans un graphe G est un chemin qui passe une fois et une seule par chaque sommet de G. Le problème du chemin hamiltonien (appelé HAM-PATH) est de savoir si un graphe G donné contient un chemin hamiltonien de s à t pour deux sommets s et t également donnés. Ce problème peut être posé pour un graphe orienté ou pour un graphe non orienté mais ces deux problèmes se ramènent aisément de l'un à l'autre.

Proposition. Le problème HAM-PATH est NP-complet.

Le problème HAM-PATH est dans NP. Un algorithme pour résoudre ce problème commence par choisir de façon non déterministe une suite de u₁, …, u_n de sommets puis vérifie ensuite qu'il s'agit d'un chemin hamiltonien de s à t.

Pour montrer que le problème HAM-PATH est NP-difficile, on va réduire polynomialement le problème 3-SAT à HAM-PATH. À chaque instance de 3-SAT, on associe une instance de HAM-PATH qui a une solution si et seulement si l'instance de 3-SAT en a une. Soit φ une instance de 3-SAT, c'est-à-dire une formule en forme conjonctive telle que chaque clause de φ contienne trois littéraux. On note k le nombre de clauses de φ et m le nombre de variables apparaissant dans φ. Si une variable apparaît positivement et négativement dans la même clause, cette clause est toujours satisfaite. On suppose dans la suite que chaque variable apparaît au plus une fois dans chaque clause.

À cette formule φ, on associe un graphe orienté ayant 2km + 2m + k sommets. À chaque clause est associé un seul sommet. À chaque variable est associé une partie du graphe appelé gadget. Pour chaque variable, ce graphe possède 2k+2 sommets et est identique à celui représenté sur la figure ci-dessous.

Fig. 3 : gadget associé à une variable

Le graphe global est obtenu en mettant bout à bout les gadgets pour obtenir une sorte de chapelet et en ajoutant les sommets des clauses. Le gadget d'une variable est relié au sommet de chaque clause où elle apparaît. Si la variable apparaît positivement dans la j-ième clause, il y a une arête du sommet 2j-1 du gadget vers le sommet de la clause et une arête du sommet de la clause vers le sommet 2j du gadget. Si la variable apparaît négativement dans la j-ième clause, il y a une arête du sommet 2j du gadget vers le sommet de la clause et une arête du sommet de la clause vers le sommet 2j-1 du gadget.

Le sommet s est le premier sommet du gadget de la première variable et le sommet t est le dernier sommet du gadget de la dernière variable. On vérifie qu'il y a un chemin hamiltonien dans la graphe construit si et seulement si la formule φ est satisfiable.

Fig. 4 : graphe associé à la formule φ

Problème de la somme

Le problème de la somme (appelé SUBSET-SUM) est le suivant. Une suite d'entiers x₁, …, x_k ainsi qu'un entier s sont donnés. Le problème est de savoir s'il est possible d'extraire une sous-suite de la suite donnée de manière à obtenir une suite dont la somme est égale à s. La solution est donc une suite croissante d'entiers 1 ⩽ i₁ < i₂ < ⋯ < i_n ⩽ k telle que

x_i₁ + x_i₂ + ⋯ + x_{i_n} = s

Proposition. Le problème SUBSET-SUM est NP-complet.

Le problème SUBSET-SUM est dans NP. Un algorithme pour résoudre ce problème commence par choisir de façon non déterministe les indices i₁, i₂, …, i_n puis vérifie que la somme x_i₁ + … + x_{i_n} a pour valeur s.

Pour montrer que le problème SUBSET-SUM est NP-difficile, on va réduire polynomialement le problème 3-SAT à SUBSET-SUM. À chaque instance de 3-SAT, on associe une instance de SUBSET-SUM qui a une solution si et seulement si l'instance de 3-SAT en a une. Soit φ une instance de 3-SAT, c'est-à-dire une formule en forme conjonctive telle que chaque clause de φ contienne trois littéraux. On note k le nombre de clauses de φ et m le nombre de variables apparaissant dans φ. Soient c₀, …, c_k-1 les k clauses de φ et soient x₀, …, x_m-1 les m variables de φ. Pour une variable x_i de variable on note p(i) l'ensemble des numéros des clauses où x_i apparaît positivement et n(i) l'ensemble des numéros des clauses où x_i apparaît négativement.

A cette formule φ, on associe un ensemble de 2(m+k) entiers qui vont s'écrire avec m+k chiffres en base 10. À chaque variable x_i correspond deux entiers n_i et p_i définis de la façon suivante.

n_i = 10^k+i + ∑_{j ∈ n(i)} 10^j
p_i = 10^k+i + ∑_{j ∈ p(i)} 10^j

Les entiers n_i et p_i s'écrivent en base 10, avec m+k chiffres égaux à 0 ou 1. Pour n_i, le chiffre à la position k+i et les chiffres aux positions de n(i) sont des 1 et tous les autres chiffres sont des 0. Pour p_i, le chiffre à la position k+i et les chiffres aux positions de p(i) sont des 1 et tous les autres chiffres sont des 0.

A chaque clause c_j, on associe deux entiers q_j et q'_j qui sont tous les deux égaux à 10^j. Les entiers q_j et q'_j s'écrivent en base 10, avec k chiffres égaux à 0 ou 1. Le chiffre à la position j est un 1 et tous les autres sont des 0.

On définit le nombre s par la formule suivante.

s = ∑_{0 ⩽ i < m} 10^k+i + 3 ∑_{0 ⩽ j < k} 10^j

L'entier s s'écrit en base 10 avec des chiffres 1 et 3. Son écriture en base 10 a la forme 1…13…3 où le premier bloc comporte m chiffres 1 et le second bloc comporte k chiffres 3.

Nous allons illustrer cette construction sur la formule φ = (x₀ ∨ x₁ ∨ x₂) ∧ (¬x₀ ∨ ¬x₂ ∨ x₃) ∧ (x₁ ∨ x₂ ∨ ¬x₃). Les entiers k et m sont égaux à 3 et 4. Les entiers n₀, p₀, n₁, p₁, n₂, p₂, n₃, p₄, q₀, q₁, q₂ et s sont donnés ci-dessous.

Les entiers associés à la formule φ.
n	x₃	x₂	x₁	x₀	c₂	c₁	c₀	Valeur
n₀ =	0	0	0	1	0	0	1	1001
p₀ =	0	0	0	1	0	1	0	1010
n₁ =	0	0	1	0	1	0	1	10101
p₁ =	0	0	1	0	0	0	0	10000
n₂ =	0	1	0	0	1	0	1	100101
p₂ =	0	1	1	0	0	1	0	100010
n₃ =	1	0	0	0	0	1	0	1000010
p₃ =	1	0	0	0	0	0	1	1000001
q₀, q'₀ =	0	0	0	0	0	0	1	1
q₁, q'₁ =	0	0	0	0	0	1	0	10
q₂, q'₂ =	0	0	0	0	1	0	0	100
s =	1	1	1	1	3	3	3	1111333

La preuve que l'instance du problème SUBSET-SUM a une solution si et seulement si la formule φ est satisfiable découle des remarques suivantes. La première remarque est que pour chaque colonne, il y a au plus cinq entiers qui ont un chiffre 1 dans cette colonne. Ceci signifie que quelque soit le choix des entiers, leur somme se fait sans retenue. La somme est donc calculée colonne par colonne.

Comme le chiffre de s est 1 dans chaque colonne associée à la variable x_i, il est nécessaire d'utiliser exactement un des deux entiers n_i et p_i. Ce-sont en effet les seuls qui ont un chiffre non nul dans cette colonne et il n'est pas possible de prendre les deux. Le fait de prendre de choisir n_i ou p_i correspond à affecter la valeur 0 ou 1 à la variable x_i. Chaque entier n_i ou p_i ajoute 1 dans chaque colonne associée à une clause égale à 1 pour le choix de la valeur de la variable x_i. Comme le chiffre de s est 3 dans chaque colonne associée à clause c_j, il faut exactement trois entiers qui apportent une contribution dans cette colonne. Deux contributions peuvent être apportées par q_j et q'_j mais une contribution au moins doit être apportée par un entier n_i et p_i. Ceci garantit que toutes les causes sont vraies. Si plusieurs variables rendent vraie la même clause, on adapte la somme dans cette colonne en retirant un ou deux des entiers q_j et q'_j.