Complexit´ e - Mines ParisTech CRYPTOGRAPHIE, TH´EORIE DES NOMBRES ET INFORMATION QUANTIQUE

1.6.1 Introduction

L’un des buts de cette section est de comprendre pourquoi la preuve for-melle de l’existence de fonctions à sens unique impliquerait P 6= NP , la célèbre conjecture en théorie de la complexité. De plus les liens entre crypto-graphie et complexité sont étroits et souvent à l’origine de nouvelles classes de complexité comme la classe RP issue de l’algorithme de Miller-Rabin.

Nous allons donner maintenant une description très informelle mais que nous espérons suggestive de diverses classes de complexité. Mais avant cela, pre-nons trois types de problèmes représentatifs des difficultés rencontrées. Les deux problèmes peuvent se traiter par des algorithmes, le dernier ne peut pas se traiter par un algorithme.

Satisfaisabilité des formules booléennes La donnée (on parle aussi d’ins-tance) est un entier n et F une fonction booléenne de n variables booléennes (xi ∈ {0,1},i= 1, ..., n)

(x₁, ..., x_n)7→F(x₁, ..., x_n)∈ {0,1}.

oùF est construite avec des expressions faisant intervenir les opérateurs logiques usuels (et, ou et négation). La question est : existe-t-il un (x₁, ..., x_n) tel que F(x₁, ..., x_n)) = 1.

Véracité des formules booléennes quantifiées La donnée est un entier n, F une fonction booléenne de n variables booléennes (xi ∈ {0,1}, i= 1, ..., n) et la formule avec quantificateurs

∀x_i,∃x_j, .... F(x₁, ..., x_n).

La question est alors : cette formule est-elle vraie ?

1.6. COMPLEXIT É 19 Dixième problème de Hilbert La donnée est un entiernet un polynôme

a coefficients entiers den variablesP(x₁, ..., x_n). La question est alors : l’´equation dite diophantienneP(x₁, ..., x_n) = 0 admet-elle une solution enti`ere (x₁, ..., x_n)∈Zⁿ.

En 1971, Matjacevic a montré qu’il n’existe pas d’algorithme (dans toutes les définitions actuelles de cette notion) qui décide si une équation diophan-tienne admet une solution entière. Cela veut dire que ce problème est inac-cessible à l’algorithmique.

En revanche les deux autres probl`emes sont accessibles `a l’algorithmique.

Pour résoudre le premier problème, il suffit de calculer F pour tous les n-uples possibles (x1, ...xn). Si F est identiquement nulle la réponse est non et oui sinon. Pour résoudre le second, il suffit aussi de faire l’inventaire de toutes les possibilités. Nous voyons bien que, pour le troisième problème, il n’est pas possible d’explorer toutes les possibilités car l’ensemble des entiers

étant infini, nous avons une infinité de cas à traiter.

Le premier problème est représentatif de la classe des problèmes dits de compléxitéNPcar c’est un problème de difficulté maximale dans cette classe (problème dit NP -complet). Un problème est dit NP si l’on peut certifier ces instances positives en temps polynômial en log(n) par un oracle. Nous verrons plus loin à quoi correspond un oracle.

Le second problème est représentatif de la classe des problèmes dits de compléxité PSPACE car c’est un problème de difficulté maximale dans cette classe. Nous n’aborderons pas cette classe de problèmes qui admettent un algorithme nécessitant un espace mémoire polynômial en log(n).

Nous allons maintenant considérer les problèmes de décision, i.e. dont la réponse est oui ou non, en connexion directe avec les algorithmes que nous avons vus précédemment. Nous noterons formellement x les données d’un problème P. Nous ne parlerons pas de machine de Turing. Aussi, les définitions qui suivent ne sont pas rigoureuses. Nous y avons remplacé la notion de Machine de Turing et de calculabilté par un autre terme que nous n’avons pas défini, celui d’algorithme, terme qui correspond plus à l’intuition.

Pour un expos´e rigoureux, nous renvoyons le lecteur `a [4, 18].

1.6.2 Classe P

Le problèmeP sera dit de classePs’il existe un algorithme polynômial en temps qui le résout. Par polynômial, nous entendons polynômial par rapport

a l’espace nécessaire pour coder les données x. Pour se faire une idée plus précise, prenons trois exemples.

Le premier probl`eme est : les entiers m et n sont-ils premiers entre eux ?

20 CHAPITRE 1. CRYPTOGRAPHIE CLASSIQUE Nous savons par l’algorithme d’Euclide calculer le pgcd. Ce calcul n´ecessite au plusE

log(n) log

1+√ 5 2

divisions pour m≤n (voir le chapitre suivant).

Le second problème est plus instructif. Il montre l’équivalence entre le calcul en temps polynômial d’une famille de fonctions (f_n)_n∈_N de {1, ...n}

dans lui même et le problème de décision suivant. Les données sont l’entier n et deux autres entiers x et t plus petits que n. La question est : A-t-on f_n(x)≤t?

En effet si f_n(x) se calcule en temps polynômial par rapport à log(n), ce problème est de fa¸con évidente dans P . Supposons maintenant que ce problème est dansP. Prenonsnetxentiers avec 1≤x≤n, voyons comment calculerf_n(x) en temps polynômial. Pour cela, nous pouvons savoir en temps polynômial sif_n(x)∈[1, n/2] ou f_n(x)∈[n/2, n]. Sif_n(x)∈[1, n/2] on peut savoir en temps polynômial si f_n(x) ∈ [1, n/4] ou f_n(x) ∈ [n/4, n/2]. Si f_n(x) ∈ [n/2, n] on peut savoir en temps polynômial si f_n(x) ∈ [n/2,3n/4]

ou f_n(x) ∈ [3n/4, n]. On voit bien qu’avec de telles dichotomies, on sait en faisant appel s-fois à l’algorithme polynômial si f_n(x) est dans un intervalle de longueur au plusn/2^s. Il suffit maintenant de prendres= 1 +E(log₂(n)) pour avoir la valeur exacte def_n(x) puisque c’est un entier. On aura obtenu ainsi la valeur de f_n(x) en résolvant un nombre polynômial de problèmes polynômiaux. Donc le calcul de f_n(x) est polynômial en log(n).

Le troisième problème est : n est-il un nombre premier ? L’algorithme AKS répond à la question avec un temps en O(log¹²(n)).

1.6.3 Classe NP

Le problème de décision P est dit calculable par un algorithme non déterministe et polynômial en temps, si et seulement si, il existe un algo-rithme ayant comme données de départ x et aussi y (fini et correspondant

a l’oracle évoqué dans l’introduction de cette section), tel que pour toute instance x vérifiant P(x) vrai alors il existe un certificat y(x) tel que cet algorithme ayant x et y(x) comme données calcule P(x) vrai en temps po-lynômial par rapport àx.

Cette définition peut paraˆıtre obscure. Elle ne dit rien du comportement de cet algorithme quand on le lance avec un x et y arbitraire. Il peut très bien ne pas s’arrêter ou s’arrêter mais après un temps gigantesque. Tout ce que nous demandons est que si l’on part d’une instance positivex et si l’on choisit bien le complément y(x) des données de départ, l’algorithme montre queP(x) est vrai en temps polynômial. Le temps est polynômial par rapport aux données brutes x, celles que l’on connaˆıt en excluant les autres données y(x) dont nous connaissons l’existence mais que nous sommes a priori bien

in-1.6. COMPLEXIT É 21 capables de calculer. C’est pourquoi on parle d’algorithme non-déterministe car le bon certificat y(x) associé l’instance positive x du problème n’en fait pas partie. La classe NP est l’ensemble des problèmes de décision calcu-lables par un algorithme non-déterministe polynômial en temps. A cause de la disymétrie entre P(x) vraie etP(x) faux, on définiecoNP l’ensemble des problèmes P donc le complémentaire est dans NP (on remplace instances positives par instances négatives dans la définition). Nous allons maintenant prendre deux exemples qui montrent bien que cette définition un peu obscure provient en fait de problèmes algorithmiques concrets.

Montrons que le problème de la factorisation est dans NP . Pour cela nous le traduisons en un problème de décision : les données sont deux entiers n et M < n. La question est : existe-t-il un diviseur de n plus petit que M et>1.

Par dichotomie successive, on voit que si l’on sait résoudre ce problème en temps polynômial, disons en p(log(n)) avec p polynôme, on sait trouver un diviseur de n en temps polynômial. On part de M = E(n/2), un pre-mier calcul donne la position du diviseur éventuel soit dans [2, E(n/2)[ ou [E(n/2), n[, i.e. dans un intervalle de longueur au plus n/2. Un second calcul va le localiser dans un intervalle de longueur au plus n/4. Aprèss calculs on a localisé le diviseur dans un intervalle de longueur au plusn/2^s. Ainsi avec s= 1 +E(log₂(n)) on aura localisé le diviseur dans un intervalle de longueur au plus de 1, i.e. on aura donc le diviseur au bout du tempsp(log(n)) log₂(n).

Montrons que notre problème de décision est dans NP . En effet, il suffit pour les instancesx= (n, M) positives (i.e., telles qu’il existe un diviseur de n plus petit que M) de prendre un diviseur de n plus petit que M que nous noterons y(n, M). L’algorithme de vérification consiste simplement à diviser npary(n, M) et ainsi on vérifie quena bien un diviseur non trivial plus petit queM. Montrons aussi que ce problème est dans coNP . C’est un peu plus compliqué car on s’intéresse àx= (n, M) tel qu’il n’existe pas de diviseur de n plus petit que M. Pour cela, la structure de y est plus lourde. En effet, il faut queycomporte les données suivantes : la décomposition denen facteurs premiers n = Qk

i=1p^ν_k^k. Avec ces données supplémentaires y = (p_i, ν_i)_i=1,...,k nous pouvons proposer l’algorithme suivant : vérification via AKS que les k nombres p_i sont bien des nombres premiers ; vérification que chaque p_i est bien plus grand que M. On laisse au lecteur le soin de montrer que notre algorithme est en temps polynômial par rapport à log(n).

On peut utiliser la mˆeme d´emarche pour montrer que le logarithme discret est dans NP et aussi dans coNP . Pour p premier, α primitif modulo-p et

22 CHAPITRE 1. CRYPTOGRAPHIE CLASSIQUE n < pon d´efinit la fonction log ainsi

(p, α, n)7→log(p, α, n) =











m sip est premier, α primitif modulo-p etm l’unique entier tel que

0< m < p etα^m =n mod (p) 0 sinon.

et le problème de décision suivant : les données sontp et les nombresα,n et t plus petits que p; la question est ” A-t-on log(p, α, n)< t? ”

1.6.4 Classe RP

Il s’agit de problèmes pouvant être résolus par des algorithmes probabi-listes polynômiaux (ne pas confondre probabiliste avec non-déterministe, ici).

Un problèmeP est dansRP , si et seulement si, il existe des polynômes p(n) etq(n) oùn la taille des données³ x et un algorithme ayant comme données de départ x ety (certificat) telles que

– les instancesxnégatives deP (P(x) faux) sont caractérisées par le fait que pour touty de taille plus petite que p(n), l’algorithme partant de xet y donne en un temps plus petit que q(n) la réponse P(x) faux.

– si x est une instance positive de P (P(x) vrai) alors pour au moins la moitié des certificats y de taille plus petite que p(n), l’algorithme fournit la réponse vraie en un temps inférieur à q(n).

Notons d’abord que RP est contenu dansNP . Ensuite, cette d´efinition est faite sur mesure pour le test de Miller-Rabin de primalit´e.

Détaillons un peu ce problème. La question est : l’entierxest-il composé ? Les variablesy correspondent ici à un entier entre 2 et x, donc le polynôme p(n) où n = log(x) n’est autre que l’identité : on ne fait que doubler au plus la taille des données en rajoutant le certificat y. Le fait que x ne soit pas composé, c’est à dire que x soit premier, est équivalent au fait que x soit fortement premier pour toutes les bases y entre 2 et x− 1. De plus, l’algorithme qui teste si x est fortement premier en base y n’est autre que le test de Miller-Rabin, il est de complexité polynômiale en la taille de x, le polynôme q correspond donc à la complexité du test de Miller-Rabin. Ainsi le premier point de la définition est vérifié. Le second point découle du fait que si x est composé alors pour au moins les 3/4 des y entre 2 et x−1, x n’est pas fortement premier en base y.

3. Sixest entier,ncorrespond donc `a log(x).

1.6. COMPLEXIT ´E 23

1.6.5 Fonctions ` a sens unique et la conjecture P 6=NP

L’existence de fonctions à sens unique est une conjecture aussi difficile que P 6=NP . En effet reprenons la définition de la section 1.1 où nous supposerons que chaque f_n est une bijection de A_n = {1, ..., n} dans B_n = {1, ..., n}. On considère alors la famille (f_n)n∈N. Le fait que lesf_nsoient faciles

a calculer se formalise alors via le problème notéF suivant : les données sont un entiern et deux autres entiersxettentre 1 etn. La question est : A-t-on f_n(x) ≤t? Si pour chaque n le calcul de f_n(x) est polynômial, le problème F est trivialement dans P . Supposons donc F dans P .

De même, le calcul de l’inverse desf_nest associé au problème de décision suivant noté F⁻¹ : les données sont un entier n et deux autres entiers x ett entre 1 etn; la question est : a-t-on f_n⁻¹(x)≤t?

Clairement, F⁻¹ est dans NP . En effet, il suffit de prendre comme cer-tificat y = f_n⁻¹(x). Le fait que le problème F⁻¹ soit difficile, i.e., que les f_n soient à sens unique, se traduit donc par le fait que F⁻¹ n’est pas dans P (car sinon le calcul de f_n⁻¹ serait polynômial, voir le second problème de la section 1.6.2 ). Comme F⁻¹ est nécessairement dans NP , on voit que l’existence d’une fonction à sens unique implique P 6=NP .

24 CHAPITRE 1. CRYPTOGRAPHIE CLASSIQUE

Chapitre 2

Th´ eorie des nombres

Nous reprenons ici certains résultats qui interviennent dans le chapitre sur la cryptographie. Les deux premières sections s’appuient en partie sur le premier chapitre de [29]. Les autres sections abordent la théorie analytique des nombres et la distribution des nombres premiers. Pour le rédiger nous nous sommes souvent inspirés des cours de Jean-Benoˆıt Bost sur les séries de Dirichlet et les nombres premiers [8, 9].

En complément le “Que sais-je” sur les nombres premiers [28] donne en dernière partie un éclairage probabiliste ainsi qu’une preuve élémentaire mais assez difficile du théorème des nombres premiers. Nous recommandons aussi l’excellent livre de vulgarisation de Jean-Paul Delahaye sur les nombres pre-miers [13] qui inclut un chapitre entier sur la cryptographie. On pourra aussi consulter l’Encyclopeadia Universalis qui comportent d’excellents articles sur des sujets connexes. Enfin un lecteur voulant vraiment approfondir le sujet pourra consulter le livre classique dû à Hardy et Wright [20].

2.1 PGCD

2.1.1 Z

ⁿ

et Z

^∗n

Deux entiers a et b sont congrus modulo un entier n, si et seulement si, leur diff´erence a−b est un multiple de n. On note alors : a = b mod (n).

La relation de congruence modulo n est une relation d’équivalence. On note Zⁿ = Z/nZ l’ensemble des classes modulo n. Il y en a n (#Zⁿ = n) et on identifieZnà l’ensemble{0,1, ..., n−1}.Znest muni d’une structure naturelle d’anneau pour l’addition et la multiplication. En particulier Zn muni de l’addition + est un groupe commutatif (on dit aussi abélien). En revanche Zn n’est pas en général un groupe pour la multiplication (le produit de 3 par

26 CHAPITRE 2. TH ÉORIE DES NOMBRES 2 dans Z⁶ donne 0). On note Z^∗n l’ensemble des éléments inversibles de Zⁿ pour la multiplication. Nous allons voir que, si n est premier, Z^∗n =Zn/{0}, etZn est un corps.

Soit k inversible modulo n, i.e.,k ∈Z^∗n. Supposons quek etn admettent un diviseur non trivial a > 1. On pose k = pa et n =qa avec p et q entier.

Alors, kq = paq = pn = 0 mod (n). Ce qui n’est pas possible car k est inversible et donc nécessairement q= 0 mod (n). Ainsi, tout élément deZ^∗n

est un entier premier avecn (un entier n’ayant pas de diviseur commun avec n, ou encore un entier dont le pgcd avec n est 1). La r´eciproque est vraie : Z^∗n correspond exactement `a l’ensemble des entiers entre 1 et n−1 premiers avec n, i.e., qui n’admettent pas de diviseur commun avec n autre que 1.

La preuve de ce r´esultat repose sur l’algorithme d’Euclide et l’identit´e de Bezout.

2.1.2 Algorithme d’Euclide

L’algorithme d’Euclide permet de calculer efficacement les inverses mo-dulonvia la relation de Bezout. Soient donc deux entiers strictement positifs k < n. L’agorithme de division d’Euclide est compos´e des divisions succes-sives suivantes :

n =kq₀+r₀, r₀ < k k =r₀q₁+r₁, r₁ < r₀ r₀ =r₁q₂+r₂, r₂ < r₁

...

r_m−2 =r_m−1q_m+r_m, r_m < r_m−1 rm−1 =rmqm+1+rm+1, 0 =rm+1 < rm

où la suite (n, k, r₀, r₁, ..., r_m, r_m+1) est strictement décroissante et arrive à zéro avec r_m+1 = 0 (ce qui définit l’indice m). Il est facile de voir que le pgcd est r_m. En effet si p divise n et k alors il divise r₀ (première divi-sion), mais aussi r₁ (seconde division), ..., et enfin r_m (avant dernière divi-sion). Commer_m diviser_m−1 (dernière division),r_m divise aussi r_m−2 (avant dernière division), ..., en enfin k (seconde division) et n (première division).

L’algorithme d’Euclide calcule donc le pgcd.

Il donne aussi l’inverse dek modulon. Il donne mˆeme plus avecl’identit´e de Bezout : pour tout 1< k < n, il existe u etv dans Z tels que

un+vk= pgcd (n, k).

2.1. PGCD 27 Il suffit de résoudre le système formé par les m+ 1 premières divisions par rapport auxm+ 1 restes r_i,i= 0, ..., m. Il s’agit d’un système linéaire de la

où la matriceA est à coefficients entiers, triangulaire inférieure et avec 1 sur la diagonale. Donc son inverse est aussi une matrice à coefficients entiers (on appelle ce type de matrices, des matrices uni-modulaires, on les retrouve très souvent et elles jouent un rôle fort important dans de nombreux domaines, ....). Donc chaquer_i est combinaison linéaire à coefficients dans Zdek et de n et en particulier r_m = pgcd (n, k) = un+vk avecu et v dans Z.

Si n et k sont premiers entre eux, alors il existe u et v dans Z tels que un+vk = 1, ce qui s’´ecrit aussi vk = 1 mod (n) donc v est l’inverse de k pour la multiplication dans Zⁿ, et donc k ∈Z^∗n.

2.1.3 Complexit´ e de l’algorithme d’Euclide

Evaluons le nombre D de divisions de l’algorithme d’Euclide en fonction de la taille de n. L’algorithme sera le plus long lorsque chaque quotient q_i vaut 1 avec r_m= 1 et r_m+1 = 0. Ainsi, on a

r_i =r_i+1+r_i+2, i= 0, ..., m−2 et

k =r₀+r₁, n =k+r₀

En prenant la récurrence précédente en sens rétrograde avec lesidécroissants, on voit que n correspond au (m+ 4)-ième nombre de la suite

F_j =F_j−1+F_j−2

avec comme départ de la récurrence,F₀ = 0 etF₁ = 1. Il s’agit de la suite de Fibonacci où apparaˆıt le nombre d’or φ= (1 +√

5)/2. En effet, on sait (faire une transformée en Z, classique en contrôle linéaire) que la solution générale d’une récurrence linéaire est obtenue par combinaison linéaire des puissances des racines de l’équation caractéristique

Z² =Z+ 1.

28 CHAPITRE 2. TH ÉORIE DES NOMBRES Les racines sont le nombre d’or φ et ψ = 1−φ. Aussi F_j =aφ^j +bψ^j où a etb sont déterminés par les conditions initiales F₀ et F₁. Ainsi

F_j = (φ^j−ψ^j)/√ 5.

CommeF_m+4 =n dans le cas le plus défavorable, le nombre D =m+ 2 de divisions effectives est relié àn via l’inéquation

n≥F_D+2 = (φ^D+2−ψ^D+2)/√ 5

Un petit calcul montre que D ≤ log_φ(n). Ainsi, l’algorithme d’Euclide est polynômial. L’estimation précédente est due à Lamé (1845).

Dans le document Mines ParisTech CRYPTOGRAPHIE, TH´EORIE DES NOMBRES ET INFORMATION QUANTIQUE (Page 19-29)