Autres attaques - Codes de Reed-Muller et cryptanalyse du registre filtré.

Il existe bien sûr de nombreuses autres approches pour attaquer un registre filtré. Les principales autres familles sont listées ci-dessous avec une rapide description et les principales références. Nous verrons également dans cette thèse plusieurs attaques en détail aux chapitres 6, 7 er 8.

Attaques Algébriques Ce sont les attaques qui vont nous intéresser le plus dans cette thèse. Elles sont essentiellement de nature algébrique contrai- rement aux attaques par corrélation par exemple, où les outils utilisés sont

plus de nature statistique. Par attaques algébriques, on désigne la plupart du temps les attaques décrites au chapitre 8, mais l’attaque basée sur la complexité linéaire du chapitre 7 rentre aussi dans la famille des attaques algébriques.

Attaques par inversion Ces attaques ont été initialement introduites par Golic [Gol96] et généralisées dans [GCD00], elles exploitent la position des entrées de la fonction de filtrage dans le registre. Rappelons que ces positions sont données par les variables t1 jusqu’à tm. En substance, la complexité de

l’attaque va alors se ramener `a une recherche exhaustive sur ce que l’on appelle la m´emoire effective du registre qui vaut

tm− t1

PGCDi(ti− ti+1)

Si le PGCD entre l’´ecart des entr´ees vaut 1 et que tm− t1 est de l’ordre de

l, ces attaques peuvent être facilement évitées. Il existe également une autre technique de complexité similaire fondée sur une représentation en treillis et sur l’algorithme de Viterbi, voir [LBGZ01].

Distingueur Mentionnons enfin les attaques qui ne visent pas directement `

a retrouver l’état initial du LFSR mais juste à distinguer la suite chiffrante d’une suite aléatoire. Ces attaques peuvent permettre de vérifier que l’on a correctement retrouvé la suite chiffrante ou nous aider à retrouver la struc- ture du chiffrement dans le cas où elle est inconnue. Notez également que cette approche peut aussi conduire à des attaques de “type diviser pour régner” s’il est possible de faire une recherche exhaustive sur une sous partie de la clef comme dans [CF01].

L’idée est ici de trouver des équations qui présentent un biais sur la suite chiffrante. La plupart des techniques pour faire cela reposent, de la même manière que les attaques par corrélation rapides, sur les équations linéaires induites par les multiples de poids faible des polynômes générateurs des LFSR qui interviennent dans le système. On en verra un exemple au chapitre 6 qui reprend l’attaque présentée dans [CF01]. Pour des chiffrements à flot plus évolués, des techniques efficaces sont données dans [Gol94] et [CHJ02].

Chapitre 5

Calcul des multiples de poids

faible

Beaucoup d’attaques par corrélation et l’attaque dont nous parlerons dans le prochain chapitre utilisent des relations de parité de poids faible vérifiées par les bits de sortie d’une séquence produite par un LFSR. Au chapitre 2 on a vu que ces relations sont en fait données par les multiples de poids faible du polynôme générateur du LFSR. Nous nous intéressons ici `

a plusieurs algorithmes pour calculer ces relations.

Nous commencerons par les algorithmes classiques qui reposent tous sur des compromis temps-mémoire et dont le plus efficace est certainement celui de [CJM02] que nous présenterons dans la deuxième section. Nous présenterons ensuite une autre approche basée sur le calcul de logarithmes discrets qui a donné lieu, avec la collaboration de Yann Laigle-Chapuy, à la publication [DLC07]. Cette approche s’avère utile pour calculer les multiples de poids 4 qui jouent un rôle essentiel dans certaines attaques ([CT00], chapitre 6).

5.1 Pr´esentation du probl`eme

Notre but est de rechercher des multiples de poids w fixé et de degré plus petit qu’une borne D d’un polynôme g(X) à coefficients dans F2. Pour des

applications pratiques, seuls les w très petits nous intéressent, typiquement 3, 4, 5, 6 ou 7. Avant de détailler les algorithmes, on rappelle deux résultats essentiels pour cette section que l’on a vus vers la fin du chapitre 2 et qui font le lien entre équations de parité pour le LFSR et multiples de g(X).

Définition 5.1 (Équations de parité associées à un polynôme). À un po- lynôme p(X) = Pn_i=1piXi de degré n à coefficients dans F2 on associe

n’importe quel d´ecalage dans le temps par : X

pist+i= 0 pour un d´ecalage t ≥ 0 .

Proposition 5.2 (Équations de parité pour un LFSR). Soit une séquence (st)t≥0 non nulle produite par un LFSR de polynôme générateur g(X) pri-

mitif, alors l’équation de parité associée à un polynôme p(X) à coefficients dans F2 est vérifiée pour tout décalage du temps si et seulement si p(X) est

égal à 0 modulo g(X). C’est-à-dire si et seulement si p(X) est un multiple de g(X).

Comme en général les LFSR utilisés ne sont pas dégénérés, g(X) a un terme constant qui vaut 1 et nous nous intéresserons uniquement aux multiples p(X) de terme constant 1. Les autres, qui sont divisibles par une puissance de X, ne représentent en effet que des équations de parité qui sont décalées dans le temps.

En supposant que les Xi modulo g(X) sont aléatoires, on a le résultat suivant qui nous donne une idée du nombre de multiples attendus de poids w et de degré au plus D. Cette “heuristique” nous permettra de choisir D en fonction de nos besoins en nombre de multiples. En pratique, l’ordre de grandeur est correct pour la plupart des cas intéressants.

Heuristique 5.3 (Nombre de multiples). Une approximation du nombre de multiples de poids w et de degré au plus D d’un polynôme g(X) de degré l est donnée par :

D w−1 2l ∼ Dw−1 (w − 1)!2l pour w = o(D) .

Justification. On fait ici l’hypoth`ese qu’un polynˆome de poids w pris au hasard parmi les Dw−1 _{possibles (car on suppose qu’il a toujours un terme}

constant égal à 1) a une chance sur 2l d’être égal à 0 modulo g(X). Le comportement asymptotique s’en déduit directement du moment que w est un o(D).

L’algorithme standard pour trouver tous les multiples de poids w et de degr´e au plus D est d’utiliser un compromis temps-m´emoire :

Algorithme 5.4 (Compromis temps-mémoire). L’algorithme prend en entrée un polynôme g(X), un degré maximal D et un poids w = 1 + q1+ q2 avec

q1 ≤ q2. Il retourne tous les multiples de g(X) de poids w et de degr´e au

plus D.

1. [Pr´ecalcul] Calculer tout les Ximodulo g(X) pour i = 1..D et les stocker dans un tableau mod[i].

2. [Mise en table] Pour tous les q1-uplets Γ = (γ1, . . . , γq1) tel que 0 < γ1 <

· · · < γq1 ≤ D, calculer et stocker les paires (1 +

imod[γi], Γ) dans une

table de hachage indexée par le premier élément.

3. [Recherche] Pour tous les q2-uplets ∆ = (δ1, . . . , δq2) tel que 0 < δ1 <

· · · < δq2 ≤ D, calculer

imod[δi] et regarder dans la table si un ´el´ement

est le mˆeme. Si c’est le cas, on trouve un multiple 1 +X

Xγi₊X

Xδi _.

La complexit´e en m´emoire de cet algorithme est en O(Dq1_{) et celle en}

temps est en O(Dq2_{). Remarquons que dans le cas impair, la phase de re-}

cherche est en fait inutile car tout le travail a déjà été fait en calculant la table, il suffit juste de détecter les collisions lors de sa création. Le compromis usuel est de choisir q1= ⌊w−1₂ ⌋ et q2 = ⌈w−1₂ ⌉.

Dans le document Codes de Reed-Muller et cryptanalyse du registre filtré. (Page 47-52)