R´ esultats des attaques par Templates

Nous avons attaqué notre processeur à l’aide d’une attaque par templates. Nous nous sommes fixés le corps GF(2²³³) et l’algorithme de halving-parallèle. Nous avons fixé le nombre de traces d’apprentissage à 1000 (par hypothèse de clefs) et le nombre de points d’intérêt à 300. Nous n’observons qu’une trace d’exécution (mais cela n’est pas aber-rant puisque, rappelons-le, nous jouissons d’un modèle idéal, sans bruit). De plus, le comportement que nous n’observons ici que sur une trace est logiquement assimilable à n’importe quelle autre trace. Le but était de montrer que lesopérations pour rienont

MIU

Lx,8/S

Halving

Adder

REG

instruction

decoding REG

w w w w w w w w w 2 1 w 1 8 32 2 16 4 4 w w w 32

k

e

y

REG8CTRL 8 8 3 4 4 w 2 2

SQRT

LFSR ₁

Figure 4.13: Une unité d’exécution dont le décodeur d’instruction est relié à des LSFR.

suffisamment d’impact pour protéger le circuit. Évidemment, plus la probabilité de lan-cement d’une opération pour rien est grande, plus le calcul d’une multiplication scalaire sera, lui aussi, grand (voir tableau4.3). La probabilité p_dummy est la probabilité (construite à partir de LFSRs) que le circuit lance, pendant le décodage d’instruction, une opération pour rien.

Figure 4.14: Probabilit´e des hypoth`eses de clefs construites par l’attaque par templates (1000 traces d’apprentissage).

p_dummy Nombre de Cycles pour un [k]P Surcout temporel

0 474733

-1/16 519596 9%

1/8 570985 20%

1/4 732284 36%

Table 4.3: Surcouts temporelsâ ^desopérations pour rienen fonction de la probabi-lité p_dummy.

a. moyennés à partir de 10 exécutions

Dans la figure 4.14, nous montrons les probabilités respectives établies par l’attaque par templates des clefs 0 = (000)2, 1 = (001)2, . . . 7 = (111)2. La bonne hypothèse de clefest 0 = (000)₂, à laquelle les templates associent la plus grande probabilité dans une version parallèle non-protégée par le biais des Dummy Operations.

Nous voyons à l’inverse qu’une version protégée avec 25% de chance de lancer une mul-tiplication inutile (à chaque instruction) ne permet pas à l’attaque par templates de récupérer l’hypothèse correcte de la clef. Pire, la probabilité de l’hypothèse 000 n’est ni seconde, ni troisième dans l’ordre des probabilités, mais sixième. Nous pouvons dès lors imaginer que cette contre-mesure permet également de contrer les attaques (possible-ment) par énumération de clefs [71]. Nous observons par contre qu’une probabilité trop faible sur l’exécution d’opérations inutiles rétablit une certaine forme de vulnérabilité : avec 1/8ème de chance de lancer une opération pour rien, la première hypothèse 000

0.09 0.1 0.11 0.12 0.13 0.14 0.15 0.16 0.17 -1 0 1 2 3 4 5 6 7 8

Probabilité des hypothèses

Hypothèses de clef

Sans Protection 1/16 1/8 1/4

Figure 4.15: Probabilit´^{e des hypoth`}^{eses de clefs construites par l’attaque par templates} (500 traces d’apprentissage).

redevient celle à qui il est attribué la plus grande probabilité. Le phénomène est en-core plus remarquable et identifiable avec une probabilité de 1/16 sur l’exécution de Dummy operations. Il est alors évident qu’il existe un compromis entre sécurité (face aux canaux cachés) et performance brute. Avec une probabilité p_dummy = 1/4, le cir-cuit semble, en partie, protégé mais le temps d’exécution de la multiplication scalaire se rapproche d’un algorithme purement séquentiel de halve-and-add. Dans la figure4.15, il s’agit des mêmes données que fournies précédemment, sauf que le nombre de traces d’ap-prentissage a été réduit à 500 par hypothèse de clef. Nous pouvons remarquer l’impact significatif des traces sur la qualité des attaques. Dans une version non protégée (sans

opérations pour rien), la probabilité affectée à la bonne hypothèse 000 est moins marquée qu’auparavant.

Avec un nombre de traces trop faible, mˆeme un p_dummy petit (≈ 1/16) permet de

protéger le circuit. Avec un p_dummy = 1/16, la probabilité attribuée à l’hypothèse de clef 000 n’est que la troisième plus grande.

Nous avons également tracé dans4.16, l’écart-type des probabilités de clefs estimées par les templates pour chaque probabilité pdummy∈ {0, 1/16, 1/8, 1/4}.

Plus cet ´ecart-type est faible, plus la distribution tend `a se concentrer autour de la

moyenne (1/8). Ce qui est remarquable, c’est que cet écart-type tend à se réduire lorsque nous augmentons la probabilité p_dummy. Autrement dit, il semble qu’ajouter des

0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045 0.05 0 0.05 0.1 0.15 0.2 0.25 ´ Ecart-t yp e Probabilit´e p_dummy 1000 Traces + + + + + 500 Traces × × × × ×

Figure 4.16: ´^{Ecart-type des hypoth`}^{eses de clef en fonction de la probabilit´}^{e p}dummy.

opérations pour rien tend à rendre les probabilités attribuées à chacune des hy-pothèses de clef plus uniformes et permettrait ainsi de réduire les biais.

C’est d’ailleurs ce que nous observons au travers les chiffres du tableau4.4. Nous avons, pour 100 attaques, estimé le nombre d’attaques réussies en fonction de la probabi-lité p_dummy. Chacune des instances des attaques a été réalisée dans les mêmes condi-tions que précédemment, c’est à dire que nous disposons de 1000 traces d’apprentissages par templates (soit un total de 2³× 1000 = 8000 traces) et travaillons avec 300 points d’intérêts. Nous considérons une attaque réussie quand la probabilité pr(T |K^(xyz)₁ ) de la bonne hypothèse de clef est la plus grande. Ce qui semble émerger de ce tableau est la confirmation qu’augmenter la probabilité p_dummy rend les probabilités pr(T |K₁^(xyz)) uniformes (ce qui va de pair avec le taux de réussite). Il apparait que chacune des pro-babilités pr(T |K^(xyz)₁ ) tend vers 1/2³.

Evidemment, nous sommes conscients que nous avons choisi des param`etres arbitraires

p_dummy 0 1/16 1/8 1/4 1/2 Taux de R´eussite 100 76 62 11 13

Table 4.4: Taux de r´^{eussite en fonction de p}dummysur 100 essais.

concernant les attaques. Il serait en l’occurrence très intéressant d’étudier la sensibilité de l’efficacité des opérations pour rien en fonction du nombre de traces d’appren-tissages, du nombre de points d’intérêts, du nombre de traces observées pour la phase d’attaque, etc. Bref, cette étude est loin d’être exhaustive ; elle montre à l’inverse une tendance. Comme attendu, augmenter le nombre d’opérations pour rienréduit l’ef-ficacité des attaques. Cette étude montre surtout que le parallélisme des calculs dans

la multiplication scalaire ne permet pas, seul, de se prémunir face à des attaques par canaux cachés.

4.9 Conclusion

Nous avons présenté dans ce chapitre un crypto-processeur réalisant des calculs sur des extensions du corps fini binaire GF(2) dans une représentation en base normale. Nous avons montré que le calcul parallèle permis par le halving et proposé par Christophe Negre et Jean-Marc Robert dans [46] est intéressant sans pour autant être très efficace sur l’architecture ici proposée. L’algorithme de parallel halve-and-add 4.5 s’est montré plus rapide. Nous avons aussi montré que le parallélisme des calculs, seul, ne parvient pas à protéger le circuit face à des attaques par canaux cachés, notamment par des at-taques par templates. Pour apporter une résistance supplémentaire, nous avons suggéré l’emploi d’opérations pour rien cachant le calcul utile dans un flot de calculs, lui, inutile. Évidemment, rajouter des opérations pour rien, c’est allonger, implicitement, le temps d’exécution d’une multiplication scalaire [k]P . Nous nous sommes aper¸cus qu’il y avait un compromis sécurité/performance, dépendant de l’abondance de cesopérations inutiles. Il serait intéressant, en perspectives, de s’intéresser à ces différents compro-mis. Pourrions-nous, par exemple, n’appliquer les opérations pour rien que sur la partie la plus rapide de la multiplication scalaire (c’est à dire sur le halve-and-add ) tout en conservant une sécurité équivalente ? Pourrions nous marier des opérations pour rienavec d’autres types de protections (échelle de Montgomery, atomicité, etc) ? Qu’en est-il des autres systèmes de coordonnées ?

RNS dans GF(2^m)

5.1 R´eduction modulaire en RNS

Dans ce chapitre, nous étudierons la représentation RNS (Residue Number System) et la pertinence de son utilisation pour les extensions du corps fini binaire GF(2). Nous présenterons notamment le Φ-RNS, une représentation mono-base des éléments de GF(2^m) (jusqu’ici, représenter un élément en RNS supposait l’existence de deux bases —au moins—, nous y reviendrons). Nous irons jusqu’à l’implémentation FPGA de l’algorithme de multiplication modulaire en Φ-RNS. Nous détaillerons un algo-rithme d’extraction de racines carrées, qui n’est d’ailleurs pas une opération si triviale dans cette représentation, ainsi qu’un algorithme d’inversion. Ces deux derniers points n’ayant, par contre, pas fait l’objet d’une implémentation matérielle.

Dans le document Contribution aux opérateurs arithmétiques GF(2m) et leurs applications à la cryptographie sur courbes elliptiques (Page 87-93)

MIU