Résultats expérimentaux et perspectives

Figure III-8 Méthode de mesure de la qualité d'une matrice de similarité

Figure III-9 Qualité de la matrice de similarité pour deux métriques de comparaison des sous-traces

Figure III-10 Efficacité de 48 attaques exploitant quelques traces de multiplications scalaires

Figure III-11 Comparaison entre des attaques contre une courbe de 384 bits et des courbes de 256 bits

Figure III-12 Complexités d'attaques par force brute orientée en fonction du nombre de traces sur des courbes de 256 bits

Je propose tout d’abord d’estimer l’efficacité des étapes 1 et 2 de l’attaque. Pour cela, je

définis une métrique permettant d’évaluer la qualité d’une matrice de similarité. Cette

métrique n’est pas utilisable par un attaquant car elle requiert de connaître le type de chaque

opération (addition et doublage) ; elle ne servira donc qu’à évaluer l’attaque et justifier mes

choix. La Figure III-8 décrit la méthode que j’ai mise en œuvre pour calculer la qualité d’une

matrice de similarité. La première étape consiste à isoler deux groupes de couples

d’opérations : le groupe contenant uniquement des couples d’additions et le groupe contenant

des couples addition-doublage. Les similarités de chacun de ces groupes sont triées dans un

ordre différent. Une normalisation du nombre de couples dans chacun des groupes permet de

faire une comparaison quantitative. Pour formaliser la construction présentée dans la

Figure III-8 : la qualité est définie comme le pourcentage 𝑞 maximal tel que 𝑞 pourcent des

similarités entre additions soient supérieurs à 100 − 𝑞 pourcent des similarités entre additions

et doublages. Cela signifie que plus les additions sont similaires entre elles ou plus elles sont

différentes des doublages, plus cette qualité sera grande (proche de 100%). Un des avantages

de cette méthode de mesure de qualité est qu’elle est indépendante de la similarité moyenne

de la matrice. De plus, elle est rapide à calculer même sur des grandes matrices de similarité :

il suffit d’effectuer deux tris.

La Figure III-9 montre que cette qualité atteint seulement 60% pour une attaque purement

horizontale (attaque sur une seule trace) : ceci est insuffisant pour que l’algorithme de

classification effectue une identification cohérente des opérations. Par contre on observe que

la qualité de la matrice s’améliore si le nombre de traces augmente. Comme expliqué

précédemment (voir section III-2-A page 85), la métrique basée sur la corrélation permet

d’obtenir des matrices de similarité de meilleure qualité. La Figure III-9 compare cette

métrique à la distance euclidienne entre sous-traces après synchronisation. Cette comparaison

est faite à partir de traces de consommation réelles (dans les conditions décrites dans la

section III-1 page 80) d’un crypto-processeur effectuant plusieurs multiplications scalaires

entre un scalaire fixé et des points différents (choisis au hasard) sur la courbe quartique de

Jacobi de 256 bis #1 décrite dans l’Annexe 4.

L’attaque que je propose dans ce chapitre a été mise en œuvre dans différentes conditions

pour évaluer son efficacité. Cinq courbes quartiques de Jacobi générées aléatoirement (voir

l’Annexe 4) ont été attaquées. Pour chacune de ces courbes, 12 scalaires ont été générés

aléatoirement. Pour chaque courbe et chaque scalaire, 80 traces de puissance consommée de

80 multiplications scalaires ont été enregistrées. Ceci représente environ 60 Go de traces

compressées. Pour chacune des 4800 multiplications scalaires espionnées, le point opérande a

été choisi au hasard sur la courbe. Contrairement à une attaque par DPA, ni les points

opérandes ni leurs représentations ne sont connus de l’attaquant. Une trace est obtenue en 20

secondes (temps de téléchargement depuis l’oscilloscope). La trace est ensuite traitée pour en

déduire la matrice de similarité associée ; cette opération est effectuée en une minute sur un

processeur XEON (Intel) cadencé à 2 GHz. Le temps de calcul pour exécuter l’algorithme de

classification est négligeable devant le temps de calcul des matrices de similarité. Cela

signifie qu’il est peu couteux d’ajouter une trace à un attaque déjà exécutée si les matrices de

similarité ont été sauvegardées.

La Figure III-10 montre l’efficacité de différentes attaques contre des courbes quartiques

de Jacobi sur 256 bits en fonction du nombre de traces utilisées. Elle représente le nombre

d’erreurs après l’étape de classification. En utilisant une seule trace, la classification effectuée

contient en moyenne 110 opérations mal classifiées sur les 378, soit 35% d’opérations bien

classifiées supplémentaires par rapport à une classification au hasard. Comme nous le verrons

dans la suite, une seule trace ne suffit pas pour retrouver le scalaire. L’utilisation de plusieurs

traces permet d’améliorer la qualité de la matrice de similarité. Le nombre moyen

d’opérations mal classifiées descend à 80 pour 4 traces, 40 pour 10 traces, 10 pour 20 traces et

2 pour 40 traces. Sur les 48 attaques contre des courbes de 256 bits, la plus efficace a permis

une classification exacte en exploitant seulement 28 traces.

Comme le montre l’attaque sur la courbe quartique de Jacobi sur 256 bit #3 sur la

Figure III-10, l’efficacité de l’attaque est variable. Par exemple une attaque contre cette

courbe utilisant une seule trace a permis de classifier les opérations avec seulement 40 erreurs

contre 110 en moyenne. Chaque trace représente la puissance consommée par une

multiplication scalaire avec un point opérande différent. L’explication semble donc être que

certains points permettent d’obtenir des traces plus exploitables. Les coordonnées (dans le

domaine de Montgomery) des points permettant d’obtenir des matrices de similarité de bonne

qualité ont été étudiées mais aucune particularité n’a pu être identifiée. Par exemple les poids

de Hamming des coordonnées de ces points spécifiques ne sont pas différents de ceux des

autres points.

Il est imaginable que l’utilisation d’un niveau de sécurité plus important puisse faciliter les

attaques par canaux auxiliaires [Walt04]. En effet, la taille de la matrice de similarité étant

plus grande (car il y a plus d’opérations basiques sur les points), il y a plus d’information en

entré de l’algorithme de classification. De plus le temps de calcul des opérations sur 𝐺𝐹(𝑝)

nécessitant plus de temps (car les nombres manipulés sont plus grands), il est imaginable que

la qualité des similarités soit plus importante.

La Figure III-11 compare les résultats de la classification d’attaques contre une courbe

quartique de Jacobi de 384 bits par rapport à ceux contre une courbe de 256 bits. En moyenne

les résultats des classifications sont identiques pour les deux tailles de courbes par rapport au

nombre d’opérations à classifier. L’hypothèse selon laquelle une attaque par canal auxiliaire

sur une courbe de taille plus grande est plus efficace n’a pas pu être vérifiée.

Le nombre d’opérations mal classifiées permet d’observer l’évolution de la qualité des

résultats de classification. Il est possible de définir une autre métrique. Même si la

classification est possiblement erronée, l’attaquant peut essayer de retrouver le scalaire secret

à partir de celle-ci. Je définis la seconde métrique comme étant la complexité d’une attaque

par force brute orientée, exploitant la sortie de l’étape de classification (la chaîne d’additions

et de doublages) pour retrouver le scalaire. Pour cette force brute orientée, il est possible de