Les fonctions de hachage - The DART-Europe E-theses Portal

une suite aléatoire, aucune propriété structurelle ne doit pouvoir être exploitée. Les systèmes de chiffrement à flot sont utilisés dans les contextes où il est primordial de pouvoir chiffrer et déchiffrer très rapidement et où les ressources matérielles, comme par exemple la taille du circuit ou la capacité de stockage, sont très restreintes. Ceci est la raison pour laquelle les chiffrements à flot sont implantés dans les téléphones mobiles et dans d’autres dispositifs embarqués.

Les fonctions de hachage : Les fonctions de hachage servent à calculer à partir d’une donnée de taille arbitraire fournie en entrée une empreinte de taille fixe. Cette taille varie en général entre 128 et 512 bits. Cette empreinte, appelée aussi condensé ou simplement haché doit dépendre de tous les bits du message et est utilisée pour représenter le message de fa¸con compacte. Une fonction de hachage est un algorithme entièrement public et aucune valeur secrète n’intervient à aucun moment du calcul. Néanmoins, les fonctions de hachage appartiennent à la famille des algorithmes symétriques, car leur construction ressemble beau-coup à la construction d’un chiffrement par bloc. Une fonction de hachage doit se comporter idéalement comme une fonction aléatoire. En parallèle, de nombreux propriétés doivent être respectées. En particulier, il doit être difficile de trouver des collisions ou d’inverser la fonc-tion. Les standards actuels sont les fonctions SHA-1 et SHA-2, mais certaines faiblesses sont connues pour cette famille de fonctions. Pour cette raison, un concours public a été lancé en 2008 afin de déterminer un nouveau standard. La fonction Keccak a récemment remporté cette compétition et est ainsi devenue la nouvelle norme SHA-3.

Les codes d’authentification de message ou MAC : Ces mécanismes cryptographiques permettent à la fois d’assurer l’intégrité du message envoyé et d’authentifier son expéditeur.

Pour r´eussir cela, lors de l’envoi du message, le code d’authentification est ajout´e au message.

Un MAC peut être construit à partir d’une fonction de hachage, comme par exemple la con-struction HMAC ou envelope MAC, à partir d’une fonction de hachage universelle (UMAC) ou encore d’un chiffrement par bloc, comme dans OMAC ou CBC-MAC.

1.3 Les fonctions de hachage

Une fonction de hachage H est une fonction qui prend en entrée une donnée de taille aléatoire m, et donne en sortie un condensé de taille fixe, n.

H :{0,1}^∗ → {0,1}ⁿ m 7→ H(m)

L’empreinte d’une donnée, c’est-à-dire son image par la fonction de hachage, sert à la représenter et permet facilement son identification.

Les fonctions de hachage sont des outils indispensables dans beaucoup de processus infor-matiques. Une de leurs premières utilisations a été la construction de structures des données, appeléestables de hachage. Une table de hachage est un tableau qui permet de stocker des données de natures diverses. Chaque donnée possède un identifiant et l’accès à un élément du tableau se passe par l’empreinte de cet identifiant, calculée à l’aide d’une fonction de hachage.

Ceci permet la recherche en temps constant d’un élément dans une grande base de données.

Pour cette utilisation, une fonction de hachage ne doit avoir aucune propriété parti-culière en dehors d’une distribution proche de la distribution uniforme et une fonction as-sez simple peut être utilisée. Au contraire, il existe des applications, où des propriétés de sécurité supplémentaires sont exigées. Pour cela, les fonctions de hachage cryptographiques sont utilisées.

1.3.1 Fonctions de hachage cryptographiques

Les fonctions de hachage sont utilisées pour diverses applications, comme nous pourrons le voir dans la section suivante. Pour la plupart de ces applications, les données sont échangées

à travers un canal non-fiable comme cela peut être le cas pour une ligne téléphonique ou une application web. Des personnes malveillantes sont alors susceptibles d’intercepter ou même de modifier cette communication. Pour cette raison, les fonctions de hachage utilisées doivent vérifier des propriétés de sécurité supplémentaires.

Une des utilisations principales des fonctions de hachage est la protection des mots de passe. Pour cette application il est crucial d’utiliser une fonction de hachage pour laquelle un adversaire ne soit pas capable de trouver un antécédent ayant une empreinte donnée. Pour d’autres utilisations, comme par exemple dans le cas des signatures numériques, un utilisateur ne doit pas être capable de produire à partir d’un messagemun deuxième messagem^′ ayant le même haché que m, ou de produire deux messages avec le même haché. Nous pourrons alors constater que le niveau de sécurité exigé pour une fonction de hachage dépend de son utilisation. Néanmoins, pour ne pas construire une fonction de hachage différente pour chaque application, il est courant de construire des fonctions de hachage qui soient sûres dans toutes les situations possibles.

De fa¸con générale, l’empreinte d’un message produit avec une fonction de hachage cryp-tographique doit dépendre de tous les bits de message. En parallèle, une fonction de hachage cryptographique doit être un procédé assez complexe de fa¸con que si un bit du message est modifié, le haché ne doit plus avoir aucune liaison avec le haché du message précédent.

Mis à part ces propriétés de conception génériques, une fonction de hachage est dite avoir des bonnes propriétés cryptographiques si elle est résistante aux préimages, aux secondes-préimages et aux collisions. Les trois problèmes suivants doivent donc être difficiles.

– préimage :étant donné un hachéhchoisi aléatoirement, trouver un message mtel que H(m) =h.

– seconde préimage :étant donné un messagemchoisi aléatoirement, trouver un message m^′ tel queH(m) =H(m^′).

– collision : trouver deux messagesm,m^′, tels que m6=m^′ etH(m) =H(m^′).

Selon sa définition, une fonction de hachage est une fonction dont l’ensemble de départ est plus grand que l’ensemble d’arrivée. Théoriquement, l’ensemble de départ peut être infini, en pratique, l’ensemble de départ comprend généralement tous les messages d’une taille inférieure

a un certain seuil. Par exemple, la fonction de hachage SHA-1 est capable de traiter des messages de taille inf´erieure `a 2⁶⁴−1 bits.

L’existence de collisions est alors inévitable pour une fonction de hachage, H, donnant des empreintes de taille n; si on choisit 2ⁿ+ 1 messages distincts, il existe forcement une paire de messages aboutissant au même haché. De la même manière, si on restreint H à un domaine de taille 2^tet on considère que les sorties deH sont uniformément distribuées, alors un condensé aléatoireh possède environ 2^t⁻ⁿ préimages.

On définit alors la résistance d’une fonction aux collisions, aux préimages et aux deuxièmes

1.3. LES FONCTIONS DE HACHAGE 7 préimages par rapport à la difficulté de résoudre ces problèmes en pratique. Cette difficulté est évaluée par rapport au nombre d’opérations nécessaires pour que la meilleure attaque générique contre une fonction de hachage idéale réussisse.

Ainsi, un attaquant ne doit pas être en mesure de trouver une préimage en moins deO(2ⁿ) opérations, puisque la meilleure attaque générique consiste à essayer 2ⁿ messages distincts pour avoir une bonne probabilité de réussite. En suivant le même raisonnement, il ne doit pas être possible de trouver une deuxième préimage en moins deO(2ⁿ) opérations.

Pour la recherche de collisions, la probabilité de réussite de la meilleure attaque générique repose sur le paradoxe des anniversaires.

Paradoxe des anniversaires :

Ce paradoxe désigne un phénomène contre-intuitif : dans un ensemble de 23 personnes choisies aléatoirement, la probabilité que deux personnes fêtent leur anniversaire le même jour de l’année est supérieure à 1/2. Ce comportement inattendu peut néanmoins être expliqué en suivant le raisonnement suivant.

Soit k éléments x₁, x₂, . . . , x_k tirés uniformément et indépendamment dans un ensemble E de taille n. La probabilité que tous lesx_i soient distincts est

Par conséquent, la probabilité qu’au moins deux éléments soient identiques est

p= 1− n!

(n−k)! · 1

n^k ≈1−e⁻^k(k−1)²ⁿ .

De ce fait, pour le cas des anniversaires, on peut constater que pour n= 365 et k= 23, cette probabilit´e devient proche de 1/2.

En appliquant ce principe dans le cas des fonctions de hachage, pour trouver une collision dans un ensemble de taille 2ⁿ, il faudra essayer 2^n/2 valeurs distinctes pour produire une collision avec une probabilité supérieure à 1/2. Cette attaque générique qui est due à G. Yu-val [Yuv97] nécessite 2^n/2calculs dans le pire cas, mais aussi une mémoire de 2^n/2, ce qui peut être assez contraignant pour certaines applications. Pour contourner ce problème, l’algorithme ρde Pollard [Pol75] peut être utilisé pour rechercher des collisions. Des versions parallélisables existent également dans la littérature [QD90,vOW99]. Enfin, une généralisation du problème

ak >2 éléments a été publiée par David Wagner [Wag02].

Les complexités des attaques génériques pour le cas des collisions, des préimages et des deuxièmes préimages sont rassemblées à la table 1.1

Attaque générique Complexité

Recherche de pr´eimages 2ⁿ

Recherche de deuxi`emes pr´eimages 2ⁿ

Recherche de collisions 2ⁿ²

Table 1.1 – Complexité des meilleures attaques génériques.

La taille des empreintes construites par une fonction de hachage est choisie de fa¸con que le nombre d’opérations nécessaire pour une attaque générique réussie soit inatteignable avec la

puissance calculatoire actuellement accessible. Aujourd’hui, on peut considérer qu’un nombre d’opérations supérieur ou égal à 2⁸⁰ est trop grand pour être réalisé en pratique. De cette fa¸con, une fonction de hachage donnant en sortie des hachés de taille 160 bits est aujourd’hui considérée comme sûre contre toutes les attaques génériques. Néanmoins, pour garantir une certaine marge de sécurité, il est demandé que la taille de sortie des fonctions de hachage modernes varie entre 256 et 512 bits.

Une fonction de hachage est considérée comme^≪cassée^≫si une attaque plus rapide que la meilleure attaque générique existe pour cette fonction, même si sa complexité ne lui permet pas d’être réalisée en pratique. En effet, cela signifie que la fonction a des faiblesses, qui n’étaient pas prévues par le concepteur.

Relation entre les différentes notions de sécurité

Des relations entre les différentes propriétés existent. Si une fonction de hachage est résistante aux collisions, alors elle est aussi résistante aux deuxièmes préimages. Ceci s’ex-plique par le fait que si on connaˆıt une méthode pour construire des deuxièmes préimages pour une fonction on peut l’utiliser aussi pour construire des collisions. Cependant, si on connaˆıt une attaque en deuxième préimage, celle-ci s’appliquera aussi aux collisions seulement dans le cas où sa complexité est inférieure à 2ⁿ², à cause de la différence dans les complexités des attaques correspondant.

De la même fa¸con, si une fonction est résistante aux préimages, alors elle l’est aussi pour les secondes préimages, car on peut toujours utiliser une attaque en secondes préimages pour construire une préimage en ignorant simplement le premier message. La réciproque n’est pas vraie et des contre-exemples existent [MvOV97].

Une définition formelle de ces notions de sécurité et leurs relations sont données dans [RS04].

1.3.2 Utilisations

Les fonctions de hachage cryptographiques sont utilisées pour assurer des besoins informa-tiques divers. Cette primitive, qui possède beaucoup de fonctionnalités, est considérée comme le ^≪couteau suisse^≫de la cryptographie.

Intégrité des données

La vérification de l’intégrité d’une donnée est parmi les principales utilisations d’une fonction de hachage. Un utilisateur doit être capable de vérifier si une donnée n’a pas été modifiée depuis sa création ou pendant sa transmission à travers un canal de communication.

Beaucoup de sites de téléchargement de logiciels affichent sur leur page principale les empreintes des fichiers proposés au téléchargement, calculées au moyen d’une fonction de hachage. Il suffit pour l’utilisateur de télécharger un fichier, calculer son haché et comparer la valeur calculée à celle affichée sur le site. Si la fonction de hachage utilisée est connue pour être résistante aux deuxièmes préimages, alors l’utilisateur peut être sûr avec une grande probabilité qu’il détient le bon fichier.

Protection de mots de passe

Dans beaucoup de systèmes informatiques, l’authentification d’un utilisateur se fait à partir d’un mot de passe. Les mots de passe de tous les utilisateurs doivent être stockés

1.3. LES FONCTIONS DE HACHAGE 9

Dans le document The DART-Europe E-theses Portal (Page 22-26)