GivaroZpz : base de Montgomery - Corps finis premiers

2.2 Corps finis premiers

2.2.4 GivaroZpz : base de Montgomery

Une autre implantation de la bibliothèque Givaro est basée sur l’utilisation de la repr´ esenta-tion de Montgomery. En 1985 Peter. L. Montgomery a proposé un algorithme de multiplication modulaire pour des moduli génériques sans aucune division [59]. Le principe de cet algorithme est de changer la représentation des entiers en les multipliant par une puissance de la base de re-présentation et d’utiliser l’équation de Bezout pour remplacer la division par un simple décalage.

Soient x, y∈Z tels quex=Pk

i=0x_ibⁱ ety=Pk

i=0y_ibⁱ, soitr =b^s tel quer > p > x, y alors la représentation dex ety dans la base de Montgomery est ¯x=xr mod p et ¯y=yr mod p. Soit z≡xy mod palors la représentation dezdans la base de Montgomery doit être équivalente au produit de ¯x et ¯y. L’algorithme proposé par Montgomery permet de satisfaire cette équivalence.

Algorithme Montgomery-Multmod(¯x,¯y,p,r) Entr´ees : x¯=xr mod p, ¯y=yr mod p,p,r Sortie : x¯¯yr⁻¹ mod p=xyr mod p

Conditions : x, y < p < r=b^s, pgcd(p, r) = 1 Pr´ecalculs :p⁰= (−p)⁻¹ mod r

q:= (¯xy¯ mod r)p⁰ modr t:= (¯xy¯+pq)/r

si(t≥p) alors t:=t−p retourner t;

Lemme 2.2.1. Soientx, y∈Zp etr une puissance de la base de représentation dex etytel que p < r et pgcd(p, r) = 1. Si l’on connaˆıt p⁰ = (−p)⁻¹ mod r alors la multiplication de x par y modulop s’effectue à partir de 2 multiplications, 1 décalage et une addition grâce à l’algorithme Montgomery-Multmod.

Preuve. Pour prouver que l’algorithmeMontgomery-Multmod est correct il faut montrer que

xy¯+qp est divisible par r et que le résultat est borné par 2p car par construction t ≡ x¯¯yr⁻¹ mod p. En rempla¸cant la variable q par sa valeur dans l’expression ¯xy¯+qp on peut écrire l’équation suivante :

x¯y+qp ≡ x¯y¯+ ¯xyp¯ ⁰p mod r²

≡ x¯y(1 +¯ pp⁰) mod r².

En utilisant l’´equation de Bezoutrr⁰−pp⁰ = 1 on obtient ¯x¯y+qp≡x¯yrr¯ ⁰ mod r², ce qui signifie que ¯xy¯+qp est bien divisible parr. Par hypoth`ese, on sait que ¯x,y < p < b¯ et par construction de q on a q < r. On peut donc borner la valeur de tpar

t <(p²+pr)/r <(2pr)/r <2p.

2.2. Corps finis premiers 51 Les seules opérations effectuées durant cet algorithme sont 2 multiplications, 1 addition et 1 soustraction. Du fait quer est une puissance de la base de représentation, les opérations de réduction modulo r et de division par r s’effectuent respectivement à partir d’un masque bit à bit et d’un décalage.

L’implantation proposée par la bibliothèque Givaro est donc basée sur une représentation des

éléments dans la base de Montgomery, c’est-à-dire que pour un entierx∈Zp, sa représentation est x.2^s mod p tel que p < 2^s avec 2^s la base de Montgomery. Les opérations d’addition et de soustraction sont effectuées de fa¸con classique (opération puis réduction) du fait que la loi additive est convervée par la représentation (x+y mod p→x2^s+y2^s mod p). L’opération de multiplication est implantée par l’algorithme Montgomery-Multmod qui conserve les propriétés de la représentation. Toutefois, l’opération d’inversion nécessite une implantation particulière car l’inverse modulaire classique par résolution de l’équation de Bezout ne conserve pas la repr´ esen-tation : (x.2^s)⁻¹ mod p 6≡ x⁻¹2^s mod p. L’implantation proposée par la bibliothèque Givaro consiste à corriger le résultat obtenu par l’inversion classique en le multipliant par une puissance de la base de Montgomery. En utilisant l’algorithmeMontgomery-Multmod pour effectuer cette correction, il faut alors choisir le cube de la base de Montgomery.

Montgomery−Multmod(2^3s modp,(x2^s)⁻¹ modp,p,2^s) =x⁻¹2^s modp.

L’utilisation de la base de Montgomery pour représenter les éléments d’un corps fini permet de bénéficier d’une opération de multiplication modulaire sans aucune division. Néanmoins, l’algorithme Montgomery-Multmod nécessite de calculer des valeurs intermédiaires plus grandes que dans l’approche classique avec division. En effet, il faut calculerqettqui sont respectivement bornés par q ≤ (r−1)² et t ≤ (p−1)²+p(r−1). En considérant que les éléments ont une précision dembits, la taille des corps finis et la base de Montgomery doivent satisfaire le système suivant :

(r−1)² < 2^m,

(p−1)²+p(r−1) < 2^m. (2.2)

L’implantation proposée par la bibliothèque Givaro s’appuie sur des entiers non signés 32 bits avec une base de Montgomery r = 2¹⁶. La taille des corps finis possible est donc limi-tée par p <= 40499, soit 15 bits. En pratique, la fonction de multiplication-addition (axpy) n’est pas implantée à la manière de la multiplication car cela nécessiterait une multiplication supplémentaire pour synchroniser l’opérande de l’addition avec le résultat de la multiplication (¯x¯y+ ¯z=xyr²+zr). L’implantation de cette opération par deux opérations successives est ici plus efficace.

Comme pour les autres implantations de corps finis de la bibliothèque Givaro, l’int´ egra-tion de cette implantaegra-tion à la bibliothèque LinBox est immédiate en redéfinissant les fonctions d’initialisation et de conversion sur le type d’entiers multiprécision de LinBox. Lewrapper Lin-Box intégrant cette implantation est la classe GivaroMontg.

2.2.5 NTL

L’implantation de l’arithmétique des corps premiers dans la bibliothèque NTL se base sur une arithmétique modulaire classique. La définition de corps premiers se fait par l’initialisation d’une variable globale fixant la caractéristique du corps. Ainsi les opérations sont directement implantées sur les éléments du corps premier sans avoir à définir de domaine de calcul. Cette

approche ne permet cependant que la manipulation d’un seul corps premier à la fois du fait du caractère statique des caractéristiques.

Deux types d’arithmétique de corps premiers sont disponibles. La première appeléeNTL::zz_p est basée sur des entiers machine 32 bits ou 64 bits selon l’architecture utilisée. L’arithmétique utilisée est une arithmétique modulaire classique (opérations + réduction). Une des particularités de cette implantation est qu’elle propose des schémas particuliers de réduction modulaire.

La réduction modulaire d’entiers compris entre 0 et 2p, typiquement le résultat d’une addition modulop, peut être effectuée sans aucune comparaison. L’idée est de toujours calculerz=x−p pour 0 ≤ x < 2p et de se servir du bit de signe de z pour corriger le résultat. En effet, en récupérant le bit de signe de z par décalage on obtient soit 0 si le résultat est positif ou nul soit−1. Du fait que les nombres négatifs sont codés en complément à la base, le codage binaire de −1 est une suite de 1 (−1 = 1111...1111) alors que le codage de 0 est une suite de 0. En utilisant le codage binaire du signe de z comme masque bit à bit sur p, on obtient la valeur de la correction (0 oup) qu’il faut ajouter à zpour obtenir le bon résultat.

Soitx, y∈Zp, codés sur des entiers signés ayant une précision dembits l’addition modulaire z≡x+y mod p s’écrit

z = x + y - p +(( x + y - p ) > > m - 1)& p

Une autre idée développée dans la bibliothèque NTL est d’utiliser une approximation du quotient de la division entière pour effectuer les réductions modulaires après multiplication des opérandes [4]. En pratique, l’idée est d’extraire la partie entière du quotient flottant. Ce quotient approche le quotient exact à 1 près à cause des arrondis flottants. Il suffit donc de calculer le résultat en soustrayant le produit du quotient approché et du modulo, et finir de corriger s’il le faut. On peut donc calculer le reste de la division entière en soustrayant le produit du quotient approché et du modulo, et finir de corriger s’il le faut.

Le modulo étant toujours le même pour un corps premier donné, le précalcul de l’inverse du modulo sur un nombre flottant double précision permet de remplacer la division par une multiplication. Cette méthode de réduction modulaire permet de remplacer la division entière par une multiplication flottante, une multiplication entière et quelques opérations d’addition/-soustraction. En pratique, cette réduction est plus efficace que la version par division entière car la plupart des processeurs ne possèdent pas d’unité arithmétique de division entière. Néanmoins, les conversions entre entiers et nombres flottants peuvent entraˆıner des effets de bord coûteux, en particulier au niveaux despipelines. L’implantation de cette réduction modulaire s’écrit :

lo ng N T L _ m o d ( lon g r , lo ng t , l ong modulus , d o u b l e i n v _ m o d u l u s ){

lo ng q = (( d o u b l e ) t ) * i n v _ m o d u l u s ; r = t - q * t ;

if ( r > m o d u l u s ) r -= m o d u l u s ; if ( r < 0) r += m o d u l u s ; r e t u r n r ;

}

2.2. Corps finis premiers 53 Cette réduction modulaire est essentiellement utilisée dans NTL pour l’opération de mul-tiplication modulaire simple précision. Cependant, cette réduction pourrait être utilisée pour l’implantation de la fonctionaxpymais cette dernière n’est pas disponible dans la bibliothèque NTL. Une partie intéressante de cette réduction est qu’elle autorise une taille de corps premier supérieure à la moitié de la précision des entiers. En effet, la taille des corps premiers est ici bornée parp <2³⁰pour des machines 32 bits etp <2⁵²pour des machines 64 bits. Cela provient du fait que le calcul du reste par soustraction ne fait intervenir que les bits de poids faible. La valeur absolue du reste obtenu par soustraction est ici inférieure à 2p. Il suffit donc que 2psoit représentable pour utiliser cette réduction. Cette implantation nécessitant des entiers signés, la borne maximale est donc de 2^m⁰⁻¹, où m⁰ définit le nombre de bits de précision des entiers non signés. Toutefois, cette borne n’est plus valable pour les entiers 64 bits du fait de l’utilisation de flottants double précision. En effet, pour que le calcul du quotient approché soit correct à 1 près, il faut que les opérandes soient représentables en double précision. Or, nous avons vu précédemment que le plus grand entier représentable à partir d’un flottant double précision est 2⁵³−1. Cela implique donc qu’il faut limiter la taille des corps premiers à p < 2⁵² pour des machines 64 bits.

Une alternative possible qui n’est pas implantée dans la bibliothèque NTL serait d’utiliser une implantation des doubles étendus qui garantissent une mantisse d’au moins 64 bits sans aucun bit implicite [1]. En pratique, les long double en C propose une mantisse codée sur 64 bits. L’utilisation de ce type de données permettrait donc d’obtenir une limite pour les corps premiers dep <2⁶³ sur n’importe quelle architecture.

L’autre implantation de corps premiers, appeléeNTL::ZZ_p, est basée sur des entiers multipr´ e-cision et une arithmétique modulaire classique. Les entiers multiprécisions utilisés peuvent soit provenir de la bibliothèque GMP²⁷ soit provenir d’une implantation fournie par la bibliothèque NTL elle-même. L’arithmétique modulaire est effectuée par des calculs entiers suivis soit par une correction soit par une division entière multiprécision.

L’intégration de ces deux implantations dans la bibliothèque LinBox a été faite au travers d’un wrapper générique appelé UnparametricField. Ce wrapper est une classe générique non paramétrée permettant de synchroniser les types de données munis des opérateurs (+,-,×,/) avec l’archétype des corps finis de LinBox. Afin de proposer un domaine de calcul paramétrable pour cewrapper, nous avons développé les classes NTL_zz_pet NTL_ZZ_pqui surchargent le wrapper générique pour les typesNTL::zz_p etNTL::ZZ_p.

Dans le document ECOLE NORMALE SUP´ ´ ERIEURE DE LYON Laboratoire de l’Informatique du Parall´ elisme (Page 60-63)