3.2 La variante de F4
3.2.2 Comportement g´ en´ erique et probabilit´ e de r´ eussite
Si{f
10, . . . , f
r0}et{f
1, . . . , f
r}sont deux syst`emes similaires instances du syst`eme param´etrique
g´en´erique {F
1, . . . , F
r}, on souhaite estimer la probabilit´e de r´eussite de l’algorithme F4Remake
de comportement g´en´erique pour une instance al´eatoire d’un syst`eme param´etr´e.
D’un point de vue th´eorique, on peut toujours calculer une base de Gr¨obner de l’id´eal engendr´e
par {F
1, . . . , F
r} dans K(V)[X
1, . . . , X
n] avec l’algorithme F4 (mˆeme si en pratique, on s’attend
`
a une “explosion” de la taille des coefficients sous forme de fractions rationnelles). On dit que
{f
1, . . . , f
r}se comporte g´en´eriquementsi durant le calcul de la base de Gr¨obner de l’id´eal associ´e
avec l’algorithme F4 :
– le mˆeme nombre d’´etapes que pour le calcul du syst`eme g´en´erique est consid´er´e ;
– `a chaque ´etape, le mˆeme nombre de nouveaux g´en´erateurs apparaˆıt avec les mˆemes monˆomes
de tˆete.
Avec cette d´efinition, on peut donner une condition alg´ebrique pour le comportement g´en´erique
d’un syst`eme. On suppose que le syst`eme {f
1, . . . , f
r} s’est comport´e g´en´eriquement jusqu’`a la
(i−1)-i`eme ´etape du calcul. En particulier, ceci implique que toutes les paires critiques impliqu´ees
`
a l’´etapeidu calcul pour le syst`eme g´en´erique et l’instance al´eatoire sontsimilairesau sens suivant :
(lcm, u
1, p
1, u
2, p
2) est similaire`a (lcm
0, u
01, p
01, u
02, p
02) si LM(p
i) =LM(p
0i) pour i= 1,2
(en particulier, u
i=u
0ietlcm=lcm
0). On consid`ere maintenant les matricesM
getM construites
par F4 `a l’´etapei pour le syst`eme g´en´erique et l’instance al´eatoire respectivement. Il est possible
qu’apr`es le pr´eprocessingM soit plus petite queM
g, mais on supposera pour la d´emonstration que
les multiples des polynˆomes manquants ont ´et´e ajout´es `a M; bien entendu, ces lignes suppl´
emen-taires n’influenceront en rien la suite du calcul de la base de Gr¨obner pour l’instance. Par hypoth`ese,
toutes les lignes deM etM
gvues comme des polynˆomes ont donc exactement les mˆemes monˆomes
de tˆete ; on notesle nombre de monˆomes de tˆete distincts pour chacune des matrices. Comme d´ej`a
expliqu´e dans la section 2.3, on remarque que l’algorithme F4 construit des matrices quasiment
triangulaires sup´erieures, et que donc s est proche du nombre de lignes des matrices M
gou M.
Quitte `a faire des ´echanges de lignes et de colonnes, on peut ramener M
get M sous la forme
pr´esent´ee en section 2.3.3 :
s LT(M) RTZ Ag,00 A
g,1A
g,2A
g,3M
g=
A00 A
1A
2A
3M =
Les deux matrices ayant les mˆemes termes de tˆete, on peut ´echelonner les s premi`eres colonnes
similairement pour les deux ; soient M
g0et M
0les matrices correspondantes.
s LT(M) RTZ
I
sB
g,1B
g,20
M
g0=
I
sB
10B
200
M
0=
On note ˜M
gla forme ´echelon r´eduite de M
g0et r = s+` le rang de cette matrice qui contient
´
s LT(M) RTZ
I
s0 C
g,10 I
`C
g,2 0 0 0˜
M
g=
o`u l’on a repr´esent´e en vert les colonnes des nouveaux pivots. Si l’on fait les mˆemes ´echanges de
colonnes sur M
0, on obtient la matrice ˜M suivante :
I
sB
10 B B
2˜
M =
o`u la matrice B contient ` colonnes. Si jamais l’un des pivots consid´er´es dans M
gs’annule apr`es
sp´ecialisation des param`etres dans la matrice B, les monˆomes de tˆete des polynˆomes g´en´er´es `a
cette ´etape pour l’instance seront distincts de ceux obtenus pour la matrice g´en´eratrice ; en effet les
monˆomes correspondant aux colonnes de la matricesB
2sont par construction tous plus petits que
ceux associ´es aux colonnes deB, on ne peut donc pas esp´erer faire un ´echange de colonnes qui
com-pense la perte de ce pivot. Il est donc clair que le syst`eme {f
1, . . . , f
r} se comporte g´en´eriquement
`
a l’´etapeidu calcul si et seulement si la matriceB obtenue `a cette ´etape est de rang plein.
Afin de donner des estim´ees sur la probabilit´e que cette matrice soit de rang plein `a chaque
´
etape, on supposera d´esormais que l’on travaille sur le corps K = F
q. On fera de plus les deux
hypoth`eses heuristiques suivantes :
1. les coefficients des matricesB intervenant `a chaque ´etape de l’algorithme sont uniform´ement
distribu´es dansF
q;
2. les probabilit´es pour chaque matriceB d’ˆetre de rang plein `a une ´etape sont ind´ependantes.
La premi`ere hypoth`ese semble naturelle pour les syst`emes `a coefficients al´eatoires : `a la premi`ere
´
etape, les coefficients sont par construction choisis al´eatoirement dans F
q, et lors des ´etapes
sui-vantes, on se convainc que les op´erations de mise sous forme ´echelon sont suffisamment m´elangeantes
pour uniformiser les coefficients. Elle est plus critiquable pour les instances al´eatoires de syst`emes
param´etr´es g´en´eriques ; il est par exemple tout `a fait possible que certains coefficients des
po-lynˆomes g´en´eriques soient ind´ependants des param`etres, donc `a valeurs dans F
q(et non F
q(V))
et constants pour chaque sp´ecialisation. Un cas particulier important est celui des syst`emes
pa-ram´etr´es g´en´eriques dont la partie homog`ene de plus haut degr´e a ses coefficients constants : dans
ce cas, toutes les instances al´eatoires vont se comporter g´en´eriquement jusqu’`a la premi`ere chute de
degr´e. En particulier, la probabilit´e de succ`es de notre algorithme peut dans ce cas ˆetre meilleure
que pour les syst`emes al´eatoires, mˆeme lorsque le corps de base est relativement petit. On renvoie
aux exemples de la section 3.3 pour plus de d´etails. La deuxi`eme hypoth`ese doit ˆetre per¸cue comme
le “pire cas” ; en effet, on peut s’attendre en pratique `a ce que si une matrice est de rang plein `a
une ´etape, les suivantes tendent `a l’ˆetre ´egalement, c’est-`a-dire que les corr´elations sont positives.
N´eanmoins, les estim´ees qui seront obtenues sous ces hypoth`eses seront satisfaisantes comme on le
verra avec l’exemple de calcul exhaustif donn´e en section 3.3.2.
Sous les hypoth`eses 1 et 2, le lemme et le th´eor`eme suivants donnent alors la probabilit´e de
succ`es de notre variante F4 :
Lemme 3.2.1. Soit M = (m
ij) ∈ M
n,`(F
q), o`u n ≥ `, une matrice al´eatoire, i.e. dont les
coef-ficients m
ijsont choisis al´eatoirement de fa¸con ind´ependante et uniforme dans F
q. Alors M est
de rang plein avec la probabilit´eQ
ni=n−`+1
(1−q
−i). Une borne inf´erieure pour cette probabilit´e est
donn´ee par :
c(q) =
∞Y
i=1(1−q
−i)≥
q−1
q
q q−1.
En particulier, lorsqueq est grand,c(q) = 1−1/q+O(1/q
2) et la probabilit´e pour M d’ˆetre de rang
plein est tr`es proche de 1.
Pour garantir le comportement g´en´erique d’un syst`eme, les matrices B intervenant `a chaque
´
etape de l’algorithme doivent ˆetre de rang plein.
Th´eor`eme 3.2.2.Si l’on suppose que le pr´ecalcul a ´et´e fait avecF4Precompenn
step´etapes pour un
syst`eme f
10, . . . , f
r0∈ F
q[X
1, . . . , X
n] qui se comporte g´en´eriquement, alors l’algorithme F4Remake
calcule une base de Gr¨obner d’un syst`eme al´eatoiref
1, . . . , f
r∈F
q[X
1, . . . , X
n]instance de la mˆeme
famille param´etr´ee avec une probabilit´e qui est heuristiquement plus grande que c(q)
nstep.
D’apr`es les r´esultats donn´es en section 2.2, le nombre d’´etapes n
stepdans le calcul de la base
de Gr¨obner d’un syst`eme g´en´erique de polynˆomes avec l’algorithme F4 pour un ordre monomial
gradu´e, est major´e par le degr´e de r´egularit´e d
regdu syst`eme homog´en´eis´e, qui est plus petit que
la borne de Macaulay P
ri=1
(deg(F
i)−1) + 1. Plus la taille du corps F
qest grande, plus c(q) est
proche de 1, donc `a degr´e de r´egularit´e fix´e, la probabilit´e de r´eussite de notre algorithme sera tr`es
proche de 1 lorsque le corps de base F
qest suffisamment grand.
Dans le document
Attaques algébriques du problème du logarithme discret sur courbes elliptiques
(Page 73-76)