IFT 6561 Simulation et mod`eles

(1)

IFT 6561

Simulation et mod `eles

Fabian Bastin DIRO

Universit ´e de Montr ´eal

Automne 2013

Fabian Bastin IFT6561

(2)

Structure de r ´eseau

Consid érons le sous-ensemble de[0,1]^t construit à partir des diff érents états initiaux possibles du g én érateur.

Ψt ={u= (u₀, . . . ,u_t−1) = (g(s₀), . . . ,g(s_t₋₁)), s₀∈ S}.

Un crit ère majeur est queΨ_t doit recouvrir[0,1]^t tr ès uniform ément, et ce pour “tout”t.

Par g én éralisation, nous chercherons également à mesurer l’uniformit é deΨI ={(u_i₁, . . . ,u_i_t)|s₀∈ S}pour une classe choisie d’ensembles d’indices de formeI={i₁,i₂,· · · ,it}. La r écurrence lin éaire à la base d’un MRG a comme cons équence majeure de produire une structure pour l’ensembleΨt.

(3)

Structure de r ´eseau

Soit(x₀, . . . ,x_k−1)dans{0,1, . . . ,m−1}^k, et la base canonique deR^k:

{e_i, i=1, . . . ,k},

Si(x₀, . . . ,x_k−1) =e₁= (1,0, . . . ,0), la r ´ecurrence du MRG donne

(x₁, . . . ,x_k) = (0, . . . ,a_k),

(x₂, . . . ,x_k,x_k+1) = (0, . . . ,a_k,a₁a_k modm), (x₃, . . . ,x_k+2) = (0, . . . ,(a²₁+a₂)a_k modm), . . . Si(x₀, . . . ,xk−1) =e₂= (0,1, . . . ,0), alors

(x₁, . . . ,x_k) = (1,0, . . . ,a_k−1),

(x₂, . . . ,x_k,x_k₊₁) = (0, . . . ,a_k−1,(a₁a_k₋₁+a_k) modm),

(x₃, . . . ,x_k₊₂) = (0, . . . , (a²₁a_k−1+a₁a_k+a₂a_k−1) modm), . . .

(4)

Structure de r ´eseau

Nous pouvons continuer de la sorte jusqu’ `a consid ´erer (x₀, . . . ,x_k−1) =e_k = (0, . . . ,0,1), ce qui produit

(x₁, . . . ,x_k) = (0, . . . ,1,a₁),

(x2, . . . ,x_k,x_k₊₁) = (0, . . . ,1,a1,(a²₁+a2) mod m), . . . . Or tout vecteur(xn, . . . ,x_n+t−1)qui ob éit à la r écurrence, pour t≥k, est une combinaison lin éaire à coefficients entiers de ces k vecteurs de base.

Pour le voir, notonsx_i,0,x_i,1,x_i,2, . . .la suite obtenue à partir du vecteur de basee_i. Un état initial(x₀, . . . ,x_k−1) = (z₁, . . . ,z_k) peut s’ écrire commez₁e₁+· · ·+z_ke_k et produit la suite

z₁(x_1,0,x_1,1, . . .) +· · ·+z_k(x_k_,0,x_k,1, . . .) modm, et r ´eciproquement.

(5)

Structure de r ´eseau

La r éduction modulomse fait en soustrayant des vecteursme_i. Ainsi, pourt ≥k,(x₀,x₁, . . . ,x_t₋₁)suit la r écurrence si et seulement s’il s’agit d’une combinaison lin éaire à coefficients entiers de

(1,0, . . . ,0,x_1,k, . . . ,x1,t−1) ...

(0,0, . . . ,1,x_k,k, . . . ,x_k,t−1) (0,0, . . . ,0,m, . . . ,0)

...

(0,0, . . . ,0,0, . . . ,m).

(6)

Structure de r ´eseau

En divisant parm, on obtient que(u₀, . . . ,u_t−1)∈[0,1)^t est dansΨt si et seulement si c’est une combinaison lin ´eaire (sur les entiers) de

v₁ = (1,0, . . . ,0,x_1,k, . . . ,x_1,t−1)^T/m ... ...

v_k = (0,0, . . . ,1,x_k,k, . . . ,x_k,t₋₁)^T/m v_k+1 = (0,0, . . . ,0,1, . . . ,0)^T

... ...

vt = (0,0, . . . ,0,0, . . . ,1)^T.

(7)

Structure de r ´eseau

Si

L_t = (

v =

t

X

i=1

z_iv_i | z_i ∈ Z )

est le r ´eseau ayant ces vecteurs pour base, alors Ψ_t =L_t ∩[0,1)^t.

(8)

m = 101, a = 12; v

₁

= (1, 12)/101, v

₂

= (0, 1)

0 1

u_n 0

1

u_n+1

. .

.

. .

.

. . .

.

. .

.

. .

.

. .

. . .

. .

.

. .

. . .

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

. . . .

.

. .

.

. .

.

. .

. . .

. .

...

.................................... .

..

...

..

(9)

LCG with m = 101 and a = 7

0 1

u_n 0

1

u_n+1

. .

.

. .

.

. .

. . .

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

. . .

. .

.

. .

.

. . .

.

. .

.

. .

.

. .

.

. .

. . .

. .

(10)

LCG with m = 101 and a = 51

0 1

u_n 0

1

u_n+1

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

. . .

. .

.

. .

.

. . ..

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

.

. .

. . .. .

(11)

LCG with m = 101 and a = 51

Pourt>k, il y am^t vecteurs dont les coordonn ées sont des multiples de 1/m, mais seulementm^k sont dansΨt (il n’y a que m^k états initiaux possible), soit une proportion de 1/m^t^−k. Cette structure de r éseau implique que les points deΨt sont distribu és suivant un sch éma tr ès r égulier.

Par exemple, chaque point deL_t a un plus proche voisin à la m ême distance et dans la m ême direction que n’importe quel autre point, et il y a des familles d’hyperplans parall èles

´equidistants qui couvrent tous les points.

(12)

Structure de r ´eseau

Au regard de cette structure particuli ère, des mani ères naturelles de mesurer l’uniformit é de ce genre d’ensemble de pointsΨt incluent:

1 la distance d’un point à son plus proche voisin, qui est aussi la distance de l’origine au point le plus proche, ou de mani ère équivalente le vecteur non-nul le plus court dans Lt;

2 La distance entre les deux hyperplans les plus éloign és qui couvrent une r égion ne contenant aucun point deLt;

3 le nombre minimum d’hyperplan ´equidistants parall `eles qui peuvent couvrir tous les points deΨt.

(13)

Distance au plus proche voisin

Pour obtenir la premi `ere mesure, nous devons calculer le plus court vecteur non nul dans un r ´eseau de basev₁, . . . ,v_t:

Minimiserkvk²₂=

t

X

i=1 t

X

j=1

z_iv^T_i v_jz_j

sous les contraintes quez₁, . . . ,z_t soient entiers et non tous nuls.

Il s’agit par cons ´equent d’un probl ´eme d’optimisation

quadratique en nombres entiers, lequel est difficile `a r ´esoudre.

(14)

Distance entre les hyperplans

Pour traiter les deux autres mesures propos ées, nous avons tout d’abord besoin de d éfinir le r éseau dual, d énot éL^∗_t, comme suit:

L^∗_t ={h∈ R^t :h·v ∈ Z pour toutv ∈L_t}.

Pour chaque vecteurh∈L^∗_t et chaque entierz, l’ensemble {v ∈ R^t :h^Tv =z}est un hyperplan orthogonal àh. Quandz parcourt tous les entiers, nous obtenons d ès lors une famille d’hyperplans parall èles qui couvrent tous les pointsv deL_t, car h^Tv ∈ Z pourv ∈Lt.

La distance entre deux hyperplans est la distance entre l’hyperplan d éfini avecz =1 et celui d éfini avecz =0, i.e., à l’origine, puisque ce dernier contient l’origine.

(15)

Distance entre les hyperplans

Il est possible de montrer que cette distance vaut 1/khk₂. Si`_t est la longueur du plus court vecteurhnon nul dansL^∗_t, alors la distance entre les hyperplans pour la famille o `u ils sont le plus

éloign és est 1/`_t. Par cons équent, nous cherchons à maximiser`t.

Un petit nombre d’hyperplans parall èles couvrant tous les points deψt peut être trouv é en calculant le vecteur non-nul le plus court dansL^∗_t en utilisant la normeL₁au lieu de la norme euclidienne.

(16)

Indices lacunaires

Plut ôt de que consid érer des indices cons écutifs, nous pouvons consid érer n’importe quel ensemble det index (distincts) I={i₁,i₂,· · ·,it}. Dans ce cas, nous avons

Ψ_I = {(u_i₁, . . . ,u_i_t)|s₀= (x₀, . . . ,xk−1)∈ Z_m^k},

= L_I∩[0,1)^t,

1/`_I = distance entre les hyperplans dansL_I.

Note:Z_m ={0,1,2, . . . ,m−1}.

(17)

Mesures d’uniformit ´e

Des bornes sup érieures de la forme`_t ≤`^∗_t(n)pour un r éseau g én éral de densit éndansR^t existent.

Nous pouvons d ès lors standardiser`_t par`_t/`^∗_t(m^k)pour avoir une mesure dans[0,1], ce qui permet d’obtenir la figure de m érite g én érale:

MJ =min

I∈J `_I/`^∗_|I|(m^k)

o `uJ est une famille d’ensemblesI={i₁,i₂,· · ·,it}.

La recherche de g én érateurs potentiellement int éressants passe alors par le calul num érique des param ètres qui maximisent cette mesure.

(18)

Autres bornes

Sii∈Ilorsquea_k−i 6=0 (aveca₀=−1), alors

`²_I ≤1+a²₁+· · ·+a²_k.

Il faut donc que cette somme soit grande!

Preuve partielle.

Consid ´eronsI={0, . . . ,t−1}et soit h= (−a_k, . . . ,−a₁,1,0, . . . ,0)^T.

Siv = (v₀,v₁, . . . ,v_t−1)^T ∈L_t, alorsv_k = (a₁v_k−1+· · ·+a_kv₀) mod 1.

Ainsi,h^Tv doit être un entier, i.e.,h∈L^∗_t. Donc`²_t ≤ khk²₂=1+a²₁+· · ·+a²_k. Se g én éralise au cas deÌ.

(19)

Exemple: Lagged-Fibonacci

x_n= (±x_n−r ±x_n−k) modm.

PourI={0,k−r,k}, on a 1/`_I ≥1/√

3≈.577.

Les vecteurs(un,u_n+k−r,u_n+k)sont tous contenus dans deux plans!

(20)

Fonction random de la glibc

L’exemple `a ´eviter. . .

Le g én érateur commence par inialiser un tableau de 34 nombres sur le principe du g én érateur Standard Minimal:

1 x₀=s;x_i=16807∗x_i−1 mod 2³¹−1 (pouri =1, . . . ,30);

2 x_i =xi−31 (pouri=31, . . . ,33) .

Pouri≥34, l’algorithme suit l’algorithme de Lagged-Fibonacci, avecm=2³¹:

x_i = (x_i−3+x_i−31) mod 2³¹.

Enfin, la fonction ignore les 344 premiers nombres et supprime le bit de poids faible:

o_i =x_i+344>>1.

(21)

Fonction random de la glibc: observations

Le g én érateur r ésume ce qu’il convient de ne pas faire:

1 le g én érateur Standard Minimal est d épass é;

2 les vecteursx_i,x_i+28,x_i+31 sont contenus dans deux plans;

3 la lin éarit é n’est pas compl étement supprim ée en enlevant le bit de poids faible, vu que pouri≥34,

o_i =oi−31+oi−3 mod 2³¹ouo_i =oi−31+oi−3+1 mod 2³¹, et on conserve la majeure partie des inconv énients li és à m=2³¹.

(22)

RANDU (IBM)

x_n+1=65539x_n mod 2³¹