Une introduction au codage de r´eseau al´eatoire

(1)

Une introduction au codage de r ´eseau al ´eatoire

Christine Bachoc

Universit ´e Bordeaux I, IMB

Ecole de printemps Codage et Cryptographie´ 17 - 21 Mars 2014, Universit ´e Joseph Fourier, Grenoble

(2)

R ´eseau de communication

I C’est un graphe orient ´e, muni d’un ensembleSde sommets sources et d’un ensembleT de sommets destinataires.

I Les ar ˆetes mod ´elisent des canaux de communication qui transmettent sans erreurs des symboles d’un alphabetA.

I Chaque ar êteepeut transmettrecesymboles par unit é de temps (sa capacit é).

I Objectif: maximiser la quantit ´e d’information (nombre de symboles deA) transmise des sources aux destinataires.

(3)

Exemple introductif: le r ´eseau papillon

t1 t2

s

Une source, deux destinataires, capacit ´e des ar ˆetes 1.

(4)

Routage versus codage

t1 t2

s

a b

Routage: un noeud peut recopier le message rec¸u avant de le transf ´erer.

(5)

Routage versus codage

t1 t2

a

b

b s

a b

Le noeud du milieu rec¸oitaetbmais il doit choisir lequel transf ´erer.

(6)

Routage versus codage

t1

a

t2

a,b

a a

a

b

b s

a b

t1

a,b

t2

b

b b

b a

a

b

b s

a b

Dans les deux cas, on atteint un taux de transmission de 1.5.

(7)

Routage versus codage

t1 t2

a

b

b s

a b

Codage: les noeuds sont autoris és àeffectuer des op érationssur les mes- sages.

(8)

Routage versus codage

t1

a,a+b

t2

b,a+b a+b a+b

a+b a

a

b

b s

a b

Le noeud du milieu choisit de transmettrea+b.

Chaque destinataire peut calculeraetb à partir des donn ées qu’il reçoit. Le taux de transmission 2 est atteint!

(9)

Conclusions

I On peut transmettre deux symboles de la source `a l’un quelconque des destinataires par routage en une session de communication.

I Si on veut transmettre ces deux symboles `atousles destinataires en une seule session, le routage ne marche pas, par contre le codage r ´eussit.

I On va voir qu’en g ´en ´eral:

FIl y a une borne naturelle pour le taux de transmission donn ée par le th éor ème max flot-min cutpour le flot d’un graphe.

FCette borne est atteinte parroutages’il y a un seul destinataire.

FCette borne est atteinte parcodage lin ´eaires’il y a plusieurs destinataires et que l’alphabet est assez grand.

(10)

Plan

1. La notion deflotsur un graphe.

2. Letheor ème max flot-min cutet leth éor ème de Menger.

3. Cons ´equence pour letaux de transmissiondans un r ´eseau de communication.

4. Optimalit é ducodage lin éaire de r éseau.

R ´ef ´erences:

R. Ahlswede, N. Cai, S.-Y. R. Li, R. W. Yeung,Network Information Flow, IEEE Trans. Inf. Th., 2000

R. W. Yeung,Information Theory and Network Coding, Springer, 2008

(11)

Flot

I G= (V,E)graphe orient ´e,S={s},T={t}.

I Pourv∈V, on noteIn(v)etOut(v)l’ensemble des ar ˆetes arrivant env, respectivement partant dev.

I PourA⊂V,B⊂V, on notee:A→Bpour une ar ˆete commenc¸ant dansAterminant dansB.

I On note aussie⁰→epour deux ar ˆetes cons ´ecutives.

I A chaque ar êtee∈Eest associ é un nombre r éel positifce(sa capacit é).

(12)

Flot

Unflotest une applicationf:E→Rtelle que:

I Pour toute∈E, 0≤f(e)≤ce.

I Pour toutv∈V\ {s,t}, X

e∈In(v)

f(e) = X

e∈Out(v)

f(e)

C’est laloi de conservation du flot.

Lavaleur du flotfest d ´efinie par:

V(f) := X

e∈Out(s)

f(e)− X

e∈In(s)

f(e).

Mod élise lesr éseaux de transports(v éhicules, marchandise, fluides, etc..).

(13)

Pourx∈V, notons

f(x) := X

e∈Out(x)

f(e)− X

e∈In(x)

f(e).

On remarque que:

V(f) =f(s) =−f(t).

En effet, X

e∈E

f(e) =X

v∈V

“ X

e∈Out(v)

f(e)”

=X

v∈V

“ X

e∈In(v)

f(e)” .

On obtient l’ égalit é annonc ée en tenant compte de la loi de conservation : f(x) =0 pour toutx6=s,t.

t 2 1 1

s

2 1 V(f) =3

(14)

Coupe

Unecoupedu grapheGs ´eparantsettest un ensembleUde sommets tel ques∈Uett∈U(ensemble compl ´ementaire deU).

Lavaleur de la coupeest

C(U) = X

e:U→U

ce

Exemple: sice=2 pour toute∈E,C(U) =4.

t s

U

(15)

Coupe

Unecoupedu grapheGs ´eparantsettest un ensembleUde sommets tel ques∈Uett∈U(ensemble compl ´ementaire deU).

Lavaleur de la coupeest

C(U) = X

e:U→U

ce

Exemple: sice=2 pour toute∈E,C(U) =4.

t s

U

(16)

Le th ´eor `eme max flot-min cut

Th ´eor `eme:maxfV(f) =minUC(U).

Preuve:constructive.

Etape 1: pour tout flot´ f, coupeU,V(f)≤C(U):SoitT⁰l’ensemble des extr émit és des ar êtes coup ées parU. On restreint le graphe àU∪T⁰et aux ar êtes non contenues dansU. Cela d éfinit un nouveau grapheG⁰.

t s

t₁⁰ t₂⁰ t₃⁰ s

IciT⁰={t1⁰,t₂⁰,t₃⁰}. La restriction defest un flot surG⁰des`aT⁰(la loi de conservation est respect ´ee aux autres sommets).

(17)

Rappel: pourx∈V,

f(x) := X

e∈Out(x)

f(e)− X

e∈In(x)

f(e).

En notant, pourX⊂V,f(X) =P

x∈Xf(x), on a:

V(f) =f(s) =−f(T⁰) = X

e:U→U

f(e)− X

e:U→U

f(e)

≤ X

e:U→U

f(e)≤ X

e:U→U

ce=C(U).

On remarque que l’ ´egalit ´eV(f) =C(U)a lieu si et seulement si :

I f(e) =cepour toute:U→U

I f(e) =0 pour toute:U→U.

(18)

Etape 2: Il existe´ f,Utels queV(f) =C(U):Soitf un flot, soit Ul’ensemble des extr ´emit ´es de chemins sous-optimaux

x∈Us’il existex1=s,x2, . . . ,xn=xtels que:

I xixi+1ouxi+1xiappartient `aE

I sixixi+1=e∈E,f(e)<ce I sixi+1xi=e∈E,f(e)>0.

Alorss∈U, etsit∈U, on peut augmenterf:en effet, dans ce cas, il existe un chemin sous-optimal des`at.

s

. . .

− − . . . t

Soit >0 tel que, le long de ce chemin,

f(e)≤ce−siepointe verst,f(e)≥sinon.

(19)

On prendmaximal, et on modifiefle long de ce chemin en posant:

f⁰(e) =f(e)±

suivant la direction dee. Alors,f⁰est un flot,V(f⁰) =V(f) +et le chemin n’est plus sous-optimal.

En it érant ce proc éd é, on obtient un flot tel quet∈/U. AlorsUest une coupe s éparantsett, et, par construction,

I sie:U→U,f(e) =ce I sie:U→U,f(e) =0.

Donc,V(f) =C(U), le flot est maximal et la coupe est minimale.

Remarques:

I La d émonstration d écrit un algorithme permettant de construire un flot maximal à partir du flot nul.

I La d émonstration montre que, si les capacit éscesont enti ères, il existe un flot maximal à valeurs enti ères.

(20)

Le th ´eor `eme de Menger

Th éor ème:[Menger, 1927] Siwest la valeur de la coupe minimale d’un graphe orient é dont les ar êtes ont pour capacit é 1, alors il existewchemins orient és desàt, deux à deux sans ar êtes communes.

t s min cut=2

(21)

Le th ´eor `eme de Menger

Th éor ème:[Menger, 1927] Siwest la valeur de la coupe minimale d’un graphe orient é dont les ar êtes ont pour capacit é 1, alors il existewchemins orient és desàt, deux à deux sans ar êtes communes.

t s

(22)

Preuve:

I Si on antels chemins, alors on peut d éfinir un flot qui vaut 1 sur ces chemins et 0 ailleurs. Sa valeur estndonc par le th éor ème mf-mc, n≤w.

I On en d éduit le casw=0, puis on proc ède par r écurrence surw.

I SoitUl’ensemble des extr émit és de chemins orient és commençant en s. On aC(U) =0, donct∈Udonc un chemin orient é reliesàt.

I Par l’algorithme, il existe un flot maximalfmaxqui vaut 1 le long de ce chemin.

I On consid `ere alors le grapheG⁰obtenu en enlevant les ar ˆetes de ce chemin et le flot obtenu par restriction. Sa valeur est

V(fmax)−1=w−1doncG⁰a pour valeur de coupe minimalew−1 donc contient par r ´ecurrencew−1 chemins orient ´es disjoints.

(23)

Codage de r ´eseau

Informellement:

I G= (V,E)graphe orient ´e acyclique,S={s},T ={t1, . . . ,t`}

I Les ar êtes transmettent des él éments d’un alphabetA.

I A l’instant 0,` X ∈A^west ´emis pars

I A chaque instant` k=1,2, . . . ,K, un él ément deAest transmis sur une ar êtee(k), qui est une fonction des él éments transmis sur les ar êtes entrantes aux temps pr éc édents.

I Chaque ar ête transmet au plus un nombreced’ él ément deAau cours de la session.

I A la fin, à chaque` ti, une fonction de d écodageDi appliqu ée aux

él éments arriv és entiretourne un él émentYideA^w.

Si, pour touti=1, . . . , `,Di retourneX, on dit quele taux de transmission multicast de ce sch ´ema de codage estw.

(24)

Codage de r ´eseau

Sans perte de g én éralit é:

I On peut supposerce=1:

3

I On peut supposerIn(s) =∅etOut(ti) =∅:

s0 s

(25)

Codage de r ´eseau

Plus formellement:

I Une application: (l’ordre des transmissions) {1, . . . ,K} →E

k7→e(k) telle que, pour toute∈E,e(k) =eau plus une fois.

I Des applications: (fk(X)est transmis sure(k)) A^w →A

X 7→fk(X)

telles que: il existe des applicationsϕk avec

fk(X) =ϕk(f_k0(X) :k⁰<k,e(k⁰)→e(k))sie(k)∈/Out(s)

I Pouri=1, . . . , `, des applicationsD_i :A^|^In(tⁱ^)|→A^w.

(26)

Codage de r ´eseau

I Letaux de transmission multicast estwsi, pour toutX∈A^w, Pour touti=1, . . . , `, Di(fk(X) :e(k)∈In(ti)) =X.

On supposera quele grapheGest acycliquecar dans ce cas:

I Il existe un ordre sur les ar ˆetes ’de haut en bas’, i.e. tel que:

Sie⁰→ealorse⁰<e.

I On prendra toujours un tel ordre pour les transmissions pour ne pas avoir de probl ème de ’d élai’ (toute l’information est arriv ée à un noeud avantque celui-ci transf ère).

I Il suffit alors de sp ´ecifier lesfonctions globales xe:=fe(X)ou les fonctions localesϕe(x_e0 :e⁰→e).

(27)

Th ´eor `eme:Si le taux de transmission multicast estwalors, pour tout i=1, . . . , `,

w≤min cut(G,s,ti).

Preuve:Facile. SiUest une coupe s éparantsetti, les donn ées qui arrivent entisont fonction des donn ées qui transitent par les ar êtese:U→U. Plus un peu de th éorie de l’information.

(28)

Le routage est optimal avec un unique destinataire

Th ´eor `eme:SiT ={t}, le taux de transmissionw=min cut(G)est atteint par routage.

Preuve:Par le th éor ème de Menger, il existew=min cut(G)chemins orient és sans ar ête commune des àt. On peut transmettre le long de ces cheminswsymboles distincts.

t s min cut=2

(29)

Le routage est optimal avec un unique destinataire

t s

(30)

Le routage est optimal avec un unique destinataire

t

a b

a a a

b s a b

(31)

Le codage lin ´eaire est optimal avec plusieurs destinataires

Th éor ème:[Li, Yeung, Cai, 2003] SiA=F^mq etFqest un corps fini assez grand, le codage lin éaire permet d’atteindre le taux de transmission multicast

w= min

i=1,...,`min cut(G,s,ti).

Codage lin ´eaire:les applicationsf_k(X)sontF^q-lin ´eaires.

Koetter et M ´edard, 2003: preuve alg ´ebrique (q>|T|).

Jaggi, Sanders, 2005: Linear Information Flow Algorithm (q≥ |T|).

Notation:X ∈A^w = (F^mq)^west identifi ´e `a la matriceX∈F^wq^×mdont les lignes sont les ’paquets’Xi∈F^mq.

(32)

Preuve alg ´ebrique

Pour touti=1, . . . , `, la matriceYi rec¸ue enti s’ ´ecrit Yi=TiX, Ti ∈F^w×wq

Ce que l’on veut: pour touti=1, . . . , `,Ti inversible soit det(T1). . .det(T`)6=0.

Soitxe∈F^mq transmis par l’ar êteeau cours de la session. À chaque paire d’ar êtes cons écutives(e⁰,e)est associ é un coefficientλe⁰,e∈Fqtel que:

xe= X

e⁰→e

λe⁰,exe⁰.

En it ´erant, on voit que les coefficients des matricesTisont des polyn ˆomes en lesλe⁰,e. DoncQ`

i=1det(T_i)est un polyn ˆome en les variablesλe⁰,e. Donc, si|Fq|est assez grand, on peut choisir des valeurs pourλe⁰,ede telle sorte qu’il ne s’annule pas.

(33)

L’algorithme de Jaggi-Sanders

On va calculer it ´erativement des vecteursFe∈F^wq tels que xe=FeX.

Ce qu’on veut: pour touti=1, . . . , `,

{Fe : e∈In(t_i)}engendreF^wq.

Pour chaquei=1, . . . , `, par le Th de Menger, il existewchemins orient ´es disjoints joignants`ati. Notons

Pi ={Ci,1, . . . ,Ci,w}

On va calculer dans un ordre ’de haut en bas’ lesFede sorte que le rang soit maximal le long de chacun desPi.

(34)

t1 t2 t3

s

w=3

(35)

t1 t2 t3

C1,2

s C1,1 C1,3

(36)

t1 t2 t3

C2,3

s C2,1

C2,2

(37)

t1 t2 t3

C3,3

s C3,1

C3,2

(38)

I On élimine toutes les ar êtes n’appartenant pas à l’un desCi,j.

I On rajoutewar ˆetes en amont deset on initialise leursFeavec la base canonique deF^wq.

s (1,0,0)

(0,1,0) (0,0,1)

. . . .

I On parcourt les ar ˆetes suivant un ordre ’de haut en bas’ pour choisirFe.

I Soit, sur chaque cheminCi,j,Fi,jle dernier desFecalcul ´e. Soit Wi=Vec(Fi,j : j=1, . . .w).

A l’initialisation, on a dim(W` i) =w. Notre objectif est deconserver le rang w dans tous les Wi.

(39)

I Supposonse∈ Ci₁,j₁, . . . ,Cis,js. Notonserson pr ´ed ´ecesseur dansCir,jr.

e e1 e2 e3

Notons que les indicesir sont deux `a deux distincts doncs≤`.

I Soit

W=Vec(Fe₁, . . . ,Fes) (er∈ Ci_r,j_r).

et soit

W_i⁰_r =Vec(Fi_r,j : j6=jr).

On va choisirFetel que:

Fe∈W(ainsixeest comb lin desx_e0,e⁰→e) Fe∈/W_i⁰_r (ainsi on maintient le rangwdansWi_r)

(40)

I On a : dim(W_i⁰_r +W)≥dim(W_i⁰_r) +1 donc

dim(Wi⁰_r ∩W) =dim(Wi⁰_r) +dim(W)−dim(Wi⁰_r +W)≤dim(W)−1.

I Donc, sim=dim(W),

card“[^s

r=1

(Wi⁰_r ∩W)”

≤`(q^m−1−1) +1.

I Siq≥`, on aq^m> `(q^m−1−1) +1 donc

il existeFe∈W\

s

[

r=1

(Wi⁰_r ∩W).

(41)

I Si on choisitFeal ´eatoirementdansW,

proba d’ ´echec≤ `(q^m−1−1) +1

q^m ≤ `

q

donc

proba de succ `es ≥1− ` q.

I Si chaque ar êteechoisitFeal éatoirement, on parle decodage lin éaire al éatoire. La probabilit é qu’un tel sch éma atteigne le taux de

transmission optimal est donc au moins

“ 1− `

q

”|E|

'1−`|E|

q =1−o(1).

(42)

Conclusions

I Avec une source et un destinataire, le routage permet d’atteindre la limite th ´eorique min cut(G)par les chemins pr ´evus par le th de Menger.

I Avec une source et`destinataires, le routage ne permet pas d’atteindre la limite th ´eorique min^`_i=1min cut(G,s,ti).

I Par contre, d `es que|A| ≥`, le codage lin ´eaire le permet (algo Jaggi-Sanders).

I Si|A| `, le codage lin éaire al éatoire r éussit avec probabilit é proche de 1. Avantage: pas de connaissance à priori du graphe.

I Ces r ésultats s’ étendent aux graphes contenant des cycles. Par contre, le cas des r éseaux multi-source estbeaucoupmoins bien compris..