• Aucun résultat trouvé

Utilisation de la covariance de la charge des liens et d’information temporelle a

1.6 Contributions

2.1.1 Utilisation de la covariance de la charge des liens et d’information temporelle a

L’information ajout´ee dans une premi`ere g´en´eration de m´ethodes fut la covariance de la charge des liens. Une s´erie de mesures SNMP au cours du temps est utilis´ee. C’est `a dire que nous cherchons `a identifier les trafics au cours du temps (principalement les moyennes) `a partir de plusieurs mesures faites dans le temps. Des relations entre la covariance des charges des liens et l’´evolution des trafics ont permis de combler ce manque d’information dont nous parlions plus haut. Le premier auteur `a publier une m´ethode de ce type fut Vardi en 1996. De nombreux travaux ont ensuite ´et´e entrepris dans cette direction dans les ann´ees qui suivirent. R´ecemment, de nouveaux travaux utilisant cette approche, mais avec de nouvelles hypoth`eses, ont ´et´e entrepris et ont donn´e de bons r´esultats.

L’id´ee principale est d’estimer le second moment de la distribution de charge sur les liens au cours du temps et de le relier aux moyennes des trafics de mani`ere `a augmenter le rang du syst`eme que l’on cherche `a r´esoudre.

Tout d’abord, en prenant la moyenne (premier moment) de Y (not´ee Y) et de X (not´eeλ) `a partir

trice de covariance des charges des liens etS(y) le vecteur de dimension L(L−1)

2 contenant les ´el´ements

diagonaux et du triangle sup´erieur deΣ(y), nous pouvons ´ecrire l’´equation du second moment (2.7).

O `uBij,k= AikAkj, etS(x)repr´esente le vecteur de dimensionc contenant les ´el´ements diagonaux de

la matrice de covariance des traficsΣ(x)(suppos´ee ˆetre diagonale vu que les trafics sont suppos´es ˆetre ind´ependants les uns des autres).

Y = Aλ (2.6)

S(y) = BS(x) (2.7)

Des hypoth`eses suppl´ementaires doivent ˆetre ajout´ees `a cette nouvelle formulation pour qu’elle puisse ˆetre r´esolue. Suivant les hypoth`eses choisies, nous pouvons distinguer plusieurs approches.

Mod`ele Poissonnien

Vardi, dans [38], suppose que les trafics suivent des distributions Poissonniennes ind´ependantes

X∼ Poisson(λ). Son objectif premier est de prouver l’identifiabilit´e du syst`eme :

∀y p(y, λ) = p(y, λ′)⇒ λ = λ′ (2.8) Il prouve alors dans cet article que les valeurs moyennes des flots sont identifiables sous cette hypoth`ese. Cela provient en fait de l’´egalit´e entre la moyenne et la variance. Son objectif ´etait donc d’estimer le vecteur des trafics moyensλ `a l’aide de m´ethodes statistiques. Pour cela, Vardi propose

d’utiliser une m´ethode de maximisation de vraisemblance avec un algorithme EM.

Plus tard, en 1998, Tebaldi et West ( [46]) supposent le mˆeme mod`ele de distribution a priori pour les trafics mais ils proposent une approche de type Bayesienne pour l’analyse et l’estimation.

Cependant, comme l’hypoth`ese de trafic Poissonnien n’est pas v´erifi´ee dans les r´eseaux IP (voir [74], [84] et [65] pour plus de d´etails), toutes ces m´ethodes ne donnent pas de r´esultats suffisamment pr´ecis pour ˆetre utilis´ees par les fournisseurs d’acc`es. L’id´ee de tenir compte des covariances des charges des liens a ´et´e utilis´ee avec d’autres hypoth`eses sur la distribution des trafics.

Mod`ele Gaussien et loi de puissance

Cao et Al. consid`erent un mod`ele Gaussien pour les trafics dans [52] (2000) : la distribution de probabilit´e des trafics est suppos´ee ˆetre gaussienne et les trafics sont suppos´es ˆetre ind´ependants les uns des autres : Xt∼ normal(λ, Σ).

Cependant, comme il n’existe plus d’´egalit´e entre la moyenne et la variance des trafics, une autre hypoth`ese doit ˆetre faite de mani`ere `a rendre le syst`eme observable : Cao et Al. supposent que la loi de puissance s’applique sur les trafics ´etudi´es. Les auteurs peuvent alors ´ecrire la matrice de covariance en fonction des moyennes :

Etat de l’art 37 avecΦ qui est un facteur d’´echelle et σ2 qui repr´esente la loi de puissance entre moyenne et variance d´ependant d’une constanteKp `a d´efinir :

σ2(λ) = λKp (2.10) On remarque alors qu’en choisissantΦ = 1 et Kp = 1, on retombe sur l’approximation propos´ee par

Vardi dans [38].

Les auteurs pr´esentent un certain nombre de r´esultats exp´erimentaux validant leurs hypoth`eses et affirment alors que le mod`ele associ´e `a un facteur de puissance Kp fix´e est identifiable. L’algorithme

d´evelopp´e par Cao et Al est bas´e sur une estimation du maximum de vraisemblance.

Cependant, Medina et Al ont prouv´e dans leur article [65] que l’hypoth`ese Gaussienne n’est pas tout le temps v´erifi´ee dans les r´eseaux r´eels. Les valeurs du mod`ele peuvent changer pour diff´erentes heures de mesures et s’av´erer compl`etement fausses certaines fois. Dans le mˆeme article, Medina et Al. affirment par contre que la loi de puissance est v´erifi´ee dans les r´eseaux r´eels.

Loi de puissance seule

Nous avons vu jusque l`a que le syst`eme (2.6)-(2.7) ´etait identifiable sous diff´erentes hypoth`eses : – distribution Poissonnienne des trafics, ou

– distribution Gaussienne des trafics et loi de puissance : la relation entre la moyenne et la variance conduit `a l’identifiabilit´e du syst`eme.

Allant plus loin, Soule et Al. dans [81] ont prouv´e que les statistiques du second ordre pour les trafics (leurs covariances) sont identifiables `a partir des seules ´equations du second moment sur les liens si les hypoth`eses d’ind´ependance des trafics et de routage stable sont suppos´ees. D`es lors, en supposant une relation entre variance et moyenne comme la loi de puissance, les moyennes des trafics peuvent ˆetre trouv´ees.

Plus r´ecemment en 2006, Vaton et al. ont d´ecid´e d’explorer cette approche dans [87]. Ils proposent de r´esoudre directement les ´equations du second moment (2.7) en utilisant la m´ethode du pseudo in- verse. Cela donne en fait une estimation au sens des moindres carr´es : S(x) = (BBT)−1BTS(y).

Ensuite, Vaton et Al. n’ont plus qu’`a estimer les moyennes (i.e. le vecteurλ de dimension c ) et pour

se faire, ils proposent deux m´ethodes : une m´ethode de projection et une m´ethode de minimisation sous contrainte. Les r´esultats de ces algorithmes sont relativement bons compar´es `a ceux de la technique d’estimation du maximum de vraisemblance (Maximum Likelihood Estimation MLE) mais surtout, le temps de calcul est grandement r´eduit.