• Aucun résultat trouvé

4.2 Evaluation ´

4.2.1 Param`etres de simulation

Diverses configurations de param`etres ont ´et´e test´ees. On consid`ere un ensemble S de n = 1000 entit´es supervis´ees consommant d = 2 services. Les entit´es se positionnent ainsi dans un espace des qualit´es E `a deux dimensions. Initialement, les entit´es sont distribu´ees uniform´ement sur E d´efinissant ainsi l’´etat initial S0 du syst`eme.

Dans ce mod`ele, on consid`ere comme isol´ee une faute impactant un nombre d’entit´es inf´erieur au seuil de densit´e τ . Par ailleurs, la restriction R2 du mod`ele suppose qu’une mˆeme faute a un impact similaire sur chacune des entit´es en percevant la d´efaillance. On suppose alors ces fautes ind´ependantes.

Une partition d’anomalies contenant A ∈ [[1, 80]] ensembles est g´en´er´ee. Ce nombre d’ensembles A est un param`etre de la simulation. Les anomalies (au sens de la d´efinition 9) sont g´en´er´ees en choisissant uniform´ement une entit´e j ∈ S.

Pour chaque entit´e j ainsi choisie, on d´etermine al´eatoirement un nombre t d’entit´es `

a d´eplacer parmi celles pr´esentes dans la boule de rayon r centr´ee sur j et telles que ak(ℓ) =FAUX. Le nombre d’entit´es t est tel que t ≤ τ avec probabilit´e G et t > τ avec

probabilit´e 1 − G.

On choisit ensuite uniform´ement t entit´es pr´esentes dans le voisinage de l’entit´e j. Le param`etre G nous permet ainsi de d´eterminer la proportion d’anomalies isol´ees et d’anomalies massives que l’on souhaite obtenir dans la v´erit´e synth´etique g´en´er´ee. Les valeurs extrˆemes de G correspondent `a des cas id´eaux. Dans le cas G = 0, seules des anomalies massives sont g´en´er´ees. Cela correspond donc `a un syst`eme dans lequel les entit´es supervis´ees sont parfaites et ne subissent aucune faute. `A l’inverse, dans le cas G = 1, seules des anomalies isol´ees sont g´en´er´ees. Cela signifie alors que seules les entit´es supervis´ees peuvent subir des fautes et que le reste du syst`eme est parfait et ne subit aucune faute. Les entit´es ainsi choisies sont ensuite d´eplac´ees dans E de

Sk

Sk−1

1 2

3 4

Figure 4.9 – G´en´eration de fautes isol´ees menant `a une faute massive.

mani`ere similaire, c’est `a dire que l’ensemble a un mouvement r-coh´erent. Pour chaque entit´e ℓ d´eplac´ee, on positionne la valeur de ak(ℓ) `a VRAI. Cette mani`ere de g´en´erer les

anomalies dans le syst`eme peut amener plusieurs entit´es ayant chacune subi une faute isol´ee `a ˆetre suffisamment proches pour appartenir `a un mˆeme mouvement τ -dense. Dans ce cas, la partition g´en´er´ee ne respecte pas la condition C2 de la d´efinition 8 de partition d’anomalies. La partition est alors modifi´ee en regroupant toutes ces entit´es au sein d’une anomalie massive et celles-ci sont alors marqu´ees comme ayant ´et´e impact´ees par une faute massive.

La figure 4.9 illustre ce cas. On a g´en´er´e quatre anomalies isol´ees et celles-ci sont suffisamment proches les unes des autres pour que le mod`ele les consid`ere comme une anomalie massive (restriction R3). On modifie alors la v´erit´e synth´etique g´en´er´ee pour marquer ces entit´es comme ayant subi une faute massive. On compare ensuite la v´erit´e synth´etique ainsi g´en´er´ee aux r´esultats fournis par simulation.

Le rayon de coh´erence r et le seuil de densit´e τ sont des param`etres fondamentaux dans notre approche : le premier caract´erise la forte corr´elation entre les variations de mesure per¸cues par les entit´es supervis´ees lors de l’occurrence d’une d´efaillance tandis que le second permet de discriminer les fautes isol´ees des fautes massives. Ces param`etres r et τ sont dimensionn´es de sorte que la probabilit´e que plus de τ fautes isol´ees apparaissent dans le voisinage d’une entit´e j soit n´egligeable.

Soient Nr(j) la variable al´eatoire repr´esentant le nombre d’entit´es dont la distance

`

a j `a n’exc`ede pas 2r et Fr(j) la variable al´eatoire repr´esentant le nombre d’entit´es

impact´ees par une faute isol´ee dont la distance `a j n’exc`ede pas 2r. On a alors Pr{Nr(j) = i} =n − 1

i 

qji(1 − qj)n−1−i

avec qj la probabilit´e que l’entit´e ℓ soit dans le voisinage de l’entit´e j.

´

Etant donn´e la position pk(j) de l’entit´e j `a l’instant k, le voisinage Vk(j) ⊂ E de

l’entit´e j `a l’instant k est d´efini par l’ensemble suivant :

On a : Pr{Fr(j) > τ } = 1 − τ X ℓ=0 Pr{Fr(j) = ℓ} = 1 − n−1 X m=0 τ ∧m X ℓ=0 Pr{Fr(j) = ℓ | Nr(j) = m} Pr{Nr(j) = m} = 1 − n−1 X m=0 τ ∧m X ℓ=0 m ℓ  fℓ(1 − f )m−ℓPr{Nr(j) = m}.

o`u x ∧ y = min(x, y) et f d´esigne la probabilit´e qu’une entit´e subisse une faute isol´ee dans l’intervalle de temps [k − 1, k].

On a donc : Pr{Fr(j) > τ } = 1 − n−1 X m=0 τ ∧m X ℓ=0 m ℓ  fℓ(1 − f )m−ℓn − 1 m  qjm(1 − qj)n−1−m.

On cherche `a fixer r et τ de sorte que la probabilit´e d’avoir plus de τ fautes ind´ependantes per¸cues par des entit´es dans le voisinage de j soit n´egligeable. ´Etant donn´e ε > 0 aussi petit que l’on veut, on cherche r et τ v´erifiant la relation suivante :

Pr{Fr(j) ≤ τ } < 1 − ε.

La figure 4.10 repr´esente la fonction de r´epartition de la variable al´eatoire Nr(j)

en fonction de la taille m du voisinage de l’entit´e j dans E pour diff´erentes valeurs de rayon de coh´erence r. Cette courbe illustre clairement l’impact de r sur le nombre d’entit´es dans le voisinage de j. Naturellement, plus la taille du syst`eme augmente plus le nombre d’entit´es dans le voisinage de j augmente. On dimensionne r de sorte que la taille du voisinage ne soit pas trop importante. Dans le cadre des simulations effectu´ees, pour n = 1000, on fixe r = 0.03 assurant un nombre de voisins raisonnable et ainsi le passage `a l’´echelle de notre approche.

La figure 4.11 illustre quant `a elle la probabilit´e d’avoir moins de τ fautes isol´ees dans ce voisinage. De la mˆeme mani`ere, il est naturel de constater que cette probabi- lit´e d´ecroˆıt lorsque la taille du syst`eme augmente. En effet, plus la taille du syst`eme augmente plus la probabilit´e de constater un nombre de fautes isol´ees dans le voisinage augmente, et donc la valeur de Pr{Fr(j) ≤ τ } diminue. Cette courbe nous permet donc

de dimensionner τ en fonction de la probabilit´e f = 0.005 de d´efaillance d’une l’entit´e. Nous utiliserons r = 0.03 et τ = 3 dans les r´esultats suivants.