Centralité du second ordre - Centralité du second ordre : calcul réparti de l’importance des

3.2 Centralit´e du second ordre : calcul r´eparti de l’importance des noeuds

3.2.4 Centralit´e du second ordre

Nous allons ici décrire l’algorithme réparti permettant d’obtenir la centralité du second ordre. Intuition

Afin de comprendre le principe de notre algorithme, nous allons ici illustrer le principe de l’algorithme dans un contexte particulier et extrême, à savoir un graphe de type barbell. La figure 3.12 représente un tel graphe. Un graphe barbell est constitué de deux composantes complètement

connect´es dem1noeuds, connect´es par un chemin dem2noeuds. Dans la figure 3.12, on am1 = 5

etm2= 2.

Considérons une marche aléatoire sur le graphe. Intéressons nous au noeud vL de la figure

3.12 : lorsque la marche est dans la partie gauche du graphe, il a comme les autres noeuds une

probabilité 1/m1 d’être la destination de la marche à chaque étape. Lorsque la marche aléatoire

passe dans la partie de droite maintenant,vLest le point de passage obligatoire, `a l’aller comme au

retour. Ainsi, les pontsvLetvRsont visités plus régulièrement par la marche. Cela se traduit par

noeud) moindre. Nous avançons que les différences de rôles de ces noeuds se traduisent dans les écarts types des temps de passage.

De plus, il est facilement d´emontrable (voir p.ex. [AF]) qu’une marche al´eatoire partant d’un

noeud quelconque dans la partie gauche met en moyennem2

1m2 étapes à arriver à une autre noeud

donné quelconque de la partie droite (et inversement) : la marche met du temps pour passer d’un côté à l’autre. Ainsi, lorsque la marche est dans une des parties, les noeuds de cette partie la voient passer régulièrement, et plus du tout lorsque cette marche change de côté. L’écart type des

temps de passage sera fort, beaucoup plus fort que dans un graphe identique de2m1 noeuds bien

connectés. Ainsi, par l’observation (locale) de l’écart type des temps de passage de la marche, chaque noeud peut détecter la présence de chemins critiques et de pièges dans la topologie. Ceci clos l’illustration dans le cas du graphe barbell.

vL vR

FIG. 3.12 – Exemple d’un graphe Barbell

L’algorithme

Avant de présenter l’algorithme, nous allons insister sur deux points clés de la conception de cet algorithme : le débiaisement de la marche et le calcul de l’écart type.

Marche aléatoire débiaisée Dans sa publication, Newman considère une marche aléatoire clas-

sique, dans le sens où la destination de la marche est prise uniformément au hasard dans les voisins du sommet courant. La distribution stationnaire (c’est-à-dire la probabilité de trouver la marche

sur le sommeti après le temps de mixage, c’est à dire après un temps suffisamment long pour

que cette probabilité ne dépende plus du point de départ de la marche) d’une telle marche est :

πi = di/2m (voir e.g. [MR95]), c’est `a dire que plus le noeud est connect´e, plus il voit la marche.

Newman a souligné ce défaut et a montré expérimentalement une corrélation entre le degré des noeuds et leur centralité d’intermédiarité basée sur les marches aléatoires, même pour les noeuds ayant une importance faible pour la topologie malgré un fort degré. On dit que la marche est

biais´ee.

Afin de pallier à ce problème et combattre l’effet d’une distribution des degrés très hétérogène, notre algorithme utilise une marche aléatoire débiaisée, dans le sens où la distribution stationnaire

est indépendante du degré des noeuds : _{∀i ∈ V, π}i = 1/n. Ainsi, après le temps de mixage,

la marche a la même chance de se retrouver sur n’importe quel noeud. Autrement dit, après un nombre de pas suffisamment grand, tous les noeuds ont le même nombre de visites de la marche à exploiter.

Le fait d’apporter des temps de retour à tous les noeuds indépendamment de leur degré aug- mente la vitesse de l’algorithme. De plus, la marche débiaisée capture ainsi l’importance des noeuds indépendamment de leur degré. Pour débiaiser la marche, nous avons utilisé la technique

dite de Metropolis-Hastings ([Has70, SRD+06]) : lorsque la marche est sur un noeudi, la desti-

transmise que selon une probabilité dépendant du degré de la destination et du degré de i. Ce

processus est d´ecrit dans les lignes 1 `a 9 de la description de l’algorithme, figure 3.13. ´

Ecart type des temps de retour Un des points cl´e de l’algorithme est le calcul des temps de

l’écart type des temps de retour que nous détaillons ici. Chaque noeudi de_{G, lors de la première}

réception de la marche aléatoire, crée un tableauΞi, qui enregistre chaque temps de retour de la

marche eni. Rappelons qu’un temps de retour est le temps mis par la marche al´eatoire partant de

i pour revenir en i. On note Ξi(k) le k-ième temps de retour de la marche en i. Après le troisième

passage de la marche, le noeudi calcule l’´ecart-type

σi(N ) =r 1 NΣ N k=1Ξi(k)2− [ 1 NΣ N k=1Ξi(k)]2

desN valeurs de Ξi. Ces temps de retour étant des expériences indépendantes, on a grâce à la loi

forte des grands nombres :

lim

N −→∞σi(N ) = σi.

Une fois que la marche a fait suffisamment de pas, les valeurs deσ repr´esentent alors l’impor-

tance des noeuds dans le graphe : plus la valeur est faible plus le noeud est important.

Temps de convergence de l’algorithme Chaque noeud doit ˆetre visit´e un certain nombre de

fois par la marche afin de calculer un ´ecart type qui a du sens. Ainsi, le temps de convergence

de l’algorithme est reli´e au temps de couverture du graphe_{G. Ce temps de couverture est d´efini}

comme le nombre de pas nécessités par une marche aléatoire pour visiter chaque sommet deG.

Feige [Fei95a] montre que ce temps de couverture est compris entre(1+o(1))n ln n pour le graphe

complet et ₂₇4 n3_{+ o(n}3_{) pour le graphe lollipop [Fei95b], c’est-`a-dire un graphe complet de n/2}

noeud lié à une ligne de n/2 noeuds. Le résultat pour le graphe complet tient dans le cas d’une

marche débiaisée puisque tous les noeuds ont le même degré. Nous ne connaissons pas de borne haute dans le cas d’une marche débiaisée.

Le coût de notre algorithme est donc le coût de la couverture, multiplié par une constante afin que chaque noeud ait plusieurs temps de retour.

Les autres algorithmes basés sur les marches aléatoires (e.g. [Fei96] pour étudier la connec-

tivité d’un graphe) nécessitent O(n3) étapes dans le pire cas (c’est-à-dire pour des graphes très

dégénérés). En pratique, ce temps est bien moindre pour obtenir des résultats satisfaisants.

Dans le document Structures et systèmes répartis (Page 41-43)