• Aucun résultat trouvé

2.5.1

Les mesures topologiques des graphes

L’analyse d’un r´eseau complexe est bas´ee sur un noyau de mesures to- pologiques qui d´ecrivent les principales propri´et´es structurelles du graphe [132, 104]. Dans ce qui suit, nous examinons certains d’entre eux.

Degr´e et la force :

Le nombre d’arˆetes adjacents au nœud est le degr´e du nœud. Il est g´en´eralement d´esign´e par la lettre k. Dans le cas des r´eseaux dirig´es, nous pouvons distin- guer le degr´e entrant kin et le degr´e sortant kout, par le nombre d’arˆetes dont le nœud est un successeur ou pr´ed´ecesseur. Pour les r´eseaux pond´er´es, la somme des poids des arˆetes adjacentes sur un nœud est la force du nœud. La force entrante et la force sortante sont d´efinies pour les r´eseaux pond´er´es.

D = |V |(|V |−1)2|E|

Dans les r´eseaux dirig´es, la densit´e est divis´ee par le facteur 2 vu que le nombre possible de connexions est le double que le nombre connexion dans les graphes non orient´es. Notons que la densit´e est une mesure qui est stric- tement d´ependante de la taille du r´eseau. Dans le cas du monde r´eel, le plus grand correspond au r´eseau, alors que la plus faible est la densit´e. Il n’existe pas un moyen standard pour ´evaluer si un graphe est dense ou ´epar. Un r´eseau est consid´er´e comme ´epar lorsque son degr´e moyen est beaucoup plus petit que le nombre de nœuds. hki << |V |, ou quand les ordres de grandeur du nombre de nœuds et d’arˆetes sont approximativement ´equivalent |V | ≈ |E|. Le Diam`etre :

La distance l(i, j) entre deux nœuds i, j dans un graphe est donn´ee par le plus court chemin entre eux. La distance maximale entre toutes les paires possibles de nœuds est le diam`etre du graphe. Ce Diam`etre est utilis´e pour ´evaluer la largeur du r´eseau, mais il est tr`es sensible aux valeurs aberrantes. En effet, seulement le plus long des courts chemins peut d´eterminer un diam`etre ´elev´e. Afin d’´eviter ce probl`eme, la mesure effective du diam`etre d’un graphe est la distance minimale qui inclut les 90% des paires de nœuds [109].

Coefficient de classification :

La structure du voisinage d’un nœud d´epend de la nature de la classification des nœuds locaux. La classification, ou transitivit´e dans les sciences sociales, mesure la tendance des voisins d’un nœud `a ˆetre reli´e `a l’autre, formant ainsi un r´eseau de triangles dense. Dans des r´eseaux sociaux humains, la tendance `a la classification importante peut ˆetre r´esum´ee par la phrase populaire sui- vante :”tous les amis de mes amis sont mes amis aussi”. Quantitativement, la classification d’un nœud i est mesur´ee par un coefficient C(i) [133] calcul´e par le rapport entre le nombre de connexions entre i et ses voisins, et le nombre maximal de tels liens. Soit ki le degr´e du nœud i et ei le nombre d’arˆetes entre ses voisins. Le coefficient de classification est alors d´efinie comme suit :

C(i) = ei

ki(ki−1)/2

Cette mesure n’est valable que pour ki > 1. Si ki = 1, on peut consid´erer que C(i) = 0. Le coefficient de classification du r´eseau, qui mesure le degr´e global de regroupement du graphe, est d´efini simplement par la moyenne de classification : hC(i)i = 1 N P i C(i) Centralit´e et la centralisation :

graphe est l’une des principales r´eflexions pour caract´eriser le r´eseau. L’im- portance d’un nœud ou une arˆete est ´evalu´ee par des mesures de centralit´e [54]. Ces derniers peuvent ˆetre d´efinies sur plusieurs caract´eristiques struc- turelles du graphe, comme sa connectivit´e ou sa position par rapport aux autres nœuds. La mesure de la position centrale la plus couramment utilis´ee est la position centrale de mesure, qui co¨ıncide avec le degr´e du nœud.

CD(i) = ki

La centralit´e de proximit´e se concentre plutˆot sur la distance du nœud cible `a tous les autres sommets. La centralit´e d’un nœud i est d´efinie comme suit :

CC(i) = P 1

j6=i

l(i,j)

La centralit´e de l’interm´ediarit´e est utilis´ee, pour tenir compte de l’impor- tance des nœuds qui peuvent ne pas ˆetre bien reli´e au reste du r´eseau, mais agir comme des ponts entre deux ou plusieurs composants qui sont vaguement reli´es les uns aux autres. :

CB(i) = P h6=j6=i

σhj(i)

σhj

O`u σhj est le nombre total des chemins les plus courts du nœud h au nœud j et σhj(i) est le nombre de ces plus courts chemins passant par i. La variation de la valeur des mesures de la centralit´e sur l’ensemble des nœuds du r´eseau (et avec des facteurs de normalisation appropri´es) est appel´ee centralisation. Elle permet de mesurer la quantit´e de l’ensemble du r´eseau centralis´ee. Par exemple, la centralisation de degr´e sera maximale dans un graphe en ´etoile, o`u tous les nœuds sont reli´es `a des arˆetes d’un nœud central (et donc la variation relative sur le degr´e sortant est maximale), et au moins dans un graphe en anneau, o`u chaque nœud est reli´e `a deux voisins dans un cercle. Le degr´e de centralisations, la proximit´e, et l’interm´ediarit´e sont d´efinis respectivement comme : CD = Pi[CmaxD −CD(i)] (|V |−1)(|V |−2) CC = Pi[CCmax−CC(i)] [(|V |−2)(|V |−1)]/(2|V |−3) CB = 2Pi[CBmax−CB(i)] (|N |−1)2(|N |−2)

2.5.2

Les outils d’analyse et de virtualisation

La visualisation des r´eseaux est une phase importante dans l’analyse des syst`emes complexes. Une bonne repr´esentation illustr´ee d’un graphe, peut

mettre en ´evidence : ses composants structurels les plus importants, diviser logiquement ses r´egions diff´erentes et indiquer les nœuds les plus centraux et les arˆetes sur lequel les flux d’information sont plus fr´equent.

Les valeurs de la plupart de la m´etrique que nous avons d´efinie pr´ec´edemment peuvent ˆetre d’une fa¸con ou d’une autre repr´esent´ees utilisant des nœuds, des couleurs d’arˆetes, des tailles et des dispositions diff´erentes.

Beaucoup d’outils gratuits pour la visualisation de graphe ont ´et´e d´evelopp´es au cours de la derni`ere d´ecennie. Citons par exemple :

1. Pajek [36] (pajek.imfm.si) : Un des premiers outils exploratoires visuels pour la visualisation et l’analyse de petit graphes.

2. Networkbench (nwb.cns.iu.edu) : Un outil pour poser et visualiser des ensembles de donn´ees en r´eseau de domaines diff´erents, `a l’appui de la re- cherche interdisciplinaire.

3. Walrus [99] (www.caida.org/tools/visualization/walrus) : Il permet de visualiser des graphes en se basant sur leur repr´esentation d’arbre.

4. Gephi [14] : Sponsoris´e comme ”photoshop for graphs” (gephi.org). Il fournit une interface d’utilisateur avanc´ee pour la manipulation visuelle et une API utile pour la visualisation en continu de graphes dynamiques.

5. GUESS [4] (graphexploration.cond.org) :Un outil d’analyse bas´e sur Gython, un langage sp´ecifique `a un domaine qui supporte les op´erateurs qui peuvent avoir affaire directement avec des structures de graphe d’une fa¸con efficace et intuitive.

6. GleamViz (www.gleamviz.org) : Sp´ecifiquement con¸cu pour simuler et visualiser la diffusion de maladies infectieuses `a travers le monde.

Plusieurs paquets d’analyse de graphe comme iGraph (igraph.sourceforge.net), networkx networkx.lanl.gov), et R (www.r-project.org) fournissent des outils de visualisation de r´eseau ou des plug-ins.

2.6

La classification dans les r´eseaux sociaux