• Aucun résultat trouvé

6.2 Mod`eles et mesures pour les r´eseaux complexes

6.2.4 Modularit´e

La modularit´e semble ˆetre une propri´et´e universelle dans les r´eseaux r´eels, mais cette propri´et´e porte des noms diff´erents selon le domaine ´etudi´e : on parle de communaut´es dans les r´eseaux sociaux (Gleiser et Danon, 2003), de modules dans les r´eseaux biologiques (Hartwell et al., 1999), et de clusters dans les r´eseaux technologiques.

Nous d´etaillerons ici les outils qui permettent de mesurer la modularit´e. Une m´ethode particuli`ere de d´ecouverte de modules, l’algorithme de Newman et Girvan (2004), est d´etaill´ee ici, car nous avons r´eutilis´e et ´etendu cette m´ethode dans la section 10.4.1.

D´efinition de la modularit´e

Il existe en informatique des algorithmes de partition de graphes, visant `a optimiser le temps de traitement d’un algorithme en le distribuant sur plusieurs machines. Le but est alors de scinder le graphe en plusieurs parties, chaque partie ayant une taille impos´ee par la capacit´e de traitement de la machine correspondante. Le probl`eme de la recherche de modules dans les r´eseaux r´eels est diff´erent, dans le sens ou ni la taille, ni le nombre de modules ne sont connus `a l’avance.

Il n’existe pas une d´efinition de la modularit´e faisant l’unanimit´e. Une cat´egorie de d´efinitions correspond `a un type de modularit´e dite autor´eferente : on d´efinira par exemple un module comme une clique, c.`a.d un sous-graphe complet, dans lequel il existe un lien entre tous les nœuds du sous-graphe. Une autre type de d´efinition d’un module fait appel `a une notion relative : les nœuds au sein d’un module sont plus connect´es entre eux qu’ils ne sont connect´es avec les noeuds `a l’ext´erieur du module. Dans ce cadre, la d´efinition d’un module peut ˆetre forte ou faible (Radicchi et al., 2004). Dans la d´efinition forte, chaque nœud au sein d’un module doit avoir plus de liens avec des nœuds `a l’int´erieur du module qu’avec des nœuds `a l’ext´erieur de celui-ci. Dans la d´efinition faible, le nombre de liens que les nœuds d’un module ont entre eux doit ˆetre sup´erieur `a la somme des liens que chaque nœud du module a avec des nœuds `a l’ext´erieur du module. C’est par exemple le cas de la d´efinition de Newman et Girvan (2004) (voir ´egalement Guimer`a et Amaral (2005)).

Il existe diff´erentes m´ethodes pour la recherche et la description des modules dans les r´eseaux r´eels (Danon et al., 2005) :

– Les m´ethodes spectrales : ces m´ethodes s’appuient sur la recherche de valeurs

propres dans une matrice d’adjacence. En effet, les nœuds appartenant `a un mˆeme module partagent les mˆemes valeurs propres (Newman, 2006).

– Les m´ethodes divisives : on part du graphe complet puis on supprime les liens

dans un certain ordre, par exemple par ordre d´ecroissant de degr´e.

– Les m´ethodes agglom´eratives : on part des nœuds du graphe et on ajoute les

connexions pr´esent dans le graphe d’origine, avec l’arrangement permettant de trou-ver les meilleures communaut´es (Clauset et al., 2004; Newman, 2004).

Algorithme de Newman et Girvan (2004) (NG)

Une des m´ethodes permettant de d´ecouvrir des modules au sein d’un r´eseau est la m´ethode de Newman et Girvan (2004). Cette m´ethode se base sur un algorithme en deux phases, correspondant respectivement `a une m´ethode divisive, puis une m´ethode ag-glom´erative. Dans un premier article (Girvan et Newman, 2002), les auteurs d´efinissent la premi`ere phase de l’algorithme. Dans un second article (Newman et Girvan, 2004), les auteurs y ajoutent la seconde phase, qui permet d’obtenir une m´ethode compl`ete. Lorsque nous ferons, par la suite, r´ef´erence `a la m´ethode de Newman et Girvan (NG),

il s’agira de la m´ethode compl`ete. Cette m´ethode se base sur la notion de centralit´e

d’interm´ediarit´e.        

Noeud j

Noeud i

Noeud k Noeud k’

Lien (k,k’)

Fig. 6.5 – Repr´esentation de la centralit´e d’interm´ediarit´e du lien {k, k0

} pour les plus courts chemins entre les nœuds i et j.

La notion de centralit´e d’interm´ediarit´e est d’abord apparue en sciences sociales afin de d´eterminer le rˆole de chaque acteur (ou nœud) dans un r´eseau social. Cette mesure se base sur la notion de plus court chemin dans un graphe (voir annexe A.3.2). En partant du principe qu’au sein d’un r´eseau l’information se propage pr´eferentiellement par les plus courts chemins, la notion de centralit´e d’interm´ediarit´e permet de savoir par quelle fraction de l’information totale transitant dans le r´eseau un nœud donn´e est travers´e. Cette m´ethode n’est applicable qu’aux graphes connexes (voir annexe A.3.2).

Il peut exister plusieurs plus courts chemins dans un graphe, si ces chemins ont la mˆeme longueur minimale. La centralit´e d’interm´ediarit´e pour un nœud k est le nombre

de plus courts chemins entre deux autres nœuds i et j qui passent par k (not´e σij(k)),

divis´ee par le nombre total de plus courts chemins entre i et j (not´e σij). Sur la figure

6.5, deux plus courts chemins, en pointill´es, existent entre les nœuds i et j, et un seul de

ces chemins passe par k. Ainsi, Cij(k) = 1/2. La centralit´e d’interm´ediarit´e du nœud k

est donn´ee par la somme des valeurs obtenues pour toutes les paires de nœuds du r´eseau, diff´erents de k : CI(k) =X i6=j Cij(k) =X i6=j σij(k) σij o`u i 6= k et j 6= k (6.8)

Girvan et Newman (2002) ´etendent cette d´efinition aux liens par la centralit´e

d’in-term´ediarit´e d’arˆete. Sur la figure 6.5 `a nouveau, le nombre de plus courts chemins

passant par le lien {k, k0

}, not´e σ({k, k0

}), est 1, et le nombre de plus courts chemins entre

i et j valant σij = 2. La centralit´e d’interm´ediarit´e du lien {k, k0

} vis-`a-vis des nœuds i et

j est donc Cij({k, k0}) = 1/2. La centralit´e d’interm´ediarit´e du lien {k, k0} est la somme

des valeurs pour toutes les paires de nœuds i et j diff´erents de k et k0 :

CI({k, k0}) =X i6=j Cij({k, k0}) =X i6=j σij({k, k0}) σij (6.9)

Module 1 Module 2

Fig. 6.6 – Les liens entre 2 modules ont une plus grande centralit´e d’interm´ediarit´e que

les liens au sein d’un mˆeme module.

L’interˆet de cette seconde mesure est de pouvoir mettre en œuvre une m´ethode de d´ecouverte des modules. Les liens entre des nœuds appartentant `a des modules diff´erents ont une valeur de centralit´e d’interm´ediarit´e plus grande que les liens entre des nœuds au sein du mˆeme module. En effet, tous les plus courts chemins entre deux nœuds pris dans diff´erents modules vont tous passer par les liens qui relient les modules entre eux (figure 6.6). La m´ethode de NG est une m´ethode divisive qui suppose la suppression des liens dans l’ordre de leur valeur de centralit´e d’interm´ediarit´e d´ecroissante, puis une m´ethode de reconstruction du r´eseau permettant la d´ecouverte des modules. La m´ethode compl`ete est constitu´ee de deux ´etapes :

Suppression des liens : On calcule les valeurs de centralit´e d’interm´ediairit´e pour tous les liens du r´eseau, et on retire le lien ayant la valeur la plus importante. On recal-cule les valeurs de centralit´e d’interm´ediairit´e pour tous les liens du r´eseau, on retire le lien ayant la nouvelle valeur la plus importante, et ainsi de suite pour tous les liens (voir

figure 6.7). Les liens sont alors stock´es dans l’ordre o`u ils ont ´et´e supprim´es.

Reconstruction des modules : On repart du r´eseau avec tous ses nœuds isol´es, chaque nœud ´etant consid´er´e comme un module. Les liens sont alors lus dans l’ordre in-verse de leur suppression, les liens ayant ´et´e supprim´es en dernier sont ajout´es en premier. Lors de la lecture d’un lien entre deux nœuds appartenant `a deux modules diff´erents, les

Nb liens supprimes

de liens max.

Centralite

Fig. 6.7 – Le r´eseau lors des diff´erentes it´erations de l’´etape de suppression des liens.

10 Modules 2 Modules 1 Module

Nb liens ajoutes

Modularite

Fig. 6.8 – Les diff´erents ensemble de modules lors de l’´etape de reconstruction des

mo-dules.

modules sont fusionn´es en un seul (voir figure 6.8). Afin de d´eterminer quel est l’ensemble optimal de modules (c.`a.d `a quel moment on passe d’un ajout de lien entre des nœuds au sein d’un mˆeme module, `a un ajout de lien entre des nœuds appartenant `a des modules

diff´erents), Newman et Girvan (2004) proposent de mesurer la modularit´e de chaque

ensemble de modules. Une des mesures de la modularit´e pour un ensemble de modules C, prenant en compte le rapport relatif des liens au sein du module et des liens vers des nœuds d’autres modules, est la suivante (voir ´egalement Guimer`a et Amaral (2005)) :

M(C) = NC X c=0 " dc L −µ lLc2# (6.10)

o`u NC est le nombre total de modules dans l’ensemble C, dc est le nombre de liens entre

total de liens) au sein du module c et L est le nombre total de liens dans l’ensemble du r´eseau.

Le calcul de la modularit´e est bas´e sur les liens du r´eseau initial, avant suppression. Cette mesure M(C) varie entre 0 et 1, elle vaut 1 si tous les liens sont `a l’interieur des modules de C, et 0 s’il y a une proportion ´egale de liens `a l’int´erieur et `a l’ext´erieur des modules de C. L’ensemble optimal de modules est celui dont la valeur de modularit´e est la plus importante lors de la phase de reconstruction des modules.

Cependant, avec cette d´efinition de la modularit´e, les r´eseaux al´eatoires pr´esentent des valeurs de modularit´e non nulles (Guimer`a et al., 2004). La valeur de modularit´e n’in-dique rien dans l’absolu, et n´ecessite toujours d’ˆetre compar´ee `a la valeur de modularit´e d’un r´eseau al´eatoire ´equivalent, c.`a.d. ayant le mˆeme nombre de nœuds et de liens.

Le calcul des centralit´es d’interm´ediarit´e est d’une complexit´e algorithmique ´elev´ee. Pour le calcul des centralit´es d’interm´ediairit´e des M liens d’un r´eseau de N nœuds,

Brandes (2001) propose un algorithme permettant de passer d’une complexit´e en O(N3)

`a une complexit´e en O(N M ). Or la premi`ere phase de l’algorithme n´ecessite de d´eterminer quel lien a la plus grande valeur apr`es chaque suppression de liens, jusqu’`a ce que l’en-semble des liens soient supprim´es, donc la complexit´e algorithmique de l’enl’en-semble de la

phase est en O(N M2).

Plusieurs extensions de l’algorithme de Newman et Girvan (2004) ont ´et´e r´ealis´ees par la suite.

Dans Newman (2004), la complexit´e de l’algorithme est r´eduite en sautant la phase de suppression de liens, par l’utilisation d’un algorithme glouton. On part de la phase

de construction de modules, o`u chaque nœud correspond initialement `a un module, puis

on teste tous les liens existants dans le r´eseau. On ajoute le lien qui donne l’ensemble de modules qui donne la plus grande valeur de modularit´e, puis on teste les liens restants, etc.

Dans Fortunato et al. (2004), les auteurs ´etendent la m´ethode de Newman et Girvan (2004), en la basant non pas sur la centralit´e d’interm´ediarit´e, mais sur la notion d’effica-cit´e (voir section 6.2.2). La m´ethode suppose de retirer ´egalement tous les liens du r´eseau mani`ere it´erative, mais cette fois en retirant le lien qui induit la plus forte r´eduction de l’efficacit´e globale du r´eseau. La reconstruction de modules est identique `a celle expos´ee pr´ecedemment. L’int´erˆet de cette m´ethode est de retirer rapidement les nœuds isol´es du

reste du r´eseau. En revanche, la complexit´e de cet algorithme, en O(N4), est encore plus

´elev´ee que celle de l’algorithme de Girvan et Newman.

La m´ethode de Newman et Girvan (2004) sera utilis´ee dans la section 10.4, o`u nous

proposerons une extension de l’algorithme aux graphes orient´es.

La th´eorie des r´eseaux complexes propose des mod`eles permettant de d´ecrire la struc-ture d’un syst`eme, au niveau de ses interactions statiques. Cependant, la plupart des syst`emes sont ´egalement caract´eris´es par des dynamiques, s’appuyant sur ces struc-tures. Dans la section suivante, nous pr´esentons les r´esultats obtenus sur des dynamiques ´emergentes `a partir d’un support topologique complexe.

6.3 Dynamique dans les mod`eles de r´eseaux