Chapitre 2 Etat de l’art 13
2.5 D´etection de communaut´es dynamiques
2.5.3 Approches par d´etections statiques inform´ees successives
3
4
Figure2.13 – Cr´eation d’un seul r´eseau en connectant les nœuds identiques dans des instan-tan´es successifs.
ou non. Une version g´en´eralis´ee de l’algorithme Louvain est utilis´ee pour optimiser la modularit´e.
Cette m´ethode ne permet pas d’op´erations de fusion ou division de communaut´es.
Mitra et al. [MTR11] travaillent sur des r´eseaux temporels particuliers, compos´es de liens dont les extr´emit´es ne sont pas dans le mˆeme instantan´e. Ces r´eseaux sont typiquement des r´eseaux de citations d’articles, ou de r´ef´erences de blogs vers d’autres blogs (qui citent des articles publi´es pr´ec´edemment dans d’autres blogs). Ces r´eseaux ont donc l’avantage de repr´esenter toute l’´evolution dans un seul graphe. Il ne s’agit cependant pas de r´eseaux classiques. Les auteurs montrent ensuite qu’il est directement possible d’appliquer une algorithme statique sur ce type de r´eseau, comme dans les deux m´ethodes pr´ec´edentes. Dans leur article, ils utilisent l’algorithme Louvain, pour sa rapidit´e. Il serait cependant possible d’utiliser un algorithme avec recouvrement, d’apr`es les auteurs.
Enfin, Aynaud et al. [AG10a] utilisent une version modifi´ee de l’algorithme Louvain pour maximiser la modularit´e, non pas sur un instantan´e, mais sur l’ensemble des instantan´es, ou un sous-ensemble d’instantan´es. Concr`etement, l’algorithme cherche `a optimiser la modularit´e moyenne d’un groupe de nœuds sur plusieurs instants du r´eseau. L’algorithme va donc chercher des communaut´es coh´erentes sur le long terme. Cette m´ethode ne permet pas d’op´erations de fusion ou division de communaut´es.
2.5.3 Approches par d´etections statiques inform´ees successives
Ces approches utilisent toujours des instantan´es, et effectuent une d´etection pour chacun d’entre eux. Cependant, afin de r´esoudre le probl`eme de l’instabilit´e des algorithmes, ces m´e-thodes proposent de prendre en compte les r´esultats obtenus `a l’´etape t lors de la d´etection des communaut´es `a l’´etapet+ 1. Ceci r´eduit l’instabilit´e, car, au cas o`u l’algorithme ne saurait lequel choisir entre deux d´ecoupages diff´erent, il pourrait par exemple prendre le plus semblable au d´ecoupage pr´ec´edent. Le principe g´en´eral de cette approche est pr´esent´e dans la figure2.14.
41
Réseau dynamique : plusieurs instantanés
Détection de communautés sur le premier
instantané
Résultat final
T T+1 T+2
T T+1 T+2
->
Détection de communautés à T+1 selon le réseau à T+1
et les communautés
de T T+1
T+1 And
T
->
Détection de communautés à T+2 selon le réseau à T+2 et
les communautés de T +1
T+1 T+2
T T+1 T+2
T+2
And
Figure 2.14 – Illustration de l’approche par d´etections statiques inform´ees successives.
2.5. D´etection de communaut´es dynamiques
2.5.3.1 Avec communaut´es non recouvrantes
Wang et al. [WF10] r´eutilisent l’id´ee des nœuds cœurs, propos´ee pr´ec´edemment par Wang et al. [WWD08], mais ont recours `a une astuce pour r´eduire l’instabilit´e entre deux d´etections.
Ils utilisent l’algorithme de Louvain pour les d´etections sur chaque instantan´e, et ils initialisent cet algorithme avec les nœuds cœurs trouv´es `a l’´etape pr´ec´edente, ce qui permet de limiter l’instabilit´e. Celle-ci reste cependant importante.
Dans cet algorithme, les nœuds cœurs sont d´efinis comme ceux qui ne changent pas de communaut´es si on ex´ecute plusieurs fois le mˆeme algorithme sur le mˆeme r´eseau l´eg`erement modifi´e.
Aynaud et al. [AG10b] proposent une m´ethode au m´ecanisme proche : `a chaque ´etape, les communaut´es sont d´etect´ees selon l’algorithme de Louvain, initialis´e avec les communaut´es trouv´ees `a l’´etape pr´ec´edente. Cette m´ethode, en revanche, n’utilise pas les nœuds cœurs.
Chakrabarti et al. [CKT06] ont propos´e une m´ethode d’evolutionary clustering . Ils ne se sont donc pas pr´eoccup´es de l’´evolution des communaut´es sur le long terme, ni des questions de fusion ou de division. En revanche, ils ont cherch´e `a assurer que les clusters trouv´ees `a l’instant t+ 1 soient coh´erents par rapport `a l’instantt. Pour ce faire, ils ont mit au point une fonction de qualit´e en deux composantes : la premi`ere est statique, et concerne donc le r´eseau de l’instantt
´etudi´e, tandis que l’autre sert `a assurer la stabilit´e, et ´evalue donc la distance entre lesclusters `a l’´etape pr´ec´edente et lesclusters `a l’´etape courante. La fonction de qualit´e peut donc s’exprimer de la mani`ere suivante :
Q=Qinstant+αQstabilit
Dans laquelle α repr´esente un param`etre permettant de donner plus ou moins de poids `a la coh´erence avec le r´esultat pr´ec´edent. Chan et al [CHX09] utilisent la mˆeme id´ee.
Xu et al [XKH11] utilisent une id´ee proche de la pr´ec´edente, mais en modifiant directement la matrice d’adjacence correspondant `a l’instantan´eten tenant compte de l’instantan´et−1. La matrice d’adjacence `a l’instant test donc d´efinie par :
W¯t=αt¯(W)t−1+ (1−αt)Wt 2.5.3.2 Avec communaut´es recouvrantes
Lin et al. [LCZ+09,LCZ+08] proposent une solution, bas´ee sur un mod`ele g´en´eratif probabi-liste, consistant `a formuler une fonction de qualit´e comme un probl`eme de factorisation de ma-trices non n´egatives qui optimise conjointement la qualit´e et la stabilit´e des communaut´es. Bien que cette m´ethode ait l’avantage de permettre la d´etection de communaut´es recouvrantes, elle impose cependant de fortes contraintes : le nombre de communaut´es doit ˆetre connu `a l’avance, et il n’esta priori pas possible d’ajouter ou de supprimer des nœuds au cours du temps. Elle ne permet pas non plus d’op´eration telles que la fusion ou la division de communaut´es.
OSLOM [LRRF11] a d´ej`a ´et´e pr´esent´e en d´etail dans la section sur les m´ethodes avec recou-vrement. Mais les auteurs pr´esentent aussi, sans s’y attarder, un m´ecanisme pour l’adapter aux r´eseaux dynamiques. Comme expliqu´e pr´ec´edemment, il est possible de fournir `a OSLOM, pour d´etecter les communaut´es sur un graphe statique, un jeu initial de communaut´es. OSLOM va alors se charger de modifier ces communaut´es, en les ´etendant ou les r´etractant, pour les am´e-liorer. Dans un graphe dynamique repr´esent´e par des s´eries d’instantan´es, il est donc possible d’alimenter OSLOM avec les communaut´es de l’instantan´e pr´ec´edent lorsque l’on veut ´etudier un instantan´e donn´e. Les auteurs ne donnent cependant pas de d´etails sur la fa¸con dont des op´erations sur les communaut´es pourraient ˆetre trait´ees. La gestion de l’apparition et de la mort des communaut´es pourrait ´egalement se r´ev´eler probl´ematique.
43
Réseau temporel : un réseau initial (facultatif)
et une séquence de modifications (trait plein = ajout,
pointillés = disparition) T T+1 T+2
Obtenir les communautés sur le premier instantané (facultatif)
T T+1 T+2
Mise à jour des communautés de T en fonction
des modifications à
T+1 T
T+1
->
Mise à jour des communautés de T+1 en fonction des modifications à
T+2
T+2
->
Résultat final
T T+1 T+2
And
And
Figure2.15 – Illustration de l’approche par d´etection de communaut´es sur des r´eseaux tempo-rels.