Approches par d´etections statiques inform´ees successives

Chapitre 2 Etat de l’art 13

2.5 D´etection de communaut´es dynamiques

2.5.3 Approches par d´etections statiques inform´ees successives

Figure2.13 – Création d’un seul réseau en connectant les nœuds identiques dans des instan-tanés successifs.

ou non. Une version généralisée de l’algorithme Louvain est utilisée pour optimiser la modularité.

Cette méthode ne permet pas d’opérations de fusion ou division de communautés.

Mitra et al. [MTR11] travaillent sur des réseaux temporels particuliers, composés de liens dont les extrémités ne sont pas dans le même instantané. Ces réseaux sont typiquement des réseaux de citations d’articles, ou de références de blogs vers d’autres blogs (qui citent des articles publiés précédemment dans d’autres blogs). Ces réseaux ont donc l’avantage de représenter toute l’évolution dans un seul graphe. Il ne s’agit cependant pas de réseaux classiques. Les auteurs montrent ensuite qu’il est directement possible d’appliquer une algorithme statique sur ce type de réseau, comme dans les deux méthodes précédentes. Dans leur article, ils utilisent l’algorithme Louvain, pour sa rapidité. Il serait cependant possible d’utiliser un algorithme avec recouvrement, d’après les auteurs.

Enfin, Aynaud et al. [AG10a] utilisent une version modifiée de l’algorithme Louvain pour maximiser la modularité, non pas sur un instantané, mais sur l’ensemble des instantanés, ou un sous-ensemble d’instantanés. Concrètement, l’algorithme cherche à optimiser la modularité moyenne d’un groupe de nœuds sur plusieurs instants du réseau. L’algorithme va donc chercher des communautés cohérentes sur le long terme. Cette méthode ne permet pas d’opérations de fusion ou division de communautés.

2.5.3 Approches par d´etections statiques inform´ees successives

Ces approches utilisent toujours des instantanés, et effectuent une détection pour chacun d’entre eux. Cependant, afin de résoudre le problème de l’instabilité des algorithmes, ces mé-thodes proposent de prendre en compte les résultats obtenus à l’étape t lors de la détection des communautés à l’étapet+ 1. Ceci réduit l’instabilité, car, au cas où l’algorithme ne saurait lequel choisir entre deux découpages différent, il pourrait par exemple prendre le plus semblable au découpage précédent. Le principe général de cette approche est présenté dans la figure2.14.

Réseau dynamique : plusieurs instantanés

Détection de communautés sur le premier

instantané

Résultat final

T T+1 T+2

->

Détection de communautés à T+1 selon le réseau à T+1

et les communautés

de T _T+1

T+1 And

->

Détection de communautés à T+2 selon le réseau à T+2 et

les communautés de T +1

T+1 T+2

T T+1 T+2

T+2

And

Figure 2.14 – Illustration de l’approche par d´etections statiques inform´ees successives.

2.5. D´etection de communaut´es dynamiques

2.5.3.1 Avec communaut´es non recouvrantes

Wang et al. [WF10] réutilisent l’idée des nœuds cœurs, proposée précédemment par Wang et al. [WWD08], mais ont recours à une astuce pour réduire l’instabilité entre deux détections.

Ils utilisent l’algorithme de Louvain pour les détections sur chaque instantané, et ils initialisent cet algorithme avec les nœuds cœurs trouvés à l’étape précédente, ce qui permet de limiter l’instabilité. Celle-ci reste cependant importante.

Dans cet algorithme, les nœuds cœurs sont définis comme ceux qui ne changent pas de communautés si on exécute plusieurs fois le même algorithme sur le même réseau légèrement modifié.

Aynaud et al. [AG10b] proposent une méthode au mécanisme proche : à chaque étape, les communautés sont détectées selon l’algorithme de Louvain, initialisé avec les communautés trouvées à l’étape précédente. Cette méthode, en revanche, n’utilise pas les nœuds cœurs.

Chakrabarti et al. [CKT06] ont proposé une méthode d’evolutionary clustering . Ils ne se sont donc pas préoccupés de l’évolution des communautés sur le long terme, ni des questions de fusion ou de division. En revanche, ils ont cherché à assurer que les clusters trouvées à l’instant t+ 1 soient cohérents par rapport à l’instantt. Pour ce faire, ils ont mit au point une fonction de qualité en deux composantes : la première est statique, et concerne donc le réseau de l’instantt

étudié, tandis que l’autre sert à assurer la stabilité, et évalue donc la distance entre lesclusters à l’étape précédente et lesclusters à l’étape courante. La fonction de qualité peut donc s’exprimer de la manière suivante :

Q=Qinstant+αQstabilit

Dans laquelle α représente un paramètre permettant de donner plus ou moins de poids à la cohérence avec le résultat précédent. Chan et al [CHX09] utilisent la même idée.

Xu et al [XKH11] utilisent une idée proche de la précédente, mais en modifiant directement la matrice d’adjacence correspondant à l’instantanéten tenant compte de l’instantanét−1. La matrice d’adjacence à l’instant test donc définie par :

W¯^t=α^t¯(W)^t−1+ (1−α^t)W^t 2.5.3.2 Avec communaut´es recouvrantes

Lin et al. [LCZ⁺09,LCZ⁺08] proposent une solution, basée sur un modèle génératif probabi-liste, consistant à formuler une fonction de qualité comme un problème de factorisation de ma-trices non négatives qui optimise conjointement la qualité et la stabilité des communautés. Bien que cette méthode ait l’avantage de permettre la détection de communautés recouvrantes, elle impose cependant de fortes contraintes : le nombre de communautés doit être connu à l’avance, et il n’esta priori pas possible d’ajouter ou de supprimer des nœuds au cours du temps. Elle ne permet pas non plus d’opération telles que la fusion ou la division de communautés.

OSLOM [LRRF11] a déjà été présenté en détail dans la section sur les méthodes avec recou-vrement. Mais les auteurs présentent aussi, sans s’y attarder, un mécanisme pour l’adapter aux réseaux dynamiques. Comme expliqué précédemment, il est possible de fournir à OSLOM, pour détecter les communautés sur un graphe statique, un jeu initial de communautés. OSLOM va alors se charger de modifier ces communautés, en les étendant ou les rétractant, pour les amé-liorer. Dans un graphe dynamique représenté par des séries d’instantanés, il est donc possible d’alimenter OSLOM avec les communautés de l’instantané précédent lorsque l’on veut étudier un instantané donné. Les auteurs ne donnent cependant pas de détails sur la fa¸con dont des opérations sur les communautés pourraient être traitées. La gestion de l’apparition et de la mort des communautés pourrait également se révéler problématique.

Réseau temporel : un réseau initial (facultatif)

et une séquence de modifications (trait plein = ajout,

pointillés = disparition) T T+1 T+2

Obtenir les communautés sur le premier instantané (facultatif)

T T+1 T+2

Mise à jour des communautés de T en fonction

des modifications à

T+1 T

T+1

Mise à jour des communautés de T+1 en fonction des modifications à

T+2

Résultat final

T T+1 T+2

And

Figure2.15 – Illustration de l’approche par détection de communautés sur des réseaux tempo-rels.

Dans le document The DART-Europe E-theses Portal (Page 56-59)