Chapitre 5 Applications de la d´ etection de communaut´ es dynamiques ` a des cas

6.2 Formats de fichiers

6.2.2 Formats de sortie

a une suppression sera not´ee - . Le lien que l’on cr´ee ou supprime est simplement repr´esent´e par les identifiants du couple de nœuds affect´e. Enfin, on peut ins´erer `a tout moment une indication pr´ecise de temps en utilisant le caract`ere # en d´ebut de ligne. Un exemple de fichier sera donc :

#01/01/2012 + a b

+ a c

#05/01/2012 + a d

-a c

#06/01/2012 + b d

On notera que l’apparition et la disparition de nœuds ne sont pas repr´esent´es. On consid`ere simplement qu’un nœud n’a d’existence que tant qu’il poss`ede au moins un lien dans le r´eseau.

Nous avons pris cette d´ecision car, dans le domaine de la d´etection de communaut´es, un nœud sans lien ne joue pas de rˆole.

La question du format de sortie est plus complexe. Dans le cas des r´eseaux statiques, les r´esultats des algorithmes de d´etection de communaut´es sont un (ou plusieurs) ensemble de communaut´es. Un ensemble de communaut´es est repr´esent´e par un fichier, et les communaut´es peuvent ˆetre repr´esent´ees de diff´erentes mani`eres. Les formats les plus utilis´es sont :

6.2. Formats de fichiers – Une ligne par communaut´e, une ligne ´etant constitu´ee par la suite des nœuds de la

com-munaut´e s´epar´es par un caract`ere pr´ed´efini, tel qu’une tabulation.

– Des couples nœuds/communaut´es, o`u chaque ligne correspond `a l’appartenance d’un nœud


a une communaut´e.

Dans le cas des communaut´es dynamiques, ces solutions ne sont pas pertinentes. Dans la litt´erature, la plupart des m´ethodes n’expliquent pas sous quelle forme sont fournis les r´esul-tats, et `a notre connaissance aucun autre algorithme de d´etection de communaut´es dynamiques n’est fourni sous la forme d’un logiciel directement utilisable fournissant un r´esultat dynamique exploitable.

Des questions se posent pourtant lorsque l’on veut fournir des communaut´es dynamiques sous une forme exploitable :

– Comment d´ecrire une communaut´e qui change au cours du temps : une communaut´e dynamique ne peut pas ˆetre r´eduite `a un ensemble de nœuds, c’est une succession de changements dans un ensemble de nœuds. Le r´esultat doit refl´eter ces changements.

– Si l’on fournit tous les d´etails de l’´evolution des communaut´es, le r´esultat devient tr`es vite inexploitable, car il y a trop d’informations. D`es lors, il faut envisager d’avoir n´ecessaire-ment `a utiliser un outil logiciel pour manipuler ces r´esultats. Or, de tels outils n’existent pas encore, du moins pas pour un grand nombre de communaut´es ´evoluant fortement.

Dans notre recherche d’un bon compromis entre ces deux probl`emes, nous avons ´et´e amen´es


a produire trois formats de r´esultats ainsi que des outils pour la visualisation de communaut´es dynamiques. Nous pr´esenterons ces outils dans la section visualisation de communaut´es dyna-miques. Nous allons ici d´ecrire les formats de sortie que nous avons d´efinis et que l’on peut g´en´erer `a partir de notre algorithme. R´esum´e condens´e

Ce fichier ne contient pas toutes les informations correspondant aux communaut´es d´etect´ees, mais en est un condens´e. Il permet de fournir un premier r´esultat qui peut ˆetre parcouru ma-nuellement, sans logiciel d´edi´e. Pour chaque communaut´e, on va d´ecrire sa date d’apparition et sa date de disparition (aucune si la communaut´e existe encore `a la fin du jeu de donn´ees). Pour d´ecrire son contenu, on va simplement citer tous les nœuds ayant ´et´e int´egr´es `a un moment o`u


a un autre de l’´evolution de la communaut´e. On reprend le syst`eme du fichier contenant une communaut´e par ligne. Le format d’une communaut´e est le suivant :

Date de début - date de fin : noeud1 noeud2 noeud3 ...

Et ce pour chaque communaut´e. Description statique des communaut´es dynamiques

Un fichier XML peut simplement ˆetre utilis´e pour d´ecrire toutes les ´etapes d’´evolution des communaut´es. On obtient un fichier qui est difficilement lisible par un ˆetre humain, mais qui pourrait facilement ˆetre trait´e par un logiciel, et qui a l’avantage de d´ecrire le r´esultat de l’algo-rithme de mani`ere exhaustive. Ce fichier est compos´e de la mani`ere suivante :

//section décrivant toutes les communautés


//description d’une communauté



<idC> identifiant </idC>

<beginning>apparition</ beginning >

<end>apparition</ end >



//fin de la section décrivant les communautés


//début de la section décrivant toutes les appartenances de liens à des communautés


//description de l’appartenance d’un nœud donné à une communauté donnée


<idNode> identifiant </idNode>

<id_com> identifiant de la communauté parent </id_com>

<date1> date d’apparition dans la communauté </date1>

<date2> date de fin d’appartenance à la communauté </date2>


//fin de la section décrivant les nœuds


//début de la section décrivant les fusions


//description d’une fusion entre deux communautés


<id_kept> identifiant de la communauté qui perdure</id_kept>

<id_lost> identifiant de la communauté englobée par l’autre </id_lost>

<date> date de la fusion </date>


</mergings> Description par modifications successives

Si la version pr´ec´edente avait l’avantage d’utiliser le format XML, standard et donc facile


a lire par un logiciel, elle pr´esentait aussi les mˆemes inconv´enients que nous avons reproch´e pr´ec´edemment au format de description de graphes dynamiques GEXF, `a savoir la verbosit´e du fichier, qui peut ˆetre p´enalisante sur de grands graphes, ainsi que la n´ecessit´e de charger tout le fichier pour pouvoir le traiter. Dans le cas de communaut´es dynamiques, il peut parfois ˆetre pratique de trouver les informations dans leur ordre d’apparition. Dans ce cas, nous avons propos´e une extension au format TNF pr´esent´e pr´ec´edemment. Il est possible de n’utiliser que les primitives pr´esent´ees ici, de mani`ere `a d´ecrire uniquement les communaut´es dynamiques, ou alors de synth´etiser dans un mˆeme fichier TNF la description de l’´evolution du graphe et de ses communaut´es, en vue, par exemple, d’une visualisation.

//descripteur de date des événements

6.2. Formats de fichiers

#date de l’événement

//événement d’ajout du noeud node à la communauté com.

+nc node com

//événement de suppression du noeud node de la communauté com.

-nc node com

//événement de la création de la communauté com +c com

//événement de la disparition de la communauté com -c com

//événement de fusion des communauté com1 et com2

= c1 c2

On peut noter que les ´ev´enements complexes, tels que la fusion de communaut´es — amenant `a supprimer l’une des communaut´es et `a, ´eventuellement, int´egrer une partie de ses nœuds dans l’autre — peuvent ˆetre d´ecrits par une succession d’´ev´enements ayant lieu au mˆeme instant.



