• Aucun résultat trouvé

3.4 Propositions sur le chevauchement

3.4.2 Fonction d’appartenance

La proposition algorithmique pour la d´etection de communaut´es chevau-chantes est fond´ee sur l’aspect sociologique d’un individu vis-`a-vis de ses rela-tions et des communaut´es auxquelles il est li´e.

Consid´erons l’exemple sociologique suivant o`u le nœud ´etudi´e est u avec deux communaut´es d’individus. Les nœuds sont des individus et les arˆetes leurs degr´es d’amiti´es. On suppose que le nœud u est ami avec Rebecca et avec Valentin. Lors d’une soir´ee, la question est de savoir vers quelle communaut´e pourrait aller le nœud u.

Figure 3.44 – Exp´erience sociale

Le nœud u a donc le choix entre trois communaut´es. Sa d´ecision se fera selon son degr´e d’amiti´e avec Rebecca, Valentin et William mais aussi vis-`a-vis des relations de ses amis. On peut s’apercevoir de la forte collaboration au sein du groupe de Valentin avec les nœuds ayant une forte centralit´e (certains ayant un degr´e de 4 ou de 5). Dans le groupe de Rebecca, la collaboration semble moins forte mais est pr´esente. Dans le groupe de William, la collaboration semble faible, certains nœuds ne communiquent pas ensemble. En observant la topologie des structures communautaires, le nœud u pourrait rejoindre au cours de la soir´ee le groupe de Rebecca ou celui de Valentin. Cependant, le nœud u ira cotoyer un groupe si son lien avec l’individu est assez fort. Si u a une plus grande affinit´e pour Rebecca et Valentin que pour William, u ira cotoyer en premier le groupe de Rebecca puis celui de Valentin. Le nœud u pourrait alors appartenir `a deux communaut´es. Notre proposition algorithmique repose sur le graphe seuill´e G0, r´esultante de la matrice de fr´equence PijN. L’id´ee est de pouvoir utiliser la pond´eration des liens que l’on peut trouver dans la matrice de fr´equence comme une relation d’amiti´e.

Le nouveau graphe G0 est alors projet´e sur le graphe originel G, tout en respectant sa topologie. Cela signifie que les arˆetes pr´esentes dans G0 mais pas dans G ne seront pas consid´er´ees, afin de ne pas mettre de liens absurdes. Ce peut ˆetre le cas s’il y a des conflits entre personnes ou que des individus re-fusent de parler `a d’autres individus, comme dans le graphe de Zachary entre le manager et l’entraˆıneur. Nous utilisons ainsi l’information stock´ee dans PijN pour pond´erer G. Cela nous permet de voir les paires de nœuds ayant une forte probabilit´e d’ˆetre ensemble en terme communautaire. En utilisant le seuil α sur le nouveau graphe pond´er´e, nous obtenons les communaut´es et les liens entre communaut´es (LEC). Les nœuds qui sont `a la fronti`ere de leurs communaut´es et reli´es `a d’autres sont de possibles candidats pour le chevauchement. Pour sa-voir si ces nœuds candidats sont de potentiels futurs nœuds chevauchants, nous proposons les fonctions d’appartenances suivantes.

Consid´erant un nœud candidat u, l’id´ee est de mesurer le pouvoir d’ap-partenance qu’a ce nœud en observant ses communaut´es avoisinantes et leurs structures topologiques. Nous ´ecrivons Cu= {Cu

1, ..., Cu

commu-naut´es auxquelles le nœud u est li´e. Si u est li´e `a K diff´erentes communaut´es, nous le notons par |Cu| = K.

Fonctions d’appartenance pour le chevauchement

En consid´erant les K diff´erentes communaut´es pr´esentes dans le voisinage du nœud u, nous proposons la fonction d’appartenance :

fX : u × {C1u, ..., CKu} 7−→ R+ (3.3) fX(u, {C1u, ..., CKu}) = max c∈ Cu K j  ,j∈{1,...,K} (1 |c|× X i∈c ωu,iXS(i)) (3.4) o`u c est une liste de combinaisons de communaut´es voisines d’un nœud u et X un param`etre portant sur une mesure sociale fond´ee sur la structure topolo-gique d’un sous-graphe. Le terme c va prendre toutes les combinaions possibles, notamment avec j ∈ {1, ..., K}. Par la suite, le terme i ∈ c signifie que l’on va regarder toutes les combinaisons de communaut´es de c, ainsi, nous pourrons avoir les pond´erations des liens ωu,i, o`u ωu,i est la somme des poids des arˆetes liant le nœud u aux communaut´es dans la liste i. Le terme XS(i) repr´esente la valeur d’une mesure sociale du sous graphe (ici la communaut´e) S constitu´e de l’union des communaut´es de i.

Le cœfficient binomial CuK

j  permet de calculer les j combinaisons dans un ensemble de CKu ´el´ements, les ´el´ements ´etant les communaut´es. Ainsi, un nœud va essayer toutes les combinaisons de communaut´es auquel il pourrait appartenir (c ∈ CKu

j ). Cela permet au nœud u d’appartenir `a une ou plusieurs commu-naut´es. La configuration ayant le score le plus ´elev´e permettra l’assignement du nœud u aux communaut´es choisies.

Nous notons dans la formule ci-dessus que j ∈ {1, ..., K}, mais il est tout `a fait possible de forcer un nœud candidat soit chevauch´e par au moins L com-munaut´es, en ´ecrivant j ∈ {L, ..., |Cu

K|}. Cela permet `a l’utilisateur de choisir le nombre de communaut´es auxquelles peut appartenir un nœud candidat.

Pour les mesures sociales portant sur la structure topologique des commu-naut´es, nous proposons d’utiliser la densit´e (dont la fonction d’appartenance est not´e fd) et le cœfficient de clustering (dont la fonction d’appartenance est not´e fcc). Ces mesures sont utilis´ees pour effectuer une ´etude comparative.

En ce qui concerne la fonction d’appartenance fond´ee sur la densit´e, un nœud avec une forte pond´eration sur ses liens connect´es `a des communaut´es ayant de fortes densit´es aura plus de chance d’ˆetre chevauchant plutˆot qu’un nœud avec de faibles pond´erations sur ses arˆetes connect´ees `a des communaut´es de faibles

densit´es. Cependant, dans certaines situations, les chevauchements ne peuvent pas se faire. Cela peut ˆetre le cas si un nœud u est tr`es faiblement li´e `a ses communaut´es avoisinantes, elles mˆemes de faibles densit´es, avec une valeur de fd relativement faible. Fond´e sur ce constat, le chevauchement sera effectu´e si et seulement si fd(u, {Cu

1, ..., Cu K}) ≥ 1

|c|

P

S∈cdS o`u dS est la densit´e du sous graphe (ici la communaut´e) S.

L’id´ee d’utiliser ensuite le cœfficient de clustering est que le nœud candi-dat observera les connexions au sein des communaut´es, et la pr´esence de lea-ders, caract´eristique des graphes de terrains dont la distribution des degr´es des nœuds suit une loi faible. De mˆeme que pour la densit´e, si un nœud u est tr`es faiblement li´e `a ses communaut´es avoisinantes, elles mˆemes de faibles cœfficients de clustering, il n’y a pas de raison pour qu’il y ait de chevauche-ment. Fond´e sur ce constat, le chevauchement sera effectu´e si et seulement si fcc(u, {C1u, ..., CKu}) ≥ 1

|c|

P

S∈cccSo`u ccSest le coefficient de clustering du sous graphe (ici la communaut´e) S.

Supposons que nous ayons le graphe de la figure 3.45, avec la partition P = {C1, C2, C3, C4} telle que C1= {v1, v2, v3},C2= {v4, v5, v6}, C3= {v7, v8} and C4= {u}, r´esultante de la propagation de labels avec matrice de fr´equence. La question est de savoir si le nœud u peut appartenir `a plusieurs communaut´es. On observe que la meilleure configuration pour l’obtention de communaut´es che-vauchantes sur le nœud u est donn´ee avec C1et C2. Le nœud u est ainsi assign´e dans la combinaison o`u les densit´es sont les plus ´elev´ees, et les pond´erations des liens sont les plus fortes.

Figure 3.45 – Apr`es avoir calcul´e fd et fcc sur le nœud u, u appartient `a deux com-munaut´es.