• Aucun résultat trouvé

3.4 Propositions sur le chevauchement

3.4.4 Exp´ erimentations sur CDLPOV

Nous testons nos m´ethodes sur des graphes r´eels sociologiques que nous avons expos´es en introduction. Pour l’´evaluation de nos m´ethodes, nous consid´erons l’information mutuelle normalis´ee dans sa forme chevauchante (NMI), le F-Score dans sa forme chevauchante (F1), l’indice d’omega (Ω) et la modularit´e de Nicosia (QN icOv ). D’autres informations sont donn´ees telles que le pourcentage de candidats au chevauchement (cand), le pourcentage de nœuds chevauchants (candOv) et le pourcentage d’arˆetes entre communaut´es (AEC).

Pour analyser les r´esultats des deux m´ethodes propos´ees, nous utilisons des r´eseaux r´eels dont certains sont connus comme ayant des nœuds chevauchants. A ce titre, nous exposons les caract´eristiques portant sur le chevauchement des r´eseaux que nous utilisons. Nous mettons ´egalement les figures pour certains.

Le graphe de Zachary Karat´e club est connu comme ayant deux commu-naut´es, et mˆeme trois pour certains. La litt´erature montre l’existence de deux nœuds appartenant `a plusieurs communaut´es. Le graphe de Zachary s’est construit sur une dispute opposant le manager et l’entraˆıneur d’un club de karat´e. Le r´esultat de cette dispute fut la cr´eation de deux clubs de karat´e dans une mˆeme rue. Le premier nœud qui est chevauchant est ami `a la fois avec le manager et l’entraineur du club. Il poss`ede un lien dans chacune des deux communaut´es. Le second nœud chevauchant est interne `a une grande communaut´e, que l’on peut subdiviser en deux. Il s’agit d’un groupe de personnes amies entre elles dont l’unique connexion au groupe est une personne amie du manager. Ce nœud ap-partient `a un chevauchement.

Le r´eseau de dauphins est caract´eris´e par deux communaut´es repr´esentant d’un cˆot´e les mˆales et de l’autre les femelles. C’est un graphe o`u il n’y a pas de chevauchement.

Le r´eseau footbalistique repr´esente 11 conf´erences. On consid`ere qu’il y a huit clubs qui appartiennent `a plusieurs communaut´es.

Le graphe des livres politiques, des ann´ees 50 `a l’´election pr´esidentielle am´ericaine de 2004 est constitu´e de trois communaut´es, `a savoir les r´epublicains, les neutres et les d´emocrates. Les livres politiquement neutres sont une r´etrospective de la politique am´ericaine, notamment par des explications historiques. La po-litique am´ericaine a connu une succession de diff´erentes politiques d´emocrates et r´epublicaines. Depuis 1961 et jusqu’en 2004, quatre pr´esidents ont ´et´e d´emocrates et cinq pr´esidents ont ´et´e r´epublicains. Certains livres du r´eseau citent des p´eriodes pr´esidentielles marqu´ees par des politiques diff´erentes, men´ees par des partis diff´erents. C’est par exemple le cas de ”Ghost wars”, de Steve Coll qui retrace l’histoire de la CIA depuis les cinquantes derni`eres ann´ees. Nous nous attendons `a ce que ce livre puisse appartenir aux trois communaut´es que sont les r´epublicains, les neutres et les d´emocrates.

Le r´eseau de collaboration scientifique montre des communaut´es caract´eris´ees par un th`eme scientifique. Cependant, certains chercheurs ont publi´e dans di-vers domaines et sont susceptibles d’appartenir `a plusieurs communaut´es. Par exemple, Mark Newman, physicien am´ericain, publie `a la fois dans le domaine de la d´etection de communaut´es mais ´egalement dans divers domaines li´es au graphe comme les hypergraphes. Cependant, le graphe qui a ´et´e form´e a d´ej`a ´

et´e bien d´efini au sens communautaire et il n’y a que peu de chevauchement.

Zachary Karate Club

Le graphe est caract´eris´e par deux communaut´es.

Figure 3.47 – Communaut´es avec diff´erentes valeurs de α en utilisant fd et fcc, a) α ≥ 0.6, b) α ≥ 0.7 c) α ≥ 0.8

les mˆemes. Pour α ≤ 0.6, seul le nœud 10 est chevauchant. Il est assign´e `a la communaut´e C2 avec fcc alors qu’il est assign´e `a deux communaut´es avec fd (qui sont C3et C4). Cela vient du fait que la communaut´e C2a un nombre plus important de triangles que C4.

Pour α ≥ 0.8, le nœud 3 qui est connu dans la litt´erature comme ´etant che-vauchant, est assign´e `a deux communaut´es avec fd (C5et C4), mais juste `a une communaut´e avec fcc(C4). Le nœud 1 est assign´e `a une communaut´e (C2) pour chacune des deux m´ethodes.

D’apr`es les r´esultats du tableau 3.24, plus la valeur de α est ´elev´ee, plus le nombre de candidats pour le chevauchement devient important. Cela vient du fait que les tailles des communaut´es diminuent alors que α croˆıt. De ce fait, le pourcentage AEC devient plus important, augmentant les nœuds candidats. Mˆeme si les nœuds chevauchants sont les mˆemes selon fd et fccjusque α ≥ 0.9, la qualit´e des r´esultats est meilleure en utilisant fd plutˆot que fcc. La valeur de la modularit´e la plus ´elev´ee est pour α ≥ 0.7 (0.62 pour chacune des m´ethodes) avec les valeurs les plus fortes pour le NMI et pour l’indice Ω.

R´esultat avec fd et fcc sur le club de Karate fd Cand CandOv AEC QN ic

Ov Ω F1 NMI #

α ≥ 0.6 47.058% 2.94% (1) 17.95% 0.399 0.065 0.65 0.237 2 α ≥ 0.7 41.17% 8.824% (3) 16.0% 0.621 0.711 0.857 0.518 4 α ≥ 0.8 55.88% 32.352% (11) 26.92% 0.420 0.492 0.75 0.349 5 α ≥ 0.9 55.88% 32.352% (11) 26.92% 0.420 0.492 0.75 0.349 5 fcc Cand CandOv AEC QN icOv Ω F1 NMI # α ≥ 0.6 47.058% 2.941% (1) 17.948% 0.399 0.064 0.65 0.237 2 α ≥ 0.7 41.176% 8.823% (3) 16.0% 0.621 0.711 0.857 0.518 3 α ≥ 0.8 55.882% 32.353% (11) 26.923% 0.420 0.492 0.75 0.349 5 α ≥ 0.9 55.882% 32.353% (11) 26.923% 0.420 0.492 0.75 0.349 5 Tableau 3.24 – Cand : candidats possibles , CandOv : Pourcentage de nœuds chevau-chants

Les femmes du sud de Davis (r´eseau bipartie)

Il s’agit d’un r´eseau repr´esentant 18 femmes, observ´ees sur une p´eriode de 9 mois dans les ann´ees 1930. Durant cette p´eriode, de nombreux sous-groupes de ces femmes vont se rencontrer dans une s´erie de 14 ´ev`enements sociaux infor-mels. Chacun des nœuds dans ce r´eseau `a deux modes a un nom, repr´esentant une femme ou un ´ev`enement (avec la notation Ek pour le k`eme ´ev`enement).

Figure 3.48 – R´esultat sur le reseau FM avec α ≥ 0.9 R´esultat avec fdsur FM

Cand CandOv AEC QN icOv # α ≥ 0.9 71.875% 25.0% (5) 33.33% 0.502∗ 4 α ≥ 1.0 87.5% 75.0% (14) 56.99% 0.021∗ 17

R´esultat avec fccsur FM

Cand CandOv AEC QN icOv # α ≥ 0.9 71.875% 65.625% (12) 33.33% 0.157* 4 α ≥ 1.0 87.5% 87.5% (16) 56.989% 0.0∗ 17

Tableau 3.25 – Cand : candidats possibles, CandOv : Pourcentage de nœuds chevau-chants

En consid´erant le Tableau 3.25, pour α ≥ 0, 8, nous n’avons qu’une commu-naut´e. Pour α ≥ 0, 9, sur la figure 3.48, nous obtenons quatre communaut´es. Apr`es avoir calcul´e fd, nous avons 25% de nœuds dans des communaut´es che-vauchantes. Comme nous pouvons le voir, c’est `a la fois les nœuds repr´esentant des individus et des ´ev`enements qui sont assign´es `a des communaut´es chevau-chantes. Verne est assign´e `a E7, E8, E9 et E12. E7 et E9 sont assign´es `a Theresa, Laura et Brenda (dans la communaut´e C1), puis pour Verne dans C4

et finalement pour H´el`ene et Sylvia C3, soit `a trois communaut´es diff´erentes. Theresa est assign´ee aux activit´es E6, E7 et E8. A la fin du processus, certains nœuds sont li´es `a plusieurs ´ev`enements comme Verne avec E7, E8, E9 et E12. pour α = 1, 0, nous obtenons 17 communaut´es. La majorit´e des communaut´es regroupe des personnes avec leurs ´ev`enements qui sont assign´es aux personnes ayant de fortes centralit´es.

On observe qu’utiliser fcc entraˆıne un pourcentage de chevauchement plus important qu’en utilisant fd (65.625% contre 25.0%), avec un taux de chevau-chement moyen plus important, particuli`erement pour les ´ev`enements.

Les dauphins de Nouvelle Z´elande

Le graphe est compos´e de deux communaut´es, qui regroupent les mˆales et les femelles.

R´esultats avec fdet fccsur le r´eseau de dauphins

fd Cand CandOv AEC QN icOv Ω F1 NMI # α ≥ 0.5 51.61% % 0.0% 20.38% 0.7959 1.0 1.0 1.0 2 α ≥ 0.6 54.838% 6.451% (4) 24.050% 0.750 0.617 .857 0.594 4 α ≥ 0.7 64.51% 8.065% (5) 30.57% 0.714 0.478 0.75 0.457 5 α ≥ 0.8 61.29% 19.355% (12) 29.30% 0.605 0.478 0.6184 0.442 8 α ≥ 0.9 77.41% 25.81% (16) 43.94% 0.542 0.355 0.533 0.246 12 fcc Cand CandOv AEC QN ic

Ov Ω F1 NMI # α ≥ 0.5 51.613% 0.0% 20.382% 0.796 1.0 1.0 1.0 2 α ≥ 0.6 54.838% 6.451% (4) 24.051% 0.750 0.613 .857 0.594 4 α ≥ 0.7 64.516% 8.065% (5) 30.57% 0.714 0.429 0.75 0.457 5 α ≥ 0.8 61.29% 19.355% (12) 29.3% 0.606 0.478 0.618 0.442 8 α ≥ 0.9 77.419% 35.483% (22) 43.949% 0.441 0.588 0.549 0.277 12 Tableau 3.26 – Cand : candidats possibles, CandOv : Pourcentage de nœuds chevau-chants

A partir du tableau 3.26, pour α ≥ 0.5, l’algorithme et les fonctions trouvent les deux communaut´es, sans aucun chevauchement, avec un NMI, un indice d’omega et un F1 score de 1,0. En augmentant la valeur de α, la taille des communaut´es diminue tandis que le nombre de candidats possibles pour le che-vauchement augmente. Le pourcentage de cheche-vauchement est le mˆeme pour α ≥ 0.6 jusqu’`a α ≥ 0.8. Malgr´e cela, les deux m´ethodes n’assignent pas les nœuds candidats de la mˆeme mani`ere. fccproduit la mˆeme qualit´e en termes de communaut´es mais a un pourcentage de chevauchement et un taux de chevau-chement moyen plus important qu’avec fd, surtout pour de fortes valeurs de α.

Figure 3.49 – R´eseaux de dauphins a) α ≥ 0, 5, b) α ≥ 0, 6, les nœuds chevauchants avec fcc et fddsont les mˆemes

En observant la figure 3.49, pour α ≥ 0.6, nous voyons que 4 nœuds ont ´

et´e selectionn´es pour appartenir `a plus d’une communaut´e. En consid´erant leurs aspects topologiques, SN 89 est li´e `a deux communaut´es avec une arˆete li´ee `a chacune, il est assign´e `a ses communaut´es voisines. Il en est de mˆeme pour T opless qui a 6 arˆetes `a l’int´erieur de sa communaut´e et 4 `a l’ext´erieur. Zap a trois nœuds `a l’int´erieur de sa communaut´e et 2 `a l’ext´erieur. Il est assign´e `a C4. SN 100 a 4 arˆetes `a l’int´erieur de sa communaut´e et deux `a l’ext´erieur vers deux communaut´es. Il est assign´e aux communaut´es C3et C4. SN 9 a juste une arˆete

de plus que SN 100 `a l’int´erieur de la communaut´e avec la mˆeme configuration topologique, il n’est cependant pas assign´e. Pour α ≥ 0.6, les r´esultats, que cela soit en utilisant fd ou fcc sont les mˆemes. Pour chacune des deux m´ethodes, la taille des dendrogrammes est de 6. De α ≥ 0.5 `a α ≥ 0.9, le nombre de nœuds s´electionn´es pour le chevauchement est le mˆeme, mais le pourcentage de che-vauchement avec fccest plus important avec fd.

Le r´eseau footballistique

R´esultats avec fdsur le r´eseau footballistique fd Cand CandOv EC QN ic Ov Ω F1 NMI # α ≥ 0.2 100.0% 0.0% 29.53% 0.722 0.530 0.762 0.597 9 α ≥ 0.3 100.0% 0.0% 29.53% 0.708 0.681 0.810 .639 10 α ≥ 0.4 100.0% 0.0% 30.01% 0.7 0 .865 0.854 0.685 11 α ≥ 0.5 100.0% 0.87% (1) 30.01% 0.699 0.851 0.854 0.682 11 α ≥ 0.6 100.0% 1.74% (2) 30.83% 0.690 0.882 0.861 0.666 12 α ≥ 0.7 100.0% 8.69% (10) 31.32% 0.629 0.825 0.819 0.629 13 α ≥ 0.8 100.0% 8.69% (10) 31.32% 0.629 0.825 0.819 0.629 13 fcc Cand CandOv EC QN icOv Ω F1 NMI # α ≥ 0.2 100.0% 0.0% 29.53% 0.722 0.530 0.76 0.512 9 α ≥ 0.3 100.0% 0.0% 29.53% 0.708 0.681 0.81 0.639 10 α ≥ 0.4 100.0% 0.0% 30.016% 0.699 0.865 0.854 0.685 11 α ≥ 0.5 100.0% 0.87% (1) 30.016% 0.699 0.851 0.854 0.682 11 α ≥ 0.6 100.0% 1.74% (2) 30.832% 0.690 0.882 0.85 0.666 12 α ≥ 0.7 100.0% 8.69% (10) 31.321% 0.629 0.825 0.819 0.629 13 α ≥ 0.8 100.0% 8.69% (10) 31.32% 0.629 0.825 0.819 0.629 13 Tableau 3.27 – Cand : Candidats possibles, CandOv : Pourcentage de nœuds chevau-chants

Selon le tableau 3.27, c’est pour α ≥ 0, 5 que les premiers nœuds chevau-chants apparaissent. De α ≥ 0, 5 `a α ≥ 0.9, le nombre de nœuds chevauchants est le mˆeme, ainsi que leur taux de chevauchement moyen. Les r´esultats en termes de similarit´e de score de qualit´es sont semblables. les meilleurs scores sont pour α ≥ 0, 5 avec un NMI 0.68. Le nombre de communaut´es augmente tr`es lentement puis fortement avec α = 1.0.

C’est un r´eseau de livres politiques datant de l’´election pr´esidentielle am´ericaine de 2004 et vendus sur le site de vente en ligne Amazon.com. Ce graphe comporte trois communaut´es au sens politique, `a savoir les d´emocrates, les r´epublicains et le centre sur l’´echiquier politique.

Resultats avec fcc et fdsur les livres politiques de Kreb fd Cand CandOv EBC QN ic

Ov Ω F1 NMI # α ≥ 0.4 24.762% 0.0% 5.215% 0.834 0.667 0.788 0.452 2 α ≥ 0.5 26.67% 0.95% (1) 6.576% 0.834 0.654 0.784 0.494 2 α ≥ 0.6 31.43% 1.90% (2) 7.71% 0.845 0.676 0.713 0.387 3 α ≥ 0.7 32.38% 5.71% (6) 9.07% 0.76 0.686 0.664 0.354 4 α ≥ 0.8 35.24% 15.24% (16) 9.98% 0.653 0.667 0.566 0.290 7 fd Cand CandOv EBC QN icOv Ω F1 NMI # α ≥ 0.4 24.761% 0.0% 5.215% 0.834 0.667 0.788 0.504 2 α ≥ 0.5 26.67% 0.952% (1) 6.576% 0.834 0.654 0.774 0.494 2 α ≥ 0.6 31.428% 0.952% (1) 7.709% 0.844 0.676 0.719 0.449 3 α ≥ 0.7 32.380% 5.714% (6) 9.070% 0.782 0.687 0.653 0.340 4 α ≥ 0.8 35.238% 15.238% (16) 9.977% 0.6533 0.667 0.532 0.28 7 Tableau 3.28 – Cand : Candidats possibles , CandOv : Pourcentage de nœuds chevau-chants

D’apr`es le tableau 3.30, c’est pour α ≥ 0.5 que les premiers nœuds chevau-chants apparaissent. Les r´esultats sont tr`es similaires pour les deux m´ethodes, n´eanmoins, fd donne un pourcentage de chevauchement et un taux de chevau-chement moyen plus ´elev´e selon nos observations qu’en utilisant fcc. Le nombre de communaut´es augmente lentement en fonction de la valeur α, comme celui des candidats au chevauchement. De 0.4 ≤ α ≤ 0.8, la majorit´e des nœuds che-vauchants sont neutres sur le plan politique am´ericain.

(a) Le r´eseau de livres politiques avec α ≥ 0, 3

(b) Le r´eseau de livres politiques avec α ≥ 0, 6

Figure 3.50 – R´esultats avec fdet fcc

Sur la figure 3.50a, nous voyons que la m´ethode pour α ≥ 0.3 donne deux communaut´es qui repr´esentent les r´epublicains et les d´emocrates, il n’y a pas de chevauchements. Sur la figure 3.50b, avec α ≥ 0.6, la m´ethode trouve trois

communaut´es, les r´epublicains, les d´emocrates et les neutres et un nœud che-vauchant, mais qui n’est pas associ´e aux communaut´es de la mˆeme fa¸con selon les fonctions d’appartenance utilis´ees. Il s’agit du livre ”Ghost Wars” ´ecrit par Steve Coll et publi´e en 2004. Ce livre retrace l’action de la CIA des ann´ees 1965 `a 2004, sous les diff´erentes administrations am´ericaines, contre des r´eseaux criminels. Ce livre n’a pas d’orientation politique et n’est qu’historique. Les tableaux 3.29 et 3.30 montrent certains livres chevauchant plusieurs commu-naut´es. Pour Ghost Wars, le livre est neutre pour α ≥ 0.5, puis chevauche la communaut´e r´epublicaine avec α ≥ 0.6 et finalement chevauche ´egalement la communaut´e d´emocrate avec α ≥ 0.7, quelles que soient les fonctions utilis´ees. Ce livre est chevauchant car il est cit´e de nombreuses fois par les communaut´es r´epublicaines et d´emocrates. En effet, des ann´ees 1965 `a 2004, les diff´erentes ad-ministrations am´ericaines ´etaient soit d´emocrates (Lyndon B. Johnson, Jimmy Carter et Bill Clinton), soit r´epublicaines (Richard M. Nixon, Gerald R. Ford, Ronald W. Reagan, George H. W. Bush). N´eanmoins,il existe plus de liens vers la communaut´e r´epublicaine (4) que vers la communaut´e d´emocrate (3), c’est l’une des raisons qui ont pu le placer dans le parti r´epublicain lors du premier chevauchement. Les autres livres ont une appartenance politique, mais restent proches de la fronti`ere des communaut´es. Ils sont chevauch´es avec la commu-naut´e neutre.

Resultats avec fd

Livres D´emocrates Neutres R´epublicains α Ghost Wars 0.5 Ghost Wars 0.6 Ghost Wars 0.7 Disarming 0.6 Disarming 0.7 Rise of the Vulcans

0.7 The choice

0.7 The great unraveling

0.7 American Dynasty

0.7

Tableau 3.29 – Les livres chevauchants

Resultats avec fcc

Livres D´emocrates Neutres R´epublicains α Ghost Wars 0.5 Ghost Wars 0.6 Ghost Wars 0.7 Disarming 0.7 Disarming 0.7 Rise of the Vulcans

0.7 The choice

0.7 The great unraveling

0.7 American Dynasty

0.7

Les r´eseaux de collaborations scientifiques de Newman (Netscience) Ce graphe repr´esentant des collaborations scientifiques entre chercheurs est ca-ract´eris´e par une tr`es faible densit´e 0.0021. Les tailles de communaut´es d´etect´ees sont tr`es petites. Observant le tableau 3.31, c’est pour α ≥ 0.4 que les premiers nœuds chevauchants apparaissent. Le nombre d’arˆetes entre communaut´es est relativement faible, de 2.39% d’arˆetes avec α ≥ 0.2 `a 18.27% avec α ≥ 0.8, impliquant un faible pourcentage de candidats. Seulement 0.61% de nœuds sont candidats avec α ≥ 0.4 tandis que l’on obtient 6.36% pour fd. Pour chacune des m´ethodes, le pourcentage de chevauchement est tr`es similaire et relative-ment faible. Observant la modularit´e, les r´esultats sont tr`es similaires. On peut conclure que pour des graphes faiblement denses, les r´esultats sont tr`es similaires en utilisant les fonctions fond´ees sur la densit´e ou sur le coefficient de clustering.

Resultats avec fd sur Netscience

fd Cand CandOv (nombre) AEC QN icOv # α ≥ 0.2 3.285% 0.0% 2.396% 0.977 293 α ≥ 0.3 5.544% 0.0% 4.175% 0.972 297 α ≥ 0.4 7.392% 0.616% (9) 5.79% 0.948 308 α ≥ 0.5 9.240% 0.684% (10) 7.734% 0.940 315 α ≥ 0.6 14.099% 2.396% (35) 12.731% 0.886 342 α ≥ 0.7 16.016% 4.517% (72) 15.332% 0.845 360 α ≥ 0.8 18.07% 6.366% (101) 18.275% 0.817 371 fcc Cand CandOv (nombre) AEC QN ic

Ov # α ≥ 0.2 3.285% 0.0% 2.396% 0.977 293 α ≥ 0.3 5.544% 0.0% 4.175% 0.972 297 α ≥ 0.4 7.392% 0.548% (8) 3.146% 0.949 308 α ≥ 0.5 9.240% 0.616% (9) 4.232% 0.942 315 α ≥ 0.6 14.1% 2.164% (36) 6.966% 0.886 342 α ≥ 0.7 16.016% 5.339% (85) 8.39% 0.855 360 α ≥ 0.8 18.07% 7.05% (112) 10.0% 0.813 371

Tableau 3.31 – Cand : Candidats possibles, CandOv : Pourcentage de nœuds chevau-chants