• Aucun résultat trouvé

Illustration de l’algorithme de la troisième phase

Dans le document Spécialité : sciences des données (Page 69-74)

En appliquant l’algorithme de la phase 3 de notre approche aux communautés obtenues sur la figure 23 page 56, on obtient la partition P suivante comme résultat : le résultat est un ensemble de communautés chevauchantes.

, = U 1,2,3,4,5,8 , 5,6,7,3,10 , 8,9,10,11,12,1,7 V

4.2.4. Complexités

Nous évaluons ici la complexité de l’algorithme que nous proposons. Ensuite nous comparerons cette complexité à celles d’autres algorithmes.

4.2.5. Calcul de la complexité de la méthode proposée

La méthode que nous avons proposée est composée de deux phases : une première qui est celle proposée par Talbi qui n’a subi aucune modification de notre part. Elle cadre avec l’algorithme 2 correspondant à la phase 1 de la page 46. Elle est constituée principalement du calcul des covariances de liens et de l’inertie interclasse. En utilisant l’équation (E9) pour le calcul de la covariance on obtient une complexité de [ par lien. Au total pour les m liens dans le réseau, on obtiendra une complexité de [ ! . Pour le calcul de l’inertie interclasse il faudra une complexité en temps de [ ! . Chacune de ces mesures (covariance et inertie interclasses) est effectuée lorsque l’on n’a pas encore atteint le nombre de sous réseaux souhaités. Cependant, l’algorithme combine la suppression du maximum de liens par itération ; ce qui en pratique permet d’effectuer 3 tours environ. En conséquence le nombre d’itérations étant faible devant m et n, la complexité pour cette phase 1 est :[ ! + [ = [ ! + = [ ! . La complexité de la seconde phase qui est une modification et une adaptation au chevauchement de communautés dépend essentiellement du calcul de la modularité et de l’étape d’ajout de nœuds chevauchants. Le calcul de la modularité s’effectue uniquement lorsqu’on ajoute un lien au graphe obtenu à la phase 1 de la méthode. Or, on ne peut ajouter que des liens qui n’existaient que dans le graphe initial. Par conséquent, au pire des cas où tous les liens ont été supprimés à la première phase, on aboutirait à m itérations pour un coût de calcul de la modularité en [ , ce qui donne au total [ ! .

En outre, l’ajout de liens chevauchants a un coût de 0 ! . La complexité de la phase 2 est par conséquent : 0 ! . En combinant les deux phases on obtient une complexité de 0 ! pour notre méthode hybride proposée.

4.2.6.Comparaison analytique de complexités

Nous représentons la comparaison de ces algorithmes dans le tableau 2

Tableau 2 : Étude comparatives des algorithmes de détections de communautés

Algorithme Complexité

CPM [ exp

Label Propagation 0s ! !⁄ t

Algorithme communautés de liens [ )\–G

CONGA [ k

Notre méthode [ !

Comme nous le remarquons à travers le tableau 2 ci-dessus, le label propagation et la méthode proposée sont celles qui offrent les meilleures complexités. Cependant, le label propagation n’est pas un algorithme stable (elle offre des résultats différents pour plusieurs exécutions sur des réseaux semblables ou identiques). La méthode proposée quant à elle, a l’avantage contrairement au label propagation d’être stable. En outre, elle ne dépend d’aucun paramètre extérieur au réseau étudié.

4.2.7.Expérimentation de notre approche sur un réseau social local

4.2.7.1. Définition du cadre d’expérimentation

Pour tester notre approche dans la pratique, considérons l’exemple du cas particulier des réseaux sociaux en dehors d’Internet (off Line) de la communauté des personnes travaillant dans

le domaine sanitaire et humanitaire. Cette communauté est constituée d’individus saints et de personnes porteurs du VIH-Sida. Ces personnes sont reparties selon les catégories suivantes : la direction, le personnel soignant et les patients. Autre précision nous avons considéré deux cliniques, une spécialisé dans la prise en charge de séropositifs et l’autre dans les spécialités classiques y compris la prise en charge des malades du VIH-Sida.

4.2.7.2. Modélisation mathématique du réseau social VIH-Sida

Soit un graphe G1, un graphe qui représente le réseau social des deux cliniques du VIH-Sida et qui est constitué d'un ensemble

v ={ ,..., }x

1

x

n de nœuds associés deux à deux par des liens. Nous notons V l’ensemble des liens et E représentant les relations d’assistances, de prises en charge, de coopération professionnelle entre le personnelle soignant et les patients

={u ,...,u }

1 m

E

et

u

i

=(x x

i, k

)

On notera G1= (V, E).

Il faut que G1 soit un graphe non-orienté G= (V, E) composé d'un ensemble V de nœuds et d'un ensemble E de paires (non ordonnées) de sommets nommés liens. Nous adoptons pour ce chapitre les notations suivantes :

n représente le nombre de nœuds (n=|V|) m est le nombre de liens (m=|E|)

Figure 22 : Extrait de la matrice représentant l’ensemble des relations entre les nœuds du réseau social du VIH-SIDA

3.7.1.1. Analyse et interprétation des résultats

La figure 24 montrent la nature des relations entre les membres du réseau social du VIH-SIDA suite à des leurs contaminations, à partir d’une base de données transformées en matrice.

4.2.7.3. Contenu de notre approche

L'approche que nous avons proposée dans ce chapitre prend ces réalités de chevauchement en compte. Cette approche a la particularité de bien fonctionner non seulement dans le cas de la détection de communautés chevauchantes mais aussi dans le cas rare de communautés totalement disjointes.

Cette contribution est constituée de deux phases: la première, principalement inspirée de la méthode de Talbi permet d'identifier et éliminer les liens inter-communautés. Cette phase sert

également à regrouper les nœuds en de très petits groupes qui comme l'ont démontré Barthelemy et Fortunato, ne peuvent être détectés en utilisant l'optimisation de la modularité de Newman. Dans la deuxième phase où nous avons utilisé la modularité multi-résolution pour la recherche d'une structure optimale de communautés, évitant de faire l’éclatement des communautés de grandes tailles. Cette modularité, a l'avantage de ne pas supprimer les petits groupes, mais surtout de préserver les communautés de grandes tailles. La dernière phase quant à elle, nous permet d'ajouter les nœuds chevauchants aux communautés déjà détectées.

4.2.7.4. Algorithmes utilisés

Dans le document Spécialité : sciences des données (Page 69-74)