• Aucun résultat trouvé

Figure 3.10 – Propriétés des réseaux N1 et N2 après diffusion avec Q = 100 distribution des degrés pour (a) N1, (b) N2 et (c) propriétés pour N1 et N2

k AL FT CG AP (a) 0 0,05 0,1 0,15 0,2 1 2 3 4 5 6 7 8 9 10111213141516 P (k ) k AL FT CG AP (b)

Degré Min Degré Moy. Degré Max Coefficient C. AL 1.0 5.673 120.27 0.0045 N1 F T 1.0 5.367 142.04 0.3036 CG 1.0 5.546 119.82 0.0020 AP 1.0 5.540 146.65 0.0142 AL 1.0 4.54 18.88 0.3882 N2 F T 1.0 3.95 23.40 0.6204 CG 1.0 4.58 18.77 0.3763 AP 1.0 4.25 33.31 0.4588 (c)

Figure 3.10 – Propriétés des réseaux N1 et N2 après diffusion avec Q = 100

distribution des degrés pour (a) N1, (b) N2 et (c) propriétés pour N1 et N2

avec CG et 33.31 avec AP . Le mécanisme AP permet ainsi l’émergence brusque d’individus suffisamment connectés pour créer les conditions d’une diffusion rapide et virulente. Il est important de comprendre que de tels individus sont ceux qui ont la "capacité de diffusion" la plus élevée, puisqu’à eux seuls, ils sont capables d’infecter une grande quantité d’individus. Un tel mécanisme de formation ne fait donc qu’accélérer l’apparition de tels individus, ce qui explique les résultats obtenus : pic élevé et apparition précoce.

La fermeture triadique consolide les liens entre des groupes de noeuds. Cela se tra-duit par une augmentation significative du coefficient de clustering. Typiquement, il passe de 0.00427 à 0.3036 pour N1 et de 0.60880 à 0.6204 pour N2. C’est le mécanisme qui fournit le plus haut coefficient de clustering. Il est même intéressant de constater que certains des autres mécanismes utilisés peuvent même parfois réduire ce coefficient (cas de AL et CG). Cependant, bien que F T permette l’émergence de noeuds fortement connectés, sa capacité à renforcer les liens intra-communautaires limite la diffusion. Ainsi, le pic apparait relative-ment tôt comme nous avons pu l’observer, mais la diffusion reste essentiellerelative-ment confinée à un même groupe, le modèle ne permettant pas l’émergence de connexions favorisant une diffusion d’un bout à l’autre du réseau.

L’aléatoire et la connexion globale tendent à réduire la plage de valeurs des de-grés et l’effet communautaire. En effet, on peut observer sur la distribution des dede-grés que AL et CG génèrent une plus forte proportion de noeuds moyennement connectés, tout en réduisant la proportion de noeuds faiblement et fortement connectés (voir diminution du degré max sur la Figure3.10(c)). Nous observons également que le coefficient de clustering est systématiquement le plus bas pour ces deux mécanismes. Par exemple, sur le réseau N1 : 0.0045 et 0.0020 pour AL et CG contre 0.3036 et 0.0142 pour F T et AP . Toutefois,

CG permet à un noeud de se connecter uniquement avec un autre au-delà de sa commu-nauté proche. C’est ce comportement qui explique pourquoi, à l’exception du coefficient de clustering qui connait de très légères variations, les effets sur les propriétés du réseau, et donc sur le processus de diffusion, sont très similaires pour ces deux mécanismes.

Enfin, nous précisons que les tendances observées dans cette étude, ont également été confirmées pour diverses valeurs de α et β.

3.4 Stratégie avancée d’évolution du réseau

Les réseaux du monde réel ont souvent des structures topologiques non-triviales qui émergent des interactions entre les individus. En effet, nous pouvons observer que dans la plupart des réseaux sociaux, les connexions entre les noeuds ne sont ni régulières, ni totalement aléatoires. C’est cette caractéristique qui leur vaut le nom de réseaux com-plexes [Albert 2002]. Ces réseaux dits "complexes" sont en général le résultat de divers mécanismes microscopiques (c’est-à-dire survenant au niveau des noeuds et des liens), indi-viduels, décentralisés et non-planifiés, aboutissant à l’émergence de propriétés statistiques macroscopiques. Par exemple, en étudiant l’évolution du réseau d’échange d’emails au sein d’une université, Kossinets et al. [Kossinets 2006] ont montré que les changements sem-blaient être dirigés par une combinaison d’effets émanant de la topologie du réseau lui-même et de la structure organisationnelle dans laquelle le réseau est intégré. Trois propriétés sont ainsi couramment identifiées [Newman 2003,Boccaletti 2006,Borner 2007] :

(i) La distribution des degrés qui suit une loi de puissance, traduisant le fait qu’il existe une faible proportion de noeuds possédant un degré plus élevé que la moyenne (propriété scale-free). (ii) Un coefficient de clustering élevé, qui est une caractéristique de structures topologiques de type petit-monde [Watts 1998]. On observe que dans de telles structures, la distance moyenne entre deux noeuds est souvent très faible. (iii) Une structure hiérarchique et communautaire [Guimera 2002] dans laquelle les individus appartiennent à des groupes (ou communautés), identifiables par une forte densité de connexions intra-communautaires et une faible densité de connexions inter-communautaires. Ces groupes appartiennent eux-mêmes à des groupes de groupes, donnant ainsi une structure naturellement hiérarchique à ces différentes communautés.

Bien que les mécanismes élémentaires étudiés dans l’étude précédente soient généra-lement impliqués dans la formation des liens de nombreux réseaux complexes, ils ne per-mettent pas à eux seuls d’expliquer les structures topologiques particulières, émergeant de l’évolution des réseaux complexes. Plusieurs modèles d’évolution ont ainsi été pro-posés pour reproduire de telles structures : DEB [Davidsen 2002], MV S [Marsili 2004], KOSKK [Kumpula 2007], BP DA [Boguna 2003], etc. Une classification et une com-paraison des principaux modèles peut être trouvée dans l’article de Toivonen et al. [Toivonen 2009].

Dans cette deuxième étude, nous nous intéressons donc à un type particulier de mo-dèle d’évolution, appelé momo-dèles spatiaux, capables de reproduire fimo-dèlement les propriétés observées sur la plupart des réseaux du monde réel. En utilisant D2SNet, nous cherchons à comprendre comment les changements survenant sur le réseau, modélisés ici par un modèle plus réaliste, affectent ou pas le processus de diffusion.

3.4.1 Le modèle spatial dynamique DynBPDA

Selon Toivonen et al. [Toivonen 2009], les modèles d’évolution des réseaux sociaux peuvent être classifiés en deux catégories. (i) Les modèles de type NEM (Network Evolution

3.4. Stratégie avancée d’évolution du réseau 63

Model) dont les modifications reposent uniquement sur la structure du réseau et (ii) ceux de type NAM (Nodal Attribute Model) dont le processus de formation se base sur les attributs des noeuds.

Les modèles spatiaux font partie des NAM. Ce sont des modèles basés sur le concept bien connu d’homophilie [McPherson 2001] et dont le processus de formation des liens s’appuie sur la notion de proximité sociale. Autrement dit, les noeuds sont projetés dans un espace social et les liens sont créés selon une probabilité qui décroît avec la distance relative dans cet espace. Ainsi, chaque noeud est identifié par un ensemble d’attributs (âge, profession, religion, centre d’intérêt, etc.) qui détermine sa position dans l’espace social. La dimen-sion spatiale définit donc d’une part le nombre de contacts de proximité qu’un individu peut établir, mais également la structure du réseau de contacts sous-jacent qui supporte la diffusion.

L’utilisation d’un modèle spatial est motivée par le fait que l’environnement social est un aspect fondamental du processus de formation des liens chez les individus, qui influence inévitablement la structure du réseau et donc a fortiori le processus de diffusion.

Un des modèles spatiaux les plus simples et les plus efficaces est le modèle spatial BPDA proposé par Boguna et al. [Boguna 2003]. Un des plus simples parce que le modèle ne requiert qu’un petit nombre de paramètres, et un des plus efficaces parce que le modèle fournit des réseaux scale-free avec des structures communautaires fortes. Le point clé du modèle BPDA est le concept de distance sociale.

Plus formellement, considérons un ensemble de N individus, uniformément distribués dans un espace social à une-dimension de taille dst. La probabilité pvivj que les noeuds vi

et vj soient en contact décroît avec leur distance dvivj dans l’espace social, c.-à-d. : pvivj = 1

1 + (dvivj

b )(1−β) (3.3)

b est une échelle de longueur caractéristique qui permet de contrôler le degré moyen du réseau résultant. β ∈ [0..1] correspond au degré de sociabilité des individus, c’est-à-dire la tendance à créer des liens plus ou moins dans l’espace social. Ainsi, quand β croît, les individus tendent à créer des liens avec des individus différents d’eux-mêmes, ou plus for-mellement des individus éloignés dans l’espace social. Inversement, quand β décroît, les individus tendent à créer des liens avec des individus similaires, c’est-à-dire situés relative-ment proches dans l’espace.

Notez que dst est un paramètre qui définit le degré de diversité dans le système, puis-qu’il induit directement la distance maximale pouvant séparer deux individus dans l’espace social.

Précisons enfin que le modèle BPDA produit des réseaux non-dirigés et non-valués dans lesquels un noeud ne peut pas avoir de connexions avec lui-même. De même, deux noeuds ne peuvent pas être reliés par plus de deux liens. Le modèle BPDA est détaillé dans l’algorithme2.

Le modèle BPDA fournit un réseau social réaliste, mais ne permet pas de simuler son évolution dans le temps. C’est la raison pour laquelle dans l’étude que nous menons, nous étendons le modèle BPDA pour y inclure la dimension dynamique. Dans un premier temps, notre objectif était de proposer un modèle qui pourrait décrire comment les liens des individus évoluent dans l’espace social.

Dans le contexte des modèles spatiaux, la dynamique peut être vue comme une variation survenant dans un ou plusieurs attributs d’un noeud et qui conduit à (i) un changement de sa position dans l’espace social, et (ii) la création de nouveaux liens, toujours basés sur la proximité dans l’espace social et la suppression des éventuels anciens liens.

algorithme 2 Modèle spatial BPDA

Précondition : N : Nombre de noeuds, β : Degré de sociabilité, dst : Degré de diversité, b : Échelle de longueur

1. G = (V, E) : Réseau social 2. ajouter N noeuds à V

3. Distribuer chaque noeud vi ∈ V avec une probabilité uniforme dans l’espace social de taille dst

4. pour i de 1 à N faire

5. pour j de (i + 1) à N faire

6. d← distance dans l’espace social entre vi et vj

7. ajouter e = (vi, vj) à E avec proba. pvivj = 1+(d1

b)(1−β)

8. fin pour 9. fin pour 10. retour G

Évidemment, de telles variations peuvent avoir diverses origines telles qu’une évolution des croyances, l’influence d’un autre individu, une volonté personnelle, etc. Toutefois dans ce travail, nous ne nous intéressons pas aux facteurs qui peuvent causer de telles variations, mais aux effets qu’ils ont sur la structure topologique du réseau et sur le processus de diffusion.

De notre point de vue, une considération idéale de la dynamique doit conserver les concepts fondamentaux du modèle spatial, c’est-à-dire une formation des liens basée sur la notion de proximité sociale, et inclure les mouvements des individus dans l’espace selon l’évolution des attributs. Le processus d’évolution des liens peut ainsi être décomposé selon ces deux composantes élémentaires. Le degré de sociabilité qui permet aux individus de créer des liens plus ou moins loin dans l’espace social et les nouvelles opportunités de connexion qui surviennent à travers l’évolution des attributs des individus. Ces processus complémentaires sont pertinents pour l’étude du phénomène de diffusion puisque, sans perte de généralité, la dynamique du réseau peut être vue comme une combinaison permanente de sociabilité et d’évolution des attributs.

D’un point de vue heuristique, deux paramètres sont utilisés pour refléter de telles variations : (i) la fréquence des changements à un niveau global Q, c’est-à-dire le nombre d’individus affectés par une évolution de leurs attributs (correspond à la vitesse d’évolution dans le modèle D2SNet), (ii) la force des changements au niveau local ω, un paramètre qui contrôle la variation maximum qui peut survenir sur l’attribut.

Le modèle BPDA étendu, appelé DynBPDA, est décrit dans l’Algorithme3.

Précisons que contrairement à certains changements qui peuvent significativement affec-ter les propriétés du réseau, le modèle DynBPDA proposé ici conserve toutes les propriétés du réseau initial.

En effet, en ce qui concerne le nombre de noeuds, celui-ci reste constant lors de l’évolution puisqu’aucun noeud supplémentaire n’est ajouté au réseau.

Lors des déplacements dans l’espace social, un noeud ne crée pas exactement le même nombre de liens. Ainsi entre deux itérations, le nombre total de liens au sein du réseau peut connaitre de très légères variations. Cependant, il est important d’observer que les nou-veaux liens sont recréés exactement comme ils le seraient dans le modèle BPDA de base, c’est-à-dire la nouvelle position est choisie aléatoirement et les liens avec les autres noeuds sont basés sur la notion de distance sociale (voir équation3.3). Nous garantissons ainsi que les propriétés du réseau restent stables tout au long de son évolution.

3.4. Stratégie avancée d’évolution du réseau 65

algorithme 3 Modèle spatial dynamique DynBPDA

Précondition : G = (V, E) : Réseau social, ω : Variation max. β : Degré de socia-bilité, b : Échelle de longueur

1. Sélectionner un noeud vi∈ V 2. Supprimer tous les liens de vi

3. Faire évoluer attribut de vi selon ω

4. Mettre à jour position de vi dans l’espace social 5. pour tout noeud vj ∈ V faire

6. si vj 6= vi alors

7. d← distance dans l’espace social entre vi et vj

8. Ajouter e = (vi, vj) à E avec proba. pvivj = 1+(d1

b)(1−β) 9. fin si 10. fin pour 0 0,01 0,02 0,03 1 144 287 430 573 716 859 De n sité Temps

Documents relatifs