• Aucun résultat trouvé

5.2 Diagramme de corrélations intertemporelles

6.1.2 Topologies de réseaux

On considère deux réseaux sociaux réels. Notre premier réseau, appelé

Medlinepar la suite, est un réseau constitué de collaborations entre des embryo-

logistes travaillant sur le poisson zébré (zebrafish) extrait à partir d’une grande

base de données de publications scientifiques5. Nous considérons uniquement la

plus grande composante connexe composée de 6 453 agents, liés par 67 392 liens,

issus de 2 476 publications6. Sa distribution de degré (voir figure 6.2) est hétéro-

gène comme il est classique de l’observer dans les réseaux sociaux (Barabási and

Albert, 1999). Le second réseau a été collecté sur le site de “They rule”7, ce réseau

est un réseau d’interlock, il est composé de directeurs siégeant à des conseils d’ad- ministration de grandes firmes ou de grandes institutions américaines. Deux direc- teurs sont liés s’ils siègent dans un même conseil d’administration. La plus grande composante connexe de ce réseau est composée de 4 656 nœuds pour 76 600 liens extraits d’une base de données formée de 516 conseils d’administration.

Notre stratégie consiste à déprécier progressivement les caractéristiques topo- lologiques de nos réseaux originaux afin de produire une série de réseaux stylisés. Nous comparerons ensuite les profils des dynamiques de diffusion sur ces diffé- rents réseaux afin de tenter d’apprécier le rôle des caractéristiques topologiques du réseau réel sur la dynamique de diffusion. Nous commençons par distinguer les 4 types de réseaux suivants :

– Réseau réel (RN - Real Network) — Le réseau réel non déprécié sera noté res- pectivement RN1 et RN2 selon qu’on se réfère au réseau de collaboration scientifique ou au réseau d’interlock.

– Sans-échelle (SF - Scale-Free) — Les réseaux SF (SF1 et SF2) sont construits à partir des réseaux réels (RN1 et RN2) en appliquant le modèle configura- tionnel (Molloy and Reed, 1995) qui consiste à connecter aléatoirement les demi-liens du réseau de façon à obtenir un réseau aléatoire préservant la distribution des degrés originale.

– Erdös-Rènyi (ER) — Les réseaux aléatoires (Erdös and Rényi, 1959) ER1 et ER2 conservent uniquement la densité des réseaux réels de départ, ainsi que le nombre d’agents N. Contrairement à SF et RN, les distributions de de- gré peuvent être approchées par une loi de Poisson (Bollobás, 1985), voir figure 6.2. Le nombre d’agents N et de liens M sont identiques au réseau réel.

– Réseau complet (CN - Complete Network) — Les réseaux complets CN1 et CN2 partagent uniquement le nombre d’agents avec leur alter-ego réel. Dans cette topologie chaque agent est connecté à l’ensemble des autres agents. La den- 5. la platforme Medline http ://www.ncbi.nlm.nih.gov/pubmed/ est spécialisée dans la litté- rature biomédicale

6. nous n’avons considéré que les articles dont l’abstract ou le titre mentionnait le terme “zebra- fish” sur la période 2000–2004

Medline Theyrule 1 10 100 1000 1 10 100 Degree Erdos-Renyi Network Scale-Free Network Event-Based Network Real Network 1 10 100 1000 1 10 100 Degree Erdos-Renyi Network Scale-Free Network Event-Based Network Real Network

FIGURE 6.2: À gauche : Distributions de degré cumulées pour les différentes topologies

envisagées (abscisses : degré k, ordonnées : N (k) = P∞

k′=kN (k

)), à droite réseau Medline,

à droiteréseau Theyrule ).

sité n’est naturellement pas préservée contrairement aux réseaux précédents, et le nombre de liens dans le réseau vaut N(N − 1)/2.

La structure de clustering de nos réseaux peut s’avérer un paramètre im- portant pour étudier le processus de diffusion d’information (Bala and Goyal, 1998; Morris, 2000). La définition classique du clustering (voir chapitre 3) est une mesure liée au ratio du nombre de triangles sur le nombre de fourches. Dans sa version locale, on définit pour chaque agent son clustering comme le nombre moyen de ses voisins qui sont également voisins l’un de l’autre :

c3(i) = [nombre de paires de voisins de i connectés ]ki·(ki−1)/2 où ki désigne le nombre de voisins du

nœud i. Le coefficient de clustering hc3idu réseau est alors une moyenne des clus-

terings calculés sur l’ensemble des agent. Comme on l’a déjà constaté dans la par- tie précédente, les réseaux réels sont généralement dotés de coefficients de cluste-

ring hc3itrès grands comparés aux valeurs attendues sur un réseau aléatoire (et ce

quelle que soit sa distribution de degré : de type SF ou ER (Boguna and Pastor- Satorras, 2002; Newman and Park, 2003b)). Dans notre cas, nous avons mesuré les

valeurs de clustering suivantes : pour le réseau de collaborations, hc3i vaut .827

tandis que son réseau déprécié de type SF a un coefficient de clustering de l’ordre de .00539. Une même disparité entre réseau réel et sans-échelle est observée dans

le réseau d’interlock dont le coefficient de clustering du réseau réel (hc3i = .889)

est supérieur de deux ordres de grandeur à celui du réseau SF (hc3i = .00395).

Nous souhaiterions également intégrer dans notre panel de réseaux stylisés, un réseau capable de préserver ce fort taux de clustering. Pour ce faire, nous uti- lisons la structure événementielle sous-jacente de nos deux réseaux. En effet, les deux réseaux réels considérés sont en fait des réseaux d’affiliation de type biparti (les scientifiques sont liés aux articles qu’ils publient, les directeurs, aux conseils d’administration auxquels ils siègent) dont la projection sur la dimension sociale produit les réseaux réels pertinents pour notre étude. Nous proposons donc d’uti-

liser un modèle de morphogenèse “à base d’événements” qui s’appuie sur cette description bipartie sous-jacente des réseaux. À partir de la description originale des données de nos deux réseaux, qui est constituée d’événements regroupant des agents participant à une même activité, nous calculons d’une part la distri- bution des tailles des événements (distribution du nombre d’agents engagés dans chaque événement) et d’autre part la distribution du nombre d’événements aux- quels chaque agent prend part. Ces deux distributions sont parfois appelées distri- butions à droite et à gauche du réseau biparti considéré. Le modèle de reconstruc- tion est très simple et revient à un modèle configurationnel sur le graphe biparti original. Chaque agent conserve un nombre de liens sortants fidèle à la distribu- tion de départ du nombre d’événements par agent. Ces liens sont reliés de façon aléatoire à l’ensemble des événements dont la taille respecte les distributions ori- ginales (distributions du nombre d’auteurs par article ou de directeurs par conseil d’administration). Une fois distribué l’ensemble des liens sortants des agents vers les événements, nous projetons le réseau biparti ainsi formé (deux agents se re- trouvent liés s’ils participent au même événement), afin de construire un réseau de type EB (Event-Based).

Le réseau EB est encore plus proche de RN que SF au sens où il conserve un plus grand nombre de propriétés topologiques. Nous avons représenté figure 6.2 les distributions de degré pour l’ensemble de nos topologies de réseau. On ob- serve que le réseau EB permet de reconstruire relativement fidèlement la queue de la distribution de degré. Cette propriété est une conséquence directe du proces- sus de construction adopté (Guillaume and Latapy, 2004; Newman et al., 2001). La structure de clustering (voir tableau 6.1) est également reconstruite de façon satis- faisante. En effet, le coefficient de clustering est fortement influencé par l’opéra-

tion de projection qui aboutit en l’addition d’autant de cliques8que d’événements

(Newman et al., 2001). On s’attend donc à observer un large nombre de structures triangulaires dans ces réseaux.

Une mesure de clustering à plus longue distance, appelée clustering d’ordre 4 a récemment été introduite (Lind et al., 2005). Elle consiste à calculer la proportion moyenne de voisins communs parmi les voisins d’un nœud i :

c4(i) = Pki i1=1 Pki i2=i1+1κi1,i2 Pki i1=1 Pki

i2=i1+1[(ki1 − ηi1, i2)(ki2 − ηi1,i2) + κi1,i2]

(6.1) où κj1,j2 désigne le nombre de nœuds que les voisins j1& j2 de i ont en commun

(i exclu). ηj1,j2 = 1 + κj1,j2+ θj1,j2 où θj1,j2 vaut 1 si j1et j2sont connectés, 0 sinon.

EB1 permet de reconstruire approximativement le clustering du réseau réel

(RN1) mais semble mis en défaut pour reconstruire efficacement hc4i (un ordre

de grandeur sépare les valeurs de EB1 et de RN1). Par contre, EB2 semble plus 8. une clique est un sous-graphe complet, i.e. un sous-graphe dont les nœuds sont tous connectés les uns aux autres.

performant par rapport à cet indice : hc4ivaut .280 ce qui reste relativement proche

de la valeur originale de .415 pour le réseau réel : RN2. Les valeurs de l’ensemble des caractérisitiques topologiques de nos réseaux sont réunies tableau 6.1.

Pour résumer, nous considérerons 5 topologies de réseau différentes : (i) le ré- seau réel RN, (ii) un réseau à structure d’événements sous-jacente EB, (iii) un ré- seau sans-échelle SF, (iv) un réseau aléatoire de type Erdös-Rényi ER, (v) un réseau complet CN.

RN1 SF1 ER1 CN1 EB1

N 6453

M 6.74 · 104 2.08 · 107 7.62 · 104

d .00162 1 .00183

dist. degré power-law tail Poisson — power-law tail

hc3i .827 .00539 .00199 1 .753 hc4i .400 .000260 .000158 1 .0694 RN2 SF2 ER2 CN2 EB2 N 4656 M 7.66 · 104 2.17 · 107 7.68 · 104 d .0035 1 .0035

dist. degré power-law tail Poisson — power-law tail

hc3i .889 .00395 .00403 1 .897

hc4i .398 .000261 .000217 1 .268

TABLE6.1: Principales caractéristiques topologiques des différents réseaux stylisés dérivés

des réseaux réels RN1 et RN2 en termes de : nombre d’agents N, nombre de liens M, densité d, formes des distributions de degré et coefficients de clustering hc3i& hc4i(valeurs

moyennées sur 1000 réseaux pour les modèles de type SF, ER & EB).