• Aucun résultat trouvé

4.6 Trajectoires des individus au sein des paysages sémantiques

4.6.2 Rétroaction macro-micro

On s’attache maintenant à vérifier l’hypothèse d’une stabilité dynamique des champs d’appartenance des chercheurs en étudiant les motifs d’évolution d’un ensemble I de plus de 800 scientifiques du domaine ayant publié au moins 7 ar-

ticles parmi notre base de publications de départ durant la période 1998-200731.

Pour apprécier la vitesse de dispersion du vecteur de densité des auteurs au sein de notre carte, nous mettons en place deux mesures.

En premier lieu nous introduisons une mesure entre deux densités de présence

normalisées ˆpaet ˆpbà l’aide de la version symétrisée de la divergence de KullBach

Leibler DKL(Kullback and Leibler, 1951). Etant donnée deux distributions de pro-

babilités à valeurs non nulles32, la divergence entre les deux distributions de pro-

babilité P et Q est définie par : DKL(P, Q) =PiP (i)log(P (i)/Q(i)); cette distance

est asymétrique mais est classiquement symétrisée en effectuant une moyenne. Dans sa version symétrique on définit alors la distance entre deux distributions

comme 1/2[DKL(P, Q) + DKL(Q, P )](Johnson and Sinanovic, 2001).

On définit donc δ comme la distance de Kull-Back Leibler symétrisée33 entre

deux vecteurs de probabilités de présence ˆpaet ˆpb. Cette distance s’exprime donc

30. Cette observation reste valable en considérant une séquence de cartes sans recouvrement tem- porel.

31. Cette borne permet de réunir un nombre suffisant de chercheurs ayant a priori publié durant plusieurs années.

32. Dans notre cas, ll paraît improbable de trouver au sein des vecteurs de densité individuels des valeurs parfaitement nulle car cela supposerait que les termes mobilisés par un auteur ne co- occurrent pas une seule fois avec aucun des termes d’un champ donné.

33. Même si la divergence de KullBack Leibler, même symétrisée ne vérifie pas les conditions d’une distance (l’inégalité triangulaire n’est pas respectée) nous l’appellerons néanmoins distance par commodité.

sous la forme :

δ(ˆpa, ˆpb) = 1/2(DKL(ˆpa, ˆpb) + DKL(ˆpb, ˆpa))

Cette mesure permet notamment d’estimer le déplacement qu’a effectué un au- teur entre deux périodes successives. On calcule la propension moyenne de dépla- cement d’un chercheur à une distance donnée en contrastant la distribution des

distances {δ(ˆpT

i , ˆpT −

i )}i∈I34 observées sur l’ensemble des chercheurs entre deux

périodes successives T− et T avec l’ensemble des distances {δ(ˆpT

i , ˆpT −

j )}(i,j)∈I2

calculée sur la totalité des paires de chercheurs (i, j) entre les deux mêmes pé- riodes. Ce mode de calcul revient à faire l’hypothèse d’un modèle nul construit en nous appuyant sur la distribution des mots-clés sur les agents à un temps donné comme une distribution typique d’un agent actif dans la communauté in- dépendamment de son activité antérieure. Les périodes successives choisies pour le calcul de la propension sont des fenêtres de trois ans non recouvrantes, soit

l’ensemble des couples {(Tk; Tk−)}1≤k≤8 où Tk− = [1995 + k − 1, 1995 + k + 1]et

Tk= [1998 + k − 1, 1998 + k + 1]. La propension représentée est une moyenne sur

l’ensemble des couples de périodes {(Tk; Tk−)}1≤k≤8 accompagnée de l’intervalle

de confiance associé.

La propension de déplacement en fonction de notre distance δ est représentée figure 4.24. Celle-ci est fortement décroissante, ce qui indique que la densité de présence d’un chercheur a tendance à être très stable d’une période à l’autre. Il est ainsi 10 fois plus probable pour un chercheur de limiter son déplacement concep- tuel à δ < 0.1 que ne le laisserait supposer un modèle aléatoire, a contrario, les déplacements importants (δ > 1.5) sont 10 fois moins probable qu’attendu.

Mais cette mesure qui s’appuie sur le vecteur de densité de présence des agents, ne permet pas de rendre compte de la structure sous-jacente de l’organisation des champs. Afin d’illustrer quantitativement notre intuition sur la “diffusion” des champs d’appartenance des auteurs via les liens de notre réseau, nous proposons d’introduire une autre distance à même de rendre compte des déplacements des auteurs en fonction de la topologie du réseau des champs.

On introduit dans un premier temps un seuil θ (en pratique, θ = 0.15, on a vérifié que les résultats restent extrêmement robustes aux modifications de ce

seuil) qui permet d’attribuer à un auteur i l’ ensemble des champs Cj, qui vérifient

ˆ

pi(Cj) ≥ θ i.e.leur probabilité de présence dans un champ doit être supérieure à

un seuil pour que ce champ soit retenu.

L’état d’un agent i au temps T est donc défini par un ensemble de champs

d’appartenance At

i = {Ck}pˆT

i(Ck)>θ. La distance ∆ entre deux états successifs d’un

agent peut alors être définie comme la moyenne de la distance minimale (au sens

du plus court chemin dans un graphe) pour se déplacer depuis AT−

i l’ensemble

34. Dans le cas où un auteur n’aurait pas publié dans une des deux périodes considérée, cette me- sure est simplement ignorée, la densité de probabilité de présence du chercheur en question n’étant pas définie.

0 0.5 1 1.5 >1.8 10−2 10−1 100 101 102

inter-period density distance δ

ˆ f(δ

)

FIGURE4.24: Propension à occuper un nouveau champ épistémique en fonction de la dis-

tance de déplacement des auteurs δ.

des champs d’appartenance de i à T− vers chacun des champs de AT

i auxquels i

appartient à t. Plus formellement

∆(ATi−, ATi ) = 1 |AT i | X j∈AT i  min Ck∈AT − i d(Cj, Ck)

où d représente la distance dans le graphe (longueur du plus court chemin dans ˆ

G permettant de naviguer d’un nœud à un autre) calculée avec l’algorithme de

Dijkstra (Dijkstra, 1959)35 36.

La distance définie ci-dessus est une moyenne sur l’ensemble des déplacements opérés par un acteur. Ainsi, afin de rendre compte de l’hétérogénéité des déplace- ments et obtenir une mesure moins agrégée plus à même de rendre compte de la continuité ou de la discontinuité thématique dont font preuve les chercheurs dans leur déplacement, on peut également associer à chaque agent se déplaçant

dans le paysage épistemique et pour chaque champ d’appartenance Cj ∈ ATi de

l’agent i à la période T , l’ensemble des distances {∆(AT−

i , Cj)}Cj∈AT

i. Ces dépla-

cements sont comparés aux déplacements que l’on obtiendrait en appliquant la même hypothèse nulle que celle décrite précédemment afin de calculer la propen- sion à “adopter” un champ situé à une distance ∆ donnée.

35. Nous avons utilisé la version non pondérée du réseau même si les résultats sont sans doute semblables en conservant ces poids et en étendant la définition de la distance à un coût de circulation dans le réseau pondéré.

36. Dans le cas où un auteur n’aurait pas publié dans une des deux périodes considérée, cette mesure est ignorée comme précédemment.

0 1 2 3 4 >4 10−2 10−1 100 101 102

fields graph distance ∆

ˆ f(∆

)

FIGURE4.25: Propension à occuper un nouveau champ épistémique en fonction du dépla-

cement ∆ opéré dans le graphe des champs — périodes de trois ans par rapport aux trois années précédentes de publication.

La propension moyenne de déplacement dans le réseau des champs sur l’en- semble des auteurs et des périodes d’observation (en suivant les mêmes hypo- thèses que précédemment) est représentée figure 4.25. On observe que cette courbe est à nouveau fortement décroissante, indiquant que les chercheurs ont tendance à “adopter des champs” avec une propension d’autant plus faible que ces champs sont éloignés des champs auxquels ils participaient précédemment. Par contre, on constate une très forte tendance à la “répétition”, la propension à rester dans un champ précédemment occupé (∆ = 0) est proche de 80. La valeur obtenue signi- fie donc qu’un auteur a près de 80 fois plus de chances de continuer à occuper le même champ épistémique le pas de temps suivant que ne le laisserait suppo- ser un modèle aléatoire. La propension chute ensuite d’un ordre de grandeur dès qu’on envisage des champs à distance 1. A contrario un déplacement à distance 4 ou supérieure est 10 fois moins probable que ne le prévoierait notre hypothèse nulle. Ce calcul confirme l’intuition que nous avions d’une grande stabilité de la dynamique des auteurs au sein de ce paysage. Il nous conforte également quant à la qualité du réseau de champ reconstruit dont la topologie semble exercer une influence capitale vis à vis de l’activité des auteurs et de leur évolution.

Les déplacements conceptuels des chercheurs semblent donc épouser les che- mins formés par les relations de proximité entre champs. De façon symétrique au réseau social qui supporte la diffusion de concepts, on peut considérer de façon duale, que les cartes des sciences constituent le medium sur lequel les scientifiques “diffusent”.

dence d’une rétroaction du niveau macro sur le niveau micro, au sens où, la struc- ture des champs qui émergent des statistiques brutes extraites de l’ensemble des publications “contraint” en retour la dynamique des scientifiques qui se retrouvent plus ou moins “emprisonnés” dans leurs champs d’appartenance ou dans leur voi- sinage proche. Ce résultat fournit donc l’illustration quantitative d’un effet d’im- mergence qu’exercent des structures de haut niveau (qui émergent pourtant direc- tement de l’activité des chercheurs) sur les dynamiques individuelles.

Les mesures que nous avons introduites permettent également de définir des indices mesurant l’activité individuelle des agents dans ces paysages conceptuels ; on peut ainsi aisément déduire des distances précédemment introduites (δ et ∆), un indice global de déplacement général d’un agent agrégeant l’ensemble de ses déplacements dans le temps afin d’apprécier sa mobilité. De la même façon un indice de diversité (lié à la pluridisciplinarité d’un auteur) peut également aisé-

ment être construit à partir des vecteurs At

i en calculant par exemple la distance

moyenne entre termes dans le réseau des champs.