• Aucun résultat trouvé

2.3 Observation in-vivo des dynamiques

2.3.3 Des traces textuelles au réseau épistémique

La construction du réseau épistémique d’une communauté de savoirs revient à modéliser la dynamique du système à partir de ses traces. Il s’agit de concep- tualiser de façon aussi fidèle que possible la richesse originale des dynamiques des traces textuelles produites par l’activité de ces communautés tout en simpli- fiant suffisamment sa description de façon à la rendre interprétable par les outils d’analyse à notre disposition. Nous décrivons dans cette partie cette opération de modélisation qui, à partir d’un corpus de textes T , permet de construire les trois

réseaux qui composent notre réseau épistémique : le réseau social GS, le réseau

sémantique GC, et le réseau socio-sémantique GSC.

Notre matériau de départ est constitué d’un ensemble de textes, des billets dans le cas de la blogosphère, des articles scientifiques dans le cas des communautés scientifiques ; chaque texte combine des éléments sociaux et sémantiques, à savoir des acteurs et des concepts. Nous avons représenté figure 2.2 le schéma conceptuel d’un texte dans cet espace socio-sémantique (dont la séparation est signalée par un trait en pointillés et, de part et d’autre duquel, on retrouve l’ensemble des acteurs (S) et des concepts (C) de la communauté). Le texte est représenté par une surface rouge qui, à une date de publication donnée (dans notre exemple le texte a été

produit à la date D2), rassemble un auteur qui initie la frontière de la surface (S1)10,

un ensemble de concepts mobilisés (C1, C3), et un ensemble de relations liant ce

texte à d’autres entités (dans notre exemple, nous avons représenté des liens de

citation vers d’autres auteurs (S2, S3)11). Formellement un texte est donc un arc

(ou plutôt un hyper-arc) dans un hyper-réseau réunissant deux types d’entités (des acteurs et des concepts) liés selon différentes références (un auteur faire référence à d’autres auteurs (citations) ou à différents concepts (usages)). On peut donc décrire un texte T comme l’objet doté des attributs suivants :

T :Texte(Auteur(T ) : S, Usages(T ) : 2C,Citations(T ) : 2S,Date(T ) : N)

Dans notre schéma, on a ainsi représenté le texte suivant :

10. Dans le cas des billets de blogs, le nombre d’auteurs est naturellement limité à 1, il en va autre- ment dans le cas des publications scientifiques, mais par mesure de simplicité, nous considérerons dans la suite que chaque texte a un seul auteur.

11. Néanmoins, ces relations peuvent être de différents types, elles peuvent aussi bien désigner des références dans un article ou dans un billet ou des commentaires de blogueurs. Elles peuvent également pointer vers un auteur ou un autre texte, etc. Dans notre exemple nous nous sommes limités pour simplifier la représentation à des relations de citation pointant vers d’autres acteurs.

Texte(S1, (C1, C3), (S2, S3), D2)). En toute rigueur un texte est donc un hyper-

lien orienté dans un hyper-réseau complexe. Les fonctions utilisées pour définir l’objet texte sont les suivantes :

– Auteur : Texte → S, dans notre exemple Auteur(T ) = S1

– Usages : Texte → 2C, dans notre exemple Usages(T ) = (C

1, C3)

– Citations : Texte → 2S, dans notre exemple Citations(T ) = (S

2, S3)

– Date : Texte → N, dans notre exemple Date(T ) = D2

S5 S4 S3 S2 C1 C2 C3 C4 C5 C6 C7 S1 D2

FIGURE2.2: Représentation schématique d’un texte daté (D2) (pouvant figurer aussi bien

un article scientifique qu’un billet de blog) regroupant un auteur (S1), les concepts mobi-

lisés (C1, C3) et l’ensemble des acteurs cités (S2, S3)

À partir de ces opérateurs de projection on peut définir les réseaux dynamiques

qui constituent notre réseau épistémique. Ainsi, le réseau social GS est composé

des liens datés suivants :

RS= {(S1, S2, D) | ∃T ∈ T , S1 =Auteur(T ) ∧ S2 ∈Citations(T ) ∧ D = Date(T )}

De la même façon le réseau GSCest constitué de l’ensemble des triplets :

RSC

= {(S, C, D) | ∃T ∈ T , S =Auteur(T ) ∧ C ∈ Usages(T ) ∧ D = Date(T )}

On définit enfin les liens RCdans le réseau sémantique GCcomme l’ensemble des

triplets défini tel que :

RC

= {(C1, C2, D) | ∃T ∈ T , {C1, C2} ⊂Usages(T ) ∧ D = Date(T )}

Nous serons amenés par la suite à affiner ces différentes définitions (et en particu- lier celles ayant trait à la définition du réseau sémantique) afin de les rendre plus à même de restituer de façon réaliste les phénomènes sous-jacents.

Néanmoins, ce qu’il importe de noter ici, c’est que nous avons transformé notre hyper-réseau de départ dont chaque texte formait un arc en trois réseaux de types dyadiques (deux monopartis et le troisième biparti). La réduction est double, nous avons, d’une part, séparé les entités sociales et sémantiques en les considérant iso- lément dans les réseaux social et sémantique, ou en les regroupant au sein d’une to- pologie de réseau bien particulière, celle d’un réseau biparti dans le cas du réseau socio-sémantique. Cette première hypothèse de modélisation s’appuie sur notre hypothèse de départ d’autonomie des sphères sociales et sémantiques, tout en ga- rantissant l’existence d’un couplage entre les deux dimensions.

La seconde réduction importante que nous avons opérée relève plus d’une né- cessité pratique que d’une hypothèse de modélisation. Même en supposant qu’il est pertinent de modéliser l’activité des communautés de savoirs comme la combi- naison de nos trois réseaux, en toute rigueur, les réseaux ainsi décrits devraient en fait être des hyper-réseaux. Par exemple, le réseau sémantique devrait mettre en relation au sein d’un même hyperlien l’ensemble des concepts ayant été conjoin- tement utilisés dans un même texte, de la même façon, un réseau de collaboration (non décrit dans notre cadre mais formellement équivalent) devrait théoriquement être constitué d’hyperliens de tailles variables regroupant l’ensemble des auteurs d’un texte. Nous avons pourtant fait le choix de modéliser nos réseaux à l’aide de relations purement dyadiques plutôt que n-adiques. Les outils et la conceptua-

lisation même des hyper-réseaux sont encore embryonnaires12, aussi nous privi-

légierons une modélisation par des réseaux exclusivement dyadiques. L’enjeu est alors de garder à l’esprit cette opération de réduction au cours de la modélisation et de rester attentif aux biais éventuels introduits par cette dénaturation des traces originales.