• Aucun résultat trouvé

La signification sociale des liens

2. Un détour par les link studies

2.2. La signification sociale des liens

À la suite, explicitement ou non, des travaux de la « nouvelle science des réseaux », de nombreuses recherches s'attaquent à la signification sociale des liens. Elles ne se contentent pas de prendre la mesure des connexions, elles leur attribuent du sens. Les liens deviennent alors des indicateurs d'autres phénomènes, et ils servent, par procuration, à appréhender ou mesurer une multitude de faits sociaux.

Ces approches interprétatives de l'hypertexte partent du principe que les liens ne sont pas aléatoires (Rogers & Nootjes Marres, 2000, p. 6) et ne sont pas simplement des « véhicules qui transportent les lecteurs d'une page d'information à une autre » (Morgan, 2002, p. 215). Au contraire, ils possèdent une « signification sociale » (Hsu & Park, 2010c), un « effet secondaire informationnel ». Par conséquent, les chercheurs qui ont la conviction que « des liens entre des pages peuvent donner de l'information utile » (Thelwall, 2006, p. 1) les utilisent pour prendre la mesure de faits sociaux, même si les liens n'ont pas été individuellement créés dans cette optique : « les effets secondaires informationnels sont dérivés de données créées dans un certain but, qui peuvent être étudiées pour comprendre d'autres phénomènes, tangentiels et potentiellement plus larges » (Adamic & Adar, 2003).

Deux postulats sous-tendent ces approches : d'une part, chaque lien serait créé dans un but déterminé. Les créateurs de pages web choisissent leurs liens de manière sélective (et pas au hasard), en accord avec une « politique d'association » (Rogers & Ben-David, 2008, p. 43). « Faire un lien vers un autre site, ne pas faire un lien, ou supprimer un lien peut être respectivement vu comme un acte d'association, de non-association ou de dissociation » (Rogers, 2010). D'autre part, les structures créées par l'accumulation de liens sont sociales et culturelles (Halavais, 2008, p. 39), elles dépassent les intentions individuelles derrière chaque lien. En d'autres termes, « un hyperlien n'est pas seulement un lien, il possède aussi une signification sociologique » (Hsu & Park, 2010c, p. 2).

Traces d'activités de communication

Un premier ensemble de recherches étudie les liens de manière plutôt descriptive, comme des traces d'activité de communication entre des acteurs. Il s'agit de retracer les connexions hypertextes pour déterminer qui parle à qui, et à quel sujet — afin de décrire les relations entre les membres des groupes étudiés : « en analysant les circuits des liens, nous pouvons capturer une perspective socialement construite des relations entre les membres d'un groupe d'acteurs en ligne, qui partagent un même intérêt ou agenda dans un réseau social » (Hsu & Park, 2011, p. 357).

Park et ses collègues ont à plusieurs reprises examiné la présence en ligne des responsables politiques sud-coréens. Ils ont par exemple examiné les liens pour décrire la « nouvelle écologie de la communication politique » (Park, Thelwall, & Kluver, 2005f), en postulant que les liens signalent l'affiliation politique. Cela les a menés à faire l'inventaire des liens issus des sites personnels des responsables politiques afin de comprendre leur agenda, à décrire les connexions tissées entre parlementaires et partis politiques (Park, Kim, & George A. Barnett, 2004), ou à mesurer les relations entre des blogs tenus par des citoyens et des mandataires politiques (Park & Jankowski, 2008). Ces chercheurs voient les liens comme les « indicateurs techniques du paysage idéologique » des groupes sociaux qu'ils étudient (Park & Jankowski, 2008, p. 62).

Ces stratégies de communication reflétées par les liens évoluent au fil du temps. Ainsi, Hsu et Park (2010c) décrivent les différences entre plusieurs générations de liens. Leur « sociologie de l'hyperlien » explore les liens créés par le web politique sud-coréen, et met au jour des évolutions notables entre ce qu'on peut qualifier de web « 1.0 » (les sites personnels des responsables politiques), de web « 2.0 » (les blogs de ces mêmes mandataires) et les liens qu'on peut trouver sur le site de microblogging Twitter. Le réseau de liens semble se densifier au cours du temps, tout en devenant de plus en plus polarisé autour de familles politiques distinctes (Hsu& Park, 2010, p. 10).

Toujours dans le champ politique, Williams et al. (2005) se sont penchés sur les stratégies des candidats à l'élection présidentielle américaine de 2004. Ils tirent parti des liens comme reflets des stratégies de campagne des candidats. En comparant les blogs ou les sites officiels des candidats, ils concluent qu'à différents genres de sites correspondent différents styles de liens — qui dénotent des objectifs stratégiques spécifiques. En l'occurrence, les liens sur les pages d'accueil des sites officiels des candidats pointent plutôt vers des initiatives internes de récolte de fonds, ou des pages susceptibles de générer des dons, là où les blogs sollicitent moins souvent les dons et proposent plus de liens externes. Dans ce contexte, avancent Williams et ses collègues, les liens reflètent des stratégies de communication politique.

Localités thématiques et cartographie des controverses

Si les études évoquées ci-dessus s'intéressent avant tout aux acteurs et aux relations qu'ils entretiennent, d'autres y ajoutent une couche de contenu : de quoi parle-t-on ? L'étude des liens sert ici à cerner l'espace public, les acteurs qui y interviennent et les débats qui y ont lieu, en observant les liens en tant que traces de conversations cohérentes sur le web. Il s'agit d'y détecter la formation d'« affinités discursives », la structuration de « réseaux d'enjeux » (Rogers & Ben-David, 2008) et de conversations publiques.

Plusieurs groupes de chercheurs, dans des espaces nationaux distincts qui se recoupent parfois, s'emparent et développent de telles approches. Ces groupes ne se structurent pas nécessairement autour de questionnements disciplinaires, de thèmes ou de problématiques spécifiques : leurs études portent sur le changement climatique (Rogers & Marres, 2000), la blogosphère iranienne (Kelly & Etling, 2008), les élections en Australie (Burgess & Bruns, 2012) ou l'édition en ligne (Ghitalla, Le Berre, & Renault, 2005). Ces groupes de recherche ont comme point commun l'adoption du web comme terrain d'étude privilégié et un appétit pour les possibilités de collecte et d'analyse de données à grande échelle, assistées par ordinateur — ils se revendiquent des humanités numériques (digital humanities), des web sciences et de l'intérêt pour les big data. Ainsi, leurs travaux se concentrent souvent, plus que sur l'obtention de résultats, sur des questions de méthode (Rogers et al, 2009  ; Rogers, 2010  ; Rogers, 2007  ; Bruns & Burgess, 2012  ; Bruns, 2007  ; Ghitalla, 2008  ; Ghitalla, 2009 ;Ghitalla, Jacomy, & Pfaender, 2006).

Chaque groupe met également en avant le développement d'outils — tant pour la collecte des données que pour leurs visualisations sous forme de cartes interactives (qui constituent souvent l'aspect le plus spectaculaire de ces recherches).

Ainsi, les recherches menées par Etling et ses collègues du Berkman Center for Internet and Society étudient les liens hypertextes pour décrire les relations et les localités thématiques de plusieurs blogosphères nationales — c'est-à-dire l'ensemble interconnecté de blogs qu'ils ont identifiés comme appartenant à un pays comme l'Iran (Kelly & Etling, 2008), la Russie (Etling et al., 2010) ou plusieurs pays arabes (Etling, Kelly, Faris, & Palfrey, 2009)

Leur but est de comprendre comment le débat public entre blogueurs se structure, et où chaque blogueur se situe dans le système médiatique que forme sa blogosphère. Dès lors, les hyperliens leur servent à détecter des « groupes d'attention », c'est-à-dire des groupes de blogs qui font preuve d'un comportement hypertextuel similaire et proposent des liens vers les mêmes ressources. Ces méthodes reposent sur le principe qu'une certaine macrostructure émerge de la tendance des individus à proposer plus fréquemment des liens vers des choses qui les intéressent, ou vers des gens avec qui ils partagent des attributs ou des relations sociales (Etling et al., 2010, p. 11). Dans ce cas-ci, les chercheurs s'emparent des schémas de liens pour donner du sens à une grande quantité de blogs, pour les rassembler dans des groupes qui signifient quelque chose — puisque des comportements hypertextuels similaires « naissent souvent d'intérêts intuitivement compris, d'idéologies, de préférences et d'affiliations qui existent au sein des blogueurs » (Etling et al., 2010, p. 14). Cela permet par exemple à Etling et Kelly (2009, p. 15) de détecter automatiquement dans leur corpus, grâce aux structures de liens, un ensemble de blogs russes qui traitent plutôt de sujets culturels, de questions régionales ou de politique.

En France, l'analyse des liens se fédère autour du groupe WebAtlas qui veut s'inscrire, « modestement, dans l'histoire moderne des systèmes d'information » (Ghitalla & Jacomy, 2009). L'association produit notamment un outil, Navicrawler (développé par Mathieu Jacomy) qui sert à la collecte de corpus sur le web, en naviguant de lien en lien. Au cours des « traversées documentaires » (Ghitalla et al., 2005, p. 5), l'hypertextualité devient un outil non sémantique permettant de découvrir des régularités sémantiques (Jacomy & Ghitalla, 2007) : si deux sites proposent exactement les mêmes liens, il est probable qu'ils traiteront de mêmes sujets, et peut-être qu'ils partageront la même opinion. En substance, les liens permettent de détecter des localités thématiques (Ghitalla, 2009) : la proximité hypertexte indique des similarités de contenu (Ghitalla, Le Berre, & Renault, 2005, p. 8). L'association WebAtlas produit de nombreuses cartes qui explorent et visualisent divers domaines : publications françaises dans le Web of Science, controverses autour de l'Arctique, controverses scientifiques sur le web, etc.

Comme son nom l'indique, la logique de WebAtlas est celle de l'atlas : il s'agit de collecter un ensemble de cartes et de représentations de différents aspects particuliers du web qui vise à fournir « une vision synthétique du vaste système de couches distinctes qui constituent le web, organisées en “localités” thématiques et hypertextuelles que nous appelons “agrégats”. Autrement dit une géographie de l'information basée sur des mots, des liens et des acteurs » (Ghitalla & Jacomy, 2009).

Des membres du groupe WebAtlas s'associent, au sein du Medialab de Sciences Po, avec les promoteurs du projet de « cartographie des controverses », qui se présente comme la version appliquée de l'Actor-Network Theory de Bruno Latour (Venturini, 2010). Ensemble, ils lancent en 2010 « l'Hypertext Corpus Initiative » (Venturini, 2012) qui a notamment pour but de rassembler une multitude de petits échantillons du web, tant de corpus spécialisés constitués de sites et de liens.

L'intérêt porté par le Medialab à la constitution systématique de corpus hyperliés ne se cantonne pas au domaine académique, celui-ci entretient également des liens avec des acteurs privés (comme la société Linkfluence qui vend son expertise d'analyse des données sur le web, ou les développeurs du logiciel de visualisation de réseaux Gephi), institutionnels (Ina, BnF), ou avec d'autres acteurs de l'analyse de liens, comme le Digital Methods Initiative d'Amsterdam.

L'utilisation des liens pour cerner les débats publics (ou, du moins, leurs traces numériques) sous-tend également le programme défendu par Rogers (2007) et son équipe, rassemblée dans la Digital Methods Initiative et dans la fondation Govcom.org, basée à Amsterdam (Rogers & Ben-David, 2008  ; Marres, 2004  ; Rogers & Marres, 2000). Ce projet entend notamment faire la « cartographie de l'espace public sur le web » et s'intéresse plus particulièrement aux controverses — rejoignant en ce point les perspectives défendues par la « cartographie des controverses » (Venturini, 2010, p. 2012) qui se présente comme une version « appliquée » de l'actor-network theory.

Rogers et Ben-David (2008) étudient par exemple les conversations qui se déploient en ligne à propos du débat sur la barrière construite par Israël pour isoler certains territoires palestiniens. L'analyse des données extraites des hyperliens permet de situer les acteurs prenant part au débat les uns par rapport aux autres. En retraçant les connexions entre les sites des ONG impliquées dans la controverse, les chercheurs mettent ainsi en évidence que les organisations israéliennes de gauche sont dans un état « d'isolation virtuelle » au sein du débat général (Rogers & Ben-David, 2008, p. 63).

De manière similaire, Rogers et Marres (2000) dressent un état des lieux du débat autour du changement climatique. Ils témoignent de l'existence de différents styles de liens typiques des domaines en .com, .org, ou .gov. Par exemple, ils remarquent que les « institutions gouvernementales ont tendance à former un ensemble opératoire massif et autonome » (Rogers & Nootjes Marres, 2000, p. 9). Dès lors, ils avancent que le débat sur le changement climatique est conditionné par la présence sur le web d'autorités gouvernementales centrales (Rogers & Nootjes Marres, 2000, p. 13).

À la suite notamment des outils mis en place par l'équipe de Digital Methods Initiatives, et particulièrement IssueCrawler, d'autres équipes s'emparent de l'analyse de liens pour cartographier des groupes et les enjeux qui les traversent. C'est le cas de l'équipe qui se rassemble autour d'Axel Bruns et Jean Burgess (basés en Australie), qui produit de nombreuses études basées sur la cartographie des liens qui connectent de grands ensembles de blogs (Bruns, 2007  ; Bruns et al., 2010  ; Highfield, 2012  ; Highfield & Bruns, 2012, Bruns & Burgess, 2012) ou, plus tard, de tweets (Bruns, 2012 ; Bruns & Burgess, 2012 ; Burgess & Bruns, 2012).

Toutes ces recherches étudient les liens en tant que traces visibles d'enjeux débattus dans la sphère publique. Les liens deviennent des outils pour cartographier les positions des différents acteurs. Tous ces auteurs suggèrent plus ou moins implicitement que de telles tentatives de cartographier les débats via les hyperliens permettent de mieux comprendre certains enjeux démocratiques.

Une monnaie symbolique

En plus de leur intérêt comme trace matérielle des conversations et de relations entre des sites, des documents et des acteurs, les liens sont également porteurs de valeur symbolique. Les liens entrants s'amassent, les liens sortants redistribuent la valeur. Un deuxième ensemble de recherches met au point différentes mesures basées sur les liens.

Les travaux de Brin et Page (1998), dans lesquels ils exposent les principes fondateurs de l'algorithme « Page Rank » — qui fera le succès du moteur de recherche Google9

— initient une tendance : utiliser les liens pour mesurer l'autorité ou la pertinence d'une page web. Brin et Page dressent un parallèle entre les liens hypertextes et les citations dans un contexte académique. Quand le travail d'un scientifique est souvent cité par ses pairs, celui-ci est considéré comme important, de qualité. Dans cette perspective, chaque lien est considéré comme un vote implicite sur la qualité ou la pertinence d'un contenu

9   L'algorithme   PageRank   a   connu   de   nombreux   raffinements   au-­‐delà   de   cette   idée   selon   laquelle   un   lien   représente  un  vote  positif  en  faveur  de  l'autorité  du  contenu  lié  (Rieder,  2012),  et  d'autres  critères  sont  utilisés   de  manière  complémentaire  par  le  moteur  de  recherche  Google  pour  classer  ses  résultats.    

(Finkelstein, 2008). Plus un contenu attire des liens, plus il fait autorité. De manière similaire, Brunn et Dodge (2001) puis (Park, Barnett, & Nam, 2002) mettent les hyperliens à profit pour évaluer la confiance et la crédibilité dont bénéficient les sites, en arguant que celles-ci sont indispensables dans le contexte de transactions commerciales. Un site qui attire de nombreux liens est alors considéré comme digne de confiance pour devenir un partenaire ou y effectuer des transactions commerciales et des paiements en ligne.

Concrètement, ces recherches proposent plusieurs méthodes et jauges pour mesurer des notions comme l'autorité ou la confiance sur le web. C'est le cas, par exemple, de l'algorithme Page Rank (Brin & Page, 1998), ou du modèle « autorités/hubs » de Kleinberg (Kleinberg 1999) et ses raffinements (Borodin, Roberts, Rosenthal, & Tsaparas, 2001). Tous deux s'appuient sur l'idée que des nœuds d'un réseau vers lesquels pointent beaucoup de liens possèdent un certain niveau d'autorité, qui peut être redistribuée vers d'autres nœuds.

Les sciences de l'information et de la documentation se sont également emparées des liens hypertextes, pour y transposer les questionnements et les méthodes de l'analyse des citations scientifiques (Thelwall, 2004) : dès 1997, les « sitations » (de sites à sites) semblent pouvoir être étudiées comme les « citations » (Rousseau, 1997).

Par analogie avec le facteur d'impact mesuré sur base des citations entre articles scientifiques, Ingwersen (1998) propose par exemple de prendre la mesure des liens pour établir un « facteur d'impact web ». Une telle démarche vise à évaluer l'activité de recherche des universités, ou à tout le moins la qualité de leurs activités de dissémination (Pinto Molina et al., 2005).

D'autres observent les liens pour ce qu'ils disent des relations entre les différents acteurs qui participent à l'activité scientifique, qu'il s'agisse d'évaluer les performances interdisciplinaires des universités (Harries, Wilkinson, Price, Fairclough, & Thelwall, 2004), les réseaux de collaborations mis en place (Vasileiadou & Van den Besselaar, 2006), de cartographier les structures institutionnelles (Kwak, Lee, Park, & Moon, 2010) ou les positions relatives que les universités occupent les unes par rapport aux autres (Ortega & Aguillo, 2009).

Il faut toutefois remarquer que la plupart de ces auteurs demeurent prudents par rapport à ces approches « webométriques », qui évalueraient les performances scientifiques de manière purement quantitative. Des métriques basées sur les liens hypertextes peuvent en effet donner des résultats significatifs (qui reflètent les facteurs d'impact traditionnels (Thelwall, 2001) ou les réseaux de collaboration mise en place par des organisations

popularité, ces métriques exigent de nombreuses précautions méthodologiques (Thelwall, 2001, p. 18) et ne mesurent jamais que la visibilité d'une institution ou d'un chercheur sur le web (Prime, Bassecoulard, & Zitt, 2002).

Le lien politique

Enfin, un dernier ensemble de recherches met à l'épreuve les utopies d'un web complètement ouvert et égalitaire. Elles analysent la façon dont les liens se distribuent, et mettent en évidence les rapports de force persistants qui dominent, dans l'ensemble, l'existence et la répartition des liens.

Certains résultats empiriques mettent ainsi à mal l'idée d'un web « démocratique » favorisant la diversité des opinions, où, contrairement au système des médias de masse, chacun disposerait d'une chance égale de s'exprimer et de toucher le public. Hindman (2009) montre ainsi que la « sphère publique en ligne est moins ouverte que certains l'avaient espéré ou craint » (Hindman, 2009, p. 40). L'analyse de quelque 3 millions de pages, catégorisées selon les sujets d'actualité politique qu'elles traitent (par exemple l'avortement, le contrôle des armes ou le Congrès américain) met en évidence que la distribution des liens hypertextes est extrêmement concentrée et inégalitaire. Quelle que soit l'échelle considérée (Hindman parle de « structure en poupées russes » (Hindman, 2009, p. 55)), un petit ensemble de sites reçoit la plupart des liens entrants — des résultats qui confirment que des lois de puissance structurent la distribution des liens sur le web. De plus, la concentration des liens est corrélée avec la répartition du trafic : les sites qui attirent le plus de liens sont également ceux qui reçoivent le plus de visiteurs (Hindman, 2009, p. 42). Le caractère fortement inégalitaire de ces distributions participe à la démystification de l'idée de la « démocratie numérique » ouverte et égalitaire. On assiste plutôt, en ligne, à la domination de ce que Hindman nomme la « Googlearchie » (Hindman, 2009, p. 55), la « règle du plus lié » qui implique que l'accès aux ressources du web est fortement dominé par une poignée d'acteurs ou de sites.

L'existence d'un web égalitaire et ouvert est également confrontée à des mesures empiriques qui prennent le contrepied et explorent l'hypothèse suivante : le web inciterait à des modes de communication fragmentés et isolés. Il s'agit alors d'étudier des notions telles que l'« homophilie politique » ou la « cyberbalkanisation ». Mise au jour par Sunstein (2001), la notion de cyberbalkanisation suggère qu'avec les possibilités de personnalisation offertes par le web et son offre toujours croissante de contenus, les gens ont tendance à consulter des sites qui promeuvent des opinions semblables aux leurs — une tendance renforcée et auto-entretenue par les services qui organisent et filtrent le web pour les usagers (Pariser, 2012) sur base, entre autres, du graphe d'hyperliens. Selon Sunstein, le

cloisonnement provoqué par de tels comportements constitue un danger pour la démocratie, étant donné que « les gens vont abandonner la lecture de points de vue politiques dissidents en faveur de contenus proches de leurs propres positions idéologiques » (Hargittai, Gallo, & Kane, 2008a).

Et l'hypothèse de la cyberbalkanisation de se confirmer au fil des recherches empiriques : la blogosphère « de guerre » (les blogs traitant de la guerre en Irak) étudiée par Tremayne et ses collègues (Tremayne, Zheng, Lee, & Jeong, 2006) se structure bel et bien en deux moitiés distinctes, l'une libérale et l'autre conservatrice. Le schisme n'est néanmoins pas complet, et un ensemble réduit, mais solide, de blogs fait office de liaison entre les deux camps (Tremayne et al., 2006a, p. 305).

Hargittai et al. (2008) interrogent la fragmentation dans le contexte de la blogosphère américaine durant la campagne pour les élections présidentielles de 2004. Le constat est similaire : les blogueurs politiques proposent en effet plus de liens vers des contenus qui partagent leur opinion que vers des contenus aux opinions divergentes. Les auteurs