5. Tirer le fil du lien hypertexte dans les discours métajournalistiques
2.7. Les liens dans leur contexte d'énonciation
J'examine ici les éléments du contexte d'énonciation des articles et leur relation avec la présence et le nombre de liens. Les éléments retenus comme significatifs du contexte d'énonciation sont le positionnement du lien dans l'article, la longueur de l'article et la rubrique dans laquelle l'article est publié.
Position des liens (dans le texte/hors du texte)
Comme l'a illustré la vigueur du débat sur la « delinkification » (voir p.93) l'endroit où les liens sont placés — principalement dans le texte ou hors du texte — n'est pas anodin.
Les liens sont majoritairement (95 % de tous les liens) situés en dehors du texte des articles, dans des « boîtes » ou des encarts qui les jouxtent. 32.393 liens sont situés dans le texte (cela représente un peu moins de 5 % du total de liens), et ils sont répartis dans 17.826 articles. Cela signifie qu'un peu plus de 10 % des articles contiennent au moins un lien dans le texte.
Sudinfo et lavenir se distinguent toutefois par leurs proportions de liens présents dans le texte des articles plus grandes que celle des autres sites, qui est respectivement de 23,7 % et 21,2 % (voir tableau 16).
tableau 16 – Proportions de liens dans le texte et hors du texte.
liens dans le
texte (%) du texte (%) liens hors
lavenir 23,7 % 76,3 % sudinfo 21,2 % 78,8 % lesoir 8,9 % 91,1 % lalibre 2,9 % 97,1 % dhnet 2,2 % 97,8 % 7sur7 1,6 % 98,4 % TOTAL 4,9 % 95,1 %
Le croisement du positionnement du lien dans l'article et de la destination (interne ou externe) du lien laisse apparaître que la grande majorité (89 %) des liens sont des liens internes situés en dehors du texte (voir tableau 17). Les liens internes à l'intérieur du texte sont très rares (1,7 % du total des liens), une tendance générale fortement influencée par leur quasi-absence dans les articles de 7sur7, dhnet et lalibre (où les liens internes dans le texte représentent moins de 1 % du nombre total de liens de chaque site). Sudinfo et lavenir présentent des répartitions différentes des autres sites : les liens apparaissent plus fréquemment dans le texte que ne le font les autres sites, même s'il s'agit de proportions modestes.
tableau 17 — Tableau croisé du positionnement des liens (dans le texte/en dehors du texte) et de leur destination (interne/externe), pour tous les liens de tous les sites. N = 661.708.
Liens externes Liens internes
TOTAL hors du texte 6,2 % 88,9 %
dans le texte 3,2 % 1,7 %
7sur7 hors du texte 3,3 % 95,1 %
dans le texte 1,0 % ,6 %
dhnet hors du texte 7,4 % 90,3 %
dans le texte 2,0 % ,2 %
lalibre hors du texte 8,1 % 89,0 %
dans le texte 2,5 % ,3 %
lavenir hors du texte 3,0 % 73,3 %
dans le texte 12,8 % 10,9 %
lesoir hors du texte 10,4 % 80,8 %
dans le texte 4,8 % 4,0 %
sudinfo hors du texte 19,2 % 59,6 %
dans le texte 16,2 % 5,0 %
En considérant les liens internes et externes séparément — pour éviter notamment que les proportions de liens externes soient écrasées par les quantités importantes de liens internes — on voit apparaître des tendances relativement homogènes de site en site en ce qui concerne les liens internes, et plus contrastées en ce qui concerne les liens externes. La quasi-totalité des liens internes (98 % de ceux-ci, voir tableau 18) sont situés hors du texte. En ce qui concerne les liens externes, ils sont également majoritairement situés en dehors du texte, mais dans une moindre mesure (66 % du nombre total de liens externes — voir
semblables de site en site, ce n'est pas le cas pour les liens externes. Lavenir se distingue particulièrement des autres sites, puisque plus de 80 % de ses liens externes se situent dans le texte des articles — il s'agit également du site avec le plus de liens internes dans le texte (12,9 % de tous les liens internes de lavenir). Dans le cas de sudinfo, les proportions de liens externes sont distribuées relativement équitablement dans le texte (45,7 %) et hors du texte (54,3 %). Les autres sites (lesoir, lalibre, 7sur7, dhnet) agencent moins d'un tiers de leurs liens externes dans le texte des articles.
tableau 18 — Proportions de liens internes dans le texte et hors du texte
liens internes (n = 599.634) dans le texte hors du texte lavenir 12,9 % 87,1 % sudinfo 7,8 % 92,2 % lesoir 4,7 % 95,3 % 7sur7 ,6 % 99,4 % lalibre ,4 % 99,6 % dhnet ,2 % 99,8 % TOTAL 1,9 % 98,1 %
tableau 19 — Proportions de liens externes dans le texte et hors du texte
liens externes (n = 62.074) dans le texte hors du texte lavenir 81,0 % 19,0 % sudinfo 45,7 % 54,3 % lesoir 31,8 % 68,2 % lalibre 23,9 % 76,1 % 7sur7 23,6 % 76,4 % dhnet 21,4 % 78,6 % TOTAL 33,8 % 66,2 %
En termes de présentation, on constate donc que les sites d’information observés optent principalement pour des liens situés en dehors du texte des articles : même si quelques liens sont dispersés à l'intérieur des articles, la plupart sont surtout rassemblés dans des colonnes latérales, dans des encadrés, c'est-à-dire hors du texte. Les liens, dans les sites observés ici, feraient donc plutôt partie du péritexte de l’article (Adam, 1997) que du texte lui-même. Les éléments qui, dans le contexte de production de l'information, structurent le choix de placer les liens dans le texte ou hors du texte sont présentés dans le chapitre V. En cela, les médias observés semblent prendre position par rapport à l’éternelle controverse du placement le plus judicieux des liens hypertextes, alimentée notamment par l’hypothèse émise par les tenants de la « delinkification » (voir p.93) selon laquelle les liens présents dans le corps du texte constituent tant de distractions pour les lecteurs. La poignée de liens qu’on trouve écrits en toutes lettres dans le texte des articles constitue une pratique très minoritaire, mais néanmoins interpellante. Quand ces adresses URL intégrées dans le texte ne sont même pas cliquables, s’agit-il encore de liens hypertextes ? Il s'agit plutôt de pseudi-liens : il semble que l’intention de diriger le lecteur vers d’autres sites ou d’autres
documents existe, mais la mise en œuvre est en décalage puisque le lien, en tant que tel, n’existe pas.
Longueur des articles
En ce qui concerne la longueur des articles, il s'agit de tester une relation autour de deux hypothèses, l'une postulant une relation positive et l'autre, une relation négative entre ces deux variables :
Plus un article est long, plus il contiendra de liens. En considérant la fonction des liens comme exhibition des sources et des matériaux ayant servi à alimenter l'article, la longueur de l'article est utilisée ici comme un indice de la densité des sources. On peut supposer qu'un article long repose sur des sources nombreuses (qui peuvent être indiquées grâce à des liens). La longueur des articles constitue également un indicateur de l'investissement en temps et en énergie de ses auteurs (Engebretsen, 2006, p. 6), qui, plus il est important, pourrait également se traduire par un soin particulier à « augmenter » l'article d'éléments multimédias et de liens.
Plus un article est court, plus il contiendra de liens. On considère ici la fonction des liens comme élément de contextualisation d'une écriture concise. Un article court ne contient pas beaucoup d'éléments de contexte, il pourra donc contenir des liens vers des explications plus élaborées, des éléments de contexte ou d'approfondissement.
À première vue, les nuages de points semblent suggérer qu'il n'y a pas de relation entre la longueur des articles et le nombre de liens qu'ils contiennent. Les nuages de points ne laissent apparaître aucune relation linéaire (ni d'ailleurs de forme particulière), qu'il s'agisse de tous les types de liens (figure 24), des liens internes (figure 25) ou des liens externes (figure 26). De même, les mêmes nuages de points examinés site par site, ou en cherchant à contraster les liens apparaissant dans le texte des articles ou en dehors de celui-ci, ne laissent apparaître aucune forme particulière41
.
41 La prémisse d'une relation linéaire entre la longueur de l'article et le nombre de liens n'étant pas vérifiée, il n'est dès lors pas pertinent de réaliser une régression linéaire. De plus, les autres prémisses nécessaires pour
figure 24 — Pour tous les articles qui comprennent au moins un lien : longueur de l'article (exprimée en nombre de signes) / Nombre de liens. n = 110.447. Les valeurs extrêmes (nombre de liens > 100 et longueur du texte > 10.000 ne sont pas
représentées)
figure 25 — Pour tous les articles qui comprennent au
moins un lien interne : longueur de l'article (exprimée en nombre de caractères) / Nombre de liens internes. N = 103.373. Les valeurs extrêmes (nombre de liens internes > 100 et longueur du texte > 10.000 ne sont pas
représentées)
figure 26 — Pour tous les articles qui comprennent au moins un lien externe : longueur de l'article (exprimée en
nombre de caractères) / Nombre de liens externes. N = 36.000. Les valeurs extrêmes (nombre de liens externes
> 100 et longueur du texte > 10.000 ne sont pas représentées)
Toutefois, on voit apparaître une relation significative entre nombre de liens et longueur de l'article en regroupant les données par classes et en observant les mesures de centralité et de dispersion. La figure 27 présente, pour chaque classe de longueur42
, la médiane, le troisième quartile (75e centile) et le 95e centile. On y observe deux tendances : le nombre de liens augmente avec la longueur de l'article, et la dispersion devient également plus
42 La longueur des articles a été divisées en cinq classes : moins de 250 caractères, entre 250 et 500 caractères, entre 501 et 1000 caractères, entre 1001 et 1500 caractères, plus de 1501 caractères. Les classes sont de longueurs inégales pour tenter de représenter au mieux le grand nombre d'articles dont la longueur est inférieure à 500 caractères, tout en conservant des classes aux effectifs suffisamment nombreux dans les classes de longueur supérieure.
grande. Ainsi, si trois quarts des articles très courts (moins de 250 caractères) qui contiennent au moins un lien en contiennent entre 1 et 8, la même proportion des articles les plus longs (plus de 1500 caractères) qui contiennent au moins un lien en comptent entre 1 et 14. Des écarts se lisent aussi sur la borne supérieure (qui représente ici le 95e centile) qui sépare les 5 % d'articles qui contiennent le plus de liens des 95 % restant. Cette borne est située à 12 liens pour les articles très courts, mais à 23 liens pour les articles les plus longs. Les mêmes tendances s'observent quand on considère uniquement les liens internes (figure 28) et les liens externes (figure 29) : les gradations qui s'observent au fur et à mesure que la longueur de l'article augmente ne sont pas spectaculaires (surtout pour les liens externes — la plupart des articles qui contiennent des liens externes en contiennent peu), mais elles existent néanmoins. Ainsi, si on observe les articles contenant des liens externes, on voit que trois quarts des articles les plus courts (la longueur inférieure à 1000 caractères) contiennent 1 ou 2 liens, alors que trois quarts des articles les plus longs (longueur supérieure à 1000 caractères) en contiennent entre 1 et 3. Les liens situés dans le texte (figure 30) et ceux situés en dehors du texte (figure 31) montrent des tendances similaires. L'accroissement du nombre de liens au fur et à mesure que la longueur de l'article augmente ne concerne donc pas uniquement les liens dans le texte, mais également ceux situés dans des encarts jouxtant le texte des articles.
C'est donc la première hypothèse qui se semble se vérifier : plus un article est long, plus il contient de liens. L'ensemble des corrélations entre la longueur du texte et le nombre de liens (que l'on considère tous les liens, les liens externes, les liens internes, les liens dans le texte ou les liens hors du texte) sont significatives et vont toutes dans le même sens (la relation entre les deux variables est positive), mais les coefficients de corrélation sont plutôt faibles43
. Tous ces éléments semblent indiquer qu'il existe une relation positive entre la longueur du texte des articles et le nombre de liens, mais que cette relation n'est ni linéaire ni très forte.
L'hypothèse d'une relation négative entre la longueur du texte et le nombre de liens (plus un article est court, plus il contient de liens) est quant à elle rejetée.
43 Le calcul du coefficient de corrélation de rang de Spearman (préféré au coefficient de corrélation de Pearson parce que nous sommes face à des données comportant de nombreuses valeurs extrêmes) donne des valeurs
figure 27 — Pour tous les articles comprenant au moins un lien (tous types de liens), mesures de centralité et de dispersion du nombre de liens par classes de longueur d'article. N = 110.453
figure 28 — Pour tous les articles comprenant au moins un lien interne, mesures de centralité et de dispersion du nombre de liens internes par classes de longueur d'article. N = 103.378
figure 29 — Pour tous les articles comprenant au moins un lien externe, mesures de centralité et de dispersion du nombre de liens externes par classes de longueur d'article. N = 36.004
figure 30 — Pour tous les articles comprenant au moins un lien dans le texte, mesures de centralité et de dispersion du nombre de liens dans le texte par classes de longueur d'article. N = 17.826
figure 31 — Pour tous les articles comprenant au moins un lien en dehors du texte, mesures de centralité et de dispersion du nombre de liens en dehors du texte par classes de longueur d'article. N = 104.939
Liens et rubriques
Le fait qu'un article soit classé dans une rubrique a-t-il une relation avec la présence et la densité de liens ? C'est en tout cas une hypothèse formulée à de nombreuses reprises, qu'il s'agisse de comparer les liens entre différentes rubriques (Larsson 2012 ; Tremayne 2005, Himelboim) ou de choisir d'étudier les articles d'une rubrique parce qu'ils sont censés être un terrain particulièrement propice aux liens (Himelboim (2010) étudie ainsi uniquement les articles de la rubrique « international »). Ces études désignent a priori des domaines de l'actualité censés faire preuve de comportements différents en matière de liens et comparent les liens qu'ils trouvent dans les articles appartenant à ces rubriques. Je propose ici de procéder de manière plus systématique et sans postuler quoi que ce soit à propos du caractère plus ou moins propice aux liens de telle ou telle rubrique : il s'agit donc d'évaluer, en considérant toutes les rubriques proposées par les sites, s'il existe des différences entre celles-ci.
L'évaluation des différences entre rubriques se déroule en deux étapes complémentaires. La première vise à évaluer la présence ou l'absence de liens de manière dichotomique, en observant les proportions d'articles comprenant au moins un lien. Il s'agit de déterminer si les articles d'une rubrique ont tendance à contenir des liens ou non, sans prendre en compte la quantité de liens. La deuxième étape s'intéresse uniquement aux articles qui contiennent effectivement au moins un lien, et cherche à jauger la densité de liens en observant, par rubrique, le nombre moyen de liens par articles. Ces analyses sont d'abord appliquées à tous les types de liens confondus, puis uniquement aux liens externes.
Tous types de liens: association entre rubrique et présence de liens
Les rubriques présentent-elles un aspect différent en ce qui concerne la présence ou l'absence de liens dans les articles qui les peuplent ? On trouve des différences significatives44
, mais l'intensité de la relation varie d'un site à l'autre (voir figure 32). Dans le cas de 7sur7 et lesoir, les différences entre rubriques sont significatives, mais très faibles : quelle que soit la rubrique, la grande majorité des articles (entre 90 et 96 % pour lesoir, entre 98 et 100 % pour 7sur7) contiennent au moins un lien. Les différences sont plus marquées en ce qui concerne les quatre autres sites, et particulièrement dhnet, sudinfo et lavenir. Ainsi, si les articles de la rubrique « sport » de dhnet sont majoritairement (82 %) pourvus d'au moins un lien, ce n'est pas le cas des articles des rubriques « société » ou « national » qui ne sont qu'environ 40 % à contenir au moins un lien. Les écarts se creusent également entre la rubrique « sport » de lavenir (des liens sont présents dans 65 % des articles de celle-ci) et les rubriques « science & technologie » (liens présents dans 31 % des articles) ou « société » (liens présents dans 42 % des articles).
La rubrique « sport » apparait, dans les quatre sites (lalibre, dhnet, lavenir, sudinfo) où il y a des différences entre rubriques, comme une de celles où il y a le plus d'articles comprenant au moins un lien. C'est-à-dire que, en dehors de 7sur7 et lesoir où la présence de liens est assurée de manière égale à travers toutes les rubriques, la présence de liens semble plus habituelle dans la rubrique « sport ». En dehors de cette tendance, la façon dont la présence ou l'absence de liens se distribue entre les rubriques n'est pas homogène parmi les sites. D'ailleurs, si on observe la présence de liens dans les articles par rubrique (voir figure 33), on constate que la présence ou l'absence de liens est essentiellement dictée par les tendances générales de chaque site : quelle que soit la rubrique, la présence de lien est importante dans les articles de 7sur7 et lesoir, alors que les liens sont absents dans la majorité des articles de sudinfo (entre 80 et 70 %).
Tous types de liens : association entre rubrique et densité de liens
Existe-t-il une relation entre la rubrique et la densité de liens ? Un test de Kruskal-Wallis45
montre qu'il y a une association significative46
entre la rubrique et le nombre de liens. Le même test effectué par site montre également que l'association entre rubrique et nombre de liens est significative pour chaque site.
44 Les tests Khi-‐carré d'indépendance conduisent tous au rejet net de l'hypothèse d'indépendance entre la rubrique et le nombre de liens (p < ,001). Les indicateurs de la force de l'association (V de Kramer) sont en revanche généralement faibles (inférieurs à 0,3 dans la plupart des cas) ce qui semble indiquer qu'il existe bel et bien une relation significative mais que celle-‐ci est modérée ou faible. Le caractère significatif du test d'hypothèse est dès lors probablement influencé par le grand nombre d'observations.
Outre l'absence de certaines rubriques dans certains sites, la comparaison systématique du nombre de liens par article pour chaque rubrique est parfois ardue puisque, une fois le nombre total d'articles réduit à ceux qui contiennent des liens, répartis par rubrique, certaines rubriques présentent de très petits effectifs (moins de 100 articles) pour lesquels il n'est donc pas pertinent de donner des tendances centrales. Ces limites établies, on observe (tableau 20) avant tout qu'il y a des variations du nombre de liens par rubriques pour certains sites, mais pas pour d'autres (lavenir, sudinfo et lesoir présentent des médianes et 75es centiles très homogènes de rubrique en rubrique). Là où le nombre médian de liens par rubrique varie, il ne le fait pas de la même manière de site en site. En d'autres termes, il n'y a pas une même rubrique qui, dans tous les sites, contiendrait systématiquement un nombre médian de liens plus élevé, ou une rubrique qui contiendrait systématiquement un nombre médian de liens plus faible. Pour les trois sites où on voit le plus de variations entre rubriques (7sur7, dhnet, lalibre), la rubrique « sport », qui semblait montrer une plus forte présence de liens, dévoile également des valeurs légèrement plus élevées pour la médiane ou le 75e centile. La catégorie « soft news », quant à elle, a une médiane et un 75e centile plus faible qu'ailleurs.
figure 32 – Présence de liens par rubrique : proportions d'articles comprenant au moins un lien (tous types de liens), par site et par rubrique. N = 176.310
figure 33 — Présence de liens par rubrique Proportions d'articles comprenant au moins un lien (tous types de liens), par rubrique et par site. N = 176.310 — Les sites entre parenthèses indiquent qu'une telle rubrique n'existe pas ou qu'elle