• Aucun résultat trouvé

C HAPITRE 4 L E MOTEUR COM H P NŒUVR S

B. Méta-tags spécialisés

De nombreux éditeurs reprochent à Google Search et Google Actualités de ne pas faire remonter leur ontenu quan il s’agit ’une information ex lusive et originale, notamment parce que les documents les plus récents remontent en premier dans les grappes de liens. Si vous êtes le premier à avoir traité une information et que ’autres l’ont traité ensuite, vous risquez ainsi ’être « au fond » du cluster, et donc de recevoir peu de visiteurs en provenance de Google. Pour tenter de remédier à cette imperfection, Google a mis au point deux méta-tags permettant ’i entifier la sour e originale ’un o ument. Le premier – « syndication source méta-tag »123 – permet à un é iteur syn iquant un ontenu qu’il n’a pas pro uit ’in iquer au rawleur où le contenu original se trouve. Ainsi, Google peut considérer ce tag pour faire remonter le site u pro u teur e l’arti le e façon prioritaire par rapport à ceux qui l’ont repris, sous forme de « cross-posting » ou ’agrégation. Bien sûr, on peut se demander dans quelle mesure un éditeur a intérêt à implémenter ce méta-tag étant onné qu’il risque de se trouver lui-même relégué au fond de la grappe.

Le méta-tag « standout »124, quant à lui, qui a remplacé en septembre 2011 le méta-tag « original source », permet à un é iteur ’in iquer au crawleur que ’est lui l’auteur original u o ument et qu’il onsi ère que ce contenu est important.

123 <meta name="syndication-source" content="http://www.example.com/article-original-pouvant-etre-publie-ailleurs.html"> 124 <link rel="stan out" href=“http://www.example. om/s oop_arti le_2.html” />

« Si vous mettez e tag ans l’entête HT L ’un e vos arti les, Google Actualités pourra montrer l’arti le a ompagné u label "original" sur la page ’a ueil e Google A tualités ou sur les requêtes qui y seront effectuées » (Google News Blog)125.

Le standout vise directement à attribuer un label aux journalistes, visible sur Google Actualités et Google Search : ce fameux signe de reconnaissance dont parle Dominique Wolton omme ’un « impératif catégorique » pour identifier « l’information-presse par rapport à toutes les autres » (Wolton, 2003, p.14, cf. 1.1.2). Voici comment Google présente ses préconisations :

« Si votre rédaction traite un scoop, ou publie un travail de journaliste hors du commun, vous pouvez l’in iquer en utilisant le tag standout. Quand il s’agira e éterminer s’il est ju i ieux ou non ’utiliser e tag pour votre article, considérez les critères suivants : / Votre article est la source originale. / Votre entreprise a investi des ressources signifiantes dans la production et le report de cette information. /Votre article mérite une reconnaissance spéciale. » (CAA)126

Google propose ainsi à l’é iteur ’être lui-même le juge de la qualité de son travail. L’usage e ette balise ne suffit cependant pas à e qu’un ontenu en parti ulier se trouve en haut u luster. D’autres ritères algorithmiques sont à l’œuvre127. ais son utilisation permet à Google ’avoir une in i ation supplémentaire quant à la qualité de l’arti le en question, et à l’é iteur e repren re partiellement la main sur la hiérarchisation des contenus opérée par le dispositif. C’est une manière pour les é iteurs de contribuer à restructurer en partie leur ligne éditoriale défaite par les « liens profonds » et le rangement en « grappes ».

Dès lors, il paraît évi ent que la tentation est gran e pour les é iteurs ’insérer ette balise ans le o e e haque nouvelle page mise en ligne. C’est pourquoi

125 « If you put the tag in the HT L hea er of one of your arti les, Google News may show the arti le with a ‘Feature ’ label on the Google News homepage and News Search results », disponible ici :

http://googlenewsblog.blogspot.com/2011/09/recognizing-publishers-standout-content.html (Notre traduction)

126 « If your news organization breaks a big story, or publishes an extraordinary work of journalism, you can indicate this by using the standout tag. When determining whether to use this tag for your own article, consider whether that article meets the following criteria: / Your article is an original source for the story. / Your organization invested significant resources in reporting or producing the article. /The article deserves special recognition. », disponible ici :

http://support.google.com/news/publisher/bin/answer.py?hl=en&answer=191283 (Notre traduction)

Google limite l’usage u méta-tag à sept articles par semaine128. Sept est un chiffre arbitraire, donné sans véritable explication. Google exerce ici son « pouvoir sur » afin que les é iteurs n’abusent pas u « pouvoir de faire » qui leur a été laissé. Cette limite lui permet e s’assurer qu’il n’y ait pas trahison, mais toujours traduction du côté des éditeurs. La limitation permet en effet ’imposer aux é iteurs ’utiliser le méta-tag comme cela a été prévu par les concepteurs du dispositif.

Le même méta-tag peut également être utilisé ans le o e HT L ’un arti le n°1 pour désigner un article n°2, original et à forte valeur ajoutée, présent soit sur le site e l’é iteur e l’arti le n°1 soit sur le site ’un autre é iteur. Ainsi, non seulement le journaliste cite ses sources via les liens hypertextes, mais en plus il peut signaler au robot quelles sont les sources qui, selon ses critères à lui, sont des travaux originaux à forte valeur ajoutée. Les porte-parole de Google encouragent fortement cette pratique de désignation129, qui n’intervient pas ans la limite es sept articles par semaine (mais qui, en revan he, peut iluer le PageRank e l’é iteur n°1 s’il ite le o ument ’un é iteur n°2).

Le méta-tag « standout » constitue un excellent exemple de la tentative ’une tra u tion par les employés e Google ’un prin ipe éontologique propres aux journalistes, à partir de ce que les employés de Google pensent à leur sujet. En effet, les porte-parole de Google donnent des recommandations aux journalistes concernant leur honnêteté professionnelle, en plaidant pour un enrôlement qui irait de pair avec une ertaine forme ’éthique ès lors qu’ils s’appuieraient sur es sour es ayant fourni l’essentiel u travail e olle te ’information130. Par ailleurs, il est important de souligner que la balise standout n’est pas simplement un outil visant à servir

128 « At this point, we ask news organizations to use the Standout tag to cite their own content at most seven times in each calendar week. If a site exceeds that limit, it may find that its tags are less recognized, or ignored altogether. », disponible ici : http://googlenewsblog.blogspot.com/2011/09/recognizing-publishers-standout-content.html (dernière visite le 21 août 2013) 129« Standout Content tags work best when news publishers recognize not just their own quality content, but also the original

journalistic contributions of others when your stories draw from the standout efforts of other publications. Linking out to other sites is well re ognize as a best pra ti e on the web, an we believe that iting others’ stan out ontent is importan t for earning trust as you also promote your own standout work. » Google News Blog,

http://googlenewsblog.blogspot.com/2011/09/recognizing-publishers-standout-content.html(dernière visite le 21 août 2013). « We strongly recommend citing standout articles from other publishers when your own article draws from that standout piece of journalism. When determining whether to use this tag to cite the work of others, consider the following criteria: / The publisher's article was the original source for the story you are now reporting. / The original source invested significa nt resources in reporting or producing the article. / You know that the original article deserves special recognition. If a piece draws on multiple pieces of standout work, you can use the standout tag multiple times in the header of the article. Also, citing standout articles from other publishers does not count against the limit of seven self -citations per week. » (CAA, http://support.google.com/news/publisher/bin/answer.py?hl=en&answer=191283 , dernière visite le 21 août 2013) 130 Voir la note de bas de page précédente.

l’intérêt es journalistes, cela car une utilisation du tag conforme à celle qui a été prévue permettra potentiellement à Google ’i entifier plus fa ilement les ontenus « de qualité », non plus selon des critères techniques et un procédé automatisé mais ’après une in i ation manuelle effe tuée du côté des éditeurs. Google a donc intérêt à ce que le standout soit massivement utilisé, pour ensuite accroître la qualité du fonctionnement du dispositif qu’il a onçu. Le « pouvoir de faire » laissé aux journalistes permettrait ainsi à Google ’in lure une expertise journalistique à son mécanisme automatisé de hiérarchisation.

4.5.3 Optimiser

A présent que nous avons mentionné les mises en œuvre qui permettaient aux é iteurs ’être éligibles à l’in exation, puis les mises en œuvre visant à ommuniquer avec les crawleurs et l’in exeur, il nous reste à onsi érer omment, te hniquement, l’é iteur peut tenter e maximiser le trafic apporté par le dispositif.

A. SourceRank

En plus du PageRank, un des critères considérés comme les plus importants par les référenceurs dans le cas de Google Actualités est appelé « SourceRank ». Il s’agit ’attribuer une note e pertinen e non pas seulement au document mais également au site lui-même. Nikos Smyrnaios et Franck Rebillard ont présenté le Sour eRank à partir ’une étu e es brevets éposés en 2005. Ils classent dans leur analyse les treize critères proposés par Google en deux catégories, dont la première est centrée sur la source et la deuxième sur la production. Dans le premier cas, expliquent-ils, « l’obje tif semble être la tra u tion en langage algorithmique du " apital journalistique" ’un mé ia, "correspondant à une reconnaissance qui s’obtient auprès e ses pairs, mais aussi auprès u public et de pouvoirs externes" (Duval, 2004, p.107) » (Smyrnaios et Rebillard, 2009, p.102). Nous retrouvons dans ette itation l’i ée ’une traduction (interprétation et déplacement) opérée par le langage algorithmique de certains éléments comme le capital journalistique. Dans cette première catégorie, Nikos Smyrnaios et Franck Rebillard énumèrent des critères comme la prise en compte du nombre de liens entrant (PageRank), le trafic global, et aussi la taille e la ré a tion, le nombre e bureaux ont elle ispose à l’étranger, les

prix reçus par les journalistes et l’opinion es internautes (qui peut être mesurée par son age). Ils pré isent toutefois qu’à part le PageRank, rien n’in ique pour le moment que les autres critères cités dans le brevet soient effectivement pris en compte par Google Actualités.

Les deux chercheurs expliquent ensuite que la deuxième catégorie de critères, centrés sur la production, semble en revanche avoir été privilégiée par Google. Dans ette atégorie, on trouve le nombre ’arti les pro uits par la sour e (lié à la qua ntité avantage qu’à la qualité), le respe t es règles ’orthographe et e grammaire, le story size et le breaking score. Le story size « consiste à évaluer l’importan e ’un sujet en fonction du nombre de sources qui le traitent » et « tend à privilégier les sujets ’a tualité qui font l’objet ’un traitement mé iatique par un gran nombre e sources au détriment des informations peu reprises » (op. cit., p. 104), ce que ’ailleurs Fran k Rebillar et Nikos Smyrnaios, ave ’autres, ont onfirmé empiriquement trois ans plus tard (Marty et al., 2012). Le breaking score, quant à lui, « représente la apa ité ’une sour e à pro uire un arti le peu e temps après que l’événement traité s’est pro uit. Autrement it, plus l’apparition ’une information est rapide sur un site (en comparaison des autres sites), mieux celui-ci sera noté. Il s’agit là ’évaluer la réa tivité ’une ré a tion en fon tion es événements. La satisfaction de ce critère implique une activité de veille considérable pour les journalistes et une organisation du travail permettant de diffuser un contenu extrêmement rapidement. In fine ce critère tend à privilégier la source qui se trouve à l’origine ’une information puisque, par éfinition, le moment e la première publication sur un sujet donné constitue la référence à partir de laquelle est calculé le breaking score des articles suivants » (Smyrnaios et Rebillard, op. cit., p. 104). Un autre critère centré sur la production est lié à la diversité des thèmes abordés par une même source, et « tend à privilégier les sources généralistes au détriment des sites ’information spé ialisée » (ibid.). Quant au dernier critère, appelé reporting, il on erne l’originalité e la pro u tion. Celui-ci est mesuré par exemple grâce au nombre e noms propres, qui in iquerait que l’arti le apporte es informations supplémentaire à un sujet (ibid.). Nous verrons que ’est à ause e e ritère, couplé avec le breaking score, que les éditeurs ne se contentent pas de reprendre les

dépêches AFP, mais les « bâtonnent » dans le but de « faire croire » au dispositif qu’ils ont produit un contenu original (cf. 9.1.6).

A l’analyse u Sour eRank effe tuée par Nikos Smyrnaios et Franck Rebillard, nous pouvons ajouter plusieurs critères qui entrent selon les spécialistes, et notamment selon une réflexion menée par une izaine ’entre eux en 2011131, dans le calcul de la pertinence de la source et des documents :

 L’autorité u site sur un sujet pré is : Google Actualités doit identifier un site comme spé ialiste ’un omaine en parti ulier, e qui ten rait à ésavantager les sites e presse trop généralistes.

 La présence de mots-clés dans le titre de la page, critère qui, comme pour Google Search, est primordial pour Google Actualités.

 Les signaux sociaux : omme pour Google Sear h, le nombre e fois qu’un arti le a été partagé et commenté sur les réseaux sociaux influence sont classement dans Google Actualités.

 Le taux de clics dans Google Actualités ainsi que dans Google Search : plus un site reçoit e visiteurs lorsqu’un e ses liens s’affi he, et plus ses liens s’affi heront, entrainant alors une spirale au sein de laquelle « les plus riches deviennent plus riches ». Par conséquent, un site « neuf », ont l’historique u taux e li est ourt, aurait, selon les spécialistes, très peu de chance de recevoir un trafic significatif via Google Actualités.

 L’utilisation ’un Sitemap : l’utilisation e et outil permet ’augmenter signifi ativement l’apport ’au ien e en provenan e u ispositif.