• Aucun résultat trouvé

Comment évolue un site ? Comment s’étend-il sur le Web ? Comment naissent et disparaissent certaines de ses sections ? Peut-on voir un site croitre, à mesure que de nouvelles pages s’ajoutent à son arborescence ? Ces questions sortent du cadre strict de notre étude sur le forum de yabildai.com, mais nous souhaitons tout de même nous y attarder ici, afin d’ajouter une nouvelle brique à nos outils d’exploration. En effet, le Web est tout autant un flux continu d’informations qu’un espace en pleine expansion, dont nous voulons maintenant retracer la genèse (à l’échelle d’un site tout du moins). Aussi, plusieurs pistes de réflexion s’offrent à nous : Qu’est ce qu’un site Web, d’un point de vue topographique ? Comment le représenter ? Comment traduire ses dynamiques internes ? Comment rendre compte de l’évolution de ses diverses ramifications depuis les archives Web ? Notre corpus suffit il, à lui seul, à couvrir toute l’étendue d’un site ?

Sur ce point, M. Toyoda et M. Kitsuregawa proposent de se baser sur les URL d’un site pour en reconstituer le graphe (Toyoda et Kitsuregawa, 2003, 2005). Chaque élément d’une URL (compris entre deux /) forme

un nœud particulier du graphe, dont l’évolution est retranscrite par une série de captures successives. On appelle cette méthode une série temporelle de graphes. C’est l’approche que nous avions utilisé pour notre prototype en oursin (Figure 3.13), présenté en Section 2.2. Mais, avec un peu de recul, il nous semble difficile de comparer visuellement de telles séries, surtout lorsque les sites (comme yabiladi.com) se révèlent être très verbeux en URL à afficher. De plus, la période de capture et de représentation reste sujette à discussion et peut varier sensiblement d’un site à l’autre.

À l’opposé, la méthode employée par B. Fry, dans son application Anemone71

(Fry, 2000, p.76-82), permet de saisir de manière dynamique

71. http://benfry.com/anemone/

l’évolution d’un site, vu ici comme un être vivant en pleine croissance. Le système, conçu par Fry, part de la première page archivée d’un site Web donné, à laquelle il ajoute toutes les n secondes une nouvelle ramification, collant ainsi à l’arborescence du site telle qu’elle a été collectée (Figure 5.22) :

(a) (b) (c) (d) (e)

inter.net inter.net/p1 inter.net/p1/p2

inter.net/p3

t0 t1 t2 t3 tn

Figure 5.22: Fonctionnement du système de visualisation Ane- mone, pour un site fictif inter.net

Mais si l’idée de croissance est bien restituée par Anemone, la spatia- lisation (en haut, en bas, à gauche. . .), de chaque branche est, quant à elle, codée pour suivre un comportement aléatoire : la structure du site reste la même, mais l’agencement local des pages varie à chaque relance de l’application. Ce procédé écarte malheureusement toute pos- sibilité d’étude répétée et systématique. De plus, le temps est ici pensé comme une mécanique de visualisation (le temps sert à mettre à jour l’Anemone) et non comme une véritable dimension d’analyse.

Sur ce point, en matière de visualisation des dimensions spatio-tempo- relles d’un processus historique, la célèbre Carte figurative des pertes successives en hommes de l’Armée Française dans la campagne de Russie

1812-1813 de C. J. Minard reste la meilleure source d’inspiration. Elle

permet de suivre le trajet (tracé beige) de l’armée napoléonienne et ses pertes humaines (épaisseur du tracé), à travers la Russie (indica- tions géographique), au cours de l’hiver 1812-1813 (temps en abscisse). Deux dimensions (temps et espace) servent ici de cadre à l’étude de l’évolution d’une troisième (le nombre d’hommes).

Figure 5.23: C.J. Minard, (1869), Carte figurative des pertes successives en hommes de l’Armée Française dans la campagne de Russie 1812-1813 Au regard de ces exemples, il nous semble judicieux de choisir de

représenter un site comme un arbre d’URL, se déployant depuis sa racine (la première page mise en ligne) et grandissant à mesure que de nouvelles pages y sont publiées. En effet, un arbre croit suivant une direction donnée qui peut, dans notre cas, être associée à un axe temporel, placé en abscisse à la manière d’une timeline (Figure 5.24) :

inter.net

inter.net/articles

inter.net/articles/categories/web

inter.net/aide.html t ( p2) t ( p3) …/hello.html p1 p2 p3 t ( p1) t ( p2)+t ( p1) 2 t

Figure 5.24: Proposition de visualisa- tion de l’évolution de la structure d’un site fictif inter.net dans le temps

Chaque URL du site représente ici une branche de l’arbre et les pages Web font office de feuilles (Figure 5.24, points rouges). L’abscisse d’une URL est déterminée suivant la date de création (dans le meilleur des cas) ou de téléchargement (dans le pire des cas) de la page qu’elle adresse. Pour positionner les embranchements mécaniques72

de notre arbre, 72. les portions d’URL entre deux / ne correspondant à aucune page réelle.

nous leur attribuons arbitrairement une date médiane (Figure 5.24, voir p2). L’ordonnée d’une URL est, quant à elle, définie de manière arbitraire (l’axe vertical n’a donc pas de signification particulière). Les URL sont placées, du haut vers le bas, de la plus ancienne à la plus récente, suivant une demi-ellipse centrée sur l’embranchement parent (Figure 5.25). L’épaisseur d’une branche de l’arbre d’URL est déterminée par son nombre d’enfants. La taille des marqueurs représentant les pages peut être ramenée à une mesure donnée, comme par exemple, un nombre de messages postés.

(x , y)

(x

3

, y

3

)

(x

2

, y

2

)

(x

1

, y

1

)

Figure 5.25: Positionnement de 3 pages (rouge) autour d’un embranchement parent (bleu)

Ceci étant défini, nous développons alors un système73

, permettant

73. Open-source et téléchar- geable icihttps://github. com/lobbeque/archive-viz/

tree/master/stayingAlive

de récupérer, depuis notre moteur d’exploration et depuis le corpus d’Internet Archive, l’ensemble des URL archivées d’un site donné. En effet, afin de garantir une plus grande couverture de l’étendue d’un site nous choisissons de coupler plusieurs sources de données. Nous implémentons cette méthode et construisons une interface de visualisa- tion Web. L’utilisateur peut y zoomer à volonté et sélectionner, s’il le souhaite, le détail d’une branche ou d’une feuille (Figure 5.26).

Figure 5.26: Capture d’écran de l’évolution topologique de la sec- tion Interprétation des rêves, roqya, djinn du forum de yabiladi.com