• Aucun résultat trouvé

Conclusion : presse imprimée & ordiphone

CHAPITRE 2. DES DOCUMENTS ANALOGIQUES A LA DOCUMENTARISATION ELECTRONIQUE

2. Le web des données : les relations

Derrière cette expression, il s’agit d’appréhender le Web non plus seulement comme une collection de documents HTML, largement désorganisés, mais également comme des données structurées pouvant être traitées de manière automatique par des machines avant de pouvoir l’être, selon de nouveaux procédés, par des individus. Ces données structurées en ontologie et taxinomie permettent non plus simplement à l’homme mais également à des machines de les manipuler selon leur description, comme nous le verrons, en tant que ressource physique ou abstraite.

Pour Philippe Bootz, la différence conceptuelle de l’hypertexte entre celle de Ted Nelson et celle de Vanevar Bush repose respectivement pour le premier sur la définition sémiotique de la notion de texte alors que le second s’inspirerait plutôt d’une définition linguistique.

Pour Vanevar Bush l’innovation de l’hypertexte reposerait sur le rôle associatif du lien, créateur de sens alors que pour Ted Nelson, ce qui fait sens reposerait d’abord sur la navigation et l’idée de découverte liée à la lecture. Pourrait-on déjà y voir une lecture déterministe de la part de Bush, organisée autour du document et une lecture centrée sur l’utilisateur de la part de Nelson ? 174

La différence conceptuelle entre le Web sémantique de Tim Berners-Lee d’une part et le Memex de Vanevar Bush ou le Xanadu de Ted Nelson est que, pour ces derniers, l’hypertexte correspond à des nœuds permettant de naviguer entre des documents organisés par et pour les gens alors que les nœuds du Web sémantique permettent de naviguer entre des données échangées entre les machines et structurées à la volée par les gens.

Nous reproduisons ici les visuels qui ont permis à Tim Berners Lee d’introduire pour la première fois le concept de web sémantique à la Conférence Internationale du WWW au Cern à Genève en septembre 1994 :

Figure 12 Le concept de Web sémantique en 1994 par Tim Berners Lee

Source : [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]

La première image représente le web, qui est un « ensemble de nœuds et de liens ». C’est une collection de documents rédigés par des humains et reliés entre eux par des liens. La deuxième image correspond à la « manière linéaire » dont les machines interprètent les relations entre les documents. Ces documents et les relations entre les documents ne sont pas lisibles ou interprétables par des machines (machine-readable information). Tim Berners Lee explique alors combien l’on passerait à côté de la puissance des machines, car ces documents peuvent décrire des personnes, mais aussi les relations de ces personnes aux choses, par exemple, la relation de propriété qui unit une personne à sa maison : c’est l’image 3. Sa proposition est d’ajouter une sémantique au web par l’ajout de deux choses : permettre à des documents d’être constitués d’informations qui sont « lisibles » par une machine et permettre de créer des liens avec les valeurs de la relation. Il s’agirait de développer des protocoles sécurisés sur le web qui permettraient de garantir l’isomorphisme entre le web et la réalité.

« Par exemple, un programme pourrait chercher une maison et négocier le transfert de

propriété de la maison à un nouveau propriétaire dont le cadastre garantit que le titre présenté correspond bien à la réalité ».

Si le système hypertexte public était un projet documentaire, le « système public

d’hyperdonnées » serait un projet de documentarisation à la fois des relations entre les

humains, les machines et les choses, selon une approche environnementale, à la fois cartographique et territoriale. Bien sûr, l’exemple donné par Tim Berners Lee en 1994 se veut abordable et compréhensible par tous, mais le concept de « web sémantique » reste toujours le même presque vingt ans plus tard. Comme tout concept informatique, il ne dépend toujours de ce que ses concepteurs et ses maîtres d’œuvre en font, qui le détourne, se l’approprie etc. Si le web a d’abord été un projet documentaire, il est dorénavant, avec le web dit sémantique, un projet de documentarisation.

Pour en donner un autre exemple du web de données, l’encyclopédie en ligne Wikipedia est au Web de document ce que DBPedia est au Web sémantique : Wikipedia, créée en janvier

2001, est une encyclopédie multilingue, universelle, librement diffusable, disponible sur le Web et écrite par les internautes grâce à la technologie wiki (Wikipedia). DBPedia est un projet d'extraction de données de Wikipedia pour en proposer une version Web sémantique.

(Wikipedia).

Le Web sémantique désigne un ensemble de technologies logicielles visant à relier les ressources du world Wide Web entre trois, deux ou une URI* qui décrivent une relation entre le prédicat, toujours un URI*, le sujet et l’objet, ressource du web ou non, physiques ou abstraite.

Ces URI* désigne la manière dont ces données sont utilisables par des programmes et agents logiciels et/ou matériels, qui vont communiquer, au sens d’une communication homme machine, grâce à un système de métadonnées dont la syntaxe des relations serait normalisée. Cette approche est celle du W3C avec le RDF. RDF - pour Resource Description Framework, est une structure de données constituée de nœuds et organisée en graphe. RDF est destiné à décrire de façon formelle les ressources Web et leurs métadonnées. Par exemple, comment un logiciel peut-il savoir ce dont je parle si j’écris Paris dans un moteur de recherche, la ville en France, la star, les paris sportifs ? Mais ce ne sera pas la structure de la page XML qui sera

modifiée, RDF n’étant ni un langage de programmation, ni un format de donnée. Ce sont les formes, le formalisme dans lesquels les données qu’elles contiennent pourront être manipulées d’un point de vue logiciel.

Un document RDF ainsi formé correspond à un graphe (une relation binaire), issu d’une représentation à l’aide du triptyque prédicat – sujet - objet. Chaque triplet correspond à un arc orienté dont le label est le prédicat, le nœud source est le sujet et le nœud cible est l'objet. Le projet du Web sémantique, titanesque, semble alors ne plus pendre uniquement pour pivot le document mais également les données le constituant ; il ne s’agit plus de mettre seulement des documents en réseau mais également des données. Parmi ces données, les relations entre les données font l’objet d’un enregistrement systématique et le plus possible dans la durée de la part des « grands acteurs du web ». C’est dans ce sens que Tim Berners-Lee explique aujourd’hui qu’une donnée est une relation – data is a Relationship.

Ces inventions successives illustrent la volonté de faire évoluer l’approche purement analytique des connaissances vers une approche systémique partant non plus seulement de la connaissance en elle-même, de manière plus ou moins abstraite, mais de celui qui l’utilise ou la manipule.

George Landow, Professor of English and Art History à l’Université de Brown dira de l’hypertexte qu’il fournit un système infiniment dé-centrable et re-centrable dont le point de

focalisation provisoire dépend du lecteur.175 Nous voyons ce mouvement de l’information

comme étant induit par cette dé- centralisation et cette re-centralisation : Dé-matérialisation, re-matérialisation, dé-territorialisation, re-territorialisation.

Nous comprenons alors que lorsque ce lecteur est devant un ordinateur fixe, l’information est tout aussi décontextualisée que s’il était devant un livre ou un journal. Que se passe-t-il lorsque ce n’est plus l’homme qui s’adapte à la machine pour rechercher des informations mais la machine qui s’adapte à l’homme pour lui donner accès à des informations se rapportant à la situation et au contexte où il se trouve ? Lesquelles ? Provenant de qui ?

175 LANDOW George. Hypertext 2.0 : The Convergence of Contemporary Critical Theory and Technology.

La démarche consiste à non plus se représenter le virtuel comme un ensemble de ressources numériques disponibles à travers le réseau Internet constituant un espace d’information mais appréhender l’espace, le temps, et l’espace-temps d’un point de vue informationnel et communicationnel comme constituant l’espace à travers lequel circule des informations.

Cette approche ne remet pas en cause la nature du système hypertexte public tel qu’il a été conçu dans les années 1990. A contrario de ce qu’a pu écrire Chris Anderson et Michael Wolff en août 2010, le web « n’est pas mort »176 si ce n’est son approche purement

documentaire qui le rattache à l’écran d’un ordinateur. En revanche, elle constitue une piste d’exploration parmi les plus stimulantes pour les entreprises dont le métier serait « d’informer » au sens politique du terme.

176 ANDERSON Chris WOLFF Michael. The Web Is Dead. Long Live the Internet. Wired.com, août, 2010.

3. Presse imprimée et ordiphone : documents, données et relations

Documents relatifs