• Aucun résultat trouvé

Conclusion : presse imprimée & ordiphone

CHAPITRE 2. DES DOCUMENTS ANALOGIQUES A LA DOCUMENTARISATION ELECTRONIQUE

1. Le web des documents : les messages

Lorsqu’en juillet 1945, Vanevar Bush, ingénieur américain, conseiller scientifique du président Roosevelt et chercheur au Massachusetts Institute of Technology (MIT), publie dans la revue Atlantic Monthly un article intitulé As We May Think, il anticipe l'invention de l'hypertexte et décrit un système d’information, appelé Memex, pour stocker et associer des livres, des notes personnelles, des idées afin de les retrouver facilement.

Dans le contexte d’après guerre, il s’agissait alors de proposer une machine, une « station de travail », permettant d’assembler des liens analogiques entre une quantité toujours plus importante de documents scientifiques afin d’en assurer une meilleure diffusion. L’hypertexte est donc avant tout un projet documentaire dans le but d’appréhender la complexité croissante face à l’entropie informationnelle dont l’homme est de plus en plus l’auteur et de moins en moins l’acteur. Cette vision documentaire est à rapprocher des premiers travaux sur la bibliologie effectuée en 1934 par Paul Otlet qui, dans une démarche prospectiviste, décrit un système alliant le téléphone et le « livre universel »

Dès 1962, Douglas Englebart proposa l’idée d'un ordinateur dont l’utilisateur manipule à l’écran des données symboliques à l’aide d’une souris, dont il fut l’inventeur, et d’un clavier à accord (chord keyboards), un clavier qui s’utilise en enfonçant plusieurs touches pour écrire des données. Ce système qu’il présenta pour la première fois le 9 décembre 1968 s’appelait NLS pour oNLine System. Très en avance sur son temps, oNLine System était un système hypertexte collaboratif couplé à un système de vidéoconférence (dont la vidéo de

démonstration est aujourd’hui accessible sur le site de Stanford164) et dont les caractéristiques sont bien plus évoluées que le système hypertexte public du Web d’aujourd’hui (2010).

Le terme hypertexte fut inventé en 1965 par Ted Nelson dans l’ouvrage Computer Lib/Dream

machines pour désigner un réseau constitué d’un ensemble de documents informatiques liés

entre eux et dont la principale caractéristique serait de permettre une lecture ou une navigation non plus linéaire mais tabulaire.

L’hypertexte désignerait ainsi une nouvelle façon d’écrire et de lire sur ordinateur, dans laquelle chaque unité textuelle donne lieu à un accès non séquentiel, le texte étant censé reproduire la structure non linéaire des idées par opposition au format linéaire du livre, du cinéma ou de la parole.

De 1990 à aujourd’hui, l’histoire du web est associée au micro-ordinateur, avec un écran, un clavier et une souris. Lorsque l’informaticien du CERN Tim Berners Lee invente un « système de gestion décentralisé de l’information » en mars 1989, il est destiné à la communauté des physiciens des hautes énergies. Les expériences menées à l’époque en physique nécessitaient des collaborations sollicitant plusieurs centaines de scientifiques du monde entier et trouvèrent avec le web « exactement ce qu’il leur fallait » selon le CERN. Un « système de gestion décentralisé de l’information ».

Perfectionné avec Robert Cailliau jusqu’en 1991, le code source du logiciel fut versé au domaine public le 30 avril 1993165. Ce geste du CERN en 1993 marque la véritable naissance du logiciel World Wide Web et du Consortium W3C* qui popularisa l’usage d’Internet (mail, irc, ftp, www, p2p, etc.) auprès des médias et du grand public. En 1990, la première page html est mise à disposition sur le système hypertexte public par Sir Tim Berners Lee et Robert Caillau. Le 6 août 1991, Sir Tim Berners Lee rend public le projet sur Usenet166 et le 30 avril 1993, le CERN verse les logiciels du World Wide Web au domaine public. Selon Matthew Gray167 du Massachusetts Institute of Technology (MIT), il y avait 130 sites web en juin

1993. Selon Netcraft, il y en aurait 463 millions en août 2011.

164http://sloan.stanford.edu/MouseSite/1968Demo.html

165 Le document officiel signé par les directeurs du CERN est accessible en ligne : http://tenyears-

www.web.cern.ch/tenyears-www/Declaration/Page2.html

166http://groups.google.com/group/alt.hypertext/msg/06dad279804cb3ba 167http://www.mit.edu/people/mkgray/net/

C’est également en 1993 que Marc Andreesen, un étudiant de l’Université de l’Illinois mit au point le premier navigateur web, doté d’une interface graphique, utilisant la souris, et non plus seulement le clavier (interface textuelle : Mosaic - voir chapitre 1 de la partie 1).

Selon Wikipedia, « le World Wide Web, littéralement la « toile (d’araignée) mondiale »,

communément appelé le Web, le web, parfois la Toile ou le WWW, est un système hypertexte public fonctionnant sur (via) Internet qui permet de consulter, avec un navigateur, des pages accessibles sur des sites. »

Cette définition tend à considérer le web comme une collection de « pages HTML » ou tout du moins, comme un espace documentaire. Le système hypertexte public est un logiciel qui articule HTTP, HTML et URI où HTTP est l’Hypertext Transfer Protocol (soit Protocole de transfert hypertexte), HTML est l’Hypertext Markup Language (soit langage de balisage hypertexte), et URI est l’Uniform Resource Identifier (soit Identifiant uniforme de ressource – auparavant, le U voulait dire Universel).

Comme nous le verrons, les évolutions du logiciel impulsées dès 1994 par Sir Tim Berners Lee changent la nature de son fonctionnement et font l’objet d’une approche où le contenu est « manipulable » non plus seulement par des humains mais aussi par des machines.

À ses débuts, le World Wide Web permettait de consulter des documents HTML identifiés par leur localisation sur le réseau (le L de URL (Uniform Resource Locator). D’autres ressources étaient identifiées par le nom (le N de Uniform Ressource Name). Aujourd’hui, un URI* (Uniform Resource Identifier) est une séquence compacte de caractère qui identifie une

ressource abstraite ou physique168 sur un réseau, par exemple une ressource web et dont la

syntaxe respecte la normalisation des protocoles de communication d’Internet. Un URI* peut être classé comme localisateur, comme nom, ou les deux. Un identifiant de ressource uniforme (URI*, Uniform Ressource Identifier) fournit un moyen simple et extensible d’identification d’une ressource169.

168http://tools.ietf.org/html/rfc3986

Une ressource du World Wide Web désigne les référents des URI (RFC170 3986), et plus récemment des IRI (RFC 3987). IRI, pour Internationalized Resource Identifier (Identificateur de ressource internationalisée) est une extension des jeux de caractères ASCII (les nombres de 0 et 9, les lettres de A à Z et quelques caractères spéciaux) aux jeux de caractères Unicode (Unicode est une norme informatique dont l’objet est de donner à tout caractère de n’importe quel système d’écriture un nom et un identifiant numérique171) et qui permettent d’écrire l’ensemble des caractères de tous les systèmes d’écritures inventés par les hommes dans toutes les cultures (arabes, asiatiques, latines etc.).

Avant 1995, le web est essentiellement utilisé par la communauté d’informaticiens dont il est issu, des universités ayant participé à la construction du réseau Internet et de leurs étudiants. A l’époque, la mise à disposition sur le système hypertexte public d’une page HTML par un informaticien correspond souvent à une liste de liens pointant vers ses pages préférées. Il est particulièrement complexe de se repérer et naviguer entre les ressources documentaires du web et se développe très rapidement deux types de services : les annuaires, dont Yahoo (1994) reste encore aujourd’hui l’emblème, et les moteurs de recherche, avec Altavista en décembre 1995, puis Google en 1998.

Usages du world wide web

Des débuts du web aux années 2000, le web est essentiellement utilisé comme un média de diffusion, à l’instar des médias de masse, permettant, non plus seulement à des professionnels de la communication mais à des chercheurs, des entreprises, des organisations, des administrations de publier des documents html sur le système hypertexte public.

A partir des années 2000, de nouvelles formes de documents émanant cette fois-ci d’un public de plus en plus large constitué non pas de professionnels mais d’individus. Ce sont tout d’abord le marché des blogs ouvert par Blogger en 1999 ou encore Skyblog en France à partir de 2002. Les wiki172 avec Wikipedia lancé en janvier 2001. Les réseaux sociaux avec

170 Wikipedia – RFC : Les requests for comments (RFC), littéralement « demande de commentaires », sont

une série numérotée de documents officiels décrivant les aspects techniques d'Internet, ou de différent matériel informatique (routeurs, serveur DHCP). Peu de RFC sont des standards, mais tous les standards d'Internet

publiés par l'IETF sont des RFC. Le premier RFC date de 1969.

171http://fr.wikipedia.org/wiki/Unicode

172 Un wiki est un site web dont les pages sont modifiables par les visiteurs afin de permettre l'écriture et

MySpace en 2003, Facebook en 2004, Twitter en 2006. Les vidéos avec Youtube en mars 2005 et Dailymotion en même temps.

Le système hypertexte public est alors utilisé comme un espace documentaire où le contenu provient à la fois de professionnels de la communication et d’individus, ce qui ne manque pas de poser quelques problèmes lorsque des individus publient des contenus provenant de professionnels de la communication.

Indexation des documents : centralisée, collective

De plus, les méthodes permettant d’indexer les documents ont évolué des pratiques scientifiques, identifiées par Otlet en 1934 et de nouvelles pratiques, commerciales, issues des services web des annuaires et des moteurs de recherche.

A côté de ces indexations scientifiques ou commerciales se sont également développées des pratiques d’indexations sociales, où ce sont les individus qui « marquent » (tag) le contenu dont ils sont à l’origine. Comme le disent Olivier Ertzscheid et Gabriel Gallezot, si la période des années 1990 aux années 2000 est d’abord celle de savoir « quoi indexer », celle ouverte à partir des années 2000 ajoute à l’équation « qui » indexe173.

Dès le début du Web en 1990, le doux rêve d’une indexation à la fois au sens social et au sens informatique des termes est porté par une communauté scientifique à l’origine de la Toile. En 2001, Tim Berners-Lee, Ora Lassila et Jim Hendler publient dans Scientific American « The

Semantic Web ; a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities » et qui sera la prochaine étape du développement du web : le

Web sémantique.

Ward Cunningham pour réaliser la section d’un site sur la programmation informatique, qu’il a appelé

WikiWikiWeb. (Wikipedia : wiki).

173 Etude exploratoire des pratiques d’indexation sociale comme une renégociation des espaces documentaires. Vers un

Documents relatifs