• Aucun résultat trouvé

Représentation des connaissances et convergence numérique : le défi de la complexité

N/A
N/A
Protected

Academic year: 2022

Partager "Représentation des connaissances et convergence numérique : le défi de la complexité"

Copied!
16
0
0

Texte intégral

(1)

et convergence numérique : le défi de la complexité

Dominique Cotte

Sciences de l’Information et de la Communication, Université de Lille 3.

cotte@univ-lille3.fr

RÉSUMÉ. La représentation des connaissances fait appel soit à une logique classificatoire soit à une logique de marquage. Les contraintes éditoriales, notamment celles liées à la convergence technologique et à la multidirectionnalité de l’information vers différents supports obligent à penser des systèmes permettant de gérer cette complexité. La banque de données multimédia peut être l’un de ces systèmes.

ABSTRACT. Knowledge organisation implies either classification or tagging. Editorial necessities, especially those linked to technological convergence, and multi-support, oblige to imagine new systems able to take in account this complexity. Multimedia database may be one of those systems.

MOTS-CLÉS : multimédia, banque de données, édition numérique, classification KEY WORDS: Multimedia, Database, Digital document, Classification

(2)

1. Les enjeux de la représentation des connaissances dans le cadre de l’écriture informatique

L’idée que la représentation des connaissances est forcément bouleversée par les technologies numériques est un des points-clés de la nouvelle anthropologie des savoirs. Cependant, le concept de « représentation des connaissances » est en lui- même ambigu, dans la mesure où la connaissance est déjà un système de représentation du monde. Le plus souvent, lorsque l’on fait référence à cette notion, on désigne la nécessité de traiter les objets qui servent eux-mêmes à déposer, à sédimenter la connaissance acquise ou en train de se faire : les documents.

De la bibliothèque d’Alexandrie au multimédia, la problématique fondamentale n’a finalement guère changé ; il s’agit toujours de redoubler un contenu donné au départ, sous une forme nouvelle et ramassée, à des fins de conservation et/ou de communication. Que les techniques utilisées s’appellent catalogage, indexation, balisage, description, analyse, résumé, etc. ne change finalement rien à cette donne initiale. Un objet A (rouleau, tablette, livre, article, disque, « page » web) suscite et génère, à des fins de description et/ou de localisation (les deux aspects étant bien sûr intimement mêlés), un objet B (catalogue, fiche, notice bibliographique, champ de base de données, balise, etc.)

La rupture historique qui intervient avec le numérique réside dans le fait que les objets A et B, s’ils restent distincts sur le plan logique et dans leurs fonctions réciproques, sont fusionnés sur le plan matériel et physique. La base et ses données, le fichier HTML ou XML et ses balises, le cédérom avec son moteur d’indexation font partie de ces objets contemporains qui intègrent à la fois les éléments de contenu du document et les moyens de leur interprétation logique. Même lorsque les différents éléments sont formellement dissociés, comme dans le cas d’un catalogue ou d’un annuaire informatisé, par exemple sur le web, la possibilité de pointer vers le document initial et de l’afficher immédiatement tend également à l’unification des médias, du moins en apparence.

Toute la difficulté consiste à mesurer ce qui se passe réellement lors du transfert du contenu de A vers le métacontenu de B, et les éventuels décalages qui s’instaurent. Tous les documentalistes du monde connaissent cette difficulté, qui d’ailleurs ne transparaît réellement que lorsqu’un tiers (l’utilisateur) doit utiliser le métacontenu de B pour « remonter » vers l’objet initial A. Tous les problèmes liés à la représentation, à la contextualité, à la préconstruction culturelle apparaissent alors. Il est évident pour les lecteurs de cette revue que ce serait une illusion de croire que la seule technologie peut lever les difficultés énoncées ci-dessus.

Pourtant, il s’agit là d’une illusion récurrente, véhiculée entre autres par les concepteurs et fabricants de solutions matérielles et logicielles, mais pas seulement.

Or, le décalage entre les promesses du traitement automatique (que celui-ci concerne la traduction, l’indexation ou toute forme de représentation des contenus) et ses réalisations effectives reste grand. L’approche que nous proposons ici consiste à postuler que, au-delà des moyens techniques de mise en œuvre des modes de

(3)

représentation, ceux-ci sont « philosophiquement » et anthropologiquement limités, et limités particulièrement à deux grands types : la classification et le marquage. Le premier type relève d’une logique exogène, le second d’une logique endogène. En ce sens, ils ne s’excluent pas, mais peuvent se compléter. La classification intervient en effet du dehors par rapport à l’objet concerné. Ceci peut sembler trivial, mais pour classer, il faut bien disposer d’un objet ou plutôt d’une série d’objets à classer.

Il peut s’agir d’objets intellectuels comme d’objets physiques. Ce faisant les

« technologies intellectuelles » contribuent à organiser la réalité et à fournir une certaine construction du monde. L’anthropologue Jack Goody a souligné par exemple le rôle des listes et des tableaux dans l’organisation des premières représentations ordonnées permises par l’écriture. Historiquement, les grands moments où triomphe la logique classificatoire sont aussi des époques valorisant une idéologie du progrès et de la rationalité scientifique : les Lumières, le positivisme. Ce n’est pas un hasard si les grands outils de classification utilisés en bibliothéconomie datent du XIXe siècle et sont contemporains de l’entreprise comtienne. Ce n’est pas un hasard non plus si la volonté de fluidifier la trop grande rigidité du modèle classificatoire émane d’un indien, Ranganathan, héritier d’un autre système philosophique. Car la classification, pour nécessaire qu’elle soit, en même temps, mutile1. Classer en Y c’est nier que Z soit meilleur représentant de l’objet désigné. Or, nombreuses sont les thématiques qui ne se satisfont, ni tout à fait de l’un ni tout à fait de l’autre. Pourtant il faut trancher. Nous verrons plus loin que les technologies de l’écrit numérique permettent une combinaison entre la pure logique de classification et certaines techniques de marquage, palliant en partie l’inconvénient.

La logique classificatoire induit un certain type de représentation, que l’on retrouve aussi bien dans les tableaux utilisés en philosophie que dans les représentations informatisées modernes. Proche d’une logique binaire, d’un choix successif permanent entre deux options exclusives, l’arborescence par exemple est une des représentations formelles de la logique de classification. Sur le plan visible, les interfaces graphiques de type Mac ou Windows avec l’organisation de leurs dossiers, les cédéroms, les services Minitel, et pour partie les pages web (sans oublier le gopher à la préhistoire de l’internet) relèvent de cette logique et la mettent en œuvre. D’une certaine manière (mais nous y reviendrons), l’arborescence devient même un mode de réalisation prédominant des sites web, au détriment de l’hypertexte au sens véritable du terme, qui ne subsiste le plus souvent sur la toile, que sous la forme édulcorée de ce que l’on pourrait appeler un « système à liens », bien loin du concept de l’hypertexte originel. La logique même de la programmation des sites, avec leur point d’entrée au moyen d’une page d’accueil (index.html), à

1. Dans ses « Notes brèves sur l’art et la manière de ranger les livres », Georges Pérec résume dans un style inénarrable le problème rencontré par le classificateur, notamment lorsque l’on s’est fixé une finitude. « Au nom de l’achevé, nous voulons croire qu’un ordre unique existe qui nous permettrait d’accéder d’emblée au savoir ; au nom de l’insaisissable, nous voulons penser que l’ordre et le désordre sont deux même mots désignant le hasard » [PER 85].

(4)

partir de laquelle divers liens pointent sur des rubriques spécifiques, induit ce retour de l’arborescence2. En tant que traduction visuelle d’une classification, l’arborescence souffre des mêmes limites que cette dernière, à savoir les limites d’une logique hiérarchique. Nous avons déjà évoqué le problème de l’exclusion, une autre difficulté est celle de la transversalité. Déjà à l’époque du Minitel, les concepteurs butaient sur cette question, et ont introduit ce que l’on appellerait, dans un autre contexte, des nœuds, afin de permettre à l’utilisateur de bifurquer à tout moment d’une branche de l’arbre vers une branche transversale. La présence, dans les parties latérales de l’écran videotex, de bannières permettant d’appeler une commande vers un autre secteur du service préfigure d’ailleurs, dans un autre environnement technologique, la présence des cadres (frames) dans le web contemporain. Rappelons d’ailleurs que les cadres sont apparus sous la pression de l’usage et que les premiers manuels de conception de pages web en HTML, antérieurs à la version 4 de ce langage, déploraient cette astuce qui n’était pas considérée comme élégante ni conforme à l’esprit de l’application.

D’une certaine manière, assurer la transversalité de la navigation dans l’application, c’est faire appel à cette autre technique de représentation : le marquage. Nous appellerons marquage toutes les techniques visant à parsemer le document d’indices permettant de se repérer dans son contenu et de s’émanciper de la linéarité de l’exposition. A ce titre, le marquage n’est pas forcément purement informatique. La note de bas de page, l’appel d’index font partie de l’arsenal des stratégies de marquage. Avant même l’imprimé, la glose du manuscrit médiéval ou l’utilisation de couleurs pour le repérage, font aussi partie de cette logique du marquage. Mais si le marquage est avant tout visuel dans le document imprimé, il peut être invisible et de nature purement logique dans le document informatique.

Celui-ci peut mettre en œuvre plusieurs formes de marquage.

Le marquage absolu, tel qu’on pourrait qualifier la technique mise en œuvre dans les technologies de la recherche en texte intégral (full-text), consiste à faire de chaque chaîne de caractères distincte (à l’exclusion des mots vides, mais pour des motifs qui relèvent d’un traitement syntaxique) un élément d’appel pour une recherche ou de renvoi vers une chaîne équivalente. Dans un texte numérique, chaque terme peut être considéré comme un marqueur, avec les problèmes soulevés que l’on connaît : bruit, ambiguïté sémantique, etc. D’où l’apparition, d’ailleurs non exclusive avec la première forme, de techniques de marquage relatif : la désignation, à l’intérieur même du document de marques spécifiques permettant de le structurer. Appartiennent à la technique du marquage relatif tous les langages à balise (SGML, HTML, XML, etc.) qui permettent d’isoler à l’intérieur d’un document des zones particulières répondant à sa structuration visuelle, soit pour une destination imprimée, soit pour une destination informatique (écran du Minitel, du micro-ordinateur, voire du téléviseur). Nous avons pu relever3 que cette logique

2. De la même manière les éditeurs wysiwyg de sites web, comme par exemple Frontpage de Microsoft, contraignent l’utilisateur à rentrer dans une logique arborescente.

3. [COT 99]

(5)

impliquait un travail d’explicitation, alors que la mise en page graphique, telle que nous la connaissons dans le support imprimé, relève, culturellement, de l’implicite.

Un titre se laisse appréhender comme tel, et revêt une signification sémiotique particulière, sans qu’il soit nul besoin de préciser sa nature. Or, le document balisé, étant destiné à une première « lecture » machinique avant d’être livré à la lecture humaine, doit comprendre des signaux redondants, destinés à la machine. C’est la fonction d’une balise de titre (<TITLE>…</TITLE> dans le langage HTML) par exemple. Nous avons exposé, dans un précédent numéro de cette revue comment ces technologies de marquage représentaient une intégration de la représentation documentaire au cœur même du document4. Cette internalisation de la structure du document est une des caractéristiques fondamentales du document numérique5.

Au-delà du renouvellement des moyens mis en œuvre, l’analyse montre que l’on retrouve toujours ces deux invariants. L’écriture informatique, dans la mesure où elle repose sur un dispositif machinique fondé, au départ sur le calcul, contribue à magnifier ces deux types de représentation. Elle facilite l’usage de l’arborescence, car l’unité d’information enserrée dans le cadre limité de l’écran se trouve placée au milieu d’autres unités d’information avec lesquelles elle doit entretenir un système de relations logiques. Parmi celles-ci, la classification s’impose avec évidence. Elle facilite aussi l’usage du marquage, comme moyen de repérer très rapidement au sein d’un vaste corpus, des éléments compris dans un texte.

Ce qui se passe, au fond, c’est que l’on retrouve sous des noms différents (indexation, banques de données, hypertexte, balisage) la même manière d’organiser la représentation de la réalité. Cependant, les deux aspects ne sont pas forcément antinomiques. Le marquage, dans la mesure où il sert à nommer, vise aussi à inscrire dans un ordre et donc à classifier. Dans la typologie des outils que nous décrirons, la banque de données, par exemple, mixte les deux approches, dans la mesure où elle est un contenant formé de champs qui servent à marquer l’information, mais aussi à classer les contenus.

2. Convergence numérique et contraintes éditoriales

Le terme de « convergence » n’est pas toujours employé dans le même sens par les différents acteurs. Notamment, il importe de se demander si l’indéniable convergence technique en matière de technologies de l’information, induit

4. [COT 98]

5. « Plus un document numérique est riche, plus il a besoin de structuration pour faciliter le repérage de l’information. Or, contrairement à l’écrit traditionnel ou aux enregistrements analogiques dont l’articulation est visible et peut être relevée et détaillée après coup, posément, lors d’une lecture ou d’un visionnage du document, le document numérique, lui, exige d’être structuré dès sa création, faute de quoi l’information ne peut même pas être enregistrée. C’est pourquoi, les logiciels associent de plus en plus l’auteur du document à la formulation de ces éléments de structuration qui constituent dès lors également des éléments de description. » [CHA 00]

(6)

forcément une convergence des usages. Sur ce point, nous nous méfierons du discours des industriels, qui, à partir de la mise au point de normes techniques, attendent l’émergence d’un outil à tout faire, véritable « couteau suisse numérique » aux multiples utilisations. Cette convergence-là (en gros entre le micro-ordinateur, le poste de télévision et le téléphone) n’est pas garantie, tandis que la première relève aujourd’hui de la certitude. Nous voudrions ici soulever quelques problèmes particuliers que la convergence numérique met à l’ordre du jour dans le domaine de notre champ de recherches qui est celui de la configuration du document électronique et des contraintes induites au plan de la représentation des connaissances.

D’un bout à l’autre d’une chaîne éditoriale quelle qu’elle soit, les éléments destinés à la communication au public (textes, images, vidéos, sons, éléments de mise en page) font l’objet d’une homogénéisation croissante sur le plan technique, sinon tout à fait encore sur le plan de la normalisation et des formats. Le problème est que l’on retrouve une hétérogénéité, elle aussi croissante, du côté de la réception du document. Si l’imprimé a eu un caractère normalisateur6, c’est parce que l’interface de réception était fixée (nonobstant les rééditions et les changements de format afférents) de manière durable et commune à tous les utilisateurs potentiels.

Or, le document numérique pourrait être qualifié de document « matrice », qui requiert, pour s’exécuter, un dispositif technique particulier, qui ajuste la forme finale du document en fonction des contraintes qui lui sont spécifiques. D’où une réception différente selon les équipements de l’utilisateur, soit au plan logiciel (l’exemple le plus évident est celui des navigateurs du web et de leur interprétation graphique différente – polices de caractère, etc. – d’un même fichier HTML), soit au plan matériel (transfert d’un même document vers le web, l’imprimé, le wap, etc.).

Cette caractéristique implique que le créateur d’un document numérique quel qu’il soit doit faire preuve d’un fort esprit d’anticipation ; il ne s’agit pas seulement de se représenter un lecteur comme dans le cas de l’écriture « classique », il s’agit de se représenter ce lecteur appareillé, et de prendre en compte la multiplicité des appareillages possibles. Certes, l’anticipation est toujours partie intégrante du processus de création, puisqu’il s’agit de prévoir comment se déroulera le processus que Michel de Certeau7 appelle « l’effectuation » de la part du lecteur. En même temps, il existe toujours un décalage entre l’intention de l’auteur et les conditions de la réception par le lecteur. Mais nous avons vu que ce qui différenciait fondamentalement le texte numérique de toutes les formes qui l’ont précédé, c’est qu’il est un espace restant ouvert tout au long du processus mettant en relation l’auteur et le lecteur. Il n’y a plus d’un côté une phase de création/réalisation/fabrication, de l’autre l’ouverture d’un espace de lecture, il y a au contraire un continuum. Si ce continuum est forgé, au départ par des considérations d’ordre technique, il importe ici d’en dégager le fonctionnement épistémologique.

6. [EIS 91]

7. [CER 90], p. 251.

(7)

Dans la création propre au numérique ou à l’hypermédia, l’anticipation du déroulement de l’œuvre doit impérativement précéder son écriture. L’écriture

« interactive » commence avant l’écriture même. On se rapproche ici des conditions de production de l’œuvre audiovisuelle, qui superpose trois écritures :

– une écriture préalable, prévisionnelle qui encadre minutieusement les étapes de la constitution de l’œuvre8 ;

– une écriture visuelle qui utilise les conditions technologiques précises de l’appareillage cinématographique (lumière, cadrage, prise de son, etc.) pour retranscrire ce qui a été prévu au niveau de la première écriture ;

– une écriture postérieure qui réagence les éléments visuels obtenus en b) pour aboutir à la physionomie définitive de l’œuvre.

A ces trois strates d’écriture correspondent respectivement les phases du scénario, du tournage et du montage. On sait que le montage représentait, pour les cinéastes russes des années 1920 (Eisenstein, Vertov, Koulechov) le moment d’une véritable écriture cinématographique qu’ils assimilent en partie à l’écriture idéographique9. Il s’agit, par exemple en montrant successivement deux objets, de suggérer une idée par le seul rapprochement de ces objets. Koulechov s’est ainsi rendu célèbre en voulant montrer qu’une image insérée dans un dispositif filmique ne voulait rien dire en soi, puisque son sens découlait de « l’avant » et de

« l’après », autrement dit qu’elle ne prenait toute sa force que dans le déroulement temporel des images qui la précédaient et la suivaient.

C’est ainsi que dans un exemple resté connu sous le nom d’« effet Koulechov », il intercalait le même plan d’un acteur, photographié sans expression particulière, entre deux plans d’enterrement, puis entre deux plans de fête (une noce villageoise) ; dans chacun des deux cas, les spectateurs étaient prêts à jurer que cet acteur savait à la perfection mimer (n’oublions pas ici la dimension essentielle liée au caractère non parlant du cinéma en question) la peine, puis la joie. Or, il ne s’agissait que d’interprétation de la part du spectateur, puisque dans les deux cas, on avait repris le même plan.

D’une certaine manière l’auteur « multimédia » doit, tout comme le réalisateur de films, intégrer la dimension temporelle dans son activité « d’écriture ». De même qu’il n’est pas indifférent, dans le cas du film, de prévoir ce qui va venir après l’image, de même l’auteur multimédia doit prévoir l’action que le lecteur pourra engager à chaque instant de sa consultation. Deux principes se rencontrent ici, au point parfois de se heurter. Un principe technique d’abord : il faut qu’informatiquement

« cela tourne », et que l’action engagée (clic sur un bouton, sur un lien) ne mène pas à une impasse ou à autre chose qu’au résultat attendu. Un principe de discours

8. Cf. A ce sujet l’intéressante retranscription des cours donnés par Eisenstein, fournis par son élève Vladimir Nijny [EIS 89].

9. [MET 92], p. 204.

(8)

ensuite : il faut que les enchaînements conservent entre eux une cohérence logique, ou encore une rhétorique qui, par bien des aspects, reste encore à inventer10.

Cette hétérogénéité sur le plan technique est un premier facteur de complexité, mais il n’est pas le seul. Le passage du monde de l’édition, au sens large, au « tout numérique », soulève également des problèmes importants en matière de stratégie éditoriale. L’un des observateurs les plus pertinents du monde des médias américains, Steve Outing11, estime à juste titre que les médias ne se caractériseront plus bientôt par le support de diffusion de leurs contenus (quotidiens, magazines, radios, télévisions), mais doivent devenir des information companies, produisant une matière première qui viendra à la rencontre de l’utilisateur à travers différents canaux. Naturellement, chacun de ces canaux particuliers appelle une forme d’écriture différente, notamment sur la plan du style. Mais ce n’est pas cet aspect-là que nous relèverons ici. Au-delà de la question de la lisibilité se pose celle de l’organisation interne du document, et notamment de l’intégration de formes de représentation adéquates, non seulement à chacun des supports de destination, mais également au document servant de matrice à l’ensemble. Cette « multidirectionnalité » du document constitue un autre facteur, autrement redoutable, de complexité. Elle crée en effet une nouvelle dimension de l’information qui participe de l’organisation globale, et du document, et de sa représentation.

Soit un document numérique servant de matrice à plusieurs expressions sur plusieurs supports. On y distinguera, d’une part des contenus, récurrents, d’autre part, des éléments de mise en forme qui, eux, varient, suivant le support de destination concerné. Autrement dit, un même « contenu" peut se voir exprimé de plusieurs façons différentes, chacune étant nécessaire en fonction d’un canal de diffusion spécifique. La notion de taille d’un message est celle qui paraît la plus évidente au premier abord pour exprimer cet exemple. Un message destiné à être édité simultanément sur une page web et sur un écran wap par exemple, le sera quasi-nécessairement en deux versions, une longue et une courte. Rappelons que l’écran du téléphone mobile, vecteur de diffusion de la technologie wap, n’accepte que quatre à cinq lignes de 16 caractères maximum, soit un message de 64 à 90 caractères, six fois moins de ce que peut supporter une page, déjà restreinte, d’un écran minitel. Dès lors, il s’agit de gérer non seulement l’information elle-même, non seulement encore les éléments de sa représentation (par exemple des balises invisibles servant à la décrire, comme c’est le rôle des tags META dans le langage HTML), mais encore ce que l’on pourrait appeler une « information fonctionnelle sur l’information » : vers qui, vers quoi, à quel moment, sous quel format, etc. Nous préciserons plus loin le système qui, à notre sens permet le mieux de gérer ces contraintes. Mais la taille du message en tant qu’élément purement quantitatif, n’est pas le seul aspect à prendre en compte, le libellé par exemple est également affecté par le support de destination. Il en ressort que l’écriture informatique doit être multiple, intégrer au départ les contraintes d’une réception plurielle.

10. [BRI 97]

11. Steve Outing, « Stop the presses ! », http://www.planetarynews.com

(9)

On notera que, dans ce contexte, on passe d’une logique de l’implicite à une logique de l’explicite. Notre compréhension visuelle d’une page imprimée, du moins dans la culture qui est la nôtre, forgée par plus de cinq siècles de fréquentation du livre et compte tenu de l’évolution historique de celui-ci, n’a pas besoin de mettre les mots sur les choses. Un titre s’impose visuellement comme une partie importante d’un texte, et, du même coup, son contenu prend une certaine valeur qu’il n’aurait pas s’il était situé autrement dans la page (et qu’il perd lorsqu’il est retranscrit en caractères ASCII simples comme dans le cas des banques de données en texte intégral). Or, le passage par la machinerie numérique implique qu’un certain nombre de choses soient explicitées et que la structure profonde du document coexiste avec son apparence. Il faudra préciser au système que ceci est un titre, ceci est une image, ceci est un chapeau, ceci est une signature. Cette mise à jour de la structure peut emprunter deux méthodes, différentes dans leur fond et leur forme, mais qui répondent à des objectifs similaires. L’objet « champ » de la base de données et l’objet « balise » des langages à balises sont autant de moyens d’énoncer ce qui, dans d’autres circonstances saute aux yeux et qui fournit à l’écrit numérique à la fois ses richesses et ses contraintes. Parmi les contraintes générées par l’écriture numérique, l’une des moindres n’est pas celle qui consiste à produire une information supplémentaire, une « information sur l’information », nécessaire pour la bonne appréhension du résultat. Prenons un exemple banal, celui d’un fichier de sociétés. Si l’on fait confiance au seul ordre alphabétique comme moyen de classement, des sociétés comme 3M apparaissent en tête de liste, tout simplement parce que, par défaut, le système aura placé en premier ce qui est en deçà de l’alphabet : le chiffre. La simple création d’un champ « Mot directeur » dans lequel on aurait entré la valeur « Trois M » et sur lequel se serait effectué le tri, aurait résolu le problème12.

3. L’hypertexte, vraie ou fausse réponse ?

Doit-on qualifier l’hypertexte parmi les technologies de « marquage » ?

L’hypertexte apparaît aujourd’hui, y compris dans des versions « dégradées « tels que les liens apparaissant dans les pages HTML du World Wide Web, comme une structure s’imposant quasi automatiquement dans tout type de document électronique. Son apparente facilité de maniement en fait une sorte de panacée, qui aurait résolu tous les problèmes de « navigation « au sein d’un corpus, problème lui-même posé par l’accroissement phénoménal des sources et des documents disponibles sous forme électronique. Ainsi, en même temps que naissait un problème lié à l’évolution de l’informatique, serait apparue une solution permise par

12. Sans cette méta-information, Louis XIV par exemple, n’est pas reconnu comme le quatorzième dans la suite des Louis, mais comme Louis /X/I/V/ et classé comme tel selon la logique des chaînes de caractères. Dans ce cas précis, il conviendrait d’utiliser un champ caché pour gérer l’information servant au classement, afin de ranger les « Louis » dans le bon ordre, sans faire confiance au classement alphabétique.

(10)

le même appareillage. La réponse n’est cependant pas aussi simple, d’une part parce que l’on peut se demander si l’hypertexte est réellement une notion « informatique » ou à relier obligatoirement à un appareillage de type informatique, d’autre part parce que ledit appareillage propose d’autres modes de structuration des écrits que l’hypertexte, comme par exemple la banque de données dont nous parlerons plus bas. Quel que soit, donc, l’intérêt de l’approche théorique représentée par l’hypertexte, nous pensons qu’il est nécessaire de faire un détour critique vis-à-vis de ce concept, avant d’en examiner la portée.

La question a été posée, notamment par Jean-Pierre Balpe13 de la liaison explicite du concept d’hypertexte avec la technologie informatique. Ce débat, à notre sens, ne sera pas tranché si l’on ne sort pas du cadre de références concerné.

Tout dépend du fait que l’on considère l’hypertexte comme une technologie d’écriture, ou comme un procédé de lecture14. En tant que procédé de lecture, l’hypertexte semble répondre à l’une des exigences, au moins, de la « lecture savante « qui est de pouvoir travailler sur un corpus ouvert et d’activer un système complexe de références internes ou externes à ce corpus. Il n’est pas de corpus intellectuel qui soit irrémédiablement fermé. La connaissance est totalisante et tout corpus agit comme un système de références lui-même en relation avec un (plusieurs) autre(s) système(s) de références. Dès lors, le réseau mental que se crée l’individu, ou une collectivité de penseurs ou d’auteurs, à la fois à travers l’espace de la littérature qui le concerne et à travers le temps de l’histoire de sa discipline ou du sujet qui l’intéresse valent comme expression d’une « transtextualité » que l’hypertexte moderne saurait rendre de manière à peu près adéquate. Cependant, si c’est le cas, on pourra qualifier d’hypertexte à peu près toute organisation mettant en relation un corpus ou fragment de corpus avec un autre. Une bibliothèque, comme lieu physique serait un hypertexte fonctionnant convenablement dans l’espace. Dans ce cas-là, l’hypertexte ne traduirait rien de bien nouveau.

En revanche, en tant que technologie d’une écriture particulière, qui ne se situe pas simplement dans l’action du lecteur, ni dans sa construction personnalisée d’un corpus évolutif qui le concerne personnellement, l’« hypertexte » doit se baser sur un système technique propre. S’il faut produire une écriture, il faut les moyens matériels de cette production. Ceux-ci pourraient-ils être autre chose que l’ordinateur ou l’informatique ? Selon les racines que l’on donne au concept moderne d’hypertexte, on privilégiera la notion d’outil conceptuel indépendant d’une plate-forme machinique quelconque, ou, au contraire, on reliera explicitement cette forme d’écriture à l’informatique.

13. Jean-Pierre Balpe s’insurge à juste titre contre le fait que l’on rapproche l’hypertexte moderne de la circulation de la lecture dans des supports anciens comme le manuscrit [BAL 90].

14. « Toutefois, toute analyse des discours relatifs à l’hypertexte ne pourra s’abstenir de se demander si l’on parle d’un concept abstrait (appelons-le “hypertextualité”), d’un système informatique (“hypertexte”) idéal ou réel ou d’un produit (le livre électronique, encyclopédie, musée virtuel, etc.) généré à l’aide de tel ou tel système (“hyperdocument”) »[BRI 97].

(11)

Ce qui rend problématique la démarche de l’hypertexte, c’est que celui-ci se veut philosophiquement « déstructurant ». En ce sens il est permis de se demander si l’hypertexte n’est pas fondé – en partie – sur un malentendu, car ce qu’il propose finalement est une autre forme de structuration du texte. Mais, ce faisant, l’hypertexte ne peut s’émanciper des éléments de base qui structurent le document.

C’est dans leur agencement qu’il peut, éventuellement, se montrer novateur, mais il doit nécessairement avoir recours, avant cela, à la même activité de décomposition.

Ce que propose au fond l’hypertexte, c’est de constituer « l’hypergraphe » ou

« l’hyperframe » d’un texte, ou de plusieurs textes. Ici, la notion de pluralité se révèle fondamentale car, contrairement à l’extraction des schèmes qui peut se faire par la seule activité intellectuelle, l’hypertexte mis en pratique suppose la machine.

En effet, établir un graphe sur plusieurs textes suppose leur concomitance physique, et donc l’existence d’une mémoire électronique capable de servir de support. Ce n’est que par une analogie en quelque sorte rétrospective que l’on a trouvé de l’hypertexte « naturel » dans le fonctionnement spontané du lecteur qui agence les différents éléments grappillés au cours de ses travaux.

En ce sens, la singularité de l’hypertexte serait d’être indépendant de tout système technique, indépendant, au sens strict, de la machine. Il a été souvent souligné (et c’est bien la problématique de Bush, qui ne présuppose pas l’informatique, inexistante comme telle à l’époque de la rédaction de l’article d’Atlantic Monthly) que l’hypertexte n’impliquait pas de système informatique particulier. Le renouveau du concept dans les années 1970 est certes basé sur la mise à disposition d’outils permettant de tracer informatiquement les liens caractéristiques de cet outil, et surtout la mise à disposition de corpus électroniques, mais il s’agit là plus du domaine de l’application que du domaine de la conception théorique.

Le statut de la machine dans le fonctionnement de l’hypertexte est radicalement différent de celui que nous avons pu mettre en relief dans le cadre de la rédaction électronique. La machine intervient de l’extérieur sur un corpus qu’elle ne contribue pas fondamentalement à structurer, même si, dans un contexte technologique particulier, elle est indispensable pour activer physiquement les liens établis conceptuellement.

L’insertion de balises dans le texte, et la fabrication des liens, soit par un auteur, soit à la demande du lecteur, contribuent-ils à combler ce fossé ? D’une certaine manière, introduire un lien dans un texte vers une autre partie de celui-ci, revient à effectuer un travail proche de l’indexation. La différence est que l’index n’existe pas ici comme un troisième terme extérieur aux deux autres, dont il est le référent, mais s’insère dans le texte lui-même, comme une composante de celui-ci. Lorsque cette dimension d’indexation est exclue, et qu’il s’agit seulement d’indiquer un cheminement entre deux parties, on peut parler d’un lien « de type hypertexte ».

Or, la présence d’un lien « de type » hypertexte ne suffit pas à engendrer un nouveau type de lecture, ni à caractériser la construction intellectuelle du corpus

(12)

comme un « hypertexte ». On peut les appeler des liens d’activation interactive ; à ce titre ce ne sont ni plus ni moins que les « boutons » de n’importe quelle application informatique de l’ère Mac/Windows, autrement dit dès lors qu’une interface graphique est capable d’habiller derrière un signe visuel une requête informatique de type « Go to », « Search », « Edit », etc.)

Supposons en revanche que l’on aille encore plus loin dans la décomposition du texte en « granulats » qui pourraient être des paragraphes (le paragraphe étant une unité de découpage du texte héritée de l’imprimerie), ou plus justement des unités d’information thématiques. Sans atteindre l’infini, cette multiplication des unités et des liens peut représenter un nombre considérable de combinaisons.

Supposons un ouvrage consacré à un thème donné, que l’on découpe en unité élémentaires d’information. Ces unités se déploient, dans le mode imprimé selon une certaine séquence qui fait sens car on a souhaité un certain déroulement de l’argumentation. Mais ce qui se trouve agencé d’une certaine manière conforme aux possibilités de la logique de l’imprimé rencontre également des limites elles-mêmes inhérentes à cette logique.

Par exemple, le fait de devoir séparer dans le temps de la lecture différents éléments logiquement reliés entre eux qui figurent à des espaces différents de l’objet livre. Là on parle de la Grèce antique, là de la philosophie, là d’un philosophe particulier. Supposons que l’on souhaite, lorsqu’il est question de telle école de philosophie, consulter d’un seul coup les notices concernant tous les philosophes concernés par cette école. Dans ce cas, l’activation d’un lien génère, par appel de différentes unités élémentaires d’information, un texte qui est, au sens strict du terme « virtuel ». C’est-à-dire que ce texte n’existe pas par avance, puisqu’il n’a jamais été écrit. C’est l’activation d’une commande sur la machine qui le fait exister à un instant t comme un tout logique. Or, cette possibilité ne peut être donnée que si un travail minutieux a été accompli de codage de chaque élément (qui peut descendre parfois au niveau de la phrase), pour le réagencer dans une logique nouvelle en fonction de la demande formulée. Dans ces conditions, il est possible de parler d’un hypertexte au sens plein du terme, puisque l’on génère un texte à travers le réagencement d’un certain nombre de morceaux de texte, préalablement décomposés.

Pour conclure sur cet aspect, nous nous interrogerons sur la notion de

« structuration » du texte. Il est souvent avancé que l’hypertexte permet de

« déstructurer » l’approche du texte par rapport à une forme de structuration qui est celle de l’écrit imprimé. Or, en bonne dialectique, on pourra constater que cette déstructuration n’intervient qu’au prix d’une très forte structuration des éléments premiers composant le texte. Ce n’est qu’après avoir décomposé le texte en particules élémentaires, en les ayant décrites dans une métastructure, autrement dit en les ayant indexées, que l’on peut donner l’illusion de la liberté de leur recomposition. Nous sommes ici au cœur de la problématique de l’anticipation liée au dispositif technique utilisé pour composer le texte, puisque celui-ci n’existe plus

(13)

seul, mais ne fait sens qu’une fois flanqué de son dispositif d’accompagnement qui permet, à partir d’un nombre fini de particules élémentaires de texte de produire n versions de celui-ci selon son centre d’intérêt du moment.

D’une manière générale, on peut se demander si la déstructuration des contenus, affirmée comme une des caractéristiques de l’hypertexte (encore que nous venons de montrer que sous l’absence apparente de structure gît en fait une structuration forte de la pensée et du texte, simplement celle-ci est présentée autrement) serait véritablement une étape progressiste dans l’histoire des modes de représentation des connaissances. En effet, on peut dire que toute l’histoire de la connaissance est orientée vers une plus grande formalisation de ses représentations, afin de pouvoir les traiter. D’où viendrait donc que d’un seul coup, le salut se trouverait dans la déstructuration absolue ? En fait, une partie de la « philosophie » hypertexte cherche à répondre, en la contournant, à une vieille problématique basée sur la formalisation, sur la structuration, et donc sur la classification. Or, on l’a dit, toute classification, d’une certaine manière, mutile. Il est donc tentant de chercher une logique qui permette de transcender les clivages nécessairement engendrés par la logique classificatoire.

La notion de transversalité introduite par le lien hypertexte est certainement un argument fort pour plaider en faveur de ce modèle. On peut cependant se demander si on ne confond pas dans ce cas, le problème du choix du modèle scientifique, sous-jacent à la représentation, et la caractéristique de l’outil de représentation lui- même. Au-delà des rigidités imposées par les modèles classificatoires, une richesse dialectique est possible à travers des métamodèles, ou tout simplement par le travail de la pensée, qui procède dialectiquement en figeant puis en dépassant ce qui a ainsi été isolé.

4. Vers la base de données multimédia comme gestionnaire de la complexité ? Le propre de l’écrit numérique est de découpler l’appareillage de gestion des ressources en amont, de la forme d’apparition du résultat devant le lecteur, en aval.

Nous avons vu que deux formes coexistaient, la classification et le marquage, qui permettaient, dans ce contexte, d’organiser le document pour la lecture. Il reste que ces systèmes, y compris celui du balisage, qui pourrait paraître a priori le mieux adapté au propos, souffrent de limites quant à la gestion du dispositif. Leur caractère endogène les limite, alors même qu’il fait partie des contraintes indépassables du système. Il faut par conséquent recourir à nouveau à une forme extérieure, à un dispositif capable de gérer, non seulement l’agencement des différents éléments et leur vie propre, mais encore leurs relations réciproques, et même qui soit capable de gérer ces relations comme des objets à part entière. L’une des hypothèses est de considérer la base de données multimédia comme le dispositif le plus capable de gérer la complexité des relations entre les différents objets composant le document.

(14)

Les banques de données sont la plupart du temps considérées sous l’angle du contenant, comme autant d’instruments servant à stocker l’information. Telle est par exemple la définition donnée par Bernard Marx15 qui identifie les banques de données à des « gisements d’information ». Le fait que la banque en tant que telle structure l’information, de par son organisation logique du modèle de données, est rarement invoqué pour revendiquer la logique de base de données comme un outil possible d’écriture et notamment d’écriture multimédia. Pourtant, on peut penser la banque de données en amont, comme étant, non pas seulement un réceptacle, mais un formalisme d’écriture, en anticipant les conditions de lecture favorisées par le calcul et la transversalité propres aux dispositifs informatiques.

En un sens, cela revient à structurer à l’extrême un texte afin d’en exploiter au mieux les contenus en les rapprochant lors de requêtes successives. D’une certaine manière cette structuration est un des moyens de lever également l’ambiguïté du langage courant. Si dans un corpus apparaît le mot fraise, il y a au moins quatre significations possibles : le fruit, l’outil du dentiste, l’outil du mécanicien, le col de l’aristocrate. La présence du mot fraise dans un champ intitulé « Production agricole » ne peut impliquer qu’une seule de ces significations. Un autre avantage réside dans la combinatoire permettant de produire automatiquement une information nouvelle qu’un recensement manuel rendrait extrêmement fastidieux et qu’une confiance dans la simple recherche textuelle rendrait aléatoire. Rechercher dans un dictionnaire multimédia organisé en banque de données toutes les ville situées le long d’un fleuve et possédant des musées devient une évidence. Mais ce qui est acquis apparemment facilement lors de la requête, nécessite un investissement considérable dans la construction en amont. Il est clair que tout type de texte n’est pas voué à recevoir ce type de traitement ; néanmoins toute la littérature de type dictionnairique, encyclopédique, technique, juridique, etc.

pourrait se trouver considérablement enrichie par ce type de démarche.

Il existe toutefois un obstacle considérable à la mise en œuvre d’une « écriture » sous la forme de banque de données, et cet obstacle est d’ordre culturel. La scripture, même à l’aide d’une machine, s’effectue sous forme de flux, alors que la saisie dans une banque de données, en mode formulaire, implique une discontinuité qui rebute l’auteur ; ce n’est pas là une méthode « naturelle » d’écrire16. Il est cependant un autre motif, qui milite pour la mise en place de banques de données multimédia comme instrument producteur du document numérique contemporain ; c’est celui que nous avons déjà évoqué, de l’information sur l’information.

Considérons qu’un document numérique est formé d’objets : du texte, du métatexte,

15. [DIC 97]

16. A l’inverse, les systèmes de marquage, dans la mesure où ils s’insèrent dans la continuité du texte écrit, paraissent plus en conformité avec l’esprit qui préside à leur rédaction ; ceci d’autant plus que l’on peut écrire le texte « à la volée », ou « au kilomètre » et le baliser après coup, comme cela se passe, par exemple, dans la presse.

(15)

des images17, des sons, etc. Examinons la quantité d’informations à gérer sur chacun de ces objets : il y a d’abord sa nature : texte/image/son, etc. Il y a ensuite son contenu ou libellé ; on trouve ensuite des éléments d’index qui servent à le décrire (dans un champ descripteur, par exemple), enfin les éléments servant à désigner sa destination, lesquels peuvent amener d’ailleurs à intégrer des variantes de l’objet original18. Autrement dit, chaque composante du document numérique est elle-même devenue un élément complexe d’un tout complexe. Elle fait l’objet de relations multiples avec les autres composantes. C’est ici qu’à notre sens se manifestent les limites de la logique de marquage, notamment celle du balisage, car la balise est unidimensionnelle ; elle peut servir par exemple à nommer ou désigner un contenu (cas de la balise <TITLE> par exemple) ; elle peut aussi servir à indexer un document (cas de la balise META « Keywords » par exemple) ; mais elle ne peut pas gérer des éléments comme la variation de libellé d’une partie ou le support de destination par exemple. Cet élément-là doit faire l’objet d’une gestion qui se situe en amont du dispositif technique d’écriture proprement dite, par exemple dans la base de données multimédia.

Considérons donc que l’appareillage, la machine, n’influe pas seulement sur les conditions de réception du document en ce qu’il en modifie la sémiotique, notamment lorsque le document vient successivement « s’incarner » dans différents systèmes de réception et supports. Etudier cet aspect est plus que nécessaire, et un certain nombre de travaux en cours sont prometteurs sous cet aspect-là. Mais il ne faudrait pas ici négliger l’apport de l’appareillage informatique en ce qui concerne la gestion même du document numérique, de ses couches visibles et invisibles, et de la méta-information qu’il recèle. La maîtrise de la complexité est à ce prix.

5. Bibliographie

[BAL 90] BALPE J.-P., Hyperdocuments, hypertextes, hypermédias, Eyrolles, 1990.

[BAC 98] BACHIMONT B., « Bibliothèques numériques audiovisuelles », Document numérique, vol. 2, n° 3-4, 1998.

[BRI 97] BRIATTE K., « Matériaux pour une rhétorique de l’hypertextualité », Strumenti Critici, A XII, n° 3, sept. 1997, p. 489-508.

17. Naturellement, la notion d’« information sur l’information » prend une dimension considérable, dès que l’on quitte le monde des objets textuels pour entrer dans celui des objets visuels et sonores. Comme le dit Bruno Bachimont, « le texte est sa propre indexation » [BAC 98], alors qu’il faudra nommer toutes les composantes de l’image ou du son qui pourraient servir à sa gestion. Sur la question de l’indexation de l’image, voir aussi [DES 00].

18. Supposons la réalisation d’un annuaire des services wap. Cet annuaire sera disponible et sur le web, et sur le wap. Le libellé d’un service affiché en wap sera plus concis que celui affiché sur le web. Il faut donc stocker les deux libellés, les gérer en les rapportant à un référent tiers, et pouvoir gérer leurs supports de destination.

(16)

[BRO 93] BROUSTE P., COTTE D., Le multimédia, promesses et limites, ESF, Paris, 1993.

[CER 90] DE CERTEAU M., L’invention du quotidien. I. Arts de faire, Gallimard, 1990.

[CHA 98] CHABIN M.-A., « Patrimoine numérique : révolutions et racines », Document numérique, vol. 2, n° 3-4, 1998.

[CHA 99] CHABIN M.-A., « Exigences numériques et besoins documentaires », Solaris, déc. 1999- janv. 2000.

[COT 98] COTTE D., « Le texte numérique et l’intériorisation des dispositifs documentaires », Document numérique, vol. 2, n° 3-4, 1998.

[COT 99] COTTE D., Sauts technologiques et ruptures dans les modes de représentation des connaissances. Etude sur le texte numérique comme objet technique, Thèse en sciences de l’information, Université de Lille 3, 1999.

[DEB 91] DEBRAY R., Cours de médiologie générale, Gallimard, Paris, 1991.

[DES 00] DESPRÉS-LONNET M., Etude des interfaces de consultation des bases de données iconographiques, Thèse en Sciences de l’Information, Université de Lille 3, 2000.

[EIS 89] ENSTEIN S., NIJNY V., Leçons de mise en scène, Ifemis, 1989.

[EIS 91] EISENSTEIN E., La révolution de l’imprimé dans l’Europe des premiers temps modernes, La Découverte, 1991.

[GOO 79] GOODY J., La raison graphique, la domestication de la pensée sauvage, Minuit, Paris, 1979.

[JAC 91] JACOB C., « La leçon d’Alexandrie», Autrement, n° 121, avril 1991, p. 23-32.

[JEA 97] JEANNERET Y., « Cybersavoir : fantôme ou avatar de la textualité ? Questionnement d’une actualité », Strumenti Critici. Poétique et rhétorique dans les sciences humaines, n° 85, sept. 1997.

[MEL 91] MELOT M., « La forme du fond », Autrement, n° 121, 1991.

[MET 92] METZ C., Langage et cinéma, Albatros, 1992.

[PER 85] PÉREC G., Penser/Classer, Hachette, 1985.

[SOU 98] SOUCHIER E., Lire & écrire : éditer, des manuscrits aux écrans, autour de l’œuvre de Raymond Queneau, Mémoire d’habilitation à diriger des recherches, dir. A.-M.

Christin, Université de Paris 7, 1998.

[VAN 99] VANDENDORPE C., Du papyrus à l’hypertexte, La Découverte, 1999.

Références

Documents relatifs

cine interne générale (SSMI) a invité chercheurs, cliniciens, aca dé miciens, politiciens et représentants de l’industrie pharmaceutique, à débattre de

Le travail en réseau et l’enseignement à distance exigent une connaissance assez profonde des dispositifs numériques et rendent positivement sur l’innovation pédagogique,

Analyse du total des informations correctes produites au Questionnaires Q1 et Q2 Nous analysons, tout d’abord, le total des réponses correctes aux questions portant sur la base de

Les pales sont placées progressivement en position travail pour obtenir une vitesse de rotation constante du générateur de 1500 tr/min.. Celui-ci sera alors couplé au réseau

La gouvernance envisagée pour l’eurozone la place sur une trajectoire de collision frontale avec le modèle social. En fait sans véritable solidarité financière, budgétaire, sociale

Si Ferguson G. dans Diglossia recense les situations dans lesquelles la variété H est utilisée et celle où la variété L est employée dans la so- ciété diglossique, Gumperz

420-1 du code de commerce aux sociétés SIMOP France SAS, groupe F2F, Saint Dizier Environnement, Saint Dizier Participations, Techneau, SAS GAEAU, COC Environnement,

182. Les pratiques constatées ont consisté en des échanges d’informations sur les prix proposés et en la définition d’une stratégie commune dans le cadre des appels