• Aucun résultat trouvé

Déterminer les nœuds

L’hypertextualisation par la structure des documents

3.2 Déterminer les nœuds

La conception des réseaux hypertextes de manière automatique ou non, soulève le délicat problème de la détermination des unités d'information manipulées par les systèmes hypertextes.

Bon nombre de chercheurs estiment que l'information manipulée par les systèmes hypertextes doit être, dès l'origine, façonnée pour une utilisation hypertexte. C'est une des raisons pour lesquelles ces systèmes intégrent des éditeurs de textes et de graphiques permettant de créer directement l'information dans les réseaux. Ces systèmes offrent aussi des outils d'importation qui rendent possible la récupération d'informations électroniques existantes mais au prix de lourdes opérations manuelles.

Nous verrons que quelques tentatives ont été lancées pour produire automatiquement des réseaux hypertextes à partir de ces informations électroniques, tentatives d'automatisation qui sont globalement restées à un stade expérimental en raison même de l'origine des informations. En effet, on a souvent reproché à celles-ci, puisqu'elles étaient saisies à partir de logiciels de traitement de textes, d'être trop linéarisées et de ne pouvoir être réutilisées dans les réseaux hypertextes qu'au prix d'une refonte totale de l'information. Cette refonte ne pouvant être menée qu'au terme d'une analyse sémantique effectuée par un être humain.

Alors que les chercheurs s'accordent pour considérer les nœuds d'un réseau hypertexte comme un réceptacle d'informations de nature hétérogène, ils restent beaucoup plus évasif quant à la manière d'appréhender sémantiquement l'unité des futurs nœuds :

[Camacho 91] :

"...les nœuds peuvent contenir plusieurs types de médias. Les éléments d'informations, les nœuds, ont un sens, une cohérence interne. Cela peut être un fichier, une page écran ou simplement un terme..."

[Balpe 90] :

"...Définir concrètement ces unités d'information, définir de ce qui va être la part d'information insécable est une première approche analytique indispensable lors de la construction d'un hyperdocument..."

[Nelson 90] :

"...Hypertext is non–sequential writing : a directed graph, were each node contains some amount of text or other information..."

[Nielsen 89] :

"...Nodes are the fundamental unit of hypertext, but there is no agreement as to what really constitutes a node..."

Cette vision conceptuelle, tend à considérer le nœud comme une entité sémantiquement autonome. Le nœud, souvent assimilé à la notion d'idée, doit comprendre l'essentiel des informations lui permettant d'assurer sa cohérence interne. Mais cette obligation d'autonomie sémantique exige une grande prudence car elle ne doit pas conduire à un isolement des nœuds dans le réseau hypertexte. En effet, en cherchant à trop appuyer la signature sémantique des nœuds, afin que, sémantiquement parlant, ils se suffisent à eux–mêmes, le risque de fermeture grandit de sorte que l'auteur éprouvera rapidement des difficultés à poser des liens entre les nœuds. Ce danger de fermeture sémantique menace de la même manière le lecteur du point de vue de la signification de ses parcours de lecture. L'exploration de nœuds sémantiquement trop autonomes pourra compliquer les tentatives de synthèse des informations glanées dans les différents nœuds.

Alors que cette idée de cohérence interne des nœuds paraît applicable lors de la conception de réseaux hypertextes où l'information est spécifiquement créée et préparée pour une telle représentation, on peut s'interroger sur la facilité à produire systématiquement des unités d'information à partir de leur autonomie sémantique en s'appuyant sur l'analyse sémantique d'un fonds informationnel déjà existant.

Prenons pour exemple, la note de renvoi, souvent utilisée dans les documents papier. Hormis le fait qu'on lui associe une représentation graphique particulière (notes en bas de page ou en fin de chapitre avec une fonte différente de celle du texte principal), on ne peut nier qu'elle apporte des informations supplémentaires mais néanmoins différentes de celles exprimées dans le texte principal.

Supposons que le texte de la note de renvoi soit "De nombreux

traitements de textes intègrent désormais le WYSIWYG qui est un acronyme anglais signifiant What You See Is What You Get que l'on peut traduire littéralement en français par Tel Ecran, Tel Ecrit", et qu'il soit rattaché à un

paragraphe traitant de l'évolution des logiciels de traitement de textes.

L'auteur communique au lecteur une information périphérique qu'il estime indispensable mais à laquelle il n'associe pas le même "poids" sémantique par rapport au thème qu'il développe dans le texte principal. On constate dès lors, que la note de renvoi dispose d'une cohérence interne mais reste extrêmement dépendante de l'information à laquelle elle est rattachée. Et aussi forte que puisse être cette dépendance, elle ne justifie pas, pour l'auteur, de fusionner l'information de la note de renvoi au texte principal.

Transposer cette situation au contexte hypertexte, reviendrait à créer deux nœuds et un lien de complémentarité entre eux. Dans le premier nœud serait inséré le texte principal alors que le second recevrait le texte "complémentaire" de la note de renvoi. Un lecteur qui parcourrait le réseau hypertexte en suivant les liens auteur, pourrait passer du nœud contenant le texte principal au nœud complémentaire, en appréciant la complémentarité des deux sources d'information. En revanche, si sa navigation privilégie une exploration par la recherche d'occurrences de chaînes de caractères, il pourra se retrouver dans le nœud complémentaire tout en ignorant l'existence d'un lien privilégié avec un autre nœud (tous les systèmes hypertextes ne proposent pas une cartographie détaillée des réseaux!). Il ne pourra nier ni la pertinence du nœud visité ni sa cohérence intrinsèque, mais il aura certainement des difficultés à l'intégrer dans sa logique de parcours et lui donner un sens.

Une solution consisterait à fusionner le texte principal et le texte de la note de renvoi dans le même nœud, mais elle soulève la question de l'ingérence dans la logique de l'auteur.

Alors que l'on pourrait penser que l'analyse sémantique est le facteur décisif dans la granularisation de l'information, dans les faits, l'auteur doit aussi tenir compte des contraintes de représentation électronique de l'information et adapter la taille des nœuds aux impératifs d'implémentation des logiciels hypertextes :

[Akscyn 88] :

"...Units of information are displayed on per window. (Systems vary in the number, size and arrangement of windows they permit)...The hypermedia node KMS is the frame, a screen-sized workspace upon which the user can place text, graphics and image items...KMS fixes the size of a frame to a width of 1132 pixels and a height of 805 pixels...The main reason we limit the

size of a frame is to reduce reliance on scrolling, which is an inefficient way to navigate ina database..."

[Halasz 88] :

"...A notecard is an electronic generalization of the 3x5 paper notecard. Each notecard contains an arbitrary amount of some editable substance such as piece of text, a structured drawing, a bitmap image..."

[Nanard 91] :

"...En fait, ce qui caractérise vraiment un hypertexte, c'est donc la finalité du contenu des nœuds. Leur contenu est avant tout destiné à l'homme. Par conséquent, ce qui caractérise le contenu d'un nœud dans un hypertexte est d'avoir une représentation perceptible par l'homme...Un nœud reprèsente une information. Il doit correspondre à un atome dans l'hypertexte. Or la granularité dépend du point de vue d'observation (...) Des règles de lisibilité au sens le plus large suggèrent naturellement de limiter la taille pour préserver son unité de sens..."

Certes, il est important de rechercher la cohérence interne des nœuds du réseau hypertexte et on peut imaginer de prime abord que seule l'analyse sémantique de l'information peut prétendre à de bons résultats. Cette démarche, aussi performante et efficace qu'elle paraîsse, a aussi ses limites. En effet, elle exige que le concepteur du réseau hypertexte possède le pré-requis suffisant lui permettant de comprendre le domaine de connaissances d'où est tirée l'information qu'il doit fragmenter pour en faire un hypertexte. La citation de Jeff Conklin [Conklin 87] résume assez bien ce constat :

"...But this sizing is completely at the discretion of the hypertext writer and the process of determining how to modularize a document into nodes is an art, because its impact on the reader is not well understood...Hypertext invites the writer to modularize ideas into units in a way that allows an individual idea to be referenced elsewhere, and alternative successors of a unit to be offered to the reader (...) But the writer must also reckon with the fact that a hypertext node, unlike a textual paragraph, tends to be a strict unit which dœs not blend seamlessly with its neighbors (...) But the boundaries around nodes are always discrete and require sometimes difficult judgements about how to cleave the subject matter into suitable chunks..."

L'opération qui consiste à déterminer des unités d'informations intrinsèquement cohérentes d'un point de vue sémantique peut être menée par un autre procédé que l'analyse sémantique. Cela dépend du type d'informations à traiter et de la manière dont elles ont été structurées. Car il est possible d'émuler une fragmentation sémantique de l'information en s'appuyant uniquement sur la structure logique des documents.

La manière dont les informations sont structurées dans les documents d'origine scientifique et technique laisse entrevoir une équivalence dans la manière dont ces mêmes informations seront représentées au sein du réseau hypertexte. Prenons l'exemple d'un manuel de référence du programmeur du système d'exploitation UNIX. Ce manuel contient le descriptif complet des commandes et des appels systèmes que le programmeur peut utiliser dans les applications qu'il développe. Chacune des commandes est bâtie sur le même schéma ; on trouve le nom de la commande, un synopsis, une description de la commande, les autres commandes auxquelles elle est associée et les diagnostics relatifs à l'exécution de la commande. La structure même du manuel, indépendamment de toute analyse sémantique pourra être utilisée pour déterminer les unités d'information. Dans le réseau hypertexte correspondant à ce manuel, nous trouverons autant de nœuds qu'il y a de commandes. Chacun des nœuds reprendra les informations du schéma que nous avons donné plus haut.