• Aucun résultat trouvé

2.3 Structures informationnelles

2.3.3 Quelques travaux

Notre proposition de considérer la notion de structure informationnelle comme inscription numérique effectivement mobilisée dans une activité, dont il s’agit de penser l’appréhension, l’émergence ou la dimension formelle, ne vient pas de nulle part ; nous l’avons abordée plus ou moins directement dans tous nos travaux au cours des dernières années. Nous présentons rapidement quelques-uns des travaux qui ne seront pas présentés plus largement dans les chapitres suivants.

2.3.3.1 Constellations de mots

Issu notamment de la volonté d’étudier les langages semi-formels d’annotation tels que Strates-IA (Prié,1999), le projet informel83

mené avec Bénédicte Pincemin avait pour objec-tif de définir la notion de constellation de mot comme structure mi-linguistique mi-spatiale et d’en étudier la lecture et l’écriture. L’idée générale est que les pratiques d’édition élec-tronique et de communication dans le cadre des nouvelles technologies ont développé une nouvelle forme d’expression linguistique, que nous avons proposé d’appeler « constellation de mots » (Pincemin et Prié,2003). Les mots ne sont plus liés syntaxiquement pour rédiger une phrase ou un texte, mais ils sont agencés visuellement à l’écran. C’est le cas par exemple de la plupart des requêtes soumises aux moteurs de recherche sur le web (suite de deux ou trois mots simplement juxtaposés), tout comme des arborescences hypertextes, des lexicogrammes (cf. figure2.7), des schémas et des expressions de connaissances sous forme de graphes séman-tiques, ou encore des cartographies documentaires qui situent des thèmes et des documents les uns par rapport aux autres. Les items lexicaux, mis en relation les uns avec les autres par leur voisinage, éventuellement par des tracés graphiques, s’organisent alors mutuellement et construisent ainsi ensemble une part non négligeable de leur sémantique. Plus précisément, une constellation est un ensemble organisé de termes (au sens le plus général) agencés vi-suellement (sur un écran, un tableau, une feuille). Les items linguistiques ne sont donc plus liés syntaxiquement pour rédiger une phrase ou un texte, mais entrent en relation via leur disposition graphique.

Ces constellations de mots, qui prennent une place grandissante dans nos pratiques quo-tidiennes en tant que mode de communication homme/machine approprié, ont pour

carac-83. Lancé en 2003, le projet avait été accepté comme Action Spécifique par le Réseau Thématique Plu-ridisciplinaire 38, mais il a fait les frais de la réorganisation des RTP au début de l’année 2004. Le projet ACI « Langage et Technologies Numériques » piloté par Jean-François Rouet (2005-2006) a pu apporter un soutien léger.

Figure 2.7 – Un lexicogramme extrait d’un corpus de documents syndicaux, présenté de deux manières différentes, qui induisent des parcours et des interprétations différents.

téristiques d’être un mode écrit (ou plus généralement graphique) convenant à la fois aux utilisateurs — pour son esthétique visuelle, son expression synthétique, et la liberté et la puissance d’expression données par le recours à la langue — ainsi qu’aux machines par ses aspects plus ou moins formels (structure plus squelettique que la langue naturelle). Il s’agis-sait alors pour nous de donner une définition unifiée des diverses manifestations courantes des constellations de mots et de modéliser, par delà cette diversité, des principes sémantiques et cognitifs fondamentaux orientant les choix expressifs et l’interprétation.

Le projet a été l’occasion d’étudier quelques occurrences de constellations de mots de type graphe, et de spécifier quelques directions de recherche :

– modes d’articulation des mots : par exemple, pour des graphes, les typologie des liens (étiquetage, orientation, profondeur, typage, arité. . . ), les figures expressives et les par-cours induits (la chaîne, l’étoile, l’arbre. . . )

– effets de contexte spatio-dispositionnels : analogie, opposition, alignement, centrage (existence, unicité et rôle de pôles centraux organisateurs), orientation et ordre (sé-quence, hiérarchie, mono- ou multidimensionalité), proximité, etc.

– contraintes liées aux moyens matériels de transcription ou/et d’affichage (frontières, bords, déplacement, facilité de retouches locales, paramètres accessibles, etc.

Nous avons également pu participer à la spécification des graphes utilisés dans une ex-périmentation visant à étudier des parcours oculométriques (cf. figure 2.8) sur des graphes de termes correspondant à différentes catégories linguistiques, pour lesquelles des liens de proximité sémantique issus de l’application de LSA (Latent Semantic Indexing) avaient été représentés par des relations plus ou moins manifestes. Les moyens matériels ont cependant manqué pour mener une étude qualitative des différents parcours.

Le projet « constellations de mots » visait donc à déterminer les modes d’appréhension et d’écriture de structures informationnelles particulières mi-symboliques mi-graphiques, sa richesse thématique n’a cependant été qu’effleurée à ce jour.

Figure2.8 – Un exemple d’une constellation pour la catégorie des boissons et d’un parcours oculaire correspondant.

Figure 2.9 – À gauche, un document multi-structuré comme graphe orienté de structures. À droite, un exemple de document bi-structuré, composé d’une structure première simple séquence de caractère, et d’une structure plus sémantique qui s’appuie sur elle. Extraits de

(Rocio Abascal Mena et collab.,2004).

2.3.3.2 Multi-structuralité des documents

Dans la continuité de notre réflexion sur les annotations et les structures des documents, notamment la proposition de considérer que toute structure documentaire est sémantique, et que par conséquent ce qui est communément appelé structure logique n’est en fait qu’une structure sémantique « canonique » ou structure auctoriale première (Prié,2000), nous avons pu contribuer avec Pierre-Antoine Champin et différents collègues lyonnais84

à un travail sur la multi-structuralité des documents. Notre contribution principale aux résultats de ce groupe

(Rocio Abascal Mena et collab., 2004) a consisté dans la spécification d’un modèle formel

de document multi-structuré, comme graphe orienté de structures documentaires Si, elles-mêmes définies comme des graphes orientés. Deux structures documentaires S1 et S2 liées dans le document multi-structuré sont en correspondance, une correspondance permettant de mettre en relation des éléments de S1avec des éléments de S2. Tout document multi-structuré possède une structure première qui est la structure de base à partir de laquelle il est possible de mettre d’autres structures en correspondance (figure2.9).

84. Regroupés au sein d’un groupe de travail de l’Institut des Sciences du Document Numérique (ISDN), financé par la région Rhône-Alpes (Programmes Thématiques 2000-2003).

Au-delà de la modélisation, somme toute anecdotique, une notion importante est la vo-lonté générale de pouvoir considérer plusieurs structures d’usages dans un document, corres-pondant à des niveaux variés d’information et de pratiques documentaires, et mettant en jeu l’ensemble des manipulations formelles possibles sur le document lui-même (dans l’exemple de la figure2.9, on peut manipuler le texte, et on peut manipuler les mots, mais aussi spécifi-quement les voyelles). Ceci ouvre la voie à la possibilité de définir les structures effectivement mobilisées dans un document à partir des structures théoriquement mobilisables (la notion de voyelle ne peut être définie formellement comme structure que parce que les caractères sont adressables). Au niveau supérieur à celui de l’unité documentaire standard, une telle manière de penser permet de regrouper aisément plusieurs documents au sein d’un nouveau par agrégation des structures qui composent ceux-ci. Le lien avec la notion de structure infor-mationnelle apparaît ici aisément, puisque l’on se donnait déjà alors la possibilité de définir n’importe quelle structure d’usage à partir des éléments numériques disponibles de façon canonique.

2.3.3.3 Structures perçues et structures vécues

La question qui suivait logiquement a été abordée au cours du stage de M2R de Bertrand

Richard (2005), dans lequel il s’agissait de se donner les moyens de penser les multiples

structures d’un document non seulement de façon formelle, mais aussi dans leur appréhension et leur manipulation par le lecteur du document.

Un document multi-structuré est alors défini du point de vue de l’usage suivant trois types de structures. Les structures de stockage correspondent tout d’abord à la description du document dans son format natif. Les structures de présentation sont ensuite les structures d’action fournies au lecteur par les outils utilisés pour manipuler ce document. Un même document (e.g. une image) pourra être manipulé par des outils différents et donc avoir des structures de présentation différentes (e.g. manipulation des pixels avec MS Paint, plusieurs niveaux de zoom avec l’aperçu windows, et seulement deux niveaux de zoom avec IE7), qui correspondent à l’accord entre la machine et l’utilisateur sur les objets qu’il est possible de manipuler. Une structure de présentation dépend pour partie de la structure de stockage considérée et de l’outil utilisé.

Les structures perçues correspondent enfin au point de vue qu’un lecteur a sur un docu-ment, dans le cadre d’une activité. Une structure perçue dépend de la structure de présenta-tion offerte par l’outils de manipulaprésenta-tion, mais ne correspond pas forcément à celle-ci. Elle est en fait issue de l’interprétation par le lecteur de la structure de présentation, il s’agit donc d’une structure virtuelle qui dépend du lecteur et du contexte de son activité. Les structures perçues, ou structures d’usage apparaissent spontanément au lecteur, mais ne sont pas forcé-ment manipulables en tant que telles par l’outil car non connues par celui-ci, ce qui sera le cas d’un titre dans un traitement de texte sans feuille de style, ou d’un élément significatif dans une image (cf. figure2.10). Le décalage entre structures perçues et structures de présentation peut notamment être mis en évidence par des « problèmes de sélection », qui apparaissent lorsque l’utilisateur essaye de sélectionner une structure d’information perçue, mais non attei-gnable par la structure de présentation (par exemple chercher à sélectionner une ligne unique d’un paragraphe de plusieurs lignes). On peut également se poser la question de l’intégration des structures perçues dans les structures de présentation et de stockage, ce que nous avons appelé explicitation de structures perçues, qui peut passer soit par l’annotation soit par une évolution des formats et/ou des outils.

Figure 2.10 – Différentes types de structures liées à une image, en fonction des différents outils utilisés.

que nous les avons proposées ici, dans la mesure où elles permettent de mettre ensemble des éléments informationnels de façon non canonique, et peuvent être intégrées par annotation dans les documents. Cependant, elles n’ont pas la contrainte de pouvoir être objectifiables, elles ne peuvent qu’être objectivables (par exemple une forme dans une image).

Documents relatifs