• Aucun résultat trouvé

Développement comparé des thésaurus

3. Systèmes d’onglets

2.1 Développement comparé des thésaurus

D’autre part, les nombreux travaux suscités par les thésaurus ont porté sur leurs méthodes de construction mais n’ont pas pris en compte leurs usages, qu’il s’agisse de ceux des professionnels de l’information ou de ceux des utilisateurs. Selon certains auteurs, la consultation du thésaurus est l’une des stratégies de recherche des professionnels qu’il faut implémenter sur les systèmes destinés au grand public, ceci sans que ne soient précisées les stratégies d’exploration et de consultation de ces thésaurus. Les premiers thésaurus grands publics ont été des CD-Roms transposés directement de l’outil papier, sans nouvelle fonctionnalité ni même d’adaptation.

«Thésaurus et cartes conceptuelles présentent des points communs

mais aussi des différences. Tous deux visent à représenter un domaine de connaissances et tous deux privilégient les relations hiérarchiques. Cependant, les thésaurus possèdent un caractère normatif que les cartes conceptuelles ne présentent pas. Loin de se vouloir « la » représentation de référence, celles-ci ont surtout valeur pour celui/ceux qui les créent. La question de leur lisibilité pour autrui ne se pose donc pas. Les tailles des

2.2. Organisation par thèmes de recherche domaines pris en compte, dans l’un et l’autre cas, ne sont pas non plus les mêmes : Novak fait figurer une vingtaine de concepts sur une carte alors qu’un champ sémantique comporte beaucoup plus de descripteurs. Par contre, les thésaurus font appel à un très petit nombre de types de liens, standardisés, entre concepts alors que les cartes conceptuelles ne les normalisent pas. (Rogeret coll., 1998) »

Nous avons plusieurs questions à résoudre pour faire avancer notre recherche sur le domaine de la cartographie active telle que nous l’imaginons. En particulier comment formaliser les concepts et les traduire visuellement de manière à ce qu’ils soient immédiatement accessibles au lecteur. Par exemple, comment devons nous dessiner les parcours, et à l’intérieur de ceux- ci, comment représenter les temps de lecture, les sauts à travers le corpus. Il existe aussi des questions qui sont liées aux autres thèmes, hypertexte et désorientation par exemple : comment devons-nous articuler cartographie et lecture, en particulier comment chaque dispositif peut-il faire référence à l’autre, et faire voyager le lecteur entre les deux, ce qui va faire basculer le lecteur d’un plan de compréhension du texte à un plan de navigation à travers le corpus.

C. Orientation et repérage

La question de la navigation suit logiquement celle de la représentation spatiale. Les problèmes d’orientation et de repérage sont incontournables dans tout ce qui touche à l’hypertexte, la cartographie est à la fois une manière de résoudre ce problème et une manière de le complexifier parce qu’elle peut en fait apporter une surcharge cognitive supérieure à la simplification apportée par la synthétisation de la navigation. Commençons par énoncer

Chapitre 2. Cadre épistémologique

le cycle à trois phases qui représente l’activité de l’utilisateur selon Rouet et Tricot (Rouet, 1992) (Tricot et Bastien, 9-11 Mai 1996) :

Sélection de l’information par sélection d’un nœud La phase de sélection

met en jeu plusieurs processus, il s’agit pour le lecteur de gérer à la fois où il se trouve et où il voudrait aller, son activité de lecture et processus de traitement des informations relationnelles.

Traitement de cette information La phase de traitement s’effectue au niveau

local du nœud (compréhension du contenu du passage lu), mais aussi à un niveau plus global, c’est ce qui conduira le lecteur, dans l’étape suivante, à évaluer si le passage lu contribue au but poursuivi et, dans ce cas, intégrer cette information à celles acquises aux cycles précédents.

Évaluation de la pertinence du nœud sélectionné Ce qui conduira le lecteur

à se poser de nouvelles questions pour sélectionner le nœud suivant. En essayant de faire une compilation des nombreux travaux qui cherchent à préciser quelles fonctionnalités il faut proposer pour atténuer le phénomène de désorientation, nous pouvons constater que ces travaux sont souvent parcellaires et de divers types. Certains parlent d’ergonomie de manière générale, certains sont plus adaptés à la navigation sur le Web. Il peut être intéressant de mettre au point telle fonctionnalité de manière isolée pour en mesurer l’impact précisément, mais il est sans doute préférable de chercher à comparer l’efficacité de plusieurs moyens d’orientation combinés, le cumul de l’impact de chacun étant sans doute inférieur à l’impact global quand les fonctionnalités sont présentes ensembles. Là encore, les différents travaux sont difficilement comparables et donnent des résultats parfois contrastés.

Nous avons relevé, toujours dans le même rapport, au travers des études comparatives et des recommandations de conception une liste de fonctionna- lités qui sont sujettes à limiter la désorientation des utilisateurs :

2.2. Organisation par thèmes de recherche

– les retours arrière – les visites guidées – les signets (bookmarks) – les cartes conceptuelles

– les vues panoramiques (fisheye views) – la mise en place de repères dans le sommaire

– la sélection, par l’utilisateur, des passages qu’il veut approfondir.

Nous ne pouvons pas terminer sans noter que la cartographie ne fait tout de même par l’unanimité, Brown (1989) récuse tout intérêt aux cartes conceptuelles et autres navigateurs graphiques. A la recherche de fonction- nalités plus performantes et qui permettraient de s’en passer il propose prin- cipalement la sélection, par l’utilisateur, des passages qu’il veut approfondir. Ces passages viennent s’insérer dans le texte courant affiché à l’écran et se donnent à lire quasi séquentiellement à l’utilisateur. Il propose également la personnalisation de l’affichage pour des utilisateurs novices, en effet il ne faut pas oublier l’importance des différences individuelles, ce qui oriente les uns alourdit la navigation des autres. Il est aussi proposé d’utiliser une organisation hiérarchique reprise dans un système de menus et sous-menus.

Un autre aspect encore est le typage de liens testé par Baron, Tague-Sutcliff et Kinnucan (1996). Pour cela, ils définissent trois types de liens :

– sémantiques : tels que ressemblance, partie de, est une sorte de

– rhétoriques : définition, explication, illustration, continuation et récapi- tulation ;

– pragmatiques : mise en garde, prérequis, usages, exemples.

Une autre étude des cartes conceptuelles est présente chez Gaines et Show (1995), mais dans leur cas ils se sont plus attachés à en étudier la mise en œuvre et les usages possibles plutôt que de valider leur impact par des

Chapitre 2. Cadre épistémologique

expérimentations. Il faut toutefois noter que comme pour Rouet (1992), Rouet et Tricot (1995) ils relèvent l’importance des différences individuelles.

Parmi les principes de cohérence, trois visent à améliorer la cohérence locale, les deux autres la cohérence globale. Il convient :

– d’étiqueter les liens, d’indiquer les équivalences (lorsqu’un même nœud est présent dans plusieurs fenêtres),

– de préserver le contexte en montrant les nœuds voisins d’un nœud donné et leurs relations. de créer des unités de plus haut niveau d’information, les nœuds composites,

– de visualiser la structure en donnant une vue générale du domaine avec ses principaux sujets et leurs relations, par exemple au moyen de cartes conceptuelles.

Les trois derniers principes visent la réduction de la charge cognitive : – fournir à l’apprenant des indicateurs de sa position, du chemin parcouru

et des options possibles,

– fournir des indicateurs de direction et de distance, – offrir une interface stable.

D. La linguistique cognitive

La linguistique cognitive doit nous aider à comprendre comment fonc- tionne le langage, afin de comprendre les modes de pensée et les diverses façons de communiquer. Nous ne pourrons pas entrer dans le débat entre les principaux courants contemporains, qui se réclament de deux grands paradigmes théoriques :

– le paradigme classique du cognitivisme (appelé paradigme computo- représentationnel symbolique), qui a été adopté par les « grammaires formelles », et notamment par la grammaire chomskienne

2.2. Organisation par thèmes de recherche

– un paradigme alternatif (parfois appelé paradigme constructiviste), représenté principalement par les « grammaires cognitives » dont une figure centrale est Ronald (Langacker, 1987), mais auquel se rattachent également certains tenants de la linguistique fonctionnaliste, ainsi que des approches typologiques et diachroniques des langues.

Il pourra être fait appel à la linguistique pour offrir un autre éclairage à notre problématique à travers ses interactions avec d’autres disciplines, abordant le langage non plus à partir de l’étude spécifique de la structure et du fonctionnement des langues, mais en tant que faculté supérieure de l’espèce humaine mise en œuvre par des sujets, donnant lieu à l’activation de certaines zones du cerveau, et susceptible d’être simulée sur ordinateur.

E. La communication

Les sciences de la communication ont pour objet l’étude de la com- munication, mais il n’y a pas une science de la communication puisque la communication fait appel à plusieurs disciplines. La communication est plutôt un objet de connaissance interdisciplinaire, au carrefour des disciplines traditionnelles et des savoirs récents liés à une formidable expansion.

«La communication est l’action complexe résultant de l’interaction

de trois actions archétypales : l’acte technique, par lequel un signal devient transmissible (le niveau A, chez Weaver), l’acte sémantique, par lequel le signal émis devient signification (niveau B), et l’acte pragma- tique, par lequel le signal reçu induit un changement de comportement du récepteur (niveau C, chez Weaver, qui parle du problème de l’effectivité : l’effectivité du signal se définissant par le changement de comportement observable du récepteur). (Le Moigne, 1994, page 196) »

Chapitre 2. Cadre épistémologique

La communication est au centre de beaucoup de nos préoccupations mo- dernes, même si ses racines remontent à l’antiquité. A quelques exceptions près, les hommes ont toujours cherché à communiquer, à se rapprocher et à apprendre des autres cultures et la communication était au centre du développement démocratique dès le forum Romain. Interdite ou manipulée, elle a aussi été un outil de pouvoir et de soumission des totalitarismes. Dans le monde moderne, l’explosion des outils dédiés à la communication, la multiplication des médias a entraîné un début de chute des frontières et des barrières. Même si la manipulation existe toujours (peut-être même plus encore qu’auparavant parce que la manipulation bénéficie des mêmes outils), Internet semble être le lieu où tout citoyen peut être en prise directe avec des évènements et des idées surgis à l’autre bout de la planète. Le phénomène des « Blogs » succède à celui des sites personnels d’il y a quelques années, l’idée est la même mais l’information se structure.

Nous nous intéresserons aux sciences de la communication alternative- ment sous trois de ses facettes :

– Nous aurons besoin d’étudier la communication dans ses rapports avec le cerveau : perception, mémoire, traitement de l’image et du langage ; – Nous devrons aussi, de manière plus précise, nous concentrer sur l’ana-

lyse des problèmes de communication entre l’homme et les machines. – Enfin, et c’est sans doute là l’aspect le plus lié à notre problématique,

nous étudierons la communication entre individus et organisations, ainsi que l’impact des techniques de communication sur le fonctionne- ment de la société.

2.2. Organisation par thèmes de recherche

F. L’informatique linguistique

L’informatique linguistique propose de nombreux outils pour assister les chercheurs dans l’analyse de grand corpus de manière plus ou moins automatisée. C’est bien entendu un aspect qui pourrait prendre une grande part dans le projetCoLiSciences, même si nous n’avons pas toutefois vocation à

développer de tels outils, ni d’en faire spécifiquement un sujet de recherche. Nous essaierons donc d’assortir notre dispositif d’outils issus de cette re- cherche et qui seront utilisés principalement pour construire des liens avec les autres thèmes.

G. La sémiotique

Nous l’avons dit, le contexte général de notre recherche nous amène à réfléchir sur la publication en ligne sur le Web de corpus textuels numérisés, sous la forme commune d’un « site web » que nous appellerons plus simplement « bibliothèque numérique ». Il est bien entendu que le site web est à la bibliothèque numérique ce qu’un immeuble est à une bibliothèque traditionnelle, rien de plus qu’un espace pour héberger et abriter les ouvrages. Pourtant un architecte qui doit dessiner les plans d’une bibliothèque se posera des questions différentes de celui qui doit bâtir un stade ou un hôpital. Il devrait donc en être de même pour le webmaster qui doit concevoir une bibliothèque numérique. En tant que formes d’organisation et de gestion d’information, les questions qui se posent à nous concernant ces bibliothèques numériques peuvent être posées de la façon suivante :

«L’évolution des modes de communication implique la nécessité

d’une maîtrise permanente du sens produit par les différents supports utilisés et diffusés. Une connaissance approfondie et évolutive des mo-

Chapitre 2. Cadre épistémologique

tivations et attentes du public-cible est donc devenue particulièrement importante dans l’optique d’un usage raisonné de produits multimédias inscrits dans une politique communicative cohérente et réfléchie. La conception et le suivi d’utilisation de systèmes d’information multimédia (logiciels,CD-ROMs, sites Internet et autres supports) font appel depuis plusieurs années à l’analyse ergonomique afin d’optimiser notamment le rapport homme-machine instauré. Or, l’application de cette seule méthode n’est pas suffisante pour appréhender pleinement des rapports tels que celui qui unit le texte à l’image, les interactions qui gouvernent les variables visuelles ou encore les jeux qui s’installent entre les différentes isotopies. Il s’agira ici d’utiliser ce que la sémiologie, en complément des éléments vus ci-dessus, peut apporter à la conception et à l’analyse de systèmes d’information multimédia. (Masselot, 2004) »

Pour préciser notre propos, nous pouvons ajouter suivant (Stockinger, 1999), que la sémiotique s’intéresse à ces formes d’organisation pour les trois raisons suivantes :

1. en tant que producteur et fournisseur d’information et de produits et services d’information ;

2. en tant que témoin d’une culture d’information, d’une histoire ou d’une tradition d’information ;

3. en tant qu’utilisateur et consommateur d’informations en vue du déve- loppement de (nouveaux) produits et services d’information et de son positionnement dans un environnement socio-culturel et économique. Dans un premier temps, la sémiotique appliquée au cadre restreint des bibliothèques numériques va nous amener à nous pencher sur la description comparative de leur organisation suivant différentes approches :

2.3. Organisation de la thèse

– les scénarii et scènes composant un scénario organisant les espaces thématiques ;

– le scénario d’un site (ou d’une de ses parties) sous forme de régions propres à une page ;

– la structure narrative, les chemins ou parcours selon lesquels un site et ses prestations peuvent être explorés et exploités par un utilisateur ; Cette étude devra permettre dans un second temps d’être mise en ap- plication sur le dispositif CoLiSciences de manière à assurer la mise en place

d’une méthodologie pour la conception et la spécification du site, ainsi que la production de scénarios ou modèles.

2.3 Organisation de la thèse

Le compte rendu de notre travail de recherche s’organise suivant deux grandes directions, qui donneront lieu chacune à une partie. Dans la première partie nous étudierons l’hypertexte et à travers ce dispositif, l’évolution de l’écrit introduite par les supports numériques (page 53). Nous commencerons donc par analyser la mutation de l’écrit imprimé vers le numérique. Pour cela, nous reviendrons d’une part sur les dispositifs techniques qui mettent à disposition des lecteurs non seulement le contenu d’un livre, mais aussi jusqu’au contenu d’une bibliothèque. Cette constatation restant tout à fait quantitative, dans un deuxième temps nous aborderons pour ce qui est du qualitatif, la « qualité » de la lecture, médiatisée à travers de tels dispositifs. Nous étudierons d’autre part l’hypertexte, en dehors de tout contexte spéci- fique, puis dans le cadre de sa mise en œuvre sur la « toile », le Web. Cette modalité d’écriture et de lecture semblant proposer une manière d’articuler

Chapitre 2. Cadre épistémologique

un texte selon comment le lecteur et sa manière de penser l’attendent. Dans cette étude des hypertextes nous aborderons :

– le sens – la lecture – les parcours

que nous ne manquerons pas de mettre en rapport avec les expérimentations menées dans le cadre du projetCoLiSciences.

Dans la deuxième partie, nous reviendrons plus précisément sur le dispo- sitif mis en place par le projetCoLiSciences. Ceci par rapport à deux axes d’étude

bien différenciés :

– le dispositif dans son rapport avec les Logiciels Libres

– le dispositif présenté comme une forme originale d’édition de textes. À ce compte rendu s’ajoute une troisième partie faisant l’analyse et la synthèse des différentes expérimentations, dans lequel nous proposerons un cadre de développement pour les bibliothèques numériques en particulier et plus généralement des modalités d’usages des NTIC dans le cadre d’actions de recherche.

Première partie

Du livre au Web

C

HAPITRE

3

L’ÉCRIT,

LA MÉDIATION,

LA NUMÉRISATION

«Les droits imprescriptibles du lecteur

1. Le droit de ne pas lire. 2. Le droit de sauter des pages. 3. Le droit de ne pas finir un livre. 4. Le droit de relire.

5. Le droit de lire n’importe quoi. 6. Le droit au bovarisme

(maladie textuellement transmissible). 7. Le droit de lire n’importe où.

8. Le droit de grappiller. 9. Le droit de lire à voix haute. 10. Le droit de nous taire. »

Daniel Pennac

Sommaire

3.1 Introduction . . . . 55 3.2 Le document . . . . 56

A. Définition . . . 56 B. Théorie du support numérique . . . 58 C. La chaîne documentaire . . . 62

3.3 La notion de collection . . . . 68

A. La définition du dictionnaire . . . 69 B. La collection pour valoriser . . . 71

3.4 Le livre, du papier à l’électronique . . . . 73

A. Le livre traditionnel . . . 75 B. Qu’entend-on par livre électronique ? . . . 81 C. Le point sur les technologies . . . 86 D. Livre électronique : Rupture ou continuité ? . . . 101

3.5 Conservation numérique . . . 136

A. Les formats . . . 136 B. La numérisation comme changement de support 138 C. La chaîne de numérisation . . . 138

3.6 Les corpus électroniques . . . 144

A. Pourquoi un corpus en ligne ? . . . 145 B. Les grands projets de numérisation de textes . . 149

3.1. Introduction

3.1 Introduction

Avant d’arriver aux corpus électroniques en ligne, il nous faut présenter les différents médias, ou plutôt les différentes générations de médias qui ont participé à la construction de cette catégorie de corpus.

Nous partirons du document et en passant par la définition du livre, nous arriverons ensuite à une clarification de la notion de collection et de corpus. Du corpus nous pourrons appréhender ses différentes médiations électroniques, en particulier celles faisant appel à une interface hypertextuelle. Du corpus à l’hypertexte nous verrons que le corpus, médiatisé à travers une interface électronique sur Internet, s’organise et prend naturellement corps sous la forme d’un système hypertextuel.

L’hypertexte nous permettra de continuer par la construction d’un par- cours raisonné dans le dernier chapitre ; pour l’instant ce sera simplement l’occasion de rappeler les différents problèmes inhérents à ce type de système et les manières de les aborder.

Ce chapitre est en quelque sorte une réflexion sur les « savoir faire » du livre numérique, que nous compléterons par l’étude des processus d’appro- priation dans le dernier chapitre.

Par son mode de fonctionnement, l’hypertexte peut être perçu comme un élément structurant, qui va permettre de lier entre elles des idées, ou une source de désorientation, par la création d’un trop grand nombre de connexions entre un trop grand nombre de concepts. La désorientation qui affecte le lecteur perdu au milieu d’un trop grand nombre de chemins

Chapitre 3. L’écrit, la médiation, la numérisation

possibles est plutôt un problème d’implémentation du système hypertextuel qu’un problème directement lié à l’hypertexte.

En revanche, dans le cas du corpus, la quantité d’information donne toute sa pertinence à l’utilisation d’un système hypertextuel, qui permet de mettre en place des parcours raisonnés et ainsi servir de guide, ou d’assistant à la lecture. L’hypertexte n’est plus seulement l’ouvrage, ni même la bibliothèque physique mais l’organisation bibliothèque c’est à dire les murs, les ouvrages les notices et les personnes qui conseillent habituellement les visiteurs.

Avant d’analyser parcours de lecture et hypertexte dans la suite, il nous faut situer le contexte du livre numérique. Pour cela nous allons revenir sur les notions de document, de corpus et de collection dans cette première

Documents relatifs