EN SCIENCES HUMAINES
L’argumentation dans l’accès aux savoirs dans l’édition numérique
STÉPHANIE DELMOTTE
Introduction. La rhétorique comme grille d’analyse
Reprendre la rhétorique comme grille d’analyse et comme fondement de l’écriture scientifique peut sembler périlleux dans un pays comme la France, qui a banni l’enseignement de cette discipline et occulté le rôle qu’elle joue dans l’élaboration des discours depuis les assauts de Descartes et de Pierre de la Ramée contre elle. Cependant, les éléments de cet antique art du discours sont bien d’actualité et fournissent des outils efficaces pour détailler avec finesse les processus de création, de mise en forme et de diffusion du savoir entre scientifiques, ce qui doit permettre d’appréhender l’évolution des formes d’édition, du livre au numérique. Ses présupposés, son rôle apparaissent utiles dans le monde actuel : il faut considérer que c’est une « technique » à part entière et c’est sur elle que reposent les fondations de l’organisation du contenu des discours et ensuite de leur mise en forme.
Il faut élucider les rapports entre les sciences humaines et sociales (SHS), ses différents domaines, les caractéristiques scientifiques du discours, l’argumentation, les formats de diffusion et les publics de réception. La question est posée de savoir quels sont les contenus scientifiques, spécifiques aux sciences humaines pour la recherche ou la diffusion de théories en SHS (Sokal, 1996 ; Gardin, 1974 ; Lepenies, 1990).
Si l’on cherche quelle est la norme de communication établie depuis des siècles, on peut établir que les discours en SHS sont des objets réglés par le système rhétorique (Delmotte, 2007). L’édition numérique est fréquemment présentée comme une « révolution », cependant elle semble marquée par la tradition rhétorique qui est transposée sur les portails institutionnels de diffusion de ressources électroniques. Une réflexion doit être menée pour répondre aux besoins de la communication médiatisée par internet et la question se pose alors de savoir quelles « normes » et quels standards doivent être envisagés. Pour répondre à cette problématique, il est essentiel d’insister sur la nécessité de penser avant tout l’organisation du discours lui-même avant la mise en œuvre de « technologies de l’information et de la communication ».
Une norme du discours de science existe et il est alors incontournable de revenir aux notions qui la fondent. Revenir aux définitions des concepts de logique, de rhétorique et d’argumentation est nécessaire et il faut alors s’attacher à les définir le plus précisément possible ainsi que leur rôle.
Buts : étudier l’impact du numérique sur l’écriture
Différencier le fond (« énonciation discursive ») et la forme (« énonciation éditoriale » (Souchier, 1998) doit donner les moyens d’organiser une analyse
empirique de l’évolution de l’édition scientifique et de la forme des ressources publiées par et pour les chercheurs. Nous voulons voir ce que deviennent les articles scientifiques, les livres et les manuels, supports traditionnels de la diffusion scientifique, et analyser la forme qu’ils prennent dès lors qu’ils sont soumis à l’édition électronique. L’étude des nouvelles revues en ligne en sciences humaines, des ressources pédagogiques sur des portails de diffusion d’institutions où l’on peut déposer et rendre publics des documents scientifiques doit permettre de mettre en relief les évolutions de l’écriture en sciences humaines et sociales avec les développements de l’édition numérique.
Il importe d’abord de se demander quelle a été la norme de communication entre scientifiques dans les sciences humaines et sociales jusqu’à présent et comment s’organise sa mise en forme sur les supports du livre qui ont été les vecteurs de sa diffusion ? Que deviennent ces normes lors de la diffusion numérique entre scientifiques ?
À propos du corpus de l’étude
Pour savoir quels sont les documents servant à la communication scientifique, on trouve la typologie suivante : cahiers de laboratoires, rapports, actes de colloques, séminaires, thèses, articles, ouvrages, brevets, cours, manuels (Mahé, 2005). Une partie de ce que l’on nomme « ressources pédagogiques » se trouve donc dans les documents pour la circulation de l’information scientifique : les manuels sont aussi considérés comme tels dans un rapport ministériel sur les presses des établissements d’enseignement supérieur en 2005/2006 1. Sensiblement la même typologie se retrouve dans la base IRIS, qui succède à Grisemine (base de « littérature grise » à l’origine), sur le site de l’Université des sciences et technologie de Lille 2, lorsqu’on fait une recherche
« par type » de document.
L’édition traditionnelle sera d’abord étudiée avec une présentation des formats livresques sous l’angle de l’organisation rhétorique. Seront étudiées ensuite les ressources en ligne via des portails : revues, articles, thèses de doctorat, « livres électroniques », littérature grise, actes de colloques, manuels (ressources pédagogiques).
1. Ministère de l’éducation nationale, de l’enseignement supérieur et de la recherche Les presses des établissements de l’enseignement supérieur : synthèse de l’état des lieux 2005-2006 ; voir site http://www.sup.adc.education.fr/bib/
2. Voir http://iris.univ-lille1.fr/dspace/
Méthodologie issue des sciences de l’information et de la communication Il est d’abord nécessaire de clarifier et détailler, les uns après les autres, les processus de production de ressources avec le plus de finesse possible. Les sciences de l’information et de la communication (SIC), qui sont pluridisciplinaires, nous donnent une méthode pertinente pour approcher les publications en sciences humaines et sociales, en permettant de faire appel à des notions issues de disciplines différentes, comme la sociologie, l’anthropologie, la linguistique, l’analyse du discours, la logique ou l’ethnotechnologie. Choisir comme cadre la théorie systémique des communications permet d’analyser les processus de production de ces ressources en mettant en relief les deux aspects de la communication : information (le contenu) et communication (les moyens de partager ce contenu : la relation) (Watzlawick et al., 1972 ; Mucchielli, 1998).
Il est intéressant de voir que ces deux aspects de la diffusion des savoirs ont été liés étroitement aux développements scientifiques du XXe siècle. La première moitié de ce siècle a été marquée par une étude et une prégnance de l’aspect « information » avec les développements de la logique mathématique et des systèmes informatisés qui en découlent. La fin de ce siècle est marquée cependant par un retour en force de l’aspect « communication », depuis les années 1980 et à la suite de travaux initiés dès les années 1950 par des chercheurs anglo-saxon (Toulmin, 1991) et belge (Perelman, 1970) qui ont donné lieu à nombre de travaux féconds (Amossy, 2002). La rhétorique fait alors sa réapparition comme objet d’étude dans de nombreux ouvrages 3. La création en 2007 de l’Institut des sciences de la communication au CNRS (ISCC) par Dominique Wolton, est un signe éclatant du retour de la communication dans le champ des études en SHS.
Lorsqu’on parle de l’aspect « information », il s’agit des contenus à proprement parler : les concepts choisis, définis et employés, les catégorisations, les « étiquettes » qui sont apposées, les ensembles dans lesquels ces éléments sont regroupés. Il y est fait appel à la logique qui établit la vérité de certaines assertions via des démonstrations valides d’un point de vue formel.
On peut parler de « grains » de savoir et de la manière dont ils sont traités. Le
« grain » est une notion que l’on retrouve dans les travaux sur l’ergonomie des documents pédagogiques (Tricot, 2001). Le grain est lié à l’idée de contenu et à
3. Voir Patillon M., Eléments de rhétorique classique, 1990 ; Reboul O., Introduction à la rhétorique, 1991 ; Declerq, L’art d’argumenter, 1992 ; Boissinot A., Les textes argumentatifs, 1992 ; Robrieux J.-J., Eléments de rhétorique, 1993; Gardes-Tamine J. La rhétorique, 1993 ; Bertrand D., Parler pour convaincre, 1999 ; etc.
la manière dont on en découpe des unités pertinentes selon une finalité ou un point de vue particuliers.
L’aspect « communication » va mettre en œuvre ce que l’on appelle « la relation » : ce sont des processus pour que le contenu soit appréhendé de la meilleure façon par un auditoire, un public et selon des formes adaptées à ceux- ci. Cette étape de l’organisation du discours est souvent passée sous silence. Il s’agit alors du choix d’un ordre dans lequel des éléments vont être présentés, du classement de ceux-ci, engendré par des choix délibérés, donc de l’usage de classifications et de l’argumentation qui permet la mise en forme discursive du raisonnement. Il faut y ajouter des références au contexte de l’énonciation, aux communautés dont émane cette forme de savoir, au domaine particulier auquel il renvoie et des moyens mis en œuvre pour convaincre un auditoire qui est un
« public cible » tels les arguments, les figures de style. Or tout cela est pris en charge par la rhétorique : on y trouve un raisonnement dialectique qui peut être opposé au raisonnement analytique (relevant de la logique formelle). Dans la conception rhétorique, un discours est adressé à un auditoire, celui-ci pouvant être une personne, plusieurs personnes, le raisonneur lui-même ou un auditoire idéal (quand nous appelons à la raison, au bons sens partagé par une communauté) (Perelman, 1971).
La notion-clef qui apparaît alors pour les sciences humaines et sociales est voisine de la rhétorique, c’est celle d’« argumentation ». Du point de vue de l’organisation classique des disciplines, l’argumentation est liée à la logique comme « art de penser correctement », à la rhétorique comme « art de bien parler » et à la dialectique comme « art de bien dialoguer » (Plantin, 2005). Le concept d’argumentation permettrait ainsi de réconcilier tout le monde. La rhétorique considérée comme « théorie de l’argumentation » semble ainsi incontournable pour les publications qui ont à exposer, transmettre des connaissances, en s’appuyant sur des moyens solides comme le raisonnement mais en y ajoutant une dimension de communication : en effet le savoir s’inscrit toujours dans une communauté qui le produit et dans une société qui entretient des rapports complexes avec ses différents types de collectivités.
Pour analyser les publications scientifiques grâce aux concepts ainsi établis, il est nécessaire d’étudier ce que recouvre la notion de « science » pour les tenants des sciences dures et ce que les sciences humaines et sociales ont de spécifique dans la définition qu’elles en donnent.
Ce qu’est LA science pour les sciences humaines : la rhétorique et l’argumentation
Si l’on compare les sciences « humaines et sociales » avec les « sciences dures », le constat suivant apparaît : ces dernières sont absolument certaines de détenir la vérité dans la forme du discours de science qu’elles donnent à voir : c’est celle de la « démonstration ». Elles se sont dotées pour cela d’un langage qui convient et qui est reconnu universellement comme scientifique : celui des mathématiques. L’efficacité des sciences de la nature réside précisément dans la maîtrise de la nature. Fortes de ces certitudes, elles produisent des ressources de science et organisent, depuis longtemps, leur circulation très rapide via des formats numériques qui sont la reproduction de celles qui ont été élaborées par le livre. Elles sont généralement peu structurées dans leur forme numérique : des exemples en nombre peuvent se trouver sur le portail HAL 4. Les sciences de la nature ne semblent pas trouver nécessaire de revoir ou de penser la forme qui est donnée à la transmission des savoirs car les formes traditionnelles, pour elles, ont fait leurs preuves.
Des remises en cause des discours scientifiques dans les SHS et de leur forme ont été faites par des chercheurs comme J.-Cl. Gardin ou Bricmont et Sokal. A l’origine de l’« affaire Sokal », les auteurs ont publié en 1996 dans Social Text, puis dans Lingua Franca un article qui a créé la polémique : il a été l’occasion de reprocher leur manque de rigueur aux Cultural Studies et Science Studies, démontrant la possibilité de publier des énoncés scientifiquement absurdes ou dénués d’intérêt, et de mettre en évidence l’ignorance des fondements de la physique. Leur intention était de démontrer que les recherches en sciences humaines manifestaient une absence totale de rigueur qui les rendait illégitimes et pointer particulièrement les influences des auteurs français tels Derrida, etc. jugés abscons et inintelligibles.
A l’origine de l’Affaire Sokal on trouve la publication d’un canular par le physicien A. Sokal dans la revue Social Text ainsi que de toutes les controverses qui en résultèrent. Social Text est une revue d’études culturelles postmoderne, chef de file dans son domaine, publiée par Duke University. En 1996, Sokal, un professeur de physique de l’Université de New York, soumet un article pseudo- scientifique à la revue dans le cadre d’une expérience visant à (selon ses dires)
« publier un article généreusement assaisonné de non-sens qui (a) sonne bien et (b) flatte les préconceptions idéologiques des éditeurs » et à voir si les éditeurs
4. Le serveur HAL, créé par le CNRS, permet de déposer et de rendre publics des documents scientifiques de toutes les disciplines. HAL est un outil de communication scientifique directe entre chercheurs. http://hal.archives-ouvertes.fr/
accepteraient l’article proposé. L’article, intitulé « Transgresser les frontières : vers une herméneutique transformative de la gravitation quantique », a été publié au milieu de 1996 dans le numéro Science Wars de Social Text, sans avoir subi préalablement un processus d’examen par les pairs, ni avoir été soumis à une quelconque critique externe. Le jour de sa publication, Sokal a annoncé dans le magazine Lingua Franca que l’article était un canular. Il décrit celui-ci comme « un pastiche du discours cryptique de la gauche, des références laudatives, des citations grandioses et d’un non-sens pur, structuré autour des citations les plus stupides possibles d’universitaires spécialistes de sciences sociales se rapportant aux mathématiques et à la physique ».
Mais cela ne semble pas aussi simple que veulent bien le faire croire Bricmont, Sokal et les chercheurs en sciences dures : cette affaire a été analysée par des chercheurs en SHS qui ont démontré que Sokal ne tenait pas compte et ne maîtrisait pas le dispositif littéraire de production de textes scientifiques (Jurdant, 1998 ; Jeanneret, 1998). Ces auteurs rappellent que les enjeux en cause ne sont pas exclusivement scientifiques mais également politiques et surtout éthiques et que le processus de production de la science fait appel aussi à des consensus dans les communautés des chercheurs et à une part incontournable d’implicite.
Il est donc légitime de se demander en quoi consiste ce que l’on nomme
« LA science » et ce qui différencie non seulement les sciences dures des SHS mais aussi et surtout les modalités de communication et les discours qui en sont les représentations. Dans les SHS, on est scientifique dès qu’on utilise une méthode scientifique, apprise auparavant et appliquée tant bien que mal aux phénomènes auxquels on s’intéresse. Du coup, cette unité de la science ne fait pas tant écho à l’unité du monde réel qu’à l’unité professionnelle des scientifiques, c’est-à-dire à la communauté des chercheurs (Jurdant, 1999). Si la forme du discours est – en apparence du moins – nettement « moins fondée » du point de vue scientifique, par contre les chercheurs en sciences humaines s’interrogent sur les dispositifs qui sont ceux de la science ou non. Or la science se parle et s’écrit ; l’écriture permet de fixer la pensée ; l’écrit permet de convaincre en faisant appel à la raison. La parole, quant à elle, permet de persuader en suscitant des sentiments, des émotions (Blanchard, 1998).
Si l’on revient ainsi aux sciences humaines et particulièrement aux départements littéraires, qui ont la réputation d’être « arriérés » d’un point de vue technologique pour les tenants des sciences dures, force est de constater que ce sont les SHS qui ont eu la volonté de faire évoluer les formats et de s’ajuster aux besoins des chercheurs en SHS, à la circulation efficace des savoirs de leur domaine avec un nombre de productions dominant face aux sciences dures (Epron, 2004) et des innovations majeures comme la TEI (Hudrisier,
2000) ou le format SCD. C’est ce qu’il est possible de voir en étudiant les portails en sciences humaines et sociales et les innovations technologiques qui y sont proposées, soutenues par des institutions soucieuses de mettre en place des systèmes ouverts et accessibles à tous.
L’organisation du contenu doit répondre à certaines exigences plus ou moins proches de « la logique » selon les domaines d’application, mais il importe aussi de voir comment cet aménagement s’exprime matériellement au travers des supports, des publications elles-mêmes. Quelle forme doit prendre le discours scientifique ? Même dans les sciences dures, la part de la communication apparaît comme incontournable. Le rôle d’un scientifique ne s’arrête pas à la réalisation de sa recherche et à la forme « logique » de sa démonstration, il doit la communiquer aux autres 5. La communication scientifique est au centre de tout travail de recherche. En effet, le chercheur doit savoir choisir le support de la publication de ses travaux. Cette publication (généralement dans des revues spécialisées) est une validation et une valorisation du travail de recherche. Dès lors, toute recherche scientifique ne s’achève que par le biais de sa communication : une recherche scientifique ne peut être achevée tant que ses résultats ne sont pas publiés.
Si l’on examine les choses de près, on s’aperçoit que même lorsqu’il se veut explicitement démonstratif, un discours scientifique ne se réduit pas entièrement à l’aspect logique, ni ne se conforme en tout à une application stricte et complète des règles de la déduction – pas même dans le domaine des sciences dures où celle-ci est considérée comme l’étalon – la référence et la condition sine qua non de la scientificité (Borel, 1992). Par exemple, une démonstration d’Euclide peut être étudiée sous l’angle du discours. Lorsqu’on parcourt sa démonstration, on constate que la preuve est loin de tout dire et que la démonstration apparaît ainsi autant guidée par le souci de faire partager une connaissance à un interlocuteur que par celui d’exposer l’ordre en soi d’un savoir. Elle a la forme d’une intervention. Il y reste aussi des formes d’implicite et le déroulement du raisonnement et de la démonstration n’y sont pas entièrement écrits, il reste un certain nombre de sous-entendus, d’« évidences », qu’Euclide n’estime pas nécessaire de développer pour que son théorème soit démontré : nul n’a jamais songé pour autant à le remettre en cause.
De plus, dans un exposé scientifique, il n’y a pas que des « faits » : il ne faut pas oublier que l’argumentation repose sur des croyances, partagées ou à faire
5. M. Ben Romdhane, S. Lainé-Cruzel (1997), Prise en compte de la structure des articles en sciences agronomiques pour la navigation dans un corpus scientifique électronique. Voir http://www.recodoc.univ-lyon1.fr/publications/sfsic/sfsic.htm#1/%20Caract%E9 ristiques%20 et%20typologie%20des%20revues%20scientifiques%20.
partager, qui vont servir de base à deux types de stratégies (Kuhn, 1962). Toute argumentation suppose un jeu entre le connu et l’inconnu, entre l’ancien et le nouveau (Gardes-Tamine, 1992 ; 1996). Il est donc possible, soit de partir du connu pour amener vers l’inconnu, soit de formuler d’emblée une thèse neuve puis de la ramener à des catégories connues.
Il est indispensable de se pencher sur l’articulation entre deux domaines, essentiels pour organiser la diffusion de connaissances en SHS : d’abord la structuration du discours par la logique et la rhétorique (que l’on peut condenser en utilisant le concept d’argumentation), ensuite la transposition de cette argumentation sur des supports livresques puis ensuite numériques et les moyens techniques qui les mettent en œuvre. Vue depuis un cadre plus large encore, celui du contexte dans lequel les portails sont élaborés, la diffusion de connaissances par des portails va prendre des formes diverses selon les domaines de savoir et les institutions qui les représentent, qui sont à l’origine de la création des réseaux de distribution de ressources numériques.
Les formes traditionnelles de l’argumentation : le livre, les revues
L’histoire doit prendre en compte les variations des dispositions des lecteurs et les variations des dispositifs textuels et formels (Chartier, 1992) : le Livre vise à instaurer un ordre. Nous voulons montrer que cet « ordre des livres » est le reflet de l’organisation rhétorique du discours. Cette théorie du discours met au premier plan sa structuration (opération active) et relègue au second plan sa structure (le discours comme produit) (Barthes, 1970). Fondée sur les analyses d’Aristote, la rhétorique s’est développée traditionnellement selon cinq parties : inventio, dispositio, elocutio, actio et memoria (Gardes-Tamine, 1992). La rhétorique est considérée comme « un vaste édifice » (Gardes-Tamine, 1996), comme « un système » (Pernot, 2000) ou comme « un empire » (Perelman, 1977), elle est composée de cinq parties :
– l’invention ou art de trouver des idées,
– la disposition ou organisation de ces idées sous forme de plan, – L’élocution ou mise en mots,
– l’action ou art de jouer le texte à la manière d’un acteur, – la mémoire ou ensemble de procédés mnémotechniques.
Les parties qui peuvent aider à comprendre l’organisation du livre sont les trois premières : inventio, elocutio et dispositio. Elles peuvent être mises en relation avec d’autres concepts qui permettent de comprendre le passage de l’élaboration du discours à sa mise en forme sur un support de lecture.
La notion de « figure du texte », de « configuration » peut être rapprochée de celle de dispositio qui émane de la rhétorique (Coutinho, 2004). La dispositio est définie comme le « traitement des contraintes de succession » (Barthes, 1970).
Un texte est fait de parties, de séquences si on le voit dans une optique
« linguistique » (Adam, 2002). Ces parties, quelles que soient leur taille, doivent être organisées les unes par rapport aux autres. Il s’agit donc de choisir « par quoi on va commencer », c’est une question de logique (Grize, 1967).
L’Antiquité déjà avait le souci du classement et la rhétorique se donnait ouvertement comme un classement : de matériaux, de règles, de parties, de genres, de styles (Barthes, 1970). Or l’enjeu du classement, c’est la place du plan. L’enjeu des choix taxinomiques c’est la place de la place, de la dispositio, de l’ordre des parties du discours. Il y a toujours un enjeu à la place des choses : les taxinomies impliquent une idéologie. L’accent est mis sur l’annonce du plan du traité, et la discussion serrée du classement proposé par les prédécesseurs.
Dans l’art rhétorique complet, il y avait deux pôles. D’abord l’aspect paradigmatique : ce sont les « figures » de rhétorique avec la lexis ou elocutio et le choix des arguments avec l’inventio. Ensuite l’aspect syntagmatique : c’est l’ordre des parties du discours, avec la taxis ou dispositio. La fonction de la dispositio est de permettre un arrangement des parties du discours. Cet ordre s’exprime au travers du plan : dans les livres, les articles, il se donne à voir dans la table des matières. On peut donc penser la dispositio comme une projection de l’axe paradigmatique sur l’axe syntagmatique.
Figure 1. La « figure du texte » ou comment le discours se « projette » sur le support
La projection devra donc se faire en fonction du support final pour permettre à un lecteur de « voir » l’argumentation. Il faut rappeler que c’est l’émergence d’une nouvelle technologie, celle du livre imprimé, qui a conduit les
Inventio (euresis ):
Trouver quoi dire Concepts, arguments Elocutio (lexis) : Le mettre en mots
Dispositio (taxis) : Mettre en ordre
imprimeurs, auteurs et libraires du XVIe siècle à concevoir le livre en tant qu’outil de recherche et d’appropriation d’information (Kovacs, 2005). La culture de l’imprimé serait donc à l’origine d’une nouvelle façon de représenter les fonctionnements de l’esprit par rapport au livre. Nous connaissons parfaitement l’ordre des livres car c’est l’univers de référence dans lequel nous avons grandi. Il apparaît donc comme normal que celui-ci soit déplacé dans un premier temps sur les supports électroniques par un « effet diligence 6 » (Perriault, 1986).
Le discours scientifique, contrairement au roman ou à l’essai, n’est pas linéaire. Dans le cadre des sciences, les pratiques des chercheurs imposent des normes de structuration du contenu où le plan joue un rôle essentiel (Lainé- Cruzel, 1999). La forme d’une publication scientifique sera conditionnée autant par le travail de l’auteur que par sa destination : c’est le rôle dévolu au lecteur potentiel ou effectif. Ainsi, il est intéressant d’étudier les résultats d’une enquête qualitative qui a été réalisée auprès d’un certain nombre de chercheurs et d’étudiants et a tenté de cerner les pratiques d’exploitation des articles scientifiques (Ben Abdallah, 1997 7). L’enquête a permis de confirmer que les utilisateurs ont une très bonne connaissance des règles de production appliquées par les auteurs et savent à l’avance qu’ils vont trouver dans un article scientifique l’exposé d’une démarche sous une forme normalisée. Le résumé, la table des matières, l’introduction, l’état de l’art, la discussion des résultats ou la bibliographie sont situés dans les articles d’une manière qu’ils savent localiser. À chaque type de document correspond un ensemble de règles de production, même si cela n’a jamais été explicité (Lainé-Cruzel, 1999). Cette
« normalisation », ce formatage peuvent être rapprochés de ce que Chartier appelle « l’ordre des livres »
La table des matières peut donc être considérée comme une « figure », une
« image » de l’argumentation : l’ordre et le sens des idées s’expriment d’abord par un plan. Sachant cela, nous pouvons observer plus précisément la forme qui est donnée aux « livres » dans les sciences humaines. Chaque partie d’un livre ou d’un article aura une signification dans le cadre du système de la communication scientifique. Les parties du livre ou de la revue scientifique peuvent être mises en relation avec les référents de la communication scientifique. Le livre, en tant qu’objet, est constitué d’une matérialité avec des
6. Les premières voitures avaient la forme de « diligences » par transposition d’un format ancien sur une innovation, avant de prendre leur propre forme.
7. Ben Abdallah, Nabil (1997) Analyse et structuration de documents scientifiques pour un accès personnalisé à l’information utile : vers un système d’information évolué ; Thèse soutenue à l’université Claude-Bernard-Lyon 1 le 7 juillet 1997.
références conceptuelles spécifiques ou encore, à chaque partie (contenu), correspondent des fonctions de communication (relation), des références au contexte scientifique de production :
– première de couverture : titre ; nom de l’auteur ; nom et sigle de la maison d’édition ; nom de la collection (références plus ou moins prestigieuses) ;
– deuxième de couverture : …silence, pause ;
– page de garde : informations éditoriales (caution scientifique plus ou moins grande selon le domaine, l’éditeur, la collection) ;
– page de titre : titre ; sous-titre ; auteur ; éditeur ;
– table des matières : plan et vision synthétique de l’argumentation ;
– texte : introduction, corps de texte (avec niveaux de TIT1, TIT2, TIT3…, paragraphes), conclusion. La typographie, le codage du texte (jeu typographique : police, corps, épaisseur, jeu des blancs séparatifs) structurent visuellement la pensée de l’auteur. Différents choix sont opérés : le choix d’une typographie (police), le choix d’un interlignage, le choix du corps (taille) ;
– notes de bas de pages : références scientifiques comme validation du contenu, savoir établi, consensus sur lesquels on s’appuie ;
– index nominorum, index rerum : concepts choisis et définitions données à ceux-ci ;
– bibliographie : auteurs, théories et univers de référence paradigme scientifique (Kuhn, 1962) ;
– annexes : illustrations et exemples appuyant l’argumentation ;
– troisième de couverture : références imprimeur et contexte matériel de l’édition ;
– quatrième de couverture : résumé de l’ouvrage, extrait représentatif du contenu et présentation de l’auteur.
Cette organisation du livre qui s’est mise en place peu à peu au long des siècles depuis la naissance du codex (Chartier, 1992) a mis en forme notre approche cognitive du savoir et elle est, le plus souvent, reportée sur le support numérique avec des aménagements qui en améliorent l’accès et la consultation, comme nous allons le voir maintenant.
Les évolutions de l’édition numérique en sciences humaines
Pour étudier les métamorphoses de l’édition en SHS, nous avons parcouru de nombreux portails, issus principalement des archives ouvertes (OAI) tels
HAL, PERSEE, Revues.org, les UNT 8, ArchiveSIC, Bibenligne, PASTEL, TEL, Cyberthèses, Cither, etc. et des sites de dépôts comme ROAR, OpenDOAR, etc. L’observation de portails de ressources numériques en SHS montre que la tradition livresque de présentation rhétorique du savoir est transposée sur les formats d’édition électronique. La seule initiative qui s’oppose violemment à la structuration rhétorique est le « programme logiciste » de J.-C. Gardin et le format SCD, dans le domaine de l’archéologie des techniques. Le numérique reproduit d’abord le livre d’une manière brute avec le PDF 9 qui est conçu pour donner une stabilité à l’impression du document et permettre sa sécurisation. Les documents diffusés sous la forme de PDF se veulent l’équivalent le plus fidèle possible d’un document papier, ils en sont parfois la forme photographiée ou numérisée : par exemple Gallica, à la BNF, propose des archives de journaux 10. Un portail issu des sciences dures à l’origine, HAL, fournit la diffusion rapide et efficace d’articles scientifiques en ligne avec son versant pour les sciences humaines et sociales HAL-SHS 11. Les formats préconisés sont toujours des versions numériques de la forme papier traditionnelle : PDF non structuré, Word, … soit fichiers rtf, TeX/LateX, etc. ; dans ce cas, HAL produit automatiquement des fichiers PS et PDF qui seront proposés aux lecteurs. Mais il est également possible de limiter le dépôt à des fichiers visualisables PDF, PS, HTML, …
La présentation éditoriale d’une revue en ligne va souvent prendre l’allure de la revue papier d’origine : l’« ours 12 » et les éléments bibliographiques traditionnels sont présentés transposés du livre. On verra donc la première de
8. Universités numériques thématiques, issues des préconisations du ministère de l’Enseignement supérieur, http://www.universites-numeriques.fr/fr/content/objectifs- et-missions-des-unt
9. Portable Document Format, format de fichier numérique qui stabilise l’organisation du document pour permettre une impression du contenu qui corresponde à la mise en forme originelle sans perte de typographie.
10. Exemple : Le Petit Parisien http://gallica.bnf.fr/ark:/12148/bpt6k664418c.r=.langfr 11. Voir http://halshs.archives-ouvertes.fr/
12. Nom de l’éditeur, nom du directeur de la publication et celui du responsable de la rédaction, nom (ou raison sociale) et adresse de l’imprimeur, date de parution et de dépôt légal, prix (s’il y a lieu), numéro ISSN (placé le plus souvent en haut et à droite de la « une » de couverture) : ces informations peuvent être regroupées dans un encadré, appelé « ours », soit en deuxième, soit en quatrième page de couverture. Cet ours comporte aussi usuellement le nom du rédacteur en chef, la composition du comité de rédaction, le n° CPPAP, le nom des principaux collaborateurs, l’adresse, le téléphone, le fax et le mél de la rédaction, les coordonnées du service d’abonnement et le prix de l’abonnement, éventuellement le nom et les coordonnées de la régie publicitaire et le nom et l’adresse de l'imprimeur.
couverture, l’ISSN, le nom de l’éditeur, la périodicité, etc. et jusqu’à des formulaires d’abonnement en PDF à télécharger. Quelques adjonctions sont spécifiques au numérique comme l’ISSN de la version numérique et des accès au site web de la revue, mais cela ne révolutionne pas l’ « esprit du livre » qui se donne à voir ici sur une page web. La page web permet cependant de donner en une seule fois des informations qui ne seraient disponibles que sur plusieurs pages du livre : la première de couverture, la deuxième de couverture, la page de titre et la table des matières. On en verra des exemples avec les revues de portails de revues en France comme CAIRN 13, PERSEE 14, Revues.org 15…
Dans la tradition de publications scientifiques, pour être acceptés par la communauté scientifique qui va les exploiter, les différents types de documents doivent respecter des contraintes de production précises (Lainé-Cruzel, 1999).
Des normes de structuration du contenu des articles sont imposées selon les domaines : le plan y joue un rôle essentiel car certaines disciplines réclament un type de plan particulier à leur domaine. Cela nous montre bien que la structuration rhétorique étend son empire sur les textes des sciences. Un travail de recherche, permettant sa reconnaissance par d’autres chercheurs, respectera un plan type dans sa construction (plan IMRED 16, plan OPERA 17 etc.). Or, les pratiques évoluent de plus en plus, même dans les sciences dures : en mathématiques par exemple les façons de faire ont changé (Blanchard, 1998).
Jaffe et Quinn, en plaidant pour l’introduction de la notion de « mathématiques théoriques », suggèrent de remplacer le traditionnel schéma DTP (démonstration, théorème, preuve) par un schéma DSTP faisant explicitement place aux spéculations (S) dans la pratique mathématicienne (Jaffe et al., 1993).
Dans les sciences humaines, en droit par exemple, les plans ont une forme particulière, ils sont organisés en deux parties de préférence. Différents types de plans y sont préconisés : descriptifs (analytiques ou chronologiques) ou synthétiques, ils doivent être adaptés au sujet 18. Le seul à se démarquer est le format SCD en archéologie des techniques avec une nouvelle « architecture »
13. CAIRN : 201 revues en SHS, portail de quatre maisons d’édition (Belin, De Boeck, La Découverte et Erès) disponible à l’adresse http://www.cairn.info/accueil.php ; voir par exemple, http://www.puf.com/wiki/Actuel_Marx, la présentation et le site de la revue Actuel Marx .
14. http://www.persee.fr ; voir sur http://www.arss.fr/ la revue Actes de la recherche en sciences sociales, un onglet « ours » : http://www.arss.fr/ourse.php?NUMERO=176-177 15. Voir p. ex. la revue Cahiers d’études médiévales : http://www.revues.org/index484.html 16. Plan « IMRED »: Introduction, Matériel et Méthode, Résultats Et Discussion 17. Plan « OPERA » : Observation, Problème, Expérimentation, Résultats, Action 18. Maury J.-P., Cours de droit constitutionnel : la dissertation juridique. Voir http://mjp.univ- perp.fr/m/dissertation.htm
figée de « plans » qui prend la forme d’une « pyramide d’inférences » (voir la partie réservée à son analyse).
Après avoir vu l’organisation du contenu sous l’influence de la rhétorique, nous allons voir maintenant les formats numériques qui ont été élaborés en SHS pour répondre aux besoins de la diffusion des savoirs par le web.
La Text Encoding Initiative pour les disciplines historiques et littéraires Le choix des formats et des types d’éditions électroniques est spécifique selon les domaines et les disciplines : les innovations y seront diverses et adaptées aux besoins des chercheurs. Dans les disciplines « littéraires », une des innovations les plus riches et les plus élaborées apparaît dès les années 1980 avec la Text Encoding Initiative (TEI) qui permet, par une utilisation réfléchie de SGML puis ensuite XML et un balisage soigneusement pensé, de transposer n’importe quel ouvrage littéraire, historique etc. en un format numérique qui offrira de la valeur ajoutée par sa publication sur internet. On retrouvera sur les pages web toutes les parties qui structurent le livre (vues plus haut), particulièrement la table des matières, les index ainsi que le découpage en titres, chapitres, paragraphes, notes de bas de page, index, etc.
Elle est mise en œuvre dans les domaines de l’histoire, des sources du Moyen Âge, de la littérature, et dans l’ensemble, de corpus en SHS d’éditions de sources manuscrites 19. Apparaissant aussi comme issue du livre, la description du document que l’on retrouve dans le document numérique lui-même sous forme d’un « en-tête » dans lequel il y a les « métadonnées » : l’en-tête dans le format TEI reprend tous les éléments de la description bibliographique traditionnelle telle qu’elle se pratique chez les bibliothécaires.
Le résultat est la mise à disposition des chercheurs de documents historiques : sources brutes, éditions critiques de ces sources, outils de recherche, articles, monographies et essais. Avec les fonctionnalités du format TEI, les textes eux-mêmes sont transposés parfois comme des fac-similés sur des pages web, accompagnés de toutes éditions critiques s’y rapportant, de notes éditoriales, d’index, de tables chronologiques et de tout document utile aux travaux de recherche des scientifiques qui étudient les sources et leurs commentaires. De nombreux corpus en sciences humaines sont ainsi diffusés dans le monde depuis les années 1980, parmi lesquels : British National Corpus 20 ; Stockholm-Umea Corpus of modern Swedish21 ; EAGLES, PAROLE,
19. Voir J.-D. Fekete et N. Dufournaud http://www.lri.fr/~fekete/ps/toulouse98.pdf 20. http://www.natcorp.ox.ac.uk/
MULTEXT 22 ; Lingua Parallel Concordancing Project 23 ; Memoria 24 ; Oxford Text Archive 25 ; Project Runeberg 26 ; Thesaurus Linguae Latinae 27 ; MODEL Editions Partnership 28 ; Brown University Women Writers Project 29 ; Corpus de Referencia del Espanol Actual 30 ; Corpus Diacronico del Espanol 31, etc.
Figure 2. L’École de Chartes et ses éditions électroniques en TEI 32
21. http://spraakbanken.gu.se/parole/Docs/SUC2.0-manual.pdf
22. Lexiques, corpus multilingues http://aune.lpl.univ-aix.fr/projects/multext-cataloc/
reports/GEN1.html
23. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.53.6817 textes multilingues à but pédagogique.
24. Information on historical book resources, linked to a virtual library of digitised documents (Tchèque) http://www.manuscriptorium.com/Site/CZE/default_cze.asp 25. Electronic literary and linguistic resources http://ota.ahds.ac.uk/
26. Free electronic editions of classic Nordic (Scandinavian) literature http://runeberg.org/ : copies photos de textes de littérature nordique.
27. Thesaurus… http://www.thesaurus.badw.de/ : exemple : Teubner, (Stuttgart u.) Leipzig (bis 1999); KG Saur-Verlag, München u. Leipzig (bis 2006); Walter de Gruyter, Berlin, New York (ab 2007.) Bände I – IX.
28. Consortium of seven historical editions which has joined forces with leaders of the Text Encoding Initiative and the Center for Electronic Text in the Humanities http://www.tei- c.org/Activities/Projects/mo01.xml
29. Renaissance Women Online texts : http://www.wwp.brown.edu/
30. http://dialnet.unirioja.es/servlet/buscador
31. Livres, périodiques, revues, mélanges, corpus oraux http://corpus.rae.es/cordenet.html 32. Cartulaire blanc de Saint-Denis voir http://elec.enc.sorbonne.fr/cartulaireblanc/
La TEI est aussi utilisée pour la diffusion de documents sscientifiques d’importance : les thèses de doctorat, avec l’initiative de l’université de Lyon 2 et le portail cyberthèses/cyberdocs 33. L’emploi d’un format léger « TEILite » permet la mise en ligne de PDF structurés ou de documents publiés en XML avec les accès aux parties du texte via un clic. On y retrouve un plan interactif qui permet une réelle navigation, les notes de bas de pages, les index, illustrations etc., typiques de la structuration rhétorique. Les littéraires ont aussi beaucoup travaillé sur des formats spécifiques en TEI pour les genres littéraires.
Sept jeux de base sont proposés : TEI.prose pour les textes en prose ; TEI.verse pour les textes en vers ; TEI.drama pour les textes dramatiques (théâtre, scénario...) ; TEI.spoken pour la transcription d’interviews ; TEI.dictionnaries pour les dictionnaires et les encyclopédies ; TEI.terminology pour les fichiers terminologiques et enfin TEI.general et TEI.mixed permettent de combiner, selon des modalités précises, les six jeux de base précédents.
Figure 3. Édition textes et images du dictionnaire du latin médiéval Charles Du Fresne Du Cange au XVIIe siècle
Il y a donc différentes sortes de corpus en SHS et il s’agit de différents types de documents nécessaires au travail de recherche en SHS, tels les sources (documents primaires), les thésaurus, les dictionnaires, les encyclopédies, les articles, les revues, les collections. Ainsi on verra, par exemple, une édition électronique réalisée par l’École nationale des Chartes à partir de l’édition de L.
Favre (Niort, 1883-1887), du célèbre dictionnaire du latin médiéval rédigé en grande partie par Charles Du Fresne Du Cange au XVIIe siècle : cet ouvrage reste, malgré son ancienneté, une référence incontournable pour la recherche
33. Voir le site http://theses.univ-lyon2.fr/
historique et linguistique sur le Moyen Âge occidental. L’édition électronique du Glossarium s’appuie sur les fichiers résultant d’une opération de numérisation en mode image et en mode texte (encodage en XML conformément au modèle TEI P5) du Glossarium. Actuellement seul le tome 6 du livre (lettres O, P et Q, soit environ 620 pages sur les 6 000 pages à traiter) est traité et consultable.
L’application est le fruit du travail d’une équipe pluridisciplinaire, dont un des objectifs à plus long terme est d’aider à mieux connaître la sémantique du latin médiéval.
De grands portails (très grandes infrastructures de recherche ou TGIR) institutionnalisés se sont constitués avec un intense réseau de partenariat, de collaborations, d’expertise de nombreuses équipes des SHS, de recherche, d’administration, d’ingénierie, de documentation, des centres de ressources numériques, mais aussi d’autres institutions comme le CC-IN2P3, le CCSD, CLEO, PERSÉE, CAIRN, l’ABES, le CINES, l’INTD, le GIS-MSH, l’INIST, etc.
Analyse de formats de documents numériques sur les portails en SHS L’étude des formats d’articles, de livres électroniques ou de documents scientifiques numériques montre une évolution : d’une transposition
« compacte » du document initial, on est passé à des formats numériques de plus en plus complexes, grâce aux langages de balisage qui permettent de structurer le texte numérique. Les portails en SHS ont d’abord proposé les archives de revues en PDF non structurés mais se sont mis ensuite à la TEI et donnent à lire des articles avec des accès facilités par l’édition structurée. Ce sont toujours les principes de l’organisation rhétorique du discours issue du livre ou du périodique qui sont transposés sur le numérique mais avec des fonctionnalités propres au numérique. Les avantages de l’« énonciation éditoriale » du livre sont conservés : le découpage en parties et l’indexation sont particulièrement soignés et donnent accès au contenu de manière très rationnelle, en partie grâce à des « métadonnées » qui permettent une visibilité optimum sur le net et des recherches performantes. La présentation permet de donner accès à la construction du savoir via les concepts utilisés, l’argumentation disponible par la table des matières, les fondements scientifiques par les notes de bas de pages, etc. Ce sont les portails revues.org, persée.fr qui sont les plus avancés dans cette démarche de production d’articles au format TEI.
Il peut être instructif de regarder des revues en archéologie sur le portail revues.org, que l’on comparera ensuite avec the arkeotek journal, revue en archéologie des techniques qui donne des articles au format SCD. On y trouve plusieurs revues en archéologie : Bulletin de correspondance hellénique, Bulletin de la
Société préhistorique française, Bulletin de l’École française d’Extrême-Orient (BEFEO) qui prit l’initiative personnelle de publier Comptes rendus des séances de la Compagnie, Académie des Inscriptions et Belles-Lettres, Journal de la Société des africanistes, Mélanges d’archéologie et d’histoire aux Mélanges de l’École française de Rome, Paléorient, Revue Archéologique de Picardie, Revue numismatique.
Figure 4. Sur PERSEE, la Revue archéologique de l’est
Si l’on observe l’une d’elles, La Revue archéologique de l’est par exemple, on constate qu’elle propose une édition semblable aux périodiques papiers mais avec une navigation possible dans les différentes parties traditionnelles d’un article, grâce au balisage structuré du document numérique. La Revue archéologique de l’est 34 donne une transposition adaptée au format web de la forme traditionnelle élaborée sur les livres, revues papier avec des accès à :
Résumé | Index | Plan | Texte | Bibliographie | Notes | Citation | Auteur Les références à l’ensemble de la revue et son contenu sont données en même temps que l’article et des onglets d’accès à son contenu et son paratexte, dans un bandeau à gauche de l’écran. On a accès à des mots-clés et au contenu synthétique de l’article. Le référencement est très précis et utilise une norme
34. Revue archéologique de l’est http://rae.revues.org/index5236.html
incontournable dans le fonctionnement des Archives ouvertes (OAI 35), le Dublin Core 36, dont on peut voir l’usage étendu et efficace si l’on en parcourt le code source 37.
L’accès au contenu est proposé selon la démarche classique issue de la rhétorique : un plan détaillé est accessible par le biais d’une table des matières dans laquelle il est possible de naviguer pour consulter le contenu de l’article.
Figure 5. L’accès détaillé à la table des matières grâce à un document structuré sur revues.org
On voit les initiatives de la TEI s’accroître via un réseau français depuis 2008, qui organise de nombreux projets, dont on peut voir quelques aperçus sur
35. L’OAI-PMH (Open Archives Initiative’s Protocol for Metadata Harvesting) ou protocole OAI facilite l’échange de données entre des fournisseurs de données (par exemple des bibliothèques ou des musées...) et un fournisseur de service (qui peut être aussi une bibliothèque, un centre de documentation, un portail thématique ou local désirant rassembler des données). http://www.culture.gouv.fr/culture/dll/OAI-PMH.htm 36. Le Dublin Core est un schéma de métadonnées générique qui permet de décrire des ressources numériques ou physiques et d’établir des relations avec d’autres ressources.
Il comprend officiellement 15 éléments de description formels (titre, créateur, éditeur), intellectuels (sujet, description, langue…) et relatifs à la propriété intellectuelle. Voir http://dublincore.org/
37. Le référencement d’un article sur revues.org avec le Dublin Core, voir <meta name="url" content="http://rae.revues.org/index5236.html" />
le wiki de diffusion 38 : corpus représentatif des premiers textes français (CORPTEF) 39, textométrie 40, base de français médiéval (BFM) 41, Weblex, etc.
Outre le formatage de la TEI qui utilise les possibilités de la structuration numérique des documents pour les chercheurs en SHS, il existe d’autres initiatives innovantes d’organisation numérique du savoir en vue de la diffusion de la science par internet. Pour les documents pédagogiques, nous allons voir le concept de « chaîne éditoriale » et dans le domaine de l’archéologie des techniques, ensuite, un format qui se veut révolutionnaire, le format « SCD ».
Les manuels pédagogiques
On ne peut pas traiter de l’édition numérique en sciences humaines sans signaler les innovations dans le domaine des ressources pédagogiques, qui se sont développées particulièrement dans le cadre de l’enseignement à distance.
Un format qui se veut l’héritier et la transposition aboutie de la tradition livresque de transmission du savoir est la chaîne éditoriale SCENARI (Bachimont et al., 1998). Issue de la réflexion théorique de B. Bachimont et d’entreprises dans le domaine de l’ingénierie du document, cette initiative est l’exemple d’une industrialisation réussie de la production de ressources pédagogiques de qualité.
Figure 6. SCENARI sur le web, accès aux concepts, définitions, index, acronymes, glossaires etc.
38. Voir l’accès public au réseau français de diffusion de la TEI ou TEI-res : https://listes.cru.fr/wiki/tei-res/public/index
39. Objectif : constituer un corpus de textes médiévaux français codés en XML-TEI P5 40. http://textometrie.ens-lsh.fr
41. http://bfm.ens-lsh.fr
Deux modèles de ressources pédagogiques, dans les offres proposées par le site et la communauté scenari-sup 42 sont particulièrement intéressants si l’on considère la production de ressources numériques comme transposition de la tradition rhétorique, et s’affichant comme telle : OPALE et M.A.I.HEU.T.I.C.
Dans le modèle OPALE, toute l’organisation traditionnelle et rhétorique d’un manuel de cours (ce que B. Bachimont et S. Crozat appellent la
« structuration logique » en termes d’édition numérique) est convertie en un nouveau format électronique avec un « document structuré » qui permet diverses navigations.
On y retrouve le plan et la table des matières, l’accès aux concepts (« grains ») et à leurs définitions par des index divers, et toutes les fonctionnalités traditionnelles issues du livre mais accessibles par navigation. Le format numérique utilisé, XML avec un balisage soigné, offre aussi des outils particuliers comme valeur ajoutée : il donne des possibilités de navigations multiples et des accès à des index, bibliographies, glossaire, acronymes. Il permet trois types de sorties selon les besoins : format PDF structuré permettant une navigation via la table des matières et les différentes parties avec une impression papier possible (donnant un polycopié sans effort supplémentaire), un format « vignette » pour le cours en présentiel et un format web pour la formation à distance 43. Le produit est structuré toujours selon les principes de la tradition rhétorique et offre en valeur ajoutée de multiples fonctionnalités pour la formation à distance (FOAD) pour les étudiants qui peuvent l’utiliser pour leurs travaux divers annotations, exercices, etc.).
Le modèle M.A.I.HEU.T.I.C, élaboré pour les besoins de la formation à distance (FOAD) de la Chambre de Commerce et d’Industrie de Paris (CCI) affiche ouvertement ses buts qui sont d’employer les éléments de la rhétorique pour favoriser la relation aux apprenants et faciliter leur travail à distance, spécifique dans la FOAD 44. Il est intéressant de voir que l’on revient ainsi de cette manière à la rhétorique pour penser une meilleure communication d’enseignements selon des protocoles nouveaux : la situation d’apprentissage en ligne avec de nouveaux dispositifs.
42. Site de l’Unité d’Innovation ICS http://scenari.utc.fr/ics/co/02_presentation.html 43. On verra un cours, son affichage et ses possibilités de navigation à l’adresse http://www.unit.eu/ori-oai-search/thematic-
search.html?menuKey=unt&submenuKey=unitTag&id=unit_cofinance
44. Voir Martin J., Modélisation et automatisation des procédés d’écriture et de production de supports de formation numérisés : le modèle M.A.I.HEU.T.I.C de la CCI de Paris http://www.ritpu.org/IMG/pdf/ritpu_0203_martin.pdf
Figure 7. Support d’apprentissage pour la CCI de Paris 45
L’organisation des cours est une mise en œuvre d’un modèle produit à l’aide de la chaîne éditoriale SCENARI. Il est adapté pour l’environnement de la CCI et plus spécialement pour les « études de cas » 46. C’est une vision un peu réduite de la rhétorique par les « figures » et par les tropes qui est ainsi transposée mais la réflexion est vraiment digne d’intérêt dans la mesure où elle est conçue sous l’angle de l’efficacité pour l’apprenant et où les concepteurs veulent montrer comment on peut donner à voir des processus de communication par des procédés électroniques.
Après les articles scientifiques sur des portails, des ressources pédagogiques, des manuels transposés de la tradition rhétorique de l’enseignement universitaire, nous allons voir ce qu’il en est d’ouvrages conséquents mis en ligne : des « livres électroniques ».
Le nouvel âge du Livre ?
Nous ne pouvons donner un panorama complet sans parler de gutenberg-e 47, site qui produit des livres numériques édités par les Columbia University Press en collaboration avec the American Historical Association. Les promoteurs du site notent bien expressément qu’ils fournissent des ouvrages où s’entremêlent la
45. Représentation de l’exorde du discours par la figure de l’hypotypose, afin de renforcer l’accord préalable orateur (enseignant) – auditoire (apprenants).
46. http://scenari-platform.org/projects/scenari/fr/showroom/co/maiheutic.html 47. Voir le site http://www.gutenberg-e.org/index.html
« tradition narrative » et « l’accès à des sources primaires » comme des photos, des cartes, etc.
Figure 8. Un livre sur gutenberg-e, le « nouvel âge du livre »
Ce site émane de l’idée multistructurale d’une « monographie électronique » (Darnton, 1999). Loin de prôner l’accumulation pure et simple de données ou la simple création d’hyperliens, il proposait d’organiser le livre électronique en couches pyramidales. Ainsi, après une démarche de fragmentation, un mouvement de recomposition. Une couche pour un exposé concis du sujet.
Une couche suivante avec des versions étoffées. Une troisième couche qui rassemble des documents associés à des essais d’interprétation. Une quatrième couche théorique ou historiographique et une cinquième couche pédagogique pour organiser des discussions, comportant des suggestions etc. Il n’en est pas resté au stade des idées mais a donné naissance au projet Gutenberg-e 48 qui est devenu un mode d’édition électronique scientifique. On trouve sur le portail des mémoires de thèse, des actes de colloques, des articles, des monographies numériques etc. Ces dernières proposent effectivement des ouvrages enrichis en matériaux divers 49 où l’accès au savoir apparaît en ensembles ou en couches diverses. Les zones découpées du savoir sont regroupées en un ensemble cohérent où l’on peut trouver matière à recomposer un tout qui fasse sens : c’est bien ce que permet la rhétorique et ce sur quoi repose son projet.
48. http://www.historians.org/prizes/gutenberg/index.cfm 49. http://www.gutenberg-e.org/andrade/
Les livres ainsi mis en ligne ont toutes les caractéristiques de l’organisation rhétorique : on en verra un exemple avec Bin Yang, Between Winds and Clouds : the Making of Yunnan, 200850. Il est possible de comparer avec l’initiative GoogleBooks qui propose des livres numérisés : ici encore tous les éléments de l’organisation rhétorique élaborée par la tradition livresque se retrouvent combinés dans les langages propres à l’informatique pour donner un « livre numérique » 51.
Les formats proposés jusqu’ici se situent tous, de manière explicite ou non, dans la continuité rhétorique et livresque de la tradition établie ces six derniers siècles. Il faut maintenant étudier le format innovant qui se veut en rupture totale avec les formes rhétoriques, le format SCD qui se veut « logiciste ».
Le format SCD en archéologie des techniques : l’anti-rhétorique
Avec une approche totalement différente, le format Scientific Constructs and Data (SCD), de diffusion en archéologie des techniques, est issu des travaux de J.-C. Gardin et de ses recherches sur l’aspect documentaire du travail scientifique, son « archéologie théorique » (Gardin, 1979). L’auteur a échafaudé un système théorique pour aboutir à un nouveau format de publication pour les SHS, qui leur redonne « un caractère réellement scientifique comme les sciences dures ». Il souhaite donc formaliser les publications en SHS selon l’empirisme logique qui, seul, en fonderait le caractère scientifiquement « pur ». Son but est d’aligner les SHS sur ce qu’il estime être le « modèle » des sciences dures. Il professe un rejet total de la rhétorique « qui cherche plus à convertir » qu’à exposer, et de ses plans. La démarche exige la transformation d’un discours scientifique traditionnel en « schémas logicistes ».
Ce résultat exige un long travail de reformulation, effectué par des personnes spécialement formées dans ce but, qui doivent condenser le discours et en dissocier les aspects internes : il faut établir une distinction entre le
« modèle » et le « récit ». Diverses étapes sont nécessaires : prendre le plan initial de l’auteur ; en séparer d’abord les deux aspects « raisonnement » et
« narration » ; les reconfigurer selon deux formes éditoriales distinctes. Le format éditorial qui en résulte donnera une publication hybride avec une partie
50. http://www.gutenberg-e.org/yang/
51. On en voit un exemple avec Meerhoff K., Rhétorique et poétique au XVIe siècle en France.
http://books.google.fr/books?id=HqIfAAAAIAAJ&pg=PA325&lpg=PA325&dq=ra misme&source=bl&ots=PYdNSchvhe&sig=-fHUgDhaa9a49-7Ti9hO-ORTyJg&hl=
fr&ei=CuPcSaC5Cd2rjAf15smbDg&sa=X&oi=book_result&ct=result&resnum=8#P PA317,M1
papier ou discursive réduite au strict minimum (une centaine de pages pour les monographies) et une partie multimédia où apparaîtra le « raisonnement » avec des écrans de lecture dans des niveaux successifs (de quatre à dix « étages » selon les nécessités de transcription de la pensée de l’auteur). La mise en œuvre du support éditorial a été effectuée par V. Roux (directeur de recherche au CNRS), associée à l’éditeur P. Blasco (Éditions Epistèmes) et aux Éditions de la Maison des sciences de l’homme, à Paris, qui a créé une collection
« référentiels » pour l’occasion.
Figure 9. Un « schéma logiciste » qui donne la « pyramide d’inférences »
En parcourant le portail de the arkeotek journal 52, on peut voir la publication d’articles scientifiques au format SCD. Les points de repères de l’organisation rhétorique ont totalement disparu et la séparation de la « partie discours » de la
« partie raisonnement » apparaît dans l’organisation des onglets de consultation disponibles. On a les parties « pages introductives », « règles d’inférence »,
« schéma logiciste », « article + données » et « bibliographie ». Les « pages introductives » correspondent à ce qui reste de discours, et sont réduites à une seule page web.
L’« article » lui-même n’a plus rien à voir avec quoi que ce soit de connu. Le feuilletage des pages donne accès à des étages successifs de « propositions »
52. Voir http://www.thearkeotekjournal.org/#
représentées par des symboles PO, P1, P2, P3 etc., accompagnées de données descriptives comme des photos d’objets ou des références correspondant à des
« arguments ». La formalisation ainsi mise en œuvre propose des contenus représentés par des symboles.
Figure 10. La partie textuelle d’un article au format SCD
Figure 11. Deuxième écran de lecture avec des « propositions » et des « arguments » accompagnés de « données brutes »
Le périodique en ligne veut aussi constituer une « base d’inférences » : les raisonnements interprétatifs sont listés sous forme de « règles d’inférence » et mis en débat : des pages spéciales sont consacrées à l’archivage de leurs énoncés, donnant ainsi les « données brutes de la science », les interprétations faites à leur sujet et les règles qui ont servi à leur élaboration. Il doit donner aux chercheurs, dans l’avenir, la possibilité d’accéder à des « bases de connaissances ».
Par ailleurs il faut noter que le format SCD lui-même est propriétaire (créé et géré par l’éditeur P. Blasco) et rendu disponible uniquement via l’équipe de V. Roux qui organise la diffusion des œuvres en archéologie des techniques. Le format est sous-tendu par des ontologies qui sont élaborées par l’éditeur.
L’utilisation de la plate-forme de support « Joomla » n’a pas été développée du point de vue de la description des contenus. Il n’y a pas de métadonnées sur les
« grains » : ni sur les « propositions », ni sur les « arguments », ni sur les
« données brutes ». Les seules métadonnées (balises « meta » uniquement en HTML) concernent uniquement les titres et auteurs. Le format SCD se démarque ainsi à tous points de vue des portails en SHS, tant par l’organisation du contenu, par son opposition farouche à la rhétorique que par les choix techniques ou descriptifs qui donnent forme au portail the arkeotek journal.
Conclusion
L’observation des ressources diffusées en sciences humaines et sociales montre que c’est encore la tradition issue du livre fondée sur l’art rhétorique du discours, transposée avec des formats numériques, qui domine largement les publications électroniques (ouvrages ou articles). On y voit à l’œuvre un plan
« créatif » issu de la rhétorique, c’est-à-dire propre à chaque étude, chaque auteur, chaque domaine et correspondant à une argumentation chaque fois nouvelle.
Un seul format est en opposition radicale avec la rhétorique d’édition multimédia: le format Scientific Constructs and Data (SCD) fondé sur le
« programme logiciste » de J.-C. Gardin. On y propose un plan type, une structure figée, comme modèle et norme auxquels doit se conformer tout discours en SHS pour être « scientifique ». L’ordre y est contraint par une structure pyramidale, structure vide qui doit être remplie et dont les nœuds sont représentés par des « propositions » qui doivent exposer les « données brutes de la science » de manière concise. Il n’y a plus de texte, de contexte ni de discours : il s’agit de « consulter » des théories scientifiques et non plus de donner à lire. La publication, pour J.-C. Gardin, devrait avoir une forme
« logiciste » (qui se rapprocherait de la logique) pour que le « raisonnement »
soit donné à voir, comme une « pyramide d’inférences ». Il n’y est pas fait de distinction entre « raisonnement analytique » et « raisonnement dialectique ».
On ne peut d’ailleurs plus le placer, ni dans la première catégorie car il ne s’agit pas rigoureusement d’une démonstration, ni dans la deuxième dans la mesure où l’aspect « communication » a disparu. Cet aspect réapparaît dans la partie
« forum » où devraient être discutées les « règles d’inférence ».
Le traitement ainsi appliqué par le format SCD apparaît d’autant plus marginal que, même dans les sciences dures, la transmission du savoir se fait toujours selon les méthodes traditionnelles. Même si l’on parcourt des sites institutionnels en sciences dures, on peut constater que la diffusion du savoir se fait toujours selon des formes rédigées en adéquation avec l’art rhétorique, sans que cette forme soit remise en question. Le format SCD reste totalement inconnu, si ce n’est de la petite communauté en archéologie des techniques qui est convaincue de son utilité et fait du « prosélytisme ». La tendance générale est pourtant bien différente, lorsqu’on se penche sur la (très prolifique) littérature qui traite de systèmes et de logiciels pour améliorer la diffusion ou la recherche d’information scientifique sur le Net. Il existe tellement de travaux et de réalisations logicielles ou conceptuelles dans ce domaine qu’il paraît difficile de les citer tous.
Si l’on en cite seulement quelques-uns on s’aperçoit que la démarche en général est de prendre les documents rédigés de manière argumentative et de leur appliquer des traitements informatiques divers et variés. Nous pouvons en citer quelques-uns. Un de ces travaux paraît symptomatique, par exemple : sur les repérages de la structure rhétorique des documents scientifiques (Ibekwé, 2005). Des perfectionnements sont élaborés pour améliorer les systèmes de recherche d’information (Chaudiron et al., 2001). L’usage sémantique de normes donne lieu à des développements sémantiques, telles les métadonnées conceptuelles dans la norme MPEG-7 (Hasuda, 1999) ou les « structures de traits » dans l’usage de la TEI (de la Clergerie 2003). Ou encore, parmi les plus récents projets mis sur pied par l’INIST 53 par exemple, et d’autres organismes de recherche prestigieux : ils étudient les liens entre données brutes de la science et le contenu scientifique de documents dans de très grandes infrastructures de recherche (cf. les deux projets du CNRS SIDR 54 en biologie ou Anthroponet 55 en SHS, etc.)
Les travaux les plus récents sur l’encodage des documents, ou le web 2.0 appliqué à la diffusion scientifique, montrent que l’on travaille dans le sens de
53 INstitut de l’Information Scientifique et Technique du CNRS, http://www.inist.fr/
54. http://www.sidr-isb.eu/
55. http://www.tge-adonis.fr/?ANTHROPONET
balisages intelligents de documents dont la rédaction est traditionnelle pour ensuite leur appliquer des traitements et des manipulations rendus possibles grâce aux logiciels informatiques. La forme de rédaction, la manière de « parler la science » n’est pas fondamentalement remise en question et l’on cherche des solutions dans la fouille de textes, la création de liens entre éléments de documents, l’emploi de normes toujours plus perfectionnées mais pas dans l’obligation pour tous de remettre en cause les fondements cognitifs d’écriture et de lecture des textes de science.
Il semble ainsi que, même si elle continue à vivre masquée mais bien vivante, la rhétorique ait encore de beaux jours devant elle. Les besoins spécifiques des formats adaptés aux « écrits d’écran » amèneront peut-être à de nouvelles formes d’édition et de présentation du savoir. Actuellement, nos capacités cognitives nous maintiennent encore dans « l’empire rhétorique ».
Bibliographie
Barthes R., « L’ancienne rhétorique », Communications, n° 16, 1970, p. 172-229.
Blanchard P., « Jeux et enjeux de l’écriture scientifique : des stylistes aux fabricants de textes », Alliage, n° 37-38, 1999, p. 42-49.
Borel M.-J., « Argumentation et schématisation », in Borel M.-J., Grize J.-B., Miéville D., Essai de logique naturelle, 2e éd. Bern, Peter Lang, 1992, p. 1-98.
Chartier R., L’ordre des livres : lecteurs, auteurs, bibliothèques en Europe entre XIVe et XVIIIe siècle, Aix-en-Provence, Alinéa, 1992.
Chartier R., Culture écrite et société : l’ordre des livres (XVIe-XVIIIe siècles), Paris, Albin Michel, 1996.
Chaudiron S., Ihadjadene M., Role F., « Exploitation de l’indexation par les auteurs pour le filtrage de documents structurés », in Chaudiron S., Fluhr C., Filtrage et résumé automatique de l’information sur les réseaux, Nanterre, CRIS, 2001, p. 39-47.
Coutinho A., « Schématisation (discursive) et disposition (textuelle) », in Adam J.-M., Grize J.-B., Bouacha M. A., Texte et discours : catégories pour l’analyse, Dijon, éditions universitaires de Dijon, 2004, p. 30-42.
Darnton R., “The New Age of the Book”, The New York Review of books, vol. 46, n° 5, March 18, 1999.
De la Clergerie Eric, Structures de traits, AFNOR 2003 [en ligne]
http://atoll.inria.fr/RNIL/TC37SC4-docs/slides230903B.pdf
Delmotte S., La formalisation des publications scientifiques : les sciences humaines et sociales à la recherche de fondements scientifiques, Thèse de doctorat, université Paris X-Nanterre, 2007.