• Aucun résultat trouvé

La continuité entre données, informations et connaissances

4. La référence centrale à l’Ingénierie des Connaissances

4.4. La continuité entre données, informations et connaissances

4.4. La continuité entre données, informations et connaissances

4.4.1. De l’information transmise à la connaissance

interprétée

Nous devons maintenant préciser ce que nous entendons par données, informations et connaissances, dans un projet qui en s’appuyant sur l’IC vise à valoriser un mode d’approche « sémiotique » de ces notions.

Après l’avènement de l’ordinateur, le concept d’information a historiquement été polarisé dans une certaine direction par l’informatique. Comme concept technique, l’information a surtout été présentée après [SHANNON 48] dans le prolongement direct des usages en ingénierie des télécommunications, en mettant l’accent sur les concepts de codage, de transmission et de décodage, et en faisant référence au nombre de messages potentiels que peut délivrer un système.

Un certain nombre de critiques sont ensuite venues de divers horizons, non seulement des Sciences du Langage, des Sciences de l’Information et de la Communication et d’une façon générale des Sciences Humaines( [VION 00], [WATZLAWICK 72], pour ne prendre que quelques exemples) mais aussi du sein même de la Systémique, de l’Informatique et des Systèmes d’Informations [LE MOIGNE 94], [ARSAC 87] [PRINCE 96], faisant valoir suivant les cas des arguments systémiques ou des arguments sémiotiques, permettant d’infléchir et d’enrichir la définition des données et de l’information.

D’un point de vue systémique, une donnée a ainsi pu être définie comme toute information, au sens de quantité transmise et codée de la théorie de Shannon, affectant un programme ou un système pour en modifier le comportement. Dans cette vision systémique, les données évoluent et se renouvellent, alors que leur processus d’utilisation est fixe. Mais un programme ou un processus peut lui-même être la donnée d’un autre processus. Peu à peu la frontière entre données, information et processus s’est donc brouillée, et nous verrons qu’il en est de même entre ces notions et les connaissances. Au final de cette évolution, pour [CHARLET 03], « nous sommes devant un continuum par rapport à un processus d’action et nous plaçons des étiquettes sur des concepts manipulés par ce processus en fonction des niveaux d’entrée dans celui-ci. » C’est en fonction de l’action qui est effectuée, ou même simplement projetée par la personne, ou prévue par le processus où doit intervenir cette personne, que les données sont interprétées, prennent du sens et deviennent suivant les cas des informations, des savoirs ou des connaissances. C’est en fonction de l’endroit où l’on se trouve dans un processus d’action et du sens que prend globalement cette action que l’on va déterminer quelle étiquette choisir parmi ces trois types. Or ce processus d’action peut être (ou inclure) un processus de traduction ou d’interprétation. Cela nous permet alors de nous relier aux approches sémiotiques de l’information, qui vont être pour nous plus intéressantes encore.

Pour [PRINCE 96], en référence à la sémiotique saussurienne, une donnée est un signifiant, appréhendé donc au moyen de signes (tels que des symboles - passage par une transcription - ou des signes physiques - signal, impulsion électriques, ondes…) susceptible d’être capté, enregistré, transmis ou modifié par un dispositif de traitement de l’information, naturel ou artificiel. De son côté l’information est un signifiétransporté par une donnée. Ce signifié est dépendant des procédures de

décodage des données (c’est-à-dire d’extraction de l’information) et de l’univers cognitif des agents qui mettent en œuvre ces procédures. Une connaissance renvoie alors au registre du « mode d’emploi » permettant de transformer ces données en information, donc « à ce qui permet le passage entre le signifiant et le signifié » [PRINCE 96].

Si l’on considère l’inscription 7 543.80, ce signe brut va devenir une donnée dans la mesure où comme inscription il est pris dans un support numérique et traitable par exemple dans le contexte d’un dispositif computationnel comme un tableur. Savoir que 7 543.80 est le chiffre d’affaires réalisé annuellement par la société Y avec le client X est une information. Nous parlerons aussi de contenu informationnel, ou tout simplement de contenu. Pour le commercial de Y en train d’organiser sa journée et responsable du client X, interpréter à son tour ce contenu pour catégoriser X comme « un assez bon client, donc à placer vers le haut de la pile avec potentiellement une tactique de proposition de rabais plus favorable », correspond à un niveau d’interprétation plus poussé, celui de connaissance et de savoir-faire. A travers ces connaissances les actions prennent sens par rapport à une ou plusieurs activités (l’activité métier du commercial pour l’action de « savoir reconnaître un bon client », ou une activité relationnelle hors travail, pour l’action de « savoir pérenniser des relations », si par ailleurs X et Y font partie du même club sportif, etc.).

De la même façon, en anticipant sur l’analyse plus complète d’un exemple étudié par le psychologue du langage H. Clark (cf. §5.1.1.3), si une vendeuse dit au client « j’arrive dans un instant », plusieurs informations ou connaissances sont susceptibles d’être induites simultanément par le client à partir du signe brut que constitue la vibration sonore « j’arrive dans un instant », qui s’inscrit de façon éphémère la couche d’air : l’information selon laquelle la vendeuse parle français, l’indication qu’elle va le servir dans un moment, et à un plus haut niveau encore, la sorte de contrat qu’elle propose au client pour qu’il accepte le délai qu’elle lui propose. S’agit-il d’informations ? De savoir, de savoir-faire ou même de « savoir être » ? De connaissances ? Ce qui ressort surtout, ce sont les multiples transformations sémiotiques du signe en significations, par des acteurs, dans un lien étroit de cette activité qui est en définitive langagière avec l’activité plus générale et sociale (ici organiser, vendre, s’occuper d’un magasin…) dans laquelle ils sont plongés. Ce qui fera ou non que la vendeuse est une « bonne vendeuse », car elle sait communiquer et convaincre un client d’attendre (ou dans l’exemple précédent, ce qui fera que le commercial est un « bon commercial » car il sait hiérarchiser les clients), sera avant tout leur capacité à traduire, à interpréter, à transformer et produire la signification dans le contexte d’une activité.

Un autre exemple, dans une situation proche de celle choisie par H. Clark, est également intéressant parce que, venant de l’IC, il concerne une transaction entre deux acteurs, tout en menant à récuser toute possibilité de modéliser complètement un unique sens de cette situation, à cause de la variabilité sémiotique. C’est l’exemple de la boulangère, proposé par B. Bachimont en 1994 : « Prenons par exemple un être humain qui achète du pain dans une boulangerie : il le paye à la boulangère. Le problème est : pourquoi le sujet donne-t-il de l’argent à la boulangère ? Si la situation est totalement décrite de façon physico-mathématique, alors tous les événements seront prédits par le modèle. Notamment le fait qu’il paye le pain. Pourtant cet événement sera indiscernable d’une situation possédant les mêmes propriétés physico-chimiques, mais qui n’aurait rien à voir avec le fait d’acheter du pain. En effet, la théorie physique ne pose que des classes d’équivalence entre des situations (tous les arrangements possibles d’électrons, photons et autres particules qui possèderont les propriétés fixées par cette théorie) et non des descriptions complètes, absolument déterminées des situations : il n’existe pas de théorie complète de l’univers telles que toutes les situations particulières puissent être décrites en tant que celle-ci et pas une autre. Décrire une situation, c’est en décrire d’autres qui sont équivalentes à la situation modulo la théorie. La classe d’équivalence de la situation en contient d’autres où le fait de vouloir acheter du pain n’est pas présent. Par exemple, la même description physique peut décrire une situation où le sujet humain rembourse sa vieille amie qu’est la boulangère, qui d’une part lui avait prêté de l’argent et d’autre part lui donne du pain gratuitement. Une même description rendra compte de situations que nous autres simples mortels trouverons différentes. » [BACHIMONT 94]

Nous avons repris intégralement ce passage, car il permet de comprendre pourquoi une approche sémiotique est nécessaire, car l’approche de modèle « fort » et cognitif de l’humain comme STI, selon le projet initial de modélisation de l’IA, est ici prise en défaut.

Ce qu’ici la théorie physique ne saurait démêler est la possibilité d’existence en concurrence, sous une forme extérieure exactement semblable, de plusieurs actions (cf. §3.3.3.3) au sens de théorie de l’activité. Cet exemple montre des acteurs dans une situation d’activité dont ils partagent le sens, et dont même un observateur humain (un client vieil habitué de la boulangerie qui serait témoin de la scène) pourrait intersubjectivement partager le sens sans se tromper sur l’interprétation. Ce sens partagé résulte de conversations passées et continue à se construire dans le présent au moyen de signes et d’interactions, qui participent de transactions communicationnelles symboliques (cf. §.3.3.6 et §4.6.7). Il continuera à se construire dans les conversations ultérieures. Si une telle situation devait être exactement transposée dans un cadre de commerce à distance ou de « gestion de la relation client », se basant sur un artefact recourant aux NTIC, la question serait tout autant posée, non pas d’un système à base de données, d’informations ou de connaissances articulés dans un modèle « fort », mais de la façon dont un artefact, selon un modèle « faible » (vraisemblablement un outil de TCAO) pourrait servir de support aux repères sémiotiques du cadre d’interprétation permettant au client, à la boulangère et aux témoins de se comprendre.

Bien qu’elle ne soit pas contradictoire, et qu’elle puisse être mise en correspondance avec la sémiotique saussurienne, nous verrons que la sémiotique pragmatique de Peirce offrira une perspective encore plus précise pour affirmer ce principe de continuité entre donnée, information, connaissance et action. Ce qui va décider de la façon de « placer les étiquettes sur des concepts » suivant les cas va être déterminé essentiellement par la place qu’occupe à un moment donné l’information dans un processus sémiotique où elle est tour à tour non interprétée (le signe brut, la donnée) ou interprétée (l’information, la connaissance, l’action), de très nombreuses différences pouvant alors intervenir selon la grande diversité des interprétants potentiels11. Mais il faut maintenant expliciter et justifier davantage cette dernière transition, que nous venons de pointer, entre connaissance et action.

4.4.2. La connaissance comme action

Confrontée à fournir une définition précise de la connaissance, qui de plus tienne compte du versant information (nécessaire à la cohérence avec les définitions utilisée par la discipline voisine des Systèmes d’Information), l’Ingénierie des Connaissances n’a eu de cesse de se défaire de sa tendance initiale à une certaine « réification » des connaissances, en choisissant des interprétants liés aux processus et aux activités humaines. Il fallait pouvoir se poser la question de la connaissance comme « mode d’emploi » (donc comme action) permettant de transformer les signes en significations, en lien avec l’usage réellement effectué de cette connaissance ou de ce savoir par les acteurs dans leur activité.

Pour prendre encore un exemple, considérons une connaissance comme le solfège : la forme « réifiante » de la connaissance va consister à représenter la connaissance « pour elle-même » dans un manuel ou dans un système expert (par exemple en y consignant un certain nombre de règles de notation, de théorie de la musique, d’algorithmes d’harmonie, etc.) où en dehors de certaines tâches scolaires les activités potentielles « utilisatrices » du solfège apparaîtront pas ou peu. Du point de vue de la pédagogie, mettre ainsi à l’écart des

11 Alors que la relation sémiotique proposée par Saussure est une relation duale entre signifiant et signifié, la relation-signe de Peirce offre pour nous une précision accrue, car pour Peirce une connaissance est une relation ternaire entre le signe, son objet et son interprétant (cf. §5.2.4). Ce dernier est l’instance tierce où se forme le sens, c’est à dire l’interprétation, ce qui inclut la notion d’effet potentiel : comme nous l’avons vu dans le cas de l’exemple du solfège, une connaissance prendra plus complètement sens en tant que connaissance en s’actualisant en termes d’action, et ainsi de suite car cet interprétant est lui même un signe pour un autre interprétant (pour l’interprète qui accomplira une relecture de la partition, ou répète en jouant pour un public imaginé, pour « le public » qui recevra l’interprétation musicale, pour « la critique » qui jugera qu’elle est bonne, pour le cadran du capteur qui indiquera à l’ingénieur du son que le niveau sonore est suffisant pour un bon enregistrement, pour l’audimat, etc.). La potentialité fait donc partie de l’interprétant peircien. Selon [BACHIMONT 96] « une connaissance est une connaissance parce qu’elle commande l’action : elle ne la commande pas comme une force physique à son effet, mais comme un type à son instance. Elle prescrit la nature de l’action à venir, de l’action possible. Idéale car pas encore réalisée et pouvant ne jamais l’être, la connaissance est le rapport idéal d’un signe à son objet pour un interprétant, pour l’action de l’interprétant » (cité par [BACHIMONT 03]).

Sauf mention contraire, nous utiliserons la notion d’interprétant au sens de Peirce, pour lequel (comme nous le définirons au §5.2.4) l’interprétant ne désigne pas forcément une personne mais peut être aussi être de nature extrêmement variée : un effet attendu de l’action, une institution, une norme, etc. (« le public imaginé », « l’indication du capteur » « la critique », « un niveau sonore suffisant », « l’audimat »). Il est important pour nous d’utiliser cette définition, car nous définirons dans la suite, à la fin du chapitre 5, la notion de « point de vue » du modèle Hypertopic en référence justement à l’interprétant peircien.

pans entiers d’activités liées, pour mettre en valeur une « connaissance pure » autour de tâches scolaires, correspond à une façon d’enseigner (« le solfège pour le solfège ») qui a prévalu à d’autres époques, avant d’être sévèrement critiquée dans des méthodes plus récentes qui ont donné une plus grande place aux exemples et inversé le modèle. Les exemples en particulier introduisent une forme « non réifiée », qui considère que cette information prend sens dans une activité, effet potentiel de cette connaissance. Cette activité sera par exemple de déchiffrer une partition pour chanter, jouer d’un instrument, composer, diriger un orchestre, etc., mais aussi résoudre des problèmes théoriques de solfège, ou enseigner le solfège, qui sont aussi des activités. On voit qu’il existe toute une progression d’interprétants des mêmes signes que sont les inscriptions du manuel (ou du système expert). Dans l’action de lecture d’une page du manuel théorique est potentiellement présente la variété des actions et activités dans lesquelles cette lecture se projette, mécanisme que la pédagogie va utiliser éventuellement pour appuyer l’apprentissage d’une connaissance sur diverses activités utilisatrices. On sait qu’on oublie moins facilement une connaissance si on l’investit sans tarder dans une activité, etc. Les connaissances réifiées du solfège prennent sens, et sont donc beaucoup plus facilement comprises et mémorisées, si elles sont en rapport étroit, comme action potentielle, avec un projet de mise en pratique musicale. Le projet peut modestement se borner à chantonner intérieurement quelque air, en utilisant plus ou moins consciemment les connaissances ainsi assimilées. Il peut aussi impliquer une activité collective de plus haut niveau, supposant de mettre en jeu ces connaissances, cette fois partagées, dans des activités conjointes et des interactions très complexes (pour se coordonner d’un point de vue harmonique et rythmique, s’accorder sur la sémantique musicale, faire face aux événements imprévus, etc.) de la part des interprètes et des auditeurs d’une œuvre musicale. C’est dans et par ces projets potentiels que le solfège comme connaissance réifiée prend son sens comme connaissance-action.

L’IC reconnaît aujourd’hui [BACHIMONT 04] [CHARLET 03] qu’il y a présomption de connaissances, si la faculté d’utilisation de l’information dans une activité (utilisation « à bon escient ») est attestée. Cette utilisation passe par une interprétation puis par une action, qui est d’abord une réécriture par l’utilisateur d’un outil (dans notre cas, un outil informatique). L’IC reconnaît en second lieu qu’il y a connaissance quand il y a contexte d’utilisation de l’information. Et enfin comme nous l’avons vu, l’IC considère que la connaissance a priori n’existe pas : elle est construite à partir d’un projet propre au modélisateur [LE MOIGNE 94]. Etudier cette construction permet d’essayer d’en dégager des invariants méthodologiques, ce qui est le projet des épistémologies constructivistes

[ZACKLAD 04] résume cet ensemble de positions de l’IC dans la définition suivante : « la connaissance désigne un potentield’action attribué à un acteur individuel ou collectif dans le contexte d’une situation au sein de laquelle celui-ci poursuit un projet. C’est uniquement dans l’action, c’est-à-dire dans le cadre de la réalisation des transactions communicationnelles symboliques, que les individus rendent manifestes les connaissances qui les caractérisent en tant qu’acteurs à travers leurs productions sémiotiques et physiques ». On voit que cette définition de la connaissance place aussi des jalons plus détaillée dans le sens d’une vision de l’action, pensée en termes d’interactions (nous reviendrons sur les transactions communicationnelles symboliques au §4.6.7, et sur les productions sémiotiques au §4.6.2). L’objectif est en effet de disposer d’outils conceptuels permettant de penser la connaissance-action dans le contexte de l’activité collective coopérative, problème pour lequel nous avons tenté de préparer soigneusement le terrain au chapitre précédent.

4.4.3. Les dimensions d’expansion de l’information et de la

connaissance

Si les fondements de l’information et de la connaissance sont l’inscription et l’interprétation par la réécriture, il convient aussi de tirer les conséquences de la grille de lecture sémiotique que nous adoptons, en direction des « langages de représentation » de la connaissance. En effet, comme nous le verrons, c’est avec un tel « langage de représentation » que, conformément aux objectifs de l’IC, nous comptons essayer, non pas de modéliser, mais de « dégager des invariants » pour la construction de cette connaissance telle que nous l’avons définie.

Considérons plus précisément notre champ d’études. Nous avons resserré ce champ (cf. §2.4) autour d’objets assez précis, en considérant une communauté confrontée dans son activité à un phénomène en évolution qui est son espace informationnel. Le groupe peut considérer cet espace changeant de documents et de contenus informationnels en tant que phénomène, qu’il a besoin de se représenter. En particulier, il doit faire face à une croissance continue de l’information qui influence l’activité de ses membres, et il existe des cas (auxquels nous restreignons l’horizon de notre étude, cf. §2.4.1) où une partie de ce phénomène présente certaines régularités, comme la présence d’objets suffisamment proches pour qu’on puisse parler de « collection », relativement homogène (de personnes, de projets, de produits…). A partir de tels objets des catégorisations plus fines vont pouvoir être entreprise par la communauté, une partie de la connaissance s’organisant alors suivant d’autres régularités, c’est à dire suivant un modèle au sens habituel du terme, ou suivant ce qu’on appelle en IC un langage de représentation.

Dans ce contexte, nous pouvons invoquer une autre définition plus sémiotique et phénoménologique de l’information, bien antérieure à celle de Shannon. Cette définition est celle du premier des sémioticiens, C.S. Peirce [PEIRCE 1868]. Celui-ci considère le lien entre le concept et l’information dans une approche qui privilégie non le canal de transmission, mais l’interprétation, la communication humaine et la signification dans sa dimension conceptuelle. Peirce propose un modèle pour l’information. Selon ce modèle, l’information est une grandeur sémiotique qui, dans la plupart des cas, est en expansion, et dont l’expansion se déroule sur deux dimensions de largeur et de

profondeur. Plus précisément, l’information grandit pour Peirce, ainsi que l’aire d’un rectangle, comme le produit de sa largeur par sa profondeur ([MORAND 04], pp.187-200). Il y a expansion de l’information quant l’aire du rectangle croît, par exemple quand il y a à la fois augmentation de