• Aucun résultat trouvé

3. Systèmes d’onglets

1.5 Le triple modèle à trois modules

l’Intelligence Artificielle, ce qui aurait l’avantage de séparer les fonctionnalités du dispositif et les éléments du corpus. De cette manière, il serait possible de reproduire sur d’autres corpus ce qui aurait été mis en place une première fois dansCoLiSciences.

Mais le moteur hypertextuel n’est a priori pas capable de tirer parti des parcours réalisés par les internautes pour évoluer et s’enrichir. Bien entendu, il est toujours techniquement possible d’envisager d’ajouter cette possibilité au moteur, mais elle sera artificielle, parce qu’elle demande que le moteur hyper- textuel soit capable d’enregistrer des informations sur le réseau hypertextuel, en dehors de ce réseau. Ce qui conduirait à avoir un moteur hypertextuel spécifique pour chaque corpus.

De cette réflexion est née tout d’abord l’idée de doter le réseau hypertex- tuel de capacités à enregistrer les parcours des lecteurs, ce qui s’est poursuivi par l’idée que le réseau hypertextuel pourrait aussi être considéré comme un

Chapitre 1. Introduction

réseau neuronal doté de fonctions d’apprentissage. Ce n’est plus le moteur qui s’enrichi des lectures, c’est directement le corpus.

Les parcours de lecture, par un phénomène assimilable à la rétro-action, enrichissent le réseau hypertextuel, qui lui-même en retour ouvre de nou- veaux parcours sur la base de ces nouvelles connaissances. Lecteur et hy- pertexte interagissent, ouvrant ainsi de nouvelles voies, symbolisées par ces nouveaux parcours.

Le dispositifCoLiSciences pourrait être considéré comme un catalyseur qui

conduit un lecteur à se poser des questions, pour lesquelles il cherche une solution dans les liens qui lui sont présentés. Le problème du dispositif est d’identifier les liens qui proposent une bonne réponse, problème d’autant plus difficile à résoudre que la question n’est pas connue et que la même page peut susciter plusieurs questions. Si cette identification pouvait être rendue possible, il faudrait ensuite que les « bons » liens soient mis en évidence pour que le prochain lecteur puisse en bénéficier. Nous pouvons aussi envisager de faire apparaître ou disparaître certains liens, suivant leur pertinence, évaluée par les parcours des lecteurs précédents.

1.2 Cadre de référence théorique

Nous nous appuyons sur un certain nombre de travaux, les uns à visée théorique, les autres d’inspiration plus nettement appliquée, tous traduisant le caractère interdisciplinaire de cette recherche.

Du côté théorique, il s’agira notamment de faire le point en ce qui concerne les modèles sémantiques (Georges Vignaux), mais aussi ceux du Web séman- tique menés par le W3C. En effet ces derniers prennent une position nettement

1.2. Cadre de référence théorique

en contraste avec l’hypertexte tel qu’il est actuellement mis en œuvre sur la toile et tendent vers la mise en œuvre de systèmes locaux d’inférences.

Du côté pratique et opératoire, on s’inspirera des recherches sur l’hy- pertextualité menées en collaboration avec l’équipe « Hypertextes et textualité

électronique » (David Piotrowski, Marc Silberstein, Georges Vignaux) de la Maison des Sciences de l’Homme - Paris Nord (CNRS-Paris), partenaire de I3M dans le cadre du Programme CoLiSciences. Rappelons les trois « idées

régulatrices » qui sous-tendent les sciences cognitives, telles qu’elles sont présentées dans le recueil de textes fondateurs d’Aline Pélissier et Alain Tête (Pélissier et Tête, 1995). Pour chaque idée, nous pouvons faire correspondre des fonctions ou des usages deCoLiSciences.

A. Première idée régulatrice : la simulation

CoLiSciences est un site Web, mais il comporte une particularité très in-

téressante : le système hypertextuel utilisé pour générer les parcours à la demande de l’internaute se comporte comme un automate programmable. Les parcours enregistrés sont en quelque sorte le « code source », le programme de l’automate. Quand un utilisateur navigue page par page, il code pas à pas l’automate, quand un parcours est affiché on exécute programme automatiquement, simulant une navigation.

C’est la partie à développer pour permettre l’identification notionnelle.

B. Deuxième idée régulatrice : la rétroaction

L’enregistrement des parcours, au fur et à mesure de la navigation, permet de générer un système de rétroaction qui enrichit chaque nouvelle lecture des enseignements des lectures précédentes.

Chapitre 1. Introduction

Comment développer cette idée de feedback pour participer à l’enrichisse- ment du site, quelles modalités d’enrichissement sont envisageable ? En par- ticulier il serait déjà intéressant de faire le distingo entre les enrichissements apportés volontairement par un lecteur et ceux apportés, non pas à son insu, mais sans sa participation active au processus d’enrichissement. C’est par exemple la différence entre un système où il est proposé d’ajouter ses propres commentaires et un autre qui analyserait la fréquentation de certaines pages pour les mettre en avant3.

Pour aller encore plus loin sur cette idée de rétroaction entre le système

CoLiSciences et ses lecteurs, nous pourrions imaginer de ne plus simplement

afficher les parcours tels qu’ils ont été réalisés par chaque lecture individuelle, mais plutôt les synthétiser pour mettre en évidence les « grandes routes » qui traversentCoLiSciences, les chemins les plus souvent empruntés.

C. Troisième idée régulatrice : l’information codée

Le codage de l’information donne lieu à deux approches, la première est liée à l’annotation notionnelle et le deuxième en découle presque naturelle- ment puisqu’il s’agit de l’utilisation du langage de balisage XML pour coder les textes et surtout, pour coder les notions. De cette manière, nous pourrions considérer XML comme une passerelle entre le texte, les mots et le sens. XML structure l’écrit.

3. Nous pouvons faire un parallèle avec des sites commerciaux. D’un côté avec le site Amazon de vente en ligne de livres, vidéos, CD, etc., à l’adressehttp://www.amazon.fr

pour le site français, qui propose à ses acheteurs de commenter les produits proposés. À l’opposé nous trouvons le modèle du moteur de recherche Google, qui analyse les liens cliqués par les internautes, en fonction des mots clefs spécifiés dans leur recherche. Les sites les plus souvent choisis « remontent » ainsi automatiquement dans les classements.

1.3. Éléments méthodologiques

1.3 Éléments méthodologiques

A. Finalité de cette recherche

Comme souvent dans le cadre de la recherche action, ce travail de re- cherche s’est construit au fil du temps, allant du général au particulier. Le sujet général correspondait plus à un ensemble d’interrogations personnelles qu’à une véritable construction, qui est venue plus tard, quand toutes les pièces ont été précisées et isolées, pour être finalement assemblées. Sans finalité pratique, les recherches sont validées par la communauté universitaire et non par le terrain. La finalité pratique de cette recherche, qui en quelque sorte permettrait de la valider par le terrain, se traduit par l’aboutissement du projet CoLiSciences, mais la finalité n’est pas uniquement pratique. Nous

nous sommes situé dans une articulation étroite des deux lieux : académique et terrain. Pour parvenir à articuler la volonté de répondre aux problèmes qui se posent sur le terrain et l’exigence universitaire de construction d’un savoir objectif, nous pouvons distinguer trois étapes pour caractériser notre démarche :

– action

– analyse de corpus – études expérimentales

1. Action

Il ne faut pas entendre « observation » dans un sens naturaliste, comme le dit Gérard Vergnaud,

«On n’a de chance de connaître vraiment quelque chose que si on

essaye de le transformer. (Vergnaud, 1994) »

Chapitre 1. Introduction

La recherche action connaît deux types de prolongements. Sur le plan de la recherche, elle se transforme en exploration systématique au cours de la seconde phase de la démarche. Sur le plan professionnel, elle conduit à la construction d’outils pédagogiques qui, élaborés avec des maîtres participant aux recherches-actions, sont ensuite proposés aux maîtres en général.

2. Analyse de corpus

Les idées nées au cours de la phase précédente vont prendre corps ici, conduisant à la constitution d’un corpus. Une analyse de corpus, aussi ob- jective et précise soit-elle, demeure insatisfaisante : les propositions produites dans ce cadre relèvent plus de l’interprétation que de la preuve. Conclusions pour la deuxième phase, elles deviennent hypothèses dans la troisième. Pour atteindre le statut de preuve, nous devons passer à une autre phase de la recherche, de nature expérimentale.

3. Études expérimentales

La mise en œuvre des conclusions de la deuxième phase à travers le projet CoLiSciences donne lieu à différents types d’expérimentations. Le pro-

jet lui-même est une sorte de macro-expérimentation, notre équipe multi- disciplinaire, les outils techniques d’une part : plate-forme de publication, numérisation, outils d’édition comme les outils cognitifs d’autre part : lec- tochromie, construction de parcours, participent tous de l’étude expérimen- tale de construction d’un système hypertextuel savant. Plusieurs micro- expérimentations ont aussi été mises en œuvre autour de CoLiSciences, qui

visaient à valider des choix particuliers de publication, ou d’analyse de textes, sémantique ou statistiques et qui ont donné lieu à de nouvelles constructions d’outils, techniques comme théoriques.

C

HAPITRE

2

CADRE ÉPISTÉMOLOGIQUE

«Dans la pensée scientifique, la médiation de l’objet par le sujet

prend toujours la forme du projet. »

Gaston Bachelard

Sommaire

2.1 Les questions à résoudre . . . . 27

A. Problématique . . . 27

2.2 Organisation par thèmes de recherche . . . . 27

A. Intelligence artificielle . . . 28 B. Cartographie . . . 38 C. Orientation et repérage . . . 41 D. La linguistique cognitive . . . 44 E. La communication . . . 45 F. L’informatique linguistique . . . 47 G. La sémiotique . . . 47 2.3 Organisation de la thèse . . . . 49

2.1. Les questions à résoudre

2.1 Les questions à résoudre

A. Problématique

Cette recherche doit nous amener à aborder un ensemble de questions relevant de :

L’Intelligence artificielle L’intelligence artificielle (I.A.) sera étudiée à travers

son rapport à l’élaboration de modèles de la cognition et de la mémoire, de mécanismes d’interactions entre niveaux de connaissances dans la compréhension de textes, de représentation de situations cognitives et de mécanismes d’apprentissage.

La linguistique cognitive La linguistique cognitive sera abordée à travers

des recherches sur les opérations fondamentales de construction des représentations et de traitement du sens.

La communication La communication nous amènera à procéder à l’étude de

modèles de la communication langagière et textuelle.

La sémiotique L’informatique linguistique et ses techniques seront utilisées

pour la mise au point d’analyseurs syntaxico-sémantiques et morpho- logiques, de procédures de validation. Ceci donnera lieu à un certain nombre d’expérimentations sur corpus.

2.2 Organisation par thèmes de recherche

Les thèmes de recherche que nous visons à développer découlent de la mise en place d’un dispositif de communication mettant en œuvre des technologies numériques. Nous aurions pu mentionner la cybernétique plutôt que la terminologie a priori plus vague de « technologies numériques », mais cela aurait en fait réduit notre champ de recherche qui tentera d’intégrer plus

Chapitre 2. Cadre épistémologique

largement les technologies de communication et de numérisation, dans leur sens le plus large possible. En cela, nous nous associons à la citation suivante :

«La technologie doit envisager l’universalité des objets techniques.

En ce sens, la Cybernétique est insuffisante. (Simondon, 1969, page 48) »

A. Intelligence artificielle

1. Définition

L’intelligence artificielle (IA) est définie par l’un de ses créateurs, Marvin Lee Minsky, comme

«La construction de programmes informatiques qui s’adonnent à des

tâches qui sont, pour l’instant, accomplies de façon plus satisfaisantes par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique. (Minsky, 1987) »

Cette discipline est liée à la question de savoir si les machines peuvent penser, sur laquelle il faut relever les recherches de Alan Turing4 qui ont abouti à la

modélisation d’un test qui permettrait d’affirmer ou non qu’une machine est capable de penser.

«Je propose d’étudier la question, "Est-ce que les machines peuvent

penser ?". Ceci devrait commencer par la définition des termes "machine" et "penser". Les définitions devraient être formulées de manière à refléter autant que possible l’utilisation habituelle de ces termes, mais cette atti- tude est dangereuse. Si la signification des mots "machine" et "penser" doit être trouvée en examinant comment ils sont habituellement utilisés il

4. Il pourrait être intéressant de remarquer que Alan Turing a été l’élève de Wittgenstein dont nous avons mentionné le Tractatus Logico-Philosophicus dans la section 4.1 du chapitre 4 consacré à l’hypertexte qui commence page 67.

2.2. Organisation par thèmes de recherche est difficile d’échapper à la conclusion que la signification et la réponse à la question "Est-ce que les machines peuvent penser ?" devrait être trouvée dans une enquête statistique telle qu’un sondage de l’institut Gallup. Mais ceci est absurde. Au lieu d’essayer une définition de ce type, je devrais plutôt remplacer la question par une autre, qui lui serait liée de près et n’utiliserait pas de mots ambigus. La nouvelle forme du problème peut être exprimé suivant les termes d’un jeu que nous appellerons "le jeu de l’imitation". Il se joue avec trois personnes, un homme (A), une femme (B), et un enquêteur (C) qui peut être de n’importe quel sexe. L’enquêteur est dans une pièce différente des deux autres. Le but du jeu pour l’enquêteur est de déterminer lequel des deux autre est l’homme et lequel est la femme. Il les connaît par des étiquettes X et Y, à la fin du jeu il dit soit "X est A et Y est B" ou "X est B et Y est A". L’enquêteur peut poser des questions à A et B. Nous nous posons maintenant la question "Qu’est-ce qui se passerait si une machine prenait la place de A dans ce jeu ?" Est-ce que l’enquêteur se tromperait aussi souvent quand le jeu est fait sous cette forme ou quand le jeu se fait avec un homme et une femme ? Ces questions remplacent celle originale "Est-ce que les machines pensent ?"5(Turing, 1950) »

5. I propose to consider the question, "Can machines think ?" This should begin with definitions of the meaning of the terms "machine" and "think." The definitions might be framed so as to reflect so far as possible the normal use of the words, but this attitude is dangerous, If the meaning of the words "machine" and "think" are to be found by examining how they are commonly used it is difficult to escape the conclusion that the meaning and the answer to the question, "Can machines think ?" is to be sought in a statistical survey such as a Gallup poll. But this is absurd. Instead of attempting such a definition I shall replace the question by another, which is closely related to it and is expressed in relatively unambiguous words. The new form of the problem can be described in terms of a game which we call the ’imitation game." It is played with three people, a man (A), a woman (B), and an interrogator (C) who may be of either sex. The interrogator stays in a room apart front the other two. The object of the game for the interrogator is to determine which of the other two is the man and which is the woman. He knows them by labels X and Y, and at the end of the game he says either "X is A and Y is B" or "X is B and Y is A." The interrogator is allowed to put questions to A and B. We now ask the question, "What will happen when a machine takes the part of A in this game ?" Will the interrogator decide wrongly as often when the game is played like this

Chapitre 2. Cadre épistémologique

L’Intelligence Artificielle est un domaine qui a suscité de nombreux débats. Après les promesses des débuts, la désillusion de certains a donné lieu à un certain nombre de controverses qu’il est possible de retrouver jusque dans la définition qu’en donne Le dictionnaire des sciences. C’est d’une part :

«Un "artifice", c’est-à-dire un art consommé qui fait illusion en

produisant des leurres fabriqués tout exprès pour nous tromper en laissant accroire que les machines seraient effectivement intelligentes, sans toutefois nous duper vraiment. (Serres et Farouki, 1997, page 479) »

Cette définition fait référence aux logiciels dont le comportement mime l’intelligence humaine « de l’extérieur », mais qui ne sont en fait basés que sur les techniques traditionnelles de l’informatique, c’est-à-dire faisant appel à la logique, aux mathématiques et à l’algorithmique.

«Cependant l’intelligence artificielle se distingue des autres branches

de l’informatique en ce qu’elle aborde des problèmes mal formulés, pour lesquels il n’existe pas de solution universellement admise. (Serres et Farouki, 1997, page 480) »

Les progrès faits en matière d’algorithmique font que certains problèmes réso- lus par l’IA hier sont aujourd’hui résolus par des techniques paradoxalement plus traditionnelles, tout en étant plus modernes.

C’est peut-être quand il doit être fait appel à l’imagination que nous entrons tout à fait dans le champ de l’IA, en particulier pour ce qui se rapproche de la création artistique.

«Certains programmes d’intelligence artificielle font reposer le tra-

vail de l’imaginaire à l’œuvre chez le compositeur sur une modélisation de la mémoire où se conjugueraient deux mécanismes heuristiques :

as he does when the game is played between a man and a woman ? These questions replace our original, "Can machines think ?"

2.2. Organisation par thèmes de recherche un mécanisme d’évocation, simulant les processus de réminiscence par lesquels un contexte [...] remet en mémoire des épisodes anciennement vécus, et un mécanisme de recombinaison, qui mettrait bout à bout et ajusterait les fragments sortis de la mémoire[...] L’élaboration, la simulation et l’évaluation de ces critères heuristiques relève précisément de l’intelligence artificielle. (Serres et Farouki, 1997, page 480) »

La liste ci-dessous, non exhaustive, des travaux de l’IA montre comment nous partageons nombre d’objectifs :

– Les systèmes experts et la résolution de problèmes – La représentation des connaissances

– Les modèles linguistiques développés pour la compréhension du lan- gage naturel (par les machines) et la traduction automatique.

Bien que dans l’architectureCoLiSciencesnous ne faisions pas à proprement

parler appel à l’IA, nous faisons appel à de nombreux procédés largement inspirés de celle-ci.

En premier lieu, le moteur hypertextuel de CoLiSciences est construit sur

le modèle d’un automate fini6 qui réagit en suivant des règles similaires à

celles implémentées par des réseaux de Petri7, comme nous le verrons dans

la section D., page 118 du chapitre 6. Cet automate peut-être échangé avec un autre, ou agrémenté d’autres fonctions qui pourraient aller jusqu’à l’utilisation d’un moteur d’inférences comme on en trouve dans les systèmes experts. En second lieu, cet automate est capable, avec plus ou moins de précision de

6. Un automate fini est constitué d’une entrée, d’une sortie, d’un ensemble d’états et de transitions étiquetées entre ces états

7. Un réseau de Petri permet d’étudier des systèmes dynamiques complexes. Ils ont été proposés dans les années 60 par Carl Adam Petri, puis développés au MIT, et sont maintenant utilisés pour spécifier, modéliser et comprendre les systèmes (dans lesquels plusieurs processus sont interdépendants. Le formalisme des réseaux de Petri est un outil permettant l’étude de systèmes dynamiques et discrets.

Chapitre 2. Cadre épistémologique

mettre en œuvre des caractéristiques que l’on retrouve généralement dans des systèmes relevant de l’IA : représentation des connaissances en particulier.

2. Système expert

Les systèmes experts interviennent dans le champ de l’I.A. de plusieurs façons, pour l’usage qu’il peut en être fait, mais aussi pour les outils qu’ils nécessitent de mettre en place. Nous pourrions de la même manière baser notre étude plutôt par rapport à l’utilisation d’un système expert pour contrôler les parcours érudits d’un lecteur à travers un corpus numérique, ce qui irait sans doute dans la direction d’une assistance à l’identification des notions traitées par le texte, mais pourrait aussi s’étendre à la propositions de voies de découvertes partant du parcours initié par ce même lecteur. Une autre voie à explorer est celle des outils nécessaires à la construction d’un système expert. Pour cela il faut généralement décrire les connaissances

Documents relatifs