De la formalisation de l'induction aux "agents adaptatifs artificiels"

Troisième partie :

2) De la formalisation de l'induction aux "agents adaptatifs artificiels"

Holland va proposer en 1986, en partant de la théorie des modèles mentaux, une formalisation computationnelle des processus d'induction ou d'apprentissage. Holland s'intéresse à l'ingénierie de ce qu'on pourrait désigner par le terme d'apprentissage computationnel ("machine learning" dans certains textes). Si Johnson-Laird est essentiellement un psychologue intéressé à comprendre et théoriser le fonctionnement cognitif des êtres humains, et plus précisément le

"travail de l'esprit", dans la mesure où il considère celui-ci comme un"système symbolique"relevant du calcul; Holland travaille directement sur la simulation au moyen de la computation, des processus "d'induction" de n'importe quel "système cognitif" situé dans un certain contexte (le

"problem-solving"). La"structure"qu'il propose alors -"A framework, not a theory"(Holland, 1986, p. 2) - est indifféremment applicable aux jeunes enfants, aux rats de laboratoire, comme aux ordinateurs239.

"Bien que nous soyons concerné doublement par les processus d'induction, avec d'un côté les organismes, humains notamment, et de l'autre les ordinateurs, nous parlerons de systèmes cognitifs pour décrire les "processus de pensée" de toutes sortes de choses, depuis l'homme jusqu'aux puces de silicium en passant par les souris"(Holland, 1986, p. 2).

Il s'agit alors de comprendre et surtout de simuler la manière dont un "système cognitif"

quelconque traite l'information venant de son environnement, et stocke de la "connaissance" de manière à conserver ainsi une trace de ces propres expériences. Holland récuse les traitements purement syntaxiques de l'induction et place"l'induction dans un contexte pragmatique, avec comme hypothèses centrales le fait que l'induction est (1) guidée par une activité de "problem-solving", et (2) construite à partir des effets rétroactifs venant du succès ou de l'échec des prévisions produites par le système"(Holland, 1986, p. 9).

La connaissance produite par le système cognitif est alors évaluée à travers le stock des

238 "L'étude de l'induction, alors, est l'étude de la manière dont la connaissance est modifiée par l'usage"

(Holland, 1986, p. 5).

239 Holland ne se demande ainsi même pas - contrairement à Johnson-Laird - si on peut considérer tous les

"systèmes cognitifs"comme des"systèmes de symboles", fonctionnant comme tels, et si "l'information" ou la "connaissance" est toujours stockée, traitée, transformée dans cette forme (symbolique) ou autrement.

"connaissances" existantes (les différentes représentations ou modèles mentaux). Elle est continuellement réévaluée d'une manière ou d'une autre dans le cadre des différents "problem-solving"; et conservée, modifiée ou supprimée. On débouche alors sur une formalisation computationnelle particulière de l'apprentissage adaptatif, - un équivalent formel du schéma biologique de l'évolution, où l'on retrouve les trois principes d'hérédité, de variété (les essais-erreurs) et de sélection (le tri), qui affectent les génotypes (les "représentations" ou"connaissances").

Les modèles proposés par Holland ("systèmes de classification" et "algorithmes génétiques") constituent alors autant de machines de Turing, qui modèlisent ce schème particulier de l'apprentissage adaptatif, et. sont fréquemment mobilisés par l'analyse des routines en termes de

"learning". Ces modèles comprennent fondamentalement deux éléments : tout d'abord, un certain nombre de règles algorithmiques, de procédures totalement spécifiées de manipulation des symboles. Ces procédures sont invariantes et opèrent sur l'autre élément constituant les modèles, c'est-à-dire les "représentations" ou "modèles mentaux", construits eux à partir d'ensembles de règles de production: "condition"ﬁ "action". Reprenons rapidement ces deux éléments (pour une présentation plus détaillée, voir l'annexe sur les formalisations, point B) :

(1) Les connaissances stockées par le système sont supportées par ce que Holland appelle un "système de classification", dont les composants élémentaires - "les briques épistémiques de base"

(Holland, 1986, p. 14) - sont des règles de production, de forme : IF "ceci et ceci", THEN "ceci et ceci". Ces règles sont éventuellement activées au moyen d'informations introduites dans le système par le programme. La partie "action" (THEN "ceci et ceci") d'une règle peut alors soit déclencher une action dans l'environnement, soit activer d'autres règles, ou en modifier d'autres (et transformer ainsi la mémoire de travail du système).

On a là un équivalent - pour Holland - du stockage dans l'esprit humain de différentes "représentations", qui - dans l'hypothèse cognitiviste - sont constituées par des symboles (à un niveau subdoxastisque). Au cours du processus computationnel, des chaînes ou grappes de règles peuvent se constituer; et ces chaînes de règles agissent partiellement en parallèle. Autrement dit, plusieurs grappes de règles peuvent être activées en même temps; et ces grappes de règles activées en parallèle représentent alors les différents modèles mentaux présents à un moment donné dans le système cognitif considéré. Ces grappes entrent alors en compétition; les modèles mentaux sont alors testés dans leur rapport à l'environnement; cette compétition est tranchée par un algorithme.

"Les règles sont un véhicule naturel pour ce que nous pensons être le mécanisme le plus fondamental de l'apprentissage : l'évaluation basée sur les prédictions des connaissances stockées. Un système inductif réaliste ne peut raisonnablement prévoir de sauter directement à des inférences inductives optimales. Il doit y avoir des mécanismes qui évaluent les structures candidates, en écartent certaines, en conservent d'autres, et modifient celles qui existaient déjà. Le mécanisme d'évaluation comparent les conséquences prévues de l'utilisation d'une structure de connaissance avec le résultat effectif de cette utilisation. Les règles "condition-action" sont manifestement bien taillées pour former les prédictions. Une règle qui conduit à une prédiction réussie doit être renforcée d'une manière ou d'une autre, ce qui augmente sa

probabilité d'utilisation dans l'avenir. Une règle qui conduit à une erreur doit être modifiée ou rejetée. Et les prédictions concernant les objectifs seront normalement la source la plus importante des rétroactions"

(Holland, 1986, p. 16).

(2) Pour réaliser toute cette mécanique de l'évaluation, du renforcement et de la sélection des différentes règles constituant le système de classification, des procédures algorithmiques totalement spécifiées sont nécessaires. Il y a tout d'abord un algorithme qui sert à trancher la compétition entre les grappes de règles. C'est l'algorithme de la brigade des seaux qui attribue à chaque règle activée à un moment donné une "force". Cette force est recalculée à chaque étape de la computation, en fonction de la contribution de la règle à la construction des différentes "représentations", et en fonction d'un paiement d'ensemble que le système reçoit de l'environnement. Par ailleurs, différents "opérateurs génétiques" peuvent modifier selon des procédures diverses les "connaissances" précédemment stockées dans le système, en modifiant ou altérant les parties "condition" ou "action" des différentes règles de production - les briques élémentaires du système.

Les "systèmes de classification" et les "algorithmes génétiques" sont des dispositifs techniques pour des programmes d'apprentissage computationnel implémentables sur machines ("machine learning"). Plus profondément, Holland pense ainsi simuler la manière dont un"système cognitif" quelconque acquière des connaissances de manière autonome à travers ses propres expériences, au cours du processus de l'apprentissage adaptatif. Le programme simule donc le comportement d'un "agent adaptatif artificiel".

"Un agent est adaptatif s'il satisfait à un ensemble de critères : les actions de l'agent dans son environnement peuvent être rapportées à une valeur (performance, utilité, paiement, aptitude, ou toute autre chose du même genre); et l'agent se conduit de manière à augmenter cette valeur au cours du temps"

(Miller et Holland, 1991, p. 365240).

Le comportement adaptatif de l'agent (artificiel) inscrit le principe de "sélection" nécessaire à l'existence d'un processus évolutionniste - au sens de la biologie - dans l'apprentissage adaptatif lui-même, c'est-à-dire dans la manière dont les connaissances sont acquises, stockées en mémoire et transformées au cours du temps. Formellement, c'est l'algorithme de la "brigade des seaux" qui assure le travail de sélection, et figure le mécanisme du tri, un mécanisme implémenté à l'intérieur même du "système cognitif"considéré.

240 Cf. Holland et Miller : "Artificial Adaptative Agents in Economic Theory", 1991, où ces deux auteurs proposent une théorie des "systèmes adaptatifs complexes", c'est-à-dire de "systèmes complexes peuplés d'agents adaptatifs reliés entre eux de telle manière que l'environnement de chaque agent inclut un certain nombre d'autres agents appartenant au système"(op. cit., p. 365). De tels "systèmes adaptatifs complexes"

présentent des propriétés mathématiques particulières. "Les systèmes adaptatifs complexes opèrent habituellement très loin d'un optimum ou attracteur global. De tels systèmes affichent de nombreux niveaux d'agrégation, d'organisation et d'interaction, chaque niveau ayant sa propre échelle temporelle et son propre comportement caractéristique. N'importe quel niveau peut être décrit en général en termes de niches locales, qui peuvent être exploitées par des adaptations particulières. Les niches sont variées, il est donc rare qu'un agent particulier puisse exploiter l'ensemble de ces niches. (...) De plus, de nouvelles niches sont sans cesse créées par de nouvelles adaptations. (etc.)"(Miller et Holland, 1991, p. 365).

B. L'approche "néo-cognitiviste" des routines organisationnelles

Les théories psychologiques sur les processus d'induction et les formalisations computationnelles du"learning"sont reprises par certains auteurs évolutionnistes pour fonder la notion de routines organisationnelles. Il s'agit alors de comprendre "l'origine" et la"nature" des différentes routines.241Pour ce courant de recherche, cette compréhension est à rechercher dans la dimension cognitive et, plus particulièrement, du côté du fonctionnement des cognitions humaines, un fonctionnement dont l'équivalent formel est le"système cognitif artificiel", c'est-à-dire le modèle computationnel de l'apprentissage adaptatif. La référence théorique ultime devient alors la psychologie cognitive, ce qui conduit à un changement d'optique par rapport à Nelson et Winter (1982), et à un retour aux problématiques traditionnelles et plus anciennes de l'école behaviouriste, celles par exemple de March et Simon (1958), et Cyert et March (1963).

Cette trajectoire de recherche, dont un séminaire tenu à Santa Fe en 1995 a dressé un bilan d'ensemble, opère selon deux axes242:

(1) Elle se fait expérimentale; l'expérimentation devant permettre selon ses promoteurs -de dériver -des conclusions générales sur les routines organisationnelles. La routine organisationnelle est métaphoriquement dérivée d'une théorie de la routine individuelle; et l'apprentissage organisationnel dérivé de même des théories sur l'apprentissage individuel des êtres humains.

(2) Elle transfère des concepts théoriques, élaborés dans un certain domaine - celui de la psychologie cognitive243 - dans un autre domaine, qu'on peut décrire comme constitué d'un côté par la théorie des routines de Nelson et Winter (1982), et de l'autre par l'économie des techniques et des organisations productives.

La discussion à Santa Fe fait apparaître des points de vue très différents, et il est bien difficile - d'une certaine manière - d'en déduire une théorie réellement unifiée. Certains clivages sont particulièrement significatifs pour notre travail, deux oppositions en particulier : (1) Une opposition explicite établie entre une approche purement cognitive des routines (où nous situerons Egidi et Cohen), et une approche des routines qui prend en compte l'idée de "trêve" et de

241 Cf. en particulier Egidi, Marengo et Narduzzo, 1994, "On the Origin and Nature of Organizational Routines : some Evidence from Experiments"; et plus particulièrement la contribution d'Egidi au Workshop de Santa Fe consacré aux "Routines" : "Accountants and Termites", in Cohen et alii., 1995, p. 40-51. 242 Voir Cohen, Burkhart, Dosi, Egidi, Marengo, Warglien, Winter [1995], "Routines and Other Recurring

Action Patterns of Organizations : Contemporary Research Issues", Working Paper, November, Santa Fe. 243 La théorie des "modèles mentaux" a été formulée pour répondre a une situation bien particulière de

"problem-solving" scientifique, comme nous avons essayé de le montrer. Johnson-Laird veut trouver, dans le cadre général des hypothèses cognitivistes, une solution au problème que pose à la psychologie cognitive, la "compréhension d'un discours" et le "raisonnement ordinaire". Il s'agit de combler l'écart entre des données expérimentales, et l'approche dominante (en termes de "logique mentale"), etc. Johnson-Laird ne formule pas une théorie générale du comportement humain, couvrant tous les aspects de ce comportement, ni même une théorie de l'ensemble des processus de cognition. Il distingue ainsi cinq types de pensée, depuis les "nuages de la rêverie"jusqu'aux rouages de la pensée, où l'on trouve le "calcul", la

"création", la "déduction", "l'induction". La théorie des"modèles mentaux" ne porte que sur l'induction (Cf. Johnson-Laird, 1988, p. 231).

"conflits", qui récuse donc une compréhension et une explication de la nature et l'origine des routines qui excluerait la dimension sociale (on situera ici Dosi et Coriat). (2) Une opposition entre deux approches cognitives différentes, deux manières d'envisager et d'analyser la dimension cognitive, plus exactement les aspects cognitifs de la routine. Cette opposition apparaît en filigrane dans un débat entre Egidi et Warglien sur la définition du terme "routine"244. D'un côté, une approche que nous qualifierons de "néo-cognitiviste" (Egidi), une approche qui, par delà Nelson et Winter (1982), se rattache directement à Simon; de l'autre, Warglien s'appuie sur les formulations de Nelson et Winter et préconise une analyse à partir du contexte organisationnel : objets, savoir-faire, formulations linguistiques, règles, etc.; le plus important alors est la manière dont la"connaissance codée"- au sens de connaissance mémorisée ou cristallisée - est maintenue, transmise, modifiée, etc. par des processus qui ne sont pas forcément psychologiques et ne relèvent pas forcément des hypothèses cognitivistes.

Nous allons revenir plus en détails sur ces différents points.

Dans le document Le concept de "routine organisationelle" entre cognition et institution (Page 192-196)

De la formalisation de l'induction aux "agents adaptatifs artificiels"

Troisième partie :

2) De la formalisation de l'induction aux &#34;agents adaptatifs artificiels&#34;

B. L'approche "néo-cognitiviste" des routines organisationnelles

2) De la formalisation de l'induction aux "agents adaptatifs artificiels"