rencontres pendant la Guerre (1943 1945) :
3. Le cerveau comme machine logique :
Le second article fondateur de la cybernétique s’intitule “Un calcul logique
des idées immanentes dans l’activité nerveuse”.175 Il a été publié par
McCulloch et Pitts en 1943. Wiener souligne la bonne fortune que
représenta pour Pitts sa rencontre avec McCulloch. Les deux chercheurs
« commencèrent à travailler très précocement sur des problèmes concernant la liaison de fibres nerveuses par l’intermédiaire de synapses dans des systèmes possédant des propriétés données. » 176 Les travaux
des deux chercheurs, qui faisaient appel à la logique mathématique, étaient à la fois parallèles et indépendants de ceux de Shannon.
Avant “Un Calcul logique…”, Pitts avait écrit « un certain nombre d'articles
sur la manière dont le fonctionnement neuronal touche au calcul. » Dans
le même volume du “Bulletin de Biophysique Mathématique” dans lequel est paru “Un Calcul logique…”, Pitts et Lettvin ont publié une étonnante “Théorie mathématique des psychoses affectives”. L’article a été considéré
« comme une plaisanterie pratique. »177 Si la valeur scientifique de l’article
apparaît des plus douteuses, on peut se demander si Pitts considérait vraiment celui-ci comme une plaisanterie. La question n’est pas sans importance quand on sait que McCulloch tenait Pitts pour le garant de l’exactitude logique de ses travaux, et que Wiener vantait les qualités
175 McCULLOCH W.S., PITTS W., “A logical calculus of the ideas immanent in nervous activity”, Bulletin of Mathematical Biophysics, Oxford, Elsevier Sciences, 1943, 5, 115-133, trad. Pélissier A., op. cit., 1995, pp 58-91. 176
WIENER N., op. cit., 1948, 1961, trad. Pélissier A., 1995, p. 19.
scientifiques du jeune prodige. Nous reproduisons deux extraits de l’article :
« La théorie introduit deux variables ϕ et ψ. La première représente l'intensité de l'émotion, la seconde mesure l'intensité de l'activité. Un ensemble d'équations intégro-différentielles est supposé gouverner la variation de ϕ et ψ en ce qui concerne le temps. Pour une augmentation des valeurs de ϕ la conduite de l'organisme varie d’une grande impassibilité à un niveau normal de sentiment jusqu’aux extrêmes d'une dépression circulaire ou d'une excitation catatonique ; tandis qu'une augmentation de ψ aboutit à une transition de la stupeur à l'excitation maniaque, les solutions des équations représentent les spécifications quantitatives de différents états psychotiques. »178
« Dans la discussion suivante nous développerons une théorie mathématique du groupe de troubles mentaux qui peuvent être caractérisés de la façon suivante : que le cours caractéristique de la maladie puisse être essentiellement décrit en termes de vicissitudes de deux variables, la première représentant le niveau de sentiment, d'affect, ou d'émotion dans l'organisme et l'autre le niveau d'activité ou de conation. 179 Nous considérons que ce groupe comprend les folies
circulaires, les psychoses réactives et la catatonie de Kahlbaum. Il peut aussi supposer inclure des troubles affectifs en surimpression sur des psychoses d'un autre type, et peut-être aussi, avec une interprétation plus spécifique des variables de détermination, certaines formes de névrose; mais nous ne considérerons pas ces derniers cas en détail. » 180
Pitts présente donc dans une même revue scientifique une théorie de la pensée fondée sur le calcul logique (avec McCulloch), et une théorie mathématique des psychoses (avec Lettvin). Que ce second article ait été ou non une « plaisanterie pratique, » il traite en tout cas d’une question à laquelle la suite va nous montrer que Pitts avait des raisons précises de s’intéresser.
- Introduction d’“Un Calcul logique…” :
Tête oppose la description aisée du « neurone de McCulloch et Pitts » à la lecture rendue « particulièrement ingrate » d’“Un Calcul logique…” par le symbolisme inspiré de Carnap dont se servent les deux auteurs pour en exprimer les propriétés. Pélissier et Tête, qui reprennent le point de vue d’Anderson et Rosenfeld - « Computation de Marvin Minsky (1967)
constitue une bien meilleure introduction aux neurones de McCulloch et Pitts […] »181 - ont pris « la liberté d’insérer dans l’article [de McCulloch et
Pitts] des développements particulièrement clairs de Minsky. »182 Pour
Jacqueline Léon, cette insertion qui facilite la lecture du texte accentue
178
LETTVIN J. Y., PITTS W., A mathematical theory of the affective psychoses in Bulletin of Mathematical
Biology, vol. 1/1939 – Vol. 74/2012, trad. de l’auteur, p. 139. [en ligne], Consulté le 17/11/12
http://download.springer.com/static/pdf/668/art%253A10.1007%252FBF02478261.pdf?auth66=1353189319_ fb1189817c07f30ad3e90158f5b806df&ext=.pdf
179
« L'adjectif conatif (du latin conatus, -us : « effort, élan ; essai, entreprise ») indique ce qui a rapport à la
conation, c'est-à-dire à un effort, une tendance, une volonté, une impulsion dirigée vers un passage à l'action. [En psychologie], orientation des conduites en termes de motivation. » [en ligne], Wikipédia, consulté le
17/11/12. Note de l’auteur.
180 LETTVIN J. Y., PITTS W., op. cit., 1939, 2012, p. 139. 181
ANDERSON J. A., ROSENFELD E., Neurocomputing, Cambridge, Ma., The MIT Press, 1988, pp. 15-17, trad. Pélissier A., op. cit., 1995, p. 60.
« l’assimilation première cybernétique et intelligence artificielle. » Après
avoir fait partie des collaborateurs de McCulloch, Minsky va en effet devenir l’un des fondateurs de l’intelligence artificielle et du cognitivisme. Tête passe « sous silence les critiques qu’a pu formuler Minsky à l’égard
de la cybernétique. » 183
- Introduction d’Anderson et Rosenfeld :
Anderson et Rosenfeld présentent l’article de 1943 comme « une tentative
de comprendre ce que le système nerveux peut réellement faire, étant donné des éléments de calcul simples qui sont des abstractions des propriétés des neurones et de leurs connexions, tels qu’ils étaient connus en 1943. » 184 McCulloch et Pitts « débattent du fait que la physiologie est
calculatoire – donc logique. »185 Ils considèrent un neurone formel que
nous appellerons c, soumis à l’action électrique de deux autres neurones,
a et b. En supposant que le seuil d’excitation de c soit 1, si a et b sont
inactifs au temps t, au temps t+1 c est inactif puisque la somme de deux fibres inactives, et donc de deux synapses inactives est zéro. Si a est actif mais b est inactif au temps t2, au temps t2+1, c est actif puisque une synapse active + une synapse inactive donne 1, qui est équivalent au seuil. De même, si b est actif et a inactif (1+0), ou si les deux sont actifs (1+1), c franchit le seuil d’excitation.
McCulloch et Pitts ont examiné les différentes combinaisons, en y incluant parfois une fibre inhibitrice. Ils ont considéré que ces combinaisons correspondent aux connecteurs de la logique des propositions. C’est ainsi que notre exemple, avec un seuil de 1 et deux entrées excitatrices, qui peuvent être actives ou inactives, réalise l’opération logique du OU INCLUSIF, dans la mesure où c devient actif seulement si a OU b ou A LA
FOIS a ET b sont actifs. Si, en revanche, le seuil d’excitation de c est 2,
l’unité constituée par a faisant synapse avec c, et b faisant synapse avec c
« calculera la fonction logique ET, puisqu’elle ne devient active que si a ET b sont actives. » 186
Le modèle McCulloch-Pitts « consiste en un réseau composé de tels
neurones idéalisés, chacun avec un certain nombre d'inputs excitateurs et inhibiteurs, une tension de seuil et un peu d'embranchement output. » 187
D’après le modèle, le neurone cérébral répond à un fonctionnement électrique binaire en tout-ou-rien. C’est la condition qui permet à McCulloch et Pitts d’affirmer que les neurones réalisent le calcul des propositions, bien que l’on sache déjà à l’époque que le neurone cérébral est aussi le siège de phénomènes continus. La légitimité de réduire son
183
LEON J., “Histoire des Sciences Cognitives : Les Filiations Multiples”, in Revue Histoire, Epistémologie,
Langage, tome XVIII, fascicule 2 (1996) : L’Esprit et le Langage ; p. 209, [en ligne], consulté le 17/11/12 http://www.persee.fr/web/revues/home/prescript/article/hel_0750-
8069_1996_num_18_2_2470_t1_0206_0000_2
184 ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 58. 185
Ibid., p. 59.
186
Ibid.
fonctionnement à une logique binaire va faire débat à l’intérieur même du groupe cybernétique.
McCulloch et Pitts considèrent donc un neurone formel répondant à une logique binaire, et constatent qu’avec un « réseau complexe de neurones
il est possible de représenter des déclarations très complexes. »188 Le
résultat essentiel de l’analyse de McCulloch et Pitts a été récapitulé par von Neumann en référence à la machine de Turing :
« Que quoi que ce soit qui peut être décrit complètement et sans équivoque, quoi que ce soit qui peut être mis en mots complètement et sans équivoque, soit ipso facto réalisable par un réseau neuronal fini approprié... » 189
Pour Anderson et Rosenfeld, « le résultat central de cet article c’est que
toute expression logique finie peut être réalisée par le neurone de McCulloch et Pitts. » Il s’agissait d’« un résultat excitant car il montrait que des éléments simples connectés en réseau pouvaient avoir un immense pouvoir calculatoire. Puisque les éléments ont la neurophysiologie pour fondement, elle suggère que le cerveau est potentiellement un dispositif logique et calculatoire puissant. »190 Nous
allons voir que, de l’avis même de McCulloch et Pitts, leur modèle ne satisfait pas entièrement à la définition d’une machine de Turing.
Les résultats formels obtenus par McCulloch et Pitts ont influencé les recherches sur les calculateurs numériques. Von Neumann a « utilisé leur
modèle pour concevoir un circuit pour un ordinateur. »191 Le neurone
formel a aussi inspiré la mise au point de réseaux connexionnistes.
L’article de McCulloch et Pitts « décrit peut-être le premier vrai modèle
connexionniste, puisqu’il est composé d’éléments de calcul simples, disposés en partie en parallèle, réalisant un calcul puissant en fonction de forces de connexion établies de façon appropriée. »192 Il constitue en
revanche un modèle insuffisant du cerveau dans la mesure où il ne prend en compte ni « les processus humoraux (donc continus) qui se mêlent aux
processus électriques (discrets), » ni les champs électriques continus :
« Comme on ne pouvait réaliser des enregistrements intracellulaires, il était difficile de voir que les potentiels postsynaptiques, dus à l’activation présynaptique qui s’étend réellement sur un bon nombre de millisecondes, étaient graduels et que les neurones se comportaient beaucoup plus comme des convertisseurs de voltage en fréquence que comme de simples éléments logiques. »193 « Gerard et Bremer ont souligné des aspects du cerveau ignorés dans la description Pitts-McCulloch : les concentrations chimiques et les champs électriques continus […] ne s’adaptent pas au modèle numérique en tout-ou- rien. » 194
188 HEIMS S. J., op. cit., 1980, p. 211. 189
VON NEUMANN J., Hixon Symposium, pp. 22-23, cité par Heims S. J., op. cit., 1991, p. 42.
190
ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 60.
191 HEIMS S. J., op. cit., 1980, p. 211. 192
ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 60.
193
Ibid., p. 61.
McCulloch et Pitts n’ignoraient pas l’existence de phénomènes continus dans le système nerveux puisque dans l’introduction de leur article de 1943 « ils commentent l’importance potentielle de changements continus
au niveau du seuil dus à l’adaptation et à l’apprentissage. » Anderson et
Rosenfeld estiment cependant que « les neurones binaires peuvent […]
constituer dans certains cas des approximations utiles des processus continus sous-jacents. » Ils signalent que « l’influence théorique immense
de cet article ne s’exerça pas parmi les chercheurs en neurophysiologie mais chez les informaticiens. » Ils y voient un motif d’encouragement pour la recherche :
« Il n’est pas nécessaire d’être correct dans le détail ou même dans le domaine originel d’application pour produire des travaux durables de grande importance. Il vous est possible d’acheter des neurones de McCulloch et Pitts dans votre magasin sous forme de circuits logiques. » 195
- A propos du calcul des propositions :
La lecture d’“Un calcul logique…” impose le rappel de notions relatives au calcul des propositions. Celui-ci « a pour objet l’étude des relations
logiques entre propositions : il fournit les règles d’inférence permettant d’enchaîner des propositions pour produire des raisonnements valides. Ce faisant, il régit l’usage rationnel du discours. »196 Une proposition est « une
affirmation à laquelle on peut, au moins en principe, attribuer la qualité d’être vraie ou fausse. »197 Les relations entre les propositions est le
domaine de la logique propositionnelle. On peut « fabriquer de nouvelles
[propositions] juste en en connectant deux anciennes à l’aide d’une particule appelée connecteur (comme on le fait dans le langage naturel à l’aide de et, ou, mais, si… alors, bien que, etc.) ; on les appellera propositions composées. Une proposition qui n’est pas composée s’appelle proposition atomique. »198 Ghiglione et Richard donnent l’exemple de deux
propositions atomiques formant avec le connecteur & (conjonction logique) une proposition composée :
« Prenons maintenant :
(A) La cuisinière est coupable, et :
(B) La servante est coupable.
Ce sont deux propositions atomiques. On peut les affirmer séparément, mais on peut aussi constituer avec elles une proposition composée (notée ci-dessous A & B) telle que celle-ci sera vraie dans le cas où chacune des propositions atomiques sera elle-même vraie, et fausse dans les autres cas. Ce qui se représente dans le tableau suivant, appelé table de vérité, qui comporte quatre lignes, une pour chaque combinaison des valeurs de vérité de A et de B :
195 ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 61. 196
VERNANT D., Introduction à la logique standard, Flammarion, Paris, 2001, 2011, p. 17.
197
GHIGLIONE R., RICHARD J.-F., “Introduction”, Cours de psychologie, t.3, Dunod, Paris, 1994, 1999, p. 34.
On remarque que la proposition composée A & B porte la valeur vraie en première ligne quand chacune des propositions atomiques A et B est vraie, et faux sur les trois lignes suivantes, conformément à notre souhait. On a ainsi créé une proposition composée, A & B, à l’aide d’un connecteur, noté &, appelé conjonction logique. La table de vérité ci-dessus constitue la définition de la conjonction. Le point essentiel est celui-ci : rien d’autre n’intervient dans la détermination des valeurs de vérité de A & B que les valeurs de A et celles de B. Cette propriété s’appelle vérifonctionnalité. » 199
Les auteurs précisent les différences entre raisonnement naturel et déduction logique :
« Le sens des connecteurs, et partant les valeurs de vérité des propositions composées qu’ils permettent de constituer, ne dépendent que des valeurs de vérité des propositions atomiques. […] Les schémas de déduction sont valides, et les tautologies vraies uniquement en vertu de leur forme superficielle, et non pas à cause d’un “contenu” quelconque. C’est en ce sens que l’on parle de logique formelle. Par contre, dans le raisonnement naturel, les propositions ont des conditions de vérité liées à des états du monde. » 200
La logique propositionnelle « exclut toute intrusion du locuteur, ne serait-
ce [que] sous la forme simple de : « J’affirme que p ». De l’assertion, la logique propositionnelle ne retient que son contenu propositionnel, sa seule dimension sémantique d’énoncé. »201 Quant à la constitution interne
des propositions, elle est le domaine de la logique des prédicats, que nous n’aborderons pas ici.
- Le calcul des propositions par le réseau neuronal :
McCulloch et Pitts rappellent les hypothèses cardinales de la neurophysiologie théorique de l’époque :
199
Ibid., pp. 37-38.
200
Ibid., p. 66.
201 VERNANT D., op. cit., 2001, 2011, p. 24. A B A&B V V V V F F F V F F F F
« Le système nerveux est un réseau de neurones, chacun possédant un soma et un axone. Leurs connexions ou synapses se font toujours entre l’axone d’un neurone et le soma de l’autre. A tout instant un neurone a un certain seuil que l’excitation doit dépasser pour créer une impulsion. Cela, excepté le fait et le moment de son apparition, est déterminé par le neurone et non pas par l’excitation. Du point où s’est produite l’excitation, l’impulsion est propagée à toutes les parties du neurone. […] De façon prédominante, l’excitation se transmet à travers les synapses des terminaisons axonales aux somas. » 202 En matière de transmission nerveuse, la sommation est la règle. La convergence de plusieurs neurones afférents sur une même synapse provoque ou non - selon l’action activatrice ou inhibitrice de chaque neurone afférent et selon que le seuil d’excitation du neurone efférent est atteint ou non – un potentiel d’action dans ce dernier. McCulloch et Pitts posent qu’un neurone cérébral présente seulement deux états, en deçà du seuil d’excitation (pas de potentiel d’action), et au-delà du seuil d’excitation (potentiel d’action) ; qu’il répond donc à un fonctionnement binaire et réalise l’alternance ouverture/fermeture d’un commutateur électrique. Les deux chercheurs jugent que le fonctionnement en tout-ou-
rien de l’activité nerveuse est suffisant « pour garantir qu’on puisse représenter l’activité d’un neurone par une proposition. »203 On peut
décrire le réseau neuronal du cortex cérébral dans les termes de la logique propositionnelle « si on y ajoute des outils logiques plus compliqués pour
les réseaux contenant des boucles. » 204
Pitts et McCulloch déclarent, pleins d’assurance, que « les relations
physiologiques existant entre les activités nerveuses correspondent bien entendu aux relations entre les propositions. » Selon leur modèle, « à chaque réaction d’un neurone correspond une assertion d’une proposition élémentaire, » 205 et aux relations entre neurones correspondent les
relations entre propositions. Chaque complexe synaptique met en fonction un connecteur logique (ET, OU, etc.) et se comporte comme un opérateur du calcul des propositions. Ce calcul s’effectue par combinaisons de propositions élémentaires.
Les deux chercheurs signalent néanmoins deux difficultés. La première concerne la facilitation et l’extinction, « dans lesquelles l’activité
précédente modifie temporairement la bonne réaction à une stimulation ultérieure d’une même partie du réseau. » La seconde concerne
l’apprentissage, « dans lequel les activités concurrentes à un moment
antérieur ont modifié le réseau de manière permanente, de telle sorte qu’un stimulus qui aurait été précédemment inadéquat est maintenant adéquat. » 206
Les premières recherches de McCulloch dans ces domaines ont eu lieu dans le laboratoire de neurophysiologie de Johann Gregorius Dusser de
202
McCULLOCH W.S., PITTS W., op. cit., 1943, 1995, pp. 62-63.
203 Ibid., p. 64. 204 Ibid., p. 62. 205 Ibid., p. 64. 206 Ibid.
Barenne à la Faculté de médecine de Yale, et ont permis, dans des expériences portant sur des macaques, de mettre en évidence les phénomènes d’extinction (1934) et d’inhibition. En 1937, McCulloch a désigné « l’hyperactivité dans la réverbération des chaînes » comme l’un
des facteurs de facilitation.207 Dans les dernières pages de leur article,
McCulloch et Pitts observent que « les phénomènes d’apprentissage, qui
sont persistants à travers la plupart des changements physiologiques dans l’activité nerveuse, semblent requérir la possibilité de modifications permanentes dans la structure des réseaux. » Ils envisagent deux types
de modifications, la « formation de nouvelles synapses ou de dépressions
équivalentes et locales du seuil. » 208
Les deux chercheurs neutralisent les difficultés liées à la facilitation/extinction et à l’apprentissage, en substituant aux réseaux cérébraux des « réseaux fictifs […] dont les connexions et les seuils sont
inchangés. » Ils précisent qu’ils ne conçoivent pas « l’équivalence formelle comme une explication factuelle. »209 Cette précision est essentielle, elle
délimite deux champs d’investigation distincts susceptibles de s’enrichir mutuellement sans se confondre : l’étude de l’activité électrique cérébrale d’une part, l’élaboration de modèles simplifiés de cette activité d’autre part. Nous allons être amenés à nous demander si les chercheurs qui se revendiquent de près ou de loin comme des héritiers de la cybernétique dans le champ de la psychologie, ont su maintenir cette distinction.
En substituant aux réseaux cérébraux des réseaux fictifs constitués de
neurone formels, McCulloch et Pitts choisissent de ne pas prendre en
compte les variations continues (facilitation, extinction) et durables (apprentissage) qui agissent sur le seuil d’excitation pour ne considérer que le fonctionnement binaire du réseau. D’après eux, « les modifications
sous-jacentes à la facilitation, l’extinction et l’apprentissage n’affectent en aucune façon les conclusions qui découlent du traitement formel de l’activité des réseaux nerveux, et les relations des propositions correspondantes restent celles de la logique des propositions. » 210
Les auteurs de l’article évoquent ensuite la présence dans le système nerveux « de nombreuses allées circulaires dont l’activité régénère
l’excitation de tout neurone concerné, de telle sorte que la référence au temps passé devient vague […]. »211 Nous avons vu qu’en écoutant
Rosenblueth à la conférence de 1942, McCulloch avait estimé que la notion de feedback permettait d’expliquer la présence de boucles neuronales dans le cerveau. Le neuropsychiatre va postuler que des
feedbacks positifs entretiennent, infinitisent des représentations et qu’ils
permettent d’expliquer la mémoire et les universaux.
207 AIZAWA K., SCHLATTER M., “Another Look at McCulloch and Pitts’s “Logical Calculus””, Centenary College of
Louisiana, Shreveport, LA 71134, pp. 3-4, [en ligne], consulté le 23/11/12.
http://personal.centenary.edu/~kaizawa/Another%20Look.doc 208 McCULLOCH W.S., PITTS W., op. cit., 1943, 1995, p. 80. 209
Ibid., pp. 64-65.
210
Ibid., p. 65.
- Une introduction à “Un Calcul logique…” par un pionnier du cognitivisme :
Vingt quatre ans après la parution de d’“Un Calcul logique…”, Minsky a