Le cerveau comme machine logique : - rencontres pendant la Guerre (1943 1945) :

rencontres pendant la Guerre (1943 1945) :

3. Le cerveau comme machine logique :

Le second article fondateur de la cybernétique s’intitule “Un calcul logique

des idées immanentes dans l’activité nerveuse”.175_{Il a été publié par}

McCulloch et Pitts en 1943. Wiener souligne la bonne fortune que

représenta pour Pitts sa rencontre avec McCulloch. Les deux chercheurs

« commencèrent à travailler très précocement sur des problèmes concernant la liaison de fibres nerveuses par l’intermédiaire de synapses dans des systèmes possédant des propriétés données. » 176_{Les travaux}

des deux chercheurs, qui faisaient appel à la logique mathématique, étaient à la fois parallèles et indépendants de ceux de Shannon.

Avant “Un Calcul logique…”, Pitts avait écrit « un certain nombre d'articles

sur la manière dont le fonctionnement neuronal touche au calcul. » Dans

le même volume du “Bulletin de Biophysique Mathématique” dans lequel est paru “Un Calcul logique…”, Pitts et Lettvin ont publié une étonnante “Théorie mathématique des psychoses affectives”. L’article a été considéré

« comme une plaisanterie pratique. »177 _{Si la valeur scientifique de l’article}

apparaît des plus douteuses, on peut se demander si Pitts considérait vraiment celui-ci comme une plaisanterie. La question n’est pas sans importance quand on sait que McCulloch tenait Pitts pour le garant de l’exactitude logique de ses travaux, et que Wiener vantait les qualités

175_{McCULLOCH W.S., PITTS W., “A logical calculus of the ideas immanent in nervous activity”, Bulletin of} Mathematical Biophysics, Oxford, Elsevier Sciences, 1943, 5, 115-133, trad. Pélissier A., op. cit., 1995, pp 58-91. 176

WIENER N., op. cit., 1948, 1961, trad. Pélissier A., 1995, p. 19.

scientifiques du jeune prodige. Nous reproduisons deux extraits de l’article :

« La théorie introduit deux variables ϕ et ψ. La première représente l'intensité de l'émotion, la seconde mesure l'intensité de l'activité. Un ensemble d'équations intégro-différentielles est supposé gouverner la variation de ϕ et ψ en ce qui concerne le temps. Pour une augmentation des valeurs de ϕ la conduite de l'organisme varie d’une grande impassibilité à un niveau normal de sentiment jusqu’aux extrêmes d'une dépression circulaire ou d'une excitation catatonique ; tandis qu'une augmentation de ψ aboutit à une transition de la stupeur à l'excitation maniaque, les solutions des équations représentent les spécifications quantitatives de différents états psychotiques. »178

« Dans la discussion suivante nous développerons une théorie mathématique du groupe de troubles mentaux qui peuvent être caractérisés de la façon suivante : que le cours caractéristique de la maladie puisse être essentiellement décrit en termes de vicissitudes de deux variables, la première représentant le niveau de sentiment, d'affect, ou d'émotion dans l'organisme et l'autre le niveau d'activité ou de conation. 179 _{Nous considérons que ce groupe comprend les folies}

circulaires, les psychoses réactives et la catatonie de Kahlbaum. Il peut aussi supposer inclure des troubles affectifs en surimpression sur des psychoses d'un autre type, et peut-être aussi, avec une interprétation plus spécifique des variables de détermination, certaines formes de névrose; mais nous ne considérerons pas ces derniers cas en détail. » 180

Pitts présente donc dans une même revue scientifique une théorie de la pensée fondée sur le calcul logique (avec McCulloch), et une théorie mathématique des psychoses (avec Lettvin). Que ce second article ait été ou non une « plaisanterie pratique, » il traite en tout cas d’une question à laquelle la suite va nous montrer que Pitts avait des raisons précises de s’intéresser.

- Introduction d’“Un Calcul logique…” :

Tête oppose la description aisée du « neurone de McCulloch et Pitts » à la lecture rendue « particulièrement ingrate » d’“Un Calcul logique…” par le symbolisme inspiré de Carnap dont se servent les deux auteurs pour en exprimer les propriétés. Pélissier et Tête, qui reprennent le point de vue d’Anderson et Rosenfeld - « Computation de Marvin Minsky (1967)

constitue une bien meilleure introduction aux neurones de McCulloch et Pitts […] »181_{- ont pris « la liberté d’insérer dans l’article [de McCulloch et}

Pitts] des développements particulièrement clairs de Minsky. »182_Pour

Jacqueline Léon, cette insertion qui facilite la lecture du texte accentue

178

LETTVIN J. Y., PITTS W., A mathematical theory of the affective psychoses in Bulletin of Mathematical

Biology, vol. 1/1939 – Vol. 74/2012, trad. de l’auteur, p. 139. [en ligne], Consulté le 17/11/12

http://download.springer.com/static/pdf/668/art%253A10.1007%252FBF02478261.pdf?auth66=1353189319_ fb1189817c07f30ad3e90158f5b806df&ext=.pdf

179

« L'adjectif conatif (du latin conatus, -us : « effort, élan ; essai, entreprise ») indique ce qui a rapport à la

conation, c'est-à-dire à un effort, une tendance, une volonté, une impulsion dirigée vers un passage à l'action. [En psychologie], orientation des conduites en termes de motivation. » [en ligne], Wikipédia, consulté le

17/11/12. Note de l’auteur.

180_{LETTVIN J. Y., PITTS W., op. cit., 1939, 2012, p. 139.} 181

ANDERSON J. A., ROSENFELD E., Neurocomputing, Cambridge, Ma., The MIT Press, 1988, pp. 15-17, trad. Pélissier A., op. cit., 1995, p. 60.

« l’assimilation première cybernétique et intelligence artificielle. » Après

avoir fait partie des collaborateurs de McCulloch, Minsky va en effet devenir l’un des fondateurs de l’intelligence artificielle et du cognitivisme. Tête passe « sous silence les critiques qu’a pu formuler Minsky à l’égard

de la cybernétique. » 183

- Introduction d’Anderson et Rosenfeld :

Anderson et Rosenfeld présentent l’article de 1943 comme « une tentative

de comprendre ce que le système nerveux peut réellement faire, étant donné des éléments de calcul simples qui sont des abstractions des propriétés des neurones et de leurs connexions, tels qu’ils étaient connus en 1943. » 184_{McCulloch et Pitts « débattent du fait que la physiologie est}

calculatoire – donc logique. »185_{Ils considèrent un neurone formel que}

nous appellerons c, soumis à l’action électrique de deux autres neurones,

a et b. En supposant que le seuil d’excitation de c soit 1, si a et b sont

inactifs au temps t, au temps t+1 c est inactif puisque la somme de deux fibres inactives, et donc de deux synapses inactives est zéro. Si a est actif mais b est inactif au temps t2, au temps t2+1, c est actif puisque une synapse active + une synapse inactive donne 1, qui est équivalent au seuil. De même, si b est actif et a inactif (1+0), ou si les deux sont actifs (1+1), c franchit le seuil d’excitation.

McCulloch et Pitts ont examiné les différentes combinaisons, en y incluant parfois une fibre inhibitrice. Ils ont considéré que ces combinaisons correspondent aux connecteurs de la logique des propositions. C’est ainsi que notre exemple, avec un seuil de 1 et deux entrées excitatrices, qui peuvent être actives ou inactives, réalise l’opération logique du OU INCLUSIF, dans la mesure où c devient actif seulement si a OU b ou A LA

FOIS a ET b sont actifs. Si, en revanche, le seuil d’excitation de c est 2,

l’unité constituée par a faisant synapse avec c, et b faisant synapse avec c

« calculera la fonction logique ET, puisqu’elle ne devient active que si a ET b sont actives. » 186

Le modèle McCulloch-Pitts « consiste en un réseau composé de tels

neurones idéalisés, chacun avec un certain nombre d'inputs excitateurs et inhibiteurs, une tension de seuil et un peu d'embranchement output. » 187

D’après le modèle, le neurone cérébral répond à un fonctionnement électrique binaire en tout-ou-rien. C’est la condition qui permet à McCulloch et Pitts d’affirmer que les neurones réalisent le calcul des propositions, bien que l’on sache déjà à l’époque que le neurone cérébral est aussi le siège de phénomènes continus. La légitimité de réduire son

183

LEON J., “Histoire des Sciences Cognitives : Les Filiations Multiples”, in Revue Histoire, Epistémologie,

Langage, tome XVIII, fascicule 2 (1996) : L’Esprit et le Langage ; p. 209, [en ligne], consulté le 17/11/12 http://www.persee.fr/web/revues/home/prescript/article/hel_0750-

8069_1996_num_18_2_2470_t1_0206_0000_2

184_{ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 58.} 185

Ibid., p. 59.

186

Ibid.

fonctionnement à une logique binaire va faire débat à l’intérieur même du groupe cybernétique.

McCulloch et Pitts considèrent donc un neurone formel répondant à une logique binaire, et constatent qu’avec un « réseau complexe de neurones

il est possible de représenter des déclarations très complexes. »188 _Le

résultat essentiel de l’analyse de McCulloch et Pitts a été récapitulé par von Neumann en référence à la machine de Turing :

« Que quoi que ce soit qui peut être décrit complètement et sans équivoque, quoi que ce soit qui peut être mis en mots complètement et sans équivoque, soit ipso facto réalisable par un réseau neuronal fini approprié... » 189

Pour Anderson et Rosenfeld, « le résultat central de cet article c’est que

toute expression logique finie peut être réalisée par le neurone de McCulloch et Pitts. » Il s’agissait d’« un résultat excitant car il montrait que des éléments simples connectés en réseau pouvaient avoir un immense pouvoir calculatoire. Puisque les éléments ont la neurophysiologie pour fondement, elle suggère que le cerveau est potentiellement un dispositif logique et calculatoire puissant. »190_Nous

allons voir que, de l’avis même de McCulloch et Pitts, leur modèle ne satisfait pas entièrement à la définition d’une machine de Turing.

Les résultats formels obtenus par McCulloch et Pitts ont influencé les recherches sur les calculateurs numériques. Von Neumann a « utilisé leur

modèle pour concevoir un circuit pour un ordinateur. »191_{Le neurone}

formel a aussi inspiré la mise au point de réseaux connexionnistes.

L’article de McCulloch et Pitts « décrit peut-être le premier vrai modèle

connexionniste, puisqu’il est composé d’éléments de calcul simples, disposés en partie en parallèle, réalisant un calcul puissant en fonction de forces de connexion établies de façon appropriée. »192 _{Il constitue en}

revanche un modèle insuffisant du cerveau dans la mesure où il ne prend en compte ni « les processus humoraux (donc continus) qui se mêlent aux

processus électriques (discrets), » ni les champs électriques continus :

« Comme on ne pouvait réaliser des enregistrements intracellulaires, il était difficile de voir que les potentiels postsynaptiques, dus à l’activation présynaptique qui s’étend réellement sur un bon nombre de millisecondes, étaient graduels et que les neurones se comportaient beaucoup plus comme des convertisseurs de voltage en fréquence que comme de simples éléments logiques. »193 _{« Gerard et Bremer ont souligné des aspects du cerveau ignorés} dans la description Pitts-McCulloch : les concentrations chimiques et les champs électriques continus […] ne s’adaptent pas au modèle numérique en tout-ou- rien. » 194

188_{HEIMS S. J., op. cit., 1980, p. 211.} 189

VON NEUMANN J., Hixon Symposium, pp. 22-23, cité par Heims S. J., op. cit., 1991, p. 42.

190

ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 60.

191_{HEIMS S. J., op. cit., 1980, p. 211.} 192

ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 60.

193

Ibid., p. 61.

McCulloch et Pitts n’ignoraient pas l’existence de phénomènes continus dans le système nerveux puisque dans l’introduction de leur article de 1943 « ils commentent l’importance potentielle de changements continus

au niveau du seuil dus à l’adaptation et à l’apprentissage. » Anderson et

Rosenfeld estiment cependant que « les neurones binaires peuvent […]

constituer dans certains cas des approximations utiles des processus continus sous-jacents. » Ils signalent que « l’influence théorique immense

de cet article ne s’exerça pas parmi les chercheurs en neurophysiologie mais chez les informaticiens. » Ils y voient un motif d’encouragement pour la recherche :

« Il n’est pas nécessaire d’être correct dans le détail ou même dans le domaine originel d’application pour produire des travaux durables de grande importance. Il vous est possible d’acheter des neurones de McCulloch et Pitts dans votre magasin sous forme de circuits logiques. » 195

- A propos du calcul des propositions :

La lecture d’“Un calcul logique…” impose le rappel de notions relatives au calcul des propositions. Celui-ci « a pour objet l’étude des relations

logiques entre propositions : il fournit les règles d’inférence permettant d’enchaîner des propositions pour produire des raisonnements valides. Ce faisant, il régit l’usage rationnel du discours. »196_{Une proposition est « une}

affirmation à laquelle on peut, au moins en principe, attribuer la qualité d’être vraie ou fausse. »197 _{Les relations entre les propositions est le}

domaine de la logique propositionnelle. On peut « fabriquer de nouvelles

[propositions] juste en en connectant deux anciennes à l’aide d’une particule appelée connecteur (comme on le fait dans le langage naturel à l’aide de et, ou, mais, si… alors, bien que, etc.) ; on les appellera propositions composées. Une proposition qui n’est pas composée s’appelle proposition atomique. »198_{Ghiglione et Richard donnent l’exemple de deux}

propositions atomiques formant avec le connecteur & (conjonction logique) une proposition composée :

« Prenons maintenant :

(A) La cuisinière est coupable, et :

(B) La servante est coupable.

Ce sont deux propositions atomiques. On peut les affirmer séparément, mais on peut aussi constituer avec elles une proposition composée (notée ci-dessous A & B) telle que celle-ci sera vraie dans le cas où chacune des propositions atomiques sera elle-même vraie, et fausse dans les autres cas. Ce qui se représente dans le tableau suivant, appelé table de vérité, qui comporte quatre lignes, une pour chaque combinaison des valeurs de vérité de A et de B :

195_{ANDERSON J. A., ROSENFELD E., op. cit., 1988, 1995, p. 61.} 196

VERNANT D., Introduction à la logique standard, Flammarion, Paris, 2001, 2011, p. 17.

197

GHIGLIONE R., RICHARD J.-F., “Introduction”, Cours de psychologie, t.3, Dunod, Paris, 1994, 1999, p. 34.

On remarque que la proposition composée A & B porte la valeur vraie en première ligne quand chacune des propositions atomiques A et B est vraie, et faux sur les trois lignes suivantes, conformément à notre souhait. On a ainsi créé une proposition composée, A & B, à l’aide d’un connecteur, noté &, appelé conjonction logique. La table de vérité ci-dessus constitue la définition de la conjonction. Le point essentiel est celui-ci : rien d’autre n’intervient dans la détermination des valeurs de vérité de A & B que les valeurs de A et celles de B. Cette propriété s’appelle vérifonctionnalité. » 199

Les auteurs précisent les différences entre raisonnement naturel et déduction logique :

« Le sens des connecteurs, et partant les valeurs de vérité des propositions composées qu’ils permettent de constituer, ne dépendent que des valeurs de vérité des propositions atomiques. […] Les schémas de déduction sont valides, et les tautologies vraies uniquement en vertu de leur forme superficielle, et non pas à cause d’un “contenu” quelconque. C’est en ce sens que l’on parle de logique formelle. Par contre, dans le raisonnement naturel, les propositions ont des conditions de vérité liées à des états du monde. » 200

La logique propositionnelle « exclut toute intrusion du locuteur, ne serait-

ce [que] sous la forme simple de : « J’affirme que p ». De l’assertion, la logique propositionnelle ne retient que son contenu propositionnel, sa seule dimension sémantique d’énoncé. »201_{Quant à la constitution interne}

des propositions, elle est le domaine de la logique des prédicats, que nous n’aborderons pas ici.

- Le calcul des propositions par le réseau neuronal :

McCulloch et Pitts rappellent les hypothèses cardinales de la neurophysiologie théorique de l’époque :

199

Ibid., pp. 37-38.

200

Ibid., p. 66.

201_{VERNANT D., op. cit., 2001, 2011, p. 24.} A B A&B V V V V F F F V F F F F

« Le système nerveux est un réseau de neurones, chacun possédant un soma et un axone. Leurs connexions ou synapses se font toujours entre l’axone d’un neurone et le soma de l’autre. A tout instant un neurone a un certain seuil que l’excitation doit dépasser pour créer une impulsion. Cela, excepté le fait et le moment de son apparition, est déterminé par le neurone et non pas par l’excitation. Du point où s’est produite l’excitation, l’impulsion est propagée à toutes les parties du neurone. […] De façon prédominante, l’excitation se transmet à travers les synapses des terminaisons axonales aux somas. » 202 En matière de transmission nerveuse, la sommation est la règle. La convergence de plusieurs neurones afférents sur une même synapse provoque ou non - selon l’action activatrice ou inhibitrice de chaque neurone afférent et selon que le seuil d’excitation du neurone efférent est atteint ou non – un potentiel d’action dans ce dernier. McCulloch et Pitts posent qu’un neurone cérébral présente seulement deux états, en deçà du seuil d’excitation (pas de potentiel d’action), et au-delà du seuil d’excitation (potentiel d’action) ; qu’il répond donc à un fonctionnement binaire et réalise l’alternance ouverture/fermeture d’un commutateur électrique. Les deux chercheurs jugent que le fonctionnement en tout-ou-

rien de l’activité nerveuse est suffisant « pour garantir qu’on puisse représenter l’activité d’un neurone par une proposition. »203_{On peut}

décrire le réseau neuronal du cortex cérébral dans les termes de la logique propositionnelle « si on y ajoute des outils logiques plus compliqués pour

les réseaux contenant des boucles. » 204

Pitts et McCulloch déclarent, pleins d’assurance, que « les relations

physiologiques existant entre les activités nerveuses correspondent bien entendu aux relations entre les propositions. » Selon leur modèle, « à chaque réaction d’un neurone correspond une assertion d’une proposition élémentaire, » 205 _{et aux relations entre neurones correspondent les}

relations entre propositions. Chaque complexe synaptique met en fonction un connecteur logique (ET, OU, etc.) et se comporte comme un opérateur du calcul des propositions. Ce calcul s’effectue par combinaisons de propositions élémentaires.

Les deux chercheurs signalent néanmoins deux difficultés. La première concerne la facilitation et l’extinction, « dans lesquelles l’activité

précédente modifie temporairement la bonne réaction à une stimulation ultérieure d’une même partie du réseau. » La seconde concerne

l’apprentissage, « dans lequel les activités concurrentes à un moment

antérieur ont modifié le réseau de manière permanente, de telle sorte qu’un stimulus qui aurait été précédemment inadéquat est maintenant adéquat. » 206

Les premières recherches de McCulloch dans ces domaines ont eu lieu dans le laboratoire de neurophysiologie de Johann Gregorius Dusser de

202

McCULLOCH W.S., PITTS W., op. cit., 1943, 1995, pp. 62-63.

203_{Ibid., p. 64.} 204 Ibid., p. 62. 205 Ibid., p. 64. 206_Ibid.

Barenne à la Faculté de médecine de Yale, et ont permis, dans des expériences portant sur des macaques, de mettre en évidence les phénomènes d’extinction (1934) et d’inhibition. En 1937, McCulloch a désigné « l’hyperactivité dans la réverbération des chaînes » comme l’un

des facteurs de facilitation.207_{Dans les dernières pages de leur article,}

McCulloch et Pitts observent que « les phénomènes d’apprentissage, qui

sont persistants à travers la plupart des changements physiologiques dans l’activité nerveuse, semblent requérir la possibilité de modifications permanentes dans la structure des réseaux. » Ils envisagent deux types

de modifications, la « formation de nouvelles synapses ou de dépressions

équivalentes et locales du seuil. » 208

Les deux chercheurs neutralisent les difficultés liées à la facilitation/extinction et à l’apprentissage, en substituant aux réseaux cérébraux des « réseaux fictifs […] dont les connexions et les seuils sont

inchangés. » Ils précisent qu’ils ne conçoivent pas « l’équivalence formelle comme une explication factuelle. »209_{Cette précision est essentielle, elle}

délimite deux champs d’investigation distincts susceptibles de s’enrichir mutuellement sans se confondre : l’étude de l’activité électrique cérébrale d’une part, l’élaboration de modèles simplifiés de cette activité d’autre part. Nous allons être amenés à nous demander si les chercheurs qui se revendiquent de près ou de loin comme des héritiers de la cybernétique dans le champ de la psychologie, ont su maintenir cette distinction.

En substituant aux réseaux cérébraux des réseaux fictifs constitués de

neurone formels, McCulloch et Pitts choisissent de ne pas prendre en

compte les variations continues (facilitation, extinction) et durables (apprentissage) qui agissent sur le seuil d’excitation pour ne considérer que le fonctionnement binaire du réseau. D’après eux, « les modifications

sous-jacentes à la facilitation, l’extinction et l’apprentissage n’affectent en aucune façon les conclusions qui découlent du traitement formel de l’activité des réseaux nerveux, et les relations des propositions correspondantes restent celles de la logique des propositions. » 210

Les auteurs de l’article évoquent ensuite la présence dans le système nerveux « de nombreuses allées circulaires dont l’activité régénère

l’excitation de tout neurone concerné, de telle sorte que la référence au temps passé devient vague […]. »211_{Nous avons vu qu’en écoutant}

Rosenblueth à la conférence de 1942, McCulloch avait estimé que la notion de feedback permettait d’expliquer la présence de boucles neuronales dans le cerveau. Le neuropsychiatre va postuler que des

feedbacks positifs entretiennent, infinitisent des représentations et qu’ils

permettent d’expliquer la mémoire et les universaux.

207_{AIZAWA K., SCHLATTER M., “Another Look at McCulloch and Pitts’s “Logical Calculus””, Centenary College of}

Louisiana, Shreveport, LA 71134, pp. 3-4, [en ligne], consulté le 23/11/12.

http://personal.centenary.edu/~kaizawa/Another%20Look.doc 208_{McCULLOCH W.S., PITTS W., op. cit., 1943, 1995, p. 80.} 209

Ibid., pp. 64-65.

210

Ibid., p. 65.

- Une introduction à “Un Calcul logique…” par un pionnier du cognitivisme :

Vingt quatre ans après la parution de d’“Un Calcul logique…”, Minsky a

Dans le document La formation du paradigme cybernétique : varias et devenirs en psychopathologie (Page 38-55)