• Aucun résultat trouvé

Les Allemands assiègent Laplace Laurent MAZLIAK 1

N/A
N/A
Protected

Academic year: 2022

Partager "Les Allemands assiègent Laplace Laurent MAZLIAK 1"

Copied!
11
0
0

Texte intégral

(1)

Laurent MAZLIAK1 28 septembre 2010

Le thème dont j’ai choisi de vous parler aujourd’hui concerne le 19ème siècle. L’idée est qu’il s’articule plus ou moins mol- lement entre les deux exposés qui l’encadrent. Le jeu de mots vasouilleux du titre, que j’ai mis pour complaire à So- nia qui souhaitait voir un peu d’humour dans ce monde de brutes, ne laisse d’ailleurs transparaître que partiellement ce que nous allons examiner ensemble rapidement, à savoir la réception des idées de Laplace sur les probabilités avant les évolutions majeures du 20ème siècle. Dans cette histoire, les Allemands mentionnés dans mon titre n’interviendront que dans un second temps, mais d’une façon importante qui m’a semblé encore relativement peu connue aujourd’hui.

L’intention initiale était de se concentrer sur cet aspect - mais j’avais été présomptueux : n’étant pas germanophone, je n’ai pas pu regarder comme il l’aurait fallu les textes ori- ginaux qui dans l’ensemble ne sont pas traduits. Je devrai donc me contenter de vous faire en quelque sorte une brève fiche de lecture de quelques publications que je mentionne tout de suite. Il y a avant tout deux des textes du traité The Probabilistic Revolution qui traitent de Laplace, ce- lui d’Andreas Kamlah et celui d’Ivo Schneider. Ensuite, la magnifique postface écrite par Bernard Bru à une réédition dans les années 1990 du traité philosophique de Laplace.

Enfin, on trouve un certain nombre de commentaires inté- ressants sur notre sujet présentés dans le livre de Jan von Plato qui cependant se concentre lui essentiellement sur le 20ème siècle.

Donc Laplace, figure tutélaire des mathématiques du ha- sard au 19ème siècle. Avec d’emblée une question : Laplace comme vous le voyez sur ses dates, vécut essentiellement au

1. Laboratoire de Probabilités et Modèles aléatoires, Université Pierre et Marie Curie, Paris, France. laurent.mazliak@upmc.fr

1

(2)

18ème siècle et est mort au début du siècle suivant. Com- ment alors expliquer une telle longévité de son influence directe, d’autant plus surprenante dans une période de dé- veloppement explosif des recherches mathématiques. La ré- ponse, on va le voir, est composite.

La force essentielle du paradigme laplacien fut d’avoir affirmé un déterminime matérialiste intransigeant dans sa cosmologie. Il s’adaptait ainsi parfaitement à l’exigence de conserver les aspects mécanistes de la physique de Newton tout en paraissant se débarrasser de la menace de toute pollution métaphysique, avant tout religieuse. Laplace s’est intéressé très tôt dans sa vie scientifique à la question du déterminisme et des probabilités en liaison avec les pro- blèmes d’erreurs dans l’estimation des trajectoires des corps célestes. L’élan donné à l’enseignement scientifique par la création de nouvelles institutions au moment de la Révolu- tion et de l’Empire va être pour lui l’occasion de mettre au clair ses idées. En 1795, pendant la brève période d’exis- tence de l’Ecole Normale de l’an III (celle qui est mention- née au fronton de la rue d’Ulm) , Laplace prononce dix leçons sur les probabilités dans un auditorium au Jardin des Plantes devant un auditoire de plus de 1000 personnes d’après des témoins. Ce n’est cependant qu’en 1812 et en 1814 que vont être publiés les deux textes majeurs de notre auteur sur les mathématiques du hasard. D’abord la Théo- rie Analytique des Probabilités, qui est le cours conçu pour l’Ecole Polytechnique. Puis deux ans plus tard, l’Essai Phi- losophique qui sert d’introduction sans technique mathéma- tique aux idées principales de la Théorie Analytique pour le grand public (cultivé) et dont le matériau se trouvait déjà essentiellement dans les leçons de 1795. Ce petit opus- cule va connaître un succès d’édition considérable (5 édi- tions du vivant même de Laplace !) et constitue peut être l’unique exemple célèbre d’ouvrage mathématique (voire scientifique) faisant partie du patrimoine littéraire français.

Son début en forme d’envoi, très connu, annonce d’emblée le présupposé déterministe de Laplace. On peut comparer

(3)

avec intérêt ce texte avec ceux de philosophes matérialistes du siècle des Lumières. L’extrait suivant de d’Holbach par exemple offre des ressemblances frappantes avec la formula- tion du mathématicien. Mais naturellement, un paradigme scientifique, même claironné avec force, ne pourrait pas sur- vivre longtemps si on ne pouvait pas le mettre en pratique.

Or c’est là la deuxième force de ce que Laplace propose : une définition effective, simple et exploitable de la probabilité.

Que cette définition ait des défauts, soit sujète à caution et crée des difficultés inextricables, on s’en est rendu compte assez rapidement ; mais, elle est restée pendant longtemps la seule définition disponible et il a bien fallu s’en conten- ter. S’ajoute à cela en toile de fond le prestige qu’on mesure mal aujourd’hui attaché à un groupe de mathématiciens investis par Bonaparte d’une influence politique et d’un rôle de créateurs de ce qu’on peut appeler un nouvel ordre aca- démique. Tant qu’à les évoquer, on peut signaler que leur fortune à la chute de l’Empire en 1815 fut assez diverse.

Lagrange était mort ; mais si Laplace continua à être cou- vert d’honneurs par la Restauration et Fourier fut épargné, ce ne fut pas le cas de Carnot dont la carrière eut à subir l’inimitié des nouveaux dirigeants et surtout de Monge qui fut ostracisé et mourut assez rapidement.

On serait donc en droit d’attendre que de l’éclat de leur créateur ait assuré aux probabilités laplaciennes une des- cendance abondante. Or, cela n’a pas été vraiment le cas et on va voir que ce qui explique en partie la permanence des idées de Laplace sur les probabilités parmi les mathémati- ciens du 19ème siècle, est l’absence d’autres textes de ré- férence. Laplace, dont l’intérêt pour le hasard mesuré était issu, comme on l’a vu, de questions cosmologiques, n’avait cependant pas caché une ambition beaucoup plus vaste : le calcul des probabilités avait sa place dans tout genre d’ac- tivité humaine où le risque et l’erreur devaient être quanti- fiés. L’héritier direct de Laplace, Poisson, va se lancer sur cette piste. En 1837, Poisson publie un volumineux ouvrage

(4)

Recherches sur la Probabilité des Jugements en matière cri- minelle et en matière civile, précédées des règles générales du calcul des probabilités. En réalité, les considérations sur l’usage des probabilités dans le fonctionnement judiciaire ne constitue qu’une partie modeste du livre (le 5ème chapitre en fait). Le titre choisi indique cependant bien l’accent que Poisson prétendait mettre sur cet aspect, d’autant qu’avec une honnêteté intellectuelle incontestable il a été puiser à des sources judiciaires authentiques fournies par le Compte général de l’administration de la justice en France. Ce cin- quième chapitre expose comment des calculs de probabili- tés seraient en mesure d’estimer le bien-fondé d’une déci- sion de justice (vous pouvez voir à ce sujet le petit article qu’Etienne Ghys a mis en ligne sur Image des Mathéma- tiques en 2009). L’idée que Poisson veut dégager est que par l’observation des acquittements et des condamnations prononcés par les différents jurys d’assises, il est possible d’obtenir des estimations pour qu’un inculpé se présentant devant telle ou telle chambre soit déclaré coupable ou ac- quitté. Le but recherché, bien en phase avec le jacobinisme centralisateur, était évidemment d’avoir des outils pour ré- duire les écarts constatés entre les différentes juridictions.

Le livre de Poisson va mettre le feu aux poudres à l’Acadé- mie des sciences où il est violemment pris à parti par Dupin et Poinsot (qui va jusqu’à parler d’ “aberration mentale”) . Surtout, Poisson doit faire face à l’opposition farouche et condescendante de Cauchy envers les prétentions univer- salistes des probabilités. Cauchy, d’ailleurs, dès la publi- cation de sa monumentale Analyse Algébrique (le cours de l’Ecole Polytechnique où tout le 19ème siècle mathéma- tique a appris à faire de l’analyse moderne “avec des ε et des δ”) en 1821, et en se gardant bien d’attaquer nommé- ment la statue du commandeur Laplace, avait mentionné que les mathématiciens feraient bien de se cantonner à faire des mathématiques. Des philosophes, emmenés par Victor Cousin vont se mêler au tollé au nom des droits sacrés de

(5)

la liberté contre les prétentions avancées par les mathéma- ticiens pour calculer comment survient un événement dans le domaine moral.

De cette affaire, le calcul des probabilités va en France sortir avec une réputation considérablement décrédibilisée.

Une des conséquences va être la difficulté de faire aboutir la demande incessante de Poisson pour la création d’une chaire à la Sorbonne, chaire de Calcul des Probabilités qui sera finalement créée de façon stable en 1850 mais en lui adjoignant la Physique Mathématique histoire de garantir un minimum de sérieux dans son activité. Comme vous le savez, notre laboratoire peut être vu comme le dernier avatar de cette chaire.

Au même moment, les mathématiques allemandes vivent une exceptionnelle période d’expansion, sur les raisons de laquelle je ne vais pas avoir le temps de m’étendre ici.

Qui plus est, le calcul des probabilités reçoit un soutien de poids en la personne de Gauss qui fait une considérable publicité à la théorie des erreurs (théorie des moindres car- rés) , elle-aussi d’inspiration largement laplacienne. Cauchy, d’ailleurs, sur ce sujet aussi, va avoir quelques interventions malheureuses en décrédibilisant la méthode des moindres carrés par un contre-exemple (c’est à cette occasion qu’il construisit une loi sans moments, celle qui porte son nom) et Bienaymé aura ensuite bien du mal à rattraper le coup en arguant que Laplace présupposait évidemment l’existence des moments

De ce fait, si la succession de Laplace s’embourbe en France dans des applications douteuses dans le domaine juridique ou dans les débats sur la théorie des erreurs, elle va au contraire être florissante en Allemagne. . .Cela, para- doxalement, va contribuer à rendre difficilement tenable le paradigme laplacien.

Le talon d’Achille de la définition de Laplace se trouve dans la considération de la probabilité des causes, autre- ment dit du principe de Bayes qui, malgré son nom, est

(6)

essentiellement dû à Laplace. Car la question se pose im- médiatement dans l’emploi du mot ‘probabilité’. S’agit-il de la même notion de probabilité que celle que Laplace définit par son quotient de cas possibles et de cas favo- rables ? Il est intéressant à ce sujet de voir qu’il y a une différence entre la présentation du principe de Bayes dans l’Essai philosophique et dans la Théorie Analytique. Dans l’Essai, Laplace illustre son calcul par un modèle élémen- taire d’urnes, du type qui est habituellement enseigné aux débutants. On tire une boule dans une urne qui contient 100 boules blanches et noires mais dont nous ignorons si elle contient 25 noires et 75 blanches ou 25 blanches et 75 noires. On tire une boule noire. Quelle est la probabilité que l’urne ait été remplie suivant l’une ou l’autre des réparti- tions susdites ? Dans un tel cas, les différentes hypothèses correspondent à une situation physique de l’urne que l’on peut décrire et donc il est possible de construire un modèle dans lequel mettre en place la définition de Laplace pour la probabilité des causes. Mais dans la Theorie Analytique, l’énoncé de Laplace a une toute autre envergure .

La question de la nature des causes se pose quand on parle par exemple de phénomènes naturels où le hasard intervient comme dans les questions obsessionnelles au 19ème siècle autour du sex-ratio, la proportion de garçons et de filles dans les naissances. Quelle est la cause derrière le hasard qui produit le choix du sexe ?

Deux attitudes sont alors possibles. Une première consiste à accepter l’existence formelle de causes dont la seule pro- priété est d’assurer une valeur a posteriori donnée de la probabilité. Evidemment, une telle cause n’est en rien ex- plicative (on peut tout à fait faire le parallèle avec la vertu dormitive de l’opium) et cela revient en fait à concevoir la probabilité comme une propension (comme Popper la défi- nira un siècle plus tard), une propriété “physique” du phé- nomène qui le pousse à se produire. Les probabilités des causes ont alors une nature spécifique, différente de celle

(7)

des probabilités a posteriori calculées suivant la définition laplacienne.

Ou alors, on accepte l’idée que derrière toute situation probabiliste se dissimule un modèle idéal de tirage dans une urne, une sorte de postulat de mécanisme universel de l’univers. Dans ce cas, comme on l’a vu, on conserve une unité à la définition de la probabilité, mais au prix de ce qu’il faut bien voir comme une hypothèse métaphysique.

C’est ici qu’entrent en scène des psychologues et physio- logistes allemands qui vont tant bien que mal essayer de s’accomoder de ce postulat mécaniste afin de faire usage de la définition de Laplace dont l’aspect pratique répondait à leur besoin. Ce dernier s’articule sur une contestation radi- cale de l’idéologie qui dominait alors l’idéalisme allemand héritier du courant de pensée incarné par Kant où pour faire vite, l’entendement est vu comme un donné qui per- met au phénoménal (c’est à dire ce qu’on observe) de révé- ler le nouménal (le sens). Les gens dont nous allons parler, qui étaient au contact de l’être humain dans son fonctionne- ment biologique dont ils trouvaient que les théories de Kant niaient les singularités, voulaient voir dans l’entendement humain quelque chose qui se construisait progressivement, et notamment par l’attitude adoptée face au risque. Cela les amena assez naturellement à se poser des questions autour de la quantification du hasard.

Notre premier héros est Carl Stumpf (1848-1936) . Sa théorie psychologique se fondait sur l’idée que la logique est pour l’esprit humain la science pratique de la cogni- tion et des jugements. Stumpf s’opposait en cela à la plu- part de ses contemporains qui ne pensaient la logique que comme un corpus de règles pratiques. La science appelée logique a pour but de nous faire comprendre notre manière de penser, comme la science appelée physique a pour but de nous faire comprendre comment le monde qui nous entoure fonctionne. A la base de cette science, deux disciplines : la psychologie et les probabilités que nous utilisons dans les procédures de choix et d’estimation du risque.

(8)

Stumpf s’est donc attaché à obtenir une interprétation de la probabilité qui ne fasse entrer que des arguments de type logique, son premier but étant d’éviter la circularité contenue dans la définition laplacienne où la probabilité est définie par la possibilité. Il propose ainsi la définition suivante.

L’expression importante est ici : si on n’a rigoureuse- ment aucune information sur lequel. Pour Stumpf, l’idée est qu’un corpus d’information B est accessible à partir du- quel on peut émettre des jugements en utilisant la logique (notons que les informations peuvent être aussi bien ob- jectives - fournies par le monde extérieur - que subjectives c’est à dire relatives à une connaissance personnelle) ; son hypothèse traduit donc qu’aucun raisonnement logique ne permet de déduire à partir de B des informations sur quel événement se produit. L’obsession de Stumpf était de gar- der le fondement déterministe du paradigme de Laplace : la probabilité ne résulte que de notre ignorance et seul le prin- cipe de raison insuffisante permet d’attribuer des probabi- lités. En fait, Stumpf l’interprète de façon tellement étroite qu’il passe même à côté de la souplesse apportée à la théorie laplacienne par la formule de Bayes. Il y eut une critique formulée contre l’obsession de Stumpf de tout fonder sur l’ignorance dont il n’arriva pas à se sortir (lui même a écrit que cela l’empêchait de dormir), énoncée sous la forme du paradoxe de la pièce. Supposez une pièce dont vous ne savez pas si elle est équilibrée ou non. La définition de Stumpf semble alors vous dire que vous n’avez pas d’autre choix que de considérer qu’à chaque lancer la probabilité d’avoir pile est 1/2. La loi des grands nombres vous dit alors que si vous lancez 1000 fois la pièce vous avez plus de chances d’avoir entre 450 et 550 pile que le contraire. Votre igno- rance aurait donc à ce compte engendré de la connaissance - une conclusion qui faisait perdre son sang-froid à notre logicien. En fait bien sûr, Laplace était autrement plus sub- til : il vous dit que votre ignorance de la probabilité réelle qui se révèle progressivement doit vous pousser à estimer x

(9)

par la formule de Bayes et la quantification des probabili- tés à chaque coup doit se fonder sur la connaissance de x.

Stumpf, qui n’était pas mathématicien, n’a probablement pas eu le recul nécessaire pour saisir toute la profondeur de la théorie de Laplace.

Mais c’est surtout un deuxième paradoxe qui va convaincre de l’absurdité qu’il y aurait à ne fonder la notion de pro- babilité que sur l’ignorance. Il est dû à notre deuxième al- lemand, le physiologiste Johannes von Kries (1853-1928).

Supposons, dit von Kries, qu’on ne connaisse pas du tout la taille des pays sur la terre. Alors, d’après Stumpf, la proba- bilité qu’une météorite frappe le Mexique ou le Danemark doit être considérée comme étant la même. Si on fait un autre découpage (en regroupant les pays d’Asie en un seul bloc par exemple) on obtient encore une autre valeur. Ce qui montre bien que se fonder uniquement sur l’ignorance n’a aucun sens. Notez que dix ans plus tard le même pa- radoxe, qui soulève l’impossibilité de construire des proba- bilités continues sur le seul principe de raison insuffisante, sera énoncé par Bertrand sous la forme plus célèbre du choix d’une corde sur un cercle

Von Kries sort de l’école d’Helmholtz qu’on peut en grande partie considérer comme l’inventeur de la biophysique à tra- vers ses mesures sensorielles, notamment acoustiques. De cette école, von Kries a tiré la conviction qu’il est vain de penser à mesurer une quelconque grandeur psychologique (douleur, plaisir etc. . .) si ce n’est à travers la mesure d’une grandeur physique qui lui est associée. De même la proba- bilité, en tant que degré d’attente qu’un événement se pro- duise ne peut être mesurée que si elle est objectivée d’une façon ou d’une autre par une mesure physique d’équiproba- bilité. Elle n’a donc rien à voir avec l’ignorance subjective ou avec la psychologie.

Von Kries se livre alors à ce qui est sans doute la tentative la plus originale du 19ème siècle allemand pour essayer de

(10)

compléter Laplace et essayer de fonder la notion de proba- bilité sur une base objective avant les définitions fréquen- tistes du début du 20ème siècle (von Mises, Reichenbach) et la définition théorique ajustée par Kolmogorov. L’approche de von Kries est une sorte de voie médiane : son projet est, à l’instar de Stumpf, de comprendre la nature de la pro- babilité. Mais au lieu d’essayer de le faire directement, il se propose de montrer comment le choix d’une probabili- tés peut être expliqué. Cette voie d’accès à la nature d’un phénomène à travers son explication est classique de la phi- losophie naturelle. Chez Aristote, l’exemple est celui d’une eclipse de lune ; si l’on vous demande ce qu’est une éclipse, vous répondez en expliquant comment elle se déroule.

L’approche de von Kries est la demande que les estima- tions de probabilités soient basées sur la donnée de Spiel- raüme - “espace de jeu”, au sens littéral, mais qu’on peut traduire par marges de manœuvres - divisant l’espace des possibilités et qui soient objectivement comparables. L’exemple type sur lequel il se penche est une version allemande de la roulette, le StoßSpiel. Très rapidement décrite, l’idée de von Kries est la suivante. La roulette fixe est divisée en un certain nombre de secteurs noirs et rouges (ce sont les Spielraüme de l’exemple) d’angle α0. Elle tourne un angle inconnu α, distribué suivant une densité f inconnue avant de s’arrêter. On a donc

prouge = X

k pairs

Z (k+1)α0

0

f(t)dt

et

pnoir = X

k impairs

Z (k+1)α0

0

f(t)dt

Si on suppose f continue et α0 petit, ces deux quantités sont proches l’une de l’autre et donc proches de 1/2. La valeur 1/2 peut donc ainsi être conçue idéalement comme une probabilité objective associée aux événements noir et rouge.

Von Kries développe donc sur cet exemple un argument de type fonction arbitraire, dix ans avant que Poincaré

(11)

ne fasse exactement la même construction pour expliquer pourquoi il est légitime de considérer l’équirépartition des petites planètes sur le zodiaque. Rien ne permet de dire si Poincaré avait lu ou non von Kries. C’est d’ailleurs une question historique assez secondaire. Plus intéressant est le constat que von Kries était donc arrivé à une vision quasi-théorique de la probabilité où on utilise la notion sans plus trop se soucier de sa nature. Dans cette même direction, Poincaré défendra l’idée d’une probabilité inter- prétée comme une convention : dans certaines situations, le scientifque choisit l’hypothèse de travail qui l’ arrange pour faire des calculs. Il le fait légitimement puisqu’asymptoti- quement, l’arbitraire de ce choix disparaîtra.

Cette évolution dans l’interprétation des probabilités est d’ailleurs le grand tournant qui marque le vingtième siècle.

Pour échapper à ce qu’ils considèrent comme une perte de sens , Reichenbach et surtout von Mises vont essayer de construire une théorie objective fréquentiste (“collectifs” de von Mises) qui, en raison de sa complexité d’utilisation, ne fera pas le poids devant le succès de la théorie abstraite incarnée par Kolmogorov. Mais ceci est une autre histoire et il est temps que je m’arrête. Merci de votre attention.

Références

Documents relatifs

La congruence linéaire caractéristique du complexe V,^a admet pour directrices les droites g et g ' dont les images G, G' sont les intersections de Q et de la droite V/^V/^i.. De

Force et puissance sur un rail Rotation d’une spire rectangulaire dans un champ magnétique uniforme Cas d’un moment magnétique1. Force

Laplace est l’un des principaux scientifiques de la p´eriode napol´eonienne ; en effet, il a apport´e des contributions fonda- mentales dans diff´erents champs des math´ematiques,

Lévy, puis Vanderpol en 1932, ont établi que ce calcul symbolique pouvait se déduire des propriétés de la transformation de Laplace, et Laurent Schwartz a

La particularité de cette décomposition est la suivante : alors que la décomposition en série de Fou- rier est une décomposition en fréquence, la décomposition en ondelettes est

On peut donner une vision équivalente à partir de la loi de Lenz : l’effet du courant induit est de diminuer les variations de flux magnétique au travers de la spire, et donc

Ce terme décroit de manière exponentielle alors que pour F 1 on avait un décroissance en

Pour conclure cette question, une représentation graphique