• Aucun résultat trouvé

2.2 Une autre vision des probabilités : Hadamard et Lévy

2.2.2 Lévy un probabiliste à part (entière)

Le parcours de Lévy vers les probabilités s’inscrit dans un rapprochement progressif entre l’analyse fonctionnelle et le calcul des probabilités. En 1919, Lévy, insatisfait des textes probabilistes qui font référence, propose de reprendre ce domaine avec un œil neuf. En 1919, Emmanuel Carvallo (1856-1945), directeur des études à l’École polytechnique, 446. [Hostinský, 1928b, Hostinský, 1928a]. Sur l’intervention de Hostinský nous renvoyons à [Bru, 2003, Mazliak, 2007a, Mazliak, 2015b].

447. [Hadamard, 1928b, 276].

448. Voir [Bru, 2003, 141-160] et [Mazliak, 2015b]. 449. Voir p.83.

2.2. Une autre vision des probabilités : Hadamard et Lévy

demande à Lévy de faire les trois conférences prévues sur les probabilités et la théorie des erreurs en remplacement de Georges Humbert, malade. Lévy avait déjà eu l’occasion de travailler sur les probabilités comme élève polytechnicien lorsqu’il se vit chargé de la rédaction des leçons de calcul des probabilités de Poincaré450. Il avait également lu la démonstration du TCL par Borel dans son livre de 1909451. Dans ses mémoires, Lévy se rappelle également avoir suivi le premier cours sur les probabilités de Borel à la faculté des sciences, mais affirme avoir été déçu452. De plus, Lévy affirme avoir finalement peu de souvenir de ces enseignements lorsqu’il prépare ses leçons en 1919453. Il s’engage alors dans une réflexion approfondie sur ce théorème et sur les probabilités.

Par ailleurs, en 1919, Lévy est toujours occupé par l’analyse fonctionnelle. À sa sortie de l’École polytechnique en 1907, Lévy suivit les cours de Hadamard au Collège de France et y trouva le sujet de sa thèse, soutenue en 1911. Cette thèse proposait une étude des équations intégro-différentielles satisfaites par les fonctions de Green en recourant à la théorie des fonctions de lignes de Volterra et au calcul fonctionnel de Hadamard454. Fin 1918, soutenu par Hadamard, il est chargé du cours Peccot au Collège de France de 1919. Pour ce cours, Lévy se propose de généraliser le problème de Dirichlet et d’étudier systématiquement le problème de l’intégration dans le domaine fonctionnel455. Ce cours tire profit de son travail d’édition posthume des notes de René Gateaux456, à la de- mande de Hadamard, abordant notamment le problème de l’intégration dans les espaces abstraits457. Lévy trouve dans les papiers de Gateaux une méthode d’extension de l’inté- gration en dimension finie à un espace de dimension infinie par un passage à la limite de moyennes. Au même moment, Lévy contacte Fréchet qui avait proposé en 1915 une théorie de l’intégration dans les espaces abstraits458et lui communique régulièrement ses avancées sur la question entre 1919 et 1924459. En 1922, Lévy publie ce cours dans un livre, inti- tulé Analyse fonctionnelle460, dans lequel apparaît une première jonction entre l’analyse fonctionnelle et le calcul des probabilités sous la forme d’une interprétation probabiliste

450. [Lévy, 1970, 69]. 451. [Borel, 1909a]. 452. [Lévy, 1970, 70]. 453. [Lévy, 1970, 69]. 454. Voir [Lévy, 2014, 27-32] 455. [Mazliak, 2015a, 401].

456. [Gateaux, 1919b, Gateaux, 1919a, Gateaux, 1922].

457. Voir plus haut 88. Pour plus de détails nous renvoyons à [Mazliak, 2015a]. 458. [Fréchet, 1915].

459. Lettres 1-8, [Lévy, 2014, 55-70]. 460. [Lévy, 1922a].

originale des formules d’intégration de Gateaux461.

Entre 1919 et 1922, Lévy se donne pour but de reprendre les fondements du calcul des probabilités en vue de donner une démonstration qu’il juge mathématiquement sa- tisfaisante du TCL. Il expose ses premier résultats lors d’une conférence tenue dans le cadre d’un colloque international de philosophie à Paris. Suite à l’invitation de la Société anglaise de philosophie à Oxford en septembre 1920, la Société française de philosophie organise une session extraordinaire à laquelle sont invitées les sociétés anglaise, belge, italienne et étasunienne. Cette réunion se tient à la Sorbonne du 27 au 31 décembre 1921. Lors de ce colloque, Lévy fait une intervention sur « les axiomes du calcul des probabi- lités et la loi de Gauss »462. Il commence par une critique de « l’ancienne notion d’axiome, "vérité évidente non susceptible de démonstration" »463 qui selon lui « doit être aban- donnée. »464 Pour lui « l’axiomatique doit comprendre : d’une part, un ensemble de définition, qu’à [son] avis c’est un tort d’appeler axiomes ; d’autre part, un ensemble de résultats expérimentaux, montrant l’accord de ces définitions avec la réalité » ajoutant que la meilleure axiomatisation « sera celle qui fait appel aux axiomes les plus faciles à admettre comme étant le résultat incontestable d’expériences courantes »465, critère, il en convient, « essentiellement subjectif »466. C’est dans cette perspective que Lévy propose de définir la notion de probabilité, et en particulier de donner un sens à une affirmation comme : « une urne contenant 10 boules, dont 4 rouges ; on dit que la probabilité de tirer une boule déterminée est 1

10; la probabilité d’en tirer une rouge est 4 10. »

467 Son idée repose sur l’idée d’assimiler un événement très peu probable à un événement impossible comme fondement de la vérification expérimentale. Selon lui, cette assimilation permet de dégager les propriétés fondamentales du calcul des probabilités, en particulier la règle des probabilités composées (formule de Bayes). Lévy exprime ainsi une position déjà expri- mée par Borel468 et par Hadamard469. Une fois ces principes posés, Lévy se tourne vers la « théorie mathématique » comprenant deux parties distinctes : « l’étude descriptive des

461. [Mazliak, 2015a, 404-407]. 462. [Lévy, 1924a]. 463. [Lévy, 1924a, 77]. 464. [Lévy, 1924a, 77]. 465. [Lévy, 1924a, 77]. 466. [Lévy, 1924a, 77]. 467. [Lévy, 1924a, 78].

468. [Borel, 1914a, 54, 227-228]. Sur cette interprétation, appelée également principe de Cournot, voir [Martin, 2018, Martin, 1994].

2.2. Une autre vision des probabilités : Hadamard et Lévy

lois de probabilité possibles, et les conséquences de la règle de composition des probabi- lités. »470 La première étude repose sur la représentation des lois de probabilité à l’aide de la « fonction caractéristique » (aujourd’hui appelée fonction de répartition) F , définie par F (x) = P(X < x). Remarquant qu’il s’agit de fonctions à variations bornées, à valeur dans l’intervalle [0 ; 1], il rappelle la classification due à Lebesgue et se réfère au livre de Lebesgue de 1904 sur l’intégration471. Il introduit également la variance (qu’il appelle valeur moyenne quadratique) et l’espérance (qu’il appelle valeur probable). Le deuxième point de son programme consiste à étudier la loi, appelée loi résultante, d’une somme de variables aléatoires indépendantes, dont les lois sont dites composantes. Il mentionne notamment le TCL et son application à la théorie des erreurs et un contre-exemple avec la loi de Cauchy. Dans cette conférence, Lévy dessine ainsi un programme de recherche qui l’occupe jusqu’en 1925.

À partir de 1922, et jusqu’en 1924, Lévy publie une série d’articles sur le TCL et les lois stables. En effet, il aborde la question du TCL sous un angle général. Non seulement il cherche à déterminer une démonstration montrant la convergence en loi d’une moyenne de variables aléatoires centrées réduites de carré intégrable vers la loi de Gauss, mais il cherche également à déterminer toutes les lois jouant un rôle similaire à cette loi de Gauss. Son analyse du TCL et des lois stables attirent l’attention de deux mathématiciens étrangers : Jarl Lindeberg (1876-1932) et George Pólya.

La première note dans les CRAS de Lévy, présentée dans la catégorie « analyse ma- thématique » le 27 mars 1922, s’intéresse au rôle de la loi de Gauss dans la théorie des er- reurs. Il y présente, dans une forme très condensée, les principaux axes de ses recherches. Il commence par une discussion de l’importance des hypothèses du TCL notamment à l’aide d’un contre-exemple, la loi de Cauchy qu’il remarque être également une loi stable par addition. D’une manière générale, il énonce que les lois stables admettent pour fonctions caractéristiques (au sens contemporain du terme) ϕ celles de la forme log ϕ(z) = −|az|α, où 0 < α 6 2. En outre, il affirme que chaque loi stable, admet un « domaine d’attrac- tion » constitué de lois admettant comme loi limite cette loi stable. Lévy montre aussi que quand les lois des erreurs se répartissent entre deux domaines d’attractions distincts et que le nombre de lois dans chacun des domaines sont asymptotiquement équivalents, la loi limite est celle pour laquelle l’exposant α est le plus petit. Il signale enfin que la loi

470. [Lévy, 1924a, 81]. 471. [Lebesgue, 1904]

limite obtenue en général n’est pas une loi stable et donne un contre-exemple.

Une première réaction à cette note vient du statisticien finlandais Lindeberg qui avait consacré ses recherches aux équations aux dérivées partielles jusqu’en 1918, puis s’était tourné vers la statistique et le calcul des probabilités472. Suite à l’article de Richard von Mises (1883-1953) de 1919473, Lindeberg développe une méthode de démonstration du TCL originale en redécouvrant et en affinant en 1922 la démonstration proposée par Alexandre M. Liapounov (1857-1918) vingt ans plus tôt. La méthode suivie par Lindeberg consiste à comparer la somme de n variables aléatoires avec la somme de n variables aléatoires normales centrées réduites et de faire tendre n vers l’infini pour montrer que la différence tend vers zéro. Lindeberg profite d’une erreur dans la note de Lévy pour envoyer à Borel sa démonstration, présentée le 29 mai 1922 comme une note d’ « analyse mathématique ». C’est grâce à l’intervention de Pólya que Lévy apprend l’existence de cette note474. Ce dernier publie donc une note475, présentée de nouveau par Hadamard, cette fois comme une note de calcul des probabilités, dans laquelle il corrige son erreur et donne quelques détails supplémentaires de sa démonstration476.

La seconde réaction vient de Pólya et n’est pas présente dans les CRAS, mais dans la correspondance qu’il initie avec Lévy suite à sa première note477. Dès 1919, Pólya, en poste à Zürich478, défend une approche fondée sur les fonctions génératrices des moments, méthode utilisée par Poincaré, qu’il communique à Lévy. Ce dernier critique l’usage de la fonction génératrice en soulignant l’avantage de la fonction caractéristique (au sens moderne du terme) ϕ, « toujours bien définie et ϕ00(u) existe si le moment d’ordre 2 existe. »479. Ainsi, si Lévy se réfère par la suite à la méthode de Lindeberg ou Bernstein pour la démonstration du TCL, il ne mentionne jamais la méthode de Pólya. Mais celui-ci réagit également à l’étude des lois stables proposées par Lévy480. En 1918, Pólya avait proposé d’étudier la propriété de stabilité des lois de probabilité en recherchant les densités

472. Voir [Elfving, 2001].

473. [von Mises, 1919a]. Voir chapitre 4, et [von Plato, 1994].

474. Cette note de Lindeberg a pu échapper à son attention. Néanmoins Lévy témoigne lui-même de sa difficulté à lire les travaux mathématiques de ses collègues, le conduisant souvent à ne pas les connaître.

475. [Lévy, 1922c].

476. Pour plus de détail voir [Fischer, 2011, 233-238].

477. Nous renvoyons pour plus de détails à [Fischer, 2011, 218-233] ainsi qu’aux chapitre 4, p. 217. Les lettres sont conservées dans les Archives de l’ETHZ.

478. Pólya sera le premier conférencier probabiliste de l’IHP. Nous revenons plus en détails sur sa carrière probabiliste au chapitre 4, p. 214-222.

479. Archive de l’ETHZ, Lettre de Lévy à Pólya, 9 avril 1922.

2.2. Une autre vision des probabilités : Hadamard et Lévy

de probabilités ϕ, admettant des moments d’ordres quelconques, solution de l’équation intégrale : 1 cϕ x c  = 1 ab Z +∞ −∞ ϕ u a  ϕ x − u b  du

ce qui le conduisit à montrer que l’unique solution est la densité normale centrée réduite. Lévy montre beaucoup d’intérêt pour l’approche de Pólya des lois stables, qu’il considère « très simple et élégante », mais, encore une fois, suggère qu’une approche en termes de fonction caractéristique, permettant d’aborder des lois de probabilités qui ne sont pas nécessairement à densité, serait encore plus simple et générale.

Toujours dans l’objectif de préciser sa démonstration, Lévy publie une troisième note481, présentée par Hadamard comme une note d’analyse mathématique. Cette troisième note précise les concepts utilisés par Lévy pour représenter les lois de probabilités. Il affirme qu’on peut la représenter soit par la fonction de répartition, soit par la fonction caractéris- tique. La note montre qu’il y a équivalence entre ces deux notions, en étendant la formule d’inversion de Fourier au cas où la fonction de répartition n’est pas absolument continue (formules de Fourier-Stieltjes). Il précise également la notion de convergence qu’il utilise pour montrer le TCL : une suite de lois de probabilités tend vers une loi limite, si la suite des fonctions de répartition converge simplement vers la fonction de répartition de la loi limite, sauf peut-être aux points de discontinuité. Cette définition se traduit en terme de fonctions caractéristiques, comme une convergence uniforme dans tout intervalle fini.

La discussion des lois stables engagée avec Pólya, continue de mobiliser l’attention de Lévy en 1923. Il publie deux notes, le 23 avril482 dans la catégorie « analyse mathéma- tique » et le 7 mai 1923483 dans la catégorie « calcul des probabilités ». La technique d’approche initialement utilisée par Lévy consiste à appliquer les notions de dérivée et d’intégrale d’ordre non-entier introduites par Riemann484. Remarquant que la fonction

481. [Lévy, 1922b]. 482. [Lévy, 1923b]. 483. [Lévy, 1923a].

484. Selon Lévy, [Lévy, 1923b, 1118], l’intégration d’ordre non entier α > 0 d’une fonction f est définie par Iα[f (z)] = z α Γ(α) Z 1 0 (1 − t)α−1f (tz)dt

et sa dérivée d’ordre non entier α > 0 par Dα[f (z)] = I−α[f (z)] = dn

dznIn−α[f (z)], pour tout entier

n. Le passage de Lévy par l’utilisation des dérivées d’ordre non entier n’est pas mentionnée ni dans [Fischer, 2011] ni dans [Lévy, 2014].

caractéristique ϕ d’une loi de probabilité vérifie l’égalité ϕ(z) = E0+ iE1z + · · · + Ep

(iz)p

p! + Φ(z)

où Eh est le moment d’ordre h de la loi supposé fini pour tout h ∈ [0 ; p + α], p étant un entier et 0 < α < 1, il propose d’évaluer le reste Φ(z). Pour cela il utilise la notion de déri- vée d’ordre non entier et obtient que Φ(z) = zp+αε(z), où ε(z) → 0 quand z → 0. Il utilise ce résultat pour établir l’existence de lois stables symétriques485 et asymétriques486. La correspondance entre Lévy et Pólya, dans laquelle seule les lettres de Lévy sont conser- vées, signale que Pólya réagit défavorablement à cette approche, jugeant qu’il n’est pas nécessaire d’avoir recours à une notion aussi complexe que la dérivée d’ordre non entier. Pólya envoie donc le manuscrit, rédigé en 1922, de son étude des lois stables487 à Lévy qui se laisse convaincre, et trouve un autre moyen en utilisant uniquement le dévelop- pement limité de eizx et des intégrations par partie. Cela étant, convaincu de l’intérêt que revêt l’opération de dérivation et d’intégration généralisée, Lévy publie une troisième note, présentée par Hadamard dans la catégorie analyse mathématique le 22 mai 1923, sur ce sujet488. En 1924, Lévy publie un mémoire sur la théorie des erreurs, dans lequel il a définitivement abandonné l’utilisation de la dérivée d’ordre non entier, et qui présente une première synthèse de ses travaux sur le TCL et les lois stables.

À partir de 1924, le rapprochement entre l’analyse fonctionnelle et le calcul des pro- babilités apparaît plus affirmé dans les travaux de Lévy grâce à sa rencontre avec Norbert Wiener qui travaille à la mise au point de sa théorie du mouvement brownien. En effet jusqu’en 1924, la relation des probabilités avec l’analyse fonctionnelle reste ponctuelle ; le calcul des probabilités sert de langage commode pour aborder un problème d’intégration dans l’espace fonctionnel489, et ses travaux d’analyse fonctionnelle l’ont familiarisé avec la transformée de Fourier-Stieltjes490 qu’il met à profit dans l’étude des lois de probabilités. En 1924, Paul Lévy, alors président de la SMF, aide Wiener à rédiger en français un article pour le Bulletin de la SMF491. Wiener avait commencé ses recherches dans le

485. [Lévy, 1923b]. 486. [Lévy, 1923a]. 487. [Pólya, 1923]. 488. [Lévy, 1923c].

489. Voir [Mazliak, 2015a]. 490. [Lévy, 1912].

2.2. Une autre vision des probabilités : Hadamard et Lévy

domaine de l’analyse fonctionnelle en étudiant l’intégration dans un domaine de dimension infinie492. Il prit connaissance des travaux de Gateaux grâce à la publication des articles édités par Lévy493. Ses recherches le conduisent à une étude du mouvement brownien qu’il publie en 1921. Wiener rencontre Lévy en 1922, lors d’un séjour en France, et discute, notamment de la troisième partie du livre de Lévy de 1922494. Dans son mémoire de 1923495, Wiener reconnaît explicitement avoir trouvé dans les travaux et les discussions avec Lévy son inspiration pour la construction du mouvement brownien (« differential space ») qu’il présente. Le mémoire de Wiener pour le Bulletin de la SMF, présente sa théorie et y établit un lien entre l’analyse fonctionnelle et le passage du temps discret au temps continu pour les processus aléatoires car « tous les résultats de [son] article sur l’espace différentiel peuvent [...] être considérés comme des résultats sur les probabilités dénombrables »496. Ce mémoire conduit Lévy à s’intéresser à un problème théorique (sur lequel il reviendra à plusieurs reprises497), l’existence (signifiant la construction) d’une mesure de probabilité sur un espace à un nombre infini dénombrable de dimension. Il publie ses recherches d’abord dans la Revue de Métaphysique et de Morale498 puis dans son livre sur le calcul des probabilités499. Il faut pourtant attendre, selon son propre aveu, 1928 pour qu’il prenne conscience du lien profond avec les probabilités dénombrables500. L’approche de Lévy s’oppose explicitement à celle de Borel. Il n’hésite pas à affirmer que des auteurs comme Poincaré, Borel et Guido Castelnuovo (1865-1952)501 ont « né- gligé systématiquement un point de vue qui [lui] paraît assez important »502, celui du mathématicien. Il estime en particulier que Borel et Deltheil, dans leur livre503, se sont « content[és] de raisonnement de bon sens »504, et attribue à Borel l’idée que la théorie des erreurs « ne justifie pas le matériel mathématique nécessaire pour y parvenir. »505

492. Pour une présentation détaillée, voir [Mazliak, 2015a]. 493. [Gateaux, 1919b, Gateaux, 1919a].

494. [Lévy, 1922a]. 495. [Wiener, 1923]. 496. [Wiener, 1924, 577-578]. 497. Voir chapitre 4, p. 198-202. 498. [Lévy, 1925b]. 499. [Lévy, 1925a]. 500. Voir chapitre 4.

501. Lévy fait référence au livre du mathématicien italien Guido Calstelnuovo, [Castelnuovo, 1919]. Nous revenons plus en détails sur ce mathématicien et son rôle dans l’histoire des probabilités au chapitre 4, p. 226-228.

502. [Lévy, 1925a, v].

503. [Borel et Deltheil, 1923]. 504. [Lévy, 1925a, v].

Lévy estime que « pour le mathématicien, cela ne saurait suffire »506, d’autant plus que cet « appareil mathématique n’est pas aussi imposant qu’on le croit généralement. »507

Cette opposition vis à vis de Borel n’est toutefois pas si simple. Les positionnements des probabilistes que nous avons mentionnés vis à vis des applications ne sont pas totalement binaires. Au premier niveau, quand il est question de l’interprétation d’une probabilité, Lévy reprend des idées déjà exprimées par Borel, notamment concernant les probabilités négligeables. Ensuite, au second niveau, Borel, surtout avant 1925, défend une approche tournée vers les applications et plus encore la mise en application. De ce point de vue le recours à des mathématiques élémentaires est une nécessité pour permettre un usage large des probabilités par des non-mathématiciens. Borel retrouve ses préoccupations dans certains écrits de Fréchet, Haag ou Galbrun. Cela étant, Borel s’intéresse aux applications à la physique et aux mathématiques, s’autorisant donc un recours à des mathématiques supérieures comme il l’avait lui-même été amené à le faire lors de ses premiers travaux probabilistes où il utilise par exemple la théorie de la mesure de Lebesgue. Par ailleurs, l’attention de Hadamard pour le théorème ergodique, et donc une application des proba- bilités à la physique, le conduit sans embarras à une formulation du problème en terme d’équations intégrales qui nécessite donc des techniques issues de l’analyse fonctionnelle. En un mot, Borel est soucieux d’adapter le matériel mathématique au lecteur qu’il envi- sage. Le point de friction entre Borel et Lévy, tient donc au fait que ce dernier propose une approche des fondements des probabilités en recourant immédiatement à des outils mathématiques transcendantes (fonction de répartition, intégrale de Stieltjes et trans- formée de Fourier-Stieltjes) excluant de fait les usagers ayant un bagage mathématique restreint. Cette opposition sur le traitement mathématique à accorder aux probabilités disparait dans les classifications disciplinaires utilisées dans les CRAS. Les notes de Lévy, après deux notes classées en calcul des probabilités, et même en présence de contenus probabilistes, sont presque systématiquement dans la catégorie analyse mathématique. De la même façon, les notes écrites par Borel lui-même montrent un usage très spécifique de la catégorie calcul des probabilités. La moindre trace d’analyse ou d’algèbre conduit à classer la note en analyse ou en algèbre, et seule l’affirmation du caractère probabiliste de la note dans les premières lignes (le titre ne suffisant pas toujours) semble garantir son p. 16.

506. [Lévy, 1925a, v]. 507. [Lévy, 1925a, vi].