A NNALES DE L ’I. H. P.
R ICHARD VON M ISES
Théorie des probabilités. Fondements et applications
Annales de l’I. H. P., tome 3, n
o2 (1932), p. 137-190
<http://www.numdam.org/item?id=AIHP_1932__3_2_137_0>
© Gauthier-Villars, 1932, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P. » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions).
Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
Théorie des probabilités. Fondements et applications
PAR
RICHARD von MISES
Les fondements de la théorie
Mesdames, Messieurs,
.Au début des conférences
que j’aurai
l’honneur de donnerici,
dansvotre bel
Institut, je
tiens à vous dire combienje
suis heureux de me trouver en face d’unpublic
aussidistingué
quecompétent
dansla
matière que je
vais traiter. Eneffet,
si onparcourt
l’histoire de la théorie desprobabilités
on y rencontre presque àchaque
pas des idées fondamentalesd’origine française.
Ne citons que Blaise PASCAL et Pierre deFERMAT,
lespremiers
fondateurs ducalcul, puis
legrand
Pierre
Simon, Marquis
de LAPLACEqui érigea
l’édificeimpérissable
de la « Théorie
analytique
», enfin Siméon DenisPOISSON,
l’auteur de la fameuse loi desgrands
nombres. Et cesgrands
maîtres du dix-huit- ième furentsuivis jusqu’à nos jours
par unelongue
série de célèbresgéomètres qui apportèrent
chacun desimportants compléments
à lathéorie
classique,
sériequi
culminait en HENRI POINCARÉ. C’estun
risque
biengrand
qued’essayer d’apporter
des modifications à une théorie sigénéralement
admise et soutenue par de sigrandes
autorités. Mais
je
suis sûrqu’une
nouvelle manière de concevoir les lois et les faits fondamentaux desprobabilités
ne sera pasadoptée
par le monde
mathématique
avant d’avoir trouvél’approbation
dessavants
français auxquels je
vais soumettre, dans cesconférences,
mes idées
principales.
138
On connaît bien les
grandes
difficultésqui s’opposent
à une défini-tion exacte de la notion de
probabilité.
Citons parexemple
HenriPOINCARÉ
qui,
en abordant son courscélèbre, s’exprime
ainsi : « On nepeut guère
donner une définition satisfaisante de la Probabilité. On ditgénéralement...
etc. » Voilà une chose bienétrange :
une théorie mathé-matique qui
commence avec un « on dit ». Et les dernières conclusions dupremier chapitre
de POINCARÉ sont : « Il y a làquelque
chosede
mystérieux,
d’inaccessible au mathématicien. » On ne saurait nierqu’une
fondation un peuplus approfondie
ne soit désirable pour unethéorie
qui,
sansdoute,
faitpartie
des sciencesmathématiques ;
surtout dans nos
temps
où la recherche desprincipes,
la recherche des fondements et des axiomes domine presque dans toutes les branches de notre science.Je
vais essayeraujourd’hui
de vous donner une es-quisse rapide
d’une nouvelle théorieque j’ai développée
dansplusieurs
travaux
depuis
1919. Dans les conférencesprochaines j’ai
l’intention à donnerquelques
détails etapplications
diverses de ces nouveauxprincipes.
I
Envisageons
pour un moment ladéfinition classique dont je
viens de
parler.
Elle définit laprobabilité
comme lerapport
du nombre des cas favorable à unévénement,
au nombre total des cas«
également possibles
».Que signifient
ces mots :également
pos- sibles » ? Lapossibilité
n’est pasmesurable,
elle n’a pas desdegrés
comme la
longueur
ou latempérature.
Sans doutel’expression
«égale-
ment
possibles »
n’estqu’une équivoque
pour «également probable
»,de sorte que la définition contient un cercle vicieux
partiel ;
elle ne fait’
que ramener le cas
général
où lesprobabilités
deplusieurs
événementspossibles
sontdifférentes,
au casspécial
où elles ont toutes la même valeur. Pour utiliser la définition il faudrait avoir par avance une défi- nition suffisante pour le cas desprobabilités égales
entreelles,
ou,comme nous
dirons,
pour le cas d’unerépartition
uniforme desproba-
bilités. Il en serait de
même,
si on voulait enmécanique
définir lavitesse en
général
en la ramenant au cassimple
d’une vitesseuniforme,
mais sans définir celle-ci au
préalable.
Dans la théorie queje
vais déve-lopper,
l’énoncéclassique
sur lerapport
du nombre des casfavorables,
etc.,
obtiendra laplace légitime
d’un théoyèmespécial qui
nouspermet
de résoudre certainsproblèmes
du calcul desprobabilités,
maisqui
ne
joue
nullement le rôle d’une définition.Constatons de
plus
que le fait de ramener touteprobabilité
au casoù tous les événements
possibles
ont la mêmeprobabilité,
n’est pastoujours praticable.
Nous disonsqu’un
dé est bon pour lejeu
si lessix
points qui peuvent
sortir sontégalement probables.
Nous en dédui-sons que la
probabilité
pourqu’un
nombrepair
seproduise, est 3 6 = I 2.
Mais si un dé est
faux, qu’il
soit falsifié ou abîmé pour une raisonquelconque,
les six caspossibles
n’étantplus également possibles,
est-cequ’il
n’existeplus
une certaineprobabilité ( différente
de 6
d’amener lepoint
6 ? Est-ce que le théorèmed’addition, qui
nous donne la
probabilité
d’un nombrepair égale
à la somme des pro- babilités pour lespoints
2, 4,6,
n’estplus juste ?
Et nous avons lamême difficulté en matière d’assurances sur la vie.
Quand
nous disonsqu’une
certaineprobabilité
de survie annuelle est 0,991, où sont là lescas
également probables ?
Y en a-t-il mille dont 991favorables,
oudix mille dont 9910 favorables ?
J’insiste
sur cepoint,
carje
trouveici le côté le
plus
faible de toute la théorie usuelle : on démontre tous lesthéorèmes,
soit la loi d’addition ou demultiplication,
soit la loi desgrands
nombres etc., ensupposant qu’il s’agisse,
en dernièreligne,
d’une énumération de cas
également probables,
etpuis
onaPPlique
ces théorèmes à des
problèmes
de toute autre nature. C’est uneexigence
inévitable pour une théorie
qui prétend
être une théorie mathéma-tique,
que ses démonstrations soient basées sur des définitions uni- voques et que ses énoncés aient un sensparfaitement
défini.Pour
parvenir
à une telle théorie il faut d’abord[fixer l’objet
dontil
s’agit
dans le calcul desprobabilités.
Il y a àdistinguer
troisgroupes de
problèmes :
lesquestions
dujeu
dehasard,
les ques- tions destatistique générale (y compris
les assurances sur lavie, etc.),
enfin les
questions posées
par laphysique
moderne. En tout cas on aaffaire à une
longue
suite d’événements ou dephénomènes,
à desexPé-
riences ou o bservations en masse. Dans
les j eux
de hasard uneexpérience
individuelle consiste par
exemple
dans le processus suivant : un dé est mis dans un cornet, on secoue le cornet,on jette
le dé sur la table et onlit le chiffre
apparaissant
en haut. Unelongue
suite de tellesépreuves
est un
objet particulier
de la théorie desprobabilités.
En affaire de sta-tistique générale
on considère commeexpérience
individuelle par exem-ple
l’examen de l’année du décès d’une certaine personne ; une série de tellesrecherches,
concernant les personnes nées dans un certain endroit et à une certaineépoque,
constitue un «phénomène
en massequi peut
servir commepoint
dedépart
pour unproblème
deprobabilités.
Enfinc’est la même
chose,
en troisièmelieu,
enphysique mathématique, quand
ils’agit
parexemple
des différentes vitesses d’ungrand
nombrede molécules gazeuses ;
ici, l’épreuve
individuelle est la mesure des troiscomposantes
de la vitesse d’une certaine molécule à un moment donné.Nous constatons que, dans tous ces cas, le résultat d’une
expérience
considérée est un
chiffre
ou ungroupe
dechiffres,
onpeut
aussidire,
unpoint
dansl’espace
à r dimensions. Nous nous servirons aussi du mot« élément » nour une
expérience individuelle,
et nommerons le résultat del’expérience
« caractèredistinctif »
» de l’élément. La notion de pro- babilité que nous allonsétablir,
est étroitement liée à la notion defré-
quence relative avec
laquelle
un certain caractère distinctif seprésente
dans la suite des résultats des observations.
Généralement dans les cours de
probabilités,
arrivé à un certainpoint
des
développements,
on introduit une notionparticulière
deprobabi-
lité dite «
statistique. »
Selon laconception usuelle,
celle-ci diffère de laprobabilité mathématique,
àlaquelle
on a affaire dans lesjeux
dehasard,
comme un terraintriangulaire
diffère d’untriangle géométrique.
Mais il faut admettre
qu’une
série dejeux
depile
ou face est aussi unphénomène réel, comparable
à untriangle
concret. Etjamais
engéô-
métrie on ne considère deux définitions distinctes de la
longueur
ou del’aire du
triangle
ou d’unefigure quelconque,
l’une valable dans la théo-rie,
l’autre pourl’expérience.
Tous les théorèmes degéométrie
sonténoncés et
prouvés
pour lesfigures abstraites,
etrigoureusement définies,
etpuis
on lesapplique
- avec une certaineapproximation
-aux
figures concrètes,
aux corpsréels,
sans donner une nouvelle défi- nition de cesobjets.
A mon avis la théorie desprobabilités
est unediscipline
tout àf ait
du même genre que lagéométyie
ou lamécanique
ra-rationetle. Elle a pour but la
description systématique
de certainsphéno-
mènes réels et se sert d’une construction idéalisée des notions et défi- nitions abstraites.
Je
veux maintenant donner une telle construction idéale pour le cas desphénomènes
destatistiques
ou deprobabilité.
II
Considérons d’abord le cas le
plus simple qui
seprésente
dans lejeu
de
pile
ou face ou dans lejeu
de rouge et noir ou dans laprobabilité
desurvie annuelle. Dans tous ces
exemples
le résultat d’uneexpérience
in-dividuelle ou le caractère distinctif d’un élément de la suite considérée
est
toujours
l’un des deuxsignes : pile
ouface,
rouge ounoir,
survie oudécès. Nous y
substituerons,
pourabréger,
les chiffres zéro et un, et par- leronsgénéralement
d’une alternative : « zéro ou un ». La notion idéalisée que nous formons d’untel jeu
ou d’un tel «phénomène
en masse » leplus simple
est la suivante : nousenvisageons
une suiteinfinie d’expériences
dont chacune ait pour résultat l’un des deux chiffres o ou l ; le
rapport
du nombre nl des « l »
parmi
les npremiers résultats,
aunombre n,
tend vers une limite~,
si le nombre n croîtindéfiniment ;
enplus
lacorrespondence
entre la valeur(o
ouI)
d’un résultat et laplace
où cerésultat se trouve dans la suite
infinie, remplit
une certaine condition d’ «arégularité »
ou de «fortuité»
que nous allons étudier à l’instant. Nousnommerons une telle suite
infinie,
obéissant aux deux conditions citéesun «
collecti f le Plus simple »
ou unealternative,
et lalimite p
laprobabi-
lité du
chi f f ~e 1 (ou
de l’événementreprésenté
par cechiffre)
dans lecollectif
considéré.L’expression
«probabilité »
sans cetteadjonction
« dans le collectif considéré » n’existe pas pour nous. Il
n’y
a pas uneprobabilité
de survie pour un individu déterminé N.N.,
iln’y
aqu’une probabilité
de survie pour une certaine classed’hommes,
constituant la base d’uncollectif,
parexemple
pour les hommes dequarante
ans, nésen
France,
deprofession non-dangeureuse. Chaque
individuappartenant
à des classes
diverses,
on nepeut jamais parler
d’uneprobabilité
desurvie pour l’individu
lui-même,
sans serapporter
à un collectif bien défini.Passons maintenant à une recherche
plus
détaillée de la notion d’aré-gularité
ou defortuité.
Oncomprend qu’il
fautdistinguer,
dans lesproblèmes
du calcul desprobabilités,
entre la suite despairs
etimpairs
dans l’ordre naturel des
nombres,
et parexemple
une suitereprésentée
par les résultats successifs
du jeu
depile
ou face. Dans ces deux cas nouspouvons admettre que la limite du
rapport’;; (nombre
des éléments d’un des deux genres au nombre total deséléments)
existe et a lavaleur I 2
.Mais nous réservons le nom de
probabilité
pour la limite du deuxième cas, caractérisé par lapropriété
suivante : Onpeut
constaterqu’en
neconsidérant que les résultats de
quatre
enquatre,
on arrive dans le casde
pile
ou face à une suite exactement de mêmecaractère,
avec le rap-port -
des résultats «pile »,
tandis que dans le cas des nombres naturels la sérieincomplète
ne contiendra que despairs
ou desimpairs
exclusive-ment. Pour définir exactement les séries
qui
forment le vraiobjet
ducalcul des
probabilités
nous introduisons une notionnouvelle,
celle du« choix de
position. »
Envisageons
unealternative,
c’est-à-dire une suite infinied’expé-
riences dont chacune ait pour résultat o et l. Nous disons
qu’on
effectueun « choix de
position »
sur cette suite en fixant une liste des nombres entierscroissants,
ai , (/.2’ a3, ~ ~ ~ de telle manière que le faitqu’un
certainnombre (/.
appartienne
ou non à la liste nedépende
pas des résultats desexpériences
numérotées CI., a. -f-1, ~ + 2, x + 3, ~ ~ ~ Onpeut prendre
par
exemple
pour établir un « choix deposition »
une loiarithmétique quelconque ;
nousprendrons
les éléments decinq
encinq,
ou bien ceuxdont le numéro est une
puissance
de 10 ou un nombrepremier,
etc.Mais on établit aussi un « choix de
position »
en utilisant les résultatsqui précédent l’élément ;
parexemple :
prenonschaque
élémentprécédé
d’un zéro ou d’une
paire
des zéros etc. Dansl’argot
des habitués deMonte-Carlo un choix de
position s’appelle
un«système à jouer » .
Le faitfondamental
qu’aucun système à jouer
nepuisse
altérer les chances d’unjoueur,
devient une base de notre théorie desprobabilités
par l’intro- duction de l’axiome suivant : Danschaque
suitepartielle
desexpé-
riences
qu’on
obtient par un choix deposition
effectué sur la suitetotale,
la limite durapport ni/~’ (nombre
des résultats « l »parmi
les n’premiers
élémentschoisis,
au nombre totaln’)
existe encore et a la mêmevaleur
fi
que dans la suiteprimordiale. Quelle
que soit lacomplication
dusystème imaginé,
il suffitd’après
cettehypothèse
de continuer lejeu
assezlongtemps
pour que lerapport
desgains
et des échecsparmi
les
parties
choisies tende vers la mêmelimite,
verslaquelle
il tenddans la suite
complète
desjeux.
Cet axiome defortuité
ou del’impossi-
bilité d’un
système
àjouer,
fait unepartie
essentielle de notre théorie.Permettez-moi maintenant de résumer la définition du collectif le
plus simple
ou de l’alternative et de laprobabilité
dans une alternative.Nous nommons « alternative » ou « collectif le
plus simple »
une suiteI43
intime
d’expériences
dont chacune aitpour
résultat zéro ou un, la cor-respondance
entre les résultats ’et l’ordre desexpériences
satisfaisant aux deux conditions suivantes :1° : Le
rapport
du nombre ni des résultatségaux
à un, au nombretotal n des
expériences
tend vers une limite déterminée~, lorsque n augmente indéfiniment ;
2° : Si on effectue un choix de
position
sur la suitedonnée,
lerapport analogue nl’/n’,
ne tenantcompte
que desexpériences choisies,
tendvers la même limite - Cette
limite,
indifférente à un choix de po-sition, s’appelle
laprobabilité
de l’événementconsidérée,
dans lecollectif
envisa gé.
tIII
Avec cette définition les
principales
difficultés de la notion deproba-
bilité sont surmontées. Revenons maintenant au cas
général, envisagé déjà plus haut,
d’une suited’expériences
dont les résultats sont donnés par des chiffresquelconques
ou par des groupes de chiffres(au
lieu dezéro et un dans le cas du collectif le
plus simple).
En tout cas onpeut représenter
le résultat d’une telleexpérience
- ou le « caractère distinc- tif » d’un élément du collectifgénéral
- par unpoint
dansl’espace
à y dimensions.
L’ensemble
despoints
considérés si onparcourt
tous les éléments de la suite infinie des
expériences,
seraappellé
son ensemble
caractéristique;
dans le cas leplus simple
d’une alternative l’ensemblecaractéristique
se réduit à l’ensemble de deuxpoints
avecles coordonnées o et 1. Dans le
jeu
de hasard avec deux dés on a unensemble
caractéristique composé
de36 points rangés
dans un carré.Dans une recherche
statistique
sur lalongueur
des feuilles d’arbres l’en- semblecaractéristique
est un certain intervalle de l’axe réel. Dans lesapplications
bien connues du calcul desprobabilités
au tir on considèrecomme ensemble
caractéristique
l’aire de lacible,
c’est-à-dire un espace continu à deux dimensions.Désignons par E
l’ensemblecaractéristique
d’une certaine suite in- finied’expériences
et par A uneportion quelconque
de E. Soit nA lenombre de tels éléments
parmi
les npremiers
éléments de la suite dont le caractère distinctif(ou
lepoint représentant
le résultat del’expé-
rience) appartient
à A. Nous demandons d’abord que lerapport nAIn
tende vers une limite déterminée
pA,
le nombre naugmentant
indé- finiment. Soit B une autreportion
deE,
sanspoints
communs avecA,
et
fiE
la limite durapport
lenombre ~
étant défini d’unemanière
analogue
à n~. Admettons maintenantque PA
et~B
ne s’éva-nouissement pas tous les
deux,
de sorte que lequotient pA/pB
soit défini.Si nous ne tenons
compte f que
des éléments de la suiteprimor-
diale dont les
points représentatifs appartiennent
soit à A soit àB,
nous avons affaire à une suite
d’expériences
dont les résultats sontcaractérisés par un des deux
signes
A et B. L’existence de la limite durapport nA/(nA
+nB)
estgarantie déjà
par lapremière hypothèse ci-dessus,
et sa valeur estPA/(PA
+ Nous demandons maintenanten
plus
que la suitepartielle
avec les caractères distinctifs A et B satis- fasse aussi à la deuxièmecondition,
formulée en haut pour une alterna- tive : Si on effectue un choix deposition
sur les(ng
+nB)
éléments ilfaut que le
rapport
du nombre des éléments avec le caractère A aunombre total des éléments retenus ait une limite
égale
à la limitede
nA nA + nB, c’est-à-dire égale à :
. fià-I- pA pA + pB
.
En résumant tout ce
qui
a été ditjusqu’ici
onpeut
formuler la défi- nition du collectif et de laprobabilité
dans le cas leplus général
commeil suit :
- Un collectif est une suite infinie
d’expériences
dont les résultats sontreprésentés
par certainspoints
dans un espace à ydimensions,
la corres-pondence
entre les résultats et l’ordre desexpériences
satisfaisant auxdeux conditions suivantes :
I~ Soit A une
portion quelconque
de l’ensemblecaractéristique ;
lerapport;
dunombre nA
de tellesexpériences parmi
les npremières
dont les résultats
appartiennent
àA,
au nombre total n desexpériences,
tend vers une limite
déterminée, n augmentant infiniment ;
2~ Soient A et B deux
portions
non-vides de l’ensemble caractéris-tique
sanspoints
communs, nA et nB les nombres de tellesexpériences parmi
les npremières
dont les résultatsappartiennent
à A ou B respec-tivement,
les limitesPA
etPB
ne s’évanouissant pas toutes lesdeux ;
sion effectue un choix de
position
sur les(nA
+nB) expériences
de sortequ’il
ne resteque na
et lerapport n’A n’A + n’B
tend vers une limiteI45
égale
à la limite durapport nA nA + nB
ou Ces deux condi-tions
remplies, la
limitePA s’appelle
laprobabilité
d’un résultatappar-
tenant à l’ensemble
A
dans lecollectif
considéré.IV
Dans notre définition
générale
de laprobabilité
nous n’avons pas fait de distinction entre le cas desprobabilités
discontinues et desprobabi-
lités dites continues ou
géométriques.
Eneffet,
cette différence n’est pas essentielledu point
de vue de la notion deprobabilité,
elle ne touchequ’aux
détails du calcul dans desproblèmes spéciaux.
Onpourrait,
enprincipe, développer
toute la théorie en ne considérant que desf onctions
d’ensemble
additifs p~ qui
définissent larépartition
de laprobabilité
sur les
portions
de l’ensemblecaractéristique.
Mais pourl’analyse
desproblèmes classiques
il faut étudier deuxtypes spéciaux
derépartition.
L’un est le cas des
probabilités
discontinues ouarithmétiques.
L’en-semble
caractéristique
ne contientqu’un
nombrefini
depoints,
et àchacun d’eux
correspond
uneprobabilité
finie. L’autre casspécial
estcelui des
probabilités
continues ougéométriques.
L’ensemble caracté-ristique
est un intervalle dansl’espace
à rdimensions,
et danschaque point
C existe la limite duquotient pA/F, pour F évanouissant,
où Adésigne
uneportion d’espace
enfermant lepoint
C et F le volume de A.Nous
appellons
cette limite une « densité deprobabilité»
pour la bien dis-tinguer
de laprobabilité
elle-même. Unerépartition arithmétique
estdonnée par les
probabilités ponctuelles, correspondant
auxpoints
ennombre fini de l’ensemble
caractéristique.
Unerépartition géométrique
sera connue
lorsqu’on
donne la valeur de la densité deprobabilité
pour tous lespoints
de l’ensemblecaractéristique.
Pour le calcul des
probabilités
il estavantageux
dans tous les cas dese servir de la
f onction de répartition que je
vais définir comme suit. Ennous bornant au cas d’une seule dimension nous considérons la fonction
f(x)
oùf signifie
laprobabilité
pour que le caractère distinctif dans le collectif soitinférieur
ouégal
à x.Évidemment f (x~
est unef onction
monotone, non-décroissante
qui
commencepar
la valeur opour
- oo etI46
finit par
la valeur lpour
+ ~. Sif(x)
est dérivable nous avons le casde la
probabilité géométrique,
sif(x)
n’a que despoints
de croissanceen nombre fini c’est le cas de la
probabilité arithmétique.
Pour définirla « moyenne » de la
répartition,
la « déviation »(carré
de l’écartmoyen)
et les autres « moments » d’une
répartition
onpeut
se servir des inté-.grales
deStieltjes
:a = xdf(x), x2df(x),
s2 = (x-a)2df(x).Ces
intégrales
se réduisent à desintégrales
riemanniennes ou à dessommes finies dans les cas
spéciaux
desprobabilités géométriques
ou.arithmétiques respectivement. Je
n’insiste pas sur lagénéralisation
pour le cas de
plusieurs
variables et sur d’autres détailspurement
ma-thématiques qui
ne touchent pas lesquestions
des fondements ou desprincipes généraux.
Mais
permettez-moi d’ajouter
une remarque. On trouve souventexprimée l’opinion
que, dans le cas desprobabilités géométriques,
ilexiste une difficulté
spéciale
à d é finir les caségalement possibles,
à causedes différentes mesures
possibles
dans un espace continu. Cetteopi-
nion n’est pas fondée. Du
point
de vue de ma théorie iln’y
a aucune différence à cetégard
entre les cas desprobabilités géométriques
et
arithmétiques.
Nous y reviendrons tout de suite.V
La définition du collectif et de la
probabilité
dans uncollectif,
établie- ci-dessus,
n’est que le commencement, lepoint
dedépart
de la théorierationnelle des
probabilités.
Sonpoint essentiel,
la baseprincipale
detous les théorèmes et toutes les recherches
spéciales
c’est l’introduction et la définition desquatre opérations simples
ouopérations
fondamen-tales
qu’on peut
exécuter sur des collectifs donnés. Avant d’entrer dansune étude de ces
opérations je
veuxpréciser
leproblème
leplus général
de la théorie des
probabilités,
et voici comment. Par desopérations
biendéfinies et se ramenant à
quatre opérations simples,
onpeut
déduire d’uncollectif
donné ou deplusieurs
collectifs donnés un nouveaucollectif.
ToutI47
géométriques
ouarithmétiques
- ou bien dans une autrehypothèse quelconque
sur lesprobabilités primordiales.
La théorie
que j’ai
l’honneur de vousdévelopper
ici estbasée,
commeje
l’aidéjà dit,
sur le faitqu’il n’y
existe quequatre opérations simples
et leurs
combinaisons,
pour déduire de nouveaux collectifs de collectifs donnés. Selon que le nombre desopérations simples
à effectuer dans uncertain cas est fini ou non, on
peut distinguer
lesproblèmes finis
oualgé- briques
desproblèmes infinis (dénombrables)
ou transcendants. Unexemple
deproblème
infini seprésente
dans l’énoncé du théorèmede Bernoulli ou de la loi des
grands nombres,
ouplus généralement
dansles théorèmes fondamentaux
que j’ai
l’intention dedévelopper
dans maprochaine
conférence. Passons maintenant à une étuderapide
desquatre opérations simples.
VI
On
peut
d’abordparvenir
à un nouveaucollectif, partant
d’un collec- tifdonné,
en effectuant un choix deposition
sur le collectif donné.Soient ei, e2, e3,... les éléments et xi, x2, ~’ ’ ’ ~ les caractères distinc- tifs de ces éléments
(c’est-à-dire
les résultats desexpériences repré-
sentées par les lettres el, e2, e3, ~ ~ ~
respectivement.
On établit unesérie ai, ~2, a.3, ~ ~ ~ de nombres naturels
croissants,
satisfaisant auxconditions mentionnées
ci-haut,
et on considère la suite des élé-ments e03B11, ea2’
. avec les valeurs non-altéréesX22’ X23’...
Ondémontre facilement que cette suite est un nouveau collectif
d’après
la définition
établie,
etqu’il
a la mêmerépartition
que le collectifprimordial
- selon la deuxième condition àremplir
par un collectif(axiome d’arégularité).
Lapremière opération simple,
- que nousnommons « sélection », - laisse la
répartition inchangée.
La deuxième
opération simple
est le «mélange
». En l’effectuant onretient tous les éléments el, e2, e3,... du collectif donné
C,
sans en sup-primer
unseul,
mais on fait varier les valeurs des caractères distinc- tifs xi, x2, x3, ~ . ~ . On déduit les nouvelles valeursxi, x2, ~3.’ ’ ’
~ des- caractères distinctifs dans le collectif déduit
C’,
en effectuant unetransformation multivoque,
de telle sortequ’à
une valeur de x’ corres-le
problème
du calcul desprobabilités
consiste en ceci : Trouver lafonc-
tion de
répartition
dans lecollectif déduit,
étant données lesfonctions
derépartition
dans lescollectifs
initiaux.Des
questions
comme les suivantes :Quelle
est laprobabilité
d’ame-ner le
point
« 6 » avec un certaindé ?,
ou :Quelle
est laprobabilité
de lasurvie annuelle pour une certaine classe
d’hommes ?,
ne sont pas desquestions
du calcul desprobabilités.
C’est la même chose pour lagéo-
métrie
qui
ne nous donne pas la valeur de la distance de deuxpoints particuliers ;
mais nouspermet
de calculer une distance si certaines distances ou autresgrandeurs géométriques
sont données. De mêmela
mécanique
rationelle nerépond
pas à laquestion : Quel
est le mouve-ment d’une certaine
pierre
en ce moment ? Elle nousapprend
à calculerla vitesse d’une
pierre
pour letemps
t, si la vitesse pour untemps précé-
dent et la force motrice sont données. Combien de malentendus
séculaires ,
combien de recherches
inutiles,
soi-disantphilosophiques,
ont leur racinedans ce
point
surlequel
on nepeut
pas assez insister. Personne ne doute que lamécanique
rationnelle ne fournisse que des relations entre des gran- deursmécaniques,
entre lesvitesses,
les coordonnées etc., des différents corps. Mais dans la théorie desprobabilités
ons’oppose
habituellement à cette restriction naturelle. On n’aime pas admettre que, comme dans toutes les sciences exactes,chaque problème
yprésente
deux côtés toutà fait différents : L’un est l’établissement des données du
problème,
et.cela est une affaire essentiellement
expérimentale,
comme la mesured’une
longueur
engéométrie,
ou d’une vitesse initiale enmécanique,
enfind’une
probabilité
dans un collectifprimordial
en calcul desprobabilités.
L’autre
côté duproblème
est la recherchethéorique qui
déduit des résul-tats, utilisant les
grandeurs
données et se servant des méthodes de la.logique
ou de lamathématique
pure.Quand
on ne considère que cette deuxièmepartie,
c’est-à-dire la recherchedéductive,
on n’a pas besoin de s’intéresser aux sources d’oùproviennent
les données. Legéomètre qui
déduit larègle
à calculer le troisième côté d’untriangle,
les deuxautres et un
angle
étantdonnés,
ne posejamais
laquestion :
D’où con-naît-on les
longueurs
des deux côtéssupposés
donnés ? On ne pourrajamais comprendre
la théorie rationnelle desprobabilités
avant d’êtreconvaincu que la recherche des
probabilités primordiales
n’est ni un devoirni un but de la théorie
mathématique
desprobabilités. Naturellement on s’occupe
souvent desproblèmes
où lesrépartitions primordiales
ne sontétablies que par une
hypothèse,
soit arbitraire ou unehypothèse
baséesur des certaines considérations de
physique théorique.
Maisjamais
lesthéorèmes et les
équations
du calcul desprobabilités
ne fournissentautre chose que des relations entre les
probabilités supposé~s
donnéeset les
probabilités
déduites.Ajoutons
que l’établissement des donnéespeut
consister dans la constatation que certainesparties
del’espace
ca-ractéristique
sontégalement probables,
soit dans le cas desprobabilités pondent plusieurs
valeurs de x. Parexemple
dans lejeu
de roulette onremplace
les valeurs o, l, 2, ... ,36
par les trois valeurs o, l et 2 enfaisant
correspondre
à la nouvelle valeur x’ == i les valeurs z, 3, 5, ~ ~ ~ 35, à la nouvelle valeur x’ = 2 les nombrespairs
du collectifprimordial
et en
ajoutant x’
= o si x = o.évidemment
larépartition
dans le nou-veau collectif ne contient que trois
probabilités distinctes,
à savoir lesprobabilités
d’amener zéro ou d’amener un nombreimpair
ou un nombrepair.
On pourra dire aussi que l’ensemblecaractéristique
du collectifprimordial
C a été subdivisé enplusieurs parties
etqu’à
tous les xqui appartiennent
à une mêmepartie correspond
le même x’. De cettefaçon
on a effectué un certain «mélange »
ou « confusion »parmi
les élé-ments du collectif
primordial,
en ne tenantplus compte
des différencesentre les valeurs confondues de x
qui appartiennent
à un même ensemblepartiel (ou correspondent
à une même valeur dex’).
Si l’ensemblecaractéristique
de C aplusieurs
dimensions onpeut
admettre que C’ ena moins. On déduit facilement de notre définition de la
probabilité
larègle
pour calculer larépartition
dans le collectifC’,
déduit parl’opé-
ration d’un «
mélange
», larépartition
dans C étantsupposée
donnée.D’après
la définition lesprobabilités
dansC,
à savoir~2, ~ ~ ~ , Pa6
au cas
du jeu
deroulette,
sont les limites desfréquences
relatives aveclesquelles
les nombres o, 1, 2, ... ,36 respectivement
sortent dansle
jeu.
D’autrepart
laprobabilité pl
dans C’ est, selon ladéfinition,
lalimite de la
fréquence
relative d’amener un nombreimpair quelconque.
Évidemment
il ne faut que sommer lesp35
pourparvenir
à la valeur cherchée de
~~.
De cette
façon
nous avons retrouvé la loi bien connue desprobabilités
totales ou loi d’addition des
probabilités.
Mais au lieu deparler
de «plu-
sieures manières selon
lesquelles
un événementpeut
seproduire,
ma-nières
qui
nepeuvent
arriver simultanément )) nous n’utilisons que des termesmathématiques
bienprécisés,
comme : ensemble depoints,
sub-division de l’en semble
caractéristique
en ensemblepartiels,
sommationd’une fonction sur les
points
de l’ensemblepartiel.
Ausurplus
notredéduction de la loi est
indépendante
de lasupposition
que lesproba-
bilités
p1, P2, p3, ...
sontégales
entre elles ouqu’il s’agit
de caségalement probables.
La déduction estjuste
aussi pour une roulette malajustée
ou pour unjeu quelconque
avec des chancesquelconques
pour les événements
particuliers.
Et comment veut-on éviter unmalentendu comme celui
qui
seprésente
dans l’énoncé habituel de la loi de sommation si on leprend
mot à mot :1/événement
de gagner cent francs à laroulette,
le 30 novembre 1931 àmidi, peut
se
produire
de deux manièresdifférentes,
en mettant 100 francs sur lacouleur rouge à Monte-Carlo ou en mettant sur la même couleur en
même
temps
àNice ;
les deux manières sontincompatibles
parcequ’on
ne
peut
pas êtreprésent
à Nice et à Monte-Carlo simultanément. Laprobabilité
dechaque
manière est-,
alors on déduit de la loi de som-mation dans son énoncé habituel que la
probabilité
de gagner cent francs est l’unité. Si on essaie de trouver un énoncéqui
nepermette
pas une telleapplication
insensée de la loi de sommation on est conduit inévi-tablement à la définition du collectif etc.
Mentionnons encore un cas
particulier,
intéressant dupoint
de vuedes
principes
de la théorie desprobabilités.
Dans lesjeux
de hasard onrencontre souvent des collectifs dont l’ensemble
caractéristique
necomprend qu’un
nombre fini m depoints
et où toutes lesprobabilités
sont
égales
entre elles. Prenons commeexemple
d’une «répartition
unif orme » le
jeu
avec deux dés corrects, où l’on a36 points
ou36
évé-nements
possibles,
tous avec la mêmeprobabilité 1 /36.
Engénéral,
si mest le nombre de
points caractéristiques
dans un collectif C àrépartition uniforme, ~la probabilité
dechaque point
est Si nous déduisonsmaintenant par
l’opération
demélange
un nouveau collectifC’,
en par-tageant
l’ensemble de mpoints
en deux ensemblespartiels
compre- nant m’ et m"points,
il faut sommer m’ fois la valeurI/m
pourparvenir
à la
probabilité ~’
quel’événement,
réunissant les m’premiers }cas possibles,
seproduise.
Ainsi on arrive,
à la formule
p’ = m’ m,
et voilà retrouvé le fameux «
rapport
du nombre des cas favorables aunombre des cas
également possibles ».
Dans cette formules’exprime
unthéorème très
spécial,
un théorème tout à faitprécis
etcomplètement
démontrable - mais pas une définition.