A NNALES DE L ’I. H. P.
G. D ARMOIS
La méthode statistique dans les sciences d’observation
Annales de l’I. H. P., tome 3, n
o2 (1932), p. 191-228
<http://www.numdam.org/item?id=AIHP_1932__3_2_191_0>
© Gauthier-Villars, 1932, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P. » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions).
Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
La méthode statistique dans les sciences d’observation
PAR
G.
DARMOIS
1 ntroduction. - Le but de ces
leçons
est de mettre en évidencequelques
idées essentielles de la
statistique
et le caractère de cet ordrespécial qu’elle peut
mettre dans certains ensembles de résultatsexpérimentaux.
Un ensemble de recherches se
présente généralement,
soit commesuite à un désir de
vérifier, d’approfondir
et de lier un grouped’idées,
soit comme
imposé
par sonimportance pratique,
par son indiscutableprésence.
A mesure que l’observation progresse dans le domaine
qu’elle
achoisi,
les résultatsqu’elle
accumule sont alorsplacés,
soit dans les cadresparfois
assez vagues d’une sorte de théoriepréalable,
soit dansun ordre de pure
commodité, généralement
sillonné dequelques
fila-ments
logiques.
Cette
organisation provisoire, description
commode du matérielobservé, permet
àl’esprit
de dominer avecplus
d’aisance des ensembles étendus.On cherche
ensuite,
ce que d’une manièregénérale,
nousappellerons
des permanences
(~),
, certaines relationsqui
demeurent constantes, etqui
constituent des loisempiriques
desphénomènes
observés.Par
exemple,
lespremières
permanencesqui
soient apparues étaient relatives à laprésence
et aux relations de dimensions des corps natu-rels,
et certaines permanences dans les mouvements des astres. Beau- coupplus
tardseulement,
on apercevra l’ordre dans laMécanique.
( i ) DIVISIA, Economique rationnelle, chap. 1.
Ces lois
empiriques
une foisobtenues,
les démarches suivantes del’esprit
visent à lescomprendre,
lesexpliquer,
les relier entre elles.Parallèlement à l’ordre
descriptif
sedéveloppent
l’ordreexplicatif, logique,
les théories et les loisscientifiques.
Ce
développement, qui
se construit àpartir
de certaines notions à labase,
doit alors retrouver les résultats del’expérience.
Il est clair que cette
opération
demodelage
de l’information scien-tifique dépend
de la masse et de laqualité
de cette information relative à unsujet donné, qu’elle
doit tenircompte
des relationsqui
se mani-festent entre des
sujets
d’abordjugés
différents. Ainsi la constructionthéorique peut
être amenée à semodifier,
et se modifieragénéralement
au bout d’un
temps plus
ou moinslong.
Bien
entendu,
la valeurlogique
de cette construction n’a paschangé,
seulement les notions à la base ont pu se révéler
trop grossières,
insuffi-santes ou inexactes devant des faits nouveaux. La valeur
explicative
de ces notions
disparaît,
et le sens même du motexplication peut
setrouver
profondément
modifié.Par
exemple,
les permanences de lagéométrie expérimentale,
lacomparaison
desgrandeurs qu’on
y rencontre, etqui
trouvent leurplace
dans le tissulogique
de lagéométrie,
enreçoivent
uneexplication macroscopique,
maisqui perd
tout son sens dans uneconception
dis-continue de la matière.
A ces moments, on cherchera
généralement
si les anciensconcepts
sont
capables
d’unprolongement,
d’une utilisation à échelle diffé- rente, ou s’il est devenu nécessaire d’introduire desconcepts
nouveaux.C’est ainsi
qu’on
essaiera desparticules
de l’anciennegéométrie
semouvant comme
l’indique
l’anciennemécanique, jusqu’au
momentoù cette
position
sera devenue intenable enprésence
des faits nou-veaux.
Les Permanences
fonctionnelles.
- Lespremières
permanences ren- contrées par la science moderne avaient un caractèrespécial,
onpeut
dire
qu’elles
étaientrigides, analogues
à cellesqu’avait
étudié lagéo-
métrie. Considérons par
exemple
une masse gazeuse ; une foisacquises
les notions de
pression,
et detempérature,
ilapparaît qu’on
nepeut
fixer ces deux
grandeurs
sans fixer en mêmetemps
l’état de la massegazeuse. Son volume est fixé. Ces trois
grandeurs
d’état sont liéesrigi-
dement,
en ce sens que deux d’entre elles fixentl’état,
et déterminentla troisième. Ces permanences sont
fonctionnelles,
leurcorrespondant
abstrait étant la notion de
fonction ;
l’observationimpose
que le vo- lume est fonction de lapression
et de latempérature,
elle donne des valeursnumériques.
L’observation
de la chute libre d’un corpsimpose
des conclusionsanalogues.
Dèsqu’on
sait mesurer letemps convenablement,
on voit quel’espace
parcouru àpartir
dupoint
où le corps est lâché sansvitesse est
toujours
le même pour le mêmetemps
de chute. Il y a là unepermanence fonctionnelle.
L’observation
trouve que la fonction a uneexpression mathématique simple.
Plus
généralement,
laposition
au bout d’un certain intervalle detemps
nedépend
que de laposition
et de la vitesse au début de l’inter- valle. D’ailleurs onpeut
mettre tous ces résultats sous la formesimple
d’une permanence
d’accélération,
etgénéraliser
ce résultat auxéqua-
tions différentielles de la
Mécanique rationnelle, qui, partant
de sesnotions
classiques,
retrouve à la fin de sondéveloppement logique
lesrésultats de l’observation.
Ainsi,
disait LAPLACE,l’esprit
humain a pucomprendre
dans lesmêmes
expressions analytiques
les étatspassés
et futurs dusystème
du monde.
C’est la permanence fonctionnelle de
l’espace-temps
ou, si l’onveut,
la
rigidité
del’Univers, conception simple
etgrandiose qui
netraduit,
bien
entendu,
que le succès momentané d’unsystème d’explication.
Pour les gaz, si l’on s’en tient aux notions de
pression, densité,
tem-pérature,
le lien fonctionnel résulte de ce que ces notions sont surabon-dantes,
mais cetteexplication
s’arrête là.Les
permanences statistiques.
- Dès la fin du XVIIesiècle,
on a vuparaître
desrégularités
d’un ordre tout différent. ALondres,
où dès leXVIe siècle on dressait des
statistiques municipales (1),
desesprits
observateurs tels que
JOHN
GRAUNT etWILLIAM PETTYremarquèrent
un certain ordre dans un
grand
nombre de faitsdémographiques
et sociaux. Certains
rapports
demortalité,
de natalitéapparaissent
comme peu variables.
Cette constance
approchée
de certainsrapports,
calculés sur degrands nombres,
nous dirons que c’est une permanencestatistique
(i) HUBER, Les Méthodes de la Statistique, Conférence à l’École Supérieure des P. T. T. Annales
des P. T. T., avril 1927.
simple.
Lesjeux
dehasard,
tels quepile
ouface,
en donnent de nom-breux
exemples.
Une des permanences
remarquables
de ladémographie, signalée
et étudiée
depuis longtemps,
est celle durapport
des naissances mas-culines au nombre total des naissances dans une
population
détermi-née.
Quand
les observations sontsoigneusement faites,
cerapport
setrouve d’une
façon remarquablement stable,
voisin de 0,51 ; 0,515. Onne connaît pour le moment aucune
explication
satisfaisante.Les
permanences
mendéliennes del’hybridation.
- Les croisements entre races trèsvoisines, végétales
ouanimales,
fournissent desexemples saisissants, qui
par leur ensemble et leursconséquences
sontune des
plus
bellesacquisitions
de labiologie (1) .
Dans le cas leplus simple (2),
où l’on croise deux races soient A etB,
différant par un seulcaractère,
lepremier
croisemen donn des individus C que nous sup- poserons différents de A et de B. Si l’on croise entre eux les individu:C,
et
qu’on
obtienne une deuxièmegénération
asseznombreuse,
elle com-prend
desA,
des B et des C. Lesproportions
sont alors très voisines de4 I
pourA, I 2
pourC, 4 I
pour B.Dans un cas
réel,
on a trouvé sur158 produits : 41 A 78C 39 B
Ces permanences
statistiques,
étendues à des casplus complexes,
constituent les lois mendéliennes de
l’hybridation.
La radioactivité. - La
désintégration
des .noyaux radioactifspré-
sente
également
desrégularités statistiques (3).
Pour un élément déter- miné lafréquence
relative A du nombre d d’atomesdésintégrés
en untemps
donné est un nombre stable. Les constantes dedésintégra-
tion
qu’on peut exprimer
par leurinverse,
la vie moyenne, varient avecl’élément dans des
proportions
énormes. La vie moyennepeut
aller eneffet de milliards d’années à des fractions de secondes.
On trouve
là, développées
sur une échelleimmense,
des permanencesstatistiques
fournies par des mécanismesnaturels,
surlesquels
nos(i) F. GUYENOT, L’Hérédité. G. Doin et C~.
(2) Loc. cit., p.p 56-57.
(3) SODDY, Le Radium, Alcan 1926.
moyens n’ont d’ailleurs aucune
action,
et dontl’explication
pose, nous allons levoir,
unproblème particulier (1) .
.L’ordre
logique dans
lespermanences simples.
- Le résultat de l’observation est que, pour certainsrapports
calculés sur degrands nombres,
il est trèsexceptionnel
de les voir s’écarter notablement d’un nombre fixe. Pour retrouverlogiquement
un telrésultat,
il faut uti-liser un
procédé
moinsrigide
que la déductionqui, elle,
donne des cer-titudes.
JACQUES
BERNOULLI yparvint
lepremier
dans son ouvragefondamental,
ArsConjectandi,
en utilisant lesprobabilités
et lesquasi-
certitudes.
Tout comme la
géométrie
ou lamécanique
rationnelle déroulent leur ordrelogique
àpartir
des notions abstraites depoint, droite, point matériel,
masse,force,
la notion abstraite deprobabilité
est à la basedu nouvel ordre
logique (2).
Dans l’ume abstraite où les boules blanches. et noires se tiennent en
proportions ~,
q, laprobabilité
d’extraction d’une blanche estfi.
S’iln’y
a que desblanches,
c’est la certitude. S’il y a une noire sur 100.000, c’est laquasi-certitude
à1/100.000.
BERNOULLI a montré par
quel
mécanisme onpouvait
arriver àdes
quasi-certitudes. Si,
parexemple,
lesproportions
sontégales,
et
qu’on
observe lafréquence
relative des blanches apparues sur ntirages,
onpeut
se fixer un intervallequelconque
autour de lafréquence
vraie dans l’ume.
Supposons
l’intervalle 0,49 à o,51. Onpeut
deman-der
qu’il
soitexceptionnel
d’ensortir,
ou se fixer unequasi-certitude d’y
êtrecompris,
fixons-la à une valeurquelconque,
parexemple 1/1000.
BERNOULLI démontre
qu’on peut prendre n
assezgrand
pour que ces deux conditions soientremplies.
Autrementdit,
si la séried’épreuves
totalisées est assez
longue,
onpeut
être aussi sûrqu’on
ledésire,
devoir la
fréquence approcher
autantqu’on
le veut de lafréquence
vraie.On voit que cette notion abstraite de l’urne
identique
à elle-même etdans
laquelle
on fait de nombreuxtirages,
trouve uneapplication
dans les permanences
simples,
etpeut
êtreessayée
commeexplication
de ces permanences.
Par le même
procédé s’expliquent
les résultats d’unelongue
sélie depile
ouface,
et cetteexplication
non seulement réussitpratiquement,
mais nous
satisfait,
et nous donne le sentiment d’un véritableprogrès.
(i) BOREL, Éléments de la théorie des probabilités. Hermann, 1924, Note I, p. 183.
(2) BOREL, Loc. cit., p. 184.
Pourquoi ? Evidemment,
parce que la valeurnumérique 1/2
attri-buée à la
probabilité
deface,
résulte pour nous d’uneanalyse
exhaus-tive des conditions du
jeu,
structure de lapièce, lancement,
mouve-ment,
arrivée.Il est clair que si nous savions que le centre de
gravité
est très voi-sin du côté
face,
et que nousreprésentions
les observations en admet- tant laprobabilité 1 /2
pourface,
celapourrait
passer momentanément pour unedescription
assezbonne,
mais non pour uneexplication.
Permanences
statistiques
à une variable. - Ilpeut
arriver que le caractère soumis à l’observation soitcapable
de diverses valeurs.(Un
des
exemples
lesplus
célèbres est l’étude des erreursexpérimentales.)
Dans une
longue série,
àchaque
valeur est attachée lafréquence
rela-tive des
épreuves qui
ont fourni cette valeur. Il arrivefréquemment
que diverses
séries,
pourvuqu’elles
soientlongues,
fournissent desfréquences
stables pour les diverses valeurs. On a donc un ensemble de permanencessimples qu’on peut appeler
permanencestatistique
à unevariable.
L,’ étude
des erreursexpérimentales
conduitparfois
à de telles per- manences ; on en trouve de trèsnombreuses,
relatives aux caractèresles
plus divers,
dans l’0153uvre deQUETELET.
Mais on les rencontre
déjà
dans l’étude des permanencessimples.
Dans une série de
rapports
calculés sur les mêmespopulations totales,
et manifestant un
groupement
autour d’un certainnombre,
on trouvefréquemment
unerégularité
nouvelle dans la structure même de cegroupement.
Des écarts d’une
grandeur
fixéereparaissent
en conservant à peuprès
la mêmefréquence.
Il y a permanence d’une fonction de
fréquence,
ou d’une courbe defréquence.
La notion abstraite
correspondante.
- Considérons unegrandeur
àqui
certaineshypothèses
et limitations apriori permettent
un ensemble d’étatsdéterminés,
chacun de ces étatspossédant
uneprobabilité
correspondante.
’Une telle
grandeur
est ditealéatoire,
et lacorrespondance
desétats à leurs
probabilités
constitue sa loi deprobabilité.
Par
exemple
une urne renfermant enproportions
déterminées desboules de
cinq
couleursdifférentes,
définit unegrandeur aléatoire,
la.couleur de la boule
extraite, capable
decinq états,
lesprobabilités
étant les
fréquences
relatives dechaque système
de boules dans l’urne.Le résultat fondamental de
Jacques
BERNOULLI revient à consi-.dérer dans n
tirages
la variable aléatoire nombre dessuccès,
ou fré- quence relative dessuccès, capable
de n + ivaleurs ;
la loi deproba-
bilité est fournie par la
règle
du binôme.Jacques
BERNOULLI a com-mencé l’étude de cette loi de
probabilité
et montréqu’un
intervalleétant choisi
qui
encadre lafréquence vraie,
laprobabilité
totale detomber dans cet intervalle est une
quasi-certitude
arbitrairementfixée,
si n est assez
grand.
Mais sa méthode ne donne que ce résultatglobal.
Abraham DE MOIVRE
qui reprit
laquestion après lui,
démontra que la courbe du binômepouvait
êtreremplacée
dans lapartie
intéressante pa- une courbe dont le seulparamètre
est la racine carrée de n. Ainsiparaissait
lapremière
permanence d’une courbe defréquence (c’était
la courbe dite maintenant de
LAPLACE-GAUSS) ,
lapremière explication possible
des permanencesstatistiques
à une variable.Description
etexplication
despermanences.
-Imaginons
mainte-nant que nous ayons devant nous une série de coups à
pile
ouface,
parexemple
100parties
de 100 coups chacune. Nous aurons 100 valeurs pour lafréquence
deface,
100 valeursgroupées
auvoisinage
de1/2.
La moyenne
générale
esto.506.
On
peut
décrire cet ensemble en disant : Tout se passe comme si laprobabilité
de face était1/2.
Les 100 nombres sontrépartis
suivantla courbe de
GAUSS,
avec leparamètre
déduit de la racine carrée de 100.On dira que les résultats de l’observation se conforment au schéma de la
probabilité 1/2.
On
peut
allerplus loin ;
lapièce qui
a servi aujeu
estexaminée,
elleest trouvée très
légèrement dissymétrique
et les conditions de lance- ment sont correctes.Imaginons
que laposition
du centre degravité
soit très bien connue, et conduise à une
probabilité
de face o,501.On
peut
alorsexpliquer
la série en disant :Il est
raisonnable,
enprésence
de la structure de lapièce
et des con-ditions de
lancement,
d’admettre 0,501 pour laprobabilité
de face. Les résultats de l’observation se conforment ici à un schéma déterminé par le raisonnement etl’expérience.
Les lois de
l’hy
bridation.-Quelle description
pouvons-nous en donner ? Onpeut toujours
tenter un schéma d’urne. Tout sepasse-t-il
comme siles individus A B C étaient
puisés
dans une urne dont lacomposition
serait fixée par les
proportions I 4, I 4, I 2 ?
Il faut pour cela que les fluctuations observées suivent la loi de la théorie des
probabilités.
C’est vrai. Nous avons donc unedescription.
Mais il est naturel de chercher à
expliquer
cette urne, en ramenant sastructure, son mode de
remplissage
àquelque
chose deplus simple.
Il est clair que
si,
d’une urne renfermant desproportions égales
dedeux sortes de
boules,
on extrait descouples,
les trois sortes decouples
se
présenteront
avec lespro a 11tes 4’
>I , I .
Voilà donc unedescrip-
tion
qui
vaplus
loin.Si l’on essaie maintenant de découvrir dans la réalité ce
qui
corres-pond
à cescouples,
ce que la théorie des chromosomes croit avoir trouvé dans les noyaux des cellulesreproductrices,
on construit uneexplication
des permanencesstatistiques observées,
àpartir
de l’urneà
chromosomes,
considérée comme un fait. .La radioactivité. - On
peut
essayer le schéma et dire : tout se passecomme s’il y avait une certaine
probabilité
dedésintégration.
Onreprésente
ainsi très bien les résultats. On est même amené àdire,
toutse passe comme s’il y avait une certaine
probabilité
dedésintégration,
la même pour
chaque
atome, et àchaque
instant. Danschaque
atomese trouve l’ume et se font les
tirages.
Achaque
élément radioactifcorrespond
une urnespéciale.
Voilà ladescription.
L’explication paraît
bien difficile. Ilfaudrait,
par une démarchelogique qui
se fonde sur une structurepossible
du noyau, rendrecompte
de ces évasions fortuites(1).
On nepeut
obtenir ce résultatavec une
mécanique
déterministe du noyau. Il fautexpliquer
l’umequi
schématise le
phénomène
par une autre ume, l’urne des étatspossibles
du noyau. Cette substitution
peut
être faite à l’aide desmécaniques
nouvelles
(2)
etparaît
avoir donné de beauxrésultats ;
sans doute elleexplique
un résultatstatistique
par une théorie à basestatistique,
mais elle met de l’ordre dans les
résultats,
et unifie les différents( r ) BOREL, Loc. cit. p. 188.
(2) Voir par exemple A. HAAS, La mécanique ondulatoire et les nouvelles théories quantiques.
Traduction française chez Gauthier-Villars, Paris.
schémas. Même si cette mise en ordre devait conserver le caractère
statistique
à la base de la nouvellemécanique,
elle réaliserait un pro-grès d’importance
etcomporterait
un véritable élémentexplicatif,
nettement différent d’ailleurs de ce que nous avons
rencontré jusqu’ici.
Permanences
statistiques
àplusieurs
variables. -L’étude
simultanée de deux ouplusieurs
caractères, faites sur les divers éléments d’unepopulation,
conduit à une notion trèsimportante, qui généralise largement
l’idée de liaison entregrandeurs physiques.
’
Fixons l’un des caractères g à un état de
grandeur
déterminée gi, etdéterminons les états de l’autre caractère
qui
lui sont associés. Noustrouvons une
répartition
defréquence
pour le deuxième caractère ~.Cette
répartition,
déterminée en mêmetemps
que gi,peut
varierquand
on considère les différents états de lagrandeur
g. La popu- lation estgénéralement
étudiée parfragments
dansl’espace,
ou dansle
temps.
Si lesrépartitions changent
peu, on a une permanencestatistique
à deuxvariables,
et si larépartition
de y pour gfixé, change
avec la valeur de g, on dit
qu’il
y a corrélation entre g et y.Un
exemple important
est fourni par l’astronomie stellaire. Les étoiles variablespériodiques qu’on appelle Céphéides
ont unepériode
bien
déterminée,
d’ailleurs très variable de l’une à l’autre. Si on meten
regard
de cettepériode
la luminosité propre ou lagrandeur
absoluede
l’étoile,
on constate que l’ensemble despoints
ne dessine pas la courbe d’une liaisonfonctionnelle,
mais que larépartition
des gran- deurs des étoiles depériode
connue, varie très nettement avec cettepériode.
Ce nuage depoints qui s’allonge
autour d’une courbereprésente
la corrélation entre lagrandeur
absolue et lapériode
desCéphéides.
La notion abstraite
correspondante.
- On l’obtient par la considéra- tion simultanée de deuxgrandeurs
aléatoires définies dans un mêmechamps,
soient G et r.A
chaque couple
d’étatsGirk correspond
uneprobabilité Pik.
Si l’on fixe la valeur
Gi
etqu’on
fasse varierk,
on a une loi de pro- babilité de la variable liéer,
loiqui
estévidemment
une fonction de lagrandeur G,
etqui peut
varier ou nonquand
varie G.On
dit, quand
cette loivarie, qu’il
y a liaisonstochastique
entre lesdeux
grandeurs
aléatoires.Quand
elle ne varie pas, il y aindépendance stochastique.
Le lien
stochastique
est lecorrespondant
abstrait de la corrélation.Il est évident que ces notions s’étendent à un nombre
quelconque
devariables,
le lienstochastique
résultant du fait que la loi deprobabilité
d’un groupe de
variables, quand
les autres variables ont des valeursfixées, change
avec ces valeurs.Description
etexplication
despermanences
à une ouplusieurs
variables. - Une loi de
probabilité
à une variablepeut toujours
êtreobtenue par une urne
ayant
la variété et lacomposition requises.
Une loi de
probabilité
à deux variablespeut
l’être de la même manière en inscrivant surchaque
boule une combinaisonGir k
etfixant les
proportions
convenables.. Tout
tirage
effectué dans ces urnes fournit des permanences statis-tiques,
avec fluctuation suivant certaines lois autour de lacomposition
réelle de
l’urne,
les lois des fluctuations variant d’ailleurs avec le mode detirage.
Nous aurons obtenu un schémad’urnes,
unedescription
desrésultats
expérimentaux,
si nous pouvons trouver une ume et un mode detirage qui
soientaptes
à redonner les observations.Il y aura élément
explicatif
si la loi deprobabilité
a une ouplusieurs.
variables,
si le mode detirage, peuvent
être dans une certaine mesure, déduitsd’hypothèses
sur le mécanisme duphénomène
observé.Par
exemple,
si l’urnepeut
être considérée commecomposée
àl’aide
d’urnes
plus simples,
ou seulement par un mécanismequi
a soncorrespondant
dans lephénomène étudié,
nous réalisons unprogrès
sur la
description
pure, nous aurons une ébaucheplus
ou moins.poussée
de théorie.*
**
Permanences à une variable. - Schémas d’urnes. - Les
premières.
observations à
représenter
conduisaient naturellement à la considéra- tion de variables aléatoires d’untype spécial,
le nombre total des suc-cès relatifs à un évènement attendu. Le succès lui même est une gran- deur aléatoire
qui prend
àchaque épreuve
la valeur l ou o.On était donc amené à additionner un
grand
nombre de variablesaléatoires,
et à étudier la loi deprobabilité
de leur somme. C’est ce pro-20I
blème
qui
a fourni les résultats essentiels de lastatistique
mathéma-tique,
etqui
estappelé
sans doute à en fournir bien d’autres.Sous la forme où le
présentent
les permanencesstatistiques simples,
chacune des variables
aléatoires, soit xi correspondant
àl’épreuve
derang i
a seulement deux valeurs i et o. Lesprobabilités
correspon-dantes pi qi peuvent
êtreprises arbitrairement,
maispuisqu’on
admetque les
épreuves
sesuccèdent, l’épreuve
derang i qui
fournit la variablealéatoire xi
fait intervenir la loi deprobabilité
liée de x;, toutes lesvaleurs
précédentes
étantsupposées
connues.. La
première recherche,
celle deBERNOULLI, supposait
que toutes ces variables sontindépendantes
entreelles,
etqu’elles
ont la même loi deprobabilité.
Les résultats sont très
simples.
Le nombre des succès est :+ ~... + ~
la
fréquence
relative des succès dans ntirages :
E étant le
symbole
del’espérance mathématique,
on a :E(f) ) _ p, E(f
-t’l2
- 03C32 f -pq s.
La
quantité importante
est : ’03C6 = f - p 03C3f
écart réduit de la
fréquence
relative. Le résultat obtenu par DE MOIVRE est que laprobabilité ~#
del’inégalité : ~~~ t
est trèsvoisine, quand n
est
grand,
de sa valeur limite pour n = oo :I 203C0 ~t-
te -t2 2dt.C’est cette dernière valeur
qui
fixe laquasi-certitude.
Il suffit dechoisir t assez
grand. Quant
à la valeur laplus grande de
soit il suffit de
prendre s
assezgrand
pour rendre cettequantité
aussi
petite qu’on
veut. _t fixe donc la
quasi-certitude.
Lap récision t vi psq
une fois tfixé varie
comme la racine carrée de s.
202
Nous avons
rappelé
cespoints classiques
pour insister sur uneremarque
importante
de K. PEARSON.Nous voulons obtenir par la théorie des
probabilités
uneimage
despermanences
statistiques.
Il faut pour cela serrer deprès
l’évaluation du nombre n. S’il nes’agit
que de démontrer la loi desgrands nombres,
on
peut
se contenter avec TCHEBICHEF de remarquer que ûl tend vers zéroavec ,
mais onn’expliquerait
pas ainsi lapetitesse
des fluctua-tions,
ni la permanence à une variablequ’elles présentent.
Cette série de s
tirages indépendants
dans une urneinvariable, répétée
un nombre N defois,
constitue le schéma de BERNOULLI. Il estrare
qu’on puisse l’appliquer
de manière satisfaisante à des sériesobservées,
ces séries ne sont pas, comme ondit,
normales.Pourtant, les
phénomènes
dedésintégration, qui
nous donnent leplus
belexemple
d’urneinvariable,
devraient enrelever,
mais ils cor-respondent
à des valeurs extrêmementpetites
de laprobabilité ~,
de sorte que les
hypothèses
nécessaires à la validité de la démonstra- tion ne sontplus vérifiées,
la courbe binomialeprésentant,
même pour degrandes
valeurs de s, unedissymétrie marquée.
La variable
qui compte ici,
c’est le nombre z desdésintégrations,
dont
l’espérance mathématique
estsp.
On admet que ceproduit
estfini
quand s
estgrand, ~ petit.
On trouvealors,
comme POISSON l’amontré,
une distribution discontinue voisine de lasuivante,
ou loi despetits nombres ;
p,.~.-~
où A =
sfi. Pr
est laprobabilité
succès.La
représentation
dans ces conditions des nombres observés dedésintégrations
radioactives se fait bien.Séries où l’urne
varie,
lestirages
restantindépendants.
- POISSONavait eu l’idée de varier l’urne à
chaque
fois dans la série destirages.
Dans ces conditions on a :
Si cette
opération
estreprise
Nfois,
on a une série de nombresqui
manifestent les deux permanences. Ils sont voisins de
Po
et la série des écarts a une courbe defréquence
voisine de la courbe deGAUSS,
si s estgrand,
mais ici leparamètre
de cette courbe est :I s p1q
1 +...+psqs s.
Il est bien clair que le
voisinage
dunombre Po peut
s’obtenir avecn’importe quelle
collection d’urnes demoyenne p0,
enparticulier
avec S urnes
p0;
leparamètre
dedispersion qui
fixe la loi des fluc- tuations varie avec cette collection d’urnes. Il a saplus
haute valeurquand
les urnes sontidentiques,
il serait nul sispo parmi
les urnesne contenaient que des
blanches,
les s(i 2014 Po) qui
restent contenantdes boules noires. C’est ce
qu’on exprime
en disantqu’à
moyenneégale,
une série de POISSON est moins
dispersée qu’une
série de BERNOULLI.Ces séries de POISSON ne se trouvent
guère
dans la réalité.Ce
qu’on
estappelé
à rencontrer, c’est évidemment une évolution lente de l’urne.Le schéma de Lexis. - Nous faisons N séries des
tirages indépen- dants,
mais cette fois l’urnequi
reste la mêmependant
les stirages, change
d’une série à l’autreparmi
les N.Les
phénomènes
sont alors tout à fait différents.La
fréquence fi
a comme valeurprobable ~,
comme écarttype
;es N nombres aléatoires
f
z ne sontplus
N valeurs d’une même variablealéatoire ;
à ladispersion
propre à chacund’eux, s’ajoute
ladisper-
sion des
pi,
oudispersion
des urnes.Cette
dispersion
desIi peut
s’étudier par la variablealéatoire,
écartquadratique
moyen desf
i autour de leur moyenne, ou mieux par le carré de cetécart,
dontl’espérance mathématique peut
êtredésignée
par
ai.
Il est clair
qu’on
aura, si les~i
ne sont pastrop dispersés,
un groupe- ment autour de leur moyenne, etqu’on
aura la même moyenne pourune infinité de
systèmes d’urnes,
mais ici la valeur deai dépasse
03C32B = p0q0
Ona :
Op
indiquant
ladispersion
des urnes. On voit que lerapport :
2 2
2 03C32B ~’-~)4
Bs 62B
est
plus grand
que l’unité. C’est le cas de la trèsgrande majorité
des. séries
statistiques réelles, qui
sontplus dispersées
que les séries de BERNOULLI donnant même moyenne, ouqui sont,
comme ondit, hypemormales.
Ce schéma de LEXIS est très
souple,
il convient à lareprésentation
d’une série
hypemormale quelconque,
il suffit de choisir03C32p
à peuprès égal
à :p0q0 s (Q2 - I).
Mais si l’on veut que le schéma ait une certaine
valeur,
il faut que les urnes aientquelque
réalité.Par
exemple,
la mortalité enAllemagne
de 1901 à 1910(1)
estI9,7 I 000,
la
population
est60,
737 millions.En
Saxe,
la mortalité est la même avec unepopulation
de 2.975 millions. Lesrapports Q
sontrespectivement 82,5
et 17,3.Si le
système
d’urnes est lemême,
on devrait avoir :(82.5~
- 1 =Q’-i
60.737
2,975Q
étant lerapport
pour la Saxe.Q
calculé par cette formule serait18,3,
la valeur réelle est 17,3. Le schémaparaît
satisfaisant.. Le Schéma d’urnes de Borel. - On
peut
obtenir des sérieshyper-
normales par un
procédé plus simple,
mais de moindresouplesse.
Ilsuffit,
dans une série normale de supposer quechaque tirage compte
pour K. Le nombre des
tirages
ne seraplus que i
etl’écart type
sera
JÉ
Il estmultiplié
parÇK .
On voit que
les fi
sont ici les N valeurs d’une même variable aléa- toirequi suit,
autour de la moyenne de BERNOULLI, une loi de GAUSS (1) L von BORTKIEVICS, Homogeneitdt und Stabilität in der Statistik, Skandinavisk Aktuaritids-krift, I9I8.
~urd.ispersée.
Onpeut
obtenir immédiatement unrapport Q
de valeurquelconque,
mais il faut que lesfi
suivent une loi de GAUSS.H est clair que
c’est,
pour lesstatistiques
demortalité,
une mise enoeuvre de l’idée de
contagion.
Il est donc naturel
d’envisager plusieurs
urnes affectées chacune d’un coeflicient K. On obtient alors un schéma d’urnes trèsgénéral, pouvant
servir à lareprésentation
des observations. ,Cas des variables aléatoires
dépendantes.
-L’hypothèse simple
des variables
indépendantes
a degrands avantages
pour lecalcul,
elle en a
parfois
moins pour la vraisemblance.Dans un cas
simple
etgénéral,
enparticulier,
elle est certainement inexacte. C’estquand
les boules ne sont pas remises dans l’ume. Cecas est
classique depuis longtemps.
On saitqu’une poignée
de Nboules, puisée
dans l’ume à Aboules,
et decomposition p,q
fournitpour
la variable aléatoirefréquence,
la mêmeespérance mathématique,
maisl’écart
type plus petit :
pq N A-N A-I.
Si A et N sont
grands,
les fluctuations suivent la loi de GAUSS.On
peut
faire d’autres conventions.Tchouprov (1)
avait examiné lecas où la boule est remise dans l’urne en
lui joignant
une boule de même couleur. Leproblème plus général
où l’on remet, avec la bouletirée,
un nombre
quelconque
de boules de mêmecouleur,
a étéposé
et traitépar POLYA
(2).
Pour des raisonsévidentes,
POLYA dit de ce schéma que c’est celui de lacontagion.
Si le nombre de boules remises en sus de la boule tirée est de la forme
AI’
on trouve pour lafréquence f
des succès :== P 03C32f = pq N I + N03B3.
E(A.=~
, °En
particulier,
si N estgrand,
mais queNI
soitfixé,
soitC,
l’écarttype
est l’écart deBERNOULLI, multiplié
parVI + C.
La loi des fluctuations est voisine de celle de
GAUSS,
mais àdisper-
sion
hypemormale,
comme dans le schéma de BOREL.(i) TCHOUPROV, Grundbegriffe undGrundprobleme der Korrelationstheorie.Teubner, 192 5.
( 2) POLYA et EGGENBERGER, Zeitschrift für Angewandte Mathematik und Mechanik, III, i923, pp. 279-289.
Si l’on
envisage
maintenant le cas de N infinimentgrand,
1 infini- mentpetit,
avecN’y
=C,
et que d’autrepart p
soit infinimentpetit,
avecN~
fini :Np == Y
on trouve une loi limite
qui s’appellera
la loi despetits
nombres aveccontagion :
pr
=(I
+c) -03BB c
- rc(03BB
-f-’c)
... (03BB + (r - I)c) r !.
Etude
de la moytalitépar diphtérie
àParis,
avant etaprès l’afifilica-
tion du sérum. - La moyenne mensuelle de la mortalité à Paris avant le sérum est de 127.
L’écart type
c =V 1500 indique
unedispersion
hypemormale.
On
peut
obtenir unereprésentation
assez satisfaisante par une loi deGAUSS,
avec coefficient decontagion.
C =
10,8
La courbe
intégrale (nombre
de mois où les décès sont inférieurs àune valeur
donnée) indique
les nombres suivants :Décès 75 100 125 150 175 200 225 Nombre de mois 9 25
48
7085
9496
Les observationsportent
sur 8 ans(1886-1893).
.Période
après
le sérum. - La moyenne mensuelle tombe à36
etla courbe de
fréquence change
de caractère.L’ajustement
par la loi despetits
nombres aveccontagion
se fait assez convenablement avecle c0153fficient :
C = 10,5.
La courbe
intégrale
donne les nombres suivants :Décès la 20 30 4° 50 60 70 80 90 Ioo 110 Nombre de mois 4 25 50 74
85
95 102 Io5 105 106 lOSLes observations
portent
sur 9 ans(1895-1903).
.L’addition des variables aléatoires et la théorie des erreurs
expérimen-
tales. - Considérons un