A NNALES DE L ’I. H. P.
C ORRADO G INI
Sur quelques questions fondamentales de statistique
Annales de l’I. H. P., tome 14, n
o4 (1955), p. 245-364
<http://www.numdam.org/item?id=AIHP_1955__14_4_245_0>
© Gauthier-Villars, 1955, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P. » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions).
Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
Sur quelques questions fondamentales
de statistique (*).
par
Corrado GINI.
CHAPITRE I.
NÉCESSITÉ
ET DANGERS DE LASTATISTIQUE.
Pour discuter
probablement
de la nécessité et desdangers
de lastatistique,
il faut d’abord s’entendre sur cequ’elle
estréellement,
carce mot recouvre des
concepts
très différents. Le commis du recensement et le secrétaire de lamunicipalité
ne le voient certainement pas sous le mêmeangle
que leprofesseur qui l’enseigne
à l’école de commerce, etcelui-ci en a une notion bien différente de celle des
spécialistes
dePhysique atomique.
Cesdivergences
tiennent au fait que l’oncomprend
sous le nom de
Statistique
un ensemble detechniques
extrêmement variées aupoint
de vuedes
moyensqu’elles
mettent en 0153uvre, desdifficultés
qu’elles
soulèvent et des connaissancesqu’elles présupposent.
Ces
techniques
vont desbesognes
matérielles de la collection des données et de leurcontrôle, dépouillement
ettabulation,
pour les-quelles
suffisent une instruction élémentaire et de ladiligence,
à l’éla-boration des
résultats, qui
nécessite au moins une bonne instruction secondaire et notamment la connaissance desmathématiques
relativesà ce
niveau,
et enfin à l’évaluation de la confiancequ’il
convient d’attri- ( * ) Cet article réunit six conférences données entre le 27 avril et le 5 mai g54 à laFaculté de Sciences de l’Université de Paris, dont quatre ( reproduites aux chapitres II, IV.1, IV. 2 et V ) à l’Institut Henri Poincaré et deux ( reproduites aux chapitres 1 et II )
à l’Institut de Statistique.
buer aux dits résultats et à leur
comparaison, qui exige 1 application
desmathématiques supérieures
et enparticulier
du Calcul desProbabilités;
sans
parler
del’interprétation
des résultats dans le cadre de la science danslaquelle
ils rentrent,qui
demande pour le moins l’assimilation des éléments de la science enquestion
etqui implique
souvent des pro-blèmes délicats de la théorie
philosophique
de la connaissance.Toutes ces
techniques
ont en commun ce caractèrequ’elles
sontnécessaires,
ou tout au moinsutiles,
pour étudier aupoint
de vuequantitatif
certainsphénomènes qui n’apparaissent.
avec l’exactitude désirée que dans une masse ou collection d’observations etqui,
parconséquent,
sontappelés phénomè~2~~s
de masse oucollectifs.
C’est là le
fondement,
la raison d’être de laStatistique :
la néces-sité
d’y
recourir pour l’étudequantitative
desphénomènes
collectifs.* Jf..If.
D’où vient cette nécessité ?
.Pourquoi
l’observation ordinaire nepermet-elle
pas d’étudierquantitativement
lesphénomènes
collectifssans l’aide de la
technique statistique ?
Cela
provient
deplusieurs causes 1 ’ ) .
D’abord d’une
capacité
très limitée de notreesprit d’opérer
des syn-thèses
quantitatives.
Chacun de nous connaît un certainnombre,
dedizaines, peut-être
decentaines,
de familles et, pour chacuned’elles,
le nombre et le sexe des
enfants, mais,
si l’on nous demandequel
estle nombre moyen des enfants ou le
rapport
des filles aux garçons dans l’ensemble des familles enquestion,
nous ne savons pasrépondre.
Ici ilne
s’agit
que de dizaines ou tout auplus
de centaines d’unités. Commentpourrait-on,
sans latechnique statistique,
se rendrecompte
du nombre des habitants d’un pays ou d’unerégion
ou d’uneville,
ainsi que de leurcomposition
par sexe, parâge,
parprofession,
etc.? Toutes les foisqu’il
y a une masse nombreuse de cas, latechnique statistique
devientdonc nécessaire pour en tirer des notions
quantitatives. Lorsque
Graunt(l) Plusieurs de ces causes avaient été déjà signalées dans le volume : Il sesso dal punto di vista statistivo, Sandron, Palermo, r~o8, p. 12-Il, ainsi que dans les cours de Statistique professés depuis {gog aux Universités de Cagliari, Padaue et Rome, Voir, pour tous, le Corso di statistica, a cura di S. Gatti e c. Benedetti (lVUOfJ(;l edizione aggiornata) Année académique I~54-IÇ~S~, Rome, ieschi. 1955.
a donné le
premier exemple d’investigation statistique,
on attribuait à Londres deux millions d’habitants : il les a réduits à400
ooo( 2 ).
Notre mémoire aussi est limitée. Il s’ensuit que, même si la masse
n’est pas
nombreuse,
l’aide de lastatistique
est nécessairelorsque
lesévénements se succèdent à de
longs
intervalles. Parexemple,
les cente- ,naircs
qui
meurent dans un pays sont en nombrelimité,
mais ces décèssont tellement
espacés
dans letemps qu’après
une année l’on ne sauraiten dire le nombre. Pour
l’exprirner
il faut enprendre
note, c’est-à-dire dresser unestatistique
pour rudimentairequ’elle
soiL.Il faut de même se méfier de
l’impression
courantelorsqu’elle
se basesur d’anciennes
statistiques,
car dans l’intervalle des modifications peuvent être survenuesdont,
sansstatistique nouvelle,
on ne sauraitdûment tenir compte. C’est ainsi que
lorsqu’en
1927 on a fait lepremier
recensement de la
population
de laTurquie,
on a trouvé un chiffreplus
ou moins double de celuigénéralement
admis. Par contre on aconstaté à la
première enquête statistique
que les chiffresgénéralement
admis pour certaines
régions
del’Afrique
du Nord - telles laTripo-
litaine et le Maroc - étaient excessifs. C’est que la
population
de laTurquie
avait subi dans les annéesprécédentes
un essordémographique remarquable,
dont on n’avait pas pu se rendrecompte
faute de statis-tique
du mouvement de lapopulation,
tandis que pour laTripolitaine
et le Nlaroc on
répétait
de vieilles estimations sans réaliser les consé- quences des guerres et desémigrations
successives.D’autres sources d’erreurs dans les évaluations de la
population
faitessans l’aide de la
statistique proviennent
soit de doublesemplois
soitde l’omission des habitants. C’est ainsi que les
navigateurs européens qui,
lespremiers,
ontjeté
l’ancre devant lespetites
îles duPacifique
en ont
rapporté
des chiffres fabuleuxquant
à leurpopulation,
et ceciparce que les
indigènes
suivaient les bateaux d’unport
àl’autre, jamais
rassasiés d’admirer ces îles
flottantes,
et que lesnavigateurs
-qui
ne s’en rendaient pas
compte -
additionnaient mentalement les foulesqui
les recevaient. Uneexagération
semblable s’est vérifiée -d’après
l’aimable information d’un
collègue français
- dans lespremières
( 2 ) Cf., à ce sujet, la conférence : The first steps of Statistics (Educational Research Forum, Proceedings, Endicott, New York, I948, p. 37 et suiv. ). Dans ladite publi-
cation la typographie avait omis plusieurs périodes, mais le texte a été retabh dans son
intégrité dans les tirés à part.
évaluations des
Touaregs
del’Afrique
du Nord.Lorsque
lesFrançais
pénétrèrent
dans leurterritoire,
ils les rencontraient partout sur leurchemin,
et enrapportèrent l’in1pression qu’ils
semontaient
à descentaines de
milliers,
tandis que,lorsque
l’on a pu en faire un relevésystématique,
ils se réduisirent àquelques milliers. Evidemment,
citaient
toujours
les mêmes groupesqui
sedéplaçaient
suivant lestroupes françaises
queprobablement
ils surveillaient. D’autres tribusindigènes
s’efl’acent au contraire devant le voyageur civilisé dont ellesont
parfois
de bonnes raisons de seméfier,
de sorte que, se fiant à sesrencontres, le voyageur sous-estimera la
population
locale et, s’il tra-verse un pays habité par des
nomades,
ilrisquera
même de le croiredépeuplé.
‘Les sources d’erreurs que
je
viens derappeler,
et que seule la trch-nique statistique
peutéviter,
concernent l’énumération des cas,premier
but de la
statistique.
D’autres erreurs, dont les causes sont
parfois obscures,
affectent le lnesurabe desphénomènes collectifs,
autre but de lastatistique.
Pourquoi
les estimations desexperts,
enparticulier
celles concernantles
récoltes, qui
sontdignes
de confiance pour les valeurs normales etsous-normales,
restent-elles engénéral
en dessous de la réalité pour les valeurs excédant lanormale,
et ceci d’autantplus
que la valeur réelle s’élève au-dessus de la normale?y3).
Les vérificationsstatistiques parais-
sent avoir mis ce résultat hors de
doute,
maisl’explication
nouséchappe.
Et
pourquoi
encore lesprévisions
des variations deprix
faites par lesexperts
sont-elles erronées leplus
souvent par excès que par défaut?Des valeurs
excessives, paraît-il,
s’obtiennent tout au moins enAmérique
pour le coton, en attribuant auxprévisions
des « bears » lemême
poids qu’à
celles des «bulls » ;
; des statisticiensavisés, après
avoir mesuré de la sorte la tendancialité de leurs
prévisions,
ont su laneutraliser avec la
pondération appropriée
etrégler
avec succès leurconduite en
bourse ~ ‘’~ ).
Dire que cela arrive parce que l’homme estoptimiste
est uneexplication
toutepareille
à cellequi
attribue à lavirtus dormitiva de
l’opium
sesqualités narcotiques.
(3) Voir la communication de F. Yates, Estimation of the yield of potatoes in England and Wales by sampling methods, présentée à la XIIe Réunion scientifique
de la Société italienne de Statistique. Rome, janvier 1953.
( i ) Cf. Patologia economica, 5e édition, Utet, Turin, 1952, p. 298.
D’autres
fois,
les causes de nosimpressions
erronéespeuvent
êtreindiquées
avec certitude.Les anciennes
publications
desbiologistes
donnaient uneprépon- dérance, parfois
énorme, aux mâles parrapport
aux femelles dans lapopulation
de maintesespèces
animales etparticulièrement
despapil- lons ;
lesplus
récentes ontbeaucoup
réduit etquelquefois
mêmecontredit cette
prédominance.
Lespremières
se basaientgénéralement
sur les
observations
courantes, les dernières se fondent sur des statis-tiques systématiques.
La différence entre les résultats des unes et desautres tient à ce que dans maintes
espèces animales,
etparticulièrement
chez les
papillons,
il y a undimorphisme
sexuel trèsmarqué,
dans lescaractères
morphologiques
etpsychiques, qui
a pour effet que les mâlessont
beaucoup plus
mobiles et d’un aspectbeaucoup plus frappant
queles
femelles,
celles-ci étant relativement immobiles et se confondantsouvent par mimétisme avec le milieu environnant. A défaut de
technique statistique,
les mâlesapparaissent
parconséquent
aux yeux de l’obser-vateur avec une
fréquence beaucoup plus
élevée que les femelles. Dans lesespèces qui
sontl’objet
de lapoursuite
de l’homme(chasse, pêche),
une
impression
erronéepeut provenir
de laplus grande
facilitéd’échap-
per
qu’ont
lesreprésentants
d’un sexe encomparaison
avec ceux de l’autre. Ilparaît
que, dans certainesespèces
depoissons,
ce sont lesmâles que l’on
pêche plus facilement,
tandis que les femelles des lièvres tomberaientplus
souvent sous leplomb
deschasseurs (;».
Lespion-
niers
anglais
de laCompagnie
des Indes commirent semblable erreurlorsqu’ils rapportèrent
que dans ce pays il y avaitje
ne sais combiende femmes pour
chaque
homme. Les recensementsqui
suivirent démon- tèrent que, non seulement ce n’était pasvrai,
mais que, dans lesIndes,
contrairement à ce que l’on constate en
Angleterre
et dans d’autrespays
européens,
ce sont les hommesqui l’emportent
aupoint
de vuenumérique.
L’erreurprovenait
du fait que lesditspionniers
s’étaientsurtout trouvés en contact avec les familles riches du pays, où la
poly- gamie
étaitadmise,
ces familles pouvant se permettre Je luxe d’une) Dans l’ouvrage cité (Ilsesso..., cUap. VI : La distribuzione dei sessi delle specie
animali e vegetali, p. I83-229), on peut trouver des informations à ce sujet pour les espèces rnentionnées dans le texte. ainsi que pour quclques autres (rats. oiseaux.
araignées. etc. ).
harem bien fourni. Ils
généralisaient
de la sorte des observationsqui
n’étaient pas du tout
représentatives ( ~ ).
Même, lorsque
tous les cas ont une chanceégale
de tomber sousnotre
observation,
il se peut quequelques-uns frappent systémati-
quement
notre attentionplus
que d’autres. Ilss’inscrivent,
par con-séquent, plus profondément
dans notre mémoire et nous laissentl’impression
d’êtreplus fréquents qu’ils
ne le sont en réalité.Les contrastes nous
frappent plus
que les concordances.Si,
dans uncouple,
l’homme et la femme sont bien assortis par la taille ouPage,
s’ils se comportent d’une
façon analogue,
si tous deux sont pourvus d’undegré
de culture à peuprès semblable,
si l’un et l’autre sontbruns,
oublonds,
nousn’y prêtons
passpécialement attention;
mais sil’un est brun foncé et l’autre tout à fait
blond ;
si l’un est remuant etbavard,
l’autre silencieux ettimide;
si l’un est degrande
taille et l’autretrès
petit;
si l’un estjeune
et l’autreâgé ;
si l’un est manifestement très cultivé tandis que l’autre fait preuve d’uneignorance exceptionnelle,
nous le remarquons et ne l’oublierons pas facilement. On
comprend
dès lors comment
l’impression peut
être sirépandue
-- mêmeparmi
leshommes de sciences - que dans les
mariages
il y ahétérogamie,
c’est-à-dire tendance à
s’accoupler
entre personnespossédant
des caractèrescontraires. Par contre, les recherches
statistiques,
vastes et appro-fondies,
que l’on a faites sur cesujet
mettent hors de doute l’existence d’unehomogamie,
c’est-à-dire d’une tendance às’accoupler
entresemblables, quels
que soient les caractères examinés :âge, culture, nationalité, religion,
lieu derésidence, taille, pigmentation,
ou n’im-porte quel
autre caractère,physique
oupsychique (~).
Si un bon élève
remporte
au cours de sa carrière des succèsprofes-
sionnels,
cela nousparaît
tout à faitnaturel ; mais,
si un garçonqui
était brillant à l’école fait faillite dans la
vie,
ousi,
aucontraire,
unmauvais
étudiant
se comporte ensuite trèshonorablement,
nous enrestons saisis. Cela
explique l’opinion
assezrépandue, qu’il n’y
aaucune relation
positive
entre le succès ou l’insuccès de la carrière scolaire et celui de la carrièreprofessionnelle.
Cette croyance n’a(6) Voir Corso di statistica, cité, p. 22.
( ~ ) Des recherches étendues sur l’homogamie ont été faites en Italie surtout par R. Benini ( Principii di Demografia. Bar.bera, Firenze, I90I) et par F. Sarvognan (La
scelta matrimoniale, Studi statistici, Biblioteca di Metron, Ruma, 1921).
-
pourtant
pas de fondement dans les faits. A. L.Lowell,
l’ancien recteurde
Harvard,
raconte dans son ouvrage bien connu Publicopinion in
War and Peace
(8)
comment, un de sescollègues
lui ayantexprimé ,
une telle
opinion,
il l’invita à citer des cas àl’appui.
Son interlocuteurne
put
en mentionnerqu’un
seul casprobant
et un autredouteux ;
com-bien d’autres élèves n’avait-il pas connus au cours de sa carrière
professo-
rale,
dont lecomportement
auraittémoigne
en faveur d’un accord entrele succès scolaire et le succès
professionnel !
Ils s’étaient tous effacés desa
mémoire,
tandis que le seul casexceptionnel s’y
étaitimprimé
d’unemanière inébranlable. Des recherches
statistiques
ont été faites et il vasans dire
qu’elles
ont démontré une corrélation fortementpositive
entreles notes de la carrière
académique
et le succès de la vieprofessionnelle.
Peut-être est-ce de la même circonstance -
l’impression plus
forteque nous recevons des contrastes - que dérive l’affirmation courante que dans certaines
espèces
les accouchements doubles donnenttoujours
lieu à un mâle et à une femelle. Les
jumeaux,
seraient larègle
pour le chevreuil et,d’aprés Bellingcri,
leur sexe seraienttoujours
différent.Pour le
pigeon,
une telle croyance ne remonte pas moinsqu’à Aristote,
mais les contrôles faits au commencement de ce siècle l’ont démentie : il
paraît
que lesproportions
des deux sexes se conforment au contraireau calcul des
probabilités (0).
Si,
laissée àelle-même,
sanscoercition,
l’attention de l’observateur seporte de
préférence
sur les contrastes que sur lesaccords,
cela nesignifie
pasquelle
nepuisse
êtredirigée
artificiellement vers cesderniers et détournée des
premiers;
niais il est d’ailleurspossible qu’elle
soitimpressionnée
par les contrastesplus quelle
ne le seraitspontanément.
Enquoi
consiste en effet lapropagande
-je parle
dela
propagande
honnête - si ce n’est dans Fart d’attirer l’attention sur les faitsqui
sont en accordavec
la thèse défendue et sur ceuxqui
sonten contraste avec la thèse adverse ?
Toute
propagande
mise àpart,
les événementsqui
nouschoquent,
ouLout au moins certaines
catégories
de ces événements,frappent
notreattention et souscrivent dans notre mémoire
plus profondément
que(8) ABBOT LAWRENCE LOWELL, Public opinion in Yljar and Peace, Cambridge, Massachusetts, I923.
(9) Voir Il sesso.... cité. p. I9I-I92.
ceux
qui
se déroulent en contraste avec notre attente ou tout au moinsavec notre désir.
, Dans notre
société,
les parentspréfèrent
souvent - etplus
souventils le
préféraient
autrefois - un garçon à une fille. Lastatistique
adémontré que dans les naissances la
fréquence
des garçonsl’emporte
d’environ
5%
sur celle des filles. C’est lapremière
loistatistique
quel’on ait
établi (10).
Avantqu’elle
ne lefût,
certaines gensprétendaient qu’au
contraire six ousept
filles naissaient pourchaque
garçon(11).
D’une manière
analogue,
les éleveurs dechiens, interrogés, répondaient
que le nombre de femelles dans les
portées
se trouvaitdépasser
celuides
mâles;
mêmeimpression
pour les chats. Pour leschiens,
tout aumoins,
lastatistique
a établi le contraire. Les éleveurs de chiens et de chatspréfèrent également
les mâles et restent - comme les parents dans nos familles -déçus
par les naissances de femelles.Il y
a lieu derappeler
encore que,lorsque
lessuffragettes
boule-versèrent la
tranquille
routine. de la viepolitique anglaise
defaçon qu’il
fut
question
de faire droit à leursrevendications,
lesdéputés qui
lescombattaient
avançaient,
comme un des argumentsdécisifs,
le fait que de cettefaçon
on aurait eu trois foisplus
de voix féminines que de voix masculines à cause de l’énorme excès de femmes dans lapopulation
adulte.
Or,
si un certain excès de femmes peut être effectivement constaté dans les pays lesplus
civilisésd’Europe
à cause du traitementparticulièrement
favorable que les femmes se sont assuré dans nossociétés
- et cedéséquilibre
estparticulièrement marqué
dans lespays
d’émigration
tels que laGrande-Bretagne
- on est,malgré
tout,. très loin de l’énorme
disproportion avancée
par lesantisuffragistes, qui
auraient d’ailleurs pu s’en convaincre facilement en consultant les
chiffres
des recensements(
1~-’ y. ’Plusieurs causes d’erreurs entrent ici en
ligne
de compte.D’abord,
il est certain que l’activité tapageuse dessuffragettes
devaitdonner
l’impression quelles
- et, parconséquent
lesfemmes,
dontelles faisaient
partie
- étaientplus
nombreusesqu’en
réalité. En secondlieu,
pour lesmysogines, parmi lesquels
se recrutaient évidem-(’°) Voir Il sesso... cité, p. 27-29 et 33.
Voir Corso di statistica, cité, p. v3.
f 12) Voir Corso di statistica. cité, p. 23.
ment les
antisuffragistes,
la rencontre d’une femme devait êtreplus désagréable
que celle d’un homme et, enfrappant davantage
leur atten-tion,
leur faisaitexagérer
le nombre des femmes.Enfin,
et c’est ici unenouvelle circonstance
perturbatrice
àsignaler, lorsque
l’on a embrasséune
thèse,
on est inconsciemmentporté
àexagérer
tous les argumentsqui
militent en safaveur,
de sortequ’il
n’est passurprenant
que lesantisuffragistes
aientexagéré
ladisproportion
des sexes en combattantla
réforme,
et le faitqu’ils
ne consultaient pas les données des recen-sements montre bien
qu’ils
negardaient
pas uneobjectivité parfaite
dans le feu des discussions.
Sur ce
point
une remarques’impose. Lorsque
nous nous laissonsguider impartialement
par notreconscience,
les événements contraires à notre attente nousfrappent davantage,
de sorte que nous enexagé-
rons
l’importance. Lorsque,
aucontraire,
nous avons embrassé une.
thèse,
notre subconscient entre en actionimpérieusement
et noustendons à
négliger
les cas contraires à notre attente. Le conscient et le subconscient secomportent
donc différemment et nous pouvonsaccepter,
d’unepart, l’explication
avancée par les statisticiens relativement aux affirmations erronées despré-statisticiens quant
aurapport
des sexes dans les familles humaines et lesportées
dechiots,
et d’autrepart l’enseignement
despsychanalistes, d’après lesquels
notre subconscient refoule dans l’inconscient les événementsdésagréables ( 1 °s ).
C’est la raison pour
laquelle
lescasuistiques
des médecins - si sérieux que ceux-cipuissent
être, et ils le sontquelquefois
- n’ontaucune valeur
scientifique
et restent souvent démenties par les statis-tiques.
Et c’est encore pour cette raison que tout statisticien
expérimenté
sait combien il faut se méfier de soi-même
lorsqu’il s’agit
de vérifier les,
chiffres
suspects.
Le bonsystème
consiste à faire derechef le relevé oules
calculs,
car, si l’on se borne à ne vérifier que les chiffres que l’on soupçonne, on estporté
inconsciemment à ne soupçonner et ne vérifier que ceux .qui
vont à l’encontre de notre attente et àaccepter
sans contrôle ceuxqui
la confirment.C’est de cette manière que les
préjugés
s’alimentent etprennent pied.
(13) Voir, par exemple, H. WOLTEREK. La porta dell’anima. G. (iasini. Roma. ~g~~.
p. 68.
Comme nous l’avons
relevé,
un contraste nousfrappe plus
souventqu’un
accord et en effet lespréjugés
défavorables ou portant sur desévénements défavorables sont
beaucoup plus fréquents
que ceux de la bonne chance. Par uneapplication risquée
duprincipe
de la concor-dance ou de celui de la
différence,
nous établissons une connexion cau-sale entre les
phénomènes
enquestion.
Cette croyanceétablie,
nousarrêtons notre attention sur tous les événements
qui
la confirment etnégligeons
tous ceuxqui
la contredisent. Ainsi la croyanceprend
.pied
et devient unpréjugé.
Le seul moyen de le déraciner ou, le cas
échéant,
de leconfirmer,
serait de le soumettre à
l’épreuve
du feu de lastatistique.
J. Graunt en
Angleterre
et G. Neumann enAllemagne
l’on fait avecsuccès pour certains
préjugés
de leurépoque, d’après lesquels
lesphases
de la lune elles
conjonctions
des astres auraient affecté la santépublique
et les
changements
du gouvernenient auraient été suivisd’épidémies
depeste, sans
parler
de l’influence des nombrescabalistiques ( 1 ~ ).
Leursrésultats dans ce domaine ont certainement contribué à gagner à la science
statistique
nouvelle apparue la confiance dupublic.
Dèslors,
ces recherches n’ont
plus
étépoursuivies,
etcependant
il y aurait unvaste domaine ouvert à leurs
applications
enmétéorologie
et enagricul-
ture, où de
multiples proverbes
sont courammentrépétés
etreçoivent pleine
créance de la part desagriculteurs qui règlent d’après
eux lessemailles et les travaux des
champs.
Il se peut que la
statistique
lesdémente,
mais il se peut aussiqu’elle
les confirme et les
précise.
En
effet,
l’observation courante ne noustrompe
pastoujours ;
elle estsouvent fondée.
Quelquefois
même, par un processusqui
nouséchappe,
son résultatconcorde d’une
façon surprenante
avec les mensurations que l’on tire desstatistiques.
C’est ainsi que l’écoleclinique
de DeGiovanni, s’occupant
de la constitutionhumaine,
a mis en lumière que les individus quenous jugeons
normauxprésentent
avec une très bonneapproximation
les dimensions de l’homme moyen
( ~J );
c’est ainsi que, comme nous le (14) Voir la conférence déjà mentionnée : T he first steps o f Statistics, p. 40.(Ui) Voir en partkulier, G. ViOLA, Le dirnensioni dell’iiomo medio normale (Lavori dell’ Istituto della Clinica Medica di Padova, t. Il, Hoepli, Milano. I904-I905;
reproduit en La costitu2ione individttale, t. I. Cappelli, Boiogna, y3~ ).
verrons
ensuite, l’âge qui,
dans certainesrégions
au moins del’Italie,
est
jugé
leplus
propre pourl’épouse quand l’époux
a unâge donné,
correspond
assez bien à la moyenne desâges
effectivementprésentés
parles
épouses. Mais,
en dehors de ces casisolés,
l’observation courante ne nous donne que de vaguesimpressions qualitatives :
c’est à la statis-tique
que nous devons recourir pour obtenir des mesuresprécises.
Point n’est. besoin de
statistique
pour nousapprendre
que les tailles moyennes sont lesplus fréquentes
et que les tailles élevées ou, aucontraire, basses
sontplus
rares, et môme d’autantplus
raresqu’elles s’éloignent
leplus
des moyennes ;mais,
si nous voulons connaître la courbe de distribution destailles,
le recours à lastatistique
devientnécessaire.
Nous sommes presque
toujours
en mesure de dire aveccertitude,
sans l’aide de la
statistique,
que le coût de la vieaugmente
ou aucontraire,
diminue.Mais,
si nous voulonspréciser
laportée
de lahausse ou de la
baisse,
nous ne pouvons nous passer de lastatistique.
Enfin il est des domaines dans
lesquels,
sans l’aide de lastatistique,
une seule observation fournit la mesure d’un
phénomène
avec une cer-taine
approximation, mais,
si celle-cipeut
étre suffisante dans certaines recherches et en vue de certainsbuts,
elle ne l’estplus
pour d’autres.La mesure d’une
longueur,
d’unehauteur,
d’unpoids,
d’un intervalle detemps,
est affectée par desperturbations
dues soit aux agentsextérieurs,
soit aux instrumentsemployés,
soit encore à l’observateurlui-même, perturbations qui
ont poureffet, lorsque
l’on effectue deux fois de suite la même mesure sur le mômeobjet,
que l’on n’obtientqu’exceptionnellement
deux valeurs exactement les mêmes.Et,
si l’onveut un résultat
plus
exact, il fautprocéder
à une masse d’observationsd’après
latechnique statistique
et recourir encore à celle-ci pour en déduire la valeur laplus plausible
à l’aide d’une moyenne.En résumé, nous pouvons dire
qu’il
existe desphénomènes dont,
sans l’aide de la
statistique,
nous ne pouvons pas nous rendre compte;d’autres
qui,
sans cetteaide,
ne nous laissentqu’une impression
erronéede leur
dimension ;
d’autres encorequi
nous fournissent des infor- mat.ions exactes, bien que seulementqualitatives
et pourlesquels
uneévaluation
quantitative
nécessitel’emploi
de lastatistique ;
d’autresenfin pour
lesquels
nous pouvons obtenir une évaluationquantitative
sans
l’emploi
de lastatistique,
mais alors seulement avec une certaineapproximation,
tandis que nous devons recourir à lastatistique
pour obtenir uneprécision plus grande.
Dans une conditionidéale,
oùchaque phénomène
serait énuméré et mesuré avec toute l’exactitudepossible,
iln’y en
aurait donc aucunqui
serait observé sans l’aide de lastatistique.
Etsi,
dans lapratique,
onn’y
recourt pastoujours,
c’estque l’on s’accommode de notions
qualitatives
ou de mesuresapprochées
par économie de
temps
etd’argent ( 1u ).
*
Si la
statistique
est nécessaire en théorie pour la mesure exacte detout
phénomène,
et enpratique
tout au moins pour le traitement quan- titatif desphénomènes collectifs,
elle est pourtantdangereuse.
« Avec la
statistique,
on démontre tout ce que l’on veut » , entend-on dire souvent et pour le démontrer on n’a pas disetted’exemples
destatisticiens
qui arrivent,
sur les mêmesphénomènes,
à des conclusionsopposées.
« Il y a troisespèces
de mensonges - disent lesAnglais
-dont la
pire
estreprésentée
par lesstatistiques ».
Si l’on entend par là que les
statistiques mensongères
constituent lepire
des mensonges,je
suis toutprêt
à souscrire. C’est lepire
desmensonges, car c’est le
plus
difficile à dévoiler. Cela est dû au carac-tère extrêmement
synthétique
desstatistiques.
Eneffet,
on ne réalise pasV
généralement quel
énorme travail est condensé dans un chiffre etparti-
culièrement dans un de ces
grands
nombresqui
sontcaractéristiques
dela
statistique.
Condensé et caché! l Pourl’analyser
et lecontrôler,
desrecherches laborieuses seraient nécessaires. Sauf un Intérêt tout
spécial,
on ne les fait pas et l’on
accepte
le chiffre telquel !
1Non seulement le chiffre est
synthétique,
mais lesqualifications
aveclesquelles
onl’accompagne
sont, dans bien des cas,elliptiques.
Et c’estd’ici que
proviennent
certaines contradictions -apparentes plutôt
que réelles - des statisticiens.Voyons-en
unexemple.
Soient deux pays A et B. Dans
lequel
des deux la mortalité est-elleplus
élevée? Le rapport des morts à lapopulation
estplus
élevédans A que dans B
( supposons
que la différence relative soit de10 % ~,
et alors de nombreux statisticiens en concluent que la mortalité est
plus
Ci. Corso cli statistica, cité. p. e É.
élevée dans A. Mais d’autres disent : -
Non,
cette conclusion n’est pasautorisée ;
elle est même erronée. Il y a dans Abeaucoup plus
d’enfantsque dans
B,
et la mortalité est, comme onsait, particulièrement
élevéechez les
enfants ;
il faut éliminer l’influence del’âge
par laméthode,
parexemple,
de lapopulation type.
On trouve alors que la mortalité est aucontraire, plus
élevée dans B avec une différencerelative,
disonsde 8
~~ .
- Un instant !objecte
un troisième groupe destatisticiens,
A estun pays de forte
émigration
et le nombre des hommes y restebeaucoup
inférieur à celui des
femmes,
cequi
n’a paslieu,
par contre, dansB ;
nous devons éliminer aussi l’influence du sexe, du moment
qu’il
est Ucertain que la
mortalité,
àégalité
d’autrescirconstances,
estplus
élevéepour le sexe masculin. Cette influence étant aussi
éliminée,
les coeffi-cients de mortalité
apparaissent égaux
pour les deux pays. - Mais cela n’est passuffisant,
observe unquatrième
groupe ; ladisproportion
dessexes rend
plus
rares lesmariages
et, parconséquent,
laproportion
desmariés dans A est moins élevée : i il faut éliminer aussi l’influence de l’état civil.
Après
cette troisièmeélimination,
la mortalitéapparaît
denouveau
plus
élevée dansB,
mais en faibleproportion (différence
relative de
4 ~ô ). Et pourquoi
ne pas éliminer aussi l’influence de laprofession, qui
est siforte,
sur la mortalité? Ce facteur encore étantéliminé,
la différence relative de la mortalité audommage
de B monteà 1 5
°/ .
Maispourquoi
ne pas éliminer aussi l’influence de la richesse ?Après
cette autreélimination,
la mortalitéapparaît
de nouveauplus
élevée dans
A,
mais en mesure àpeine sensible (différence
relativede i
% ). Cependant
le climat est très différent dans les deux pays.Admettons
qu’il
soitpossible
d’éliminer aussi l’iniluence de ce facteuret
qu’à
la fin la mortalitéapparaisse
presqueégale
dans les deux paysavec une différence relative
de 2%
audommage
de B.Ainsi,
dans unequestion
aussisimple
que celle de savoir si la mortalité estplus
élevéedans A ou dans
B,
nous sommesarrivés,
par les méthodesstatistiques,
à
sept
conclusionsplus
ou moins différentes. La différence relative àl’avantage
de B est, eneffet,
apparue successivement :r o % , - 8 % , o % , - 4 ~ , ~--1 ~ % , + 1 % ,
-2 %.
Et nous ne pouvons même pas direqu’il s’agisse d’approximations
successives vers le résultatfinal ;
lavaleur la
plus approchée (0 % )
du résultat final(- 2 % )
a étéobtenue,
en