R EVUE DE STATISTIQUE APPLIQUÉE
A. V ESSEREAU
Sur les conditions d’application du critérium χ 2 de Pearson
Revue de statistique appliquée, tome 6, n
o2 (1958), p. 83-96
<
http://www.numdam.org/item?id=RSA_1958__6_2_83_0>
© Société française de statistique, 1958, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
SUR LES CONDITIONS D’APPLICATION
DU CRITÉRIUM X2 DE PEARSON
par
A. VESSEREAU
Ingénieur
enchef des manufactures de l’Etat
On sait que le
"Critérium x2
" de Pearsonpermet
de tester l’accord entreune
"distribution observée"
et une"distribution théorique".
Cette dernière est définie par les
probabilités
v
attachées aux k états d’une
grandeur aléatoire,
aux k valeurs d’une variable dis-crète,
ou encore à k classes(égales
ouinégales) découpant
lechamp
de variabi- lité d’une variable continue. On supposera, dans tout cequi suit,
que cette loithéorique
est"entièrement spécifiée" :
lesprobabilités
pi sont des nombres don-nés, qui n’empruntent
rien aux observations.La distribution observée
comporte
les effectifs :Si elle constitue bien
"un échantillon" prélevé
au hasard dans la distribu- tionthéorique (N tirages indépendants
et non exhaustifs au sein d’une urne à kcatégories
de boules enproportions pl, p2 ... Pk)
laquantité
aléatoire :(qu’on désigne
parX2
pour éviter lesconfusions)
suitapproximativement
la loide
à(k - 1) degrés
de liberté - c’est-à-dire la loi de la somme des carrés de(k - 1)
variables normales réduitesindépendantes.
Lorsque
Naugmente indéfiniment,
la loi deX2
converge vers cette loide
Mais sur larapidité
de la convergence -d’oùdépendent
les conditionsd’application pratique
du"Critérium x2
dePearson"-
lesopinions
sont assez diverses. Nous citeronsquelques exemples qui
ont été relevés dans des ouvra-ges
français
ouétrangers.
"L’approximation
est trèsbonne,
et la distribution dex2 peut
être ap-pliquée
avec confiancelorsque
les effectifsthéoriques (produits Np i)
sont aumoins de 20. "
"Les
conditions de validité sont les suivantes :- aucune des
probabilités pi n’est trop
voisine de 0 ou de1,
-
Npi
n’est pastrop petit,
pas inférieur à 5 ou même 10. ""On
admetgénéralement
que le nombre des individus d’une classe doit être au minimum de5,
et que l’effectif total de l’échantillon ne doit pas être in- férieur à50".
"Lorsqu’on applique
le critérium dePearson,
on limite ordinairement leminimum des
fréquences
absolues pour une classe à 5unités".
La
question
a faitl’objet
d’études deSukhatme, Haldane, Neyman
etPearson,
Cochran. Dans unimportant
article paru en 1954 dans Biometrics(vol.
10, N°4)
Cochran estime que la condition d’un minimum de 10 ou 5 unités par classe esttrop
sévère."C’est
uneopinion, écrit-il,
car des recherches suffi- santes n’ont pas encore été faites pour rendre la situationparfaitement claire" .
Cochran donne la recommandation
pratique
suivante dans le cas d’une distribu- tion unimodale(telle
que la loi normale ou la loi dePoisson) :
grouper les clas-ses de
façon qu’à chaque
extrémité l’effectifthéorique
soit au moins de 1.Nous avons tenté
d’apporter quelques
éclaircissementssupplémentaires
sur cette
question,
et pour cela nous avons utilisé trois voiesd’approche : (1)
Méthode des moments;
(2)
loi exacte deX 2
dansquelques
cassimples ; (3)
chan-gements
de variables.1.
MÉTHODE DES MOMENTS
S’il n’est pas
possible
d’obtenirl’expression mathématique
de la loi deX2
dans le casgénéral,
onpeut
tout au moins calculer les premiers moments de cette variable et les comparer aux moments de lavariable x .
On sait que, pour(k - 1) degrés
deliberté,
lesquatre premiers
moments dex2
sont :Espérance mathématique wi
= k - 1Moment centré du 2e ordre
(variance) w2
=2(k - 1)
Moment centré du 3e ordre
1£3
=8(k - 1)
Moment centré du 4e ordre ~£4
=12(k - 1)(k
+3)
Remarquons
immédiatement que les variablesX2
etx2
ont la même es-pérance mathématique.
En effet :Les lois de
X 2 et
dex2
coïncident donctoujours,
sansrestrictions,
en cequi
concerne leurs valeurs moyennes.Le calcul des moments centrés est
beaucoup plus
laborieux. Nous l’avonsentrepris
et mené à bonne finjusqu’au
4e ordre. Peuaprès,
consultant la biblio-graphie,
nous avons constaté que J. B. S. Haldaneavait,
dès 1937 -par une mé- thode différente de la nôtre- effectué le même travail. Celui-ci a étépublié
dansBiometrika,
volumeXXIX, parts
1 etII,
Juin1937,
sous le titre"The
exact va-lues of the moments of the distribution
of x2
used as a test ofgoodness
of fitwhen
expectations
aresmall".
Nous passerons
complètement
sur le détail des calculsqui
sont relative- mentsimples pour
lavariance,
maissingulièrement
fastidieux pour les moments du 3e et surtout du 4e ordre. On obtient finalement lesexpressions
suivantes:TABLEAU 1 - Moments de
X2
=i=k
(ni - Npi)l
TABLEAU
1 - Mo~ents
deX2
=~
i =1N Np i
On constate que les moments centrés de
X 2
diffèrent des moments dex2
par des termes en
1/N~ 1/ N’2
ou1IN3 qui dépendent :
pour la
variance, de
k(nombre
declasses),
etpour le moment du 3e
ordre,de
k(nombre
declasses),
pour le moment du 4e
ordre, de
k(nombre
declasses),
On peut
effectuer surX2
une transformationsimple,
de la formele
+A ,
ou
MX
A et M étant choisis defaçon
que les deuxpremiers
moments de la va-riable transformée
(wi et w2 )
coïncident avec les deuxpremiers
moments d’unevariable
x2 (dont
le nombre dedegrés
de liberté seramodifié,
et cesseragéné-
ralement d’être un
entier,
cequi
ne constitue pas un inconvénientgrave).
Nousreviendrons sur ce
point au §
III.En conservant la valeur habituelle de
X 2,
onconstate,
àpartir
des ex-pressions ci-dessus,
que l’étroitesse de l’accord entre la loi deX2
et celle dex2
à(k - 1) degrés
de liberté-jugée
par lacomparaison
de leursquatre
pre- miers moments-dépend :
- de
l’importance
de l’échantillon(N) ;
- du nombre de classes
(k) ;
- de la loi
théorique - par
lesexpressions~ 1 Pi .Y~~ Pi ~~2 1 3, Pt
1....
Il ne semble donc pas
possible
d’énoncer unerègle unique
etsimple
in-diquant
dansquelles
conditionsl’approximation
à la loi dex2
est satisfaisanteou
acceptable.
Dans
chaque
casparticulier,
onpeut
essayer dejuger
de cedegré dl ap -
proximation par la comparaison
des moments exacts de Xet
de ceux dux2
ap-proprié.
Il ne semble pas,cependant,
que cette méthode soit vraiment intéres- sante. Outre que les calculsnumériques
serontfastidieux,
on se trouvera em-barassé pour décider si l’écart entre les valeurs observées
peut
être considérécomme
acceptable
ou non.Enfin la concordance
approximative
des moments ne constitue pas un cri- tère suffisantpuisque
la loi deX2
est discontinue tandis que cellede x2
est con-tinue.
Il.
LOI EXACTE DE X2 DANS QUELQUES CAS SIMPLES
Il est
théoriquement possible
d’établir la loi exacte deX2 lorsqu’ on
sedonne les valeurs des
p;
etl’importance
N de l’échantillon.Toutefois,
les cal-culs ne sont abordables que dans des cas très
particuliers.
Nous les avons ef-fectués dans les cas suivants :
- nombre de classes k allant de 2 à
10 ;
-
probabilités Pi
touteségales,
doncégales
àI/k,
les effectifsthéoriques
étant
Np i = N/k =
n.Remarquons
que lesexpressions
desquatre premiers
moments deX2 prennent
alors des formes assezsimples.
2 i - -k
(n ¡-Np i ) 2
1TABLEAU 2 -
Moments de X~ = V;~’ ’ i=l Np. Npi)2 quand p. " 1 =~-
k
La loi exacte de
X2
s’obtient àpartir
des calculs suivants :Soit (nl,
n2, ...nd -avec 0n i ==
N- l’une des distributionsobservées.
Il lui
correspond
uneprobabilité :
‘‘~et une valeur :
La même
probabilité
et la même valeur deX2 peuvent
s’obtenir un nom-bre de fois
égal
à :r
désignant
le nombre d’effectifsn ; non nuls, AN
le nombred’arrangements
de Nobjets
r à r,s; le
nombre de fois que l’effectif ni se trouverépété
dans le groupe(ni, n2
...nk ).
Enumérant toutes les distributions observées
qui
diffèrent par la valeur d’au moins uneffectif, quelle
que soit la classe où les effectifs sontplacés,
ondresse le tableau suivant :
On additionne enfin les
probabilités correspondant
à une même valeur deX . La distribution exacte de X a ainsi été établie dans les cas suivants :
2
A titre
d’exemple,
nous donnons ci-dessous(tableau 3)
la distribution deX2
pour(k = 5,
n =3), (k = 8,
n =2), (k = 10,
n =1).
Sur le
graphique qui suit,
on atracé,
pour ces mêmes valeurs de k et n, la courbe en escalierreprésentant,
en fonction des valeurs deX2 ,
laprobabilité
que ces valeurs soient atteintes ou
dépassées.
Le mêmegraphique
montre lacourbe continue
correspondante
pour la loide X2
à(k - 1) dégrés
de liberté. Onconstate que la courbe continue traverse correctement la
ligne
en escalier. L’ac- cord entre les deuxlignes
estparticulièrement
étroit pour les faibles valeurs de laprobabilité-
celles utilisées dans les tests- et il est naturellement d’autantplus
étroit que n estplus
élevé.La même constatationa été faite dans tous les cas étudiés. -Elle se trou-
ve résumée dans le tableau 4
qui s’interprète
de lafaçon
suivante :TABLEAU 3 - Loi exacte de
X2.
Supposons que l’on
veuille tester la distribution observée au seuil «(oc = probabilité
de conclure que la distributionthéorique
nes’applique
pas alorsqu’el-
le
s’applique), en adoptant pour X2
la valeurx2(ex)
lue dans la table dex2
à(k - 1) degrés de liberté.
Les distributions deX2
etX2
n’étant pasconfondues,
lerisque
réel n’ est pas
égal
à oc : c’est cerisque
réelqui
estindiqué
dans le tableau 4 poura = 5
%
et oc = 1 %.Sur ce tableau on a tracé des
lignes
deséparation qui indiquent
àpartir
dequelle
valeur de N il semble que lerisque correspondant
à 5%
restecompris
en-tre 4
%
et 6%,
et lerisque correspondant
à 1 ulo entre0,
8 0’o et1,
2% ;
tout aumoins est-il
probable
que pour Nplus élevé,
lesrisques
réels ne sortent pasbeaucoup
de ces intervalles. L’alluregénérale
deslignes
semble montrer que, dès que Ndépasse
15 ou20,
lesrisques
réels sont suffisamment voisins de 50/0
et 1
mo
pour que l’erreur commise en utilisant la distribution dex2 puisse
êtreconsidérée comme
pratiquement
sansimportance.
Cetteconstatation, qui
se tra-duit par un minimum
imposé
àN,
et non auxNp ~ , s’applique, rappelons-le,
aucas
particulier
où lesprobabilités
sontégales
dans toutes les classes. Elle n’estpas tellement
étonnante, puisque
alors la variance deX2
est :2(k - 1) [1 - 1/N]
Elle ne diffère de la variance de
X2
que par le coefficient( 1 - 1/ N).
Parailleurs,
l’effet de la discontinuité de
X2 ,
@ dans la zone de cette distribution intéressée par lestests,
n’aurait pasgrande importance pratique.
Ainsi,
avec 10 classesd’égale probabilité
et 10observations,
une sérietelle que :
4 1 0 0 3 0 1 0 0 1
(X2 18)
est
improbable
au seuil 5%,
et une série telle que :3 0 0 2 0 3 0 0 2 0
(X2 - 16)
est
déjà
trèssuspecte.
III. CHANGEMENTS DE VARIABLE
On ne
peut
évidemmentgénéraliser
à toute situation les conclusions de l’étudeprécédente.
On observe eneffet,
dans ce casparticulier,
deux circons- tances favorables :- la variance de
X2 égale
à2 (k - 1)(1 - 1 / N)
esttoujours
infé-rieure à celle du
x2
utilisé dans le critérium dePearson,
- la
quantité(,P",>/P, ) qui
intervient dansl’expression générale
de la va-riance et des moments d’ordre
supérieur
est minimumquand
tousles pi
sontégaux.
On
peut
considérer que, pour un nombre finid’observations,
le test parX2
à(k - 1) degrés
de liberté est inexact pour deux raisons :1 / La loi de x~
est continue alorsque celle
deX2
est discontinue. L’étu- de du casparticulier précédent
semble montrer(sans
que cela soit effectivementdémontré)
que l’effet de la discontinuité n’est pas trèsimportant,
si l’on n’est pas trèsexigeant
sur la valeur exacte du seuil designification.
2
2/
Al’exception
de la valeur moyenne, les distributions deX2
et dex2
n’ont pas exactement les mêmes moments.
En ce
qui
concerne ce deuxièmepoint,
onpeut
obtenirl’égalité
des deuxpremiers
moments(moyenne
etvariance) enprenant
une"variable X2
transfor-mée".
a/
SoitLa valeur moyenne de
X’2
est d’ =(k - 1)+A
et sa variance 2d’= 2(k - 1) + 2A
La loi de
X,2
coïncide par ses deuxpremiers
moments avec une loi dex2
à d’degrés
de liberté. Tous les moments centrés deXI 2
sont naturellement les mêmes que ceux deX2
@ mais ils doivent êtrecomparés
aux moments d’unevariable x2
dont le nombre dedegrés
de liberté est modifié.La valeur moyenne de
X"2
estd" =M(k - 1)
et sa variance 2d" =2M(k - 1).
La loi de
X"2
co’incide par ses deuxpremiers
moments avec une loi dex2à
d"degrés
de liberté. Les moments centrés deX" 2 se
déduisent de ceux deX2
en lesmultipliant
parM2
@M3,
@M~ ~
@ ... ils doivent êtrecomparés
aux mo-ments d’une loi
de x2 à
d"degrés
de liberté.En
opérant
une de ces transformations-qui·fait
intervenir une loi dex~
ayant
un nombre dedegrés
de liberté non entier-l’ajustement
est amélioré etl’on
peut
penser que le test àpartir
de la nouvelle loi dex2
seraplus
exact.Etude d’un
casparticulier
°
Nous avons étudié l’effet de ces
changements
de variable dans le cas par- ticulier suivant :k classes
effectifs
théoriques (Np, ) égaux
à 1 dans C de ces kclasses ;
effectifs
théoriques (Npj ) tous égaux -donc égaux à (N - C)/(k - C)
dans les(k - C)
autres classes.
La variance de
X2 prend
alors la forme suivante :Si N est suffisamment
grand
pour que les deux derniers termes soientpetits
parrapport
àC ,
la variance deX2 dépasse d’environ
C unités la variancede X2
à(k - 1) degrés
deliberté,
cequi peut
entraîner une erreurimportante
dans le test.
Les moments du 3e et 4e ordre
prennent
les formes suivantes : w3(X2) = 8(k - 1)
+ 23 C +(termes
en1/N
et1/N2 ) .
~~(X2) = 12(k - 1)(k
+3)
+3C 2 + (12k+ 373)C + 112+ (termes en 1/N, 1/N2, 1/N~).
Ces moments
peuvent
différer considérablement des moments deX2
à(k - 1) degrés
de liberté.Pour continuer
l’étude,
nous avons fait choix des valeursparticulieres
suivantes :
Par
exemple,
pour N = 50 et C =5,
la distributionthéorique
est la sui- vante :1111199999
Il ne
s’agit
doncplus
de distributionsd’équi-probabilité
commeau§ II,
mais au contraire de distributions fortement ou très fortement
"déséquilibrées"
(certaines probabilités
étant trèspetites
parrapport
auxautres).
1. Effet des changements du variable
surles
momentsa%La variance de x2 à(k - 1)=
9degrés
de liberté est 18. Avec les valeursnumériques choisies,
la variance deX2
varie suivant le cas de17,36
à25, 83 .
Les transformations
XI 2
etX" 2
annulent cette discordanceimportante.
b/ Le calcul numérique des moments w3
et 114 deX2
conduit à la consta- tation suivante. Ces moments s’écartent deplus
enplus
des moments d’une va-riable
X2 à
9degrés
de liberté à mesure :- que le nombre de classes à effectif
théorique égal
à 1 estplus élevé,
- que le nombre total N d’observations est
plus grand.
La différence dans les cas extrêmes
(C
=9,
N =100)
devient considéra- ble. Onpeut
dire sommairement quel’approximation
de la loi deX2
à une loi dex2 à (k - 1) degrés
de liberté est d’autant moins bonne que la distribution théo-rique
estplus "déséquilibrée".
c/
Leschangements
de variableX’ 2 = X2
+A, X" 2
=MX2 ,
avec:rapprochent
tous les deux les moments du 3e et 4e ordre des moments de la va-riable X2 comportant
lesdegrés
de libertéappropriés.
On constate(avec
les va-leurs
numériques
choisies pourk,
C etN),
que lerapprochement
est meilleuravec la variable
X" 2.
C’ est cette variable que nous retiendrons seule dans cequi
suit.II. Effet du changement du variable X"2= MX2
surle seuil de signification
Nous admettrons que la variable
X" 2
=MX2 (avec l’expression
de M don-née
ci-dessus)
suit la loide X2
à d" =M(k - 1) degrés
de liberté : ce n’est en- corequ’une approximation puisque X,,2
etx2
ne colncident que par leurespérance mathématique
et leurvariance,
et queX"2
est discontinu alors quex 2
est con-tinu.
a/
avec les valeursnumériques
choisies(k
=10),
si l’on admet queX2
est distribué en loi de
X2
à k - 1 = 9degrés
deliberté,
le test conduit àrejeter
au seuil 5
% l’hypothèse
concernant la loithéorique lorsque X2
atteint oudépasse
la valeur
16,
92.La loi de
x 2 à
d"degrés
de libertédonne,
au même seuil de 5%,
une va-leur limite pour
X" 2 ,
d’où l’on déduit la valeur limite deX2 = X., 2/M.
Le ta-bleau 5
contient,
dans sapartie gauche,
les valeurs limites deX2
ainsiobtenues,
Jpour les différentes combinaisons
(C, N)
étudiées. Ces valeurs limites varient de16, 76
à18, 64.
b/ Inversement,
à la limite16, 92
pourX2 correspond
pourX" 2
dans la loi dex2
à d"degrés
de liberté uneprobabilité qui
n’estplus
de 5%,
etqui - sous
les réserves faites
précédemment- peut
être considérée comme lerisque
réelencouru
lorsqu’on
se réfère à la loide X2 à
k - 1 = 9degrés
deliberté.
Ces pro- babilités sont données dans lapartie
droite du tableau5,
pour les différentes combinaisons(C, N)
étudiées. Elles varient de4,
8%
à8,
1 ato.TABLEAU 5 - Effet du
changement
de variableX" 2 = MX2 .
Revenant aux valeurs inscrites dans la
partie gauche
du tableau5,
onconstate que la
plus
élevée18, 64 correspond,
dans la loi dex2
à 9degrés
deliberté,
à uneprobabilité
d’environ 3%.
Dans les cas
particuliers étudiés,
et sous les réservesdéjà
faites(non
concordance des moments d’ordre
supérieur
à2, discontinuité),
onpeut
doncdire que le
risque
réel nedépassera
pas 5%
si l’onprend
pour valeur limite deX2
la valeur lue au seuil 3%
dans la table dex 2 à
9degrés
de liberté..
CONCLUSION
Les trois tentatives que nous avons faites pour essayer de mieux
préci-
ser les conditions
d’application
ducritérium x2
de Pearson nous conduisent auxconclusions suivantes : 1. La méthode
des
momentsfournit un moyen très
général
pour reconnaître si la loi deX 2
est voi- sine de la loide X2
à(k - 1) degrés
de liberté. Mais ce moyen n’estguère
utili-sable dans la
pratique
pour les raisons suivantes :- il nécessite des calculs
numériques laborieux,
- on ne saura comment
interpréter
les écarts constatés entre les moments deX2
et dex2 ,
@-
la comparaison des
momentsne tient pas
directementcompte
de la dis-continuité de
X2 .
La conclusion de cette étude est
plutôt négative :
il ne semble pasqu’on puisse
définir les conditionsd’application
correcte du critériumx2
par unerègle
simple
etprécise applicable
en toute circonstance.---
(a)
Cette valeur est16,
92 dans la loi dex2 à
9degrés
de liberté.(b)
Cette valeur est 5%
dans la loi dex2 à
9degrés
de liberté.JI.
L’étude d’un
castrès particulier (tous les pi ébauax)
montre que, dans certaines
circonstances,
le test deX2
estpratique-
ment valable même si les effectifs sont
petits, jusqu’à
êtreégaux
à l’unité dans toutes les classes. Dans ce casparticulier,
c’est le nombre total d’observations Nqui intervient, beaucoup plus
que les effectifs par classe.D’autre
part,
cette étude semble montrer que, dans larégion
de la distri- bution deX2 qui
est intéressée par les tests habituels(seuils
de 5%
ou 1010)
ladiscontinuité n’introduit pas une erreur très
importante.
3/ Après
avoir montré que les distributions de’X 2et x2ont
tendance à être d’au- tantplus
différentes que la loithéorique (caractérisée
par lesprobabilités Pi )
est
plus "déséquilibrée",
la troisième étude propose unchangement
de variable faisant coihciderpar leurs
deuxpremiers
moments(espérance mathématique
etvariance)
la variable transformée et une variablex2 dont
le nombre dedegrés
de liberté est modifié.
Cette transformation de variable n’est pas à conseiller dans la
pratique,
Jcar elle
impose
des calculs ennuyeux.Mais, compte
tenu des constatations ré- sumées en1/
et2/,
ellesuggère finalement
unerègle
un peugrossière,
maissimple, qui
est la suivante :-
lorsque
tous les effectifsthéoriques
sont au moinségaux
àquelques unités, appliquer
lecritérium x2
sous sa formeusuelle,
-
lorsque
certains effectifs sontpetits
-de l’ordre de l’unité- considérer que la valeur limite pourX2
au seuil 5%
est celle que l’on trouve dans la table dex2
à(k - 1) degrés
de liberté au seuil 2%
ou 3%.
A notre
avis,
iln’y
a pas lieu d’être extrêmementexigeant
sur la valeurexacte du seuil de
probabilité:
il nousparait pratiquement
sansimportance,
dansla
plupart
des cas, que le seuil réel soitcompris
entre 4%
et 6%,
alorsqu’on
se
figure qu’il
est exactement de 5%.
On
peut
se demander s’il n’est pasplus simple
deprocéder
à des"grou- pements",
de sorte que lesclasses,
suffisammentgarnies, permettent
d’effec-tuer le test
X2
sous sa forme usuelle. Enfait,
cettefaçon d’opérer peut
masquer des différences essentielles.On a constaté
au §
II que la série observée : 4 1 0 00 10 3 10diffère
significativement (au
seuil 5%)
de la sériethéorique
1 1 1 1 1 1 1 1 1 1
Si l’on fait des
groupements (en
admettantqu’ils aient
une baselogique)
de fa-çon que les effectifs
théoriques
soient au moins de5,
il ne reste que 2classes,
et les distributions
théorique
et observée deviennentidentiques (5 - 5).
Faire
participer
lespetits
effectifs au test-quitte
àperdre
un peu sur larigueur
de celui-ci-peut
être très utile pour examiner cequi
se passe aux"queues"
des distributions.Il arrive par
exemple qu’une
distributions’ajuste
bien à une loi normale danssapartie centrale,
mais que cela ne soitplus
vrai aux extrémités. Le grou-pement
des classespeut
alors fairedisparaître
arbitrairement des anomaliesqui
sont redoutableslorsque
les valeurscorrespondantes
de la variable inter- viennent dans desquestions
de sécurité ou de santé.SUMMARY
on
the application of Pearson’s fest
In order to see what
happens
at the"tails"
ofdistributions,
it may be use- ful to introduce the small theorical values in Pearson’sx2 test,
even if it meanslosing
some of the strictness of this test.It happens,
forexample,
that a distribution is wella justed to
a normal lawin its central
part,
but not in its extremities.Grouping
some classes may then makedisappear,
in anarbitrary
way, anomalies which are verydangerous
whenthe
corresponding
values interfere insecurity
or health matters.The three
attempts
we have madeintrying
to define the conditions of ap-plication
of Pearson’ sx2
test lead us to thefollowing
conclusions.(1)
The method of momentsgives
a verygeneral
method ofrecognizing
ifthe law of
X2
is close to the law ofx2
with(K - 1) degrees
of freedom. But thismethod is not very
practical
because it entails rather tedious numerical calcula-tions,
we do not know how the variations found out between moments ofX2
and momentsof X2
should beinterpreted, comparison
of moments does not take di-rectly
into account thediscontinuity
ofX~ .
The conclusion of this
study
is rathernegative :
it does not seempossi-
ble to define the conditions of a correct
application
of thex2
test with an easy and accurate ruleapplicable
to every case.(2)
Thestudy
of a veryparticular
case(when
all thepi
areequal)
showsthat under certain
circumstances,
the test ofx2
is ofpractical value,
even if thenumbers are
small,
even so small as toequal
one in each class. In thatparticu-
lar case, it is the total amount of observations N which matters rather than the numbers in each class.
Besides,
thisstudy
seems to prove that in the area of the distribution ofX2
which iscovered by the
usual tests(levels
of 5 or 1%),
thediscontinuity
doesnot introduce a very
important
error.(3)
Afterhaving pointed
out that the distributions ofX2
andx2
tend to be the more different as the theorical law(characterized by probabilities pi )
ismore
"unbalanced",
the thirdstudy
proposes a transformation of the variablemaking
the transformed variable anda x2 variable,
of which the number of de- grees of freedom ismodified,
coincideby
their first two moments(expected
va-lue and
variance).
. This transformation is not to be recommended in
practice,
for itimposes
tedious calculations. But even
taking
into account the statements summarized in(1)
and(2),
itsuggests finally
arule,
rather broad but easy, which is :When all theorical numbers are at least
equal
to a fewunities, apply
test of