R EVUE DE STATISTIQUE APPLIQUÉE
I VETTE G OMES
H ELENA M. B ARROSO
A NTONIA A MARAL
Étude expérimentale de tests d’ajustement
Revue de statistique appliquée, tome 23, n
o2 (1975), p. 5-18
<http://www.numdam.org/item?id=RSA_1975__23_2_5_0>
© Société française de statistique, 1975, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ÉTUDE EXPÉRIMENTALE DE TESTS D’AJUSTEMENT(1)
M.
Ivette GOMES, Helena
M.BARROSO
et M.Antonia AMARAL
(2)1 - INTRODUCTION
L’objectif
de ce travail est l’étudeempirique
dequelques
testsd’ajuste-
zonent
("goodness-of-fit")
d’une fonction de distribution et d’une fonction de densité deprobabilité.
Pourcela,
nouspartons d’échantillons,
de tailleassez
grande, pris
dans despopulations
de diverstypes,
à fonctions de distri- bution connues, et les soumettons à des tests(de
normalité etautres).
La
méthodologie
que nous avons. suivie est différente de celleadoptée
par E. Pearson
[3] ;
; dans cetravail, après
avoirengendré
par simulation enordinateur
quelques
milliers d’échantillons aléatoires de dimension n = 10 et n = 20 deplusieurs
distributionscontinues,
Pearson teste la normalité de ces échantillons par diverses méthodes.Dans les deux sections
qui suivent.,
nous décrivons les tests utilisés et lestechniques
de calculemployées.
La section
4,
est réservée à ladescription complète
duproblème
et à laprésentation
des résultats.II - DESCRIPTION
THEORIQUE
DES TESTS EMPLOYESPlusieurs méthodes
non-paramètriques
ont étéproposées
pour testerl’hypothèse
selonlaquelle n
observationsproviennent
d’unepopulation
àfonction de distribution
F (x)
connue(sans paramètres).
Laplupart
de cesméthodes repose sur la
comparaison
de la fonction de distributionhypothé- tique, F (x),
avec la fonction de distributionempirique.
---
( 1 ) Ce travail a été réalisé dans le Centro de Matemâticas Aplicadas, Faculdade de Ciências de Lisboa, sous l’orientation de M. le Professeur J. Tiago de Oliveira.
( 1 ) Article remis le 18/ 17/73, révisé le 19/9/74.
6
où
(x’1 x’2 ... x’n)
est l’échantillonordonné,
obtenu par réordon- nancement de l’échantillon initialpris
dans lapopulation, (Xl’
xi ... ,xn)’
Parmi eux, nous avons
employé
des tests dus àKolmogorov-Smirnov,
Cramer-von
Mises, Stephens
etSherman, basés, respectivement,
sur les statis-tiques
dont la fonction de distribution
asymptotique
estde distribution
asymptotique
où
Kl/4 (x)
est une fonction deBessel ;
Andersen etDarling
ontpublié [2]
latable des valeurs de z
qui
satisfont à Prob(W2 z)
= a, pour a = 0.01(0.01) 0.99,
0.999. aveccinq décimales ;
dont la distribution
asymptotique
estoù
Q (x)
est la fonction de distribution limite de lastatistique
deKolmogorov- Smirnov ;
avec
la distribution
asymptotique
de la variable aléatoireétant normale réduite.
Revue de Statistique Appliquée, 1975 vol. XXIII N° 2
Les distributions
asymptotiques
de cesstatistiques peuvent
êtretrouvées,
en
détail,
dans[2], [5] et [6].
Remarquons
queW2n
etUn peuvent s’exprimer
en termes desstatistiques
ordonnées
avec
Deux autres
tests,
de nature différente desprécédents
et basés seulementsur la fonction de distribution
supposée F (x),
ont étéproposés
parTiago
de Oliveira
[7]
et utilisent lesstatistiques :
lesquelles
sontasymptotiquement
normales.Tiago
de Oliveira a aussiétudié, [7],
des testsd’ajustement qui
ne sontapplicables
que si la distribution de lapopulation
testée est absolument con-tinue
c’est-à-dire,
s’il existef (x)
=F’(x) ;
ces tests se fondent sur les statis-tiques :
lesquelles sont,
ellesaussi, asymptotiquement
normales3 - DENSITES EMPLOYEES ET ESTIMATION DE LEURS PARAMETRES Nous avons
simulé,
enordinateur,
13 échantillons de taille n = 1002,
avec densités de
probabilités présentées
dans le tableau I.A chacun des ces
échantillons,
et en admettant que rien n’était connu sur sadistribution,
nous avonsessayé d’ajuster,
non seulement les distributions8 Tableau 1
du tableau
I,
avec desparamètres
àestimer,
mais aussi la distribution de Weibull(minima),
dont la densité deprobabilité
estRemarquons
que la distributionexponentielle
et celle deRayleigh
obte-nues, sont des cas
particuliers
de cette distribution de Weibull pour k = 1 et k = 2Revue de Statistique Appliquée, 1975 vol. XXIII N° 2
Les distributions
asymptotiques
desstatistiques présentées
dans la sec-tion
précédente
ne sont connues que dans le cas où il n’est pas nécessaire d’estimer lesparamètres
de la distribution que l’on va tester comme étantsous-jacente
à lapopulation
où l’échantillon a étépris.
Il est donc évidentque l’estimation des
paramètres peut complètement changer
la distribution de lastatistique.
Pourtantquand
on désire faire desapplications,
on .neconnait pas, en
général,
les vraies valeurs desparamètres,
d’où la nécessitéde les estimer.
Un des
problèmes qui
seposent
est celui de savoirquelle
est la sensi-bilité d’un certain test aux
problèmes
d’estimation. Celui-ci n’est pas,pourtant, l’objectif
de cetravail ;
cequi
nous intéresse est lacomparaison
des différents tests utilisant(autant
quepossible)
le même critère d’estimation. Nous avonsopté
pour la méthode du maximum de vraisemblance parce que, enprincipe,
celle-ci
fournit,
en des conditions derégularité,
les meilleursestimateurs,
sauf en cequi
concerne la distributionrectangulaire
et la distribution Beta.Quant
à la distributionrectangulaire,
une fois que les estimateurs du maximum de vraisemblance sont obtenus comme des maxima sur la frontière del’équation
du maximum devraisemblance,
nous avons introduit une cor- rection pour cesvaleurs,
en utilisantqui
sont des valeurs centrées des extrêmes de l’intervalle(a , b),
où la fonction est définie.Pour la distribution Beta il n’a pas été
possible
d’utiliser la méthode du maximum de vraisemblance à cause de limitations del’ordinateur,
cequi
nousamena à
adopter
des estimateurs obtenus par la méthode des moments.Dans ce
cas-ci,
nous avonspris
comme valeurapprochée
de la fonctionde distribution celle que propose Peizer-Pratt
[4]
avec
fi>
étant la fonction de distributiond’une
normale réduite.10
Une fois
adopté
la critère du maximum de vraisemblance comme mé- thode d’estimation àsuivre,
ceux des testsauparavant
mentionnésqui
sontfondés sur les
statistiques T 1 n
etD 1"
nepeuvent
pas êtreappliqués
à certainesdistributions,
car les valeurs observées desstatistiques
centrées et réduites.sont nulles
La valeur observée
t i
est nullequand
la distribution testée est de Fréchet(maxima),
de Gumbel ou de Weibull(maxima),
et demême,
pourdit quand
la distribution testée est
exponentielle,
normale ou de Pareto.Il faut encore
souligner
que, dans le cas où on entend tester la distributionrectangulaire,
les tests sur la fonction de densité ne sont pasapplicables,
dufait que
D ln
etD2n
ne sontplus
fonctions des observations et prennent tou-jours
une valeurconstante, indépendemment
de la méthode d’estimation suivie.4 - DESCRIPTION DU PROBLEME. RESULTATS
Soient
Fi(x/9 ) , (i
=1 , 2 , ... , 11 )
les fonctions de distribution corres-pondant
aux densitésfi(x/0) présentées
dans le tableauI,
etF 12 (x / 0)
lafonction de distribution de Weibull
(minima), 0
étant le vecteur 0 =(0 0.
des
paramètres.
On commença par simuler en ordinateur
(Time sharing, Honeywell
BullGE
265)
un échantillon de n = 1 002 nombrespseudo-aléatoires uniformesl) (vid. Annexe)
et, àpartir
de cesnombres,
et par inversion de transformations uniformisantes(exception
faite de lanormale,
dont la fonction de distribution n’a pas d’inverseexplicite),
nous avons obtenu les échantillons(x 1 , Xn
1 , 2 , ... 13)
mentionnés dans la section 3.La fonction de distribution
Foj, sous-jacente
à lapopulation
d’où l’échan- tillon(x i , ,..., xjn)
a étépris,
est donc une des fonctionsFi,
pour une valeurparticulière 0 = 0°
duparamètre.
Relativement à chacun de ces
échantillons,
nous avons testé lapossibilité qu’il
ait été extrait d’unepopulation
à fonction de distributionFi(x/8 ) (i = 1
...12).
en estimant le vecteur 8 des
paramètres
comme il a étéindiqué
en 3. Nous avonsensuite
appliqué
la batterie des tests décrite en2.,
et obtenu pour les niveaux designification
a =0.01 ; 0.05 ; 0.10,
les résultatsprésentés
dans les tableauxII,
III et
IV, respectivement.
Ce.s
tableaux ont été élaborés comme suit :Dans la
1 ère
colonne se trouvent les distributionsFoj(j = 1 , 2 , ..., 13) sous-jacentes
auxpopulations
àétudier,
et dans la1 ere ligne
les distributionsFi (i
=1 ,
... ,12)
testées.---
(1) Des détails sur le procédé de génération peuvent être trouvés dans (1)
Revue de Statistique Appliquée, 1975 vol. XXIII N° 2
Tableau II
a = 0.01 1
12 Tableau III
z=0.05
Revue de Statistique Appliquée, 1975 vol. XXIII N° 2
Tableau IV a = 0.10
14
Dans chacun des carrés centraux, le résultat obtenu à
partir
de chacundes huit tests cités en
2.,
se trouvetoujours
dans la mêmeposition relative, d’après
le schéma.La lettre R
figure
dans cetteposition
si le test amène àrejeter l’hypothèse testée,
et la lettre A si c’est le contraire.Les
positions signalées
avec un .correspondent
à des tests non utilisables pour les raisons référées en3.,
et cellessignalées
avec *correspondent
à destests
qui
nepeuvent
pas être utilisés à cause de l’annulation de la fonction de distribution ou de la fonction densité enquelques points
ou encore à causede ces limitations de
l’ordinateur,
lesparamètres
n’ont pas pu êtreestimés,
les casescorrespondant
à ces cas-là restant vides.Il est
opportun
de remarquer que, aussitôt que la distribution sous-jacente
est un casparticulier
de la distributiontestée,
tous les testsapplicables
ont conduit à la
non-rejection
de cettedistribution,
comme on devaits’y
attendre.
Relativement à
chaque
distributiontestée,
àchaque
test, et àchaque
niveau de
signification
a(0.01 ; 0.05 ; 010)
nous avons déterminé les fractionspartielles
derejection
correcte, c’est-à-dire lequotient
entre le nombre derejec-
tions vérifiées
(vid.
tableauV)
et le nombre total derejections
correctes. Ce dernier nombre estindiqué
dans le même tableau.La colonne normale du tableau II
représente
lesrésultats,
au niveau designification
a =0.05,
de l’ensemble de tests dutype :
Ayant
un échantillon dont nous connaissons apriori
la distribution(uni- forme, normale, exponentielle, etc.)
nous allons testerl’hypothèse.
H 1
: la distribution est normaleV.S."2 :
ladistribution,
n’est pas normaleSoit en
particulier
Tous les tests
employés
ont conduit à laréjection
del’hypothèse H,
auniveau de
signification
a = 0.05 - c’est le sens dusymbole
R dans le tableau.Revue de Statistique Appliquée, 1975 vol. XXIII N° 2
Tableau V
Fraction
partielle
deréjection
correcte16
Toutes ces
réjections
sont correctes, vu que l’on savait d’avance que l’échan- tillon suivait une distributionexponentielle.
On
pourrait
s’attendre à que,chaque
fois que l’on essayed’adapter
lanormale à une distribution
qui
ne l’est pas(et
de même pour toute autre dis-tribution),
le testemployé
devrait conduire à laréjection (correcte).
Pourtant celà ne se vérifie pastoujours.
Unexemple :
C’est-à-dire, quand
nous essayonsd’adapter
à l’échantillon uniforme une distri- butionnormale,
les testsTln
etT2n
conduisent àl’acceptation, quoique
laréjection
fût correcte.Il s’avère donc que le nombre de
réjections auxquelles
conduit un testn’égale
pastoujours
le nombre deréjections qui
seraient correctes.Comme l’on voit sur le tableau
III,
et dans le cas, parexemple,
où ladistribution à tester est la
normale,
la fractionpartielle
deréjection
correcteprend
la valeur8/12
pour le testSherman ;
pour le même test, la valeur1 /5
si la distribution testée est celle de Weibull
(maxima).
Pour arriver à une
comparaison empirique
des différents tests on a calculé pour chacun d’eux le "score" des fractionspartielles
derejections
correctes,en
multipliant chaque
fraction par le nombrerespectif total
derejections
cor-rectes. On a ainsi obtenu la fraction moyenne de
réjection
correcte,laquelle
n’est que lequotient
du nombre de fois où le test a conduit à laréjection
par le nombre total deréjections
correctesauxquelles
il devraitconduire,
les valeurs de ces fractions moyennes et le nombre total derejections
correctesfigurent
au tableau VI.Tableau VI
Fraction moyenne de
rejection
correcteAlors nous pouvons dire
qu’un
test estplus puissant qu’un
autrelorsqu’il
a une
plus grande
fraction moyenne derejection
correcte.Revue de Statistique Appliquée, 1975 vol. XXIII ? 2
Ainsi nous pouvons conclure
empiriquement
que,parmi
tous les testsprésentés,
leplus puissant
est le testU2n
deStephens
parcequ’il prend
laplus grande
fraction moyenne derejection
correcte(voir
tableauVI).
En même
temps
onpeut
supposer que, dupoint
de vue desapplications,
la meilleure forme d’action n’est pas la conclusion basée sur un seul test, mais à l’aide d’un groupe de tests. Dans ce cas-là on
n’accepterait
pasl’hypothèse
testée au cas où elle aurait été
rejetée
par un des tests du groupe. Au niveau designification
a =0.10,
les deuxcouples (U2n , Sn)
et(U2n , Dn )
ont la mêmefraction moyenne de
rejection
correcte,0.9326, proche
de0.9422,
celle de la batterie de tous les tests.Pourtant,
le groupequi
nous semble leplus indiqué
est le
couple (U2n , Sn) puisque,
au niveau designification
a =0.01,
ilprésente
la fraction moyenne
0.9038, égale
à celle de la batterie etsupérieure
à celledu
couple n n) (vd.
TableauVII).
En vue de ces résultats il nous sembledispensable
le calcul des fractions moyennes deréjections
correctes pourplus
de deux tests ensemble.
Tableau VII
REFERENCES
[1] AMARAL, M.A., BARROSO, H.M., GOIES, M.I., MULLER,
D. VEIGA DEOLIVEIRA,
M.F. - Un processo de gerar númerospseudo-aleatórios
e seus testes. Rundamentos e resultados
(en
voie depublication).
[2] ANDERSON, T.W., DARLING,
P.A.(1952) - Asymptotic theory
ofcertain
goodness
of fit criteria based on stochastic processes, A nnalsof
Mathematical
Statistics, 23,
193-212.[3] PEARSON,
E.S.(1973) - Testing
fordeparture
fromnormality, Addendum
to document
69/2
N75 ISO(BRIT.
STAND.INSTN.).
[4] PEIZER, D.B., PRATT,
J.W.(1968) -
A normalapproximation
for bino-mial, F, Beta,
and other common, related tailprobabilities, I,
Journalof
the American Statistical Association
(63)
1416-1456.[5] SHERMAN,
B.(1950) -
A random variable related to thespacing
ofsample values,
A nnalsof
the MathematicalStatistics, 21,
339-361.[6] STEPHENS,
M.A.(1963) -
The distribution of thegoodness-of-fit
statis-tic
U2n , I , II, Biometrika, 50,
303-313 et51,
393-397.[7] TIAGO
DEOLIVEIRA,
J.(1963) -
Estatistica de densidades-resultadosassintóticos, Separata
da Revista da Faculdade de Ciências deLisboa,
2a sérieA,
vol.IX,
fasc. 1.18
Distribution limite de
nw2 (1)
(1)
Table extraite de l’article M. Anderson etDarling,
cf. référence 2.Revue de Statistique Appliquée, 1975 vol XXIII N° 2