R EVUE DE STATISTIQUE APPLIQUÉE
R. S NEYERS
Sur les tests de normalité
Revue de statistique appliquée, tome 22, n
o2 (1974), p. 29-36
<http://www.numdam.org/item?id=RSA_1974__22_2_29_0>
© Société française de statistique, 1974, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
SUR LES TESTS DE NORMALITÉ
(1)R.
SNEYERS
Institut
Royal Météorologique
deBelgique
1. INTRODUCTION
Dans un article récent
[ 1 ],
E. Morice apassé
en revue un ensemble de testsproposés
dans la littératurestatistique
pour vérifierl’hypothèse
de la normalité de larépartition
d’une séried’observations.
Bien que l’auteur se soit défendud’apporter
un éventailcomplet
de ces tests, onpeut cependant
considérer queceux
qui
ont été réunistémoignent
des diverses tendancesqui
ontprésidé
à leur élaboration.En outre, en
rappelant
les résultats obtenus par lesexpériences
Monte Carlo effectuées pour faire ressortir lespuissances respectives
de ces tests dans le cas d’alternatives biendéterminées,
laquestion
se trouvaitimplicitement
soulevéede savoir
pourquoi
tel test donne engénéral
un meilleur résultat que tel autre.Dans ce
qui
suit nous avonsreplacé
les testsenvisagés
dans le cadregéné-
ral de
l’adéquation
d’une loi normale donnée à une série d’observations vue sousl’angle
duprincipe
des moindres carrésgénéralisés,
et nous avons montré dansquelle
mesure lesstatistiques
des tests cités formaient des casparticuliers
de lastatistique
du casgénéral.
Il est apparu de cette manière que la moindre
puissance
de certains tests parrapport
à d’autrespouvait
directement êtrerapportée
à un moindredegré
d’exhaustivité ou à une moindre efficacité
(au
sens deFisher)
desstatistiques correspondantes.
2. DE
L’ADEQUATION
DE LA LOI NORMALEComme les moments de la loi normale existent pour
n’importe quel ordre,
on
peut
admettre que cette loiappartient
à une famille de lois deprobabilité
àune infinité de
paramètres
fonctionnellementindépendants
et que, dans cettefamille,
toute loi normale est elle-même définie par des valeursparticulières
deces
paramètres.
Dans ces
conditions,
pour vérifierl’adéquation
de la loi normale à une série de n observationsindépendantes,
on pourraprocéder
à l’estimation de nparmi
l’infinité deparamètres,
estimations que l’on peut supposercorrigées
pour lebiais,
etprocéder
à un test decompatibilité
des estimations obtenues avec les valeurs données de ces nparamètres
sousl’hypothèse
nulle d’une loi normale déterminée. Enthéorie,
le choix des nparamètres importe
peupuisque n
obser-vations conduisent tout au
plus
à n estimations fonctionnellementindépendan-
tes.
Si Ilvii Il désigne
alors la matrice des covariances des estimations des para- mètres sousl’hypothèse
nulle et si03B2i, 03B2i,
i =1, 2,
..., ndésignent respective-
ment les valeurs données de ces
paramètres
et leursestimations,
lacompatibi-
lité des estimations avec les valeurs données ou encore,
l’adéquation
de laloi normale considérée pourra, en
.application
duprincipe
des moindres carrésgénéralisé,
être véfifiée au moyen de lastatistique :
où
~v(-1)ij~ I
est la matrice inverse de la matriceils,,11.
Sous certaines
conditions,
cettestatistique
seraapproximativement
distri-buée suivant une loi de
x2
à ndegrés
de liberté et, de toutesmanières,
lesgrandes
valeurs seront
significatives
d’un désaccord avecl’hypothèse
nulle.Si la valeur de la
statistique 4
n’est passignificative
au niveauadopté l’hypothèse
nulle d’unerépartition
suivant la loi normale deparamètres (3i’
i = 1, 2,..., n
pourra êtreacceptée.
Dans le cascontraire,
il conviendra de dis-tinguer
entre l’éventualité où le désaccrodpeut
être levésimplement
par un meil- leur choix desparamètres
deposition
et d’échelle et celle où un tel choix ne suf- fit pas. Pour éviter cetteambiguïté
il est clairqu’on peut
calculer la statisti- que(1)
en tenant compte de l’estimationpréalable
desparamètres
deposition
et
d’échelle,
sachant que cette estimation entraîne une modification de la loi derépartition
de lastatistique correspondant
à une réduction à(n - 2)
du nombre dedegrés
de libertépour
une loi deX2.
Signalons
encore,qu’en
cas derejet,
la méthodeesquissée peut
être con- duite de manière à déterminer l’alternativequi
s’accorde le mieux avec la séried’observations, par exemple,
en modifiant tout d’abord leparamètre 0,
1 pourlequel
lerapport (03B2i1-03B2i1 )2/vi1i
1 1est le
plus
élevé.1
Cela
étant,
les directions danslesquelles
les tests de normalité ont été déve-loppés peuvent
être caractérisées comme étant les casparticuliers
du testprécé-
dent où les
paramètres 0,
sont soit les moments centrés réduits d’ordresupérieur,
soit les
espérances mathématiques
desstatistiques d’ordre,
ou encore celles desvaleurs pour ces
statistiques
de la fonction derépartition
de la loi normale.3. LES TESTS DE NORMALITE BASES SUR LES MOMENTS CENTRES REDUITS
Appliquée
aux moments centrésréduits,
la méthodequi
vient d’être décrite conduit à unestatistique
de la forme :pour
laquelle
on peut supposer que lesPi sont des
transformées normales de moyennes nulles des estimations de ces moments et où lamatrice" vii Il
est lamatrice des convariances de ces transformées.
D’autre
part,
en raison del’indépendance
dechaque
moment centréempi- rique
d’ordreimpair
avec tous les moments centrésempiriques
d’ordrepair,
onpeut prévoir
que la corrélation entre les variablesj31
relatives aux momentsd’ordre
impair
et celles liées aux moments d’ordrepair
seranégligeable malgré
la corrélation introduite par
l’emploi
d’une estimation del’écart-type
dans le cal-cul des moments centrés réduits. On en déduit que la
statistique Xi-2
se décom-pose en la somme de deux
statistiques pratiquement indépendantes X2@ 1 n-2,et x 2
l’unedépendant
des moments d’ordreimpair
etl’autre,
des momentsd’ordre
pair.
Il s’ensuit que le test de normalité
peut
s’effectuer enprocédant séparé-
ment à un test de
symétrie
des observations au moyen de lastatistique X2 1, n-2 et
à un test de l’étalement de ces observations au moyen de la
statistique X 22, n-2 en
déterminant ensuite la
probabilité
associée au testglobal,
parexemple,
aumoyen du test de Fisher
(cf. [2] p.99).
En d’autres termes, sial
est laproba-
bilité pour
laquelle
la valeur dela statistique X i n-2
estsignificative
etot2,
la pro- babilitécorrespondante
pourxi n-2’
laprobabilité
associée au testglobal
se dé-termine au moyen de la
statistique (en logarithmes népériens) :
qui possède
unerépartition
deX 2
àquatre degrés
de libertélorsque
lesprobabi-
lités
al
et cl sontindépendantes.
Une version
simplifiée
de ce testpeut
s’obtenir en combinant de la manièreindiquée
les testsen b1
etb2
de K. Pearson.Rappelons
à cesujet
que l’on a :avec
où je = 2
xi/n
et où Xi’ i =1, 2,
n sont les nobservations,
etque les
pro-L’emploi
d’une formesimplifiée
du testsignifie qu’on néglige apparemment
lapart
de l’information contenue dans les moments centrésempiriques
d’ordresupérieur
à 4.Toutefois,
en raison de la corrélationqui
lie le momentempirique
d’ordre 3 aux moments
empiriques
d’ordreimpair supérieur
à 3 et cellequi
lie lemoment
empirique
d’ordre 4 aux momentsempiriques
d’ordrepair supérieur
à4,
ce n’estqu’une
fraction de cettepart qui,
enréalité,
se trouvenégligée.
4. LES TESTS DE NORMALITE BASES SUR LES
STATISTIQUES
D’ORDRE.Si l’on considère les
statistiques
d’ordre déduites de la série ordonnée desobservations,
le test de normalité revient à vérifier au moyen de lastatistique
2.(1),
convenablementdéfinie,
lacompatibilité
de cesstatistiques
d’ordre avec leursespérances mathématiques.
Si xm, m =
1, 2,
..., ndésigne
cette fois cesstatistiques
d’ordre et si jnet a sont la moyenne et
l’écart-type
de la loi normaleconsidérée,
les variables um =(xm - J.l)/a
seront lesstatistiques
d’ordre de la loi normale réduite. Si deplus, üm
sont desespérances mathématiques
de ces variables et siIlvmm,1I désigne
la matrice des covariances de ces
statistiques,
lastatistique
2.( 1 )
devient alors :où IlvJ;:J,fI désigne
la matrice inverse de lamatrice Ilvmm,1I
et pourlaquelle
iciaussi les
grandes
valeurs serontsignificatives
d’un désaccord entre la série d’ob- servations etl’hypothèse
nulle. Parailleurs,
il va de soi que leremplacement
dejn et de a par des estimations de la moyenne et de
l’écart-type
aura des con-séquences analogues
à celles de la mêmeopération
sur lastatistique
2.(1).
Dans la
pratique,
un tel test de normalité ne semble pas avoir étédéveloppé jusqu’à présent,
sans doute en raison du fait que lamatrice 1 Iv,,, , , 11
n’est connueque pour les faibles valeurs de n et surtout par suite de la
complexité
des calculsqu’entraîne
l’inversion de cette matrice.Par contre,
plusieurs
tests de normalitépeuvent
être considérés comme uneforme
simplifiée
du testprécédent puisque
lesstatistiques correspondantes
sontde la forme :
c’est-à-dire,
lerapport
àl’écart-type empirique s d’une
fonction linéaire des sta-tistiques
d’ordre.Pour cette dernière
statistique,
on noteraqu’en
raison de lasymétrie
dela loi
normale,
elle doitpouvoir
se mettre sous la forme :d’où il résulte
qu’elle
sera sensible à la fois dans le cas d’alternatives sanssymétrie
ou danslesquelles
l’étalement n’est pas conforme à celui de la loi nor-male. Une telle
statistique
doitdonc,
enprincipe
et dans une certaine mesure,pouvoir remplir
un rôleanalogue
à celui de lastatistique
3.(1).
Pour le choix des valeurs les meilleures à attribuer aux constantes am,on re- tiendra que
lorsque
celles-ci sontfixées, l’espérance mathématique
du numéra-teur de la
statistique (3)
est, à un facteur bien déterminéprès, égal
à la vraie va-leur de
l’écart-type
a. En outre, il est évident que le meilleur choix sera celuiqui
rend var X minimal. Il s’ensuitqu’on
s’enrapprochera
enplaçant
au numé-rateur de la
statistique (3)
l’estimateur linéaire de a à moindre variance.Si l’on fait
alors s’ = 1 (xm - x)2 ln,
avec x = L xmln,
W =X2
devientla
statistique
du test deShapiro
et Wilk[6]
dont lespetites
valeurs sont si-gnificatives
d’unerépartition
non normale etqui grâce
aux tables de fractiles existantes peut être utilisée pour des échantillons d’effectifsn = 3 (1)
50.Pour n >
50,
le test a étéadapté
parD’Agostino [7] en
utilisant au numéra- teur de lastatistique (3)
l’estimateur linéaire de Downton[8],
cequi,
à un fac-teur
près,
revient à poser :La
statistique
a, enoutre,
été transformée de manière à avoir une moyenne nulle et une variance unité. Ceprolongement
estparticulièrement opportun puis-
que l’estimateur linéaire de Downton est
asymptotiquement
un estimateur liné- aire de a à moindre variance.A ces deux
statistiques,
il convientd’ajouter
lastatistique
W’ deShapiro
etFrancia
[9]
construite avec un estimateur linéaire de a dérivé àpartir
d’unprin- cipe
de moindres carrésapproché
etqui
semble avoir despropriétés analogues.
Par contre, la
statistique
du test deGeary
et celle du test de David[3] se
déduisent de la
statistique (3)
à l’aide de nouvellessimplifications.
En faisant a’m =
1/n,
m =1, 2,
..., lastatistique (3) devient,
pour npair, lasstatistique
du test deGeary,
tandis que pour nimpair,
lastatistique
de ce testprend,
avec am =1 In,
la forme :où mo
=(n-1)/2
+ 1.Enfin, avec a1 = 1, am=0, m=2, 3,... et s2 = 03A3(xm -x)2/(n-1); la sta-
tistique (3)
se confond avec celle du test de David soit :5. TESTS DE NORMALITE APPARENTES AU TEST DE KOLMOGOROV.
Si l’on considère les valeurs
prises
par la fonction derépartition
F(x)
pour les diversesstatistiques d’ordre,
on obtient un nouveau groupe de n variablesFm = F(xm)
pourlesquelles
on a :et
Il s’ensuit que si
F(x)
est donnée et si on pose :pour vérifier
l’adéquation
de la fonctionF (x)
à la séried’observations,
on consi-dèrera la
statistique :
où ~v(-1)mm,~ désigne
la matrice inverse de lamatrice et
dont lesgrandes
valeurs seront à nouveau
significatives
d’une discordance entre la fonction derépartition
F(x)
et la série d’observations.Si,
deplus,
onadopte
pour F(x)
la fonction derépartition
F(x)
obtenue enajustant
une loi normale à la séried’observations,
on obtiendra lastatistique :
dont la
répartition
subira parrapport
à celle de lastatistique (4)
une modifi- cationanalogue
à celle de la réduction à(n-2) degrés
de liberté dans le cas d°une variableX2 .
Comme sous
l’hypothèse
nulle la valeurprise
par lastatistique (4)
Dermet d’associer uneprobabilité
à l’ensemble de variablesdm - Fm - m/(n
+1),tout
comme la
statistique (5)
le fait pour l’ensemble de n variablestout
procédé qui
consiste à choisir une ou deuxparmi
ces n variables pour en faire lastatistique
d’un nouveau testpeut
être considéré comme une forme sim-plifiée
du testoptimal.
Dans cette
optique,
le test deKolmogorov (cf. [ 10]
p.68)
basé sur la sta-tistique ).
constitue une forme
simplifiée
du testoptimal
basé sur lastatistique (4).
De
même,
les tests de normalité de Lilli eforsr11] ] et
deKuiper [12] pour lesquelles
lesstatistiques
sontrespectivement :
et
appellent
la même remarque relativement à lastatistique (5).
Il convient de noter que ces tests
présentent
en outre le défaut deréunir,
pour faire le
choix,
dans un même échantillon des variables dont les variances sontinégales,
cequi
entraîne un biais dans les conclusions de ces tests.Quoiqu’il
ensoit,
on voit immédiatementqu’on
se trouve enprésence
destatistiques simplifiées
à undegré
semblable à celui de lastatistique
4.(6)
de David.6. DU CHOIX D’UN TEST DE NORMALITE.
En
résumé,
il est apparu que toutes lesstatistiques
des tests de normalité considérés sont, à desdegrés divers,
des formessimplifiées
de lastatistique
op- timale de leurcatégorie.
Aucune nepeut
donc être considérée comme défini- tivement la meilleure et onpeut
concevoir que certainsprogrès pourraient
encore être
accomplis
dans ce domaine.Il s’ensuit que, pour
l’instant,
lors de l’examen de la normalité de larépar-
d’une séried’observations,
le choix doit seporter
sur lesstatistiques
dont laforme est la
plus proche
de lastatistique optimale.
A cetitre,
il convient deretenir le test basé sur la combinaison des deux
statistiques
de K.Pearson ainsi que ceuxqui
utilisent lesstatistiques
deShapiro-Wilk-D’Agostino-Francia.
Une telle conclusion se trouve d’ailleurs confirmée
parles
résultats des ex-périences
Monte Carlo effectuées parShapiro,
Wilk etChen[13]pour
mettreenévidence la
puissance
des divers tests àl’égard
d’un ensemble d’alternatives.Pour
l’illustrer,
nous avonsappliqué chaque
test à une série de 45 obser- vations de latempérature
de l’air à Bruxelles-Uccle enjanvier
à l’altitude de 220mb,
apparemmentréparties
suivant une loi doublementexponentielle
(1ère asymptote
deFisher-Tippett).
Les niveaux a pourlesquels
les valeurs ob- tenues par cesstatistiques
sontsignificatives
ont été les suivants :Il clair dans le d’alternatives
particulières,
il arriver que les(cf. [14]
p.28).
Mais ceci ne saurait être un argument pour le casgénéral puisque
si l’alternative estprécisée,
il existe unestatistique optimale
bien dé-terminée fournie par la méthode de
Neyman-Pearson,
pourséparer l’hypothèse
nulle de
l’hypothèse
alternative.En
conclusion,
la démarchequi
dans lapratique paraît
laplus
raisonnable consiste dansl’emploi
du testconjoint
sur les deuxstatistiques
de K. Pearson etdu test sur les
statistiques
deShapiro-Wilk-D’Agostino qui
sont lesplus sévères,
et, en cas derejet,
dans un choix del’hypothèse
alternatives’appuyant
sur lesvaleurs données par les
statistiques
de K. Pearson.BIBLIOGRAPHIE
[1]
MORICE E. 2014 Tests de normalité d’une distributionobservée,
Revue deStatistiques Appliquée, 1972,
vol.XX, n°2. p.5-35.
[2]
FISHER R.A. 2014 Statistical Methods for ResearchWorkers,
Oliver andBoyd, London, 1958,
13th Ed.[3]
PEARSON E.S. and HARTLEY H.O. 2014 Biometrika Tables forStatisticians,
Vol.1, Cambridge University
Press. 1966.[4]
D’AGOSTINO R.B. 2014 Transformation tonormality
of the null distributionof g1, Biometrika, 1970, 57,
p. 679-681.[5]
D’AGOSTINO R.B. and TIETJEN G.L. 2014 Simulationprobability points
ofb2
for smallsamples, Biometrika, 1971, 58,
p. 669-672.[6]
SHAPIRO S.S. and WILK M.B. 2014 Ananalysis
of variance test fornormality (complete samples), Biometrika, 1965, 52,
p. 591-611.[7]
D’AGOSTINO R.B. 2014 An omnibus test fornormality
for moderate andlarge
sizesamples, Biometrika, 1971, 58, p.341-348.
[8]
DOWNTON F. 2014 Linear estimateswith polynomial coefficients, Biometrika, 1966, 58, p.129-141.
[9]
SHAPIRO S.S. and FRANCIA R. S. 2014 Anapproximate analysis
of variance test fornormality,
Journ. Am. Stat.Assoc., 1972, 67, 337, p.215-216.
[10]
VAN DER WAERDEN B.L.Statistique Mathématique, 1967, Dunod,
Paris.[11]
LILLIEFORS H.W. 2014 On theKolmogorov-Smirnovtest
fornormality
with mean and variance
unknown,
Journ. A m. Stat.Ass., 196 7,
p. 393-402.[12]
LOUTER S.A. and KOERTS J. 2014 On theKuiper
test fornormality
withmean and variance
unknown,
Stat. Neerl.1970,
p. 83-87.[13]
SHAPIROS.S.,
WILK M.B. and CHEN H.J. 2014 Acomparative study
ofvarious test for
normality,
Journ. Am. Stat.Ass., 1968, 63,
p, 1343- 1372.[14]
KENDALL M.G. and STUART A. The AdvancedTheory
ofStatistics,
Vol.