R EVUE DE STATISTIQUE APPLIQUÉE
E. M ORICE
Tests de normalité d’une distribution observée
Revue de statistique appliquée, tome 20, n
o2 (1972), p. 5-35
<http://www.numdam.org/item?id=RSA_1972__20_2_5_0>
© Société française de statistique, 1972, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
TESTS DE NORMALITÉ D’UNE DISTRIBUTION OBSERVÉE
E. MORICE
L’auteur passe en revue, dans l’article
qui
suit, lesprincipaux
tests denormalité
qui
sontproposés
dans la littératurestatistique,
en essayant de rendre clair leur moded’emploi,
d’unepart,
et cequ’on
sait(peu
de chose envérité)
deleurs
propriétés
en termes depuissance.
Peut-onfaire plus,
et donner des recommandations àl’usager, quant
au choix du testqu’il
aura intérêt àemployer,
dans telle situation
pratique ?
Il ne nous semble pas que ce soit aisé.
Reprenons
ici l’essentiel desleçons qu’apporte
en ce domaine lapratique
de lastatistique.
Lorsqu’on
aaffaire
à de trèsgrands échantillons,
on arriverapratiquement toujours
à mettre en évidence une discordance avec la loi normale - et celaquel
que soit le test utilisé. D’un autre
côté, lorsqu’on
aaffaire
à des échantillons assezfaibles,
l’accord avec la loi normaleparaîtra
presquetoujours
admissible. C’est dans le domaineintermédiaire, quant
àl’effectif
des échantillons -disons,
leplus
souvent, entre une à deux dizaines et une à deux centaines d’observations -
qu’on peut
rechercherquelque
assurance dans une méthode de testapportant
desgaranties
raisonnables à l’encontre des deuxespèces classiques
d’erreurs. On sait combien il est aisé de contrôler l’erreur depremière espèce,
on sait aussiqu’il
enva tout
différemment
pour l’erreur de secondeespèce, qui
n’est même pasdéfinie
tant
qu’on
n’a pasprécisé
unehypothèse
alternative.D’ailleurs,
dans lapratique
courante, les raisonsqui font
choisir tel test sont très terre à terre, et tiennent souvent à laprésentation
desdonnées,
à lacommodité,
ou aux calculsdéjà effectués
parailleurs,
etqu’on peut
utiliser à boncompte.
De telles motivations en valent bien d’autres - pourvuqu’on
prennegarde toutefois
à ne pas utiliser untest 1
de Pearson si les seules alternatives raisonnables sont des distributionssymétriques,
ou un test utilisant l’étenduelorsque
lesperturbations
que l’onpeut craindre,
parrapport
à la loinormale, affectent
depréférence
les valeurs centrales des observations !Cela
dit,
onpeut s’inspirer
du peu que l’on sait sur lapuissance
des testscourants, et c’est à cette
fin
que nousprésentons
le contenu de cet article. On peut aussi consolerl’usager
en luirappelant qu’il
esttoujours possible,
enthéorie,
d’établir "sur mesure" le test
optimal
à l’encontre de tellehypothèse
alternativecomplètement spécifiée.
Le lemme deNeyman
et Pearson nousapprend,
d’unemanière
incontestable,
àfaire
cette étude. On ne sera pastoujours
conduit à des calculssimples,
mais les ordinateurs sont là. Mais surtout, en contrepartie,
unealternative bien
précise peut
rarement traduire correctement ce que sait et ce que craint lepraticien,
et pour cette raison une telle étude ne pourra que trèsexceptionnellement
êtreenvisagée
par le statisticien.Les tests
classiques
decomparaison
de moyennes ou de variances àune valeur
spécifiée
ou decomparaison
deplusieurs
moyennes ou variancesimpliquent généralement l’hypothèse préalable
d’échantillons tirés de popu- lations normales.Si,
dans certains cas, parexemple
étude de moyennes d’échantillons d’effectifs non trèspetits,
onpeut
ne pas tenir compte de cet- tehypothèse,
on sera souvent amené enprésence
d’unepopulation
inconnueà se demander si
l’hypothèse
de normalitépeut
être considérée comme va-lable,
d’où l’utilité de tests de normalité ouplutôt,
comme le disaitK. Pearson, de "tests de non
normalité", permettant
éventuellement d’êtreen mesure de
juger
que lapopulation
échantillonnée estprobablement
unepopulation
normalement distribuée.De nombreux tests ont été
proposés, pouvant
serépartir
en deux ca-tégories.
I - TESTS BASES SUR LA COMPARAISON DE LA DISTRIBUTION OBSERVEE A UNE DISTRIBUTION
NORMALE M(m, c)
DONTLES PARAMETRES ONT ETE ESTIMES A PARTIR DES OB- SERVATIONS GENERALEMENT PAR LA METHODE DES MO- MENTS :
1 - Test
d’adéquation
deX2
Son utilisation suppose
pratiquement
que l’ondispose
d’un échantillon suffisammentimportant
pour que l’onpuisse répartir
les n observations par classes.Si
Xi
est le centrede
la classe(xi-, Xi)’ Xi = 1 (xi_ 1 + xi)
etni
l’effectif de cetteclasse, L
n1 = n, k étant le nombre desclasses,
les1=1
paramètres
de la loi normaleajustée
seront estimés parLe
groupement
de toutes les observations d’une classe sur sa valeur centrale entraine une erreursystématique qui
pourra êtreapproximative-
ment
corrigée
par la correction deSheppard, qui
donnerait :correction
négligeable
dans le cas de classeségales
de faibleamplitude
a(pratiquement
dès que le nombre des classesdépasse 10).
L’effectif
théorique nl
de la classe(xi_ 1, xi) peut
alors être calculéà
partir
de la fonction derépartition F(u) = J 1 e -t2/2 dt :
On calcule ensuite
distribué
approximativement
comme la variableX2
avec V = k - 3degrés
de liberté pour k classes utilisées
dans
lacomparaison.
Le test conduit au
rejet
del’hypothèse
de normalité aurisque
a si la valeur trouvée estsupérieure
à la valeurX2_ donnée
par la table deX2
cx-Pr
[X2 > ~21-03B1].
On admet
généralement
que ce test est utilisable à conditionqu’aucun
effectif
théorique
n’ ne soit trèspetit (au
moins 4 ou 5unités) (1),
cequi peut exiger
pour sonemploi
de réunir certaines classes aux extrémités de ladistribution,
diminuant alors le nombre dedegrés
deliberté ;
son résul-tat
peut dépendre
du choix des limites declasses,
laissé à l’arbitraire de l’utilisateur.2 - Test de
Geary [8] ] [9]
Il est basé sur la distribution
théorique
durapport a
de l’écart moyen àl’écart-type, rapport
dont la valeurthéorique
dans le cas d’une loi nor-male est
Cl:) 2 1/2 = 0,7979.
La loi de distribution de la variable
a été étudiée par
Geary qui
a calculé certains fractiles de cette loi. Le test conduira aurejet
del’hypothèse
de normalité aurisque
a si la valeur cal- culée de a est extérieure à l’intervalle acr/2 a1-cr/2 donné par les tables.---
(1) Cochran [4], estime que cette condition est trop sévère, particulièrement dans le
cas d’une distribution unimodale et donne comme condition : n’
soit
au moins de 1ou 2 unités.
On trouvera en annexe un extrait de ces tables. Pour
l’emploi
de cetest on notera que le calcul de l’écart moyen
n’exige
pas le calcul individuel de toutes les valeursIXi - î 1.
Plus
simplement, après
avoir classé les observations individuelles parrapport
à la moyenne on a :avec :
Xj,
observations inférieures àx,
en nombrenj
xk, observationsupérieure
àX,
en nombre nkLe test de
Geary
est surtout sensible au caractèretrop
ou insuffisam- mentaplati
de la distribution.3 - Test de K. Pearson
[17] ]
Il est basé sur la
comparaison
des valeurs calculées àpartir
de l’échan-tillon,
desrapports
à leurs valeurs
théoriques
dans le cas d’une loi normale soit :Des tables donnant
quelques
fractiles de cesdistributions, respective-
ment pour n > 25 et n > 50, ont été
publiées
dans Biometrika Tables[17] ,
ainsi que des
abaques
dans la revue Biometrika(1936
p.304-7).
Le test conduira au
rejet
del’hypothèse
de normalité aurisque
a, si|03B21| > 03B21.
(1-a/2) ou si03B22
est extérieur à l’intervalle(03B22, (03B1/2), 03B22, (1-0/2))’
On trouvera en annexe un extrait de ces tables.
Le test de K. Pearson est sensible à la fois au manque de
symétrie
caractérisé
par 03B2
1 et audegré d’aplatissement
caractérisé par03B22.
Parcontre, en raison des moments d’ordre élevé
qui
interviennent dans les cal-culs,
sa conclusionrisque
d’être faussée par laprésence
d’observations aberrantes(anormalement grandes
oupetites).
Ceproblème
des observations aberrantes devra être examiné avant le calculde 03B21
et03B22 ;
Exemple
Un échantillon de n = 200 a donné :
03B21
= - 0,5103B22
=2,83
Au
risque
a = 2%,
les fractilescorrespondants
sont :pour P 1
: -0, 403
+ 0, 403pour 03B22 : 2,37 3,98
Le test
global
conduit à conclure que la distribution n’est pas nor- male en raison de sonasymétrie significative (avec
une queue de distribu- tionplus
étalée vers lespetites valeurs)
bienqu’elle
ne soit passignifica-
tivement
plus aplatie qu’une
distribution normale.4 - Test de David -
Hartley -
Pearson[6]
Il est basé sur le
rapport
de l’étendue à l’estimation del’écart-type
de l’échantillon
Des tables des fractiles de la distribution de u ont été calculées pour n = 3.... 20..
30...100...1000,
pour les valeurs a ou 1 -03B1 = 0,005 - 0,01 - 0,025 - 0,005 - 0,10. (voir
tableV)
Le test conduit au
rejet
del’hypothèse
de normalité aurisque
a si la valeur calculée de u est extérieure à l’intervalle u03B1/2, u1..012 donné par les tables.5 - Test de
Shapiro -
Wilk[19] [20]
Il est basé sur l’étude du
rapport
du carré d’une certaine combinai-son linéaire des étendues
incomplètes (c’est-à-dire
des différences des ob- servations ordonnées : xn - x1, xn-1 - X2 ... ,Xn-j + 1 - xj, J
’
n/2)
à lasomme des carrés des écarts à la moyenne des n observations.
La
statistique
utilisée est :avec :
Les coefficients
aj
étant donnés en fonction de n par unetable,
on dis- pose d’autrepart
d’une autre tabledonnant,
en fonction de n,quelques
frac-tiles usuels de la distribution de W.
On trouvera en annexe un extrait de ces tables.
De même que dans le test de
Geary,
ils’agit
encore durapport
descarrés de deux
quantités
associées toutes deux à l’estimation de ladisper-
sion
(le
numérateurdépendant
d’une fonction linéaire des étenduestronquées) .
Le test conduira à
rejeter l’hypothèse
de normalité aurisque
a si lavaleur calculée de W est extérieure à l’intervalle
(W03B1/2, W1-al2).
6 - Test de R.
d’Agostino [1]
Tenant
compte,
luiaussi,
d’une certaine fonction des observations or-données x1n, .... xin, .... , xnn, le test
d’Agostino peut
être considéré comme unprolongement
du test deShapiro-Wilk,
dont la table est limitée à n = 50 .Il est basé sur les
statistiques
Une table donne
quelques
fractilesusuels, (aoul-a=0,5-l- 2, 5 -
5 - 10% =
de la distribution de Y pour n =50 (1)
....100 (50)
...1000.
II - METHODES BASEES SUR LA COMPARAISON DE LA DISTRIBUTION CU- MULATIVE OBSERVEE A LA FONCTION DE REPARTITION D’UNE LOI NORMALE AJUSTEE AUX OBSERVATIONS
11.1 - Estimation des
fréquences
cumuléesCes méthodes
impliquent
le calcul ou l’estimation de lafréquence
cu-mulée des observations
jusqu’à
X = xi pour les valeurs observées ou, éven-tuellement,
pourquelques
unes d’entre elles(limites
declasses).
S’il
s’agit
d’un échantillonimportant permettant
larépartition
des ob-servations en un nombre suffisant de classes
(au
moins 10 à 15classes),
lafréquence
des observations inférieures à X = xi estSn(xi) - ni/n
avec- ni nombre des observations inférieures ou
égales
à X = xi,- n effectif de l’échantillon.
Mais dans le cas d’observations individuelles ordonnées X1 X2 ... xn
en
trop petit
nombre pourpermettre
unerépartition
parclasses,
on seraobligé
d’estimerSn (xi),
car pour X = xi la valeur ni, effectif cumuléjus- qu’à
et ycompris X = xi
est une variablealéatoire,
variable d’un échantillon à unautre,
pour une mêmepopulation.
Il en est de même deSn (xi ) , qu’il
est nécessaire d’estimer
statistiquement
en fonction de l’information donnée par l’échantillon.On est donc confronté au
problème
de l’estimation d’une valeur cen-trale d’une variable aléatoire
Sn (xi) compte
tenu de sa loi de distributionqui
est connue(on
montrequ’elle
nedépend
que de i et den).
De même la fonction de
répartition F(x),
loi normaleajustée
aux ob-servations,
devra être déterminée àpartir
decelle-ci,
sesparamètres
met a étant estimés par :
En ce
qui
concerne l’estimation deSn (x),
diverses solutions ont étéproposées :
a) S. * (xi) - 1/n
Cette
estimation, particulièrement simple,
ne tient pascompte
du ca- ractère continu de la variable aléatoire X.b) Sn (xi) = i - 0,5 n
Cette solution
proposée
par Chernoff[3]
en 1954 consiste à considérer que la courbe cumulativeempirique
estjalonnée
par les milieux des seg- ments verticaux dugraphique
en escaliercorrespondant
aux observations.c) Sn* (xi) = i n + 1
Cette valeur est
l’espérance mathématique
de la variable aléatoireSn (xi), dont
la loi de densité est une loi Beta deparamètres
i et n - i +1 , [2].
Fo, 0 étant
la valeur médiane de la variable F de Fisher-Snedecor avecles
degrés
de libertév
1 et v2.Cette valeur
Sn (xi)
est la valeur médiane de la variable aléatoireSn (xi),
valeur
qui
a uneégale probabilité
de ne pas être atteinte ou d’êtredépassée .
Elle a été
proposée
par Johnson[12]
*sous le nom de "median rank". Ses valeurs ont ététabulées,
on trouvera en annexe un extrait de cettetable ,
que l’on
pourrait prolonger
à l’aide de la formule ci-dessus et d’une table des valeurs deFoo 50 (Vl, v2) (Tables
de Hald[11]).
e) Sen (xi)
= F(03BEi)
Dans cette
formule,
Fdésigne
la fonction derépartition
de la variablenormale réduite u
et 03BEi = E(ui),
uétant
la ième observation ordonnée d’un échantillon aléatoire de n variables normales réduites.Cette solution a été
proposée
par E. Pearson. Une table des valeurs de03BEin
est donnée dans Biometrika Tables[17].
On en trouvera un extraiten annexe.
Les
quatre
dernièressolutions, identiques
pouri = n + 1 2 (n impair ,
restent très voisines pour des valeurs de i situées dans la
région
centralede l’intervalle
(i, n),
mais elles diffèrentsystématiquement
aux extrémités .Comparaison
des estimations deSn (xi)
1/
n = 92/ n = 49
Bien que les trois dernières estimations soient définies
théoriquement
de manière
précise,
aucun critère nepermet
de dire quesystématiquement
et
généralement
l’une d’entre elles estsupérieure
aux autres.Chacune
présente
pour l’utilisateur desavantages
et des inconvénients(voir § II. 2).
La formule donnant la valeur médiane
(d), permet
en yremplaçant 0, 50
para/2
et 1 -a/2
de définir un intervalle de confiance à 1 - a pour la variable aléatoireSn (xin)
àpartir
des tables de la distribution de la variable F.Pour une valeur donnée de a et pour un effectif donné n,
l’amplitude
des intervalles de confiance est maximale pour i voisin de
n/2 (pour i = n; 1
si n est
impair) ;
pour ifixé,
elle décroitlorsque
naugmente.
S0, 05 S0, 95
So, 95 - S0, 05
Ces marges donnent une idée de l’incertitude de
l’interprétation
gra-phique,
à l’aide d’une droite(voir ci-après),
d’un ensemble depoints [xi , Sn (xin)]
fournis par unpetit
échantillon.II. 2 -
Comparaison
de la distribution cumulativeSon (x)
à la distribution nor-male
ajustée
aux observations1/
Test deKolmogorov -
Lilliefors[14]
Ce test résulte d’une
adapatation
des testsclassiques de Kolmogorov
Smirnov
(comparaison
de deux distributions cumulatives observées et com-paraison
d’une distribution cumulative à une distribution normale donnée àpriori).
La
statistique
utilisée estD =
max 1 F * (x) - Son (x) |
valeur maximale des écarts entre la fonction de
répartition F* n (x)
de la loinormale
ajustée
aux observations avec 03C32 estimé par s2= (xi - x)2 n - 1
etm estimé par
x = 2- et
la distribution cumulative définie parS. (xi)
=i/n(l).
nL’étude de la loi de la variable D ne
pouvant
être faite par voie ana-lytique,
a été réalisée par la méthode de Monte-Carlo : pourchaque
valeurde n, 1000 échantillons issus de
populations
normales ont été tiréspermet-
tant l’estimation des fractiles de la distribution de D pour n =
4,
..., 30 et au-delà.On trouvera en annexe un extrait de la table donnée par Lilliefors.
L’hypothèse
de normalité estrejetée
aurisque
a choisi derejeter
unehypothèse vraie,
si la valeur trouvée de D estsupérieure
à la valeur don- née par la table en fonction de n et a.Les valeurs
critiques
du test de Lillieforssont,
pour a =0, 05,
environ1, 55
foisplus petites
que les valeurs du test deKolmogorov-Smirnov
relatifà la
comparaison
d’une distribution observée et d’une loi normale donnée apriori.
2 /
Test deKuiper,
Louter et Koerts[15]
Avec les mêmes définitions de
S*n (x)
et deF* (x),
lastatistique
utili- sée parKuiper
est :V = max,
ES: (x) - F* (x)] - min, CS: (x) -
F*(x)]
elle tient
compte séparément,
aussi bien des différencespositives
que des différencesnégatives,
le dernier terme de V étant engénéral négatif.
La table des fractiles de la distribution de V a aussi été déterminée par la méthode de Monte-Carlo à l’aide de 10000 échantillons pour
chaque système
de valeurs de n et a :Pour un même
couple
de valeurs de n et a, lerapport
des fractilesV/D
reste voisin de1, 6.
11.3 - Méthodes
graphiques
Toutes ces méthodes sont des
adaptations
de la méthodegraphique
deHenry : possibilité d’ajustement graphique
d’une droite à un ensemble de npoints
définis par leurs abscisses(valeurs observées)
et leurs ordonnées(es-
---
(1) Pour un petit nombre d’observations, la distribution cumulative définit un diagram-
me en escalier, et on a :
Sn (x) -
0 pour x x1,S*n(x) = i n pour
xi x Xi+ln
1 pour x > xi.timations des valeurs
correspondantes
de la fonction derépartition (ou
de la variable normale réduiteordonnée) qui correspond
aux observationsxi)(1).
Ces méthodes ne diffèrent que par le
choix, qui
restearbitraire,
del’estimation de l’ordonnée
Sn (x),
et aussi par le choix dupapier
utilisé pour construire legraphique.
- Si l’on utilise les estimations
(b), (c)
ou(d)
il sera souvent commo-de d’utiliser du
papier ayant
une échelle deprobabilité
normale. Dans ce cas lesestimations i - n 0,5
eti n + 1
de calculfacile, permettront
deplacer
immédiatement lespoints [ xi , S*n (xi)],
à l’aide de l’échelle fonctionnelle enSn (x).
Par contre, l’utilisation de la valeur médiane nécessitera de recourir
préalablement
à la table de Johnson.Par ailleurs
l’emploi
dupapier
à échelle deprobabilité normale, oblige
à utiliser l’échelle fonctionnelle
graphique
choisie par l’éditeur etqui peut paraitre
ne pas convenir au dessinateur. Onpeut
alors utiliser dupapier
millimétréordinaire, permettant
de choisir à saguise
les deux échellesmétriques
enremplaçant
l’échelle deprobabilité
normale par une échellemétrique
en u, en faisantcorrespondre
àchaque
valeurSon (xi)
la valeur uidéfinie par une table de la loi
normale,
c’est-à-dire par- Si l’on utilise la variable normale ordonnée
03BEi,
cequi implique
l’usa-ge d’une table
spéciale,
legraphique
despoints (xi, 03BEi),
se ferasimplement
sur
papier millimétré,
mais si l’on est intéressé ultérieurement par l’esti- mation des valeurs de la fonction derépartition ajustée graphiquement,
ilfaudra,
pourchaque
valeur de03BE,
calculerqui peut
être lue directement sur legraphique
à échelle deprobabilité
nor-male.
Avec cette variable normale
ordonnée,
onpeut
évidemment aussi uti- liser lepapier
à échelle deprobabilité
normale si onprend
comme ordonnéeSon (xi) =
F(03BEi)
déduite de la table de la loi normale.En
fait, compte
tenu du caractèrequelque
peusubjectif
du tracé d’une droited’estimation, lorsqu’il parait possible,
ce choix entre les diverses---
(1) Toutes les remarques ci-après sont évidemment valables dans d’autres cas d’ana-
morphose linéaire : distributions lognormales de Weibull, Gumbel, Frechet pour
lesquelles des échelles fonctionnelles permettent aussi de représenter la fonction
de répartition par une droite.
(2) Pour divers couples (i, n), 1 i, n 40, une table calculée par M. Dumas [8],
donne les valeurs,
exprimées
en mm, de 50V2 Ui, permettant
l’usage de blocsde papier millimétré de format courant.
estimations des
fréquences
cumulées n’a que peud’importance,
lespoints représentatifs correspondant
à une même valeur dex étant
trèsrapprochés ,
sauf aux extrémités
(pour
i voisin de 1 ou den).
Cependant
onpeut
noter que, d’une manièregénérale,
on a :et
d’où il
peut résulter,
pour le dessinateur delégères
différences dansl’ap- préciation
de lapente
de la droiteajustée, pente qui
caractérise l’estima- tionapproximative
del’écart-type
de la distribution.A titre
d’exemple
pour n = 20 les estimations ci-dessusenvisagées
sontLa droite
d’ajustement ayant
pu être éventuellementtracée,
on en dé-duira,
conformément au schémaci-après (figure 1),
les estimations de met o. Ces estimations, et
particulièrement
celle de cr, n’ontévidemment,
dans la
plupart
des cas,qu’une
valeurapproximative.
Lorsqu’il n’y
a pas linéaritéapproximative
dugraphique,
son alluregénérale peut
donner une indicationquant
auxdivergences qui peuvent
existerpar
rapport
à une distribution normale : une concavité tournée vers le hautou vers le bas caractérise une distribution
dissymétrique
dont le sommet estdéplacé respectivement
vers lesgrandes
ou lespetites
valeurs. Ellepeut
être l’indice de la validité
possible
d’unajustement
par une distributionlog-
normale dont l’étude
graphique
pourra se faire de la même manière en uti- lisant unpapier
à échelle deprobabilité
normale en ordonnée et à échellelogarithmique
en abscisse. On pourra,éventuellement, envisager
d’autreschangements
de variables tels que y =log (x
+a),
y =x,
....Quel
que soit le mode d’estimation desfréquences
cumuléesSn (xî)
-et ceci n’a
pratiquement
que peud’importance-
lasimple
méthodegraphique , proposée
parHenry,
consiste à tracer une droite Aparaissant
compenser"au mieux" les différences d’ordonnées entre les n
points
ainsi déterminés[xi Sn (xi)]
et lespoints
de même abscisse de la droite A.Même si cette
compensation graphique parait
convenablementréalisée ,
il faut se demander si les écarts constatés sont
compatibles
avecl’hypothè-
se de normalité et
peuvent
êtreimputés
aux hasards del’échantillonnage.
Si l’on admet que la droite de
Henry représente rigoureusement
la loi deprobabilité
cherchée et siFi
est l’ordonnée dupoint
observation d’abscissexi
de ladroite,
onpeut,
si n est suffisammentgrand, approximativement
Figure 1
considérer que sur n
observations,
on en a trouvé iqui
sont inférieures à xi.Dans ces conditions
l’écarti n - Fi
suitapproximativement
une loi nor-male de moyenne nulle et
d’écart-type
o =[Fi (1 - Fi)/n]1/2,
ceci au moinsdans la
région
où nFi(1 - Fi)
est suffisammentgrand
pour quel’appro-
ximation normale d’une loi binomiale soit valable
(par exemple supérieur
à
10).
On
pourrait
alors associer àchaque
abscissexi
un intervalleFi
±u1-03B1203C3 définissant,
pour l’ensemble despoints observés,
unerégion d’acceptation
de
l’hypothèse
de normalité aurisque
a derejeter
unehypothèse
vraie(u =
variable normaleréduite).
M. Dumas
[8] a,
pour sa méthodegraphique, signalée ci-dessus,
cal- culé les limites de ces intervalles pour a =0, 50.
Haag [11]
avaitpréconisé
cette méthode dans le casparticulièrement
favorable de l’étude de la normalité de tirs
balistiques
d’artillerie de 60 coups tirés dans des conditions aussiidentiques
quepossible.
Il a d’ailleurs
signalé
les faiblesses de laméthode, particulièrement
lorsque
n estpetit,
en raison du caractèresubjectif
du tracé de la droiteD et de la non validité de
l’approximation
normale pour les observations ex-trêmes pour
lesquels
nF(1 - F)
estpetit.
Le test de
Lilliefors, plus objectif, implique
enprincipe
le calcul des valeursF* (xi)
de la distribution normaleajustée 9t (K, s2), après
l’esti-mation de x et
s2,
mais il est faciled’y
fairecorrespondre
une solutiongraphique
entraçant
la droite Adéfinie,
sur ungraphique
à échelle de pro- babilité normale par les deuxpoints (x,
50%)
et(x
+ s, 84,2%).
On notera d’ailleurs que si le
problème
de la normalité se pose c’esten
général
parce que l’on aenvisagé
d’utiliser cette normalité dans des pro- blèmes d’estimation et detest,
relatifs soit à des moyennes, soit à des va-riances,
problèmes qui impliqueront
le calcul de x et des2.
On
peut alors,
sur legraphique,
mesurer,compte
tenu de l’échellenormale,
lesécarts 1 F. (x) - Sn (x) entre
lespoints
observations et la droite A et comparer leplus grand
d’entre eux aux valeurscritiques
données par la table de Lilliefors pour lerisque
choisi.Figure n° 2 Test de
Kolmogorov-Lilliefors
Limites des régions d’acceptation au risque 10 %
de
l’hypothèse
de normalité (n = 10, 20 et 100) Fonction de répartition ajustée 0394 : A (m = X, a2 =S2)
On
peut
aussi délimiter une zoned’acceptation
del’hypothèse
de nor-malité,
aurisque choisi,
a, entraçant
les courbes définies àpartir
de ladroite A,
à l’aide des différencescritiques
données par la table. Il suffirapratiquement
de faire cette transformation pourcinq points répartis
sur lapartie
utile de la droite A(figure 2).
Pratiquement,
il semble bien que si l’on s’intéresse seulement à laréponse qualitative
à laquestion
"normalité ou non normalité" et si l’on veut éviter lepetit
calcul de x et s 2(!)
-au moins dans les cas où lesimple
tracé
graphique
de la droite A neparait
pas devoir donner lieu à des va-riantes très différentes suivant
l’appréciation
du dessinateur- l’onpuisse
uti-liser
pratiquement
les critères déduits de la table deLilliefors,
relativement à cette droite.III - EXEMPLES
Les diverses méthodes
envisagées
ci-dessus sontappliquées
à un mê-me
exemple :
étude de la normalité d’une distribution définie par un échan- tillon de 20 observations.(Cet
échantillon est constitué par 20 valeurs consé- cutivesprises
dans la table des variables normales aléatoires de la "RandCorporation",
pour unepopulation
normalet)t(m = 2, 0=1).
Ces 20 valeurs ordonnées sont :
0,790 - 0,843 - 1,286 - 1,331 - 1,383 - 1,411 -
1,757 - 1,874 - 1,985 -2,006 - 2,009 - 2,355 - 2,481 - 2,560 - 2,980 - 3,129 - 3,284 - 3,287 - 3,328 - 3,532.
Les différentes méthodes
envisagées
donnent les résultatsci-après : 1/
Test deGeary (Table
n°4)
5i =
2,181, 03A3 |xi - xl =
2x +29, 636 -
16,677 =14, 620
valeur intérieure à l’intervalle bilatéral
d’acceptation
aurisque 0, 05 (soit 0,71 - 0, 89).
2/
Test de David(Table
n"5)
valeur intérieure à l’intervalle bilatéral
d’acceptation
aurisque 0, 05 (soit
3,10 - 4,67).
3/
Test deShapiro-Wilk (Table
n°6)
valeur intérieure à l’intervalle bilatéral
d’acceptation
aurisque 0, 05 (soit 0,837 - 0,986).
4/
Test de Lilliefors(Table
n°7)
D =
Max x 1 F * (x) - S * (x) 1 = 0 ,111
Figure n° 3
Etude graphique de la normalité d’une distribution (échantillon tiré d’une population normale (m = 2, 6 -- 1)
valeur inférieure à la limite
supérieure
de l’intervalled’acceptation
au ris-que unilatéral
0,025 (soit 0,216).
5/
Test deKuiper-Louter (Table
n°7)
V =
Maxx [S*(x) - F*(x)] - Minx[S*(x) - F*(x)] = 0,111 - (- 0, 072
=0,183
valeur inférieure à la limitesupérieure
de l’intervalled’acceptation
au ris-que unilatéral
0, 025 (soit 0, 333).
6/
Etudegraphique
du test de LillieforsSur le
graphique
à échelle normale(figure 3),
on amarqué
les 19points (xi, i/20), (i =
1 ...19,
lepoint
i - 20 nepouvant
évidemmentpas être
représenté),
et on a tracé la droitecorrespondant
à la distri- bution normale définie àpartir
des observationspar x = 2,181,
s =0, 865 .
On a de
plus
tracé les courbes limitant les zonesd’acceptation
auxrisques
5%
relatifs à la valeur absolue des écartsF (x) -
S(x).
Fractions en %
Valeur calculée :
Figure 4 - Comparaison des statistiques calculées à leurs lois de probabilité La
figure
4 montre laposition
des valeursnumériques trouvées,
dansles divers
tests,
parrapport
à certains fractiles des distributions des statis-tiques utilisées ;
onconstate,
dans le casprésent,
que tous ces tests con- duisent à la même conclusionqualitative : acceptation
del’hypothèse
de nor-malité. Mais ces conclusions
correspondent
à desrisques
réels différentsqui dépendent
de laposition
des valeurs calculées surl’échantillon,
dansles lois de
probabilité
desstatistiques
utilisées.Ces
statistiques,
définies en fonction de certaines combinaisonsparti-
culières des observations ne sont pas sensibles de la même manière auxfluctuations aléatoires d’un échantillon tiré au hasard d’une
population
nor-male
(m, 03C32),
et ilpeut
fort bienarriver,
dans un casparticulier
que, pourun
risque
depremière espèce fixé,
l’utilisation de ces tests donne des ré- sultatslégèrement
contradictoires en apparence.CONCLUSION
Comment tester la normalité d’une distribution et
quelle
méthode con-vient-il d’utiliser est une
question
souventposée
par lepraticien
et,parti- culièrement,
parl’ingénieur responsable
des décisionsprises
en matière de contrôlestatistique,
et,fréquemment,
àpartir
d’échantillons d’effectif assezpetit.
Bien que les
techniques
d’étude despetits
échantillons aient été intro- duites dansl’analyse statistique depuis près
de 50 ans, leproblème
resteouvert et le restera
longtemps quelles
que soient les nouvelles méthodesproposées
et la facilité des calculsnumériques
résultant des moyens mo- dernes.D’ailleurs,
laréponse
au test de normalité n’estgénéralement
pas le but final del’opération :
on désire souvent savoir si l’onpeut
valablement utiliser les lois deLaplace-Gauss,
deStudent-Fisher,
deX2
ou de Fisher- Snedecor dans des tests ultérieurs d’estimation ou decomparaison
de moven- nes ou de variances.Si le nombre des observations utilisées est
grand,
le test de normalitépeut
conduire à conclure à un écartsignificatif
denon-normalité,
alors que ,cependant,
les loisprécédentes pourront
être utilisées sans erreurappré-
ciable dans l’étude des
paramètres
estimés surle(s) échantillon(s).
Si le nombre des observations est
petit,
ilpeut
arriverqu’aucun
testne soit
capable
de mettre en évidence defaçon significative
la non-norma-lité bien que dans un
pareil
casl’emploi
des distributionsenvisagées
ci-dessus soit sérieusement erroné.
Mais que
signifient
les mots"grand"
ou"petit" ?
Là encore aucuneréponse
formelle nepeut
être donnée : celadépend
de la nature del’hypo-
thèse alternative
qui peut
êtreenvisagée
et du butpoursuivi.
Dans certainscas
pratiques,
parexemple
en contrôlestatistique
desfabrications,
onpeut généralement
admettre que les lois dérivées de la loi normalepeuvent
être valablement utilisées si n > 10(tests
relatifs auxmoyennes)
ou n > 30(tests
relatifs auxvariances).
Cette dernière remarque montre aussi que dans certains cas il
peut
être
préférable
de tenircompte
de l’informationpréalable possédée
sur lapopulation
dontprovient
l’échantillonplutôt
que des résultats d’unsimple
test sur un
petit
échantillon.Enfin,
ilimporte
de noterqu’un
test de normalité est un test compo- site nonparamétrique,
aussi bien en cequi
concernel’hypothèse
à testerque
l’hypothèse
alternative -généralement
nonprécisée
mêmequalitative-
ment.
Il en résulte que la
puissance
d’un testparticulier
nepeut
être ni for-mulée,
ni calculée(sauf
par simulation dans le cas d’une alternativeparti-
culière bien
précisée)
etqu’évidemment
il nepeut
pas exister de test uni- formément leplus puissant
contre toutes leshypothèses
alternativespossi-
bles.
Théoriquement
onpeut
considérerqu’une
distribution normale est com-plètement
caractérisée par la nullité de ses moments d’ordreimpair
et parles relations liant ses moments d’ordre
pair
à la variance.Pratiquement
ceci conduit à faire
appel
aux autrespremiers
moments et à utiliser pa- rallèlement les deux tests de K. Pearson(03B21 : symétrie, et 03B22 : aplatisse-
ment).
Les valeurs calculées de
Pl et 03B22
sur un échantillon de n observationsrisquent,
en raison du calcul de moments d’ordreélevé,
d’être très sen-sibles à la
présence
d’observations trèséloignées
de la moyenne,particuliè-
rement pour de
petits
échantillons : il en résulte que les tables de la dis- tributionde
1 n’ont étépubliées jusqu’à
une date récente que pour n > 25 et cellesde2
pour n > 50.(1)
L’emploi
simultanéde Pl et 03B22 exige
donc des échantillonsimportants .
Il en est de même du test
X2
en raison de la nécessité de grouper les observations en classes. Sa sensibilitédépend
du nombre desclasses ,
lié à l’intervalle declasse,
arbitrairement choisi.L’étude
purement graphique
de la normalité n’est pas un test au sensstatistique
du mot, deplus
onpeut
luireprocher
son caractèresubjectif, Cependant
ce ne sont pas des raisons suffisantes pour enrejeter systéma- tiquement l’emploi :
enplus
de l’indicationqualitative,
certes peuprécise qu’elle fournit,
cette méthode est, même pour depetits échantillons,
unguide
utile pour décider si une certaine fonction de la variable x, par exem-ple log
x oux,
a une distributionplus
voisine de la normale que la va- riable x elle-même.Il semble
d’ailleurs,
comme il a été ditplus haut,
que sous réserve du calculpréalable
de x ets2,
onpuisse
associer aisément la méthode gra-phique
au test de Lilliefors de manière àpréciser
lerisque
depremière espèce (rejet
de la normalité alorsqu’elle
estvraie),
associé à la décision.Pour les
risques
depremière espèce
définies par a =0,01 - 0, 05 - 0, 10,
lespuissances
des tests de Lilliefors et deKuiper
ont étécomparées
par la méthode de simulation, par Louter
[15]
pour des échantillons d’effec- tif n =10,
20 et 30 et pourquelques
alternativesspécifiées (uniforme ,
~2(03BD
=3),
t de Student(v = 3), exponentielle,
F de Fisher-Snedecor(v1 =
3 ,v2 =
5)
etCauchy).
Pour ces
hypothèses alternatives,
en nombretrop
limité pour en tirer une conclusiongénérale,
on constate que lespuissances
des deux tests sonten
général
très voisines avec unléger avantage
pour le test deKuiper,
avan-tage qui
ne compense pasl’impossibilité
d’associer à ce dernier des limitesgraphiques
d’intervalles de confiance.Il convient de
plus
de remarquer que ces deux tests n’utilisent pas toute l’information fournie par les observationspuisqu’ils
sont basésuniquement
sur les valeurs extrêmes des différences
F* (x) - Son (x).
Les deux tests de
Shapiro-Wilk
etd’Agostino
ont évidemment le mé- rite d’utiliser toute l’information fournie par lesobservations,
ainsi que les deux tests de K. Pearson, cequi
n’est pas le cas ni pour le test deDavid,
ni pour le test de
Geary.
---
(1) Des tables de la distribution de
b2 ont
été recemment calculées par simulation pourn = 7 (1) .... 12, 15(5) .... 50.
R. d’Agostino et G. Tietjen : Biometrika 1971 n° 3 p. 670.
Diverses tentatives de
comparaison
de ces tests ont étéfaites,
parsimulation,
par Louteret Koerts,
parShapiro,
Wilk et Chen et pard’Agos-
tino.
Malheureusement les
puissances
ainsi calculées necorrespondent
pas toutes ni aux mêmes effectifs n, ni aux mêmes alternatives. Pourquelques
alternatives
particulières,
onpeut cependant
noter les résultatssuivants ,
pour n = 50. Les tests de
Kolmogorov-Lilliefors (K.L.)
et deKuiper
sont,en
général,
moinspuissants
que les tests deShapiro-Wilk (W), d’Agostino (Y),
Pearson(b2)
et David(u).
- Alternative : loi uniforme
Le test Y est moins
puissant
que les testsW, 03B22
et uqui
ont sensi- blement la mêmepuissance
voisine de 0,95(le
testpi ayant
dans ce casune
puissance
voisine dezéro).
- Alternative : loi de
X 2,
V = 2Les tests
W, P
1 etX2
ont sensiblement une mêmepuissance
trèsélevée, supérieure
à celle des tests Y,b 2 et K. L.,
très nettementsupé-.
rieure à celle du test u.
-
Alternative :
loi de t, v = 2Les
cinq
tests Y,W, 03B21, 03B22
et u ont despuissances
relativementélevées,
nettementsupérieures
à celles des testsX2
et K. L.- Alternative : loi
log-normale (pt
=0, 03C32 = 1)
Les
cinq
tests Y,W, pi, 03B22, X2
et K. L. sont trèspuissants,
nette-ment
plus puissants
que le test u.Bien
sûr,
ces indications trèspartielles,
relativement à unproblème
aux
multiples aspects,
nepermettent
pas de donner au statisticien unerègle systématique. Peut-être, cependant, pourront-elles, compte
tenu de l’infor-mation
qu’il possède
apriori,
des raisonsqu’il
a de se poser laquestion ,
del’usage qu’il
veut faire de la conclusion du test, del’importance
du ris-que matériel ou financier -au sens courant du mot- associé à une
accepta-
tion erronée de la
normalité,
et de la commodité de laméthode,
l’aider à choisir celle(ou celles) qui
luiparaissent
le mieux convenir à sonproblè-
me.