R EVUE DE STATISTIQUE APPLIQUÉE
M AURICE D UMAS
Sur les tests dérivés de la loi de Kolmogorov
Revue de statistique appliquée, tome 25, n
o1 (1977), p. 35-55
<http://www.numdam.org/item?id=RSA_1977__25_1_35_0>
© Société française de statistique, 1977, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
35
SUR LES TESTS DÉRIVÉS DE LA LOI DE KOLMOGOROV
Maurice
DUMAS
Ingénieur
en chef de l’artillerie navale(E. R.)
TABLE DES MATIERES
Pages
1. Introduction et notations... 36
2. Le test K.S. et son
application graphique ...
373.
Remarques
sur le test K.S... 374.
Application numérique
du testK.S...
39Exemple
... 395. Cas où H est une loi normale... 40
6. Cas 1 : La loi normale
H,
biendéterminée,
estquelconque...
407. Cas II : Les
paramètres
de la loi normale H sont déterminés par m = xet a = s... 418. Cas III : Les
paramètres
m et a de la loi H ont été déterminés par une droite deHenry ...
419.
Exemple
tiré d’une étudetechnique...
44a)
Position duproblème...
44b) Graphique
deHenry...
44c)
Tests divers... 45d)
Discussionstatistique...
46e)
Discussiontechnique...
4610.
Bibliographie...
47Table 1 et Table II... 48 - 5 0
RESUME
L’auteur examine le cas du test de Kolmogorov-Smirnov, et celui du test de Lilliefors ; il formule à leur sujet quelques remarques qui le conduisent à établir différentes tables numé- riques, grâce auxquelles l’application de l’un et de l’autre de ces tests est rendue très simple,
particulièrement
en ce qui concerne le cas où la loi hypothèse est normale.Revue de Statistique Appliquée, 1977 vol. XXV N° 1
Mots-clés : Loi de
Kolmogorov.
Test deKolmogorov-Smirnov.
Test de Kolmo-gorov-Lilliefors.
Il établit de plus une liaison entre ces tests et la construction de Henry ; il montre
que des courbes critiques, concrétisant des tests, peuvent être tracées sur un graphique de Henry, et comment l’on peut se rapprocher ainsi d’un test de normalité.
1 - INTRODUCTION ET NOTATIONS
Le test dérivé le
plus
directement de la loi deKolmogorov
est connusous le nom de Test de
Kolmogorov-Smirnov (Test K.S.).
Il met en causeune série de n mesures xi, avec :
à
laquelle
nous faisonscorrespondre :
Le test K.S.
s’applique lorsque
l’on se propose de décider s’il y a lieu derejeter l’hypothèse d’après laquelle
la série de mesuresproviendrait
d’unecertaine loi
continue,
entièrementdéterminée ;
soit F(x)
la fonction derépar-
tition de cette
loi,
dite loihypothèse,
ou loi H. Enparticulier,
ils’applique
au cas où H est la loi
normale,
entièrement déterminée par ses deux para- mètres m et a, connus ;plus particulièrement
encore, ils’applique
au casoù m et a sont définis à
partir
de la sérieelle-même,
au moyen des relationssuivantes,
mettant en cause des estimationsclassiques :
Ce dernier cas
particulier
a étéenvisagé
par MASSEY[2] ] puis
étudiépar LILLIEFORS
[3] ]
au moyen d’une méthode deMonte-Carlo ;
l’aboutis-sement a été le test de
Kolmogorov-Lilliefors (dit
dans la suite : testL.) auquel
sont associées des valeursnumériques inférieures,
à conditionségales,
à celles que le test K.S. conduirait à considérer si l’on ne tenait pas
compte
des coincidences que traduisent les relations(1).
Dans ce
qui suit,
nous nous proposons de montrer que la mise en oeuvregraphique
du test K.S.peut
êtreplus simple
que si la théorie était suivie pas à pas ; de la sorte, le recours à ce test - le théorème de K. est "un desjoyaux
de lastatistique mathématique"
comme l’a écrit G. DARMOIS dansune
préface [ 1 ] -
pourra devenir encoreplus fréquent qu’aujourd’hui.
Par voie de
conséquence,
la mise en oeuvre du test L.peut,
elleaussi,
être trèssimple.
En outre, nous nous proposons de relier les deux tests aux études que
permet
l’établissement d’une droite deHenry.
2 - LE TEST K.S. ET SON APPLICATION
GRAPHIQUE
a) L’application
du test K.S. suppose que l’on ait admis unrisque
depremière espèce,
soit a cerisque,
et que l’ondispose
d’une table donnant la valeur de la "différence"D, correspondant
à n et à a. MASSEY[21 ]
adonné une telle
table ;
STEPHENS[4]
et[5]
a donné pour D des valeursun peu différentes des
précédentes ;
remarque est faite que D estindépen-
dante du rang i des mesures
prises
en considération pourl’application
du test.b)
Sous sa formegraphique (Fig. 1 ),
le test K.S. revient à ceci :- tracer la courbe de
répartition de H,
c’est-à-dire la courbeF (x) ;
- lire sur la table la valeur de D
correspondant
auxdonnées ;
- tracer de
part
et d’autre de la courbeF(x)
les "courbescritiques"
inférieure et
supérieure,
déduites l’une et l’autre de la courbeF(x)
par une translationd’amplitude D, parallèlement
à l’axe desordonnées ;
si la gra- duation de cet axe n’est paslinéaire,
cette "translation" déforme lacourbe ;
-
porter
lespoints représentatifs
des mesures de lasérie ;
pourcela,
à l’abscisse xi, fairecorrespondre
2points,
d’ordonnéesrespectives i/n
et(i
-1 )/n ;
il y a donc à
porter
2npoints,
dont 1 sur chacune des ordonnées 0 et1 ;
-
rejeter l’hypothèse
si même un seul despoints
ainsiportés
se situeà l’extérieur du domaine limité par les courbes
critiques.
c)
Le casparticulier
où H est une loi normale est examinéséparément (n°
5 etsuivants).
Figure 1 - Test K.S. du n° 2.
3 -
REMARQUES
SUR LE TEST K.S.a)
Sur la droite d’ordonnéei/n
sontportés
à la fois lespoints
d’abscissesAppelant,
relativement à l’ordonnéei/n,
"valeurcritique
inférieure(supé- rieure)"
l’abscisse dupoint
de rencontre de la droite d’ordonnéei/n
avecla courbe
critique supérieure (inférieure),
il y a lieu àrejet
del’hypothèse
dufait d’un
point
d’ordonnéei/n :
- soit si xi est inférieure à la valeur
critique inférieure,
désormais dési-gnee
parxi
- soit si xi+1 est
supérieure
à la valeurcritique supérieure,
désormaisdésignée
parxi+ 1.
N.B. - Aucun des cas x >
x"i+1
et xi+ 1x;
n’est àconsidérer ;
eneffet,
par
exemple,
x >xi+1
entraine que sur l’ordonnée(i
-1 )/n
il y ait x >x;’ ;
d’où
rejet.
b)
Du fait du aci-dessus,
il y arejet
si xi est extérieur à l’intervalle(xi , x
Figure 2 - Test K.S.’du n° 3.
Le
rapprochement
desfigures
1 et 2 montre que, relativement à la mesurexi’ on ne
change
aucunement le résultat du testsi,
à cette mesure xi’ l’on ne faitcorrespondre
sur legraphique qu’un
seulpoint (Fig. 2),
au lieu de 2points (Fig. 1),
à la double condition d’unepart,
que cepoint
soit sur l’ordonnée(i
-0,5)/n,
et d’autrepart,
que les courbescritiques
soientrapprochées
de lacourbe
F(x),
de manière que leurs distances à cette courbe deviennent +d,
avec :
d = D -
0,5/n.
Ainsi
l’application graphique
du test K.S. se trouvesimplifiée puisqu’il n’y
aplus
àporter
que npoints
au lieu de2n ;
aucun de ces nouveauxpoints
ne se trouve sur une ordonnée extrème.
N.B. - En
rapport
avec cequi prècède,
lespoints critiques
d’abscissesx;
etx;’,
sont àplacer graphiquement
sur une seule et même ordonnée(c’est-à-dire
l’ordonnée
(i
-0,5)/n, qui
est aussi celle dupoint
d’abscissexi )
comme surla
figure 2,
et nonplus
l’un sur l’ordonnéei/n
et l’autre sur l’ordonnée(i
-1 )/n,
comme sur la
figure
1.4 - APPLICATION
NUMERIQUE
DU TEST K.S.Au niveau a
admis,
il y a lieu derejeter l’hypothèse d’après laquelle
la série de n mesures
proviendrait
de la loiH,
si même une seule des mesures xi se situe en dehors de l’intervallecritique (x; , xi’)
défini indifféremment :-
d’après
les considérations des numéros 2b et3a,
par :ce
qui
donne-
d’après
les considérations du numéro3b,
par :L’application numérique
du test K.S. estparticulièrement simple
si l’onutilise la table
I, laquelle donne, multipliées
par1000,
les valeurs de(i
-0,5)/n
et de d = D -
0,5/n,
les valeurs de D ayant été celles de MASSEY[2].
La table 1 donne en outre, suivant trois
variantes,
la manière d’utiliser lesquantités données,
les trois variantes conduisant naturellement aux mêmes conclusions.La variante A
correspond
directement àl’application graphique
du test.Les variantes B et C font intervenir les
quantités 1 - 0,5 + d, qui peuvent
n
d’ailleurs être tabulées
indépendamment
de H.La variante C convient au mieux
lorsque
H sertd’hypothèse
à bien desreprises,
car une table des valeurscritiques peut
être établie une fois pour toutes.Exemple.
Soit à tester au niveau ci =0,20, l’hypothèse d’après laquelle
une certaine série de n = 14 mesures
proviendrait
de la loi normaleréduite ;
les calculs ne sont faits ici que dans le cas de la mesure x9 =
0,90
de cette série.La consultation d’une table de la loi normale réduite fait connaître
F(0,90)
=0,816.
Sur la table 1 on trouvequ’à
n = 14 et i = 9correspond (i
-0,5)/n
=0,607 ;
etqu’à
n = 14 et a =0,20 correspond
d =0,238.
Suivant la variante
A,
les deux valeurscritiques
de(i
-0,5)/n
=0,607
sont :
0,816 - 0,238 = 0,578
et0,816
+0,238
> 1.Suivant la variante
B,
les deux valeurscritiques
deF (xi)
=0,816
sont :0,607 - 0,238
=0,369
et0,607
+0,238
=0,845.
Suivant la variante
C,
les deux valeurscritiques
de x9 =0,90,
sontx’9
etx9 ,
valeursdéterminées, après
exécution des calculs de la varianteB,
parConclusion :
D’après
la seule mesureconsidérée, l’hypothèse
ne seraitpas à
rejeter.
5 - CAS OU H EST UNE LOI NORMALE
Pour
l’application
du test K.S. au cas où H est une loinormale, on peut
établir des tablesgrâce auxquelles
cetteapplication
est encoreplus
directequ’avec
la table I. A cetteparticularité s’ajoute
le faitdéjà signalé plus
haut(n° 1)
de l’existence du test L.Remarque
étant faite que les tests K.S. et L. ne sont pas des tests denormalité,
et que leurapplication implique
que lesparamètres
m et a de Hsoient bien
déterminés,
nous sommes amené àdistinguer plusieurs
cas.Dans le cas
I,
m et a n’ont aucunement été tirés de la série de n mesuresconsidérée ;
c’est le cas parexemple
où l’on se propose de comparer cette série à cequi peut
être attendu d’une loi normale(la
loiH)
surlaquelle
l’attention a été attirée par des raisonnements ou des
expériences
antérieures.Dans les cas II et
III,
m et a ont été tirés de la sérieconsidérée,
parce que l’on se propose de résumer cette série par seulement deux valeurs numé-riques,
caractérisantrespectivement
moyenne etdispersion
des mesures ; ce que l’on demande alors au test, c’est de faireapparaître
s’il serait déraisonnable de s’en tenir à un résumé aussisimple
que celuienvisagé.
Bienentendu,
ce résumé devrait inclureégalement
la valeur de n, en l’absence delaquelle
cerésumé n’aurait aucune valeur
pratique.
6 - CAS 1 : LA LOI NORMALE
H,
BIENDETERMINEE,
ESTQUELCONQUE ;
en
particulier,
lesparamètres
m et a de H ont été déterminésindépendamment
de la série de mesures.
Le cas où m et a sont
quelconques
se ramène au cas m = 0 et a = 1(cas
de la loi normaleréduite)
enremplaçant chaque
xi par sa valeur réduite(xi
-m)/o-.
A
partir
d’une table F(u)
de la loi normaleréduite,
on calcule les valeurscritiques u;
etus
parapplication
de la variante C de la Table1 ;
les relations sont donc :.
u étant
positif
ounégatif
suivant queF(u)
estsupérieur
ou inférieur à0,50 ;
leurapplication
a donné les valeurs des colonnes K de la Table II. Ainsi.reprenant
l’exemple numérique
du numéro4,
traité suivant la varianteC,
les valeurs
critiques (soit - 0,334
et1,015) figurent
directement dans la co-lonne
K20,
pour n = 14 et i = 9 de la table II.Remarque.
Cequi précède
montre que, pour ndonné,
on peut, avant toutcalcul,
tracer sur unpapier
à échelle fonctionnelle loinormale,
les courbescritiques
définies par lesu;
etu;’,
pour les différentes valeurs de a que l’onenvisage
d’utiliser. De la sorte,après
calcul des valeurs réduites(xi
-m)/o,
le test K. S.
s’applique graphiquement
defaçon
trèssimple.
Bienentendu,
lepoint correspondant
à xi est àporter
sur l’ordonnée(i
-0,5)/n.
7 - CAS II : LES PARAMETRES DE
LA LOI
NORMALE HSONT DETERMINES PAR m = x ET a = s.
a)
Le cas où H est déterminé en fonction de la série de mesures par leségalités
m = x et a = s, est celui où le testL, présenté
aun° 1, peut
être substitué au testK.S., avantageusement
de différentspoints
de vue. Tout cequi
a été dit relativement au test K.S.s’applique
au testL. ;
il y a seulement à utiliser lesdifférences,
soitDL,
tabulées par LILLIEFORS[3],
à laplace
des différences D dites
plus
haut. Enparticulier,
les nouvelles valeurscritiques
v:
etvs
sont définies parIl y a donc lieu de
remplacer
dans la tableII,
lesu;
etus
des colonnesK,
par les
v;
etvs
des colonnes L. La remarque dun°
6 restevalable,
sous réserveque ce même
remplacement
soit effectué.Il est à noter que, les valeurs
DL
ayant été obtenues par une méthode deMonte-Carlo,
il est téméraire de s’en servir dans des conditionsqui
ne sont pasen accord avec celles des essais de l’auteur.
b)
Le cas IIpeut
être traitégraphiquement :
voird)
dun°
suivant8 - CAS III : LES PARAMETRES m ET a DE LA LOI H ONT ETE DETERMINES PAR UNE DROITE DE HENRY
Remarque
liminaire. Le casIII, puisqu’il
ne se confond pas avec le seulcas
(cas II)
où le test L. estapplicable,
doit être traité au moyen des valeurs du testK.S. ;
mais onpeut espérer qu’une
futureexpérimentation permettra
derapprocher
pour le casII,
le test K.S. du test L.(voir,
aun° 10,
la remarqueau
sujet
de[2] MASSEY) ;
l’onpourrait
donc êtretenté, toujours
pour lecas
III,
de se référer au testL.,
mais desprécautions
seraient alors àprendre
(paragraphe c) ci-dessous).
a)
Le cas où H est déterminée par une droite de HENRY construited’après
la série de n mesures, estparticulièrement
intéressant étant donné que, à notreavis,
une étude sur legraphique
de HENRY et un recours au test de K.S.(ou L),
sont deuxopérations qui
secomplètent
heureusement l’une l’autre.Développer
cepoint
serait sortir du cadre de laprésente note ; il
y a seulement lieu de remarquer ceci :1)
Sur ungraphique
deHENRY,
il estpossible
de reporter de part et d’autre de ladroite,
retenue commecompensant
au mieux les mesures de lasérie, (droite
deHENRY),
les valeurscritiques
des mesures xi, calculées àl’aide,
parexemple,
de la tableII ;
comme à ces valeurscritiques
sont associésdes
risques a
biendéterminés,
l’ensemble constitue un véritable test, aussicomplet qu’il peut
êtredésiré,
et intéressant à connaître mêmesi,
dans l’état actuel deschoses,
il seprésente
comme étant peupuissant.
Pour lemoins,
on obtient par le tracé des
lignes joignant
lespoints critiques,
uneprécieuse
indication visuelle sur les écartspouvant exister,
sans que cela soitsurprenant,
entre les
points expérimentaux
et la droite de HENRYcorrespondante ;
une indicationdifférente,
maisrépondant
à la mêmepréoccupation,
a été men-tionnée dans
[6],
sous ladésignation
de"Lignes
L 25 et L 75".2)
Legraphique
de HENRY est valablement établi si l’onadopte (i
-Q,5)/n
comme estimation de la
fréquence
cumulée de xi ;lorsqu’il
en estainsi,
lespoints critiques
de xi seplacent (N.B.
dun° 3b)
sur la même ordonnée(soit : (i
-0,5)/n)
que lepoint
xi lui-même.Il est à noter que, pour l’établissement d’un
graphique
de HENRY :- d’une
part,
la table 1 donne les valeurs de(i
-0,5)/n, qui
sont utilesen cas
d’emploi
d’unpapier
à échellefonctionnelle,
loinormale ;
- d’autre
part,
la tableII,
dans sa dernièrecolonne,
donne uid’après F(ui) = (i
-0,5)/n
pour isupérieur
à0,5
n ; en utilisant convenablement cette dernièrevaleur,
on se libère de lasujétion
d’avoir recours à unpapier
à échelle
fonctionnelle,
loinormale,
et l’onpeut opérer
sur unesimple
feuillede
papier quadrillé.
En outre, l’utilisation des ordonnées
(i
-0,5)/n
et dupapier quadrillé
peut être faite à l’aide de tables existantes[6].
3)
Si pour l’étude en cause l’onadopte
non pas l’estimation(i
-0,5)/n,
mais
i/n,
oui/(n
+1)
ou etc, l’étude n’en sera pasmodifiée,
à condition que les valeurscritiques
de xi soient bienportées
sur la même ordonnée que xi.b) Puisque
la série de mesures a faitl’objet
d’une étudegraphique,
àsavoir celle
qui
a conduit à la droite de HENRY dont lesparamètres
m et a ontété retenus, il est tout naturel
d’appliquer
le test K.S. sous sa forme gra-phique, particulièrement expressive.
Pour cela :- calculer les
quantités
m +ui
a et m +ui’
a ;- porter les
points
ayant cesquantités
pour abscisses sur la même ordonnée que lepoint
d’abscisse xi ;-
rejeter l’hypothèse
si même un seul despoints
d’abscisse xi se situe hors de l’intervalle des deuxpoints
de même ordonnée.Remarque.
Il n’est pastoujours
nécessaire de calculer en totalité les m + uaqui
sont au nombre de 2n. Eneffet,
lespoints correspondant
à cesquantités
se situent sur deux courbes dont l’allure
générale
estsimple ;
cette allureest celle des courbes tracées sur la
figure 3,
comme elle est aussi celle descourbes L25 et
L75,
citées ena)
ci-dessus. Il suffit doncpratiquement d’opérer
ainsi :
- calculer les m + ua seulement pour trois valeurs de
i,
voisines respec- tivement de 0(i petit),
de0,5
n et de n ;- porter sur le
graphique
les 6points correspondant
à ces troisvaleurs ;
- tracer les courbes
passant
par cespoints
etayant
comme alluregéné- rale,
celle diteplus haut ;
- conclure immédiatement ou
bien,
s’il y adoute, repérer
les valeurs de i pourlesquelles
lepoint
xi se situetrop près
d’une courbe pour que l’on ait puconclure, puis
calculer les m + uaqui renseigneront
sur cepoint,
etconclure.
Figure 3 (Exemple du n° 9) - Graphique de HENRY et points critiques du test de LILLIE- FORS, pour a = 0,200
x points expérimentaux
0 points critiques correspondants.
c)
Dans la construction ci-dessus on s’en est tenu strictement au testK.S., puisque
l’on a eu recours(table II)
aux u et non pas aux v du testL ;
si l’on choisit de se référer au test
L,
onpeut opérer
exactement commeplus haut,
sauf àremplacer
les u par les v, et seulement à la condition d’avoir l’attention attirée sur cequ’en agissant
de la sorte, ons’expose
à une sévéritéaccrue c’est-à-dire à être amené à
rejeter l’hypothèse -
ou encore(n° 5)
àêtre incité à ne pas résumer la série de n mesures par seulement les m et a
déduits de la droite de HENRY tracée -
plus
souvent que si l’on s’en était tenu strictement au test K.S.d)
Le cas IIpeut
être traitégraphiquement
dans les mêmes conditions que le casIII,
mais en utilisant valablement les v de la table II au lieu des u ; c’est d’ailleurs cequi
est fait aun°
9.e)
A supposer que la double étude sur ungraphique
de HENRY conduiseà
rejeter
leshypothèses correspondant respectivement
au cas II et au casIII,
on est conduit à penser que la série de mesures
n’appartient
ni à la loi normaledéfinie par les estimations sans biais de ses
paramètres,
ni à la loi normale que legraphique
de HENRY a faitapparaître
comme cadrant "au mieux" avec lesmesures. Il semble donc que cette double
étude,
sansqu’elle puisse
être consi- dérée en touterigueur
comme constituant un test denormalité,
est bienprès
de mériter
cependant
d’être considéree comme tel.9 - EXEMPLE TIRE D’UNE ETUDE
TECHNIQUE a)
Position duproblème
La série de n = 10 mesures
reproduite
sur lafigure
3représente
les duréesde vie de
lampes
à incandescence d’un mêmemodèle, provenant
d’un mêmeatelier,
ou,plus
exactement, delampes
que l’on ne saitdistinguer
l’une del’autre par aucun détail
technique
de leurélaboration,
ou encore, delampes appartenant
à un même lottechnique.
Leproblème technique qui
se pose est de déterminer ce que l’onpeut
valablement retenir de la série de mesures, et notamment si l’on est incité par cette dernière àagir
sur le processus de fabrication.Nous avançons que toute étude du genre de
celle-ci,
doit commencerpar l’établissement d’un
graphique
deHENRY ;
ellepeut
êtrepoursuivie
comme il estindiqué plus
loin.b) Graphique
de HENRYSe
reporter
à la case n = 10 de la tableII, puis, disposant
d’unsimple papier quadrillé,
faire choix d’échelles linéairesconvenables,
à la fois pour les durées de vie(axe
desx)
et pour les ui de la table II.Porter sur le
graphique
les 10points représentatifs
des mesures,points marqués
d’une croix sur lafigure
3. L’ordonnée de xicorrespond
à(i
-0,5)/n.
Aucune droite de HENRY n’est
tracée,
étant donné que lespoints
venantd’être
portés apparaissent
comme ne pouvant pas être biencompensés
par unedroite ;
il se trouve même que ladisposition
d’ensemble de cespoints
donne à penser que,peut-être,
la série étudiée résulte d’unmélange
de deux sériesd’origines
différentes.Finalement,
ilapparaît
commeparticulièrement
inté-ressant de soumettre la série donnée à différents tests, avant de conclure.
c)
Tests divers1 )
Test K. S. Comme aucune droite de HENRY n’a ététracée,
on nedispose
pas de valeurs de m et a, nécessaires pourappliquer
le test en cause.2)
TestL., forme numérique.
Un calcul donne :Il y a lieu de se référer aux colonnes L et à la case n = 10 de la table
II, puis,
pour toutes les valeurs dei,
de calculer les valeurscritiques
de xi et de les comparer à xi 1Ainsi,
pour i = 5 et pour a =0,20,
les valeurscritiques
de Xs = 1345 sont : 1500 -0,568
x 425 = 1259 et 1500 +0,292
x 425 = 1624.Finalement,
aucune valeur xi ne conduit àrejeter l’hypothèse
soumise au test.Remarque : Si l’on
avaitcomplété
les calculsci-dessus,
par celui des valeurs réduites(xi
-x)/s,
on aurait eu à comparer directement ces valeurs auxv
etvs
de la table II.Ainsi,
pour i =5,
la valeur réduite est(1345 - 1500)/425,
soit -0,365,
valeurqui
se trouve êtrecomprise
entre -0,568
et0,292.
3)
TestL., forme graphique.
Constructionpréliminaire :
Sur lafigure
3porter :
- d’une
part,
la droite définie par les valeurs m = 1500 et a =425 ;
- d’autre
part,
tous lespoints représentatifs
des valeurscritiques,
cal-culées comme il est dit à propos du test
L,
formenumérique ;
-
puis
tracer les deux courbes réunissant cespoints
entre eux : ce sontles courbes
critiques.
Cette construction
préliminaire
ne fait paspartie
du test L.exposé ici ;
son but est de faire
apparaître quelle
est véritablement l’alluregénérale
de cescourbes et leurs
positions
parrapport
à la droitereprésentative
de la loi normale en cause dans le test.Test. Calculer comme
plus haut,
les valeurscritiques correspondant
seulementà trois valeurs de
i,
à savoir2, puis
5 et9 ;
-
porter
sur legraphique
de HENRY les sixpoints critiques correspondants ;
- tracer
approximativement
les deux courbescritiques,
sachantqu’elles
passent par lespoints critiques,
etqu’elles
ont pour alluregénérale,
celle que l’onconnaît,
attendu que l’alluregénérale
des courbescritiques
tracées surla
figure
3 au cours de la constructionpréliminaire,
est valable en toutecirconstance ;
- reconnaître que les courbes
critiques
tracéesapproximativement,
con-tiennent entre elles tous les
points
xi, saufpeut-être,
avec les données del’exemple traité,
ceuxcorrespondant
à x6(éventuellement, trop faible)
et à X7(éventuellement trop fort) ;
- élucider ce dernier
point
par les calculs de 1500 - 425u6
et de1500 + 425
u"7.
Ainsi dans le cas
présent,
le nombre des calculs nécessaires a été de8,
au lieu de 20 calculs du test
L,
formenumérique ;
-, la différence aurait étéencore
plus grande
si n avait étésupérieur
à 10.4)
Test de SHAPIRO et WILK. Lescalculs,
non détaillésici,
conduisent à : W =0,894.
Les valeurs
critiques
de W aux niveaux tabulés(soit
ex =0,01 - 0,02 - 0,05 - 0,10
et
0,50) permettent
de situer0,894
auvoisinage
de0,20.
d)
Discussionstatistique
Le
graphique
de HENRY a fourni lesenseignements
ditsplus
haut(n° 9b).
Le test L ne conduit pas à
rejeter l’hypothèse
de base de ce test, etcela,
même au niveau a =
0,20, qui
est un niveau sévère en ce sensqu’il
entrainedes
rejets d’hypothèse
bienplus fréquents
que les niveaux0,05
et surtout0,01.
Le test de normalité de SHAPIRO et WILK conduit au même résultat
général
que le test L.e)
Discussiontechnique
D’une
façon générale, hypothèse
est faitequ’une
fabrication bienréglée
donne lieu à une distribution normale des mesures, et
qu’en
cas de distributionnormale,
la fabricationapparaît
comme d’autant mieuxréglée
que ladispersion
de cette distribution est
plus
faible. Enconséquence,
le faitqu’une
distribution soit considérée comme normale ne fournit au technicien aucuneindication,
sice n’est
qu’elle
lui donne confiance dans le processussuivi ;
mais il lui restetoujours
à continuer son étude en vue de réduire ladispersion
des mesures.Ainsi,
dans les conditions del’exemple traité,
le technicien n’est pas incité par les tests à intervenir dans le processus d’élaboration duproduit.
Mais il a l’attention attirée par le
graphique
de HENRY - que, s’ilpossède quelques
notions élémentaires destatistique,
il a étécapable
de construirelui-même sur une feuille de
papier quadrillé, puis d’interpréter -
sur l’éven-tualité d’un trouble
équivalant
à unmélange
de deuxfabrications ;
réfléchis- sant sur cetteindication,
il se dit que l’effectif n = 10 de la série dont il adisposé,
est bientrop
faible pourrenseigner
sur unmélange
éventuel.Finalement,
ou bien ce technicien est enpériode d’essais,
et il fera ensorte d’effectuer de nouvelles mesures sur un échantillon de
grand effectif ;
ou
bien,
la fabrication étant en cours, ilportera particulièrement
son atten-tion sur tout ce
qui pourrait
confirmer ou infirmer l’indication donnée par legraphique
de HENRY. De toutefaçon, jusqu’à plus ample informé,
il évi-tera de considérer que les valeurs x = 1500 et s =
425,
Qui, associées à n =10,
résument la série par deux estimations sans
biais,
résument valablement la fabri- cation.10 - BIBLIOGRAPHIE
[1] DUGUE
D. 2014 Traité destatistique théorique
etappliquée.
Masson.Ouvrage visé au n° 1.
[2]
MASSEY F.J.Jr. - The KOLMOGOROV-SMIRNOV test forgoodness
of fit.Am. Statistical Ass. Journal -
1951,
pp. 68-78.Note contenant une table pouvant servir à
prolonger
la table I pourn = 1 - 2 et
3,
et pour n = 25 - 30 et 35.Les notations étant dans ce
qui
suit celles de notre texte, MASSEY noteque l’on doit s’attendre à ce que
l’ajustement
de m et de 03C3 aux valeurs corres-pondantes
del’échantillon,
"soit parcalcul,
soit parajustement
visuel à uneligne
droite sur unpapier
à échelle fonctionnelle" ait pourconséquence
uneréduction de
Dn,03B1 ;
ilappuie
cela par uneexpérience
de Monte Carlo ayantcomporté
letirage
de 100 distributions de chacune 10valeurs
d’unepopula-
tion
normale ; chaque
distribution a étéreprésentée
sur unpapier
à échellefonctionnelle,
et une droite a été tracée aumieux ; parmi
les résultats del’expé-
rience
figure
notamment ceci que seulement uneobservation,
sur100, dépassa
le
point critique
de 03B1 =0,20, d’après
le D du test K.S. D’autres résultats sontrappelés
par FERIGNAC dans[8].
Remarque.
Des deux casenvisagés
parMASSEY, l’ajustement
par calcul a étédéveloppé
parLILLIEFORS,
tandis quel’ajustement
visuel -c’est-à-direl’ajus-
tement par droite de HENRY2014 reste à traiter
plus complètement qu’il
nel’a été par les 100 distributions de MASSEY. Pour ce
faire, l’opérateur
auraà éliminer des droites
qui,
même si ellescompensent
"au mieux" lespoints expérimentaux,
les compense en fait "très mal".L’opérateur
aura donc à sefixer une
règle pratique d’élimination ; naturellement,
les valeurs des diffé-rences retenues finalement pour
remplacer
dans le casparticulier étudié,
lesD de
K.S.,
ne seront valables que dans le cadre de la diterègle, explicitement énoncée, règle qui,
dans cesconditions, peut
être relativement arbitraire.[3]
LILLIEFORS H.W . - On the KOLMOGOROV-SMIRNOV test for norma-lity
with mean and variance unknown. Am. Statistical Ass. Journal -1967,
pp. 393-402.Note contenant une table
pouvant
servir àcompléter
les colonnes L de la table II pour les valeurs 03B1 =0,10
et0,15.
[4]
STEPHENS M.A. - Use of theKOLMOGOROV-SMIRNOV,
Cramér-vonMises and related statistics without extensive tables. Journal
of
theRoyal
Statistical
Society.
Série B. 32 - 1970 pp. 115-122.Note
indiquant
pour D(test
deKOLMOGOROV-SMIRNOV)
et pourDL (test
deLILLIEFORS)
des valeursqui
auraient pu servir à l’établisse- ment des tables I etII,
sauf pour 03B1 =0,20 ;
et auprolongement
de cestables pour 03B1 =
0,025.
[5] PEARSON
E.S. and HARTLEY H. - Biometrika Tables for Statisticians.Vol. 2. 1972.
Cambridge University
Press.Ouvrage reproduisant
dans sa table 54 les résultats de STEPHENS.[6]
DUMAS M. - Lesépreuves
sur échantillon.1955 ;
Centre national de la recherchescientifique.
Ouvrage
visé aun°
8a et8b,
en raison desfigures
A et B de sonn° 403 ;
ces
figures
sont d’ailleurs lesreproductions
desfigures
a et b dun°
42 del’ouvrage :
M. DUMAS et P.MAHEU,
Les méthodesstatistiques
et ... ,publié
par le Mémorial de l’Artillerie
Française,
dans ses fascicules de 1948 - 1949 et 1950.[7] MORICE
E. - Tests de normalité d’une distribution observée. Revue deStatistique Appliquée.
1972. Vol. XXn°
2.En
particulier : exposé
du test L. et table dequelques
valeurs relatives à ce test.[8]
FERIGNAC P. - Test deKOLMOGOROV-SMIRNOV.
Revue de Statis-tique Appliquée.
Vol.X, n° 4,
p. 13 à 32.Ouvrage
citéplus haut,
à propos de MASSEY[2].
Table I. Test de KOLMOGOROV-SMIRNOV MODE D’EMPLOI
Données. xi X2 ... ’ xi ... Xn : série de n mesures, ordonnées
xi _ 1
xia :
risque
depremière espèce, admis ;
F(x) :
fonction derépartition, continue,
de la loihypothèse
H.Objectif
Décider s’il convient derejeter l’hypothèse d’après laquelle
la sériede mesures
appartiendrait
à la loi H.Processus.
Opérer
ainsiqu’il
suit pourchaque
valeur de i- dans la
rubrique
n, lire sur laligne
i la valeur de(i
-0,5)/n,
et surla
ligne
a, la valeur de la différenced ;
N.B. : les valeurs
indiquées
sont à diviser par 1000.- faire choix de l’une des variantes suivantes :
Variante A. déterminer
F(xi), puis
retenir comme valeurscritiques
de(i
-0,5)/n
les valeursF (xi )
± d.Variante B. déterminer
F(xi), puis
retenir comme valeurscritiques
deF (xi )
les valeurs(i
-0,5)/n
± d.Variante C retenir comme valeurs
critiques
de Xi’ lesquantités xi
etxi’,
solutions de
F(x) = (i
-0,5)/n
± d.Décision.
Rejeter l’hypothèse,
même si pour une seule valeur dei,
il y adépassement
des valeurscritiques indiquées
par la varianteadoptée.
Table de (i -
0,5)/n,
puis table de la différence d(a , n)** d = D -
0, 5/n,
avec pour D les valeurs lues sur la table de MASSEY[2].
Table II. Tests en cas de loi H normale MODE D’EMPLOI
Données. xi x2 , ... Xi i ... xn : série de n mesures, ordonnées
xi-1
xia :
risque
depremière espèce,
admis :Objectif
Décider s’il convient derejeter l’hypothèse d’après laquelle
la série de mesuresappartiendrait
à une certaine loi normale.Processus.
Opérer
ainsiqu’il
suit pourchaque
valeur de ia)
Cas où la loihypothèse
est une loi normale entièrement déterminée(m
et aspécifiés),
et où par suite il y a lieud’appliquer
le test de KOLMOGOROV-SMIRNOV.- dans la
rubrique
n, lire sur laligne
i lesu;
etu;’
des colonnes K intéressées :- retenir comme valeurs
critiques
de xib)
Cas où la loinormale, hypothèse,
n’est pas déterminée(m
et a nonspécifiés),
et où par suite il estjustifié d’appliquer
le test de LILLIE-FORS :
- dans la
rubrique
n, lire sur laligne
i lesv;
etvs
des colonnes Lintéressées ;
- retenir comme valeurs
critiques
de x, :N.B. - Les valeurs
indiquées
pour les u et les v, sont à diviser par 1000.Décision.
Rejeter l’hypothèse,
même si pour une seule valeur dei,
il y adépassement
des valeurscritiques.
Table donnant :
- Colonnes K :
u;
etus (test
deKOLMOGOROV-SMIRNOV),
- Colonnes L :
v;
etvs (test
deKOLMOGOROV-LILLIEFORS),
- Dernière colonne : ui pour i >