• Aucun résultat trouvé

Sur les tests dérivés de la loi de Kolmogorov

N/A
N/A
Protected

Academic year: 2022

Partager "Sur les tests dérivés de la loi de Kolmogorov"

Copied!
22
0
0

Texte intégral

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

M AURICE D UMAS

Sur les tests dérivés de la loi de Kolmogorov

Revue de statistique appliquée, tome 25, n

o

1 (1977), p. 35-55

<http://www.numdam.org/item?id=RSA_1977__25_1_35_0>

© Société française de statistique, 1977, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.

sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

(2)

35

SUR LES TESTS DÉRIVÉS DE LA LOI DE KOLMOGOROV

Maurice

DUMAS

Ingénieur

en chef de l’artillerie navale

(E. R.)

TABLE DES MATIERES

Pages

1. Introduction et notations... 36

2. Le test K.S. et son

application graphique ...

37

3.

Remarques

sur le test K.S... 37

4.

Application numérique

du test

K.S...

39

Exemple

... 39

5. Cas où H est une loi normale... 40

6. Cas 1 : La loi normale

H,

bien

déterminée,

est

quelconque...

40

7. Cas II : Les

paramètres

de la loi normale H sont déterminés par m = xet a = s... 41

8. Cas III : Les

paramètres

m et a de la loi H ont été déterminés par une droite de

Henry ...

41

9.

Exemple

tiré d’une étude

technique...

44

a)

Position du

problème...

44

b) Graphique

de

Henry...

44

c)

Tests divers... 45

d)

Discussion

statistique...

46

e)

Discussion

technique...

46

10.

Bibliographie...

47

Table 1 et Table II... 48 - 5 0

RESUME

L’auteur examine le cas du test de Kolmogorov-Smirnov, et celui du test de Lilliefors ; il formule à leur sujet quelques remarques qui le conduisent à établir différentes tables numé- riques, grâce auxquelles l’application de l’un et de l’autre de ces tests est rendue très simple,

particulièrement

en ce qui concerne le cas où la loi hypothèse est normale.

Revue de Statistique Appliquée, 1977 vol. XXV N° 1

Mots-clés : Loi de

Kolmogorov.

Test de

Kolmogorov-Smirnov.

Test de Kolmo-

gorov-Lilliefors.

(3)

Il établit de plus une liaison entre ces tests et la construction de Henry ; il montre

que des courbes critiques, concrétisant des tests, peuvent être tracées sur un graphique de Henry, et comment l’on peut se rapprocher ainsi d’un test de normalité.

1 - INTRODUCTION ET NOTATIONS

Le test dérivé le

plus

directement de la loi de

Kolmogorov

est connu

sous le nom de Test de

Kolmogorov-Smirnov (Test K.S.).

Il met en cause

une série de n mesures xi, avec :

à

laquelle

nous faisons

correspondre :

Le test K.S.

s’applique lorsque

l’on se propose de décider s’il y a lieu de

rejeter l’hypothèse d’après laquelle

la série de mesures

proviendrait

d’une

certaine loi

continue,

entièrement

déterminée ;

soit F

(x)

la fonction de

répar-

tition de cette

loi,

dite loi

hypothèse,

ou loi H. En

particulier,

il

s’applique

au cas où H est la loi

normale,

entièrement déterminée par ses deux para- mètres m et a, connus ;

plus particulièrement

encore, il

s’applique

au cas

m et a sont définis à

partir

de la série

elle-même,

au moyen des relations

suivantes,

mettant en cause des estimations

classiques :

Ce dernier cas

particulier

a été

envisagé

par MASSEY

[2] ] puis

étudié

par LILLIEFORS

[3] ]

au moyen d’une méthode de

Monte-Carlo ;

l’aboutis-

sement a été le test de

Kolmogorov-Lilliefors (dit

dans la suite : test

L.) auquel

sont associées des valeurs

numériques inférieures,

à conditions

égales,

à celles que le test K.S. conduirait à considérer si l’on ne tenait pas

compte

des coincidences que traduisent les relations

(1).

Dans ce

qui suit,

nous nous proposons de montrer que la mise en oeuvre

graphique

du test K.S.

peut

être

plus simple

que si la théorie était suivie pas à pas ; de la sorte, le recours à ce test - le théorème de K. est "un des

joyaux

de la

statistique mathématique"

comme l’a écrit G. DARMOIS dans

une

préface [ 1 ] -

pourra devenir encore

plus fréquent qu’aujourd’hui.

Par voie de

conséquence,

la mise en oeuvre du test L.

peut,

elle

aussi,

être très

simple.

En outre, nous nous proposons de relier les deux tests aux études que

permet

l’établissement d’une droite de

Henry.

(4)

2 - LE TEST K.S. ET SON APPLICATION

GRAPHIQUE

a) L’application

du test K.S. suppose que l’on ait admis un

risque

de

première espèce,

soit a ce

risque,

et que l’on

dispose

d’une table donnant la valeur de la "différence"

D, correspondant

à n et à a. MASSEY

[21 ]

a

donné une telle

table ;

STEPHENS

[4]

et

[5]

a donné pour D des valeurs

un peu différentes des

précédentes ;

remarque est faite que D est

indépen-

dante du rang i des mesures

prises

en considération pour

l’application

du test.

b)

Sous sa forme

graphique (Fig. 1 ),

le test K.S. revient à ceci :

- tracer la courbe de

répartition de H,

c’est-à-dire la courbe

F (x) ;

- lire sur la table la valeur de D

correspondant

aux

données ;

- tracer de

part

et d’autre de la courbe

F(x)

les "courbes

critiques"

inférieure et

supérieure,

déduites l’une et l’autre de la courbe

F(x)

par une translation

d’amplitude D, parallèlement

à l’axe des

ordonnées ;

si la gra- duation de cet axe n’est pas

linéaire,

cette "translation" déforme la

courbe ;

-

porter

les

points représentatifs

des mesures de la

série ;

pour

cela,

à l’abscisse xi, faire

correspondre

2

points,

d’ordonnées

respectives i/n

et

(i

-

1 )/n ;

il y a donc à

porter

2n

points,

dont 1 sur chacune des ordonnées 0 et

1 ;

-

rejeter l’hypothèse

si même un seul des

points

ainsi

portés

se situe

à l’extérieur du domaine limité par les courbes

critiques.

c)

Le cas

particulier

H est une loi normale est examiné

séparément (n°

5 et

suivants).

Figure 1 - Test K.S. du 2.

3 -

REMARQUES

SUR LE TEST K.S.

a)

Sur la droite d’ordonnée

i/n

sont

portés

à la fois les

points

d’abscisses

(5)

Appelant,

relativement à l’ordonnée

i/n,

"valeur

critique

inférieure

(supé- rieure)"

l’abscisse du

point

de rencontre de la droite d’ordonnée

i/n

avec

la courbe

critique supérieure (inférieure),

il y a lieu à

rejet

de

l’hypothèse

du

fait d’un

point

d’ordonnée

i/n :

- soit si xi est inférieure à la valeur

critique inférieure,

désormais dési-

gnee

par

xi

- soit si xi+1 est

supérieure

à la valeur

critique supérieure,

désormais

désignée

par

xi+ 1.

N.B. - Aucun des cas x &#x3E;

x"i+1

et xi+ 1

x;

n’est à

considérer ;

en

effet,

par

exemple,

x &#x3E;

xi+1

entraine que sur l’ordonnée

(i

-

1 )/n

il y ait x &#x3E;

x;’ ;

d’où

rejet.

b)

Du fait du a

ci-dessus,

il y a

rejet

si xi est extérieur à l’intervalle

(xi , x

Figure 2 - Test K.S.’du n° 3.

Le

rapprochement

des

figures

1 et 2 montre que, relativement à la mesure

xi’ on ne

change

aucunement le résultat du test

si,

à cette mesure xi’ l’on ne fait

correspondre

sur le

graphique qu’un

seul

point (Fig. 2),

au lieu de 2

points (Fig. 1),

à la double condition d’une

part,

que ce

point

soit sur l’ordonnée

(i

-

0,5)/n,

et d’autre

part,

que les courbes

critiques

soient

rapprochées

de la

courbe

F(x),

de manière que leurs distances à cette courbe deviennent +

d,

avec :

d = D -

0,5/n.

Ainsi

l’application graphique

du test K.S. se trouve

simplifiée puisqu’il n’y

a

plus

à

porter

que n

points

au lieu de

2n ;

aucun de ces nouveaux

points

ne se trouve sur une ordonnée extrème.

N.B. - En

rapport

avec ce

qui prècède,

les

points critiques

d’abscisses

x;

et

x;’,

sont à

placer graphiquement

sur une seule et même ordonnée

(c’est-à-dire

l’ordonnée

(i

-

0,5)/n, qui

est aussi celle du

point

d’abscisse

xi )

comme sur

la

figure 2,

et non

plus

l’un sur l’ordonnée

i/n

et l’autre sur l’ordonnée

(i

-

1 )/n,

comme sur la

figure

1.

(6)

4 - APPLICATION

NUMERIQUE

DU TEST K.S.

Au niveau a

admis,

il y a lieu de

rejeter l’hypothèse d’après laquelle

la série de n mesures

proviendrait

de la loi

H,

si même une seule des mesures xi se situe en dehors de l’intervalle

critique (x; , xi’)

défini indifféremment :

-

d’après

les considérations des numéros 2b et

3a,

par :

ce

qui

donne

-

d’après

les considérations du numéro

3b,

par :

L’application numérique

du test K.S. est

particulièrement simple

si l’on

utilise la table

I, laquelle donne, multipliées

par

1000,

les valeurs de

(i

-

0,5)/n

et de d = D -

0,5/n,

les valeurs de D ayant été celles de MASSEY

[2].

La table 1 donne en outre, suivant trois

variantes,

la manière d’utiliser les

quantités données,

les trois variantes conduisant naturellement aux mêmes conclusions.

La variante A

correspond

directement à

l’application graphique

du test.

Les variantes B et C font intervenir les

quantités 1 - 0,5 + d, qui peuvent

n

d’ailleurs être tabulées

indépendamment

de H.

La variante C convient au mieux

lorsque

H sert

d’hypothèse

à bien des

reprises,

car une table des valeurs

critiques peut

être établie une fois pour toutes.

Exemple.

Soit à tester au niveau ci =

0,20, l’hypothèse d’après laquelle

une certaine série de n = 14 mesures

proviendrait

de la loi normale

réduite ;

les calculs ne sont faits ici que dans le cas de la mesure x9 =

0,90

de cette série.

La consultation d’une table de la loi normale réduite fait connaître

F(0,90)

=

0,816.

Sur la table 1 on trouve

qu’à

n = 14 et i = 9

correspond (i

-

0,5)/n

=

0,607 ;

et

qu’à

n = 14 et a =

0,20 correspond

d =

0,238.

Suivant la variante

A,

les deux valeurs

critiques

de

(i

-

0,5)/n

=

0,607

sont :

0,816 - 0,238 = 0,578

et

0,816

+

0,238

&#x3E; 1.

Suivant la variante

B,

les deux valeurs

critiques

de

F (xi)

=

0,816

sont :

0,607 - 0,238

=

0,369

et

0,607

+

0,238

=

0,845.

Suivant la variante

C,

les deux valeurs

critiques

de x9 =

0,90,

sont

x’9

et

x9 ,

valeurs

déterminées, après

exécution des calculs de la variante

B,

par

(7)

Conclusion :

D’après

la seule mesure

considérée, l’hypothèse

ne serait

pas à

rejeter.

5 - CAS OU H EST UNE LOI NORMALE

Pour

l’application

du test K.S. au cas où H est une loi

normale, on peut

établir des tables

grâce auxquelles

cette

application

est encore

plus

directe

qu’avec

la table I. A cette

particularité s’ajoute

le fait

déjà signalé plus

haut

(n° 1)

de l’existence du test L.

Remarque

étant faite que les tests K.S. et L. ne sont pas des tests de

normalité,

et que leur

application implique

que les

paramètres

m et a de H

soient bien

déterminés,

nous sommes amené à

distinguer plusieurs

cas.

Dans le cas

I,

m et a n’ont aucunement été tirés de la série de n mesures

considérée ;

c’est le cas par

exemple

l’on se propose de comparer cette série à ce

qui peut

être attendu d’une loi normale

(la

loi

H)

sur

laquelle

l’attention a été attirée par des raisonnements ou des

expériences

antérieures.

Dans les cas II et

III,

m et a ont été tirés de la série

considérée,

parce que l’on se propose de résumer cette série par seulement deux valeurs numé-

riques,

caractérisant

respectivement

moyenne et

dispersion

des mesures ; ce que l’on demande alors au test, c’est de faire

apparaître

s’il serait déraisonnable de s’en tenir à un résumé aussi

simple

que celui

envisagé.

Bien

entendu,

ce résumé devrait inclure

également

la valeur de n, en l’absence de

laquelle

ce

résumé n’aurait aucune valeur

pratique.

6 - CAS 1 : LA LOI NORMALE

H,

BIEN

DETERMINEE,

EST

QUELCONQUE ;

en

particulier,

les

paramètres

m et a de H ont été déterminés

indépendamment

de la série de mesures.

Le cas m et a sont

quelconques

se ramène au cas m = 0 et a = 1

(cas

de la loi normale

réduite)

en

remplaçant chaque

xi par sa valeur réduite

(xi

-

m)/o-.

A

partir

d’une table F

(u)

de la loi normale

réduite,

on calcule les valeurs

critiques u;

et

us

par

application

de la variante C de la Table

1 ;

les relations sont donc :

.

u étant

positif

ou

négatif

suivant que

F(u)

est

supérieur

ou inférieur à

0,50 ;

leur

application

a donné les valeurs des colonnes K de la Table II. Ainsi.

(8)

reprenant

l’exemple numérique

du numéro

4,

traité suivant la variante

C,

les valeurs

critiques (soit - 0,334

et

1,015) figurent

directement dans la co-

lonne

K20,

pour n = 14 et i = 9 de la table II.

Remarque.

Ce

qui précède

montre que, pour n

donné,

on peut, avant tout

calcul,

tracer sur un

papier

à échelle fonctionnelle loi

normale,

les courbes

critiques

définies par les

u;

et

u;’,

pour les différentes valeurs de a que l’on

envisage

d’utiliser. De la sorte,

après

calcul des valeurs réduites

(xi

-

m)/o,

le test K. S.

s’applique graphiquement

de

façon

très

simple.

Bien

entendu,

le

point correspondant

à xi est à

porter

sur l’ordonnée

(i

-

0,5)/n.

7 - CAS II : LES PARAMETRES DE

LA LOI

NORMALE H

SONT DETERMINES PAR m = x ET a = s.

a)

Le cas H est déterminé en fonction de la série de mesures par les

égalités

m = x et a = s, est celui où le test

L, présenté

au

1, peut

être substitué au test

K.S., avantageusement

de différents

points

de vue. Tout ce

qui

a été dit relativement au test K.S.

s’applique

au test

L. ;

il y a seulement à utiliser les

différences,

soit

DL,

tabulées par LILLIEFORS

[3],

à la

place

des différences D dites

plus

haut. En

particulier,

les nouvelles valeurs

critiques

v:

et

vs

sont définies par

Il y a donc lieu de

remplacer

dans la table

II,

les

u;

et

us

des colonnes

K,

par les

v;

et

vs

des colonnes L. La remarque du

6 reste

valable,

sous réserve

que ce même

remplacement

soit effectué.

Il est à noter que, les valeurs

DL

ayant été obtenues par une méthode de

Monte-Carlo,

il est téméraire de s’en servir dans des conditions

qui

ne sont pas

en accord avec celles des essais de l’auteur.

b)

Le cas II

peut

être traité

graphiquement :

voir

d)

du

suivant

8 - CAS III : LES PARAMETRES m ET a DE LA LOI H ONT ETE DETERMINES PAR UNE DROITE DE HENRY

Remarque

liminaire. Le cas

III, puisqu’il

ne se confond pas avec le seul

cas

(cas II)

le test L. est

applicable,

doit être traité au moyen des valeurs du test

K.S. ;

mais on

peut espérer qu’une

future

expérimentation permettra

de

rapprocher

pour le cas

II,

le test K.S. du test L.

(voir,

au

n° 10,

la remarque

au

sujet

de

[2] MASSEY) ;

l’on

pourrait

donc être

tenté, toujours

pour le

cas

III,

de se référer au test

L.,

mais des

précautions

seraient alors à

prendre

(paragraphe c) ci-dessous).

(9)

a)

Le cas H est déterminée par une droite de HENRY construite

d’après

la série de n mesures, est

particulièrement

intéressant étant donné que, à notre

avis,

une étude sur le

graphique

de HENRY et un recours au test de K.S.

(ou L),

sont deux

opérations qui

se

complètent

heureusement l’une l’autre.

Développer

ce

point

serait sortir du cadre de la

présente note ; il

y a seulement lieu de remarquer ceci :

1)

Sur un

graphique

de

HENRY,

il est

possible

de reporter de part et d’autre de la

droite,

retenue comme

compensant

au mieux les mesures de la

série, (droite

de

HENRY),

les valeurs

critiques

des mesures xi, calculées à

l’aide,

par

exemple,

de la table

II ;

comme à ces valeurs

critiques

sont associés

des

risques a

bien

déterminés,

l’ensemble constitue un véritable test, aussi

complet qu’il peut

être

désiré,

et intéressant à connaître même

si,

dans l’état actuel des

choses,

il se

présente

comme étant peu

puissant.

Pour le

moins,

on obtient par le tracé des

lignes joignant

les

points critiques,

une

précieuse

indication visuelle sur les écarts

pouvant exister,

sans que cela soit

surprenant,

entre les

points expérimentaux

et la droite de HENRY

correspondante ;

une indication

différente,

mais

répondant

à la même

préoccupation,

a été men-

tionnée dans

[6],

sous la

désignation

de

"Lignes

L 25 et L 75".

2)

Le

graphique

de HENRY est valablement établi si l’on

adopte (i

-

Q,5)/n

comme estimation de la

fréquence

cumulée de xi ;

lorsqu’il

en est

ainsi,

les

points critiques

de xi se

placent (N.B.

du

n° 3b)

sur la même ordonnée

(soit : (i

-

0,5)/n)

que le

point

xi lui-même.

Il est à noter que, pour l’établissement d’un

graphique

de HENRY :

- d’une

part,

la table 1 donne les valeurs de

(i

-

0,5)/n, qui

sont utiles

en cas

d’emploi

d’un

papier

à échelle

fonctionnelle,

loi

normale ;

- d’autre

part,

la table

II,

dans sa dernière

colonne,

donne ui

d’après F(ui) = (i

-

0,5)/n

pour i

supérieur

à

0,5

n ; en utilisant convenablement cette dernière

valeur,

on se libère de la

sujétion

d’avoir recours à un

papier

à échelle

fonctionnelle,

loi

normale,

et l’on

peut opérer

sur une

simple

feuille

de

papier quadrillé.

En outre, l’utilisation des ordonnées

(i

-

0,5)/n

et du

papier quadrillé

peut être faite à l’aide de tables existantes

[6].

3)

Si pour l’étude en cause l’on

adopte

non pas l’estimation

(i

-

0,5)/n,

mais

i/n,

ou

i/(n

+

1)

ou etc, l’étude n’en sera pas

modifiée,

à condition que les valeurs

critiques

de xi soient bien

portées

sur la même ordonnée que xi.

b) Puisque

la série de mesures a fait

l’objet

d’une étude

graphique,

à

savoir celle

qui

a conduit à la droite de HENRY dont les

paramètres

m et a ont

été retenus, il est tout naturel

d’appliquer

le test K.S. sous sa forme gra-

phique, particulièrement expressive.

Pour cela :

- calculer les

quantités

m +

ui

a et m +

ui’

a ;

- porter les

points

ayant ces

quantités

pour abscisses sur la même ordonnée que le

point

d’abscisse xi ;

-

rejeter l’hypothèse

si même un seul des

points

d’abscisse xi se situe hors de l’intervalle des deux

points

de même ordonnée.

(10)

Remarque.

Il n’est pas

toujours

nécessaire de calculer en totalité les m + ua

qui

sont au nombre de 2n. En

effet,

les

points correspondant

à ces

quantités

se situent sur deux courbes dont l’allure

générale

est

simple ;

cette allure

est celle des courbes tracées sur la

figure 3,

comme elle est aussi celle des

courbes L25 et

L75,

citées en

a)

ci-dessus. Il suffit donc

pratiquement d’opérer

ainsi :

- calculer les m + ua seulement pour trois valeurs de

i,

voisines respec- tivement de 0

(i petit),

de

0,5

n et de n ;

- porter sur le

graphique

les 6

points correspondant

à ces trois

valeurs ;

- tracer les courbes

passant

par ces

points

et

ayant

comme allure

géné- rale,

celle dite

plus haut ;

- conclure immédiatement ou

bien,

s’il y a

doute, repérer

les valeurs de i pour

lesquelles

le

point

xi se situe

trop près

d’une courbe pour que l’on ait pu

conclure, puis

calculer les m + ua

qui renseigneront

sur ce

point,

et

conclure.

Figure 3 (Exemple du 9) - Graphique de HENRY et points critiques du test de LILLIE- FORS, pour a = 0,200

x points expérimentaux

0 points critiques correspondants.

(11)

c)

Dans la construction ci-dessus on s’en est tenu strictement au test

K.S., puisque

l’on a eu recours

(table II)

aux u et non pas aux v du test

L ;

si l’on choisit de se référer au test

L,

on

peut opérer

exactement comme

plus haut,

sauf à

remplacer

les u par les v, et seulement à la condition d’avoir l’attention attirée sur ce

qu’en agissant

de la sorte, on

s’expose

à une sévérité

accrue c’est-à-dire à être amené à

rejeter l’hypothèse -

ou encore

(n° 5)

à

être incité à ne pas résumer la série de n mesures par seulement les m et a

déduits de la droite de HENRY tracée -

plus

souvent que si l’on s’en était tenu strictement au test K.S.

d)

Le cas II

peut

être traité

graphiquement

dans les mêmes conditions que le cas

III,

mais en utilisant valablement les v de la table II au lieu des u ; c’est d’ailleurs ce

qui

est fait au

9.

e)

A supposer que la double étude sur un

graphique

de HENRY conduise

à

rejeter

les

hypothèses correspondant respectivement

au cas II et au cas

III,

on est conduit à penser que la série de mesures

n’appartient

ni à la loi normale

définie par les estimations sans biais de ses

paramètres,

ni à la loi normale que le

graphique

de HENRY a fait

apparaître

comme cadrant "au mieux" avec les

mesures. Il semble donc que cette double

étude,

sans

qu’elle puisse

être consi- dérée en toute

rigueur

comme constituant un test de

normalité,

est bien

près

de mériter

cependant

d’être considéree comme tel.

9 - EXEMPLE TIRE D’UNE ETUDE

TECHNIQUE a)

Position du

problème

La série de n = 10 mesures

reproduite

sur la

figure

3

représente

les durées

de vie de

lampes

à incandescence d’un même

modèle, provenant

d’un même

atelier,

ou,

plus

exactement, de

lampes

que l’on ne sait

distinguer

l’une de

l’autre par aucun détail

technique

de leur

élaboration,

ou encore, de

lampes appartenant

à un même lot

technique.

Le

problème technique qui

se pose est de déterminer ce que l’on

peut

valablement retenir de la série de mesures, et notamment si l’on est incité par cette dernière à

agir

sur le processus de fabrication.

Nous avançons que toute étude du genre de

celle-ci,

doit commencer

par l’établissement d’un

graphique

de

HENRY ;

elle

peut

être

poursuivie

comme il est

indiqué plus

loin.

b) Graphique

de HENRY

Se

reporter

à la case n = 10 de la table

II, puis, disposant

d’un

simple papier quadrillé,

faire choix d’échelles linéaires

convenables,

à la fois pour les durées de vie

(axe

des

x)

et pour les ui de la table II.

Porter sur le

graphique

les 10

points représentatifs

des mesures,

points marqués

d’une croix sur la

figure

3. L’ordonnée de xi

correspond

à

(i

-

0,5)/n.

Aucune droite de HENRY n’est

tracée,

étant donné que les

points

venant

d’être

portés apparaissent

comme ne pouvant pas être bien

compensés

par une

(12)

droite ;

il se trouve même que la

disposition

d’ensemble de ces

points

donne à penser que,

peut-être,

la série étudiée résulte d’un

mélange

de deux séries

d’origines

différentes.

Finalement,

il

apparaît

comme

particulièrement

inté-

ressant de soumettre la série donnée à différents tests, avant de conclure.

c)

Tests divers

1 )

Test K. S. Comme aucune droite de HENRY n’a été

tracée,

on ne

dispose

pas de valeurs de m et a, nécessaires pour

appliquer

le test en cause.

2)

Test

L., forme numérique.

Un calcul donne :

Il y a lieu de se référer aux colonnes L et à la case n = 10 de la table

II, puis,

pour toutes les valeurs de

i,

de calculer les valeurs

critiques

de xi et de les comparer à xi 1

Ainsi,

pour i = 5 et pour a =

0,20,

les valeurs

critiques

de Xs = 1345 sont : 1500 -

0,568

x 425 = 1259 et 1500 +

0,292

x 425 = 1624.

Finalement,

aucune valeur xi ne conduit à

rejeter l’hypothèse

soumise au test.

Remarque : Si l’on

avait

complété

les calculs

ci-dessus,

par celui des valeurs réduites

(xi

-

x)/s,

on aurait eu à comparer directement ces valeurs aux

v

et

vs

de la table II.

Ainsi,

pour i =

5,

la valeur réduite est

(1345 - 1500)/425,

soit -

0,365,

valeur

qui

se trouve être

comprise

entre -

0,568

et

0,292.

3)

Test

L., forme graphique.

Construction

préliminaire :

Sur la

figure

3

porter :

- d’une

part,

la droite définie par les valeurs m = 1500 et a =

425 ;

- d’autre

part,

tous les

points représentatifs

des valeurs

critiques,

cal-

culées comme il est dit à propos du test

L,

forme

numérique ;

-

puis

tracer les deux courbes réunissant ces

points

entre eux : ce sont

les courbes

critiques.

Cette construction

préliminaire

ne fait pas

partie

du test L.

exposé ici ;

son but est de faire

apparaître quelle

est véritablement l’allure

générale

de ces

courbes et leurs

positions

par

rapport

à la droite

représentative

de la loi normale en cause dans le test.

Test. Calculer comme

plus haut,

les valeurs

critiques correspondant

seulement

à trois valeurs de

i,

à savoir

2, puis

5 et

9 ;

-

porter

sur le

graphique

de HENRY les six

points critiques correspondants ;

- tracer

approximativement

les deux courbes

critiques,

sachant

qu’elles

passent par les

points critiques,

et

qu’elles

ont pour allure

générale,

celle que l’on

connaît,

attendu que l’allure

générale

des courbes

critiques

tracées sur

la

figure

3 au cours de la construction

préliminaire,

est valable en toute

circonstance ;

(13)

- reconnaître que les courbes

critiques

tracées

approximativement,

con-

tiennent entre elles tous les

points

xi, sauf

peut-être,

avec les données de

l’exemple traité,

ceux

correspondant

à x6

(éventuellement, trop faible)

et à X7

(éventuellement trop fort) ;

- élucider ce dernier

point

par les calculs de 1500 - 425

u6

et de

1500 + 425

u"7.

Ainsi dans le cas

présent,

le nombre des calculs nécessaires a été de

8,

au lieu de 20 calculs du test

L,

forme

numérique ;

-, la différence aurait été

encore

plus grande

si n avait été

supérieur

à 10.

4)

Test de SHAPIRO et WILK. Les

calculs,

non détaillés

ici,

conduisent à : W =

0,894.

Les valeurs

critiques

de W aux niveaux tabulés

(soit

ex =

0,01 - 0,02 - 0,05 - 0,10

et

0,50) permettent

de situer

0,894

au

voisinage

de

0,20.

d)

Discussion

statistique

Le

graphique

de HENRY a fourni les

enseignements

dits

plus

haut

(n° 9b).

Le test L ne conduit pas à

rejeter l’hypothèse

de base de ce test, et

cela,

même au niveau a =

0,20, qui

est un niveau sévère en ce sens

qu’il

entraine

des

rejets d’hypothèse

bien

plus fréquents

que les niveaux

0,05

et surtout

0,01.

Le test de normalité de SHAPIRO et WILK conduit au même résultat

général

que le test L.

e)

Discussion

technique

D’une

façon générale, hypothèse

est faite

qu’une

fabrication bien

réglée

donne lieu à une distribution normale des mesures, et

qu’en

cas de distribution

normale,

la fabrication

apparaît

comme d’autant mieux

réglée

que la

dispersion

de cette distribution est

plus

faible. En

conséquence,

le fait

qu’une

distribution soit considérée comme normale ne fournit au technicien aucune

indication,

si

ce n’est

qu’elle

lui donne confiance dans le processus

suivi ;

mais il lui reste

toujours

à continuer son étude en vue de réduire la

dispersion

des mesures.

Ainsi,

dans les conditions de

l’exemple traité,

le technicien n’est pas incité par les tests à intervenir dans le processus d’élaboration du

produit.

Mais il a l’attention attirée par le

graphique

de HENRY - que, s’il

possède quelques

notions élémentaires de

statistique,

il a été

capable

de construire

lui-même sur une feuille de

papier quadrillé, puis d’interpréter -

sur l’éven-

tualité d’un trouble

équivalant

à un

mélange

de deux

fabrications ;

réfléchis- sant sur cette

indication,

il se dit que l’effectif n = 10 de la série dont il a

disposé,

est bien

trop

faible pour

renseigner

sur un

mélange

éventuel.

Finalement,

ou bien ce technicien est en

période d’essais,

et il fera en

sorte d’effectuer de nouvelles mesures sur un échantillon de

grand effectif ;

ou

bien,

la fabrication étant en cours, il

portera particulièrement

son atten-

tion sur tout ce

qui pourrait

confirmer ou infirmer l’indication donnée par le

graphique

de HENRY. De toute

façon, jusqu’à plus ample informé,

il évi-

(14)

tera de considérer que les valeurs x = 1500 et s =

425,

Qui, associées à n =

10,

résument la série par deux estimations sans

biais,

résument valablement la fabri- cation.

10 - BIBLIOGRAPHIE

[1] DUGUE

D. 2014 Traité de

statistique théorique

et

appliquée.

Masson.

Ouvrage visé au n° 1.

[2]

MASSEY F.J.Jr. - The KOLMOGOROV-SMIRNOV test for

goodness

of fit.

Am. Statistical Ass. Journal -

1951,

pp. 68-78.

Note contenant une table pouvant servir à

prolonger

la table I pour

n = 1 - 2 et

3,

et pour n = 25 - 30 et 35.

Les notations étant dans ce

qui

suit celles de notre texte, MASSEY note

que l’on doit s’attendre à ce que

l’ajustement

de m et de 03C3 aux valeurs corres-

pondantes

de

l’échantillon,

"soit par

calcul,

soit par

ajustement

visuel à une

ligne

droite sur un

papier

à échelle fonctionnelle" ait pour

conséquence

une

réduction de

Dn,03B1 ;

il

appuie

cela par une

expérience

de Monte Carlo ayant

comporté

le

tirage

de 100 distributions de chacune 10

valeurs

d’une

popula-

tion

normale ; chaque

distribution a été

représentée

sur un

papier

à échelle

fonctionnelle,

et une droite a été tracée au

mieux ; parmi

les résultats de

l’expé-

rience

figure

notamment ceci que seulement une

observation,

sur

100, dépassa

le

point critique

de 03B1 =

0,20, d’après

le D du test K.S. D’autres résultats sont

rappelés

par FERIGNAC dans

[8].

Remarque.

Des deux cas

envisagés

par

MASSEY, l’ajustement

par calcul a été

développé

par

LILLIEFORS,

tandis que

l’ajustement

visuel -c’est-à-dire

l’ajus-

tement par droite de HENRY2014 reste à traiter

plus complètement qu’il

ne

l’a été par les 100 distributions de MASSEY. Pour ce

faire, l’opérateur

aura

à éliminer des droites

qui,

même si elles

compensent

"au mieux" les

points expérimentaux,

les compense en fait "très mal".

L’opérateur

aura donc à se

fixer une

règle pratique d’élimination ; naturellement,

les valeurs des diffé-

rences retenues finalement pour

remplacer

dans le cas

particulier étudié,

les

D de

K.S.,

ne seront valables que dans le cadre de la dite

règle, explicitement énoncée, règle qui,

dans ces

conditions, peut

être relativement arbitraire.

[3]

LILLIEFORS H.W . - On the KOLMOGOROV-SMIRNOV test for norma-

lity

with mean and variance unknown. Am. Statistical Ass. Journal -

1967,

pp. 393-402.

Note contenant une table

pouvant

servir à

compléter

les colonnes L de la table II pour les valeurs 03B1 =

0,10

et

0,15.

[4]

STEPHENS M.A. - Use of the

KOLMOGOROV-SMIRNOV,

Cramér-von

Mises and related statistics without extensive tables. Journal

of

the

Royal

Statistical

Society.

Série B. 32 - 1970 pp. 115-122.

Note

indiquant

pour D

(test

de

KOLMOGOROV-SMIRNOV)

et pour

DL (test

de

LILLIEFORS)

des valeurs

qui

auraient pu servir à l’établisse- ment des tables I et

II,

sauf pour 03B1 =

0,20 ;

et au

prolongement

de ces

tables pour 03B1 =

0,025.

(15)

[5] PEARSON

E.S. and HARTLEY H. - Biometrika Tables for Statisticians.

Vol. 2. 1972.

Cambridge University

Press.

Ouvrage reproduisant

dans sa table 54 les résultats de STEPHENS.

[6]

DUMAS M. - Les

épreuves

sur échantillon.

1955 ;

Centre national de la recherche

scientifique.

Ouvrage

visé au

8a et

8b,

en raison des

figures

A et B de son

n° 403 ;

ces

figures

sont d’ailleurs les

reproductions

des

figures

a et b du

42 de

l’ouvrage :

M. DUMAS et P.

MAHEU,

Les méthodes

statistiques

et ... ,

publié

par le Mémorial de l’Artillerie

Française,

dans ses fascicules de 1948 - 1949 et 1950.

[7] MORICE

E. - Tests de normalité d’une distribution observée. Revue de

Statistique Appliquée.

1972. Vol. XX

2.

En

particulier : exposé

du test L. et table de

quelques

valeurs relatives à ce test.

[8]

FERIGNAC P. - Test de

KOLMOGOROV-SMIRNOV.

Revue de Statis-

tique Appliquée.

Vol.

X, 4,

p. 13 à 32.

Ouvrage

cité

plus haut,

à propos de MASSEY

[2].

Table I. Test de KOLMOGOROV-SMIRNOV MODE D’EMPLOI

Données. xi X2 ... xi ... Xn : série de n mesures, ordonnées

xi _ 1

xi

a :

risque

de

première espèce, admis ;

F(x) :

fonction de

répartition, continue,

de la loi

hypothèse

H.

Objectif

Décider s’il convient de

rejeter l’hypothèse d’après laquelle

la série

de mesures

appartiendrait

à la loi H.

Processus.

Opérer

ainsi

qu’il

suit pour

chaque

valeur de i

- dans la

rubrique

n, lire sur la

ligne

i la valeur de

(i

-

0,5)/n,

et sur

la

ligne

a, la valeur de la différence

d ;

N.B. : les valeurs

indiquées

sont à diviser par 1000.

- faire choix de l’une des variantes suivantes :

Variante A. déterminer

F(xi), puis

retenir comme valeurs

critiques

de

(i

-

0,5)/n

les valeurs

F (xi )

± d.

Variante B. déterminer

F(xi), puis

retenir comme valeurs

critiques

de

F (xi )

les valeurs

(i

-

0,5)/n

± d.

Variante C retenir comme valeurs

critiques

de Xi’ les

quantités xi

et

xi’,

solutions de

F(x) = (i

-

0,5)/n

± d.

Décision.

Rejeter l’hypothèse,

même si pour une seule valeur de

i,

il y a

dépassement

des valeurs

critiques indiquées

par la variante

adoptée.

(16)

Table de (i -

0,5)/n,

puis table de la différence d(a , n)*

* d = D -

0, 5/n,

avec pour D les valeurs lues sur la table de MASSEY

[2].

(17)

Table II. Tests en cas de loi H normale MODE D’EMPLOI

Données. xi x2 , ... Xi i ... xn : série de n mesures, ordonnées

xi-1

xi

a :

risque

de

première espèce,

admis :

Objectif

Décider s’il convient de

rejeter l’hypothèse d’après laquelle

la série de mesures

appartiendrait

à une certaine loi normale.

Processus.

Opérer

ainsi

qu’il

suit pour

chaque

valeur de i

a)

Cas où la loi

hypothèse

est une loi normale entièrement déterminée

(m

et a

spécifiés),

et par suite il y a lieu

d’appliquer

le test de KOLMOGOROV-SMIRNOV.

- dans la

rubrique

n, lire sur la

ligne

i les

u;

et

u;’

des colonnes K intéressées :

- retenir comme valeurs

critiques

de xi

b)

Cas où la loi

normale, hypothèse,

n’est pas déterminée

(m

et a non

spécifiés),

et par suite il est

justifié d’appliquer

le test de LILLIE-

FORS :

- dans la

rubrique

n, lire sur la

ligne

i les

v;

et

vs

des colonnes L

intéressées ;

- retenir comme valeurs

critiques

de x, :

N.B. - Les valeurs

indiquées

pour les u et les v, sont à diviser par 1000.

Décision.

Rejeter l’hypothèse,

même si pour une seule valeur de

i,

il y a

dépassement

des valeurs

critiques.

Table donnant :

- Colonnes K :

u;

et

us (test

de

KOLMOGOROV-SMIRNOV),

- Colonnes L :

v;

et

vs (test

de

KOLMOGOROV-LILLIEFORS),

- Dernière colonne : ui pour i &#x3E;

0,5

n

(2e

du

n° 8a)

(Pour

i

0,5

n,

changer

le

signe

de

ui )

(18)
(19)
(20)
(21)
(22)

Références

Documents relatifs

[r]

PARTIE A : On suppose dans cette partie que la probabilité pour qu’une pièce prélevée au hasard soit conforme est égale à 0, 9.. Soit X la variable aléatoire, qui à

On suppose que le produit np

[r]

On onsidère la variable aléatoire X 2 qui, à tout prélèvement de 800 appareils, assoie le nombre d'appareils défetueux1. On déide d'approher la loi de la variable aléatoire X 2 par

Estimation des paramètres des quatre modèles de lois bidimensionnelles choisies pour le couple de variables aléatoires (TM, DVTM). TABLEAU

Les intervalles de confiance déterminés, et les tests effectués sur la variable transformée Y = log X s’appliquent aux paramètres de cette variable. Leur

Que ce soit les tirages à pile ou face (Bernoulli et de Moivre), les erreurs de mesure en astronomie (Laplace et Gauss), mais aussi la distribution des longueurs des tirs d’un