• Aucun résultat trouvé

Note sur les intervalles statistiques de dispersion

N/A
N/A
Protected

Academic year: 2022

Partager "Note sur les intervalles statistiques de dispersion"

Copied!
22
0
0

Texte intégral

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

A. V ESSEREAU

Note sur les intervalles statistiques de dispersion

Revue de statistique appliquée, tome 20, n

o

1 (1972), p. 67-87

<

http://www.numdam.org/item?id=RSA_1972__20_1_67_0

>

© Société française de statistique, 1972, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (

http://www.

sfds.asso.fr/publicat/rsa.htm

) implique l’accord avec les conditions générales d’uti- lisation (

http://www.numdam.org/conditions

). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

67

NOTE SUR LES INTERVALLES STATISTIQUES DE DISPERSION

A. VESSEREAU

Un intervalle

statistique

de

dispersion

est un

intervalle,

calculé à par- tir d’un échantillon d’effectif n, tel

qu’on puisse affirmer,

avec un niveau

de confiance fixé 1 - a,

qu’il

contient au moins une fraction p de la popu- lation dont

provient

l’échantillon. L’intervalle

dépend

des 3

paramètres

n, p, a.

L’intervalle

peut

être

bilatéral ;

il est alors limité par deux

quantités (aléatoires) 1~, Ls, appelées

"limites

statistiques

de

dispersion"; la

fraction

p

s’applique

à l’intervalle

(4, L~ .

Si l’intervalle est

unilatéral,

la fraction p

s’applique,

soit à l’intervalle

(-00, LS),

soit à l’intervalle

(4,

+3o).

On suppose que les individus constituant l’échantillon ont été

prélevés

au

hasard,

et

indépendamment,

dans une

population

normale de

paramètres (m,o).

La détermination d’un intervalle

statistique

de

dispersion

a été

étudiée,

dans le cas m et cr sont

inconnus,

notamment par :

- BOWKER dans

EISENHART,

HASTEY and WALLIS : "Selected

Techniques

of Statistical

Analysis"

Mac Graw Hill 1947

- JOHNSON and WELCH :

"Applications

of the non central t-distribution"

Biometrika 1:1

(1960)

p.

93/104

- WALD and WOLFOWITZ : "Tolerance limits for a normal distribution"

Annals of Mathematical Statistics

17 (1946)

p.

208/215

- BOWKER :

"Computation

of factors for tolerance limits on a normal dis- tribution when the

sample

is

large"

Annals of Mathematical Statistics 17

(1946)

p.

208/240

En notant x et s les estimations de m et o, l’intervalle est de la forme

x ± ks

(intervalle bilatéral)

x + ks ou x - ks

(intervalle unilatéral)

Des tables donnant

(ou permettant

de calculer

facilement)

le coefficient k se trouvent dans :

Revue de Statistique Appliquée. 1972 - vol. XX 1

(3)

68

- BOWKER dans

EISENHART,

HASTAY and WALLIS : "Selected

Techniques

of Statistical

Analysis"

Mac Graw Hill 1947

Tables pour le cas bilatéral

- OWEN : "Handbook of Statistical Tables"

Addison

Wesley

1962

Cas bilatéral et cas unilatéral

- DIXON and MASSEY : "Introduction to Statistical

Analysis"

Mac Graw Hill 1968

(3ème édition)

Cas bilatéral

- HAHN : "Statistical intervals for a normal

population"

Journal of

Quality Technology

1970 n°

3,

p.

115/25

Cas bilatéral et cas unilatéral

Par

contre,

nous n’avons trouvé nulle trace dans la littérature du cas

un seul des deux

paramètres,

m ou cr, est inconnu.

(Lorsque

les deux

paramètres

sont connus, les intervalles sont des in- tervalles certains : intervalle unilatéral m +

ui_p

a, ou m -

u 1-P (y

inter-

valle bilatéral m ±

u~ cy).

2

Dans cet article :

- on

rappelera

le

principe

de la détermination d’un intervalle

statistique

de

dispersion lorsque

m et o sont

inconnus,

et l’on donnera des tables

simplifiées,

suffisantes pour la

plupart

des

applications pratiques,

- on étudiera le cas un seul des

paramètres

est inconnu.

1 - INTERVALLES

STATISTIQUES

DE

DISPERSION,

m et cr INCONNUS

Les estimations de m et cr sont x et

1.1 - Intervalle unilatéral

La limite

Ls

= x +

ks, (ou Li -

X -

ks)

est telle que, dans la distri- bution normale

(m, C),

l’aire

(A)

soit au moins

égale

à p, avec une pro- babilité 1 - ex .

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(4)

69

F

désignant

la fonction de

répartition

de la variable normale réduite.

Le coefficient k est donc défini par la relation :

En

désignant

par u la variable normale

réduite,

et par

X(v)

la varia- ble X à v - n - 1

degrés

de

liberté,

cette relation s’écrit :

soit

ou encore

est la variable t

décentrée,

à v

degrés

de liberté et

paramètre

de décentrement

égal

à

-V n up.

D’où :

D’où l’on tire :

t~

étant le fractile d’ordre a de la variable t décentrée.

On trouvera en annexe 1 une table des valeurs de k pour p =

0, 90 ; 0,95 ; 0, 99

et 1 - a =

0, 95 ; 0,99 (d’après Owen, op.cit).

1. 2 - Intervalle bilatéral

Les limites

Li =

x -

ks, LS -

x + ks sont telles que :

D’où:

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(5)

70

On notera que l’intervalle ainsi défini est

symétrique

par rapport

àx,

mais

qu’il

n’est pas

symétrique

en

probabilité :

il

n’y

a pas une

proportion

1 2 p

à

gauche

de

Li

et une

proportion 201320132013

à droite de Ls.

Pour n &#x3E;

10,

Hald

(Statistical Theory

with

engeneering applications)

donne pour k

l’expression approchée ci-après :

X~(~)

étant le fractile d’ordre a de la variable X à v = n - 1

degrés

de

liberté.

On trouvera en annexe 2 une table des valeurs de k pour p =

0, 90 ; 0,95 ; 0, 99

et 1 - a =

0,95 ; 0,99 (d’après Bowker, op. cit).

Nota - Owen et

Fawley

ont calculé des intervalles bilatéraux tels que

simultanément,

au niveau de confiance 1 - a, une

proportion

au

plus égale

à

pl

soit inférieure à x -

kls

et une

proportion

au

plus égale

à

P2

soit su-

périeure

à x +

k2s.

Pour

p - P~ = 2013r~ ~

obtient ainsi des intervalles

symétriques

en

probabilité

et par

rapport

à x. Ces intervalles sont

légère-

ment

plus grands

que les

précédents (Owen

and

Frawley :

"Factors for tole-

rance limits which control both tails of the normal distribution". Journal of

Quality Technology

1971 2 p.

69/79).

2 - INTERVALLES

STATISTIQUES

DE

DISPERSION,

m

CONNU,

T INCONNU

La moyenne étant connue, l’estimation de ~ est

2.1 - Intervalle unilatéral

La relation

(1)

dans

laquelle

x est

remplacé

par m donne immédiate- ment :

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(6)

71

Les valeurs de k s’obtiennent facilement à l’aide d’une table des frac- tiles de la variable

~,(v)/1~ (par exemple : Hald,

Statistical Tables and For-

mulas).

Elles sont données en Annexe

(Table 3).

2.2 - Intervalle bilatéral

La relation

(3)

ou x est

remplacé

par m, donne

Là encore, les valeurs de k s’obtiennent facilement à l’aide d’une ta- ble des fractiles de la variable

X(~)/B~T

Elles sont données en Annexe

(Ta-

ble

4).

On notera que,

lorsque

m est connu, l’intervalle est

symétrique

en

probabilité -

La valeur de

k,

bilatéral pour une

proportion

p, est

égale

à

la valeur de k unilatéral pour une

proportion 1 + p

2

3 - INTERVALLES

STATISTIQUES

DE

DISPERSION,

m

INCONNU,

o CONNU

Les intervalles sont de la forme x ± k6 3.1 - Intervalle unilatéral

La relation

(1)

dans

laquelle

s est

remplacé

par a donne immédiate- ment :

Les valeurs de k sont données en Annexe

(Table 5).

3.2 - Intervalle bilatéral La relation

(3)

s’écrit :

Revue de Statistique Appliquée. 1972 - vol. XX 1

(7)

72

Les valeurs de k

qui

satisfont à cette relation

(Table

6 de

l’Annexe)

ont été calculées de la

façon

suivante :

Posant :

cette relation s’écrit :

Développant H(u)

en série de

Taylor,

on

trouve,

par un calcul

qui

ne

présente

pas de difficultés

D’où la relation :

La résolution de cette

équation

en

k,

pour différentes valeurs de n

(on

ne considérera que les valeurs au moins

égales

à

5),

et pour les dif- férentes situations

(p = 0,90 ; 0,95 ; 0,99), (1 -

cx -

0,95 ; 0,99), peut

s’effectuer en cherchant des valeurs

approchées

de k à

partir

du seul ter-

me en

U2,

ces valeurs étant ensuite améliorées en tenant

compte

du terme

en

(U2)2

et éventuellement du terme en

(u2)3.

Lorsqu’on

limite le

développement

du terme en

U2,

la relation

(8)

s’écrit :

Revue de Statistique Appliquée. 1972 - vol. XX 1

(8)

73 d’où l’on déduit :

(U2) l..aétant

le fractile d’ordre 1 - a de la variable

u 2 (variable X2

à 1

degré

de

liberté).

Il est

plus

commode

d’exprimer

n en fonction de k :

La

plus petite

valeur de k est

1,645, qui correspond

à p =

0, 90

et

n =00. En donnant à k des valeurs

espacées

de

0, 01 (1, 65 ; 1, 66 ; 1, 67,.. )

on détermine des valeurs de n

qui,

inversement fournissent des valeurs ap-

.prochées

de k pour

n = 5, 6,

7, ....

Lorsqu’on

introduit le terme en

(U2) 2 la

relation

(9) prend

la forme

Ayant

calculé les valeurs

approchées

de k à

partir

de la relation

(9) ,

on les améliore au moyen de la relation

(11).

Au-dessus d’une certaine va-

leur de n, le terme correctif

figurant

dans

(11)

devient

négligeable.

Enfin, lorsqu’on

tient

compte

du terme en

(u2)3Ia

relation

qui

déter- mine k s’écrit :

On constate en fait que l’introduction du terme en

(U2)3

n’a pour effet que de modifier

légèrement

la 2ème décimale de

k,

et

uniquement

pour les

plus

faibles valeurs de

n(n 10).

Cette méthode de détermination des valeurs du coefficient k est assez

laborieuse. Je dois à M. MORLAT la méthode

ci-après qui

est

plus

sim-

ple (et

aussi

plus satisfaisante).

La relation

qui

définit k est :

u est la variable normale réduite.

Revue de Statistique Appliquée. 1972 - vol. XX 1

(9)

74 Posant

on constate que la variable aléatoire

Z(u)

est une fonction

paire

de u, et que,

lorsque

u croit de 0 à +00~

Z(u)

est constamment décroissant

(de 2F(K)

- 1 à

0).

Il en résulte que le

quantile

d’ordre a de u est :

et la relation

(13)

s’écrit :

Les valeurs de k - pour les différentes combinaisons

(p,

a,

n)

peu- vent donc s’obtenir à

partir

d’une table de la fonction de

répartition

de la

variable normale réduite.

On observe aussi que k est le même

(p

étant

fixé)

pour les valeurs de a et n telles que

reste constant. Pour les valeurs de a , a =

0,05

et a =

0,01,

on a :

On a donc la même valeur de k pour n et a =

0, 05,

et pour n’ =

1, 73

n

et ex =

0,01 -

par

exemple

n =

10,

n’ = 17 - n =

20,

n’ = 35 - etc.. ,

comme on

peut

le constater sur la table des valeurs de k.

4 - TABLEAU RESUME DES VALEURS DE k SOUS LES DIFFERENTES HY- POTHESES ENVISAGEES

Le tableau

ci-après permet, notamment,

de constater l’influence sur

la valeur de

k,

de la connaissance de l’un des

paramètres,

m ou ci, de la distribution. La

comparaison

de ces situations

peut

être faite de

façon plus complète

sur les 6

graphiques

donnés en Annexe.

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(10)

75

Revue df Statistique Appliquée. 1972 - vol. XX N° 1

(11)

76 Table 1

Intervalle

statistique

de

dispersion

unilatéral m, 6 inconnus

valeurs du coefficient

k(n, p

1 -

a )

Revue de Statistique Appliquée. 1972 - vol. XX 1

(12)

77 Table 2

Intervalle

statistique

de

dispersion bilatéral,

m, 6 inconnus

valeurs du coefficient

k(n, p,

1 -

a)

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(13)

78 Table 3

Intervalle

statistique

de

dispersion unilatéral,

m connu, o inconnu

valeurs du coefficient

k(n,

p, 1 -

oc)

Revue de Statistique Appliquée. 1972 - vol. XX 1

(14)

79 Table 4

Intervalle

statistique

de

dispersion bilatéral,

m connu, cr inconnu

valeurs du coefficient

k(n, p,

1 -

a)

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(15)

80 Table 5

Intervalle

statistique

de

dispersion unilatéral,

m

inconnu,

a connu

x + ka ou x - ka

valeurs du coefficient

k(n, p,

1 -

a)

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(16)

81 Table 6

Intervalle

statistique

de

dispersion bilatéral,

m

inconnu,

a connu x f ka

valeurs du coefficient

k(n, p,

1 -

o)

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(17)

82 Revue de Statistique Appliquée. 1972 - vol. XX 1

(18)

83

Revue de Statistique Appliquée. 1972 - vol. XX 1

(19)

84 Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(20)

85

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

(21)

86 Revue de Statistique Appliquée. 1972 - vol. XX 1

(22)

87

Revue de Statistique Appliquée. 1972 - vol. XX N° 1

Références

Documents relatifs

Le

Si l'on en croit Jesse Fox, auteur principal d'une étude et professeur assistante en communication à l'Université de l'Ohio, les hommes qui publient beaucoup de selfies sur

Les élèves ne disposant pour l’instant que d’informations qualitatives sur l’énergie potentielle et l’énergie cinétique d’un système, le but de

Mais dans les deux cas la valeur du coefficient de 5^ est très-faible et n'influe pas sur la valeur de l'indice de la quantité 0,00470 pour les plus grandes longueurs d'onde; en

3- Ne cessant d’améliorer notre commande, nous avons constaté qu’un phénomène d’oscillation de l’eau autour d’un niveau provoque de nombreux démarrage et arrêt

Ce scénario décrit les processus qui surviennent lors des interventions de maintenance précédant généralement un avis de panne pour un objet technique (vous avez également

On décompose le volume du liquide en rotation en couronnes cylindriques de rayon r, d’épaisseur dr et de hauteur z(r). Exprimer le volume dV d’une telle couronne. En supposant que

Elle est d’autant plus importante que la masse de la charge est grande et s’oppose à la mise en mouvement. Elle est caractérisée par le moment d’inertie J, qui s’exprime en