R EVUE DE STATISTIQUE APPLIQUÉE
W LODZIMIERZ K RYSICKI
La variance empirique peut-elle être égale à zéro ?
Revue de statistique appliquée, tome 13, n
o2 (1965), p. 83-94
<
http://www.numdam.org/item?id=RSA_1965__13_2_83_0>
© Société française de statistique, 1965, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LA VARIANCE EMPIRIQUE PEUT-ELLE ÊTRE ÉGALE A ZÉRO?
Wlodzimierz KRYSICKI École Polytechnique de Lodz
Dans tous les
problèmes
concernant desmensurations,
les gran- deurs mesuréespeuvent prendre
toutes les valeurs d’un certain intervalle.Cependant,
étant donné que, pour les diversesmensurations,
onadopte
des unités données ou,
souvent,
à la suite de l’exactitude limitée dechaque
mensuration, nous attribuons auxgrandeurs
mesurées des va-leurs
arrondies ;
par ex. si nous mesurons certaineslongueurs
avecune
précision
de1/2
mm en"arrondissant"
les résultatsjusqu’aux
mil-limètres
entiers,
nous n’obtiendrons que des nombres entiers.Il
peut
donc arriverqu’en
effectuant n mensurationsindépendantes
avec la même exactitude de moitié d’une certaine unité et en arrondis- sant le résultat obtenu
jusqu’à
un nombre entier de cesunités,
nous ob- tenions n résultatsidentiques :
L unités, tandisqu’en
réalité nous pouvons être sûrs seulement que les véritablesgrandeurs
inconnuesl1, l2, ... ln,
satisfont
l’inégalité
S’il en est
ainsi, li
= Lquel
que soiti,
la varianceempirique
calculée
S2 e
seraégale
àzéro,
la varianceempirique
exacte définie parS 2 h 1 (ij - l)2
demeurant inconnue.Cette étude a pour
objet
de calculer laprobabilité qu’en adoptant
une certaine exactitude constante pour chacune des n mensurations toutes ces mensurations donneront le même résultat, c. à. d. que la variance em-
pirique
seraégale
à zéro.Nous étudierons ce
problème séparément
pour les distributions deprobabilité
suivantes :1/
uniforme(rectangulaire), 2 /
normale3/
normaletronquée
unilatéralement etbilatéralement,
4/ triangulaire.
§
1. CAS DE LA DISTRIBUTION RECTANGULAIRE.Admettons
qu’étant
donné l’unité de mesureadoptée
les résultats des mensurations nepeuvent
donner que les nombres84
c. à. d. des nombres de forme a +
ih,
où h >0,
i = 0,1,
...k,
la limitesupérieure
de la valeur absolue de l’erreur danschaque
mensuration étantégale à h ;
alors nous savons seulement que lagrandeur
réellequi
a donné comme résultat de la mensuration a unités est contenue entre
a - f h
et a+ 1 h,
et que lagrandeur
réelle dont la mensuration a donné le résultat a + kh est contenue entre a+ kh - 2
et a + kh+ 2 .
Donc la dif- férence entre laplus grande
et laplus petite grandeur
réellepeut
être dea + kh + h 2 -(a - 1 2 h) = (k + 1) h,
c. à. d. k + 1 intervalles delongueur
h.
La
probabilité
que ngrandeurs indépendantes,
variant defaçon
con-tinue dans l’intervalle
prendront,
dans un des(k
+1)
intervallesdisjoints,
les valeursen admettant une distribution de
prababilité rectangulaire, (uniforme)
estégale
à :C’est donc avec une telle
probabilité
que, dans les conditions consi- dérées la varianceempirique
s seraégale
à zéro.Dans le tableau suivant on a
présenté
laprobabilité
pexprimée
en%
pour n =2, 3,...,
10 et k =1, 2,
... , 9.* L’intervalle [c, d) désigne un intervalle fermé à gauche et ouvert à droite c.à.d. un
ensemble de nombres satisfaisant l’inégalité c x d.
Revue de Statistique Appliquée. 1965 - Vol. XIII - N’ 2
§
2. DISTRIBUTIONNORMALE.
Si la variable aléatoire suit la loi de
Laplace-Gauss
de moyennem et de variance 62, la
probabilité
de satisfairel’inégalité :
est
égale
à :En
posant
nous obtenonsLa
probabilité
que nvariables aléatoiresindépendantes
x , i = 1,2,
... n, dont chacune suit’la loi deLaplace-Gauss
de moyenne m de variance C52,prendront
des valeurs dans le même intervallexo - h 2 xi
xo+ h 2,
i =
1, 2,..., n est égale
àLa
probabilité
que les ngrandeurs
citées soient contenues dans unquelconque
des intervallesdisjoints
où l
peut
varier de - w à +00 enpassant
par tous les nombresentiers, s’exprimera
par la formuleChurchill Eisenhart dans
"Effects
ofRounding
orGrouping Data" (1) présente
le tableau suivant des valeurs de laprobabilité
que la varianceempirique
de n mensurationsindépendantes "arrondies"
d’une distribution normale soitégale
à zéro.Nombre des
observations Longueur
de l’intervalleexprimée
enécarts-types
observations
86
Si nous posons
n = h 03C3,
les conditions suffisantes depossibilité d’ap- pliquer
ce tableau sont :Eisenhart
suggère
comme indicationgénérale
que l’unité dont on se sert dans les mensurations soit inférieureà 03C3 3 ou
même à03C3 4.
Le calcul de la valeur exacte de
l’expression (II) présente
des dif- ficultés. Nous pouvons obtenir uneapproximation
tout à fait suffisante pour des finspratiques
de lafaçon
suivante. Ncusremplaçons
d’abordl’intégrale
entreparenthèses
par leproduit
de lalongueur
de l’intervalled’intégration bi 03C3 - ai 03C3 h
la valeur de la fonction àintégrer
en uncertain
point
x e intérieur à cet intervalle et nous obtenons :En écrivant cette
expression
sous la forme :et en la
remplaçant
par la valeurapproximative
de la somme des inté-grales,
on obtient :qui
à son tour estégale
à :En calculant la dernière
intégrale
nous obtenons enfin comme valeurapproximative
Pour n = 1 cette formule
approchée,
donne p = 1, cequi
est évi- dent.Revue de Statistique Appliquée. 1965 - Vol. XIII - N’ 2
Voici les résultats obtenus
d’après
la formuleapprochée (II *)
pourquelques
valeurs consécutives de nEn
comparant
les valeursapproximatives
calculées selon les for- mules données pourp , p,... (des
résultats voisins avec une exactitude de 4 chiffressignificatifs,
pour n =2, 3, 4, 5,
6 sont donnés par U. Graf et H. J.Henning [2]
avec les valeursprésentées
dans le tableau(A)
nousconstatons que les différences entre les valeurs
correspondantes
rarementatteignent
1%.
Dans lamajorité
des cas elles sont notablementplus
pe- tites.Les
représentations graphiques
de la variabilité de ces fonctions dans le réseau doublelogarithmique
sont deslignes
droites. Lafigure
1présente
ces droites pour les valeurs durapport
x- h
allant de x =0,
025 à x =2,
5exprimant
p(i = 2,
... ,10)
en% ;
nous remarquerons en mêmetemps
que lapartie
de lafigure
1depuis
la valeur de Kégale
à peuprès
à 1 à x =
2,
5 n’a pasd’importance pratique
et n’a étéprésentée
que pour rendrecompte
du cours deslignes
droites.Remarquons
enfin que dans l’intervalle limité aux valeurs m - 3 6 et m + 3o seplacent 603C3 h = 6 x
unités de mesure.§
3. DISTRIBUTIONNORMALE,
UNILATERALEMENT ET BILATERA- LEMENTTRONQUEE.
Lorsque
la variableprend
les valeurs de l’intervalle a xb,
dans une distribution normale bilatéralementtronquée
de moyenne m et de variancea2,
sa densité deprobabilité
est : -pour
a x b, ~(x) = 0
pour x a et pour x >b,
88
oùFigure 1 - rapport de l’unité de mesure à l’écart type.
La forme des courbes
cp (x)
varie en fonction desparamètres
m, 0 et des limites de l’intervallea, b ; cependant indépendamment
de cela cesont des arcs de la courbe de
Laplace-Gauss
dont les ordonnées ont étémultipliées
partandis que les abscisses des extrémités de l’arc sont les valeurs a et b. Ces arcs n’auront un axe de
symétrie
quelorsque
l’on a 2m = a + b . Les écarts parrapport
à la forme de la courbe deLaplace-Gauss
serontimportants
si lalongueur
de l’intervalle b - a est considérablementplus petite
que l’intervalle delongueur 6o*.
Si,
en mesurant certainesgrandeurs
suivant la distribution normale bilatéralementtronquée
nous ne pouvons obtenir dans les conditions dé- crites au débutdu §
1 que les nombres suivantsa, a +
h,
a +2 h, ... ,
a +kh,
ce
qui
veut dire que lesgrandeurs
mesurées x, étant donné laprécision
des
mensurations, peuvent
être effectivement contenues dans l’intervalle* Le travail exhaustif de N. A. Borodaczew [3] présente de nombreux détails à ce sujet
ainsi que de nombreux dessins des courbes cp (x) définies par la formule (3).
Revue de Statistique Appliquée. 1965 - Vol. XIII - N· 2
la
probabilité PL-Gtr.2,
que les n résultats des mensurations x se trouve- ront dans un même intervalle(quelconque)
étant donné le raisonnement
précédent (§2)
et la formule(3),
seraégale
à :
où
Pour une valeur finie de n avec a1 = -~,
bl =
+00, et par la mêmeavec l’indice i variant de - oo à +00 nous obtenons de la formule
(III)
laformule
(II).
PL-Gtr.2
est laprobabilité
pour que la varianceempirique sé
de nmensurations
indépendantes "arrondies"
soitégale
à zéro dans ce cas.La densité de
probabilité
d’une distribution normale unilatéralementtronquée,
de moyenne m et de variancea 2 pour
la variableprenant
lesvaleurs de l’intervalle
a x + co
sera obtenue comme cas
particulier
de la formule(3)
en y faisant b = +00 ; on obtient alorsPour une distribution normale unilatéralement
tronquée
dont la den-sité de
probabilité
est donnée par la formule(5),
laprobabilité
que n mensurationsindépendantes
seront contenues dans unquelconque
des in-tervalles
pour i
prenant
toutes les valeurs entières nonnégatives s’exprimera
par la formule90
oùDans ce cas nous pouvons encore
remplacer
la formule exacte(IV),
difficile à
appliquer,
par une formuleapprocher.
Enappliquant
à la som-me des nèmes
puissances
du second membre de la formule(IV)
les trans-formations
déjà
utilisées pour obtenir la formule(II )
nous obtenons :Puis nous
procédons
auchangement
de variable vnt = u, nous ob- tenonsExprimant
la dernièreintégrale
parl’intégrale
deLaplace
définiepar la formule
(4),
nous obtenons au lieu de la formule(IV)
la formuleapprochée
suivante :§
4. DISTRIBUTION TRIANGULAIRE.Supposons
que la variable aléatoire suit la loi de la distributiontriangulaire (selon
letriangle isocèle)
dans l’intervalledonc dans l’intervalle de
longueur (k
+1)
h. La densité deprobabilité
sera alors donnée par la formule
pour
pour
Remarquons qu’il
faut ici considérer 2 cas selon que le nombre des intervalles k + 1 estpair
ouimpair.
Revue de Statistique Appliquée. 1965 - Vol. XIII - N’ 2
Cas 1. Le nombre k des valeurs
possibles
a +(u - 1) h,
u =1, 2,...
k des mensurations obtenues estimpair,
c. à. d. le nombre des intervalles k + 1 estpair
soit:Nous avons BD =
rh, AD = 1 (figure 2).
rh
Fig. 2
La
probabilité
que la variable aléatoire soumise à la distributionenvisagée
soit contenue dans un intervalle delongueur
hest
égale
à la surface dutrapèze
de rang(i
+1).
Cette surface estégale
à2i+1 2r2,
et laprobabilité que
n variables aléatoiresindépendantes prennent
des valeurs arbitraires de l’intervalle(7)
estDonc pour obtenir la
probabilité
que n variables aléatoires indé-pendantes prennent
des valeurs arbitraires dans unquelconque
des inter- vallesdisjoints (7)
pour i =0,
1.., 2r - 1, il faut additionner les valeurs(8)
pour i =0,
1, ... , r-1, et ensuitemultiplier
par 2.Nous obtiendrons alors
Pour une valeur entière arbitraire r > 0 avec n = 1 nous obtenons de cette formule
Ptriang. = 1 (en
effet la somme des nombresimpairs
con-sécutifs allant de 1 à 2r - 1 est
égale
àri),
92
Pour n = 2 et pour n =
3,
en vue d’un calculplus rapide,
nouspouvons
appliquer
les formules suivantesLa formule
générale
pour la somme des n èmespuissances
des nom- bresimpairs
consécutifs àpartir
de 1 est la suivante :le dernier terme contient r ou
r2,
selon que n estpair
ouimpair ;
lesnombres
B2, B4, B6, ... sont
les nombres de Bernoulliapparaissant
comme coefficients dans le
développement
de la fonctionLes
quelques premiers
nombres de Bernoulli ont les valeursLe tableau suivant donne
quelques
valeurs dePtr i ang.
pour r =1, 2 ,
..., 10 ; n =
2, 3,
..., 8(probabilités
en%)
Cas 2. Le nombre k des valeurs
possibles
a +(u - 1) h,
u =1, 2,
...,k
obtenues des mensurations estpair,
c. à. d. le nombre desintervalles,
k + 1 estimpair.
Soit k = 2s. Alors BC =
(2 s
+1)h,
doncBD = (s +1 2)h, (figure 3)
Revue de Statistique Appliquée. 1965 - Vol. XIII - N’ 2
Fig. 3
La
probabilité
que n mensurationsindépendantes
soient alors con-tenues dans un même intervalle défini par
l’inégalité
est
égale
àPour calculer la
probabilité
que n mensurationsindépendantes
soientcontenues dans un
quelconque
des intervallesdisjoints (12),
il faut addi- tionner les valeurs(13)
pour i =0,
1, ..., s-1 ; nous obtiendrons alorsIl faut encore calculer la
probabilité
que n mensurationsindépen-
dantes soient contenues dans l’intervalle médian
EG,
c. à. d. calculer la surface dupentagone
EFAHG et ensuite calculer sa nèmepuissance.
Cettesurface calculée comme surface de deux
trapèzes égaux
estégale
à :Donc en
multipliant (14)
par 2 et en additionnant(15)
nous obtenonsla
probabilité
cherchée.Pour une valeur entière arbitraire s avec n =
1,
de la formule(VI)
nous obtenons
Ptriang. =1, ce qui
est évident. La manière de calculer lasomme des nèmes
puissances
des nombresimpairs
consécutifs àpartir
de1 est donnée par les formules
(9), (10)
et(11).
Le tableau suivant donne
quelques
valeurs de laprobabilité Ptr.
pour
n = 2, 3,...,
8 et pour s =1, 2,
..., s,exprimée
en%
94
REFERENCES[1]
EISENHART CHURCHILL - Effects ofRouding
orGrouping
Data. Se-lected
Techniques
of StatisticalAnalysis.
StatisticalResearch Group.
Columbia
University
1947.[2]
GRAFU. ,
HENNING H. J. - Der Einfluss derMessgenaurgkeit
aufStrenning Spannweite
bei kleinenStichproben, Misseilungs
für mot-hematische Statistik
1951,
2.[3]
BORODATCHEV N. A. - Lesproblèmes principaux
de l’exactitude de laproduction
Académie de l’U. R. S. S.Moscou-Leningrand
1950(en russe).
Revue de Statistique Appliquée. 1965 - Vol. XIII - N’ 2