R EVUE DE STATISTIQUE APPLIQUÉE
A. V ESSEREAU
Intervalles de confiance et tests dans le cas de changement de variable cas de la loi log-normale
Revue de statistique appliquée, tome 21, n
o1 (1973), p. 59-66
<http://www.numdam.org/item?id=RSA_1973__21_1_59_0>
© Société française de statistique, 1973, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
INTERVALLES DE CONFIANCE ET TESTS DANS LE CAS DE CHANGEMENT DE VARIABLE
CAS DE LA LOI LOG-NORMALE
A. VESSEREAU
Le calcul des intervalles de confiance et les tests
classiques
decomparaison
de moyennes et de variances s’effectuent de
façon particulièrement simple
lors-que la variable étudiée est distribuée suivant une loi normale.
Lorsqu’il
n’en est pas ainsi il est souvent conseillé de rechercher unchange-
ment de variable Y =
~(X) permettant
de "normaliser" la distribution : les mé- thodesclassiques pourront
alors êtreappliquées
à la variable Y. Mais on s’abstienttrop
souvent de dire si et comment les résultats obtenus sur Ypeuvent
être ap-pliqués
à la variable initiale X. Parexemple,
les limites d’un intervalle de confiance d’unparamétre
de Y(moyenne, écart-type)
étantLi
etLs’ peut-on
en déduireque pour le
paramètre correspondant
dans la loi deX,
les limites sont~-1(Li)
et
~-1 (Ls) ? Quelques
articles traitant de cettequestion
sont cités dans la biblio-graphie figurant
à la fin de cette note.Dans celle-ci on se propose d’étudier ce
problème lorsque
la loi de X est uneloi
log- normale.
1. POSITION DU PROBLEME
La variable X est distribuée en loi
log-normale,
avec uneespérance
mathé-matique E(X)
=m.,
et unécart-type 0 x .
Les estimations
ponctuelles (sans biais)
dem
et02,
calculées àpartir d’un
échantillon de n valeurs x.
sont
x=---1.
ets2 - 1 Z(x. 2013 x)2.
Si l’on a deux
échantillons, correspondant
à des distributions deparamètres
(mx, 03C3x) et (m’x, 03C3’x) :
l’estimation
(sans biais)
de m - m’ est x - X’02 S2
La variable Y =
loge
X est distribuée en loinormale,
avecl’espérance
mathé-tique E(Y)
=my
etl’écart-type 0 .
*o
En
posant Cx = ’ (coefficient
de variation deX),
on a, entre lesparamètres mx
des lois de X et de
Y,
les relations suivantes :L’échantillon
"associé"
auxxi :
:YI y2 ,
... , 1Yn (avec Yi = log xi)
apour moyenne
arithmétique 00FF
et la variance estimée ests2v = 1 103A3
y n - 1 i(Yi - y)2
1Dans
quelles
conditions les informationsapportées,
par l’échantillon desyl,
sur les
paramètres
de la loi de Y sont-elles utilisables pour lesparamètres
de lavariable initiale X ?
2. INTERVALLES DE CONFIANCE
On ne considérera que les intervalles
bilatéraux, symétriques
enprobabilité,
au niveau de confiance 1 - of.
2.1. Intervalle de confiance de la moyenne
Lorsque l’écart-type o
est connu(ce qui implique, d’après (4),que
le coef-ficient de variation
Cx
est connu, cequi paraît
être un cas trèsexceptionnel),
les limites
L et L s
de l’intervalle demy
sont :u1-03B1/2
étant lequantile
d’ordre 1- 03B1 2de
la variable normale réduite.Lorsque o
inconnu est estimé parsy ,
on a :t1-03B1/2
étant lequantile
d’ordre 1- =de
la variable t à v = n - 1degrés
deliberté. 2
De la relation
on
déduit, compte
tenu de(3) :
Il en résulte que
eL’, e S
ne constituent(approximativement)
des limitesde confiance de mX - d’ailleurs non
symétriques - qu’à
la condition que le coef- ficient de variationCx
soitpetit.
2.2. Intervalle de confiance de la variance
(de l’écart-type)
Les limites de l’intervalle de confiance de
03C32y
sont :x203B1/2
étant lequantile
d’ordrea/2
de la variableX2
à v = n - 1degrés
de liberté.De la relation
on
déduit, compte
tenu de(4) :
sont des limites de
confiance,
non dea2 x mais
desont des limites de confiance du coefficient de variation
Cx .
2.3. Intervalle de confiance de la différence de deux moyennes
a)
Si l’on suppose connus lesécarts-types Qy , 1 a’ y (ce qui
entraîne que lescoefficients de variation
C., Cl
sontconnus)
on a, pour la variableY,
enposant
entraîne :
d’où, compte
tenu de(3)
Si les coefficients de variation
C x
etC’ x
sontégaux, (d’où o
= a’y ), eL’, é S
sont des limites de confiance exactes, non de la différence
mx - m’x
maisdu rap-
port mx/m’x. Si,
sans êtreégaux,
ils sontpetits
tous lesdeux,
ce sont des limites de confianceapproximatives.
b)
Si lesécarts-types a
et0’ y
sont inconnus etsupposés égaux,
cela revient à supposer que les coefficients de variationCx , C’x
sontégaux.
Dans les expres-sions de
Li
etLS
onremplace
u par t(v
= n + n’ - 2degrés
deliberté) et ad par
son estimation
sd .
On a alors :de sorte que
eL’,
ieLs
s sont des limites de confiance exactes pour lerapport r-" .
de sorte que
e ’,
ex sont des limites de confiance exactes pour lerapportm’x m’x.
*2.4. Intervalle de confiance du
rapport
de deux variances Les limites de confiance deCr2 /U,2
sont :F1-a/2 (n - 1, n’ -1 )
étant lequantile
d’ordre1 -2" de
la variable F à v = n -1 ,
v’ = n’ -1
degrés
de liberté.entraîne, d’après (4) :
Si les coefficients de variation
Cx , C’x
sontpetits
tous lesdeux,
on aapproxi-
mativement :
r r-2 1
Li, Ls
sont des limites de confiance(approximatives),
non durapport
des va- riancesaX /QXZ
mais durapport
des carrés des coefficients devariation C2/C’2;
Li
etB/U
sont des limites de confiance(approximatives)
durapport Cx/C’x.
On remarquera que
Cx - C’x
entraînerait que l’on a defaçon
certaine03C32y = 03C3’2y,
d’oùL. = LS -
1 pour lerapport 03C32y/03C3’2y.
3. TESTS D’HYPOTHESE
Là encore on ne considèrera que des tests
bilatéraux, symétriques
enproba-
3.1. Test de
comparaison
d’une moyenne à une valeur donnéeL’hypothèse (Ho) mx -
a, a étant un nombredonné,
nepeut
être testée di- rectement àpartir
des résultatsxi.
Par
contre,
on sait(cf. (3)
et(4))
que, sousl’hypothèse (Ho)
y est distribuéenormalement avec
la moyenne
la variance
Cette distribution
dépend
deC;.
Le test nepeut
donc être effectué que sil’on connaît le coefficient de variation de X. S’il en est
ainsi,
la condition derejet
de
l’hypothèse (Ho)
est3.2. Test de
comparaison
d’une variance à une valeur donnéeL’hypothèse (Ho )
estU2 x = A2 , A2
étant une valeur donnée. Sous cettehypothèse (cf. (4))
laquantité
est distribuée en loi de
X2
à v = n - 1degrés
de liberté. Comme elledépend
dem.,
le test nepeut
être effectué que si la moyenne de la distribution de Xestconnue. S’il en est
ainsi, l’hypothèse (Ho )
estrejetée
si cettequantité
est infé-rieure à
X203B1/2(n - 1)
ousupérieure
àX21-03B1/2 (n-1).
Par
contre,
s’ils’agit
de testerl’hypothèse
del’égalité
du coefficient de varia- tion de X à une valeur donnéeC,
le testpeut
être effectué àpartir
deL’hypothèse Cx =
C estrejetée si(n - 1)s2y loge(1 + C2) est extérieur à l’intervalle
3.3. Test de
comparaison
de deux moyennesL’hypothèse (Ho)
estmx - m’x = 0, qui
estéquivalent
àou encore,
d’après (3) :
Ce test ne
peut
donc être effectué que siCx
etC’x
sont connus.S’il en est
ainsi,
enposant l’expression :
suit la loi normale réduite.
L’hypothèse (Ho)
estrejetée
si cetteexpression
estextérieure à l’intervalle ±
03BC1-03B1/2.
Lorsque
les coefficients de variationCx
etC’x
sontégaux, l’expression pré-
cédente
prend
la formeplus simple :
3.4. Test de
comparaison
de deux variancesL’hypothèse (Ho)
est03C32x
=0’; .
suit la loi de F à v = n -
1,
v’ = n’ - 1degrés
de liberté.Cette
propriété
nepeut
être utilisée pour le test del’hypothèse (Ho)
quesi les moyennes
mx, mX
sontégales. Lorsqu’il
en estainsi, S2 /s’2y suit,
sousl’hy-
pothèse (Ho)’
la loi deF(n - 1 ,
n’ -1). L’hypothèse (Ho) est rejetée
sis2y/s’2y
est extérieur à
l’intervalle 1 F1-03B1/2(n’ - 1, n - 1)’ F1-03B1/2(n-1,n’-1). , F1- 0l/2 (n - 1, n’ - 1).
Par
contre,
s’ils’agit
de testerl’hypothèse
del’égalité
des coefficients de variationC., C’x,
lerapport
des variancess2y/s’2y
suit la loi deF,
si cettehypo-
thèse estvraie,
cequi permet
d’effectuer le test.4. CONCLUSION
Les intervalles de confiance
déterminés,
et les tests effectués sur la variable transformée Y =log
Xs’appliquent
auxparamètres
de cette variable. Leur inter-prétation
en terme desparamètres
de la variable X estparfois possible (pas
tou-jours),
sous certaines conditions. Dans certains cas(par exemple,
intervalle de confiance ou test relatif à unemoyenne)
celles-ci sont très restrictives etpeuvent
limiter fortement l’intérêt du
changement
de variable.BIBLIOGRAPHIE
FINNEY. - On the distribution of a variate whose
logarithm
isnormally
dis-tributed. Journal of the
Royal
StatisticalSociety (B) 7,
1941 p.155/61.
NEYMAN and SCOTT. - Correction for bias introduced
by
a transformation of variables. Annals of Mathematical Statistics31, 1960,
p.643/55.
DAGNELIE. - A propos des transformations de variables. Biométrie-Praximé-
trie 6,
1965 p.59/78.
DAGNELIE. - Relation entre le coefficient de variation