B. L ECOUTRE
H. R OUANET
Deux structures statistiques fondamentales en analyse de la variance univariée et multivariée
Mathématiques et sciences humaines, tome 75 (1981), p. 71-82
<http://www.numdam.org/item?id=MSH_1981__75__71_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1981, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
DEUX STRUCTURES
STATISTIQUES FONDAMENTALES
EN ANALYSE DE LA VARIANCE UNIVARIEE ET
MULTIVARIEE*
B.
LECOUTRE ** H. ROUANET ***
1. INTRODUCTION
Cet article sera consacré à deux structures
statistiques
que l’on rencontre constamment enanalyse
de lavariance,
univariée et multivariée : la struc- ture "multinormale - kh.i-deux" et la structure "multinormale - Wishart".Nous avons
précédemment distingué (Lecoutre [4])
leproblème
de l’étudede l’effet associé à un contraste et le
problème
de l’étude de l’effet associé à unecomparaison
à un nombrequelconque
dedegrés
de liberté. Enanalyse univariée,
lepremier problème
peut être ramené à la structure "normale - khi-deux". Les deux structuresdéveloppées
ici constituent desgénéralisations
de cette structure "normale’- khi-deux" :
. la structure "multinormale - khi-deux" intervient dans les
problèmes
decomparaison
àplusieurs degrés
de liberté enanalyse
de la variance univariée(voir
Lecoutre[3]
et[4]) ;
. la structure "multinormale - Wishart" intervient dans les
problèmes
d’inférencesur un contraste en
analyse
de la variance multivariée(ce
dernierpoint
constitue.un
prolongement
des méthodesdéveloppées
en[3]
et[4]).
Pour chacune de ces deux structures, nous
envisagerons
successivement les tests designification
et les solutionsbayésiennes.
*Cette recherche a bénéficié de l’aide financière de l’ATP
3447, "Analyse
descomparaisons
pourprotocoles
multidimensionnels~’~**Laboratoire de
Psychologie (ERA 235),
Université de PARIS-VIII.et GroupeMathématiques
etPsychologie,
Université René Descartes***Groupe Mathématiques
etPsychologie,
Université René Descartes2. STRUCTURE
STATISTIQUE
"MULTINORMALE - KHI-DEUX"Nous
appellerons
structurestatistique
"multinormale -khi-deux",
ou encore"m-normale -
khi-deux",
la donnée de deuxstatistiques, d
ets2 qui,
sous uncertain modèle
d’échantillonnage,
sont distribuéesindépendamment, respecti-
vement
9 et
ce que nous noterons :
La structure "m-normale - khi-deux" fait donc intervenir le
paramètre
. 2 .
multinumérique 6
et leparamètre numérique a2.
Pourl’inférence,
nous ferons.
jouer
auparamètre À 2 =
S’8 le rôle dep aramètre numérique principal
sim > 2
(si
m = 1 leparamètre numérique principal
est bien entendu6), 02
jouant
le rôle deparamètre numérique
secondaire. Enparticulier, l’hypothèse
nulle 6=0 est
équivalente
àX2 = 0.
Nous définirons enconséquence
lastatistique numérique £ 2 = d’d.
Le test de
signification
seracalqué
sur les tests Fclassiques
enanalyse
de la variance(ou
encore sur les tests dits du t de Student dans lecas
particulier
m =1).
Lesprocédures bayésiennes,
enrevanche,
mettront en évidence de nouvellesdistributions, qui,
à notreconnaissance,
n’ontguère
étéétudiées à l’heure actuelle.
2.1. Test de
signification
del’hypothèse
nulleÀ2 =
02
On
envisagera
lastatistique
de test F = 9 dont la distribution mbs 2d’échantillonnage
est celle d’un Fde2Fisher-Snedecor
à m et qdegrés,
non-centré en
général (d’excentricité ‘ 2 )
centrélorsque X2 =
0 ; ; · ce que nous. bQ
écrirons : ba
(F
centré usuel à m et qdegrés
deliberté)
Dans le cas
particulier
m = 1(structure
"normale -khi-deux"),
onenvisagera également
lastatistique
de test t =d
, dont la distribution7b-s
d’échantillonnage
est celle d’un t de Student à qdegrés
deliberté,
non-centréen
général (d’excentricité -~-2013)~
. centrélorsque 6 =
0 ; ce que nous écrirons : si m =1,
sousH :
o 6 =0, t - t
q(t
usuel à qdegrés
deliberté)
2.2. Procédures
bayésiennes
...
On se donnera pour
(ô,a2)
une distributioninitiale,
et on endéduira,
àpartir
de la distribution
d’échantillonnage conjointe (d,s2)/ô Q2,
la distribution finale donnée par le théorème de Bayes.2.2.1. Cas de distributions initiales
marginales indépendantes
Dans le cas
particulier
où les distributions initiales(marginales)
relativesà chacun des
paramètres
& et62
sontindépendantes,
~ on pourra, en utilisantl’indépendance
des distributionsd’échantillonnage, décomposer
l’inférence :. d’une part en une inférence relative à la structure"multinormale"
. d’autre part en une inférence relative à la structure "khi-deux"
On en déduira les distributions finales
relatives,
d’une part à 8 étant donnecT2,
, et d’autre part àa2,
, cequi
déterminera la distribution finaleconjointe.
2.2.2. Distributions
fiducio-bayésiennes
Comme distribution initiale on peut
prendre pour 6
la distribution(conjuguée)
~ (d ,b U ) (lU 1>0)
et poura-2
la distribution(conjuguée)
on obtient dans ce cas la distribution
finale,
caractérisée par les
propriétés
suivantes :Quand b o +
+00 et 0, cequi
revient àexprimer
un état initiald’ignorance,
on
obtient,
en passant à lalimite,
la distributionfinale,
caractérisée par lespropriétés
suivantes :Cette
distribution,
que nousappelons
distributionfiducio-bayésienne
pourla structure "m-normale - khi-deux"
(et
que nous marquons d’unastérisque),
est
généralement justifiée
dans le cadrebayésien
par le recours à la... ,..., 2 distribution initiale
non-informative
définie en prenant la densitéf(ô,a2)
proportionnelle
àa-2 (distribution impropre) :
cf.Lindley [5],
Box etTiao
[2].
La distribution
fiducio-bayésienne (marginale)
relative auparamètre 8
est une distribution
qu’il
estd’usage
enstatistique bayésienne d’appeler
distribution du t de Student m-dimensionnel
généralisé,
de centre d et dematrice d’échelle
bs2l ;
m ; nous noterons :Lorsque
m =1,
ils’agit simplement
de la distribution usuelle du t de Student à qdegrés
deliberté,
à un facteur de centrage et d’échelleprès :
2 2 La distribution f. d . b
Y ésienne
relative au cou1
le(
22)
estLa distribution
fiducio-bayésienne
relative aucouple (À a )
estobtenue à
partir
de la distribution :_7
La distribution
fiducio-bayésienne (marginale)
relative auparamètre numérique ~2
est unedistribution,
~ que nousappelons
distribution dupsi-deux,
à m et q
degrés
deliberté, qui généralise
la distribution du khi-deuxnon-centré,
et dont le rôleapparaît
central dans les extensionsbayésiennes
de
l’analyse
de la variance(voir
Lecoutre[3]
et[4]) ;
nous écrirons :Il
Il pourra encore être intéressant de considérer les distributions fiducio- b ..-. 1. d, ,,&
d, "
X2
bayesiennes relatives,
d une partà a et
d autre part a2
·a
La
première
est unedistribution,
que nousappelons
distribution 1’ m-d2mens2on-nelle,
à qdegrés
de liberté(voir
sa définition enannexe) ;
nous écrirons :La seconde est une
distribution,
que nousappelons
distributionL~,
à m et q
degrés
de liberté(voir
sa définition enannexe) ;
nous écrirons :Par
ailleurs,
si nousdésignons
parFobs
la valeurprise
par la statis-tique
de test F définie en2.1.,
nous pouvons écrire les distributions... 2
a
fiducio-bayésiennes
relatives àx 2
et au rapportX2
sous la forme :Et, dans le cas
particulier
m =1,
si nousdésignons
partobs
la valeurprise
par la
statistique
de test t définie en2.1.,
nous avons encore :2.2.3. Cas d’une distribution initiale de la même famille que la distribution
fiducio-bayésienne
Il peut être intéressant de considérer le cas d’une distribution initiale de la même famille que la distribution
fiducio-bayésienne,
soit une distribution initiale caractérisée par :La distribution finale est encore-une distribution de la même
famille,
donnéepar : o o
On en déduit :
et encore :
On remarquera que,
lorsque
+00 etq o +
0, la distributionprécédente
diffère de la distribution
fiducio-bayésienne "par
mdegrés
deliberté",
cequi
est dû àl’hypothèse
denon-indépendance
des distributions initiales de S eto 2
.3. STRUCTURE STATISTIQUE "MULTINORMALE - WISHART"
Nous
appellerons
structurestatistique
"multinormale -Wishart",
ou encore"r-normale -
Wishart",
la donnée de deuxstatistiques,
d etS, qui,
sous uncertain modèle
d’échantillonnage,
sont distribuéesindépendamment, respectivement
N
r
(&,br)
r,q
(r) (distribution
de Plisha2,t r-dimensionnelle à qdegrés
deliberté,
de matrice de covarianceI,
cf. Anderson[1]
et Rao[7]) ;
ce que nous noterons :La structure "r-normale - Wishart" fait donc intervenir les
paramètres
multinumériques 6
et I. Pourl’inférence,
nous feronsjouer
le rôle depapamètpe
.1 ...
l .... 2 t’ ,
-1
1 t"( 1-
11/2
- - 1 .numérique principal
auparametre 6 =
0 lQ,
,Q lô ) généralisé
la distance de Mahalanobis
classique,
si r,2 (si r=l, on retrouve la structure"normale - khi-deux"
déjà
étudiée en 2.). Enparticulier, l’hypothèse
nuîle8 = 0 est
équivalente
àA 2 =
0. Nous définirons enconséquence
lastatistique numérique
Le test de
signification
seracalqué
sur le testclassique
deLes
procédures bayésiennes
mettront en évidence de nouvellesdistributions,
commedans le cas
précédent.
3.1. Test de
signification
del’hypothèse
nulle2=0
On
envisagera
lastatistique
de test F -q-r+1
D 2(1)
, dont la distribution On
envisagera
lastatistique
de test F =q rb
, dont la distributiond’échantillonnage
est celle d’un F de Fisher-Snedecor à r etq--r+1 degrés
del.b ~ ~ ~ ~ 1 (d’
.. ~~2
~1 2
liberté,
non-centre engénéral (d’excentricite b ),
centrelorsque A
=0 ; ceque nous écrirons :
(F
centré usuel à r etq-r+1 degrés
deliberté)
3.2. Procédures
bayésiennes
On se donnera pour
(S,~)
une distributioninitiale,
et on endéduira,
àpartir
de la distribution
d’échantillonnage (d,S)/~,~,
la distribution finale donnée par le théorème de Bayes.3.2.1. Cas de distributions initiales
marginales indépendantes
Dans le cas
particulier
où les distributions initiales(marginales)
relativesà chacun des
paramètres 6
et 1 sontindépendantes,
on pourra, en utilisantl’indépendance
des distributionsd’échantillonnage, décomposer
l’inférence :. d’une part en une inférence relative à la structure "multinormale"
. d’autre part en une inférence relative à la structure "Wishart"
On en déduira les distributions finales
relatives,
d’une part à 6 étantdonné 1,
et d’autre part àI,
cequi
déterminera la distribution finaleconjointe.
3.2.2. Distributions
fiducio-bayésiennes
Comme distribution initiale on peut
prendre pour a
la distribution(conjuguée)
N
(d b U ) ( U
01 >0)
etpour 1:-ila
distribution( ... 1 )
r o 0 0 o
o o
oavec ; la distribution finale relative à a étant donné 1 est de la même forme que celle donnée en 2.2.2. pour 8 étant donné
Q2 (mais
avec 1quelconque) ;
celle relative
à r-l
1 est :Quand b -
o +00 etq +
o 0, cequi
revient àexprimer
un état initiald’ignorance,
on
obtient,
en passant à lalimite,
la distributionfinale,
caractérisée par lespropriétés
suivantes :- -
(1)
On a encore en posantcorrespond
à lastatistique
de test deHotelling.
Cette
distribution,
que nousappelons
distributionfiducio-bayésienne
pour lastructure "r-normale - Wishart"
(et
que nous marquons d’unastérisque),
estgénéralement justifiée
dans le cadrebayésien
par le recours à la distributioninitiale
non-2nformat2ve
définie en prenant la densitéf(6,I) proportionnelle
- ’1
(distribution impropre) :
cf. Box et Tiao[2],
Press[6].
La distribution
fiducio-bayésienne (marginale)
relative auparamètre
8est une distribution du t de Student r-dimensionnel
généralisé,
àq-r+1 degrés
de liberté :On en déduit en
particulier :
La distribution
fiducio-bayésienne
relative aucouple (~Z,F)
est obtenue àpartir
de la distribution :-
La distribution
fiducio-bayésienne (marginale)
relative auparamètre ~L
est une distribution
L 2
à r et qdegrés
de liberté :Par
ailleurs,
si nousdésignons
parFobs
la valeurprise
par lastatistique
de test F définie en
3.1.,
nous pouvons écrire les distributions fiducio-bayésiennes
relatives à et à2
sous la forme :3.2.3. Cas d’une distribution initiale de la même famille
que la
distributionfiducio-bayésienne
Il peut être intéressant de considérer le cas d’une distribution initiale de la même famille que la distribution
fiducio-bayésienne,
soit une distributioninitiale caractérisée par :
La distribution finale est encore une distribution de la même
famille,
donnéepar : o o
où
où
On en déduit :
On remarquera que,
lorsque b 0 -
+00 etq0 -+
0, la distributionprécédente
diffèrede la distribution
fiducio-bayésienne "par
undegré
deliberté-",
cequi
estdû à
l’hypothèse
denon-indépendance
des distributions initiales de 6et 1:- .
4. ANNEXES : DISTRIBUTIONS INTRODUITES
alors nous dirons que x a la distribution L’
.L .L ...
p-dimensionnelle, à q degrés
deliberté,
deposition
a et d’échellebl ;
nous’ ’ ’
P noterons :
On a les
propriétés
suivantes(écrites symboliquement) :
on montre que z a pour densité :
pour moyenne :
et pour
matrice de
variances et covariances :Enfin,
si x - L’p,q
(a,bl ) P
et si M est une matrice à plignes
et k(k,p)
colonnes,
telle que =cl k’
alors :En
particulier,
en prenant pour ~ un vecteur colonne comportant’un 1 à laligne
iet des 0 partout
ailleurs,
on obtient la distributionmarginale
du ième composantde X,
soit :qui,
suivant la définitionprécédente,
est la distribution L’ unidimensionnelle à qdegrés
deliberté,
d’indice deposition al
etd’indice
d’échelle b ; nousnoterons encore :
~ ~ L’ q (aBb)
, alors nous dirons que x a la distributions
L2
à p eut q
degrés
deliberté,
d’excentricité a ; nous noterons :On peut
également
donner la caractérisationéquivalente
suivante :On a les
propriétés
suivantes(écrites symboliquement) :
on montre que x a pour densité :
et
pour moyenne :
pour variance :
BIBLIOGRAPHIE
[1]
ANDERSON T.W., An introduction to multivariate statisticalanalysis,
New
York,
JohnWiley
and Sons, 1958.[2]
BOX G.E.P., TIAO G.C.,Bayesian inference
in statisticalanalysis, Wesley Publishing Company,
1973.[3]
LECOUTRE B., Extensionsbayésiennes
del’analyse
de lavariance, Paris,
Université René Descartes, thèse de doctorat de troisième
Cycle,
1980.[4]
LECOUTRE B., "Extensions del’analyse
de la variance :l’analyse bayésienne
des
comparaisons",
Math. Sci.hum., 75, 1981, p.49-69.
[5]
LINDLEY D.V., Introduction toprobability
and statisticsfrom
abayesian viewpoint,
Part 2 -Inference, Cambridge University
Press,1965.
[6]
PRESS S.J.,Applied
multivariateanalysis,
NewYork, Holt,
Rinehart andWinston,
Inc., 1972.[7]
RAO C.R., Linear statisticalinference
and itsapplications,
NewYork,
John