A NNALES SCIENTIFIQUES
DE L ’U NIVERSITÉ DE C LERMONT -F ERRAND 2 Série Mathématiques
G UY F OURT
Au-delà de l’analyse de la variance ?
Annales scientifiques de l’Université de Clermont-Ferrand 2, tome 65, série Mathéma- tiques, n
o15 (1977), p. 76-95
<http://www.numdam.org/item?id=ASCFM_1977__65_15_76_0>
© Université de Clermont-Ferrand 2, 1977, tous droits réservés.
L’accès aux archives de la revue « Annales scientifiques de l’Université de Clermont- Ferrand 2 » implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
-76-
AU-DELA DE L’ANALYSE DE LA VARIANCE ?
Guy
FOURTUniversité de Clermont II
Sommaire
Nous donnons ici
(IV - VIII)
uneapplication
de la théorie des côneshomogènes
auproblème
fondamental del’analyse
de la variance multi-dimension-nelle ;
nous en recherchons des solutions"optimales" (de façon plus précise
les
plus puissantes
ou à défaut localement lesplus puissantes)
invariantessous le groupe linéaire. Si les résultats de IV ne sont pas nouveaux
(on
les trouvedéjà
enfil1granne
dans ils ne sont malheureusement pas suffisam- ment connus.L’efficacité
de la théorie des côneshomogènes
pour la solution duproblème
deHotelling
nous a incitéà,aborder
desproblèmes plus généraux.
On retrouvera
(théorèmes
5 et8)
les bases del’analyse
de la variance unidi- mensionnelle hors de touteheuristique (pour
leurdéveloppement
on consultera~2~
ou[71 )
ainsi que le test deLawley-Hotelling
comme forme limite(théorème 6). Signalons
enfinqu’on
trouve dans[7J
les mêmes testsprésentés
comme UMP
invariants,
alors que leprésent
article ne prouve que lapropriété
UMP locale. Cela
parait plus
attirant maisprovient
de ce que le groupe de transformations considéré estplus riche,
et que la famille desstatistiques
à l’intérieur delaquelle
a été faite l’étude estbeaucoup plus
restreinteque dans notre
présentation.
--77-
I- Introduction
De nombreux
problèmes
de tests sontposés
de la manière suivante. Soienti=1,2,...p
un échantillon de variables aléatoires à valeurs dansRk ,
laplaciennes, d’espérance
m et de covarianceA.
Cette dernière matrice est inconnue et on recherche des informations sur m. En fait onpeut supposer A
inversible ; sinon les
Xi appartiennent
presque sûrement à unhyperplan
etil convient de se
placer
immédiatement dans cethyperplan
pour faire l’étude.Remarquer
ensuite que l’absence d’information surA provient
du fait suivant : des mesures ont été effectuées sur unepopulation,
sans estimationpossible
a
priori
des corrélations entre lesgrandeurs mesurées,
celles-ci étant choissimplement
pour des raisons de commoditéd’expérience,
et les données du pro- blème sont moins lesXi
que les A(Xi )
où A est une transformation linéaire inversible. Aussi il est raisonnable de chercher des solutions en terme destatistiques
invariantes sous le groupe linéaire.II-
Pourquoi
les côneshomogènes?
Considérons les
statistiques
où les
Xi
sont des matrices colonnes d’ordre k etoù A désigne
latransposée
de la matrice A. S est une matrice
symétrique.
Elles forment deuxstatistique
exhaustives. Pour des raisons
d’homogénéité,
nous utiliserons dans la suite X depréférence
àX.
Pour n =
201320132013=201320132013 ,
soit El’espace
vectoriel de dimension n de matrice(k,
k)symétriques,
et le cône des matrices définiespositives, désignant
le cône des matrices semi-définiespositives.
Soit A une matrice(k,
k) inversible. On lui associe la transformationg. définie
surE par
78-
Cette transformation,
opérant
surE,
est linéaire. En fonction de A, elle n’a pas depropriétés
delinéarité,
mais il est immédiat quegA o ge
=9AB
et que g A
applique n+
k(resp.
k dans lui-même. Il estégalement simple
de vérifier que pour tout s dans1*+
il existe au moins une matricek A
(k,k)
inversible telle queet donc que pour tout
s
et s’ de~ K
il existe une matrice A , telleque SI -
(s). Désignant
le groupe desopérateurs g , 1~.
forme un espace
homogène
dugrouper
et l’étude desstatistiques
invariantesse ramènera à
l’étude
des actions des éléments de la formeCA, g )
du groupeproduit
surl’espace homogène Rk auquel appartient
le
couple
destatistiques (X. S).
Notons que la connaissance de la donnée X
tX
estéquivalente
à celle de X(à
unesymétrie
parrapport
àl’origine près, qui
neperturbe
pasS).
Aussice
problème
se ramènera à l’étude des actions des élémentsdiagonaux
desur
l’espace homogène M k
De manière
générale
on ditqu’un
cône C deR~
esthomogène
si :- C est un ouvert ne contenant pas de droites - il existe un
groupe go
de transformations linéaires surR n
conservant C
’(pour
tout s et s’ de C,l’équation
s’ -g(s)
a une solutiondans
g ).
On montre
qu’il
existe alors au moins un sous groupeCLde(dL opérant
de
façon simplement
transitive sur C(c’est-à-dire
que pour s et s’ dansC , l’équation
s’ =g(s)
a une solution uniquedansai).
1. Deplus,
lesopé-
rateurs de g sont
représentables
dans une base convenablement choisie par des matrices(n,n) triangulaires supérieures.
Pour le choix d’une unité e de C on définit alors une loi degroupe 1
enposant
pour s =g(e) .
G79-
Noter que la définition de la
loi-L-repose
sur les choix successifs de(r4
et de e ... En ce
qui
concerne le cônehomogène
nous utiliserons cellequi s’exprime
leplus simplement,
obtenueavec g,
groupe des trans- formationsgT "
où T est une matrice(k, k) triangulaire supérieure
et oùe est la matrice identité sur
R .
On a donc, pour s = TtT ,
(Ttriangulaire
k,
k)
Pardonnez-moi si la notation e se superpose avec celle de e, base des
logarithmes népériens.
Leur coexistence, même dans la même formule ne pose pas de soucis tant ces deux êtres sont distincts. Monexpérience
m’a habituéà reserver la notation exp aux
opérateurs, compte
tenu del’importance
dela structure en tant que groupe de Lie.
III- Anatomie de
M+k
Le lecteur consultera utilement
[4]
où il trouvera uneprésentation
sommaire des cônes
homogènes ;
pour une étudedétaillée,
nous le renvoyons àC51
ou~8~ .
Nous donnons ici unglossaire qui,
nousl’espérons,
luipermettra
de suivre les calculs deschapitres
IV à VIII.Loi à : pour tout vecteur a de
l’espace
E ,l’équation L(e) -
a fournitune solution
unique L a
dansl’algèbre
deLie,
dérivée de G . Defaçon
simi-laire,
à la définition de1.,
on posea à
b =La (b) (a,
b EE)
D est une loi
d’algèbre (non
associative) assezsophistiquée.
Mentionnonscependant
lespropriétés
que nous utiliserons par la suite. Si M.(i=1,2)
sont des vecteurs de
k-1
les matrices(aMi)
sont des vecteurs de R . pour les matrices
M
0J
. notées
encore Mi par abus
d’écriture, à
vérifie la relationsimple :
80-
Le lecteur en déduira sans
peine
que(Mi a M2
=M),
M à M est dans ainsi que leprincipe
dedécomposition :
la matrice-- est dans
%k
si et seulement si z > 0 etdans
11b;-1 .
Deplus
est dansOn posera
également,
pour a mT tT ,
T matricetrian g ulaire supérieure
ets
CMI = T (M).
Produit scalaire et dualité. On munira
Rn
d’unproduit scalaire compatible .
avec
à
au sens Nous utiliserons icile
produit
scalaire usuel de la tracequi
estcompatible.
Le cône dualde n’ est autre que
1%. ,
mais il faut reordonner la base danslaquelle
ont étéexprimées
les données pour que le groupe destransformations duales
gT* (pour
,> ) puisse
être lu comme un groupe trian-g ulaire supérieur.
Si s aTtT. 9T (s) (T
matricetriangulaire supérieure), s*= tT T = * (s)
définit lepoint
dual de s.Fonction puissance p
Ce sont les
homomorphismes de M+
muni deL dans R+ .
Notons par le déterminant de la matrice obtenue enrayant
les-i-1prsmiéres lignes
et colonnes de s et posons
1 9 à
1 . Touthomamorphisme
s’écrit defaçon canonique
IIp’ i
que nous
abrégerons
en sk
i=1 Noter que s
...
p k
.s
(pk .. p 1
et que det s m
s (1...1)
81-
Mesures fondamentales
dx
désignera
la mesure deLebesgue
associée aux structures euclidiennes définies par . >(on
n’oubliera pas que pour les matrices M associées à des vecteurs de M, M > = e, M à M > = tr M) = 2 tr(M
= 2 x
(norme
usuelle deM~Z
d
yixJ désignera
la mesure de Haar àgauche
pour la loi1 qui
est la mesuredv (x)
est la mesure de Haar à droite, la fonction modulaire étantPrésentation de
(X,
S) dans ces espaceshomogènes
.Nous avons vu que X
X était,
pour une étude destatistique
invariante,équivalente
à X. Aussi, nousreprésenterons (X,
S) sous la forme de lamatrice
(k+1,
k+1)symétrique
~ /
s , cequi permettra
detx °/
faire
jouer
tout son rôle à la loiA.
Lescomposantes
S et X sontindépendant
On posera ici a’=
4
A . Lacomposante
X a la densitépar
rapport
à la mesure deLebesgue
del’espace
euclidienRk
muni de , > . Enfin S suit la loi de Wishart àp-1 degrés
de liberté et si p > k admet la densité(par rapport
àdp
Pour le calcul du coefficient
r ,
on sereportera
à151 -
.IV- Un
galop
d’essai : le test deHotelling
Nous
développerons
defaçon
détaillée cette solution duproblème classiq
qui
consiste à tester m = 0 contre m # 0, bien que les résultats obtenus ne-82-
soient pas nouveaux. En effet c’est une bonne méthode pour s’initier aux
techniques
que nousdévelopperons
sur desproblèmes plus complexes.
Le groupe linéaire est
engendré
par le groupetriangulaire
et le groupeorthogonal.
Notre attention seporte
sur lastatistique (X tX,
S) ou mieuxencore
(X
6 X, S). Faireopérer
une matricetriangulaire
T sur les donnéesrevient à faire les
produits
àgauche
par b - TtT ,
c’est-à-dire à trans- former(X
à X. S) ent b 1(X à X) , b "~ S) .
Comneb..L (X 6 X)
est unpoint
de la frontière du cône on ne trouvera destatistique
inva-riante que si
b.L S
est dansM+K,
et donc inversible(pour .L).
On estramené à considérer la
statistique
invariante(par
le groupetriangulaire)
définie
si p est strictementsupérieur
àk. (re que
nous supposerons désor-mais) .
L’action du groupeorthogonal
fait subir à cette dernièrestatistique
des rotations
(au
sens duproduit
scalaire, > )
autour de la matrice/
identité e de
~~.
0’ oi) le choix de lastatistique
.T - e .
s (X
à X >qui
s’écrit encoreT -IIS -1
(exercice :
vérifier que T est lastatistique
deHotteling,
au coefficientp-1 près).
. Théorème 1
~
La
répartition
de T est la loie décentrée,
deparamètre
dedécentrage.
...L. 1 Cm) 112 . ~n A-1
m.Nous donnerons seulement la méthode de démonstration de ce
résultat qui
est cité dansCs] ,
les calculsexplicites
étantrepris
auchapitre
suivant.
La fonction de
répartition
de T est donnée pour t > 0 par-83-
On effectue les
changements
de variables a1 s =
s’ 1qui
conservedu (s) .
a
1 (x)
= x’Cde jacobien
a 1/2(1...1) ,
cf[5]] puis
lechangement
de’ variable
(pour
sfixé)
y = s1 _1
1Cx)
Enfin l’ écr1 ture de y en coordonnées
"polaires"
y = =1)
meten évidence la densité de T
exprimée
en fonction de la mesure deLebesgue
da
(u)
de lasphère
unité(pour
,> )
deRk . Pour
une matriceorthogonale
H convenablement choisie le
changement
devariable
défini parramène le calcul au cas où
On
développe
alors la dernièreexponentielle
en série et onpermute
lessigne î
etff
. Les termes de rangimpairs
sont nuls parsymétrie.
Ceuxde rang
pair
se calculent en écrivantdy (s)
=s-a
d ~(s)
et en effectuantle
changement
de variable s’ = s1(e
+ tv 6 v) qui permet d’intégrer
ens’
puis
par des méthodes usuelles en v.Théorème 2
Le test de
Hotelling
est UMPparmi
les tests invariant sous le groupelinéaire .
-84-
Preuve : il suffit
d’appliquer
au résultatprécédent
le lemme deNeymann-
Pearson. Le
rapport
de vraisemblance s’écriti
E a
les aétant des
coefficients positifs.
C’est donc une fonction croissante de
t
et a fortiori de t.V- Problèmes où interviennent
plusieurs
échantillons---
De nombreux
problèmes
se ramènent auproblème théorique
suivant. Soientxi# S)
unestatistique
dont lescomposantes
sontindépendantes
etoù les
Xi
sont des variables normales deR k d’espêrance
de covariance-i-- A
et où S suit une loi de Wishart deparamètre A - à Jul (p1-1 )degrés
de liberté. On se propose de tester
l’hypothèse
"tous lesm i
sont nuls*contre des
hypothèses
adverses.Remarquons
que sans detrès
fortes restrictionssur ces
hypothèses,
on n’obiendra pas de solution satisfaisante : contre unehypothèse
où tous lesmi
sont nuls sauf le meilleur test sera, en vertu du IV le test deHotelling qui dépend
dei .De plus
en l’absence
probable de
test nous nous bornerons à rechercher des tests localement UMP( qui séparent
leplus
vite deshypothèses voisines).
Sur
cesujet,
le lecteur consultera avec fruit, outre leclassique
ouvrage
Ci] ,
l’intéressante étudeE3]
sur les tests usuellementpratiqués.
Posons de même
qu’en
IVXi 2
etreprenant
la même méthodenous sommes conduit à étudier les
statistiques (S, X i à Xie) puis
lesstatistiques
SL-1
i(Xi A xi,)
et enfin à nous borner aux distances mutuellesentre ces
points,
et entre cespoints
etl’origine.
VI- Une bonne
approximation
_ ~ _ ~_ __ _Nous allons oubier dans un
premier temps
lesstatistiques "rectangles"
et ne conserver que les
statistiques T
=Il S 1-1 (X1),12
.Décrivons leur loi
conjointe
85-
Théorème 3
La densité de
l 2
...TJ
estproportionnelle à
Preuve : la fonction de
répartition conjointe
desTi
est, enposant
On pose a «L s a s 1 et
altxl
=x’ .La mesure de Haar à
gauche
est conservée etdxi
est conservé au coefficienta près.
D’où : --86-
Pour s fixé on pose s
qui
fait intervenir leacobien s "2( 1 ... 1 )
.Alors
On pose enfin
ce
qui
donnedy = ri’
do(ui) dr , étant la
mesure deLebesgue
sur la surface de la
sphère
unité 1. La densitécherchée
est miseen évidence par la formule obtenue :
Théorème 4
Notons par f
(t 1t2
...tj) l’intégrale exprimée
au théorème 3 sousl’hypothèse
nulle. Pour la structurestatistique (T 1 T2
...T L
il existeun test localement UMP de
l’hypothèse (V
im=0)
contre toutehypothèse
de la forme
(lia Ila -LCm-)j) = ... = Ila 3-(mi ).l i
Sa
région
derejet
est donnée par-87-
(N’oublions
pas que définit la distance naturelle entre observa- tions associées àl’expérience,
carIla 1 Cm)1 12
n’est autre quem Am....
même si cette distance est inconnue !)Démonstration
Le
paramètre
est iciqui
est un élémentLes tests localement UMP sont ceux
qui (pour
des tests sans biais de niveau donné) maximisent en m = 0(hypothèse nulle)
la formequadratique
des déri- vées secondes. Nous écrivons la matrice de la différentielle secondepar ses blocs de dimension
(k,
k). Cela revient à calculer les différentiellespartielles D
mï
8p.,1 puisqu’alors
Nous ferons m = 0 dans cette
expression.
On a d’abord, pour la densité-88-
On calcule ensuite pour
Il est facile de voir que pour
mi la mi, a 0,
cette forme estidentiquement
nulle, les
intégrales
étant nulles par desarguments
desymétrie.
Il n’enest pas de même pour i a i’.
En
0,
la différentielle secondepartielle s’exprime
par
Remarquons
ensuite que a1 cui),
s1 (ui)
> est la trace deSon carré
s’exprime
donc commeou encore 2
ou enf in 2
On écrira alors ;
-89-
en
posant :
Calculons maintenant
tH M i
H, pour H matriceorthogonale.
Effectuons le
changement
de variable défini parOn obtient alors les relations
Opérant
sur la variable s, cechangement
de variable conservel’orthogonal1t
donc la mesure
Comme du (s) = [det (s)]
2 et ques(1...1) =
det s il conserve aussis ~ (1...1) dp (s).
Si deplus
pour sfixé, u1(z)
etu2 (z)
sont deux courbeorthogonales.en
z = 0 tracées sur lasphère 1 lui 1
= 1, c’est-à-dire vérifiantul (0), u2 (0)
> = 0 , pour les courbeshomologues
définies par-90-
Posant s = T
tT’ , où T et T’
sont des matricestriangulaires supérieures,
cette relation s’écritvi T H
Tui
et parconséquent
Aussi, pour s
fixé,
leschangements
de variables enui
conservent les da(ui ).
Comme la
première expression du changement
de variableglobal
ne fait pasintervenir u, il s’ensuit que -
°
est
conservé,
donc quel’intégrale
estinchangée.
On a donc, pour toute matrice Horthogonale tH mi
H -Mî il
cequi
prouve queM i
s’écritui
...ti)
e ,avec u
On en déduit :
Le lemme de
Neyman
Pearson conduitdonc,
pour maximiser la forme différentiell seconde, àprendre
commerégion
derejet
-91-
ou
plus simplement
Si on se restreint à des
hypothèses
adverses vérifiant, cela revient à
rejeter
Théorème 5
(Principe
del’analyse
de la variance unidimentionnelle)Si les
statistiques
X. sont à valeurs dans R, le test ci-dessusrejette J
1l’hypothèse
nullei=1 i
.
Preuve . da s’écrit
simplement d1
+6-1 (6
mesure de Dirac en x) etui à ].
ui =
iui ;
].enfin d03BC d03BC (su) est la mesure dS s. (s)
est la mesure On en déduitLa
région
derejet
est donc donnée parou encore par
puisque
est croissante pour x > 0.1+x
Théorème 6
Le théorème 5 n’est
plus
valable pour k > 1.Cependant
si p ~ 006 le test construit au théorème 4 estasymptotiquement équivalent
au test dei
Lawley-Hotteling L
T. > c, 1
1=1
92-
Preuve. k a
2, J -
2 et pu 4 fournissent un contreexemple
accessible parun calcul élémentaire de f
(tio t2~
Posant enfin
Ri
= pTi à
le testprécédent rejette
donc siPour des v.a.
Indépendantes
S(ayant
larépartition
de Wishart à Pdegrés
deliberté)
etU. (uniformes
sur lasphère Iluill- 1) on-interprète
f et-S2013
comme
le -
s 1 .
...Si en loi
(lgi
d.esgrands nombres),
De même
L’ensemble de
rejet
tend donc versVII- Ebauche d’étude
générale
’.-
Dans le cas unidimensionnel les
statistiques
SL-l
L (Xià Xi’) (c’est-
à-dire
plus simplement S... 1)
sont les seulesstatistiques
inva-riantes sous le groupe linéaire
(la
seule transformationorthogonale
nontriviale est X - - X
déjà utilisée).
Or leur donnée estéquivalente
àcelle des
X1
La méthode
précédente
conduit au résultatnégatif
suivant :93-
Théorème 7
Il n’existe pas de test localement UMP de
l’hypothèse
nulle(mi
= 0 Vcontre ... _ ~
Preuve. un calcul
classique
montre que la densitéconjointe
desTi
est :En différenciant deux fais, on voit que la zone de
rejet
d’un test localement UMP serait donnée parce test
dépend
donc étroitement du choix dessignes des Pi 6
d’où le résultatThéorème 8
-
Dans une
optique Bayésienne,
si lesmi
ont desrépartitions symétriques
autour de
0 et
sontindépendantes,
le testd’analyse
de la variance est localement UMP contre leshypothèses =lm21 =
... =lm11 Î
Preuve. La
répartition
dem
conditionnelle àImil
est la loiPar suite de
l’indépendance,
on a alors :Le calcul
précédent
conduit à la zone derejet
94-
ou
après
avoir conditionné par la connaissance desPi
En
imposant
que tous lesui
soientégaux
en valeur absolue on est conduit àrejeter l’hypothèse
y nullesï 2013=2013
> c’est-à-diresi
T > ci=1
T’ 1
11-1
’IX- Conclusion
Cette étude met en évidence des
propriétés optimales
des méthodes del’analyse
de la variance pour des études unidimensionnelles. Enanalyse multivariée,
il est raisonnable de penser que le théorème 7 reste valable etqu’une
variante du théorème 8 conduit àprendre
les testsplus sophistiqués
établis au théorème
4,
dont le test deLawley-Hctteling
est la forme limite.Du
point
de vuepratique,
ce dernier conduit àdes
bornes fonctionspuissances
et surtout à des calculs
simples.
Seules des simulationspeuvent permettre
de
décider
s’il est vraiment utile(pour
des nombres dedegrés
de libertéfaibles)
deprendre
des formesplus
élaborés.-95-
X-
Bibliographie
[1]
ANDERSON T.W. - An introduction to Nultivariate StatisticalAnalysis Wiley,
New-York(1958)
[2]
BARRA J.R. - Notions fondamentales destatistique mathématique.
Dunod - Paris (1971)
[3]
EATON M.L. et PERLMAN M.D. - Amonotonicity property of
the powerfunctions of some invariant tests for MANOVA. Ann. Math. Statist.
Vol. 2, N° 5 (1022-1028)
[4]
FOURT G. - Lois sur les côneshomogènes.
AnnalesScientifiques
del’Université de Clermont-Ferrand, N° 51
(1974),
p. 22-30[5]
FOURT G. - Mesures sur les côneshomogènes (soumis
pourpublication)
[6]
LINNIK Y. -Leçons
sur lesproblèmes
destatistique analytique.
Gauthier-Villars (1967)
[7]
SCHEFFE H. - Theanalysis
of variance.Wiley,
New-York[8]
VINDBERG E.B. -Theory
of convexhomogenenous
cones. Trans. Moscow Math.Society
12 (1963)G. FOURT
Université de Clermont II
Complexe Scientifique
des Cézeaux,
Département
deMathématiques Appliquées
Boite Postale n° 45 F- 63170 AUBIERE