R EVUE DE STATISTIQUE APPLIQUÉE
H. E L M AÂCHE Y. L EPAGE
Mesures d’association vectorielle basées sur une matrice de corrélation
Revue de statistique appliquée, tome 46, n
o4 (1998), p. 27-43
<http://www.numdam.org/item?id=RSA_1998__46_4_27_0>
© Société française de statistique, 1998, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
MESURES D’ASSOCIATION VECTORIELLE
BASÉES SUR UNE MATRICE DE CORRÉLATION
H. El
Maâche,
YLepage
Département
demathématiques
et destatistique,
Université de MontréalRÉSUMÉ
Trois mesures d’association vectorielle sont construites à
partir
de la matrice de corrélation échantillonnale. Ces mesures servent à tester l’absence de liaison entre deux vecteurs de loiselliptiques. À partir
de la loiasymptotique
de la matrice de corrélation échantillonnale, la loiasymptotique
des mesures d’association vectorielle est obtenue sousl’hypothèse
d’absencede liaison et sous une suite
d’hypothèses
alternatives. Unexemple
est donné pour illustrer les différents tests et une étudeexpérimentale
permet de comparer ces tests à ceux basés sur la matrice de covariance.Mots-clés : Mesures d’association vectorielle, matrice de corrélation, lois
elliptiques,
loisasymptotiques,
testsd’hypothèses.
ABSTRACT
Three measures of multivariate association are constructed
using
the correlation matrix.These measures are utilised to test the lack of multivariate association of two vectors
of elliptical
distributions. The
asymptotic
distributions of the measures are obtained under thehypothesis
of lack of multivariate association and under a sequence of alternatives from the
asymptotic
distribution of the correlation matrix. The tests are illustrated
by
anexample
and anempirical study
isperformed
to compare the new tests with those based on the covariance matrix.Keywords :
Multivariate association, correlation matrix,asymptotic
distributions,elliptical
distributions,hypothesis testing.
1. Introduction
On veut
éprouver l’hypothèse
nulle d’absence de liaison entre deux vecteurs aléatoires dont la loiappartient
à la famille des loiselliptiques.
En utilisant la matrice de covarianceéchantillonnale,
Muirhead(1982)
aproposé
un testasymptotique
pour tester l’absence de liaison entreplusieurs
vecteurs aléatoires. Dans le même contexte,en utilisant la mesure d’Escoufier
(1973)
basée sur la matrice decovariance,
Cléroux& Ducharme
(1989)
ontproposé
un autre test pour l’absence de liaison entre deux vecteurs aléatoires.À partir des
mesures d’Escoufier(1973),
de Stewart & Love(1968)
et Cramer & Nicewander
(1979),
Allaire &Lepage (1990)
ontgénéralisé
le travailde Cléroux & Ducharme
(1989)
enproposant
trois autres tests pour tester l’absence de liaison entreplusieurs
vecteurs aléatoires.En
pratique,
il arrive souvent que l’échelle des variables n’est pas la même et que les variancesrespectives
sont très différentes. Pourpallier
à ceproblème,
on centre etréduit
chaque
variable afin de donner unpoids égal
à chacune d’elles dansl’analyse.
Dans de telles
situations,
la mesure d’Escoufier(1973)
et la mesure de Stewart &Love
(1968)
ne sont pasappropriées puisqu’elles
ne sont pas invariantes sous des transformations linéaires des vecteurs d’observations. Ceproblème
adéjà
été soulevé par Allaire &Lepage (1990)
et aussi parRoy
& Cléroux(1993).
Pour yremédier,
on
applique
les mesures d’Escoufier(1973),
de Stewart & Love(1968)
et Cramer &Nicewander
(1979)
à la matrice de corrélationplutôt qu’à
la matrice de covariance.On en déduit trois nouveaux tests
asymptotiques
pouréprouver
l’absence de liaison entre deux vecteurs aléatoiresprovenant
d’une loielliptique.
La loiasymptotique
des mesures est obtenue sous
l’hypothèse
nulle d’absence liaison(Théorème 3)
etsous une suite d’alternatives
convergeant
versl’hypothèse
nulle(Théorème 4).
Cesrésultats
originaux reposent
sur la connaissanceexplicite
de la matrice de covariance de la loiasymptotique
de la matrice de corrélation d’un échantillonprovenant
d’une loielliptique (Théorèmes
1 et2).
Unexemple
illustre les nouveaux tests et une étudeexpérimentale permet
de comparer les niveaux et lespuissances
des trois tests baséssur la matrice de corrélation à ceux construits à
partir
de la matrice de covariance.2. Notation
Soit X =
(X(1),
...,X(p), X(p+1), ..., X(m))’
un vecteur aléatoire de di- mension m, de matrice de covariance E =(03C3(k,l))
et de matrice de corrélation P =(03C1(k,l))
oùpCk,l) = 03C3(k,l)/03C3(k,k) 03C3(l,l), k
et l =1, ..., m. À partir
d’unéchantillon
Xl,..., Xn,
on construit les matrices de covarianceempirique
S =(skl)
et de corrélation
empirique
R =(rkl)
où rkl =skl/skk sll, k
et l =1,...,
m. Onpartitionne
le vecteur X en deux sous-vecteursX[1]
etX[2]
de dimensionrespective
p et q
(p
+ q =m)
et les matrices P et R :où P11 : p p et R11 : p p.
Les mesures d’Escoufier
(1973),
de Stewart & Love(1968)
et de Cramer &Nicewander
(1979) appliquées
à la matrice de corrélation échantillonnale sont pour la mesure d’Escoufier(1973)
pour la mesure de Stewart & Love
(1968)
pour la mesure de Cramer & Nicewan- der
(1979),
où on a tenucompte
que Notons que ce derniercoefficient est
identique
à celui que l’on obtiendrait si l’onremplaçait
lesRij
par lessij -
Au niveau de la
population,
si onapplique
les mêmes mesures à la matrice decorrélation,
on obtientpour la mesure d’Escoufier
(1973),
pour la mesure de Stewart & Love
(1968)
pour la mesure de Cramer & Nicewan-
der (1979).
Les trois nouvelles mesures construites sont invariantes au
changement
deposition
et d’échelle etpossèdent
lespropriétés
suivantes :(i) pM(R)
= 0 si et seulement siP21
=0,
pour M =RV,
SL et CN.(ii) Lorsque
p = q =1,
les trois mesurescorrespondent
au carré du coefficient de corrélationsimple
entre les variablesX(l)
etX(2).
(iii) 0 03C1M(R) 1,
pour M =RV,
SL et CN.(iv) M(R)
est un estimateurconvergent
depM(R)
pour M= RV,
SL et CN.3. Distribution
asymptotique
den 1 / 2
vec R.La distribution
asymptotique
deVii
vecR,
où vec R est le vecteur obtenu enempilant
les colonnes de la matriceR, qui
estprésentée
dans le casgénéral
parSteiger
& Hakstian
(1982)
nepermet
pas d’obtenir les éléments de la matrice de covarianceasymptotique
de ce vecteur comme fonction des éléments de la matrice de corrélation de lapopulation P,
autrement dit comme fonction seulement des moments d’ordre deux. En faisantl’hypothèse d’ellipticité,
onpeut
donner uneexpression
matriciellequi dépend
de P pour cette matrice de covarianceasymptotique.
THÉORÈME 1. Soit R la matrice de corrélation d’un échantillon de taille n issu d’un
vecteur aléatoire X =
(Xl,
...,Xm)’
dont la loi estelliptique
deparamètres
03BC etV,
de matrice de corrélation P et decoefficient d’aplatissement
03BA. Alors la loiasymptotique, lorsque
n~ ~, den(vec
R -vec P)
est une loi multinormaleNm2 (0, (1
+k)039B)
avec
m
où la matrice I
désigne
la matrice identité m x m, EHii
~Hii
avecHij,
i=1
i, j
=1,
..., m, étant la matrice m x m ayant 1 à laposition (i, j)
et 0 ailleurs etm m
K =
Kmm = 03A303A3 Hij
0H’ij désigne
la matrice de commutationm2
xm2.
Démonstration.
D’après
le théorème deSteiger
& Hakstian(1982),
on aoù les éléments de
03A9R
sont donnés paret
ainsi,
on obtientOn identifie la matrice à
laquelle correspond chaque
élément du membre de droite de la somme03C9(ij,kl).
On a parexemple
w
03C1(i,k) p(j,l)
est évidemment l’élémentgénérique
de la matrice P 0 P..
p(i,l) p(j,k)
est l’élémentgénérique
de la matrice(P
0P)K.
Eneffet,
si onpose
e’i
=(0,..., 0,1, 0, ..., 0),
le vecteur de dimension m dont toutes lescomposantes
sont nulles sauf la
iième qui prend
la valeur1,
on aDe cette
façon,
onpeut
trouver la matrice àlaquelle appartient
l’élément enquestion. Ainsi,
on obtient que4. Distributions
asymptotiques
den 1/2 vec R21
On veut
éprouver l’hypothèse
nulleHo : P21
= 0. Cettehypothèse n’implique
évidemment pas
l’indépendance
entreX[1]
etX[2]
mais seulement la non corrélationentre
X[1]
etX[2].
Considérons aussi la suited’hypothèses
alternativesoù A est une matrice donnée de dimension q x p, i = p +
1,..., m et j
=1,
.., p.La loi
asymptotique
devn
vecR21
sousHo
et sous la suiteHl:n convergeant
vers
Ho
se déduit comme casparticulier
de lapremière partie
du théorème suivantqui donne,
àpartir
du théorème1,
la loiasymptotique
devn
vecR21
avec uneexpression
matricielle pour la matrice de covariance
asymptotique.
THÉORÈME 2. Sous les conditions du théorème
1,
on aoù pour
désigne
la matrice de commutation qp x qp.converge en loi vers une loi multinormale
(iii)
SousH1:n, n
vecR21
converge en loi vers une loi multinormaleDémonstration.
(i)
Soit la matrice B =B1
~B2
avecB, - [Ip 0] :
p x m etB2
=[0 1q] : q
x m.Alors, B
vec R =(Bi (& B2)
vec R = vec(B2 RB’)
= vecR21
et
d’après
le théorème1,
on obtient quen(vec R21 - vec P21)
converge en loi versArpq (0, (1
+03BA) B A B’).
Il suffit alors
d’expliciter
la matrice B039BnB. Pourcela,
onreprend
terme à termela somme des matrices constituant A.
Considérons par
exemple
la matrice(7 0 P) E (P
0P)E(I
(g)P)
et calculonsla
première
matrice :puisque
avec
Dtt :
p xp ayant
1 à laposition (t, t)
et 0 ailleurs.De
même,
on a0
Donc si t > p ou s > p, on obtient A = 0.
Pour 1 t p et 1 s p, on a
d’où
et
Ainsi,
on aEn
remarquant
que certaines matrices de A sont destransposées
d’autres et queKmm (B’1
Q9B’2) = (B’2 ~ B) Kqp,
on obtient par le même calcul le résultat cherché.(ii)
SiHo
estvraie,
c’est-à-direP21
=0,
on a alors(iii) D’après
lapartie (i), yin
vecR21
converge en loi vers une loi multinormale dont la matrice de covariance est(1 + 03BA)P11
0P22, puisque
tous les termes de lamatrice
D,
autre queP11
0P22,
contiennentP12
ou satransposée
et que les éléments de cette matrice sont parhypothèse
de la forme aij/ n,
pour i = p +1,
..., m etj = 1, ...,p.
D’autre
part,
en substituant la valeur deP21,
on déduit queyin
vecR21
convergeen loi vers une loi multinormale de moyenne vecA. Par
conséquent,
parSerfling (1980) (voir
lemmeA, p.20), yin
vecR21
converge en loi vers une loi multinormaleNpq(vec A, (1
+03BA) P11
0P22)
.c.q.f.d.
On remarque que pour m = 2 et pour p et r
désignant respectivement
lecoefficient de corrélation de la
population
et del’échantillon,
on aet on retrouve le résultat,
(voir
Muirhead(1982».
5. Distributions
asymptotiques
des mesuresAvec les résultats de la section
précédente,
onpeut
établir les loisasymptotiques
des
nRV (R) , nSL(R)
etnCN (R)
sousHo
et sousHl:,, convergeant
versHo.
THÉORÈME 3. Soit R la matrice de corrélation d’un échantillon de taille n issu d’un
vecteur aléatoire X =
(X1, ..., Xm)’
dont la loi estelliptique
deparamètres
li etV,
dematrice de corrélation P et de
coefficient d’aplatissement
r,.Alors,
sousl’hypothèse Ho,
on aoù les variables aléatoires
Ukj
sontindépendantes
et de même loiN(0, 1),
k -1, ..., p et j
=1,
..., q,indépendantes
et de même loiX2
avec qdegrés
deliberté,
avec
03BBk,
k =1,
..., p, et03BCj, j
=1,
..., q, étant les valeurs propres deP11
etP22 respectivement.
Démonstration.
Puisque
les matricesR11
etR22 convergent
enprobabilité
respec- tivement versPl,
etP22, n
vecR21
converge en loi vers le vecteur aléatoire Z de loiNpq(O, (1+03BA)(P11~P22))
et comme onpeutécrire n
tr(R12R21) = (n vec R21)’
(n
vecR21),
avec
Àk, k
=1,
..., p, et03BCj, j = 1,
..., q, étant les valeurs propres deP11
etP22 respectivement
et les variables aléatoiresUkj
sontindépendantes
et de même loiN(0, 1), 03BA
=1,
..., pet j
=1,...,
q. La démonstration s’achève enremarquant
queTHÉORÈME 4. Si les conditions du théorème 3 sont
satisfaites,
alors sousHl:n,
on a1. nRV
(R) f-
1 + 03BA p q03BBk
03BCj
2
où les variables aléatoiresl. nRY ~
t
r(P211) tr (P222) 03A303A3 03BBk03BCj U2kj,
où les variables aléatoiresUkj
sontindépendantes
et de loiN(03B4kj, 1), k - 1, ..., p et j
=1,
..., q,2.
nSL(R) ~ 1 + 03BA p 03A3 03BBk~2k(q)(03B42k),
où les variables aléatoires~2k(q)(03B42k),
k =
1,..., p,
sontindépendantes
et suivent des lois~2
décentrées avec qdegrés de
libertéet paramètre de
décentralité03B42k,
3.
nCN(R)~ 1 + k p ~ 2pq (03B42),
où la variable aléatoirex2 b2
suit une loix2
avec pq
degrés de
libertéet paramètre de
décentralitéb2,
les 03BBk,
=1,..., p,
et03BCj, j
=1,..., q, étant les valeurs propres de P11 et P22 respectivement,
aket bj
leurs vecteurs propres orthonormés associés etDémonstration. La démonstration est
analogue
à celle du théorème 3 avec unparamètre
de décentralité introduitpuisque
le vecteur de la moyenne de la loiasymptotique
deyin
vecR2l
est non nul.En
effet, désignons
par aket bj
les vecteurs propres orthonormés associésrespectivement
àÀk
et Iij. Le vecteurVkj = ak 0 bj correspond
alors au vecteurpropre orthonormé associé à la valeur propre
03BBk03BCj.
On a alors(voir
Baldessari(1967»
le
paramètre
de décentralitéavec k = 1, ..., p et j = 1, q.
Pour
SL, bj
= ej =(0, ..., 0,1, 0, ..., 0)’
E IRq est un vecteur propre associé à la valeur propre 1 demultiplicité
q; on a le résultat en sommantsur j
les03B42kj
carUkj,
k =
1,
..., p, sontindépendantes.
PourCN, ak =
ek =(0, ...,0,1,0, ...,0)’ E
IRPest un vecteur propre associé à la valeur propre 1 de
multiplicité
p; le résultat s’obtienten effectuant la double sommation.
c.q.f.d.
6. Tests et
applications
Le théorème 3
permet
de construire trois testsasymptotiques
pour testerl’hypothèse
nulleHo. À
l’aide des mesures d’Escoufier(1973),
de Stewart & Love(1968)
et Cramer & Nicewander(1979),
lesrégions critiques
des tests de niveauasymptotique
a sont donnésrespectivement
paroù
C(h)03B1, pour h
=1, 2, 3,
est lequantile
d’ordre 1 - oz de la loicorrespondante
donnée par le théorème 3.
On a
M(R) ~ 03C1M(R) lorsque
n ~ ~, pour M =RV,
SL ou CN.Lorsque Ho
estfausse, pM(R)
> 0 et alors pour M =RV,
SL ou CN et h =1, 2, 3,
on conclut que limP (nM (R)
>C(h)03B1) =
1. Les trois testsproposés
sont doncconvergents.
Cependant,
la fonction derépartition
d’une sommepondérée
de loisX2 indépendantes
nepossède
pas une formeexplicite.
On évaluenumériquement
lesquantiles
donnés par le théorème 3 à l’aide del’algorithme
d’Imhof(1961)
dont unprogramme en Fortran est donné dans Koerts & Abrahams
(1969).
Puisqu’en général
certainsparamètres
sontinconnus,
on lesremplace
par des estimateursconvergents,
c’est-à-direPll, P22,
03BCl etÀk
sontremplacés
parRu, R22
et leur valeurs propresrespectives Pl
etk.
Dans une étudefaite,
dans un cadregénéral,
parRoy
& Cléroux(1993)
laprécision
des valeurscritiques
obtenuespar
l’algorithme
d’Imhof(1961)
enremplaçant
lesparamètres
inconnus par des estimateursconvergents
estanalysée.
Les auteurs montrent que le niveau obtenuen utilisant
l’algorithme
d’Imhof(1961)
converge enprobabilité, lorsque
n ~ oo,vers le niveau nominal.
Un
exemple. L’exemple qu’on
considère ici a été traité par Cléroux &Ducharme
(1989)
en utilisant la mesure d’Escoufier(1973)
basée sur la matricede covariance.
Toutefois,
les donnéesindiquent
que les variances des variables sont très différentes et n’ont pas la même échelle de mesure. Même si on centre et réduitchaque variable,
on nepeut appliquer
la mesure d’Escoufier(1973)
oucelle de Stewart & Love
(1968),
basées sur la matrice de covariance échantillonnale parce que ces mesures ne sont pas invariantes parrapport
aux transformations linéaires.Mais,
basées sur la matrice de corrélationéchantillonnale,
les trois mesuressont invariantes aux
changements
d’échelle et deposition
et parconséquent,
elless’appliquent parfaitement
à cetexemple.
Cettepropriété
constitue unavantage important
parrapport
aux testsparamétriques
d’absence de liaisonproposés
par Cléroux & Ducharme(1989)
ou par Allaire &Lepage (1990). D’ailleurs,
les derniers auteurs soulèvent ceproblème
de la nature de la matrice utilisée par les trois mesures.On considère donc l’ensemble de données de
Werner, Tolls,
Hultin & Mellecker(1970).
Les données sont constituées des résultatsd’analyses sanguines
de 188patients.
Pourchaque patient,
on mesure 8 variables :âge, taille, poids,
utilisation depilule anticonceptionnelle, cholestérol, albumine,
calcium et acideurique.
Lavariable
pilule anticonceptionnelle, qui
est une variablebinaire,
n’est pas considérée ici. Deplus,
7 vecteurs sont omis à cause d’observationsmanquantes. Ainsi,
la taille de l’échantillon est réduite à n = 181. Les 7 variables considérées seregroupent
naturellement en deux sous-ensembles de variables. Lepremier
estdésigné
par le sous-vecteur
X[1]
constitué des troispremières
variables(biologiques).
Ledeuxième est
désigné
par le sous-vecteurX[2]
constitué desquatre
dernières variables(biochimiques).
On a donc deux sous-vecteurs de dimensionrespective
p = 3 et q = 4(avec p + q = m = 7).
À
l’aide de chacun des trois testsproposés,
onrejette
très fortement la non-association entre les deux sous-vecteurs. Le tableau 1 donne les différentes valeurs des
statistiques correspondantes,
leurspoints critiques
au niveau nominal 5 % et les niveauxcritiques.
TABLEAU 1
Tests d’absence de liaison basés sur la matrice de
corrélation, points critiques
et niveauxcritiques
7.
Étude expérimentale
À
l’aide d’unesimulation,
on va évaluer lecomportement
des trois testsdéveloppés précédemment
et les comparer aux trois testscompétiteurs,
basés sur lamatrice de covariance
nM(C),
M =RV,
SL etCN,
étudiés par Allaire &Lepage (1990). Rappelons
queCN(R)
=CN(C).
On utilise la méthode de Monte Carlo pour comparer le niveau et la
puissance expérimentalement.
Cette étude est réalisée à titre indicatifpuisqu’on
se limiteseulement au cas p =
2,
q = 2(p
+ q =m)
et au niveau 5 %. Le nombre d’échantillonsgénérés
est 10000 pour troistypes
de lois multivariéeselliptiques :
uneloi
multinormale,
deux lois multinormales E-contaminées(E
=0,05
et0,1)
et deuxlois t multivariées de
degrés
de liberté 25 et 5respectivement.
Elles sont utiliséesavec la même matrice de covariance E telle que
où les matrices
Cxy représentent
les matrices p x q dont tous les éléments sontégaux
à
0,
xy. Parexemple,
tous les éléments deC15
sontégaux
à0,15.
Cetype
de matrices de covariance a été utilisé parCléroux, Lazraq
&Lepage (1995).
Ainsi,
les lois utilisées sont les suivantes. La loi multinormaleN4 (0, E)
avec uncoefficient
d’aplatissement k =
0. La loi multinormale 6-contaminéepeut
s’écrirecomme
(voir
Johnson(1987), p.55)
En fixant
a2 = 0, 25
et en considérant E =0, 05
et E =0, 1,
on obtientrespectivement
03BA =
0, 028
et 03BA =0, 059
car(voir Muirhead (1982), p.49).
La loi t multivariée avec vdegrés
de liberté etparamètre
V s’obtient
(voir
Johnson(1987),p. 118)
paroù Z suit une loi
N4(0, V),
S suit une loiXI,
Z et S sontindépendantes,
E =
03BDV/(03BD - 2)
et 03BA =2/(03BD - 4).
Parconséquent,
pour v = 25 et v = 5 on trouverespectivement r, 0, 095
et 03BA = 2. On a choisi v = 5 afin de considérer uneloi dont les ailes sont
plus
relevées que celles d’une loi multinormale.Afin de
générer
des nombresaléatoires,
on a utilisé le programme GGNSMprovenant
de laprogrammathèque
IMSL. On a ainsigénéré
10000 échantillonsindépendants
selon la loimultinormale,
loi multinormale E-contaminée(E
=0, 05
et E =
0,1)
et les lois~225
et~25
pour obtenir les observations désirées. Des tailles échantillonnales de50, 100, 150, 200, 250,
300 et 1000 sont considérées.Les tableaux 2 et 3
présentent
les résultats de la simulation pour lescinq
lois.Les lois y sont
disposées
selon l’ordre croissant de leur coefficientd’aplatissement.
De la loi multinormale à la loi
t5,
on a K =0, 0,028, 0,059, 0,095
et 2. Afin depouvoir juger
du niveauexpérimental
descinq
testsasymptotiques
et de leurpuissance expérimentale,
un niveauexpérimental
serajugé acceptable
si le niveau nominal 5 %appartient
à l’intervalle de confiance au niveau 95 %. Ceci sera réalisélorsque
le niveauexpérimental, correspondant
à la colonneCoo,
varie entre 45610-4
et 54410-4.
Les résultats de cette étude font
apparaître
que pour des loisprésentant
desailes
plus
relevées que celles d’une loimultinormale,
les niveauxexpérimentaux
ne sont
acceptables
que pour de trèsgrandes
tailles échantillonnales. Pour cetype
delois,
lescinq
testsasymptotiques convergent lentement,
en fonction de la taille n, vers un niveauacceptable. Cependant,
les tests basés sur la matrice decorrélation échantillonnale
convergent plus rapidement
que ceux basés sur la matrice de covariance échantillonnale. Ceci est mis en évidence par l’étudeexpérimentale
avecla loi
t5
dont le coefficientd’aplatissement
est 2. Onpeut
le constater en examinant les résultatsexpérimentaux
pour la loit5
donnés dans le tableau 2 et notamment dans le tableau 3 pour la taille 1000. Il ressort donc de cette étudeexpérimentale qu’on
devrait utiliser ces tests avec
prudence lorsque
lapopulation sous-jacente
suit une loielliptique
avec des ailesplus
relevées que celles d’une loi multinormale.TABLEAU 3
Niveau
expérimental ( x 10000)
des tests au niveau nominal 5 % pour n = 1000 etdifférentes
lois. -Quant
à lapuissance expérimentale,
mis àpart
le cas de la loit5
où lescomparaisons
nepourraient
se faire que pour de trèsgrandes
tailleséchantillonnales,
on
peut
conclure queglobalement
les deux groupes de testsnM (R)
etnM(C),
pour M =RV,
SL etCN,
sontéquivalents. Aussi,
on note que dans lescinq
cas, lapuissance expérimentale
dechaque
test croît au fur et à mesurequ’on s’éloigne
del’hypothèse
nulleCoo,
c’est-à-dire que lapuissance expérimentale
croît avec la valeurxy des matrices
Cxy.
Deplus, plus
ons’éloigne
del’hypothèse
de multinormalitéplus
la
puissance expérimentale
descinq
tests diminue. Elleapparaît
comme une fonctiondécroissante du coefficient
d’aplatissement.
De
façon générale,
onpeut
dire que le test construit avec la mesure de Cramer& Nicewander
(1979) (c’est-à-dire
les testsnCN(R)
=nCN(C»
secomporte
mieux que ceux construits avec les deux autres mesures. Il stabilise le niveauexpérimental
àun seuil
acceptable,
et deplus,
sapuissance expérimentale augmente plus rapidement
que pour ceux avec les deux autres mesures.
Références
ALLAIRE
J.,
LEPAGEY., (1990),
Tests de l’absence de liaison entreplusieurs
vecteurs aléatoires pour les distributions
elliptiques. Statistique
etAnalyse
desDonnées, 15, 3,
21-46.BALDESSARI
B., (1967),
The Distributionof Quadratic
Form of Normal Random Variables. Ann. Math.Statist, 38,
1700-1704.CLÉROUX R.,
DUCHARMEG., (1989),
Vector Correlation forElliptical
Distribu-tions. Commun.
Statist.-Theory Meth., 18(4),
1441-1454.CLÉROUX R., LAZRAQ A.,
LEPAGEY., (1995),
Vector Correlation Based on Rank anda Nonparametric
Test of no Association Between Vectors. Commun. Statist. -Theory meth., 24(3),
713-733.CRAMER
E.M.,
NICEWANDERG.R., (1979),
SomeSymetric
Invariant Measureof Multivariate Association.
Psychometrika, 49,
403-423.ESCOUFIER
Y., (1973),
Le Traitement des variables vectorielles.Biometrics, 29,
751-760.IMHOF
P., (1961), Computing
the Distribution ofQuadratic
Forms in Normal Variates.Biometrika, 48,
419-426.JOHNSON
M.E., (1987),
Multivariate StatisticalSimulation,
JohnWiley,
New York.KOERTS
J.,
ABRAHAMSA.P.J., (1969),
On theTheory
andApplication of
theGeneral Linear
Model,
RotterdamUniversity
Press.MUIRHEAD
R.J., (1982), Aspects of
Multivariate StatisticalTheory,
JohnWiley,
New York.
ROY
R., CLÉROUX R., (1993),
Vector Cross-Correlation in Time Series andApplication,
International StatisticalReview, 61, 3,
447-464.SERFLING
R.J., (1980), Approximation
Theoremsof Mathematical Statistics,
JohnWiley,
New York.STEIGER
J.H.,
HAKSTIANA.R., (1982),
TheAsymptotic
Distribution of Elements of a Correlation Matrix :Theory
andapplication.
British Journalof Mathema-
tical and Statistical
Psychology, 35,
208-215.STEWART
D.,
LOVEW., (1968),
A General Canonical Correlation Index.Psycho- logical Bulletin, 70,
160-163.WERNER