R ÉMY V IREDAZ
Sur l’invariance de l’indice de redondance
Mathématiques et sciences humaines, tome 57 (1977), p. 59-75
<http://www.numdam.org/item?id=MSH_1977__57__59_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1977, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
SUR
L’INVARIANCE
DEL’INDICE
DEREDONDANCE 1
Rémy
VIREDAZ1. La méthode des
corrélations canoniques 2,
ouanalyse canonique,
estune méthode de
statistique multivariée destinée
à mesurer et éventuelle-ment à
analyser
larelation
entre deuxjeux
de variables X et Y surune
même population.
Ilpourrait s’agir
parexemple d’un jeu
de variablesdécrivant
desconditions socio-professionnelles d’une part,
et d’unjeu
de
variables décrivant
lasymptomatologie psychiatrique d’autre part,
observés surl’ensemble
des consultantsd’une policlinique psychiatrique pendant
unecertaine période.
Le
procédé
est lesuivant.
On cherched’abord
unecombinaison
liné- airefl
desvariables
dupremier jeu
et unecombinaison linéaire
gl des variables du secondjeu
telles que lacorrélation
def,
et g, soitmaximale;
celle-ci estappelée
lacorrélation canonique
des deuxjeux
de variables X et Y.1
On chercheensuite
deuxcombinaisons
liné- airesf2
et g2 définies de lamême façon
mais sous lacondition
que toutes deuxsoient orthogonales (sans corrélation)
aussibien
àfi qu’à
gl ; et ainsi de
suite
paritération.
Pour mesurer la
relation
entre les deuxjeux
de variables X etY ,
ons’est vite
renducompte
que lacorrélation canonique convient
mal :1. Cet
article
estissu
d’uncolloque
tenu àl’Ecole
des Sciences socialeset
politiques
del’Université
deLausanne, chaire
deMathématiques
pour lessciences humaines,
àl’instigation
duprofesseur Georges
Leresche.2. On pourra
consulter,
enfrançais, Caillez
etPagès (1),
et Lebart etFénelon
(2).
comme elle ne fait
intervenir qu’une
seulepaire
defacteurs,
ellepeut
trèsbien être
fortemême si globalement
les deuxjeux
ont peu de rela-tion
entre eux - carfl
et glpeuvent être
fortement corrélésentre eux tout en étant des facteurs
relativement "marginaux"
à l’inté-rieur de leur propre
jeu.
On a doncintroduit
une autrequantité,
appe- lée laredondance
dupremier jeu
devariables
étant donné le second.Cette
quantité peut
se calculer de deuxfaçons :
soit comme moyenne des carrés descorrélations multiples
entre les variables dupremier jeu
et le second
jeu (formule
A ci-dessous§ 4), soit
comme somme des"indi-
ces de
redondance"
attachés àchaque
facteur dupremier jeu (formule B).
- On calcule
symétriquement
la redondance du secondjeu
étant donné lepremier.
-Comme,
pardéfinition,
la moyenne des carrés des corrélations mul-tiples (A)
estindépendante
de la méthoded’orthogonalisation utilisée,
on
peut
se demander si(ou :
dansquelle mesure)
la somme des indices deredondance
(B)
en estindépendante
elle aussi.D’après Miller
et Farr(4)
ellel’est,
et dans tous les cas; mais leur démonstration est erronée(v.
§4)
et leurexemple
estparticulier
(facteurs principaux).
Leproblème
reste doncposé.
2. Nous le
traiterons géométriquement,
en utilisant lefait
que, surl’espace
vectoriel des variables de moyenne nulledéfinies
sur une popu-lation
donnéeP ,
lacovariance
est unproduit scalaire. Arrêtons-nous
un moment sur ce
point.
Soit P
unepopulation d’effectif
N . Unevariable (numérique)
xsur P est une
application
de’ P dans le corps des nombres réels 1R : àchaque individu
a de P estassocié
unnombre, appelé
score de aet noté
x(a) . Définissons
la somme de deuxvariables
x et y comme lavariable
x + yqui
associe à a le scorex(a)
+y(a) ,
leproduit
d’une variable
x parun’nombre
k comme lavariable
k xqui associe
à a le score k
x(a) ,
et leproduit
de deux variables x et ycomme la variable x y
qui
associe à a le scorex(a) y(a) .
Le; deuxpremières
de cesopérations
font del’ensemble
des variables sur 1 un espacevectoriel;
etl’ensemble
desvariables
de moyenne null.e en Est un sous-espace.Sur un tel espace
vectoriel,
onpeut toujours
introduire unproduit
scalaire
et parlà-même
unemétrique (longueurs, angles). Rappelons qu’un produit scalaire
associe à toutcouple
de vecteurs(x; y)
unnombre,
noté x·y , et ceci de manière
bilinéaire (linéaire
en x etlinéaire
en
y ), commutative (x-y = y.x),
etdéfinie-positive ( x·x
estpositif,
et nul seulement si x est le vecteur nul - en
l’occurrence,
si tousles individus de P ont le
même
score 0 pour lavariable x ).
Pourla
statistique -
étant donné les formules de la moyenne, de lavariance
et de la covariance - il
convient
dechoisir
commeproduit
scalaire lamoyenne de la
variable-produit (il
est facile devérifier
quec’est bien
un
produit scalaire) :
En
particulier,
lacovariance
de deuxvariables
x et y sera leproduit scalaire
des variables de moyenne nulleassociées
à x et à y . La covariance est comme leproduit scalaire
une formebilinéaire
commuta-tive,
mais ellen’est
pasdéfinie-positive ( cov(x, x) =
0n’implique
pas que x
soit
nul : ilsuffit
que tous lesindividus
de Paient
lemême
score pourx ).
Mais sur le sous-espace desvariables
de moyenne nulle ces deux formes bilinéairess’identifient.
Comme nous neconsidére-
rons que des variables de moyenne
nulle,
nous pouvons dire que la cova-riance de deux telles variables x et y est
simplement
leproduit
sca-laire x· y .
On a dès lors les
équivalences suivantes
entreconcepts géométri-
ques et
statistiques :
etc.
En
particulier,
la méthode des corrélationscanoniques peut être présentée
commesuit. Soient
X et Y deuxfaisceaux
de vecteurs(dans
un espace
multidimensionnel).
On cherched’abord
un vecteurfi
situédans le sous-espace
engendré
parX ,
et un vecteur gl situé dans le sous-espaceengendré
parY ,
tels quel’angle
entrefl
et glsoit minimum. (Dans
le casparticulier
où X serait forméd’un
seul vecteur,et Y de deux vecteurs, on
obtiendrait
ainsil’angle
entre ladroite
définie
par X et leplan défini
par Y.)
On cherche ensuite deux vec-teurs
f2
et g2définis
de lamême façon
mais sous lacondition
que tous deuxsoient orthogonaux aussi
bien àfi qu’à
gl ; etainsi
de suite.3. Nous
utiliserons
lesnotations suivantes.
Soient :
deux
systèmes
devecteurs normés
(c’est-à-dire
delongueur unité);
(X)
et(Y)
les sous-espacesqu’ils engendrent;
deux bases ortho- normées
quelconques
de(X)
et(Y) .
(Si l’espace vectoriel considéré
estcelui
des variables de moy-enne nulle sur une
population,
X et Y sont deuxjeux
devariables préalablement standardisées (moyenne nulle, variance unité),
et F etG deux
jeux complets
de facteursorthogonaux.)
Posons
projection orthogonale
dexi
sur(Y) ,
et demême
fi
etinversement
Yj’ gk
celles deYj’ gk
sur(X) .
"h J k J
gk
La
he composante ("saturation")
dex.
dans la base F estx. ih
==
x.-f ; 1 h
i h lake
composante de 1 dans la base G estx’
1 = 1gK
=On
définit
demême
On
écrira
X-Y la matrice desproduits scalaires
de X etY ,
c’est-à-dire
lamatrice
dontl’élément
enligne
i etcolonne j
estxi·y..
1 J(Comme x.
i ety.
j sont delongueur 1 ,
’xi·y,
i j est uncosinus,
en
statistique
unecorrélation :
X.Y est ennotation statistique RXY .)
Par
"variance"
deX ,
on entendra la somme desvariances
des va-puisque
lesx. i
sont nor-1
més). C’est
la somme des carrés deslongueurs
des vecteurs du"faisceau"
X .
On
abrégera l’expression fréquente "proportion
devariance
de aexpliquée
parb " (où
a aussibien
que bpeuvent être
soit une va- riable isolée soit unjeu
devariables)
en"pve(a, b)".
Pour
faciliter
lalecture,
lesindices i , j , h ,
k auronttoujours
lemême
rôle queci-dessus (p.ex.,
il seratoujours
entendu que i se rapporte aux vecteurs dusystème
X et va de 1 àp ). Quand
lesfacteurs des deux
jeux
sontappariés,
commec’est
le cas des facteurscanoniques,
h etk
seront souventremplacés
par & .4.
Considérons
alors lesquantités
A est la
proportion
devariance
de Xexpliquée
parY ,
ou moy-enne des carrés des corrélations
multiples
entre lesxi
et(Y) .
B
s’obtient
encalculant,
pourchaque
facteur leproduit pve(X, fh)
> xpve(fh, Y) ,
et enadditionnant
cesproduits.
Selon Miller et Farr
(4),
p.317,
il résulted’un certain "théorème
demultiplication"
que cespve(X, fh)
h xpve(fh,
hY)
sont les contribu-tions
dechaque fh
àpve(X, Y) ,
de sorte que Bserait égal
àA ,
et
ceci, indépendamment
de F et G(c’est-à-dire, quelle
quesoit
laméthode
d’orthogonalisation choisie).
Cethéorème, s’il était vrai,
se-rait
extrêmement intéressant :
eneffet, puisque A ,
pardéfinition,
nedépend
pas des bases F etG ,
il aurait pourcorollaire
que Bn’en
dépend
pas nonplus.
Iln’y aurait
doncplus besoin,
pour démontrerl’in- variance
deB ,
de lalongue ("lengthy") démonstration
deMiller (3) (ce dernier point
sembleavoir échappé
à Miller etFarr).
3.
Miller (3) a-t-il
réellement montré quen’importe quelles
bases F etMais
leraisonnement
de Miller et Farr est incorrect. Unproduit
deproportions
devariance expliquée n’a
aucuneraison d’être
uneproportion
de
variance expliquée.
Le"théorème
demultiplication"
dont ilss’autori-
sent est un théorème
(ou plutôt
unaxiome) qui s’applique
auxprobabilités
d’événements indépendants,
et n’a donc rien à faireici!
Enfait,
unevariance "expliquée" n’est qu’une longueur pro,jetée
aucarré;
or si onprojette
lesxi
surf h
,puis qu’on projette
le résultat sur(Y) ,
onn’obtiendra
engénéral
pas lemême
résultatqu’en projetant
lesxi
sur(Y) directement. 4
La
question
reste doncposée :
est-ce que A = Bindépendamment
de F et de G ?
Comme A et B sont tous deux des sommes
( - ~ ~ ...),
onpeut
pik
même
se demander si cetteégalité
a lieu terme à terme : est-ce quepour tout i et pour tout k ?
Ou,
si cen’est
pas le&...
cas, est-ce que du moins les sommes sur
i ,
ou les sommes surk ,
sontégales
entre elles?Enfin,
au cas où ceségalités
neseraient
pas vraies engénéral,
dans
quels
casparticuliers
le sont-elles?5. Pour
répondre
à cesquestions,
le mieux est de commencer parétudier
un
exemple.
Nous avonspris
p = m = 2 pourX ,
q = n = 3 pour Y . Les bases orthonormées ont lespropriétés
suivantes : G estquelconque;
P
et Q
sont les facteursprincipaux
de X et Yrespectivement;
Uet V sont telles que
h ~
k =>ULV (condition d’"orthogonalité
mutuelle"
encre les deuxjeux
defacteurs, qui
estl’une
desconditions imposées
sur les facteurscanoniques).
G donnent pour B le
même résultat,
commel’écrivent
Miller et Firr(4),
p.318,
ou seulement que les facteursprincipaux
donnent le m~me résultat que les facteurscanoniques?
En tous cas, seule estvraie
laseconde de ces
propositions.
4. La variance
d’un
facteurfh peut
êtrechoisie arbitrairement
(nousl’avons prise égale à 1).
Laprendre égale
à la varianceexpliquée
parfh peut
induire en erreur, mais nechange
rien auraisonnement,
o~~ lalongueur
defh n’intervient
pas. D’ailleurs lesprojections
desfh
ne sont pas
orthogonales
entre elles.Données
artificielles :
(par rapport
à unecertaine
base orthonormée del’espace somme);
(les matrices
de passage sont lesmatrices
decorrélations F*U , X·F ,
(ces
troisdernières matrices
ne sont pasutiles
pour notre propos, maispermettent
des’assurer
quel’exemple
est"suffisamment quelconque").
En calculant la
matrice X.G , puis
en élevant chacun de ses termesau carré - ce que nous noterons
(X·G)2 -
onobtient
lamatrice
desxV2 ik
dont oncalcule ensuite
les sommes deslignes
et les sommes des co-lonnes;
le total estégal
àp A .
Ce calcul seradésigné
par"X
vers Gdir(ectement)"
dans le tableau 1. Onpeut faire
lemême
calcul enrempla- çant
G par V ou parQ .
Le
produit matriciel
des matrices(X-F)2
et(F-G)2
donne la ma-trice des î x2 f,2 ,
dont on calculeensuite
les sommes deslignes
eth
hkles sommes des
colonnes;
le total estégal
àp B .
Ce calcul sera dési-gné
par"X
vers G viaF".
Onpeut
faire lemême
calcul enremplaçant
F( = P )
parU ,
ou G par V ou parQ .
On compare
ensuite chaque
calcul"indirect"
au calcul"direct"
correspondant (tableau 1).
On
procède ensuite
demême
pourY ,
cequi
donne une nouvellesérie d’exemples (tableau 2).
Les calculs ont été faits en valeurs exactes tant que
c’était
pra-ticable, puis
à 4décimales
pardéfaut;
ici les résultats sont arrondisà deux
décimales
pour unemeilleure lisibilité.
6. Outre le fait que A ne
dépend ni
de F ni deG ,
ni B de G(par définition),
les tableaux 1 et 2s’accordent
àfaire apparaître
lesrésultats
suivants :
THEOREME 1
Si les bases
F et G sontmutuellement orthogonales (hlk
=>fh ’ gk"
alors :
Pour tout i, et pour
tout k,
Démonstration.
sih ~ k ,
de sorte que le second membre seréduit
àx2
ik kkf,2 . D’autre part, l’équation
donne,
parprojection orthogonale
surcette somme, pour la même
raison,
seréduit
à il’égalité
à démontrer.Tableau 1
Tableau 2
THEOREME 2
base
F estcelle des facteurs principaux, alors :
Pour tout
k,
etquel
quesoit G,
Démonstration.
Le second membrepeut s’écrire puisque
(he
valeur propre de lamatrice des corrélations X.X).
D’autre part, si
A est lamatrice
des"saturations" factorielles
(X =
AF , avec tA
A =A, matrice diagonale
des valeurspropres),
on a X*G = A
(F-G) , c’est-à-dire
=xi-gk = h a. ih fh-gk .
En
prémultipliant
X.G par satransposée,
ilvient : (G·X)(X·G) -
=
(G-F) tA
A(F-G) = (G-F) l1 (F-G) .
Enlisant
les termesdiagonaux
de cette
équation matricielle,
on a, pour tout 1d’où l’égalité
à démontrer. 1 nCOROLLAIRES
1.1
Si
F esttelle qu’il avec h -é k
=>alors :
Pourtout 2 (et quelle
quesoit la base G’ utilisée pour calculer
effectivement
cesquantités),
(Sommer
sur kl’égalité (1).)
1.2
Si
F et G sontles bases des facteurs canoniques, alors
A = B .(Sommer
sur k et sur il’égalité (1),
etparticulariser
F etG .)
2.1
Si F
et G sontles bases des facteurs principaux, alors
A = B .(Sommer
sur kl’égalité (2),
etparticulariser G .)
2.2 La
formule
Bdonne
avecles facteurs principaux le même résultat
qu’avec les facteurs canoniques.
(Conséquence
de 1.2 et2.1, puisque
A estinvariant.)
On
obtient ainsi
deux théorèmesdéjà
connus(1.2
et2.2), mais
comme
corollaires
de deux théorèmesplus forts,
et avec des démonstra-tions
plus simples.
En
revanche, quand
F estquelconque,
Bpeut
ne pasêtre égal
àA ,
et le tableau 2 en donne unexemple (où Y , X ,
G del’exemple jouent
les rôles desX , Y ,
F de lathéorie).
Le tableau 1 ne con-tient pas de tel
exemple,
parce que nousn’avons
utilisé pour X que des basesparticulières (facteurs canoniques,
facteursprincipaux).
7. La
conséquence pratique
desconsidérations théoriques qui précèdent
est
qu’il
ne semble pas y avoir de sens à utiliserB , ni
sadécomposi-
tion
en somme descontributions
des facteurs dujeu "expliqué",
àsavoir
pour
l’analyse
de donnéesbimultivariées.
Ce
qui
estimportant, c’est
laproportion
devariance
de Xexpli- quée
par Y[ou inversement], c’est-à-dire,
pardéfinition (§3),
la moy-enne des carrés des corrélations
multiples. Celle-ci peut
se calculer par la formule Aquelle
que soit la méthoded’orthogonalisation utilisée,
alors que la formule B ne
s’applique qu’aux
facteurscanoniques 5
ouprincipaux.
Si l’on
veutdécomposer
cetteproportion
devariance expliquée,
ilparaît
naturel del’analyser
en somme descontributions
des facteurs dujeu "expliquant",
non dujeu "expliqué" :
en considérant Y commeexpli-
quant X ,
on veut voir comment les facteurs de Y separtagent
la tâche :Le
fait important
est que cettedécomposition,
elleaussi,
est pos- siblequelle
que soit la méthoded’orthogonalisation,
alors que la décom-position
de B a peud’intérêt puisqu’elle
n’estpossible
que pour des5. Ce que nous
disons
des facteurscanoniques s’applique
enfait
à toutdouble
jeu
de facteurs mutuellementorthogonaux,
seulehypothèse utili-
sée dans le théorème 1.
facteurs
qui
ne sontguère interprétables,
à savoir les facteurscanoni-
ques ou lesfacteurs principaux,
mais non pas des facteursVarimax
oud’autres
facteursaprès rotation.
8. Notons
d’ailleurs
que dans le cas del’analyse canonique
la"mau-
vaise" décomposition
se trouvecoincider
avec la"bonne" :
lescontribu- tions
des facteursdu jeu expliqué, pve(X, f )
xpve ( f ~, Y) ,
sontéga-
les à celles
du jeu expliquant, pve(X , g~) .
. On a en effetoù
r 91
est la~e corrélation canonique,
etd’autre part
(en utilisant
le théorème 1 et le fait quef’ = 0
h 9, sih Z).
En som-mant ces
égalités
suri ,
on obtient laproposition
à démontrer.Cela
signifie
que, dans le casparticulier
des facteurscanoniques,
- ~ x~ r2
nedoit
pas êtreconsidéré
comme lacontribution
def
àp i
191 91 91pve(X, Y) ,
mais comme lacontribution
deg ,
?« , ou ducouple (f ; 9
91 91 Pour les autres méthodesd’orthogonalisation
où les facteurs des deuxjeux
ne sont pas
appariés, l’usage
dedécomposer pve(X, Y)
parrapport
àF ,
au lieu de
G ,
résulted’une
mauvaisegénéralisation.
Même
dans le cas des facteursprincipaux,
où onpourrait
attendreque les
pve(X, fh)
xpve(fh, Y) aient
unesignification, puisque
leursomme donne un résultat
intrinsèque,
cettesignification
esttrop compli- quée
pourêcre intéressante
dans lapratique.
9. A dire
vrai,
onn’a jamais
cherché danspve(X, fh)
xpve(fh, Y)
quelque
chosequi ait
unesignification, mais
seulement une mesure pra-tique
del’importance
d’un facteur parrapport
àl’autre jeu.
On a remar-qué qu’en
mesurantl’importance d’un
facteur parrapport
àl’autre jeu,
ou
importance "externe",
parpve(f, Y) ,
et en cherchant le facteurqui
maximise
cettequantité,
onn’obtient
pas une bonne mesure de l’inter-relation,
ou"chevauchement" (overlap),
entre X et Y - car un facteurà forte
pve(f, Y)
a souvent peud’importance "interne", c’est-à-dire
de faiblescorrélations
avec son proprejeu.
On a doncsuggéré
depondérer
l’importance
externe parl’importance interne,
mesurée parpve(X, f).
Mais
cetteprocédure n’est qu’un emplâtre
sur unejambe
debois,
car
pve(f Y)
=Ifhl 12 n’est même
pas une bonne mesure del’impor-
tance externe : elle
peut être grande
même si lesy.
Jsont,
dans leurensemble,
mal corrélés avec pourvuqu’il
existe unecombinaison linéaire
desyj qui soit proche
defh .
. Une bonne mesure serait, la moyenne des carrés des
corrélations
entrefh
et lesy .
. Notons quec’est précisément
lacontribution
defh
àla redondance totale
(cf.
formule A§4).
Il
n’est
donc pas étonnant que leproduit pve(X,
xpve(f , Y)
soit
sansintérêt.
Comme nousl.’avons
vu,il
estsimplement égal
àpve(X, g~)
pour les facteurscanoniques (ou
autres facteurs mutuellementorthogonaux),
designification
obscure pour les facteursprincipaux,
etsans aucune
signification
pourd’autres
facteurs.En
général,
la redondance deX ,
étant donnéY ,
estdéfinie
dansle cadre de la méthode des
corrélations canoniques,
et àl’aide
de laformule
B ,
et ensuite seulement onsignale
que le résultat estiden-
tique
à celui de la formuleplus simple
A . Laraison
de ce détour estprobablement historique :
ons’est intéressé d’abord
à lacorrélation
canonique (au carré) pve(fl, Y) , qu’on
a ensuite"corrigée" (§9)
en unindice
de redondancepve(X, fi)
xpve(fl, Y) , complété
à son tour enf )
xpve(f , Y)] = B ,
formulejustifiée
aposteriori
par leQ
Qthéorème B = A . Mais il est en tout
point préférable
dedéfinir di-
rectement
A , indépendamment
de la méthode descorrélations canoniques,
et de
reléguer
B aux oubliettes.10. En
résumé,
il semblerecommandable,
pourl’analyse bimultivariée,
une
fois extraits
des facteursorthogonaux,
dere pas calculer ladécompo- sition
de la formuleB ,
mais de calculer les deux redondances totalescomme
Ces calculs donnent comme résultat
intermédiaire l’importance
externe des
facteurs,
tandis
que leurimportance interne
est donnée parIl ne semble pas que cela ait un sens de
multiplier l’importance
externepar
l’importance
interne : il estplus
clair de lesgarder séparées.
Cette
procédure
laisselibre
dechoisir
la méthoded’orthogonalisa-
tion qui paraît
lemieux
convenir auproblème
considéré.Il. Effectuons ces
calculs,
pour notreexemple,
dans le cas des facteursprincipaux ( F
et G sont doncici
les P etQ
du§ 4).
Il faut calculer pour cela les sommes des colonnes des matrices
(X-F)2 , (Y-G)2 (Y·F)2 , (X-G)2 (notation
définie§ 5),
etdiviser
ces sommes par p
(= 2)
ou par q(= 3)
selon le cas(tableau 3).
12. La remarque
faite
ci-dessus§
9 ausujet
depve(f, Y)
nous amèneà une autre remarque au
sujet
del’analyse canonique
engénéral.
On aremarqué
que cetteméthode, maximisant pve(f, Y)
etpve(g, X) ,
nedonne
généralement
pas des facteursinterprétables
et utiles(4,
p.314).
La
raison n’en
est pasqu’il s’agit d’une "maximisation purement
mathé-matique" (ibid.) :
unemaximisation
esttoujours purement mathématique
par
nature,
et pourtant ellepeut
donner des résultatsinterprétables
ouutiles si le
critère
àmaximiser
est bienchoisi.
Les raisons sontplutôt
celles-ci :
1°
un facteur nepeut
pasmaximiser
à la fois un critèred’importance interne
et un facteurd’importance
externe, de sortequ’un
facteur
canonique n’a
aucune raisond’être
un facteurimportant
dans sonIndices d’importance
interneIndices d’importance
externeTableau 3
propre
jeu; 2° pve(f, Y)
est unmauvais
critèred’importance
externe,de sorte
qu’un
facteurcanonique
a peu deraisons d’être
un facteur im-poitant
parrapport
àl’autre jeu.
C’est pourquoi l’objectif même
del’analyse canonique
serait mieuxservi
par une méthodemaximisant pve(Y, f)
au lieu depve(f, Y) 6.
C’est justement
ce que propose van denWollenberg (5, 6),
etqu’il appelle
"analyse
deredondance".
Cet auteurmaximise
la"redondance",
non passous la forme
pve(Y, gQ)
xpve(gQ,, X) -
cequi
neconduirait
à rienpuisque
cette formulen’a
de sens quesi
g 91
est un facteurcanonique
ou un facteur
principal - mais
sous la formepve(Y, f~) .
. Cetteméthode
ne donne pas des facteurs mutuellement
orthogonaux (5); mais
onpeut, après n’avoir gardé
que les facteurs dont lacontribution
estimportante,
effectuer une
analyse canonique
sur lesdimensions
retenues(6).
Il semble bien que le meilleur
emploi
del’analyse canonique
soitseulement comme
complément
d’une autre méthode. Lepremier
passerait
dechoisir
lesdimensions qui expliquent
un maximum devariance, soit
dansleur propre
jeu (analyse
encomposantesprincipales), soit
dansl’autre jeu (analyse
de redondance au sens de van denWollenberg),
selonqu’on
veut des facteurs dont
l’ifiportance
soitinterne
ou externe. Le secondpas serait de transformer par
rotation
ces facteurs end’autres
mieuxinterprétables,
cequi peut
sefaire
par des méthodes telles que les ro-tations Varimax,
etpeut-être aussi l’analyse canonique,
cette dernièreméthode
ayant l’avantage (au
moinspratique)
de donner peu decorrélations
non nulles entre les facteurs des deux
jeux.
6. Cette remarque ne
s’applique
pas àl’analyse factorielle discriminante (considérée
comme un casparticulier
del’analyse canonique).
Dans cetteméthode,
eneffet,
on cherche unefonction
de Xqui soit aussi proche
que
possible d’une fonction
constante sur lesclasses,
cequi correspond
bien
àmaximiser
lacorrélation canonique.
BIBLIOGRAPHIE
(1)
CAILLEZ F. et PAGESJ.P., Introduction
àl’analyse des données, Paris, SMASH,
1976.(2)
LEBART L. etFÉNELON J.P., Statistique
etinformatique appliquées, Paris, Dunod,
1971.(3)
MILLERJ., The development and application of bimultivariate
cor-relation, unpublished
doctoraldissertation,
StateUniversity
ofNew York at
Buffalo,
1969.(4)
MILLER J. and FARRS., "Bimultivariate redundancy :
acomprehensive
measure of