R EVUE DE STATISTIQUE APPLIQUÉE
R. L AFOSSE
Analyse de concordance de deux tableaux : monogamies, simultanéités et découpages
Revue de statistique appliquée, tome 45, n
o3 (1997), p. 45-72
<http://www.numdam.org/item?id=RSA_1997__45_3_45_0>
© Société française de statistique, 1997, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE DE CONCORDANCE DE DEUX TABLEAUX :
MONOGAMIES, SIMULTANÉITÉS ET DÉCOUPAGES
R. Lafosse
Lab. de
Statistique
et Probabilités, UMR C55830 Université Paul Sabatier, 118 rte de Narbonne,31062 Toulouse Cedex
RÉSUMÉ
Sans se fonder sur la résolution de
problèmes d’optimisation numérique,
on définit les composantes desanalyses
factorielles lesplus
usuelles d’une ou de deux matrices àpartir
d’unepropriété
de non corrélation, apportant ainsi pour deux tableaux de nouveaux arguments en faveur de larégression simple
simultanée.Sans référence à la notion de rotation, l’inertie du tableau
analysé
pour sa concordanceavec l’autre est
découpée
en trois sous-ensembles de contributions : une concordanceimbriquée
à une discordance et
complétée
par une notion de bruit. Ainsi lepotentiel
deprédiction
linéaire d’un tableau est-il
découpée
en trois parts; ainsi dans l’étude del’analogie
de deuxdistributions multivariées, la discordance
peut-elle correspondre
à une notion d’effet stéréo.Pour
chaque
sous-ensemble, onajoute
à la notion de contribution des individus une notion departicipations partielles
des variables du tableauanalysé,
permettant depréciser l’importance prise
par chacune danschaque
sous-espace, et menant à unepossibilité
debiplots.
Mots-clés : Corrélation linéaire,
analyses factorielles,
concordance de deux matrices,régression simple
simultanée,découpages, biplots.
ABSTRACT
The components of factor
analyses
of one or two matrices are definedusing
a zero-correlation property rather than
through
anoptimization problem.
For two matrices thisyields
new arguments for simultaneous
simple regression.
The variation in a table
analysed
with respect to its concordance with another ispartitioned
into three partsindicating
concordance, discordance, and noise. A suchpartition
relative to the
prediction potential
of a matrixgives
the concordance for theexplicative
part.If
applied
to thecomparison
of two multivariate distributions, the discordance can be viewedas a sort of stereo effect. For each part, measures of the
importance
of the contributions of the individuals andpartial participations
of the variables aredeveloped
and abiplotting technique
described.
Keywords :
Linear correlation, Factoranalyses, Agreements
between two matrices, Simulta-neous
simple
regression,Splittings, Biplots.
1. Introduction
Les
couples
decomposantes
définis par Tucker(1958)
dans le but de comparer deuxjeux
de corrélations internesapparaissent
dans cepapier
d’une certaine manièrecomme les seuls
couples
isolables définissables.La définition des
couples
de Tucker ainsi introduite n’est donc pas ici fondée surl’optimisation
d’un critère de covariancequi
donne les valeurssingulières
successives de la matrice des intercovariances,
maisplutôt
fondée sur une notion dedécoupage.
Elle
n’implique
pas un classement de cescouples,
cequi
autorise tout classement enassociation avec un
objectif particulier.
Le calcul s’introduitcependant
naturellementavec cette définition
depuis
l’obtention des vecteursappariés
de ladécomposition
envaleurs
singulières
de la matrice des inter covariances.En fait la définition donnée des
couples
de Tucker estélargie
en introduisant desmétriques quelconques
dans les deux espaces d’individus relatifs aux deuxtableaux,
et les deuxcomposantes
d’un mêmecouple
sont dites concordantes dans cetteapproche plus générale.
La concordance dont cescouples
sontporteurs
est fondée sur les corrélations au carré entre composantes dechaque paire.
Lescomposantes
d’un mêmecouple apparaissent
alors commecomposantes
monogames, unecomposante
ne
pouvant
avoir de corrélation non nullequ’avec
son proprepartenaire.
La famille des
composantes
de l’ACPapparaît
ainsi comme la seule définissableen termes de famille de
composantes endogames.
L’ensemble des scores d’un tableau est ici
partagée
en trois ensembles de scores, chacune des variables et chacun des individus de ce tableauparticipant plus
ou moinsà chacun de ces trois ensembles.
L’un des ensembles
correspond
à une notion de bruit dans le tableaucomparé
à l’autre fondée sur l’absence de corrélations que ce bruit
possède
avec tout cequi
lui est
extérieur,
aussi bien dans l’un que dans l’autre tableau. C’estl’anti-image
deGuttman
(1953) qui décompose
un tableauanalysé
parrapport
à un autre, en deux tableauxappelés image
etanti-image, désignant
ainsi les contributions des individus àl’explication
linéaire et à la nonexplication.
Les deux autres ensembles définis
partagent l’image
de Guttman en deuximages.
Le fait de
pouvoir
définir tous lescouples précités
en terme decouples
isolablesjustifie pleinement
une notion derégression simple
simultanéepermettant
d’estimerune
image
dite concordante. Cetterégression particulière
ne fait intervenir que les corrélations entre les deuxcomposantes
descouples
monogames tout en conduisant à undécoupage
du tableauanalysé
en deux sous-ensembles de contributions. Pour définir cetteimage,
il n’est doncplus
fait référence à une rotationparticulière
commeprécédemment
en communauté(Lafosse, 1985)
ou en redondance(Israëls, 1986).
La dernière
image complète
ladécomposition
de l’inertie totale du tableaucomparé
à l’autre et estappelée image
discordante. Contrairement aubruit,
elleapparaît
comme cellequi
est vraimentconceptuellement complémentaire
del’image
concordante. Concordance et discordance constituent deux
images
corrélées et doncétroitement
imbriquées.
A un
découpage
en sous-espaces del’espace
des individusengendré
par chacune desimages,
onajoute
dans cet article une notion departicipations
des variables du tableaucomparé
à l’autre. En définisant desparticipations partielles
relatives auxtrois
images,
onprécise l’importance
du rôlejoué
parchaque
variable dans unereprésentation
desindividus,
cequi
n’était pas obtenu dans lesgraphiques
de variables réalisés parprojection (Lafosse, 1991).
Les
biplots
de Gabriel(1971),
devenus usuels enanalyse
descorrespondances
ou en
analyse discriminante,
sont alors conçus d’une manièreplus générale
si on seréfère au fait que les
métriques
sontquelconques.
Quand
les deux tableauxanalysés
sontunivariés,
le même coefficient de corrélation linéaire au carré des deux variables enprésence peut
servir aussi bien àmesurer la
dépendance,
une similarité des deuxdistributions,
unpouvoir
deprédiction.
Quand l’analyse
est relative à deux ensembles multivariés toutes ces notions seséparent
et sont ici abordéesdepuis
desanalyses
de concordanceparticulières.
Quelques particularités
induites par cetteapproche d’analyses
usuelles ou moinsusuelles sont alors relevées.
Quand
cela estpossible
et selon un usagefréquent
pour nombre de revues, les formules sont écrites dans cet article dans unlangage
matricielcompact
directementportable
dans deslangages
deprogrammation
tels quefortran90, Matlab,
ou autre.2.
Analyse
de concordanceSoient X n x pl et Y n x p2 deux matrices. Les ensembles
respectifs
de pl etp2 colonnes définissent deux ensembles de variables centrées mesurées sur un même ensemble de n individus. La matrice
diagonale
despoids
des individus est notée D.Les matrices M et N étant celles de deux
métriques euclidiennes,
on veut comparer la distribution multivariée des individus de(Rp1, M)
à celle de(Rp2, N).
Pour atteindre cet
objectif,
on ramène lacomparaison
multivariée à descomparaisons
univariées entrecomposantes
decouples,
cescouples
étant construitsde
façon
àpouvoir
les considérer isolément.2.1
Définition
descouples
decomposantes
concordantesSoit s un nombre entier fixé entre 1 et
min(pi, p2).
L’inertie totale de(X, M)
est
décomposée
àpartir
de s vecteursM-orthonormés ai
de(Rp1, M)
en auplus (s
+1) parts distinctes,
associées aux sprojections
des individus du tableau X sur chacun des axes ai et à laprojection
sur un sous-espacesupplémentaire orthogonal
éventuel.
Un
découpage
de l’inertie totale de Y s’ effectue àpartir
de vecteurs N-orthonormés bi
de(RP2 , N).
Les corrélations linéaires non nulles que les
composantes XMai,
i =1,..., s,
possèdent
avec descomposantes YNbj,j = 1,...,
s, associent lesparts
d’inertie distinctes de X auxparts
d’inertie distinctes de Y.Parmi toutes les
composantes précédentes envisageables,
on recherche main- tenant celles formant descouples (X Ma2, YNbi),
se constituant parce que la com-posante X Mai
s’associe toutparticulièrement
à lacomposante YNbi.
Eneffet,
on voudrait que laparticipation
aux liens de corrélation entreX Ma2
et les variables de Y et celle entreYNbi
et les variables de Xs’expriment
au moyen d’une seule corrélation non nulle : celle entreX Mai
etYNbi .
Un
couple
sera dit formé de composantes concordantesquand
la corrélation de lacomposante YNbi
avec toutecomposante XMaj
autre queX Ma2
estnulle,
et
quand
la corrélation de lacomposante X Mai
avec toutecomposante
deYNbj
autre que
YNbi
est nulleégalement.
La corrélation non nulle des deuxcomposantes
concordantes d’uncouple (XMai, YNbi)
associe ainsi defaçon biunivoque
les deuxparts
d’inertierespectives
relatives aux axes ai etbi.
On note
Pl
la matrice constituée des scolonnes ai
etQ1
celle constituée des scolonnes
bi.
On note P la matrice
Pl complétée
de pl - s vecteurs colonnessupplémentaires,
l’ensemble des vecteurs colonnes formant une base M-orthonormée
{ai}
de Rp1.On note
Q
la matriceQ1 complétée de p2 -
s vecteurs colonnessupplémentaires,
l’ensemble des vecteurs colonnes formant une base N-
orthonormée {bi}
de RP2.On note A une matrice s x s
diagonale
définiepositive.
Les corrélations
PT
=p2 (X Mai, YNbi),
i =1,...,
s, étantsupposées
nonnulles,
pour définir descouples
decomposantes
concordantes on veut enplus :
D’où les
égalités
nécessaires et suffisantes entre matrices :Puisque
P etQ
sont matricesrespectivement
M et Northogonales,
on a :D’où :
Finalement,
on veut quePl
etQ1
satisfassent aux deuxégalités :
Soit r le rang de X’DY.
Soit une
décomposition
en valeurssingulières
de la matriceX’DY,
cettematrice étant ici considérée comme celle d’une
application
linéaire entre espacesmétriques (Rp2, N)
et(Rp1, M) :
avec :
On a donc les relations :
La matrice
diagonale
r x rA contient ici(et
pour la suite del’exposé)
les valeurssingulières
de X’DY.Les
égalités (1)
et(4) indiquent
que, pour une valeur de s fixée entre 1 et r,les colonnes de
Pl peuvent
être constituées d’un sous-ensemble de s colonnesprises parmi
l’ensemble des r colonnes deA,
celles deQ 1
étant alors le sous-ensemblecorrespondant
des colonnes de B.Aux ordres de
multiplicité près
des valeurssingulières
et auxsignes près
descouples appariés,
uncouple (ai, bi) pouvant
êtreremplacé
par uncouple (-ai, -bi),
tous les vecteurs solutions sont donc issus de cette
décomposition.
Le calcul se réalise en recherchant les vecteurs
appariés
de ladécomposition
en valeurs
singulières
usuelle de la matrice :où P’P =
Q’Q
=Ir.
La solution est alors donnée par :
Les mêmes
couples
decomposantes
auraient pu être définis comme solutions successives duproblème d’optimisation
relatif au critère :puisque
sous les contraintes A’MA = B’NB =Ir,
lesoptima
successifs constituent les valeurssingulières.
La définition des
couples
entemps
quecouples
decomposantes
concordantes estquant
à elle fondée sur unconcept
demonogamie,
unecomposante n’ayant qu’une
seule composante pour
partenaire
dans l’autre tableau. Parsuite,
uncouple
monogameapparaît
comme isolable des autrescouples
monogames.Cependant
lesystème {XMai}
est engénéral
formé decomposantes corrélées,
comme l’est aussi le
système f YNbi 1).
C’est dire seulement que chacun des deuxsystèmes
decomposantes permettent
desynthétiser
l’information interne à X miseen concordance avec l’information interne à
Y,
comme lescomposantes principales
de l’ACP le
permettent
pour un tableau(de façon plus simplifiée cependant). Quand,
par
exemple,
r = pl, ils’agit
de toute l’information interne àX,
dans la mesure oùon a :
De
plus
cette définitionqui
n’est pas attachée àl’optimisation
d’un critèrenumérique, n’implique
pas pour le moment un ordre dans lerangement
descouples
solutions.
Remarques :
On vérifie aisément que la notion de
couples
decomposantes
concordantes estindépendante
de toute isométrie réalisée dans(Rp1, M)
ou dans(RP2 , N).
Les
composantes principales
d’untriplet statistique (X, M, D)
sont définissablescomme
composantes endogames,
étant les seulesqui
ne soient corréléesqu’avec
elles-mêmes tout en
décomposant
l’inertie totale de X enparts
distinctes. Celaapparaît
avec
(Y, N, D) = (X, M, D),
les deuxcomposantes
d’uncouple
monogame étant alorsidentiques
à unecomposante principale
de l’ACP de(X, M, D).
2.2.
Image
de X concordante avec YOn veut connaître le rôle
joué
parchaque ligne
et parchaque
colonne dela matrice X dans cette concordance pour le moment relevée sur les r
couples
decomposantes
concordantes.Guttman
(1953) décompose
une matrice X n x pl en somme de deux matrices de dimension n x plappelées image
etanti-image.
La matricePy
=Y(Y’DY)-1Y’D
désignant
leprojecteur
D-orthogonal
sur le sous-espacede
Rnengendré
par les colonnes deY, l’image
est la matricePyX qui permet d’analyser
la part de Xexpliquée
par Y. Comme l’inertie de X estégale
à la somme de l’inertie del’image
et de
l’anti-image,
les contributions deslignes
de X à l’intensité del’explication
obtenue sont définissables à
partir
deslignes
de la matricePYX.
Par
analogie,
on veut ici définir une matrice n x plcorrespondant
à la notiond’image
concordante telle que ladécomposition
de X en uneimage
concordante et uneimage
non concordantecorresponde
à undécoupage
de l’inertie totale de X en deuxparts
distinctes.Pour construire
l’image
concordante on se propose deprocéder
parrégression simple
simultanée. La simultanéité est une notionprécédemment
introduite par Fortier(1966) qui
fait référence à réquations
simultanées pour définir dans une matrice cequi
est linéairementexplicable
par une autrematrice,
c’est à dire pour définirl’image
de Guttman
(Ten Berge (1985)
remarquel’équivalence
entrel’approche
de Fortier et deWollenberg (1977).
Israëls
(1984, 1987)
considère cetterégression
simultanée enanalyse
de laredondance sur variables
qualitatives,
ou nommerégression canonique (CRA)
larégression
simultanéecomposée
desrégressions partielles d’Hotelling (1935).
Cessimultanéités,
considérées une fois unproblème
derégression posé,
concernent descouples expliqués-explicatifs
del’analyse
de la redondance ou lescouples canoniques
de
l’analyse canonique classique
de deux tableaux.La justification
donnée ici à la simultanéitéprovient
de ce que par construction lescouples
decomposantes
concordantespeuvent
être considérés isolément. Cettejustification peut
aussi servir pour lescouples expliqués-explicatifs
oucanoniques (cf.
section3).
On note
diag (C)
la matricediagonale ayant
pourdiagonale
ladiagonale
d’unematrice carrée C.
On pose maintenant :
Gérant
séparément
chacun descouples
decomposantes
concordantes de sorte que les seules corrélationsimpliquées
soient les r corrélations entre les deuxcomposantes
dechaque couple,
on effectue rrégressions simples séparées
obtenuesen
régressant
lescomposantes X Mai
sur leurscomposantes respectives YNbi.
Celarevient à estimer la matrice X MA à
partir
de YNB d’unefaçon particulière,
en usantde la matrice de
régression :
et non en usant de la matrice de
régression :
On note
Da la
matricediagonale
des coefficients des rrégressions séparées.
Lesvaleurs p2
dénotant les corrélations entreX Mai
etYNbi, Da
contient donc les valeurs :Comme B’NY’DX MA - 0 contient les covariances entre
composantes concordantes,
on obtient donc la matrice estimée :
La matrice MAA’ est la matrice identité
quand
r = pl et,sinon,
est une identitépartielle englobant
toutes les dimensions de RPI concernées par la concordanceavec Y.
A
partir
de l’estimationprécédente
deX MA,
faite d’une certaine manière àpartir
deY,
on se propose alors d’estimer X(ou XMAA’)
par la matrice n x pi :Standardisant les
composantes YNbi
en ramenant à 1 leursvariances,
etrangeant
les rcomposantes
standardisées en colonnes dans une matrice notéeK,
cette estimée de X
apparaît
bien comme uneimage
deX, puisqu’on
vérifie que :On nommera désormais la matrice
XA image
de X concordante avec Y.(Cette
estimation est donc celleproposée
dans Lafosse(1985)
dans un contextede
communauté,
en faisant référence à la rotationProcruste.
Le calcul y était en effetprésentée
comme une «rotatedsolution»,
si on se réfère aulangage
utilisé dans le contexte del’analyse
de la redondance par Israëls(1986)).
La matrice
XT, n
x pi, définie par :représente
alorsl’image
de X totalement non concordante de Y.Propriété
2.2La variance totale de
l’image
concordante et celle del’image
totalement nonconcordante
décomposent
la variance totale de X. La variance totaleexpliquée
dansla
régression simple
simultanée estégale
à l’inertie totale del’image
concordante.On a bien la deuxième
proposition, puisque,
àpartir
de la définition(8) :
Comme
on a :
La
décomposition :
conduit à
l’égalité
entre matrices :D’après (12),
la matriceX’DXA
estsymétrique.
CommeX’ A DXA
l’estaussi, XITDXA
estsymétrique
etl’égalité (14)
est uneégalité
entre matricessymétriques.
Sachant que tr
(X’DXAM)
= tr(XAMX’ A D)
= tr(X’ADXAM),
on a :On a donc bien finalement :
Cela
étant,
il devient naturel de mesurer l’intensitéglobale
de la concordance dutriplet (X, M, D)
avec letriplet (Y, N, D)
par l’indice :le numérateur étant somme des variances
expliquées
de larégression simple
simul-tanée, d’après
leségalités (13) :
L’intensité de toute la non concordance de X avec Y est alors mesurée par l’indice :
(LAI,
comme «linearagreement index»).
L’opérateur
trace définissant unproduit
scalaire entre deux matricespermet
de concevoir l’indiceglobal
comme un cosinus au carréqui
mesure laproximité
entreX et
l’image
concordante. Eneffet, d’après
leségalités (13),
on a :L’image
concordante de(X, M, D)
avec(XA, M, D)
estXA
etl’image
concordante de
(X, M, D)
avec(X, M, D)
est bien sûr X.2.3.
Concordance,
discordance et bruitGuttman
(1953),
Kaiser(1976) décomposent
les scores d’un tableau linéairementanalysé
parrapport
à un autre en deux sous-ensembles de scores, nommésimage
etanti-image.
Nous définissons ici ce quereprésente
lesimages
concordantes et totale- ment non concordantes parrapport
aux sous-ensembles de Guttman.La variance totale de
PYX englobe
celle deXA qui
aussi est linéairementdépendante
de Y via les coefficientspartiels
de concordancePT
=p2 (X Mai , YNbi),
i =
1,...,
r. Pour établircela,
on calculeci-après l’image
dePyX
concordanteavec Y.
La même
décomposition
en valeurssingulières
étant encore celle alors à considérerpuisque Y’DPYX
=Y’DX,
lescomposantes
concordantes sont cette fois les colonnes des matricesPY X MA
et YNB.Puisque
pour tout i =1,..., r, [(X - PYX)Mai]’DKNbi = 0,
on a :et les coefficients de
régressions
sontinchangés,
tout comme restent invariantes les nouvelles variancesexpliquées
derégression
simultanée. Ainsi la mêmeimage
concordante
XA
est obtenue. Doncl’égalité Py X = XA
+(PYX - XA ) correspond
à un
découpage
de la variance totale dePYX,
tout commel’égalité
X =PYX
+(X - PYX) découpe
la variance de X. Finalementl’égalité
suivante :permet
dedécouper
la variance totale de X en troisparts
associées aux troisimages.
On pose maintenant :
En usant de la définition de
XA
et del’idempotence
dePy,
on vérifie que les matrices suivantes sontnulles,
cequi
traduit ungrand
nombre de corrélations nulles :On en déduit que
l’anti-image XN
de Guttman estindépendante
de tout cequi
dans notre
approche
n’est pas elle-même et cetteanti-image
est ici nommée : bruit de X par rapport à Y.On
comprend
mieux ainsipourquoi l’analyse
sans le bruit n’a pas modifiél’image
concordante.L’image XD, expression
d’une non concordancepartielle
de X avecY,
établitune notion de discordance dans la
comparaison
avec Yplus pertinente
que le bruitqui,
en dehors de ce constat d’êtreindépendant
parce que totalement noncorrélé,
ne
peut plus
fairel’objet
d’aucune mise en relation. On nommel’image XD image
discordante.
L’image
deGuttman, égale
àXA
+XD, imbrique
donc une notion deconcordance avec une notion de
discordance,
les deuximages
étant corréléespuisque
la matrice
XA DXD
n’est pas nulle même si tr(X’ADXDM)
est nulle. L’imbrication des deux notions est relative au même sous-espace de RPI. On vérifie en effet que :alors que On a donc :
ce
qui signifie
que lesystème {ai} qui englobe
toutel’image
concordanteenglobe
aussi toute
l’image
discordante.Finalement,
ladécomposition
obtenue :associée à la
décomposition
d’inertieconduit à considérer trois indices
globaux respectifs,
celui de la concordance de Xavec Y
(indice LAI),
de la discordance et dubruit,
la somme de ces indices valant 1 :L’indice de concordance étant étroitement associable à l’indice de
discordance,
l’intérêt pour l’indice de totale non concordance
(18)
se trouve fortementaffaibli,
cet indicemélangeant
deux notions fortdisparates.
Propriété
2.3.1L’imbrication de la concordance et de la discordance est nulle en moyenne relativement à chacun des axes ai, sachant que pour tout i =
1,...,
r, on al’égalité : a’iMX’ADXDMai =
0.D’après
leségalités
et donc on obtient :
Comme J
et ainsi :
Propriété
2.3.2L’indice
global
LAI et les indicespartiels p2
sont des indices de concordance d’autantplus
faibles que le bruit etl’image
discordante sontimportantes.
Quand PYX
estcomparé
à Y à laplace
deX,
c’est à direquand
onsupprime
le
bruit,
les indicespartiels
de concordance s’accroissent.Les indices de concordance
partiels p2 (PYXMai, YNbi) prennent
des valeursplus
élevées que les indices03C12i = 03C12(XMai, YNbi),
de sorte que les différences suivantesévaluent pour
chaque
axe ai l’influence du bruitXN
sur la concordance mesurée par03C12i.
C’est donc aussi que les valeursévaluent pour
chaque
axe ai l’influence del’image
discordanteX D .
Les
propriétés
2.3.1 et 2.3.2peuvent
être utilisées pour associer desgraphiques
en les
juxtaposant (remarque
de la section2.4.3).
Elles ne sont à considérerqu’axe
par axe. C’est une
façon
de décrirelocalement,
c’est à dire pourl’axe ai
considéréisolément, pourquoi
l’intensité de la concordance mesurée parp2
est si faible.Précisément,
la mesurep;
est ici celle de la valeur de l’indice LAI restreint à la dimensioni,
soitp;var(XMai)/var(XMai) ,
et neparticipe
pas directement à ladécomposition
de l’indiceglobal
LAI surlaquelle l’analyse peut
être fondée.Dans le même
temps, quand
on enlève lebruit, puisque
le numérateur de l’indice LAI resteinchangé
alors que le dénominateurdécroît,
allant de tr(X’DX M)
à tr
(X’DPyXM),
cet indices’accroît,
et la mesure de l’écart suivantindique
l’influence du bruit dans l’évaluation de la concordance
globale
de X avec Y :tandis que l’influence de
l’image
discordanteXD
est évaluable par :Théorème 2.3
Quelle
que soit lamétrique M, l’image
concordante de[X, M, D]
avec[Y, (Y’DY)-1, D]
estégale
àl’image
de GuttmanPy X,
et on a ladécomposition
de X en seulement deux
parts :
Ayant
introduit la(semi-)métrique
de Mahalanobis(Y’DY)-1
dansRP2 ,
et détruisantainsi dans la matrice Y toute l’information relative à ses covariations
internes,
la seule concordancepouvant
alors s’établir avec cette matrice Y est doncl’expression
de sadépendance
linéaire.On a en effet ici :
car A =
Da, puisque
ici lescomposantes
non corrélées colonnes deY (YDY) B
ont leurs variances
égales
à 1.Quand
r = pi, la matrice MAA’ est la matriceidentité,
et,sinon,
l’identitépartielle
MAA’agit
sur la droite de la matrice Y’DX comme l’identité. FinalementXA
=Py X.
Prenant leproblème
autrement, on aurait pu aussi constater que, bien que la matrice KK’D(qui
ici est celle d’unprojecteur D-orthogonal)
ne soit identifiable àPy
quelorsque
r = rang(Y),
on acependant : KK’DX
=PyX.
Propriété
2.3.3L’image
concordantepeut
être obtenue en recherchant d’abordl’image dépendante
parrapport
àY,
soitPYX, puis
la concordance de Y avec cette im- agedépendante obtenue,
le bruitX N
nepouvant
fairel’objet
d’aucune mise enconcordance.
Le fait que
l’image
concordanteXA puisse
être obtenue aussi commel’image
concordante de
PYX
avecY,
se traduit par ladécomposition
suivante de l’indice LAI :Pour une
métrique
Mfixée,
différents choix demétriques
Npeuvent
conduire à uneprise
encompte plus
ou moinsgrande
des covariations internes de Y.Par
exemple l’image
ressemblante de X avec Y(cf.
section3.4),
est une im-age concordante
qui
s’obtient enprenant
encompte
toutes les covariances internes àY,
N étant lamétrique
identité.Quand
au contraire cette contrainte est totale- mentsupprimée,
c’est à direquand
lasemi-métrique
de Mahalanobis(Y’DY)-1
vient à la
place
de lamétrique identité,
alors l’indice LAI estmaximal, puisque
LAI[(PYX,M,D),(Y,N,D)] =
1 et la concordance s’accroît donnant à laplace
del’image
concordante toutel’explication
linéaire par Ypossible.
Remarque
Le calcul de
Py peut
poserproblème quand
les variables de Y sont très corrélées.On peut en effet retenir des dimensions en nombre
trop grand
parrapport
à celuiqu’il
serait
plus
réaliste de conserver. Ceproblème peut
aussi se poser enanalyse
de laredondance et en
analyse canonique.
En fait la matrice
Py apparaît
dans les calculs non comme isolée mais associée à X dans leproduit PYX.
Le nombre de dimensions à retenirpeut
donc être contourné une fois résolu celui du nombre de dimensions à retenir lors du calcul de ladécomposition
en valeurssingulières
de X’DY : sitrop
de dimensions avaient été retenues lors du calcul dePy,
l’effet des dimensions en excèspeut
être éliminéen
remplaçant PYX
parPY X MAA’ .
2.4. Classement d’axes et
graphiques
2.4.1 Introduction
Introduire la famille des
composantes
de l’ACP comme celle des seulescomposantes endogames
définissables(remarque
de section2.1) implique qu’il
n’est pas forcément fondamental de classer ces
composantes
par le critère d’inertie maximale.L’explorateur
de donnéesqui
use de l’ACP a très souvent un intérêtparticulier
pour une
variable,
ou pour un sous-grouped’individus, supplémentaires
ou non,et souhaite ainsi que ses
graphiques
soient informatifslocalement,
autour de sespréoccupations.
Les
composantes
de l’ACP sont les seulesqui
permettent depréciser,
pourn’importe quel
sous- espaceengendré
par des axesprincipaux,
dansquelle
mesurechaque
variable du tableau a contribué à lareprésentation
des individus du sous-espace. La famille d’axes et de
composantes
de l’ACP est ainsi une famille trèsprivilégiée
et il est souhaitablequ’un logiciel puisse
classerautomatiquement
cesaxes et
composantes d’après
des critèrescorrespondants
aux désirs lesplus
usuelsdes
utilisateurs,
le critère d’inertie maximum n’étant que celuiproposé
àpriori.
Pour de mêmes raisons de
découpage,
l’utilisateur est en droit de modifier enfonction de ses propres
préoccupations
les classements d’axesindiqués
en section2.4.2 comme classements à
priori. L’égalité :
décompose
les scores de X en trois sous-ensembles de scorescomplémentaires, partageant
en troisparts
distinctes l’inertie totale de X.Cependant
l’imbrication del’image
concordante et del’image
discordante nepermet
pas ladécomposition
de lamatrice de covariances de X en somme des trois matrices de covariances
respectives.
Par
suite,
les trois ACP relatives aux troisimages
n’auraient pas vraiment de sens.Dans la section
suivante,
on s’intéresse bien à lareprésentation
de chacun des trois nuages définissant les contributions deslignes
de X à la concordance avecY,
à la discordance et aubruit,
mais on s’intéresse aussi dans le mêmetemps
à définir les relations entretenues par les variables de X avec chacune des troisimages.
De làprovient
notre intérêt pourl’égalité
matricielle :Comme les matrices
X’DXA(= X’DKK’DX)
etX’DXN(= X’ N DXN)
sontsymétriques,
cetteégalité
est donc uneégalité
entrequatre
matricessymétriques.
2.4.2. Classements d’axes
On note de
façon générique
parXG l’image XA, XD
ouXN.
On mesure les contributions
respectives
deslignes
deXa
par les termes dediag (XGMX’ G D),
lekeme
termedésignant
l’inertie de l’individu k(i.e.
sa massemultipliée
par le carré de sa distance àl’origine).
Selonl’image considérée,
ces contributions définissent les contributions des individus de X à la concordance avecY,
à la discordance ou au bruit. Leur somme étendue aux troisimages
et à tous lesindividus reconstitue l’inertie totale de
(X, M, D).
Le calcul des vecteurs propres
M-orthogonaux
des matricesM-symétriques X’DXGM permet
de se proposer troissystèmes
d’axes dereprésentation
relatifsaux trois nuages
(XG, M)
dans desrepères
M-orthonormésrespectifs,
notés defaçon générique {gi}.
Notant G la matrice contenant en colonnes ces vecteurs, on a donc :la matrice
diagonale Ag
contenant les valeurs propres03BBgi.
Le classement de ces axes
peut
donc se faire pourchaque image
selon le critère d’inertiemaximum,
c’est à dire selon les valeursg’iMX’GDXGMgi.
Ce sont les troisclassements
proposés
àpriori.
La suite et la section 2.4.3apportent
desarguments
en faveur d’un tel choix.Dans le cas de
l’image concordante,
les vecteurs propres ne sont pas à calculerpuisqu’il s’agit
des vecteurs ai. Les valeurs propres,égales
aux variancesexpliquées
de la
régression simultanée,
sont doncégales, d’après
la section3.2,
aux inertiesproposées
pour classer les axes.Dans le cas du
bruit, X’DXNM
=X’ N DXNM,
et les axescorrespondants
sont donc aussi classés selon les valeurs propres de la matrice
diagonalisée.
Ce n’est que dans le cas de
l’image
discordante que le classement des axesproposé
ne coïncide pas avec celui par les valeurs propres de la matricediagonalisée.
Les contributions
partielles
des individus de X relativement à un axe gi sont par suite définies pourl’image XG
par les valeurs dediag (XGMgig’iMX’GD),
lekème
terme étant donc le carré de l’abscisse de laprojection
dukème
individu surl’axe gi,
pondéré
par sonpoids.
Lesgraphiques
des individusreprésentés
avec unsystème {gi} peuvent
donc êtreaccompagnés
dediagrammes
en bâtonsdescriptifs
des contributions
partielles, superposés
auxdiagrammes
des contributionsglobales.
2.4.3.
Participations
des variables etbiplots
On veut maintenant décrire les
rapports qu’entretiennent
avec les variables de X avec les individusreprésentés
parprojection
sur les sous-espaces.En ACP de
(X, M, D)
des directions définies par leurs cosinus directeurs et associées aux variables de X sontajoutées
auxreprésentations
des individus. Ces directions ne constituent pas desreprésentations
de variables dans un sous-espace, mais elles permettent de connaître les variablesqui
sont intervenues dans le faitqu’un
individu donné
apparaisse
comme excentré. On use ainsi d’unbiplot
detype
Gabriel(1971),
enprojetant orthogonalement
sur ces directions les individusreprésentés
dusous-espace considéré
(n’importe lequel).
Ces
projections
se font au sens de lamétrique identité,
lesproduits
scalairesqui
interviennent étant issus de ladécomposition
de X enproduit
de matrices :ui 1 désignant
lesystème
des r axesprincipaux.
Alors,
unprojeté
sur une direction Vqui apparaît éloigné
del’origine
traduitun individu à forte contribution
quant
au sous-espaceconsidéré;
cet individu doit(au
moins en
partie)
cette contribution aux variablesayant
la direction V ou une direction voisine deV,
pourvuqu’elles
aientjoué
un rôleimportant
dans la constitution du sous-espace considéré.Cette
importance
des variables de Xquant
à leursparticipations
à un axe i estsouvent utile à
connaître,
et pas seulement pour lesbiplots.
La valeur
Ài désignant
l’inertie de l’axei,
cetteimportance
est définie par les contributionspartielles,
termes de :Ces valeurs sont souvent définies comme les variances des variables
D-projetées
sur la
ième composante principale
duale de l’axe i.Ci-après
elles seront considérées comme des valeurssynthétisant
lesrapports
de covariations entretenus par les variables de X avec le nuageprojeté
sur l’axei,
c’est à dire comme les termes de
diag [X’D(XMuiu’i)].
La racine carrée
positive
du cumul de ces valeurs étendu aux axes d’unbiplot permet
le calcul deslongueurs
de flèchesportées
par les directions associées aux cosinus directeurs définis par les colonnes de U.Quand
M est lamétrique identité,
le total desparticipations
des variables relatif à un axe i estégal
à l’inertie de cet axe.Quelque
soitM,
lesparticipations globales
des variables sont définies par
diag (X’DX).
Donc pour unemétrique quelconque,
le
partage
de l’inertie ne coïncide pas avec lepartage
de la variance totale de X.On veut maintenant définir une notion
générale
departicipations partielles
desvariables de X aux différentes
images,
enprocédant
paranalogie
avec cequi précède.
Pour une
image
donnéeXG,
les coordonnées des individus sur l’axe i sont les termes deXG Mgi.
Les coordonnées des variables de X dans le
repère X GMgi
dual durepère unidimensionnel gi
constituent la colonne i de la matriceX’ D(XcMG) = GAg.
Les individus étant
représentés
dans lerepère
orthonormé{gi},
les cosinus directeurs des variables de X sont ainsi donnés par les colonnes de G.Des valeurs propres
négatives peuvent
exister pourl’image discordante,
lamatrice
X’DXD
étant nonpositive
engénéral.
Notons H la matrice formée à
partir
deG,
les colonnes associées aux valeurs propresnégatives
étantrespectivement prises égales
aux colonnesopposées,
les autresétant
inchangées.
La matrice H est donc la matrice Gayant
subi une modification designe
surquelques
colonnesquand
ils’agit
del’image discordante,
et estégale
à Gpour les deux autres
images.
La matrice
MGH’
est ici la matrice de l’isométrie Procruste de(XG, M)
vers(X, M) (Green, 1952).
Cette rotationorthogonale particulière
du nuage(Xa, M)
n’affecte pas la dualité des
repères
ni la nature du nuage(ainsi
l’ACP de(XGMGH’, M, D)
est-elleidentique
à l’ACP de(XG, M, D)).
Quelle
que soitl’image,
on propose alors de définir lesparticipations
totalesdes variables de X à
l’image XG
par les valeurspositives
constituant les termes de :et les
participations partielles
par les termes de :Représenter
les individus deXGMGH’
dans lerepère
H revient àreprésenter
lesindividus de
XG
dans lerepère G,
commel’indique l’égalité suivante,
H’MH étantmatrice identité.
Les
biplots
associables auxparticipations
des variables de Xprécédentes
sontfinalement associés aux
décompositions
suivantes enproduits
de matrices :Dans le cas
particulier
del’image concordante, puisque XAMAA’
=YNBDaA’,
cette
décomposition peut
s’écrire :Par
construction,
le total de toutes lesparticipations
estsupérieur
à la variance totale de X(sauf
si toutes les valeurs propres deX’DXDM
sont nonnégatives, auquel
cas le total de ces
participations
estégal
à cette variancetotale).
En fait l’imbrication des notions de concordance et de discordance existe en concordance dans la définition desparticipations partielles (X’DXA - X’ADXA
+X’ D DXA),
mais leségalités (15)
et(22)
fontqu’elle
nes’exprime
pas dans les mesuresglobales
etpartielles.
La redondance
provient
doncuniquement
d’uneprise
encompte
de l’imbricationen discordance.
L’importance
de cette redondance évalue doncl’importance
del’imbrication des variables de X
quant
aux deux notions.Quand
N estmétrique
de Mahalanobis