R EVUE DE STATISTIQUE APPLIQUÉE
G. K ISSITA P. C AZES M. H ANAFI R. L AFOSSE
Deux méthodes d’analyse factorielle du lien entre deux tableaux de variables partitionnés
Revue de statistique appliquée, tome 52, n
o3 (2004), p. 73-92
<http://www.numdam.org/item?id=RSA_2004__52_3_73_0>
© Société française de statistique, 2004, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
DEUX MÉTHODES D’ANALYSE FACTORIELLE DU LIEN
ENTRE DEUX TABLEAUX DE VARIABLES PARTITIONNÉS
G.
KISSITA*,
P.CAZES**,
M.HANAFI***,
R. LAFOSSE***** ISG, Université Marien
Ngouabi,
Brazzaville,gakissita@yahoo.fr
** Lise-Ceremade, *** Université Paris
9-Dauphine, cazes@ceremade.dauphine.fr
ENITIAA-INRA, Nantes,hanafi@enitiaa-nantes.fr
****
LSP, Université Paul Sabatier, Toulouse 3,
lafosse@cict.fr Statistique Appliquée,
RÉSUMÉ
Deux ensembles X et Y de variables mesurées sur les mêmes individus sont respec- tivement formés de sous-ensembles de variables
{Xi},
i = 1,..., kx et{Yj}, j =
1,...,ky.
Une
première analyse,
nommée concorG, revient àremplacer
chacun des tableaux Xi etYj
parun nombre réduit de variables latentes
capables
de résumer le lien de X avec Y. Le lien d’un tableau Xi avec un tableauYj
constituant un lienpartiel,
les variables latentes de la deuxièmeanalyse
nommée concorGM permettent de comparer entre eux tous les lienspartiels possibles.
Par un choix de kx +
ky métriques
euclidiennes, ces deuxanalyses
conduisent à desanalyses canoniques,
desanalyses explicatives
(ACPVIgénéralisée),
ou desanalyses procrustéennes
etse
prêtent
à diversespossibilités d’applications.
Mots-clés :
Analyse factorielle,
Corrélation entre multi-tableaux.ABSTRACT
Two data sets X and Y measured on the same set of individuals are
respectively
formedwith subsets of variables
{Xi},
i = 1,..., kx and{Yj}, j
= 1,...,ky.
A firstanalysis,
namedconcorG, amounts to
replace
each of the subsets Xiand Yj by
few latent variables which cansum up the
relationship
between X and Y. The aim of the secondanalysis
named concorGM is toinvestigate
thekxky relationships,
between each Xi and eachYj. By choosing
kx +ky
euclidean metrics, these two
analyses
lead to canonical, orredundancy,
or procrustesanalyses,
and so to various
applications.
Keywords :
FactorAnalysis,
Correlation between multi-sets.1. Introduction
Le nombre de circonstances où les données sont recueillies sous la forme de multi-tableaux va
croissant,
notamment pour les donnéessensorielles, écologiques, chimiométriques, temporelles
etd’imagerie.
Dans cepapier
les données correspon- dent à des sous-ensembles de variablesqui
sontappariés
parce que toutes les variables considérées sont mesurées sur un même ensemble fixé d’individus. Cetype
de donnéesse
prête
à desanalyses
bien connues comme lesanalyses discriminantes,
lesanalyses
des
correspondances,
lesanalyses
de redondance ouACPVI,
lesrégressions PLS,
ou lesanalyses
procruste. Le type dedonnées,
des choix différents demétriques,
et desfaçons
différentes de choisir lesorthogonalités
entre solutionssuccessives,
font que les deuxanalyses proposées
dans cepapier peuvent correspondre
chacune à tous cestypes d’analyses.
Cazes P. & coll.
(1977) proposent
une étude du lien entre deux séries de variablesqualitatives
en considérant des critères de covariances. Vivien M.(2002)
considèrel’étude d’un lien entre deux groupes d’ensembles de variables
quantitatives,
àpartir
d’un critère de covariance
également.
Dans cette dernièreanalyse
nomméeacimoG,
les tableaux sont modifiés avant de recalculer une nouvelle
solution,
contrairement àce
qui
estproposé
par Cazes. Chacune de ces deuxanalyses correspond
à une étudesymétrique
du lien. En variant lafaçon
de modifier lestableaux,
Vivien définit desrégressions (acimoG-PLS),
necorrespondant plus
à uneanalyse symétrique
du lien.Les deux
analyses
du lien deplusieurs
ensembles avecplusieurs
autres ensem-bles
proposées
dans cepapier
sont basées sur des critères de carrés de covariances.La nature
symétrique
ou nonsymétrique
du liendépend
d’un choix demétriques
fait au
départ
parl’utilisateur,
en fonction de la nature de ses données et de sespréoccupations.
Lesfaçons
de modifier les tableaux sont induites par ce choix.Ces deux
analyses
sont despropositions
d’extensiond’analyses
définies par Lafosse et Hanafi(analyse
concor,1997), Esposito
etScepi (1999),
Balbi etEsposito (1999)
ou Hanafi et Lafosse(développement
de concor,2001),
où l’association deplusieurs
ensembles de variablesquantitatives
n’est considéréequ’avec
un seul autreensemble. L’acimo-PLS de Vivien et Sabatier
(2001),
où un ensembleexplique plusieurs
autresensembles,
est fondée aupremier
pas sur lapremière
solution del’analyse
concor, mais s’enéloigne
notamment par des conditionsd’orthogonalité
différentes aux pas suivants.
La
première
des deuxanalyses proposée
ici est uneanalyse
du lien entre deuxtableaux X et
Y,
nommée concorG(concor généralisée), permettant
de détailler les contributionspartielles
des sous-tableaux formant chacun des deux tableaux X et Y.La deuxième
analyse,
nommée concorGM(concor généralisée
etmultiple)
permet de comparer l’intensité du lien
partiel
d’un sous-tableau de X avec un sous-tableau de
Y,
aux intensités de tous les autres lienspartiels possibles
entre sous-tableaux.
C’est
l’analyse
concorGMqui
est considérée pour traiter uneapplication
detype analyse discriminante, puis
uneapplication
detype analyse procruste.
Les résultatssont confrontés aux résultats fondés sur le critère de l’acimoG et sur celui de concorG.
Les programmes ont été réalisés en
langage
R et enlangage
scilab.2.
Analyse
concorGL’analyse
concorG est unegénéralisation
del’analyse
Concor introduite par Lafosse et Hanafi(1997).
Dans Concor onanalyse
le lien entre deux ensembles Xet Y de variables centrées mesurées sur les mêmes
individus,
sachant que l’un des deux tableaux estpartitionné
en sous-ensembles de variables. Ils’agit
alors d’évaluer la contribution dechaque
sous-tableau de lapartition.
Ainsi le tableau de données Yétant de dimension n x q, le tableau de données X de dimension n x p est formé des sous-tableaux
Xi,
i =1,..., kx
de dimensionsrespectives n
x pi, avecE pi =
p.Par des
changements
demétriques, plusieurs types
de lienpeuvent
alors être considérés(Hanafi
etLafosse, 2001). L’analyse
concorG se ramenant(du
moins aupremier pas)
à uneanalyse
interbatterie de Tucker(1958)
écrite avec desmétriques quelconques (Lafosse, 1997), comprend
donc comme casparticuliers
lesanalyses classiques,
telle quel’analyse canonique
de deuxtableaux,
ou telle quel’ACPVI,
et constitue une
généralisation
de cestechniques.
Pour êtregénéral,
on note N lamétrique
euclidienne surl’espace
d’individusRq,
etMi
lesmétriques
euclidiennesrespectives
sur les espaces d’individus Rpi. Lamétrique
M considérée sur RP est lamétrique
des blocsdiagonaux Mi,
les autres blocs étant nuls.Certaines matrices de
l’exposé
sont alors considérées comme matricesd’appli-
cations linéaires entre espaces
métriques,
et par suite unedécomposition
en valeurssingulières
d’une matrice A considérée commeapplication
linéaire de(Rq, N)
dans(RP, M)
et notéecorrespond
à une écriture où les colonnes de U sont les vecteurssinguliers
àgauche
M-orthonormés et où celles de V sont les vecteurs
singuliers
à droiteN-orthonormés,
les valeurssingulières
se trouvant sur ladiagonale
de la matricediagonale
A(Greenacre, 1984). Quand
ils’agira uniquement
de ladécomposition
en valeurssingulières
usuelle(M
et N sont alors lesmétriques identité),
cela seraindiqué
dansl’exposé.
La
métrique diagonale
despoids
affectés aux individus définie sur Rn est notée D.Pour éviter de
trop
alourdir lesécritures,
on convient ici et par la suite d’user des mêmes notations pourdésigner
les vecteurs à calculerapparaissant
dansl’expression
d’un critère à
optimiser,
et les vecteurs solutionscorrespondants.
La
première
solution del’analyse
Concor consiste à définirkx
+ 1 combinaisons linéaires des variables des tableauxrespectifs Xi
etY,
notéesXiMiui1
etY N VI (ui1~Rpi
etv1~Rq).
Sous contraintes de normeségales
à 1 deskx
+ 1 vecteurs Ull, u21, ... , ukx1 et v1, cesk.
+ 1composantes
sont solutions du critère à maximiserOn note maintenant encore
(Ull,
u21, ... , Ukx 1,VI)
cepremier (kx
+1 )-uple
solution de Concor. Le deuxième
(kx
+1 ) -uple
solution(u12,u22,...,
ukx2,V2)
estobtenu comme le
premier,
maisaprès
avoirremplacé
chacun des tableauxXi
par le tableau déflationnéXi - XiMiui1u’i1.
Cela revient alors à maximiser le critère(1)
sous les mêmes contraintes de normes avec en
plus
les contraintesd’ orthogonalité
On
procède
ainsi par déflationssuccessives,
pour obtenir les solutionssuivantes,
toutesorthogonales
auxprécédentes
selonkx orthogonalités respectives.
Si on souhaite quel’analyse
du lien concerne tous les tableauxsimultanément,
le nombre de solutions calculées serapris
auplus égal
àmin(rang(Xi)).
Dans d’autres circonstances cenombre pourra être
plus
élevé.Le
couple (ui, v1)
étant lepremier couple
de vecteurssinguliers
de la matriceX’DY,
considérée comme celle d’uneapplication
linéaire de(Rq, N)
dans(RP, M),
l’obtention de la
première
solution s’effectue àpartir
de cepremier couple,
les vecteursuil étant les sous-blocs
respectifs
normés à 1 du vecteur ul et à la solution on aUne démonstration est donnée dans l’annexe 6.1.
Maintenant on suppose que le tableau Y est lui aussi
partitionné
enky
sous-ensembles des variables
Yj, j = 1,..., ky,
avec lesmétriques respectives Nj
et onconsidère que la
métrique
N est lamétrique bloc-diagonale
des blocsdiagonaux Nj.
Voulant maximiser sous
ky
+ 1 contraintes de norme(vj 1 eRq
etu1~Rp)
le critèreon obtient aussi la solution
depuis
le mêmepremier couple (u1, u1) précédent,
avecvj1
le j-ème
sous-bloc normé à 1 de vl . Finalement à la solution onpeut
écrireoù
Ai
est lapremière
valeursingulière (avec
lesmétriques associées)
de la matrice X’DY.Le calcul de la
première
solution del’analyse
concorG(Concor généralisée)
consiste à réaliser ce double calcul pour obtenir les
kx + ky
composantespartielles XiMiuil
etYjNjvj1,
et les deuxcomposantes globales X Mul
etYNvl .
La
propriété
suivante montre que les composantespartielles
de lapremière
solution de concorG sont des
représentants
unidimensionnés de leurs tableauxrespectifs pouvant
caractériser le lien de X avec Y.Propriété
2.1Soit
Zx
le tableauayant
pour colonnes leskx composantes partielles XiMiuil,
et
Zy
le tableauayant
pour colonnes lesky composantes partielles YjNjvj1. Alors, (al , bl )
étant lepremier couple singulier
de ladécomposition
en valeurssingulières
usuelle de
ZDZY,
on aUne démonstration se trouve dans l’annexe 6.2.
La deuxième solution de concorG se calcule comme la
première,
maisaprès
avoir déflationné
chaque
tableauYj
etchaque
tableauXi,
cequi
permet d’obtenirkx + ky
+ 2 vecteurs, Ui2, v j2, U2 et V2,orthogonaux
aux vecteursrespectifs
de lapremière
solution. On définit ainsi 2 nouveaux ensembles decomposantes partielles {XiMiui2}
et{YjNjvj2}
associés aux deux nouvellescomposantes globales XMu2
et
YNV2.
Les solutions successives sont calculées de la mêmemanière, chaque
foisaprès
avoir à nouveau déflationné leskx + ky
tableaux des deuxpartitions.
Parce que chacun des deux
systèmes
de vecteurs{us}
et{vs}
est unsystème orthogonal,
et parce que lescomposantes globales
associées aux s =1,...,
Ssolutions successives vérifient
les solutions successives
correspondent
à undécoupage
effectif du lien entre X et Y. La mise encorrespondance
departs
d’inertie distinctes issues de chacun des deux tableaux(cov(XMus , YNvs) ~ 0),
constitue ainsi une véritableanalyse
de celien. Cela
peut
être condensé enénonçant
lapropriété suivante, soulignant
bien que l’ensemble des solutions del’analyse
concorG constitue uneanalyse
du lien entre unepart
de X et une part de Y(parts
extraites avec lesprojecteurs orthogonaux
U U’ Met
VV’N).
Propriété
2.2Soit U la matrice
ayant
pour colonnes les S vecteurs M-orthonormés us, et V la matriceayant
pour colonnes les S vecteurs N-orthonormés vs . Alors lescouples (us , vs)
sont tous lescouples singuliers
de la matrice(XMUU’)’D(YNVV’).
En
réalité,
comme cela a étédit,
chacune des solutions del’analyse
concorGs’obtient
depuis
le calcul d’unpremier couple singulier.
Ce n’estplus
le cas pourl’analyse suivante,
nommée concorGM(concor généralisée multiple), qui
nécessiteun
algorithme particulier.
3.
Analyse
concorGM3.1. Le critère
Toutes les notations
précédentes
sontreprises,
les matrices X et Y étant toutes deuxpartitionnées.
Les vecteurs solutions sont différents pour desanalyses différentes,
bien que notés de la mêmefaçon
pour faciliter lacorrespondance
entreles termes
analogues.
Généralisant Concor
(Concor
est retrouvéequand
l’un des deux tableaux n’est paspartitionné), l’analyse
concorGM est fondée sur le critère ksuivant,
à maximisersous les
kx + ky
contraintes de norme, celles considérées pour le critèreconcorG,
Quand
X = Y etquand
lapartition
est commune, ce critère devient le critère03A83 optimisé
par Hanafi(1997,
pp.74),
iciposé
en dimension 1.Le critère de l’acimoG
(Vivien 2002)
serait le critère k sous les mêmescontraintes,
si ce n’était que les covariances ne sont pas élevées au carré en acimoG.L’auteur s’en sert pour réaliser des
régressions
de type PLS et le calcul des solutions successives necorrespond
pas aux mêmes modifications de tableauxqu’en analyse
concorGM.
Quand
X = Y etquand
lapartition
est commune, le critère de l’ acimoG devient le critère MAXBET(Ten Berge, 1986) posé
en dimension 1.Finalement, l’analyse
concorGM est bien différente del’acimoG,
mais les deux critèresrespectifs
sont vraiment de même nature. C’est
pourquoi
dans le traitement de données duparagraphe
4 les valeurs des critères serontcomparées.
3.2. Première solution
L’optimisation
du critère(2)
revient à poser celle duLagrangien
L’annulation des
kx + ky
dérivéespartielles
de L parrapport
aux vecteurs ui1 et vj1, conduitaux
+ky égalités
Ces
égalités,
et lapropriété 2.1,
conduisent à proposerl’algorithme ci-après (la
preuve de sa convergence est établie dans l’annexe
6.3).
3.3
Algorithme
de calcul de lapremière
solutionChoisir
kx
vecteursu(0)i respectivement Mi-normés,
parexemple
ceux donnéspar la
première
solution de concorG. En prenant alors k =1,2,..., répéter
laséquence :
* Pour
chaque j,
calculer lepremier
vecteursingulier
àgauche v(k)j, Nj-normé
(celui
à droite étantI-normé),
de lamatrice qj
xkx
* Pour
chaque i,
calculer lepremier
vecteursingulier
àgauche u(k)i, Mi-normé
(celui
à droite étantI -normé),
de la matrice pi xky
* Calculer la valeur du critère k.
* Arrêter
l’algorithme quand
l’accroissement obtenu pour cette valeur n’estplus
sensible.Nous définissons les solutions successives de concorGM comme la
première,
mais
après
déflations des tableauxXi
et des tableauxYj,
comme cela est fait pourl’analyse
concorG.L’analyse
concorGM est vraiment uneanalyse
de lien entre les deuxpartitions
car la valeur du critère
dépend
de lafaçon
departitionner
les tableaux dès lapremière solution,
mêmequand
lesmétriques
sont lesmétriques
identité(ce qui
n’est pas lecas pour le critère de
concorG).
Nous en déduisons un intérêt accru pour concorGM.Cependant
les solutions calculées de concorG sontglobales,
alors quel’algorithme
de concorGM
peut
converger vers des solutions locales. C’estpourquoi
on aproposé
d’initialiser cet
algorithme
en partant de lapremière
solution de concorG.4.
Exemple d’applications
Les données sont issues d’une
expérimentation
conduite par leSyndicat
desvins de Cahors
(Laffargue
etcoll., 1983-1993).
Les 30
lignes
dechaque
tableaudésignent
5x6 vinsdifférents,
la différenceprovenant
de l’un des 5porte-greffes possibles
ou de l’un des 6greffons possibles.
On a effectué au moment de la récolte
(en 1983, 1985, 1988,
1989 et1990),
8analyses physico-chimiques
de ces 30 vins. Les 8analyses physico-chimiques
sont :anthocyane
enmg/1,
indice de réfraction du rouge, indice de réfraction dujaune,
indice de
folin, degré
enalcool,
extrait sec, acidité totale et acidité volatile.Chaque
année est finalement
représentée
par un tableau 30x8 de colonnes centrées et réduites.4.1. Une
analyse
detype
discriminanteOn veut savoir si les variables
physico-chimiques peuvent
discriminer les vins selon leurappartenance
aux 6catégories
degreffons,
ou bienplutôt
selonleur
appartenance
aux 5catégories
deporte-greffes.
Les 2hypothèses
de sous-groupages sont considérées simultanément car on veut
désigner laquelle
des deuxs’avère dominante par
rapport
àl’autre,
en les confrontant. Deplus,
pour ne pasprivilégier
une annéeplutôt qu’une
autre, les 5 annéesparticipent
simultanément à l’étude.Finalement les données sont ici constituées de 2 tableaux d’indicatrices
YI, 30x5,
etY2, 30x6,
et de 5 tableauxd’explicatives Xi,
i =1... 5,
30x8. Les 30 vinssont les 30 individus communs aux 7 tableaux.
L’analyse concorGM, l’analyse
concorG etl’analyse
fondée sur le critère del’acimoG,
sont réalisées en munissant les 7 espaces d’individus desmétriques
deMahalanobis
respectives,
de sorte que le critère devient un critère somme de carrés de corrélations pour concorGM. Les 10 carrés de corrélations d’une solution relatifsaux 10
couples (Yj, Xi)
sont alorsinterprétés
en termes depouvoirs
discriminants.TABLE 1
Valeurs du critère concorGM pour les 4 solutions et les 3
analyses
TABLE 2
Valeurs du critère acimoG pour les 4 solutions et les 3
analyses
Quatre
solutions successives sont calculées.Quatre
est ici la valeur du rang deYI
alors que le rangde Y2
estégal
à5,
ceux desXi
valant 8. Donc 4 est le nombremaximal de solutions à calculer pour
permettre
de confronter des 2hypothèses.
Pourchaque
solution dechaque analyse,
la valeur du critère concorGM considéré dans la table 1 est la somme de 10 carrés de corrélation. Les 2premières
solutions de concorGMcorrespondent
alors à 65 % de ladépendance analysée.
La table 2 établit la
comparaison
entre cesanalyses
dupoint
de vue del’acimoG,
le critère somme des 10 corrélations étant celui alors calculé(avec
59 % de ladépendance
extraite par les 2premiers
axes, selonl’acimoG).
La table 3 contient les
parts
relatives du critère concorGM de chacune des 2premières solutions, parts prises
par chacun des 10couples (Yj, Xi).
Dans
l’ensemble,
les corrélations sontplus
élevées avecYI qu’avec Y2.
Pour l’année
1988,
lapremière
solutionindiquerait plutôt
lecontraire,
mais la81 TABLE 3
L’intérieur de la table contient les carrés des corrélations
entre les composantes, pour les 2
premières
solutions des 3analyses
deuxième solution montre que ce n’est pas vraiment le cas. Finalement
l’analyse
révèle nettement que les variables
physico-chimiques
considéréespermettent
la discrimination desporte-greffes
bienplus
que desgreffons.
Pour faciliter la
comparaison,
les déflationsrespectives
réalisées pour le calcul de la deuxième solution de chacune des 3analyses
sont dutype proposé
enanalyse
concorGM ou concorG. En ce sens, on s’est écarté de la véritable définition de l’ acimoG. On peut noter que la différenciation entre
porte-greffe
etgreffon
est moinsnette
depuis
lescomposantes
del’acimoG,
comme onpeut s’y
attendre. Eneffet,
pour le critère de
l’analyse
concorGM l’élévation au carré des corrélationsproduit
larecherche d’une solution accentuant les écarts entre corrélations faibles et corrélations fortes. On remarque que les corrélations obtenues
depuis l’analyse
concorG se situentdans une
position
intermédiaire entre les valeurs de concorGM et de acimoG.La discrimination trouvée en
analyse
concorGM est aussi révélée par lesgraphiques correspondants
de lafigure 1,
enpermettant
de détailler laparticipation
dechacun des vins. Pour la
figure
la(tableaux YI
etY2),
les vins d’un mêmeporte-greffe (resp. greffon) ayant
le mêmecodage
dansYI (resp. Y2)
sontprojetés
au même endroitdésigné
par le numéro duporte-greffe (resp.
dugreffon),
sur lesrepères (Vjl, Vj2)
respectivement
obtenuspour j =
1 et 2. Sur lafigure
lb(projections
des 30 vins sur lesrepères (Uil, ui2)),
on a codéchaque
vin par son numéro deporte-greffe,
tandisque sur la
figure le, identique
à1 b, chaque
vin est codé par son numéro degreffon.
Tous les 7 x 2 axes de 1 b ou 1 c ont la même échelle.
Ainsi voit-on se
correspondre
assez bien lespositions
desporte-greffes représentés
sur legraphique gauche
de lafigure la,
avec celles desporte-greffes représentés
surchaque graphique
de lafigure
lb. Cela est très net pour leporte-greffe
5
quelle
que soit l’année et donc ceporte-greffe
ajoué
un rôleimportant
dans la dis-crimination mise en évidence. Par contre la
correspondance
entrepositions respectives
s’établit
beaucoup
moins bienquand
on veut associer lesgreffons
dugraphique
droitde la
figure
la avec ceux de chacun desgraphiques
de lafigure
1 c.La
figure
1 d contient lesgraphiques
des variables dechaque
tableauXi projetées
sur les
repères respectifs
des composantespartielles,
duaux desrepères
de lafigure
1 bou le. Ces
repères
sont orthonormés car lesmétriques
de Mahalanobis sont celles utilisées.Quand
on passe d’une année à une autreannée,
on ne voit pas lespositions
des variables se
correspondre.
Bien que la discrimination par lesanalyses physico- chimiques
se réalise assez bien pour lesporte-greffes,
cesgraphiques
ne révèlentpas l’existence de deux
premiers
facteursqui
seraient communs à toutes les années.Finalement on peut conclure que les facteurs discriminants des
porte-greffes
sontplutôt
à évaluerséparément
pourchaque
année.4.2. Une étude
d’analogie
entre vins vieux etvins jeunes
En fait les mêmes
analyses physico-chimiques
des 30 vinsprécédents
ont étérépétées
5 ansaprès
la récolte. Pour chacune des années1983, 1985, 1988,
1989 et1990,
ondispose
donc d’un nouveau tableau 30x8 de variables centrées réduites. Ces tableaux sont maintenant notésYj, j = 1,...,
5. On se propose alors de comparerles
analyses
des 5 vinsjeunes (Xi,
i =1,..., 5)
avec celles des 5 vinsvieux,
voulant savoirquelles
associations deux à deuxpeuvent prédominer.
En considérant simultanément toutes les associationspossibles,
si certaines s’avèrent sensiblementplus
fortes qued’autres,
on pourrajuger
celles-cisignificatives (plus
facilementque par des
analyses séparées). L’analyse
concorGM est cette fois réalisée avec lesmétriques
identité et le critère est un critère somme de 25 carrés de covariances.On considère ici que la structure associée à un tableau
correspond
à l’ensemble des corrélations entre variables de ce tableau. Un lien fort établi entre deux sous-tableauxva
correspondre
avec lesmétriques
identité à l’existence d’un lien fort entre deux structures et révèlera ainsi deux structures internesplutôt analogues.
Voulant
prédire
les vins vieux àpartir
des vinsjeunes,
on auraitadopté
lesmétriques
de Mahalanobis relatives aux tableaux des vinsjeunes
et lesmétriques
identité pour les tableaux des vins
vieux;
mais cetype d’analyse
n’a pas été réalisé dans cepapier.
Huit solutions successives peuvent être
calculées,
ce nombrecorrespondant
aunombre de colonnes de chacun des 10 tableaux
(et
à leurrang).
Les deuxpremières
solutions de
l’analyse
concorGMcorrespondent
ainsi à 92% du cumul des 8 valeurs du critère somme des 25 carrés de covariances(table 4),
avec unepremière
solutionpresque 4 fois
plus importante
que la deuxième.Outre la valeur du critère concorGM
qui
est donnée dans la table 4 pour les 3 méthodesconcorGM,
concorG etacimoG,
on donne les valeurs du critère acimoG dans la table 5. On notera que ces critères ne sont directementcomparables qu’au
83
FIGURE 1
Représentation
des 30 vins dans lesrepères (vj1, vj2), j = 1, 2 (ligne a)
et dans lesrepères (Uil, ui2),
1 i5, (lignes
b etc).
Les 30 vins sontsymbolisés
par leurporte-greffe (ligne
a,Y1,
etligne b),
ou par leurgreffon (ligne
a,Y2,
etligne c),
lareprésentation
deslignes
b et c étantidentique.
En dernièreligne,
les variables sontreprésentées
dans lesrepères (XiMiuil, XiMiui2) .
premier
pas, du faitqu’aux
pas suivants les tableaux déflationnés diffèrent suivant la méthode utilisée.TABLE 4
Valeurs du critère concorGM pour les 8 solutions des 3
analyses
TABLE 5
Valeurs du critère acimoG pour les 8 solutions des 3
analyses
TABLE 6
Carrés des corrélations entre les 2 composantes des 25
couples (Xiuis, Yjvjs).
Les5
premières lignes
sont relatives à lapremière solution,
les 5lignes
suivantes à la deuxièmesolution, orthogonale
à lapremière
de la mêmefaçon
pour les 3analyses.
Les caractères gras mesurent l’association
« vin jeune-vin
vieux » d’une même annéeLes 5
premières lignes
de la table 6 contiennent les valeursp2 (Xiui1, Yjvj1),
pour z =
1,...
5et j = 1,... 5,
associées à lapremière
solution. Les 5 dernièreslignes
contiennent les valeurs03C12(Xiui2,Yj V j2)
associées à la deuxième solution. Les85 deuxièmes solutions des 3
analyses
diffèrent du fait du critère et non pas du fait dutype
de déflations(on
s’est donc encore ici écarté de la vraie définition del’acimoG).
Quelle
que soitl’analyse
et pourchaque solution,
on observe des corrélations engénéral
bienplus
fortesquand
ils’agit
descouples (Xiui,, Yivis),
i =1,... 5, qui
associent les mêmes années
(en
gras sur lesdiagonales).
La faiblesse relative de presque tous les termesextra-diagonaux
estévidente,
notamment pour lapremière
solution de
l’analyse
concorGM. Le fait de trouver ainsi des associations dominantes pour les vins de la même annéeimplique
que ces associations sontsignificatives.
Parsuite, envisager
deprédire
lesanalyses
d’un vin vieux àpartir
desanalyses
du mêmevin faites au moment de la récolte semble concevable.
Pour
repérer
unvin,
ou unporte-greffe,
ou encore ungreffon, responsable
de cette association
dominante,
onpourrait juxtaposer
les vinsjeunes
de l’annéei
projetés
dans lerepère (Uil, Ui2)
avec les vins vieux de l’année iprojetés
dansle
repère (Vil, Vi2).
Un même vinqui
occupe la mêmeposition
excentrée sur deuxgraphes juxtaposés
contribue fortement à la dominanceprécédente,
et encoreplus
fortement si cela se
reproduit
pour luichaque
année.Notons
qu’une
autreanalyse,
celle effectuée avec lesmétriques
deMahalanobis,
ne conduit pas à ces associations
dominantes,
et doncl’analogie
mise en évidenceentre vins de la même année
n’apparaît qu’avec
laprise
encompte
des structures internes aux sous-tableaux(avec
lesmétriques identité).
5. Conclusion
Pour
chaque
solution de concorG ou deconcorGM,
desparts
de variances et/ou desparts
d’inertie sont mises en relation selon un critère d’association. Les solutions successives considèrent de nouvellesparts
et ledécoupage
ainsi induit définit la notiond’analyse.
Undécoupage
relatif à chacun des sous-tableaux convient à l’étude du lien entre tous ces sous-tableaux.L’analyse
concorGM étant effectivement uneanalyse
entre les
sous-tableaux,
cedécoupage
est naturel. Par contre, lapropriété
2.2indique
clairement que concorG
analyse plus
le lien entre X et Y que les liens entre lessous-tableaux,
et de cepoint
de vuel’analyse
concorG s’avère moinspertinente
que concorGM.Cependant,
les traitements de données effectuésindiquent
que lespremières
solutions de concorG peuvent être
proches
des solutions deconcorGM,
dans la mesure où la valeur du critère concorGM calculée avec les solutions de concorG est élevée.Pour des raisons de
rapidité
de mise en oeuvre, ces solutionspourraient
donc êtrerecherchées à la
place
des solutions de concorGM. On a d’ailleurs ainsipensé
àinitialiser
l’algorithme
de concorGM àpartir
du calcul de lapremière
solution de concorG.En outre, par construction et pour
chaque
solution de rang s, enanalyse
concorGil existe un lien entre les
signes
des vecteurs Uis et lessignes
des vecteurs V j s et pour cette raison lescomposantes
del’analyse
concorG(et
aussi celles del’acimoG) pourraient
êtrepréférées
à celles del’analyse concorGM,
notammentquand
ils’agit
de révéler les individus
qui
sont dans despositions analogues
surplusieurs graphiques
juxtaposés.
Cependant, puisque
cessignes
sont totalement arbitraires enanalyse concorGM,
il est
possible
de les choisir. Pour une solution s, onpeut
parexemple
choisirles
signes
deproche
enproche,
en considérant d’abord les vecteurs associés auxcovariances
cov(XiMiuis, YjNjvjs)
lesplus
élevées en valeurabsolue,
de sorte queces covariances deviennent
positives (en
tout caschaque
fois que cela estpossible, compte
tenu des choix designes déjà faits).
Ainsipeut-on
obtenir lesgraphiques
de la
figure
1. Il a été en effetpossible
de choisir lessignes
des vecteurs(et
donc les orientations desaxes)
tels que toutes les covariances - en fait des corrélations - deviennentpositives (par
ailleurs on a constaté que les covariances calculées avec lescomposantes
des deuxpremières
solutions de concorG étaient aussi toutespositives,
tout comme celles calculées en
acimoG).
En prenant pour
métriques Mi
celles de Mahalanobis pour les tableauxrespectifs Xi,
et lesmétriques
identité pour les tableauxYj,
le critère concorGM devient un critère somme de variancesexpliquées
etl’analyse
devient uneanalyse
detype
régression.
Ils’agit alors, parmi
toutes les associations « tableauexpliqué Yj
partableau
explicatif Xi
», dedésigner
celles menant aux variancesexpliquées
lesplus
élevées.
Chaque système {Xiuis}, s = 1,2,....
est alors formé decomposantes explicatives
de corrélations nulles deux à deux.Cependant,
dans certains cas(notamment quand
le nombre des variables des tableauxXi
est trèsélevé)
la mise en oeuvre de cetteanalyse
devient incertaine.Pour éviter le calcul des
métriques
deMahalanobis,
onpeut
alorsenvisager
unemodification de
l’analyse, recopiant
une démarcheproposée
enrégression
acimoG-PLS par Vivien. Le critère d’association considéré pour calculer
chaque
solution estalors le critère concorGM de
type procruste (toutes
lesmétriques Mi
etNj
sont lesmétriques identité),
et les modifications successives des tableauxXi
sont différentes de cellesproposées
enanalyse concorGM,
car choisies pour obtenir dessystèmes {Xiuis}, s = 1, 2,...,
formés decomposantes explicatives
de corrélations nulles deux à deux. On obtient alors unerégression « concorGM-PLS », qui peut
se situercomme étant un
compromis
entre deux typesd’analyse concorGM,
le typeprocruste
etle
type régression
décrit dans leparagraphe précédent.
La différence entre concorGM- PLS et l’acimoG-PLScorrespondante provient
seulement du critère utilisé.6. Annexe
Sans
perte
degénéralité,
nous faisons les trois démonstrationsci-après
en sup-posant
que lesmétriques
euclidiennes sur les espaces d’individus sont lesmétriques
identité.
6.1. Critère concorG
Il
s’agit
de montrer que, souskx
+ 1 contraintes de norme, la maximisation du critèreet, sous 2 contraintes de norme, celle du critère
sont 2
optimisations
relatives à un mêmeproblème
avec à lasolution, f1 = f 2
avecb = v,
leskx
vecteurs ui étant leskx
sous-blocs normés à 1 du vecteur a.Le
Lagrangien
associé à la maximisation def 2
s’écrivanten annulant les dérivées
partielles
deL2
par rapport à a etb,
et en posanton obtient
d’où l’on déduit immédiatement que
Le
couple (a, b)
est ainsi celui des vecteurs propres associés à laplus grande
valeur propre des matrices X’ DYY’ DX et Y’DXXDY.
Puisque À == r2,
aidésignant
le i-ème sous-vecteur de a, la restriction de(4)
au bloc
Xi
s’écritDans le cas de
l’optimisation
defi,
leLagrangien
s’écritÉgalant
à zéro les dérivées deLi
par rapport à ui et v, etposant
on a
On en déduit alors que
Compte
tenu de(13), l’égalité (11)
s’écrit encorece
qui, reporté
dans(12),
donneCette
équation
étantidentique
à(8)
on en déduitOn déduit alors de
(15)
et de(9)
Compte
tenu de(13), (14)
et(17), l’optimum
defi
est bienégal
à celui def 2,
et on déduit de
(19)
que ui est le i-ème sous-vecteur(normalisé)
du vecteur a.Remarques
1)
Pour maximiser le critèref3,
sous contraintes de norme desky
+ 1 vecteursul vil ... 1 vil ... 1 Vky
on suit le raisonnement
ayant
conduit àl’optimisation
defi, après
interversion des rôles de X et de Y. Enposant
on obtient
bj
étantle j-ème
sous-vecteur de b.2)
Lecouple (Xa, Yb)
est lepremier couple
de Tucker(1958)
des tableaux X etY,
card’après (7)
et(8)
il vérifie leséquations
6.2. Démonstration de la
propriété
2.1Le
couple (Xa, Yb)
étant lepremier couple
decomposantes
de Tucker(1958)
des tableaux X et
Y,
il faut montrer que c’est aussi lepremier couple
decomposantes
de Tucker des tableauxZx
etZy.
Il doit donc vérifier leséquations (24)
et(25),
oùX et Y sont à
remplacer
parZx
etZy respectivement.
D’après
les définitions deZx
etZy,
on aOr
d’après (5), (6)
et(23),
on ad’où, puisque v’jvj =
1Or
Donc
Comme
d’après (9)
et(19)
puisque u’iui = 1,
etcompte
tenu de(6)
et de(19),
on ace
qui
montre que X a est bien unecomposante
de Tucker des tableauxZx
etZy.
De la même
façon
on démontrerait que Yb est l’autre composante de Tucker de ces tableaux.6.3.
Convergence
del’algorithme
concorGMAfin de montrer la convergence de
l’algorithme
décrit auparagraphe 3.3,
onmontre que la valeur du critère ConcorGM
augmente
àchaque étape
del’algorithme.
En
effet,
sachant les contraintes de norme àrespecter,
cette condition est suffisante(Hanafi, 1997).
La démonstration repose en effet sur le fait
qu’en posant
le critère concorGM
peut s’écrire
Soient
{u(0)i}
et{v(0)j}.
leskx + ky
vecteurs tous normés et considérés comme une initialisation del’algorithme.
Lesvecteurs {u(1)i} et {v(1)j},
étant leskx + ky
vecteurs alors calculés lors d’une
étape
del’algorithme 3.3,
tout leproblème
consistedonc à établir que
Or, d’après
cetalgorithme,
un vecteurvjl)
étant lepremier
vecteursingulier
àgauche
de la matrice