R EVUE DE STATISTIQUE APPLIQUÉE
S ÉBASTIEN L E D IEN
J ÉRÔME P AGÈS
Analyse factorielle multiple hiérarchique
Revue de statistique appliquée, tome 51, n
o2 (2003), p. 47-73
<http://www.numdam.org/item?id=RSA_2003__51_2_47_0>
© Société française de statistique, 2003, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE FACTORIELLE MULTIPLE
HIÉRARCHIQUE
Sébastien LE
DIEN,
JérômePAGÈS
Laboratoire de
mathématiques appliquées
Pôle
agronomique
de Rennes65 rue de Saint Brieuc CS 84215 - 35042 Rennes cedex, France
RÉSUMÉ
Il n’est pas rare, dans
l’analyse
de tableaux de type individus x variables, de rencontrerune structure en
partition
sur les variables. On peut citer, pourexemple,
lesquestionnaires
structurés en thèmes. Plusieurs méthodes existent,
qui
permettentl’analyse
de ce type de tableau, dontl’analyse
factoriellemultiple (AFM).
Il arriveégalement
que l’on veuilleprendre
en compte non pas une
partition
sur les variables mais une hiérarchie : c’est le cas desquestionnaires
structurés en thèmes et en sous-thèmes. Dans cet article, nous proposonsune nouvelle méthode
qui généralise
l’AFM en prenant en compte cette structure sur les variables :l’analyse
factoriellemultiple hiérarchique (AFMH).
L’AFMHéquilibre
(au sens del’AFM)
pourchaque
noeud de la hiérarchie, les groupes de variables constituant ce noeud.L’AFMH fournit des sorties
analogues
à celles de l’ AFM mais aussi des aides àl’interprétation spécifiques,
telle que lareprésentation
de chacun des noeuds d’une part et lareprésentation
desindividus décrits par chacun des noeuds, d’autre part.
Mots-clés :
Analyse factorielle multiple hiérarchique, analyse factorielle multiple,
hiérarchiede variables.
ABSTRACT
Frequently,
in theanalyses
of individuals x variables tables, sets of variables are structu- redaccording
to apartition.
Several methods make theanalysis
of this type of datapossible,
asfor instance
Multiple
FactorAnalysis (MFA,
Escofier andPagès,
1998). In some cases, users want to take into account notonly
onepartition
on the variables but ahierarchy
as it is oftenthe case for
questionnaires
structured intotopics
andsub-topics.
In this article, we propose ageneralisation
of MFA which takes into account this structure on the variables, the hierarchicalmultiple
factoranalysis (HMFA).
To do so, HMFA balances the role of each group related to its node of thehierarchy,
as in MFA. HMFAprovides
the same outputs as MFA but itprovides
alsoits own outputs such as a
graphical display
of the groups of variables related to the nodes of thehierarchy
or agraphical display
of the individuals describedby
each of the groups related to the nodes of thehierarchy.
Ke y words :
Hierarchicalmultiple factor analysis, multiple factor analysis, hierarchy
on setsof
variables.1. Introduction
L’analyse
factorielle de données danslesquelles
un même ensemble d’individus est décrit parplusieurs
groupes de variables est unproblème auquel
le statisticien estfréquemment
confronté : il est souvent naturel de regrouper les variables en fonction d’unetypologie;
dans le cas des donnéesd’enquête,
enparticulier,
lesquestionnaires
sont
généralement
structurés en thèmes. Ceproblème, aujourd’hui classique, peut-
être traité par différentesméthodes,
dontl’analyse procrustéenne (Gower, 1975),
laméthode STATIS
(Lavit, 1988)
etl’analyse
factoriellemultiple (Escofier, Pagès, 1998).
Une difficulté
s’ajoute lorsque
l’on veut tenircompte
d’une hiérarchie compre- nant la notion de groupes et de sous-groupes de variables : pourreprendre l’exemple
des
questionnaires,
les thèmesprécités
sont souvent eux-mêmes structurés en sous-thèmes. Considérer non pas une
partition
sur les variables maisplusieurs partitions emboîtées,
dans uneanalyse
factorielle de l’ensemble desvariables, implique
d’unepart d’équilibrer
les thèmes et les sous-thèmes et d’autrepart
de fournir des sorties(graphiques
ou indicateursnumériques) permettant
deprendre
en compte dans l’in-terprétation
la structure apriori
sur les variables. Ceproblème,
bien que souventrencontré,
ne semblejamais
avoir été abordé. Dans cetarticle,
nous proposons une nouvelleméthode, l’analyse
factoriellemultiple hiérarchique (AFMH), qui généralise
l’AFM au cas où les variables sont structurées selon une hiérarchie.
Les
principes
de base del’AFMH,
sesspécificités
en tantqu’analyse
factorielle ainsi que lestypes
de résultatsqu’elle
fournit serontprésentés
au travers d’unexemple
issu de
l’analyse
sensorielle.Dans le cadre de cet
article,
nous considérons le cas où toutes les variables sontquantitatives
et centrées-réduites. L’extension aux variablesqualitatives
et auxdonnées mixtes est en cours d’étude.
2. Données utilisées pour illustrer la
présentation
de la méthode96 étudiants du Pôle
Agronomique
de Rennes ont évalué etapprécié
6 pursjus d’orange
choisisparmi
lesprincipales
marques du marché(cf.
tableau1).
TABLEAU 1 Jus
d’orange
étudiésLes variables
disponibles
serépartissent
d’abord selon deux groupes :jugements hédoniques
et caractérisation.Les
jugements hédoniques
sont ceux des 96 étudiantsqui
ont notéchaque jus
sur une échelle allant de 1 à
5,
1signifiant
que lejus
n’a pas du tout été aimé et 5indiquant qu’il
a étéparticulièrement apprécié.
Le groupe caractérisation est
composé
de 16 variables que l’on peut subdiviseren 9 variables
physico-chimiques
d’une part et en 7descripteurs
sensoriels d’autrepart (cf. figure 1) :
1. les variables
physico-chimiques
sont l’aciditéglobale,
lepH brut,
lepH après centrifugation
duproduit,
le taux d’acidecitrique,
le taux ensaccharose,
le tauxen
glucose,
le taux enfructose,
lepouvoir
sucrant et enfin le taux en vitaminesC;
2. les variables sensorielles sont la
typicité
del’odeur,
les caractèressucré,
amer,acide, pulpeux,
l’intensité dugoût
et l’intensité de l’odeur. Ces variables sont les moyennes des notes attribuées par les 96étudiants, chaque
note variant surune échelle allant de 1 à
5,
où 1signifie
que l’intensité associée audescripteur
est perçue comme faible et 5
signifie
au contrairequ’elle
est ressentie commetrès élevée.
FIGURE 1
Le groupe de variables
descriptives
sedécompose
en variablesphysico-chimiques
d’une part et endescripteurs
sensoriels d’autre part Un desenjeux
de l’étude est la mise en relation des deuxaspects
caractérisation(variables physico-chimiques
etsensorielles)
d’unepart
etjugements hédoniques
d’autre
part.
Une AFM du
jeu
de données structuré selon ces deuxaspects permet
de les comparer à travers les structuresqu’ils
définissent sur l’ensemble desjus d’orange
mais ne
permet
pas dedistinguer
les variablesphysico-chimiques
desdescripteurs
sensoriels au sein de la caractérisation.
Par
ailleurs,
une AFMdu jeu
de données structuré selon les trois groupesphysico- chimique,
sensoriel ethédonique
nepermet
pas unecomparaison
directe des deuxaspects
caractérisationet jugements hédoniques.
L’AFMH va
permettre
une tellecomparaison,
tout en tenantcompte
de lastructure interne du groupe des variables
descriptives.
3. Notations et définitions
On note X le tableau de données individus x
variables,
I l’ensemble desindividus,
D la matricediagonale
de leurpoids (on désigne
par p lepoids
del’individu
i ; 03A3i~I
pi =1)
et K l’ensemble des variables. Dansl’AFM,
ces K variablessont structurées suivant une
partition unique composée
de J groupes; enAFMH,
onne considère non
plus
une seulepartition
sur les variables maisplusieurs partitions
emboîtées.
Soient deux
partitions Pl = {A1,..., AJ1}
etP2 = {B1,..., BJ2}
sur unmême ensemble de variables
K; Pl
est emboîtée dansP2,
ce que l’on notePl
CP2,
si tout élément de
Pi
est inclus dans un et un seul élément deP2 :
Plus
généralement,
soient Ppartitions
sur un même ensemble de variablesK;
une suite departitions
emboîtées à P éléments est un ensemble departitions {P1,..., PP}
notéSp,
tel que :FIGURE 2
Représentation
d’une suite departitions
emboîtées à trois éléments :la
première (resp. deuxième;
resp.troisième)
coupurehorizontale,
à l’indice de niveau 1(resp. 2;
resp.3), correspond
à lapartition Pl (resp. P2 ; resp. P3),
constituée de 7
(resp. 4;
resp.2)
sous-ensembles de variables(éléments
terminauxde l’arbre associé à
Sp).
Les groupes de variables sontrepérés
soit par leur numéro de n0153ud(de
1 à12)
soit par leur numéro de groupe associé à leurpartition
(cf. figure 4)
Cette suite
Sp,
en tant que hiérarchie sur les variables deK, peut
êtrereprésentée
sous la forme d’un arbre
hiérarchique
dont les éléments terminauxcorrespondent
chacun à une variable et dont les indices de niveaux sont entiers et
correspondent
chacun à une
partition (cf. figure 2);
par la suite on utilisera indifféremment les termes d’indice de niveau et de niveau departition.
Dans la
figure 2,
les groupes de variables sontrepérés
par leur numéro denoeud,
le dernier noeudcorrespondant
à l’ensemble des variablesK ;
ilpeut
êtreutile,
commeon le verra par la
suite,
de lesrepérer
par leur numéro de groupe associé à leurpartition.
Pour un niveau de
partition donné, l’appartenance
d’une variable à une classeest définie à l’aide de la fonction
f p.
Pardéfinition, f p est l’application qui
à la variablek associe l’indice du groupe
auquel
elleappartient
au niveau departition
p.Dans l’étude concernant les
jus d’orange,
un desobjectifs
est de les décrire au travers des deux aspects caractérisation etjugements hédoniques,
en tenantcompte
de la distinction entre variablesphysico-chimiques
et sensorielles au sein de la caractérisation. Pourcela,
on considère une suite departitions
emboîtées à deux élémentsS2 (cf figure 3)
telle que :1.
Pl
est lapartition
constituée des 3 groupes de variablesphysico-chimiques,
sensorielles et
hédoniques;
2.
P2
est lapartition
constituée des 2 groupes caractérisation etjugements hédoniques,
où le groupe caractérisation est l’union des 2 groupesphysico- chimique
et sensoriel dePl.
FIGURE 3
P1
est lapartition
constituée des 3 groupesphysico-chimique (groupe 1,
n0153ud1),
sensoriel
(groupe 2,
n0153ud2)
ethédonique (groupe 3,
n0153ud3); P2
est lapartition
constituée des 2 groupes caractérisation
(groupe 1,
n0153ud4) et jugements hédoniques (groupe 2,
n0153ud3)
Si k est la variable sensorielle caractère
pulpeux (cf. figure 3),
alorsf1 (k)
= 2et
f2 (k)
= 1(le
noeud 4correspond
au groupe 1 de lapartition P2).
On note
Jp
l’ensemble des groupes de lapartition Pp, Kr
l’ensemble des variables dugroupe j
au niveau departition
p etX p
le tableau associé àKpj (cf.
figure 4) :
Les
symboles I, J, K, Jp
etKr désignent
à la fois l’ensemble et son cardinal.À
toute suite departitions Sp,
on associegénéralement
deuxpartitions
supplémentaires :
FIGURE 4
Représentation
d’une suite departitions
à troisniveaux,
en termes de sous-tableaux(cf. figure 2) :
les groupes de variables sontrepérés
par leur numéro de groupe associé à leur
partition
1. la
partition
laplus
fine(niveau d’agrégation 0),
oùchaque
variable est un groupe;2. la
partition
laplus grossière (niveau d’agrégation
P+1),
où toutes les variablesappartiennent
à un même groupe.4.
Principe, équivalences
4.1.
Principe
Prendre en
compte
la suite departitions implique d’équilibrer
le rôle dechaque
groupe au sein de sa
partition
et ce à tous les niveaux departition.
Dans notreapplication,
on veut obtenir unedescription des jus
à travers lesaspects
caractérisation etjugements hédoniques, qui équilibre
ces deuxpoints
de vue entre eux maisaussi,
au sein de la
caractérisation,
le rôle des variablesphysico-chimiques
d’unepart
et sensorielles d’autre
part.
EnAFMH,
pour obtenir un teléquilibre,
on réalise unesuccession d’AFM à
chaque
noeud de l’arbre associé à la suiteSp,
que l’on parcourt de l’indice de niveau leplus
bas à l’indice leplus
élevé. De cettefaçon, grâce
àl’ AFM,
on
pondère
les groupes de variables issus de ladécomposition
d’un noeud defaçon
àéquilibrer
leurinfluence,
tout en tenantcompte
de leur structure interne. L’AFMH est uneanalyse
du tableau de données X structuré selon la hiérarchieSp, qui peut
alorsse
décomposer
de lafaçon
suivante :Étape
1 : on réalise uneanalyse
factorielle de chacun des groupes de variables associés aupremier
niveau departition;
on stocke les facteurs obtenus. Dansl’exemple,
cela revient à réaliser une ACP de chacun des groupes de variables associésaux noeuds 1 à 7
(cf. figures
2 et5).
Étape
2 : àchaque
noeud de l’indice de niveau 2(noeuds 8, 9
et10, cf. figure 2),
on réalise une AFM dans
laquelle
les groupes de variables sont ceuxqui
constituent le noeud(pour
le noeud8,
ils’agit
des groupes de variables 1 et2).
Enpratique,
à ceniveau,
les variables d’un groupe sontremplacées
par les facteurs issus de son ACP.À
leur tour, les facteurs de ces AFM sont stockés : ce sont euxqui représenteront
lesgroupes de variables associés aux noeuds dans les AFM de
l’étape
suivante.(...)
Étape
p : on réitèrel’étape
p - 1jusqu’à
l’indice de niveau leplus
élevé(cf. figure 5);
àchaque étape,
les variables sontremplacées
par les facteurs issus des AFM réalisées àl’étape précédente.
Lors de la dernière
étape (i. e. l’étape P),
lesprincipaux
facteurs de variabilité de l’AFMH sont obtenus à l’issue de l’AFM des groupes de facteursprincipaux
associésaux noeuds de l’indice de niveau P
(dans l’exemple
de lafigure 2,
on réalise une AFMdes groupes de facteurs associés aux noeuds 11 et
12).
Cetteétape, qui correspond
donc à une ACP
pondérée
du tableau de donnéesX,
constituel’analyse globale
del’AFMH.
FIGURE 5
Analyses factorielles
réalisées au cours de l’AFMH(cf. figure 2);
à l’issuede la dernière
AFM,
réalisée sur les groupesde facteurs principaux
associés audernier niveau de
partition,
on obtient lesprincipaux facteurs
de variabilité de l’AFMH
On utilise pour
l’analyse globale
de l’AFMH les notations usuelles de l’ Acp.On note us l’axe
principal
de rang s du nuage des individus etFs
le facteur associé(i. e.
le vecteur des coordonnées des individus surus);
on note vs l’axeprincipal
derang s du nuage des variables et
Gs
le vecteur des coordonnées des variables sur vs.Enfin,
on note03BBs
la se valeur propre.Le calcul des
principaux
facteurs de variabilité de l’AFMH passe par la réalisation d’ ACP(pour
les noeudscorrespondant à P1)
et d’ AFM(pour
les autresnoeuds) séparées.
Les valeurs propres de ces
analyses permettent
de se faire une idéeprécise
desstructures d’inertie induites par chacun des groupes de variables
(cf.
tableau2).
TABLEAU 2
3
premières
valeurs propres desanalyses partielles
FIGURE 6
Premières valeurs propres issues des
analyses partielles;
1B 1 1(3) correspond
à la 1 e valeur propre de l’AFMH du tableau de données structurées selon lafigure
3 : l’AFMH estprésentée
comme une ACPpondérée
de l’ensemble des
variables,
autrement dit comme une ACPpondérée
des variablesregroupées
suivant lapartition
laplus grossière,
où toutes les variablesappartiennent
à un même groupe(niveau d’agrégation
P + 1 =3,
d’où lanotation)
Dans
l’exemple, d’après
le tableau 2 et lafigure
6 :1. Les
analyses séparées
des groupes de variablesphysico-chimiques
et sen-sorielles mettent en évidence pour
chaque
groupe une direction d’inertieprépondérante
sans pour autant que l’onpuisse
considérer ces groupes comme unidimensionnels.2. Le groupe des
jugements hédoniques
est nettementplus
multidimensionnel que les deux autres, cequi
est attendu étant donné son nombre relativementimportant
de variables et leur nature(les jugements hédoniques pouvant
être trèsdivers).
3. Les fortes différences entre les
premières
valeurs propres desanalyses séparées
rendent
indispensable
lapondération
des groupes au sein d’uneanalyse globale.
4.2.
Équivalence
avec une AcpL’AFM étant une ACP
pondérée, l’analyse globale
de l’AFMHpeut
êtreprésentée
comme une ACP dans
laquelle
les variables sontpondérées
de telle sorte que le rôle dechaque
groupe soitéquilibré
au sein de sapartition,
et ce à tous les niveaux departition.
Dans
l’algorithme présenté,
le fait de travailler àpartir
des facteursprincipaux
nonnormés assure
l’équilibre
entre les groupes de variables. Il reste maintenant àexpliciter
le calcul des
poids
des variables de base àchaque étape.
Rappelons
que l’AFMpondère
les variables d’un mêmegroupe j
par1/03BBj1, où,
suivant les notations de
l’AFM, Ai désigne
lapremière
valeur propre del’analyse
factorielle du
groupe j.
La détermination des
poids
des variables en AFMH se déroule en Pétapes,
dela
façon
suivante :Soit
ma (k)
lepoids
initial accordé à la variablek ; généralement
toutes lesvariables ont un
poids
initialégal
à 1.Étape
1 :Vj ~ {1,..., J1}
onappelle Bj (1)
lapremière
valeur propre issue de l’ACp dugroupe j
dePl.
Cette valeur proprepeut
aussi être notée03BBf1(k)1
si lavariable k
appartient
augroupe j
dePi.
Pour toutk ~ {1,...,K}, on
calcule :Étape
p :V j ~ {1,..., Jp}
onappelle 03BBj(p)1
lapremière
valeur propre issue de l’Acppondérée
dugroupe j
dePp
parl’application
mp-1. Cette valeur proprepeut
aussi être notée03BBfp(k)1
si la variable kappartient
augroupe j
dePp.
Pour toutk
~ {1,..., K},
on calcule :(...)
Étape
P : Lepoids m(k)
de la variable k dans l’AFMH est donnée par la formule suivante :À
un niveau departition p
donné et pour un groupe devariables j
donné( j 1, .... Jp),
le rôle de chacun des sous-groupes constituant legroupe j
au niveaude
partition p -1
estéquilibré :
aucun d’eux nepeut
êtreprépondérant
dans lapremière
direction d’inertie du nuage décrit par les variables du
groupe j.
Le rôle de chacundes groupes est ainsi
équilibré
par noeud et cequel
que soit le niveau departition.
À
la fonction depondération
m on associe M EM (K
xK) (M (K
xK’) désigne
l’ensemble des matrices de dimension K xK’),
la matricediagonale
despoids
des variables del’AFMH,
définie par :.
À
la fonction mp on associeMf
EM(Kpj x Kpj),
la matricediagonale
despoids
des variables dugroupe j
au niveau departition
p, définie par :Remarques.
1. Dans notre
programme, les
calculs se fontsystématiquement
àpartir
du tableaudes données centrées réduites. Le fait d’affecter le
poids
initial 1 à chacune des variables revient àaccorder,
danschaque
groupe dePl,
la mêmeimportance
àchaque variable, quelle
que soit sadispersion.
Si l’on désireprivilégier
au seind’un même groupe de
P1 les
variables lesplus dispersées,
on accorde àchacune,
comme
classiquement,
unpoids
initialégal
à savariance,
soit ma(k)
=s2k,
oùs2 désigne
la variance de la variable k.2. L’AFM est une AFMH où l’on ne considère
qu’un
seul niveau departition (P
=1).
3. Le calcul de la
pondération
des variables de base tient compte du casparticulier
où un même groupe de variables
appartient
à deuxpartitions
successivesPp
et
P p+ l :
dans ce cas, au niveau p+ 1,
la valeur de lapremière
valeur propre associée àl’analyse
factorielle du groupe estégale
à 1.4. Le calcul des
pondérations
des variables se révèle êtreplus simple
en raisonnantpar
partition
même si le raisonnement par noeudparaît plus
intuitif pour d’autresaspects
de l’AFMH.4.3.
Équivalence
avec une AFMLa
présentation
del’analyse globale
du tableau de données X associé àSp
par
l’AFMH,
comme une ACPpondérée,
ne doit pas faire oublier que l’AFMH est aussi une AFM des groupes de variables associés aux noeuds de l’indice de niveau P. Dans le cas desjus d’orange,
cette AFMpermet
derépondre
auproblème
de lacomparaison
des aspects caractérisationet jugements hédoniques;
elle est essentielle àl’interprétation
desrésultats,
car c’est à ce niveau que la structure sur les variables est laplus générale
et que l’on aborde leproblème
dans sonaspect
leplus global.
EnAFMH, l’interprétation
des résultats se fait defaçon «descendante» ,
enpartant
du niveau leplus synthétique.
5. L’AFMH vue comme une
analyse
factorielleLe coeur de l’AFMH repose sur une
analyse
factoriellepondérée
du tableau de données X. Cetteanalyse, qui
constituel’analyse globale
del’AFMH,
est une ACPpondérée lorsque
toutes les variables sontquantitatives. À
cetitre,
l’AFMH fournit les résultatsclassiques
del’Acp,
à savoir desreprésentations graphiques
du nuage des individusNI
et du nuage des variablesNK
ainsi que les aides àl’interprétation
associées.
Rappelons
que les notations usuelles del’ACP,
us(resp. vs), Fs (resp. Gs)
et
Às,
sont utilisées pour l’AFMH.5.1.
Nuage
des variablesNK
FIGURE 7
Représentation
desvariables, physico-chimiques
et sensorielles d’une part(A)
et
hédoniques
d’autre part(B),
dansl’analyse globale
de l’AFMH(par
souci delisibilité,
les variables de chacun de ces 2 groupesont été
représentées
sur desgraphiques différents)
Dans
l’exemple
desjus d’orange,
laqualité
dereprésentation
des variablesphysico-chimiques
et sensorielles estglobalement
bonne(cf. figure 7, A) :
on retrouveune
opposition (acide, amer)/sucré, classique
enanalyse
sensorielle. Cetteopposition
est corrélée avec le
pH,
cequi apporte
une validation par le sens, essentielle dans cetteanalyse qui
necomporte
que 6 individus.Par
ailleurs,
même si unelégère majorité
des étudiants est corréléepositivement
avec le
premier
facteur(cf. figure 7, B),
lesjugements hédoniques
individuels sont trèsdispersés :
iln’y
a pas de consensus entre les étudiants concernant leurspréférences;
certains
préfèrent
lesjus
sucrés et peu acides et d’autres lesproduits
acides et peu sucrés.Remarque. -
Sous l’action de latempérature
et dupH,
le saccharose en solutionse
décompose
englucose
et fructose : cephénomène d’hydrolyse
se retrouve sur lepremier plan
factoriel avecl’opposition (saccharose, pH)
et(glucose, fructose).
5.2.
Nuage
des individusNI
FIGURE 8
Représentation
des individus par l’AFMHLe
premier
facteurFi (cf figure 8)
oppose lePampryl ambiant,
le Joker ambiant et lePampryl
frais aux trois autresjus;
cesproduits
ont été perçus commeplutôt
acideset amers alors que les trois autres ont été perçus comme
plutôt
sucrés. La deuxièmebissectrice, quand
àelle,
oppose lesproduits
« frais » perçus commepulpeux
auxproduits
« ambiants » perçus comme peupulpeux.
D’un
point
de vueformel, l’interprétation conjointe
desgraphiques
des nuages des individus et des variabless’appuie
sur les relations de transition.6. Sorties
spécifiques
de l’AFMHConsidérer une suite de
partitions
emboîtées sur les variablesengendre
dessorties
supplémentaires (graphiques,
aides àl’interprétation),
que nousprésentons
dans la
partie qui
suit.6.1.
Représentation superposée
des nuages d’individuspartiels
Principe. -
Pardéfinition,
un individupartiel
associé augroupe j
dePp
est unindividu décrit par les seules variables de
Kpj.
Dansl’AFM, chaque
individupossède
autant de
représentations partielles qu’il
y a de groupes devariables ;
lareprésentation superposée
de ces individus et de leursreprésentations partielles
est telle quechaque
individu est au centre de
gravité
de sesreprésentations partielles.
En AFMH le
problème
de lareprésentation graphique
secomplique, puisque
l’on considère non
plus
une seule maisplusieurs partitions;
leurprise
encompte suggère
autant dereprésentations partielles qu’il
y a de groupes de variables distincts toutespartitions
confondues ou, defaçon équivalente, qu’il
y a de noeuds dans la suite departitions Sp représentée
sous forme d’arbrehiérarchique.
Dans
l’application présentée,
onpeut
considérer que lesjus d’orange
sont décritssuivant
quatre
groupes devariables;
eneffet,
ondispose
de noteshédoniques
d’unepart
et de variables caractérisant lesproduits
d’autre part, ce dernier groupepouvant
être subdivisé en deux sous-groupescomposés
de variablesphysico-chimiques
d’uncôté et de
descripteurs
sensoriels de l’autre(cf. figure 3).
On souhaite comparer lesjus
suivant les aspects caractérisation etjugements hédoniques,
et, au sein de lacaractérisation,
suivant les aspects sensoriels etphysico-chimiques.
D’où la nécessitéd’un
graphique
danslequel chaque
individu estreprésenté
par autant depoints qu’il
y a de noeuds dans la hiérarchie.
Le
principe
de lareprésentation superposée
des P nuages d’individuspartiels généralise
celui de l’AFM : pourreprésenter
l’ensemble des individuspartiels,
on lesplonge
dans un même espaceR K (espace
des individus décrits par l’ensemble desvariables).
Pour cefaire, l’espace RK
estdécomposé
successivement en sous-espacesorthogonaux
deplus
enplus petits,
suivant ladécomposition
induite par la suiteSp,
parcourue de
façon
descendante(i. e.
dePp
àP1):
Étape
1 : Partant du niveau departition
P leplus général,
ondécompose R K
en
Jp
sous-espacesorthogonaux
deux à deux etisomorphes
aux espacesRK3 p
Étape
2 : De même quele j e
groupe de variables au niveau departition
P sedécompose
en sous-groupes dePp-1, RKPJ peut
sedécomposer
enoù
Dpj désigne
à la fois l’ensemble des indices des sous-groupes dePp-1
issus de ladécomposition
dugroupe j
dePp
et soncardinal,
la formule ci-dessuscorrespondant
au cas où p = P.
On en déduit une
décomposition
deR K
en somme directe deJp-1
sous-espacesorthogonaux
deux à deux etisomorphes
aux espacesRKP-1J
:(...)
Etape
P : Suivant le mêmeprincipe, RK2j
sedécompose
end’où une dernière
décomposition
deR K
en somme directe deJI
sous-espacesorthogonaux
deux à deux etisomorphes
aux espacesRK1J:
Dans R K les
coordonnées du nuage des individuspartiels
associésau j e
groupe deP p
sont contenues dans la matrice de M(I, K)
danslaquelle X p
estcomplétée
par des 0
(rappelons qu’en AFMH,
de mêmequ’en ACP,
les variables sonttoujours centrées).
Cettereprésentation
simultanée est artificielle et inutilisabledirectement,
mais sert de base à unereprésentation
simultanée obtenue parprojection
sur les axesprincipaux
us issus del’analyse globale
deNI
par l’AFMH.Graphique.
Pourreprésenter
simultanément les nuages des individus et des individuspartiels
deux solutions sontenvisageables (cf. figure 9).
FIGURE 9
Représentation
des individuspartiels
associés aux groupesphysico-chimique (~),
sensoriel
(S),
caractérisation(C), et jugements hédoniques (H) : (A)
l’individu i est à lafois
àl’isobarycentre
def H, CI
et def H, ~, SI;
(B)
i est àl’isobarycentre
def H, CI
et C est àl’isobarycentre
deIS, ~}
Une
première
solution consiste àreprésenter
les individuspartiels
de tellesorte que,
quel
que soit le niveau departition considéré, chaque
individu soit au centre degravité
de sesreprésentations partielles;
on bénéficie alors de lapropriété barycentrique
del’AFM,
àchaque
niveau departition :
où
ipj
est lareprésentation partielle
de l’individu i associéeau je
groupe de variables dePp (rappelons qu’en AFM,
ondésigne
parij
lareprésentation partielle
de l’individu i associée augroupe j).
Une telle
représentation graphique (cf. figure 9, A)
ne rend pas compte del’équilibre
entre les rôlesjoués
par les variables sensorielles etphysico-chimiques
dans la caractérisation des
jus :
lareprésentation partielle
associée àl’aspect
caractérisation n’est pas à
l’isobarycentre
desreprésentations
associées auxaspects
sensoriel etphysico-chimique.
La seconde
possibilité
consiste àreprésenter
les individuspartiels
de telle sorteque :
1.
chaque
individu est au centre degravité
de sesreprésentations partielles
auniveau de
partition P;
2.
chaque
individupartiel
associé à ungroupe j
dePp (1 p P)
est au centrede
gravité
de « ses »représentations partielles,
induites par ladécomposition
dej
en sous-groupes dePp-1.
Autrement
dit,
Vi =1,..., I,
1. i est
l’isobarycentre
de{ipj, j = 1,...,} JP};
2.
Vp
=2,..., P, Vj = 1,..., Jp, ipj
estl’isobarycentre
de{ip-1j’, j’
EDpj}.
Nous choisissons cette seconde solution pour
laquelle
un individupartiel
estau centre de
gravité
des «ses»représentations partielles.
Une tellereprésentation graphique (cf. figure 9, B)
rend biencompte
del’équilibre
entre les rôlesjoués
par lessous-groupes j’
dePp-1, j’
EVf,
dans la constitution dugroupe j
dePp.
Dansl’exemple,
l’individu i est àl’ isobarycentre
de sesreprésentations partielles
associéesà la caractérisation et aux
jugements hédoniques;
C est àl’isobarycentre
de S et~, représentations partielles
associées aux groupes sensoriel etphysico-chimique :
cecitraduit la notion
d’équilibre
inhérente à l’AFMH.Remarques.
1. Dans certains cas, une telle
représentation peut
se révélerchargée;
onpeut
alorschoisir de ne
représenter
que certainsindividus,
certainsniveaux,
ou encore l’ensemble des niveaux appartenant à une branche de l’arbrehiérarchique.
2. La
propriété barycentrique
de l’AFM dont hérite l’AFMH au niveau de lapartition P,
est due à ladilatation,
selon le coefficientJp,
des nuages des individuspartiels
associés aux groupes dePp.
De la mêmefaçon,
pourobtenir la
représentation ci-dessus, chaque
nuage d’individuspartiels
associésau groupe
Kr
est dilaté selon un coefficientdépendant
à la fois deJp
et deDp, j - 1,..., Jp (le
calcul de ce coefficient estexplicité
enannexe).
Par lasuite,
ondésigne
parNJpI
={ipj, i e I, j
=1,..., Jp}
le nuage des individuspartiels dilaté,
au niveau departition
p,qui
bénéficie despropriétés exposées
ci-dessus.
Exemple d’interprétation. -
Au niveau departition
leplus synthétique (cf. figure 10, A),
lesreprésentations partielles
des individus dupoint
de vue de lacaractérisation d’une
part
et desjugements hédoniques
d’autrepart
sontglobalement proches :
l’axe 1 et à un moindredegré
l’axe 2expriment
des structures communes aux deux groupes, cequi
seraquantifié
par la suite.FIGURE 10
(A) Représentation
des individuspartiels
associés aux groupes caractérisation(C) et jugements hédoniques (H),
au niveau departition
leplus synthétique.
(B) Représentation
des individuspartiels
à tous les niveaux departition
TABLEAU 3
Extraits du tableau de données centré-réduit :
quelques
variablesparmi
lesplus
corrélées avec le 1erfacteur
Au niveau de
partition
leplus
fin(cf. figure 10, B),
la situation est à peuprès
lamême pour les
aspects
sensoriel etphysico-chimique, quoique
defaçon
un peuplus
atténuée.
À
titred’exemple,
onillustre,
àpartir
des données centrées-réduites(cf.
ta-bleau
3),
lespositions respectives
des individus Fruivita frais etTropicana
frais. LeFruivita frais est
également
caractérisé par sonaspect
sensoriel et sonaspect physico- chimique (les
valeurs centrées-réduites sont du même ordre degrandeur
en valeurabsolue);
leTropicana
frais estplus
caractérisé par sonaspect
sensoriel que par sonaspect physico-chimique (en
valeurabsolue,
les valeurs centrées-réduites des variables sensorielles sontplus grandes
que celles des variablesphysico-chimiques).
6.2. Aides à
l’interprétation
à lareprésentation superposée
La
représentation superposée
est souventcomplexe
et nécessite des indicateurssynthétiques :
nous enprésentons quelques-uns,
fondés sur l’inertie.Pondération. - Pour calculer ces
indicateurs,
on utilise une fonction depondé-
ration
qui
traduit la notiond’équilibre
entre les sous-groupes de variables « issus » d’un même n0153ud.Cette
pondération
est telle que,quel
que soit i~ I,
les individuspartiels
« issus »d’un même noeud
(i. e.
associés aux sous-groupes de variables d’un mêmenoeud)
ontun
poids identique;
la somme de leurpoids
estégale
aupoids
de l’individu décrit par le groupe de variables associé au noeud dont ils sont issus.Formellement,
sip(ipj)
est lepoids
de l’individupartiel
i associé au groupe de variablesKp,
alors :Rappelons
queDp+1j’ désigne
à la fois l’ensemble des indices des sous-groupes dePp
issus de la
décomposition
dugroupe j’ de Pp+1
et son cardinal. Deplus,
En
effet,
parconstruction,
ViG 7, Vp
=1,..., P,
cette somme se réduisant
pour PP+1
à un termeunique qui
est lepoids
pi de l’individu i : lapartition PP+1 correspond
au cas où les variablesappartiennent
toutes à unmême groupe. Dans le cas
particulier
du nuage depoints partiels NJPI, iP+11 désigne
l’individu i et son coefficient de
pondération p(iP+11)
est alorségal
à pi.De cette
pondération,
découlent les deuxpropriétés
suivantes :1.
Quel
que soit le niveau departition
p, l’individu i est au centre degravité
deses
représentations partielles
associées aux groupes dePp,
ainsipondérées (ce
choix est en
phase
avec lapremière représentation superposée proposée
dansle
paragraphe précédent).
2.
Quel
que soit le niveau departition
p, les nuages des individuspartiels,
NJpI
={ipj, i ~ I, j
EJp},
sont centrés(ce qui
découle directement de lapropriété précédente).
Dans
l’exemple
desjus d’orange, chaque
individu est affecté d’unpoids
de
1/I = 1/6.
Lepoids
des individuspartiels
associés auxaspects jugements hédoniques
et caractérisation vautrespectivement 1/12 - 1/2
x1/6 (poids identiques; Vi,
Phéd +Pcar = Pi =1/6);
lepoids
des individuspartiels
associés auxaspects sensoriels et
physico-chimiques
vautrespectivement
1/24(poids identiques;
Vi, psen + pphy =
pcaT =1/12).
Décomposition
de l’inertie. -À
tous les niveaux departition
p, l’AFMH calcule l’inertie du nuage despoints partiels NJpI,
notéeItot(p).
Un tel nuage depoints
peutse
décomposer
en I xJp+1
sous-groupes, de lafaçon
suivante :- dans un
premier
temps, on regroupe tous lespoints
associés à un mêmeindividu
i ;
- dans un second
temps,
ondécompose
chacun des I groupes enJp+1
sous-ensembles de la forme