M ATHÉMATIQUES ET SCIENCES HUMAINES
C. D ENIAU
G. O PPENHEIM
Deux méthodes linéaires en statistique multidimensionnelle (2). Analyse des tableaux de correspondances
Mathématiques et sciences humaines, tome 45 (1974), p. 5-28
<http://www.numdam.org/item?id=MSH_1974__45__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1974, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
DEUX MÉTHODES LINÉAIRES
EN STATISTIQUE MULTIDIMENSIONNELLE (2)
ANALYSE DES TABLEAUX DE CORRESPONDANCES par
C. DENIAU et G. OPPENHEIM
RÉSUMÉ
Ce texte constitue la suite de l’article "Deux méthodes linéaires en
statistique
multidimensionnelle " paru dans le n° 44 de cette revue. Nous nous intéressons ici aux tableauxd’effectifs.
La théorie duparagraphe
1.2 estappli- quée
pour obtenir les résultats : détermination descomposantes
et axesprincipaux,
construction desgraphiques, indices, analyses conjointes
des deux nuages associés au tableau des données.On insiste sur
quelques difficultés
courantes del’interprétation
des résultats.Plusieurs
problèmes
dont certainsméthodologiques
sonteffleurés : codages,
rotations des axes,symétrie
de deuxensembles,
etc.SUMMARY
This article is a
follow-up
to the articleentitled,
« Two linear methods in multi-dimensional statistics », whichappeared
in No. 44of
thisjournal.
Here we are interested incontingency
tables. Thetheory of paragraph
1.2is
applied
in order to obtain thefollowing
results : determinationof components
andprincipal
axes, constructionof graphs, indices, joint analysis of
two clusters associated with tablesof
data.One insists on some current
difficulties
ininterpreting
results.There are many
problems
where certainmethodologies
aremerely
touched upon :coding,
rotation of axes,symmetry of
two sets, etc.1. INTRODUCTION ET EXEMPLE 1.1. INTRODUCTION
Ce texte constitue la suite de l’article « Deux méthodes
d’analyse
factorielle 1 » paru dans cette revue(nO 44).
Les notions utiles et leproblème
à résoudre sont ceux des§
0 et 2 duprécédent
article. Dans cequi
suit nous
particularisons
les définitions au cas des tableaux decorrespondances.
Tous les résultats du§
2sont
applicables ici ;
dans laplupart
des cas, il sera suffisant despécifier quelques
définitions et de laisserau lecteur le soin de déduire les différentes
propriétés
dont aucune démonstration neprésente
de difficultésimportantes.
Nous suivrons leplus
souvent cechemin,
nous attachant à mettre en évidence les écueils.1. Les références à des paragraphes de cet article sont précédées de 1.
D’après
J.-M.Faverge [15]
lesprincipes
de cette méthoded’analyse
de tableaux d’effectifs datent de 1950, Guttman[161.
D’autrepart
en 1952 C.Hayashi [17]
et[18]
adéveloppé
l’étude des tableaux decorrespondances
et introduit certainesreprésentations graphiques.
,Un
développement systématique
a été réalisé en France par J.-P. Benzécri[11] permettant d’épurer
les méthodes anciennes des
hypothèses
inoffensives ou inutiles en faisant mieuxapparaître
le cadrelinéaire,
et non
probabiliste
de la méthode. Deplus
la réalisation et la diffusion de programmes d’ordinateur a rendupossible
l’utilisation de la méthode dans ungrand
nombre dedisciplines.
1.2. EXEMPLE D’ANALYSE DES CORRESPONDANCES
La courte illustration
qui
va suivre est tirée de l’Etude de lacomposition
parâges
de 141 villestouristiques
dulittoral
français [13], auquel
on serapportera
pour le détail des tableaux dedonnées,
desrésultats,
des inter-prétations,
des discussionsméthodologiques
et du choix desvilles ;
ces élémentstrop
nombreux ettrop
volumineux nepeuvent
trouverplace
dans cetexemple.
a)
Les données : Chacune de ces 141 villestouristiques
littorales(V.T.L.)
est décrite par sacomposition
par
âge.
Pourchaque
sexe le recensement de 1968 nous donne des classes dontl’amplitude
est 5 ans(0
à 5 ans, 5 ans à 10 ans,etc.),
et une classe pour lesplus
de 75 ans. Par abus delangage
onparlera
de 32 classesd’âges (16
classesd’âges
parsexe).
i)
Ainsi à chacune des 141 V.T.L. est associée une suite de 32 nombres entierspositifs
ou nuls.Chaque
nombre est l’effectif de la
population
masculine ou féminine d’une classed’âge
de cette ville. Leprofil (ou description)
d’une ville est la distribution desfréquences
des 32 classesd’âges
de cette ville.ii)
A chacune des 32 classesd’âges
est associée une suite de 141 nombres entierspositifs
ounuls ;
pour une classe
chaque
nombre est l’effectif de cette classed’âge
dans une des 141 villes. Leprofil (ou
des-cription)
d’une classed’âge
est la distribution desfréquences
des 141 villes pour cette classe.b) L’analyse :
Les tableaux etgraphiques
sont les suivants :Tableau 1 : Code des V.T.L. et des classes
d’âges.
Tableau 2: Effectifs par âge et sexe de la
population
des 141 V.T.L.Tableau 3 : Valeurs propres et
qualité
del’ajustement.
Tableau 4: Résultats concernant les classes
d’âges
pour les 4premiers
axes.Figure
1 : Les classesd’âges
et les V.T.L. dans leplan (1, 2).
Figure
2 :Cartographie
desprojections
des V.T.L. sur l’axe 2.Figure
3 : Les classesd’âges
dans leplan (3,
4).Tableau 1. - Code de
quelques
villes touristiques littorales.Tableau 2. -
Effectifs
par âge et sexe de l’ensemble de lapopulation
des 141 villes touristiques littoralesTableau 3
CODE DES CLASSES D’AGES
Une lettre M
(masculin)
ou F(féminin) précédant
unmultiple
de 5. Ainsi*:M 25 représente la classe des hommes tels que 25 âge 30 F 50 représente la classe des femmes tels que 50 âge 55 Pour M 75 et F 75 il
s’agit
d’individus de 75 ans etplus.
Tableau 4. - Résultats concernant les classes
d’âge
pour les quatre premiers axesa : coordonnées des
projections
de la classed’âge
sur l’un des axes(factor-scores).
b : pourcentage de la
dispersion
totale de l’axeprise
en compte par la classed’âge.
c :
qualité
de lareprésentation
de la classed’âge
par l’axe.c) Quelques
résultats del’analyse empruntés
à[13] (pour
unexposé complet s’y reporter).
L’analyse
a été effectuée dansl’espace
R3z(de
dimension bienplus petite
que celle deR~~.
On verra(1.3)
comment àpartir
des résultats del’analyse
du nuage desV.T.L., cAP (I)
cR32, il
estpossible
d’endéduire ceux du nuage des classes
d’âges, cAP (J)
c R 141.Le tableau 3 fournit les 10
premières
valeurs propres et lespourcentages
associés dedispersion prise
en
compte,
le tableau 4 les résultatscomplets
relatifs auplus petit
ensemble(classes d’âges)
sur les 4premiers
axes factoriels :
projections, qualité
dereprésentation,
etpart
de chacune des classesd’âge
dans ladispersion
de chacune des
composantes principales
définies en 5.2.4.Nous ne
présentons
aucun des résultatsanalogues
concernant les V.T.L. car le nombre de tableaux etgraphiques
estdéjà important.
1. REPRÉSENTATION DANS LE PLAN DES DEUX PREMIERS AXES FACTORIELS.
Figure
1"
i)
Les classesd’âges
sontfigurées
par destriangles ;
celles pourlesquelles la qualité
de lareprésentation,
par le
plan
des deuxpremiers
axesfactoriels,
estsupérieure
à 0,60 sontfigurées
par destriangles pleins.
Les colonnes la et 2a du tableau 4
permettent
de nommer les différentstriangles.
ii)
Les V.T.L. sontfigurées
par despoints ;
celles dont laqualité
de lareprésentation,
par leplan
des deuxpremiers
axesfactoriels,
estsupérieure
à 0,60 sont munies de leur code.1. Le coût des calculs croît avec le cardinal de l’ensemble de plus petit cardinal.
Figure
2. -Cartographie
des villes touristiques littorales sur le 2e axef acforiel. (Les
coordonnées positives sont représentées par des cerclesvides,
les né; atives par des cerclespleins.
Les diamètres des cercles sontproportionnels
aux valeurs absolues de cescoordonnées)
A l’are 1 est associée
près
de 60%
de ladispersion
totale. Un effet massifd’opposition jeunes-vieux
se manifeste sur cet axe ; les classes
d’âge
serépartissent (des plus jeunes
auplus vieilles) pratiquement
dans l’ordre croissant de
gauche
à droite.En ce
qui
concerne les V.T.L. on retrouve uneopposition
nette entre d’unepart
lesrégions
touris-tiques
danslesquelles
lapart
relative desjeunes
estimportante,
le Nord de la France(ex. :
leTouquet, Wimereux, Saint-Valéry-en-Caux)
ou sur les littorauxplus
récemment ouverts au tourisme(Bretagne
duNord),
et d’autrepart
lesrégions
danslesquelles
laproportion
des personnesâgées
estgrande :
Côted’Azur,
Côte Vermeille
(ex. : Menton, Collioure, etc.).
Les résultats obtenus sur l’axe 1 étaient attendus.
L’axe 2 est
plus
intéressant car il oppose un littoral du Nord et laBretagne, qui
ont un excédent d’ado-lescents,
au littoral méditerranéenqui présente
un excédent dejeunes
adultes(25-30 ans).
La zoneAquitaine- Languedoc
constitue une belle transition.La carte de la
figure
2 fournit une illustration de ce résultat. Elle a été constituée à l’aide desprojec-
tions des
descriptions
des villes sur le 2e axe factoriel(factor scores)
del’analyse.
Les coordonnéespositives (resp. négatives)
sontreprésentées
par des cercles vides(resp. pleins)
dont les diamètres sontproportionnels
aux valeurs absolues de ces coordonnées.
Les classes
d’âges
dont laqualité
de lareprésentation
estsupérieure
à 0,40, par leplan engendré
par les 3e et 4e axes
factoriels,
sontfigurées
par destriangles pleins.
Figure
32. REPRÉSENTATION DANS LE PLAN DES 3e ET 4e AXES FACTORIELS
Les 3e et 4e valeurs propres sont très
voisines,
lapart
de ladispersion prise
encompte
par lecouple
d’axesassociés est
supérieure
à 11%
donc nonnégligeable.
Laquasi-égalité
de ces valeurs propres est confirmée par d’autresanalyses portant
sur des données très voisines :analyse
des seules V.T.L. deplus
de 10 000habitants,
études mettant en
jeu
lesménages extraordinaires,
etc. Pour cette raison leplan (3,4)
est considéré commeun
plan
propre, et pour faciliterl’interprétation
des résultats une rotationorthogonale
dusystème
d’axesa été effectuée afin d’obtenir des
cartographies
intéressantes sur ces nouveaux axes. Ces résultats se trouvent dans[13]
et nous conseillons au lecteur des’y reporter.
D’autrepart,
lafigure
3 fournit laprojection
des classesd’âge
dans lerepère
initial et il est assez facile d’en déduire le nouveaurepère
choisi. Le critère de rotation estsimple :
l’axe 3’ traverse le groupe des classesd’âge
des hommes de 40 à 60 ans et des femmes de 35 à 55 ans, l’axe 4’ traverse les groupes 20-25 ans.(On
pourra utiliser le tableau 4 pour détecter les classesd’âges
dont la
participation
à ladispersion
du nuageprojeté
sur leplan (3, 4)
estimportante).
2.
EXPOSÉ
DE LAMÉTHODE
2.1. DÉFINITIONS 2.1.1.
Correspondance
i)
SoitI,
J deux ensembles 1 et K un ensemble fini 2 de cardinal N. Soit P : Il -+ 7 X J leprotocole d’expérience
oud’enquête
initial et v : I X J - N la distribution d’effectifassociée,
i.e.l’appli-
cation définie par :
l’entier nj nombre d’occurrences du
couple (i, j)
estappelé
effectif de(i, j).
Exemple (2.1.1.)
K est l’ensemble des habitants des 141 villes littorales
françaises,
J : un ensemble de 32 classes
d’âges (en
fait J =C, 6
X~2 ! ~
== classesd’âge, S
=Sexe),
I : l’ensemble des 141 villes
touristiques
littoralesfrançaises
étudiées.P associe à tout individu le
couple
constitué par sa classed’âge
et sa villed’origine.
n,j est l’effectif de la
classe j
de la ville i.ii)
On note : n jn ij et nj = 1 n ij
les effectifsrespectifs
de l’élément i E I et de l’élémentj
1j E I ;
enfin :est l’effectif total
iii) L’application v
estappelée correspondance
sur I x J(on
dit aussicorrespondance
de J vers 1ou de I vers
J).
Elle constitue la donnée de base de la méthode étudiée. Nous allons en déduire d’autres distributions.2.1.2. Distribution des
f réquences - fréquences
conditionnellesi)
Onappelle :
fréquence
d’occurrence ducouple (i, i)
E 7 XJ,
le nombrenij
q N
ni
fréquence
d’occurrence de l’élément i EI,
le nombrem, ni
‘N nj
fréquence
d’occurrence del’élément i
EJ,
le nombreN
1. On ne tient pas compte de la structure éventuelle de I ou J
(structure
ordinale parexemple).
lân tenir compte soulève des pro- blèmes non tous résolus.2. La
conditions 11 1 ] finis
n’est pas nécessaire ; si elle n’est pas réalisée on restreint V à un sous-ensemble fini de I X J.Un exemple de restriction de v est donné en 2.12 avec la condition ~ 0.
On suppose que :
Vi
c-I, vi
c-J,
0.S’il n’en est pas ainsi on restreint les ensembles I ou J en
supprimant
les éléments iou i
dont leseffectifs sont nuls.
ii)
Onappelle fréquence
conditionnelle del’élément j parmi
les ni occurrences de i le nombreniJ.
ni On
appelle fréquence
conditionnelle de l’élément iparmi
les nj occurrencesde i
le noml)renI).
nj
iii)
Onappelle profil
de l’élément i E I(resp. i
c-J)
la distribution conditionnelleRemarque (2.1.2)
La donnée d’une
correspondance
estéquivalente
à la donnée desfréquences
conditionnellesni),
n, pour tout
(i, j)
E I X J et des effectifs nt pour tout i E I.(On peut
bien entenduéchanger
les rôles de I etJ.)
2.1.3.
Nuages. Profils
etpondérations. Descriptions
etdescripteurs
Nous
replaçant
dans le cadre vectoriel duchapitre
1.2 construisons les tableaux suivants : Tableau 5Tableau 6
On associe à la
correspondance,
deux nuages :(1)
tableau associé à lacorrespondance (2)
tableau associé au nuage(3)
tableau associé au nuage2.1.4.
Propriétés
vectorielles du nuage. Variété linéairesupport
du nuageConsidérons dans Rp la variété linéaire de dimension
.. I
Soit alors xi un vecteur du nuage
N (I)
cRP,
on vérifie immédiatement que xi e 7c(les
coordonnées de xipossèdent
unepropriété supplémentaire :
elles sont toutes nonnégatives).
Dé f inition (2.1.4)
On
appelle support
a du nuagec~ (I )
la variété linéaire deplus petite
dimension contenant les vecteursde
cr (7).
On remarque que a c 7r et dim a
in f (n
- 1, p -1 ) ;
en outre les vecteurs du nuage se trouvent dans laportion
Or =={x
e J : a~ >0}
domainepolygonal
convexe de Rp dont les sommets sont les vecteurs de basebj
de Rp.Remarque (2.1.4)
Une définition et des résultats
analogues peuvent
être donnés pouroY (J)
dans Rn.Figure
5Dans ce cas
particulier :
p - 3, n = 2. Alors 6T est le domainetriangulaire
dont les sommets sontbi, b2, b3.
La dimension de 7r est 2, celle de a est 1.Propriétés barycentriques
Quel
que soit x i vecteur du nuagepropriété
en disant que :on
peut exprimer
autrement cettex i est
barycentre
du nuage dont les vecteurs sont ceux de la baseCJ3
de R".Pour i =~ i’ les vecteurs
de v;
etv,’
sont évidemment lesmêmes ;
lespondérations, elles,
sont engénéral
différentes. Cette
propriété barycentrique jouera
un rôleprépondérant
dansl’interprétation
desrésultats
(2.4.2.).
Point moyen du nuage
cAP (1) (voir
aussi(1. 1 1))
On note g
(1 ) )
ouplus simplement
g, lepoint
moyen du nuagec,,V (1),
il est défini par :on
peut
aussil’exprimer
dans la base~,
Enfin :
2.1.5. Distance euclidienne sur RP
(resp.
surRn)
Alors
qu’en composantes principales (voir L2.3.~. )
la distance euclidienne introduite est définie sans réfé- rence 1 auxdonnées,
encorrespondance,
la distancedépend
desfréquences
d’occurrence des divers éléments.Produit scalaire
W : définition
1. Il n’en est
plus
ainsi lorsque l’on travaille sur des données centrées et réduites, où la distance est alors une fonction des éléments du tableau de données.la matrice associée à
W,
relativement à la base~
deRP,
que nous continuerons ànoter *
est :Propriétés :
outre lespropriétés
usuelles des distances euclidiennes on a :a)
La baseÇJJ
de Rp est41 -orthogonale
maisnon gi -orthonormale,
carI Ib fl I2 = 1
engénéral
dif-mi
férent de 1. La norme de
b f
est d’autantplus grande
quel’élément j
E J est moinsfréquent (mj petit).
Cetteparticularité
estimportante
car la structuremétrique
de RP en découle : les coordonnées desprofils
associésaux mf les
plus petits jouent
un rôleprépondérant
dans le calcul de la norme d’unprofil
ou dans le calculde la distance entre deux
profils.
(Il peut
arriver que certains éléments soient 100 ou 1 000 fois moinsfréquents
que d’autres. De telleshétérogénéités poseront
desproblèmes
au moment de la détermination et del’interprétation
des axes facto-riels.)
b)
Le vecteur moyen g, est de*-norme égale
à 1 ; c’est aussi laprojection orthogonale
du vecteur nul 0sur le
support
deeN (7), (fig. 5).
En effet :quel
que soit i e 1 :d’où W (xi, gj)
= Donc l’axe[gjl
estw-orthogonal
ausupport
du nuagecY (I) ;
enconséquence
g, est bien laprojection *-orthogonale
de 0 sur lesupport
du nuagecY (1).
c) Remarques
sur distances etprofils
1. La
métrique
définie estparfois appelée métrique
du X 2. Cetteterminologie rappelle
saparenté (ou l’analogie)
avec lastatistique
du même nom les notations étant tradition- nelles. Cettequantité
estproportionnelle
au carré de la distance(associée
auproduit
scalaire sur Rp définientre une distribution de
fréquence
et la distribution deprobabilité
del’hypothèse
nulle(py, 1 j p) ).
2. Comme on l’a vu la définition des vecteurs du nuage
(2.1.3)
amène à confondre(vecteurs
à distancenulle)
lesdescriptions
d’éléments i et i" pourlesquels
les distributions d’effectifs sontproportionnelles
et nonpas seulement
égales.
Deux tellesdescriptions
sont dans une même classed’équivalence
pour une relationd’équivalence
ditedistributionnelle; chaque
élément est en effet décrit par la distribution de ses occurrences.Le terme
d’équivalence
distributionnelle renvoie à une définition dulinguiste
Z.S.Harris ;
pour cepoint
d’histoire on
peut
sereporter
à Benzécri(llb,
p.189).
Soit
(I)
c RP - 1 le nuage associé à cette nouvellecorrespondance.
Soit 1>’ etQ’
lesmétriques
définiessur R" et RP - 1 comme en 2.1.5. On montre facilement que :
- les distances entre vecteurs
homologues
de-
quel
que soit P sous-espace vectorielDisp c
x",
etx’,
étant les vecteurs de(1)
associés aux éléments k et l.Pour
plus
de détails sur cettequestion,
onpeut
sereporter
à[121.
Ces
propriétés
sontl’analogue
despropriétés
que l’onpeut
établir sans difficulté dans le cadregénéral du §
1.2 pour des nuages initiaux :de la
métrique
étant 1de
R",
lamétrique
étant 1L’importance
de lapropriété
de laRemarque
3 n’est pascomplètement explorée.
Cettepropriété
n’est
jamais
directementutilisée ;
mais c’est sans doute ens’appuyant
sur elle que l’onpeut
penser que certains résultats del’analyse
d’un tableau degrandes
dimensions sont peu modifiés(et
doncstables) lorsqu’on
regroupe des éléments.
2.2. MEILLEURS AJUSTEMENTS PAR UN SOUS-ESPACE DE DIMENSION r
On a vu
(1.2.4)
que la résolution de ceproblème
nécessite la détermination des vecteurs et valeurs propres d’une matrice facilement déterminée àpartir
de la formequadratique
dedispersion.
Dans ce
qui suit,
étudiant dans RP le nuagec4i (1)
nous établissons la matrice Mpuis
la matrice àdiagonaliser.
Des remarques facilitant la recherche des axesprincipaux ’if-orthogonaux
achèvent ceparagraphe.
2.2.1. Notations matricielles Soit F la matrice
C la matrice
Q
la matriceAu nuage
c» (J)
c R" est associée la matrice n X p, B =FW
dontla je
colonne est la suite des coordonnéesde yJ.
Au nuage
cÀf (I)
c RP est associée la matrice p X n, A = dont la ie colonne est la suite des coordonnéesde xi.
La matrice colonne p X 1 associée à g¡ sera notée
G ;
La matrice colonne p X 1 associée à gj sera notée K.
D’après (1.2.4), 2 s’exprime
de lafaçon
suivante :2.2.2. Recherche de la solution,
Il reste à
déterminer,
conformément aux résultatsdu (§ 1.2.)
r vecteurs propres Ut,BIf-orthonormés
associésaux r
plus grandes
valeurs propres de la matrice :Nous commençons par montrer que la
diagonalisation
de cette matricenon-symétrique peut-être
obtenue à l’aide de celle d’une matrice
symétrique
pourlaquelle
existent desalgorithmes
et des programmes très efficaces. Lespropriétés qui
suivent sont introduites dans ce but.(P1 ) - Comparaisons
des vecteurs propres et dea)
G est vecteur propre de associé à la valeur propre 0 et de associé à la valeur propre 1,b)
Tout autre vecteur propre(resp.
valeurpropre)
de est vecteur propre(resp.
valeurpropre)
de= AB.
Pleuve
a)
Ladémonstration, immédiate,
est laissée au lecteur.b)
Soit U un vecteur colonne*-orthogonal
à G :tGWD
= 0.donc : ce
qui
achève la démonstration.Remarquons
que les droites vectorielles[u]
de RPengendrées
par les vecteurs colonnes U sontparal-
lèles à la variété linéaire Tu de dimension
p -1;
deplus
si 1 ~ 0,[u]
estparallèle
ausupport
du nuage.(P 2) -
U est vecteur proprede BjI - 1 L
associé à la valeurpropre X
si et seulement si U’ _Pl 12 U
est un vecteurpropre de la matrice
symétrique
associé à la même valeur propre, en notantet en
multipliant
les deux membres parConséquences :
ex. Les valeurs propres sont réelles nonnégatives : 0 , Xi,
P.
On détermine r valeurspi-opres 1
de la matricesymétrique gi - 112 Lxk - 1 12@
les vecteurscherchés
(U~)
se déduisent des vecteurs(U’,)
par la relationU,
=W-112 U’,.
Ilssont *-orthonormés
car :
tu "WU k
=’UBUB
==8",,’.
2.2.3.
Propriétés
des valeurs propresLa matrice
0/ -IL = (FW)
= eststochastique [19]
i.e. telle que pourtout i
e]p] :
= 1. Comme toute matrice
stochastique,
ses valeurs propres sont inférieures à un en niodule. Donci
,d’après
2.2.2.d :2.2.4. Axes
principaux
etcomposantes principales (voir
définition(3.3.1)).
Les axes sont les axes
principaux
du nuage(ou
axesfactoriels).
La
dispersion
du nuageprojeté
sur[uk]
est~~,
ke valeur proprede * -’l
ougi - ’L ;
on n’indexe ni[G]
ni la valeur proprequi
lui est associée 2.Posons xlk
= ~ uk),
alors ck =(xi k , ..., Xnk)
est la kecomposante principale
du nuageCV (I )
c RP.ck est la suite des n coordonnées des
projections
des vecteurs du nuagecAP (I )
sur uk.2.3. ETUDE CONJOINTE DES DEUX NUAGES
cAP (I)
ETcÀi (J)
Une étude semblable à celle faite pour
cAP (I )
c Rppourrait
être faite pourc~ (J)
c R . Il est alors facile d’établir la matrice associée à la formequadratique
dedispersion
du nuagecAP (J)
ainsi que de déterminer les axesprincipaux.
Inscrivons sous forme de tableau les résultats relatifs aux deux nuages.
Tableau 7
1. On continue à supposer les valeurs propres distinctes (voir note I du
§
1. 2.4).2. Remarquons qu’à
[G]
correspond la plus grande valeur propre,égale
à 1, de et la plus petiteégale à
0 de1~l
-1 t.2.3.1. Relations liant les axes
principaux
decV (I)
etcV (J)
Soit a
et g
lesapplications
dont les matrices sont A et B dans lecouple
de basedl, 0.
Les deux familles de valeurs propres non nulles desapplications oeofi
etgooc
sontégales [21a]
et les sous-espaces propres deoeop
etgooc
associés à une même valeur propre non nulle sontimage
l’un de l’autrerespectivement par g
et oc.Ainsi si
Ã." =1=
0(X,, [uk])
étant associé àc~ (1)
et(Ã", [vl)
associé àc~ (J) plus précisément,
siRemarque (2.3.)
Il est intéressant d’étudier en détail les
applications
oc etP.
a)
Lesimages par g
des vecteurs de la base0
sont lesprofils
Les
images
par a des vecteurs de la base~
sont lesprofils
x,.b)
Dans lecouple
de baseQl, lJÎ
les matrices associées à ocet g
sontdiagonales :
c)
Notons que(uk /k
E]p])
et(vk /h
E]n])
sont des vecteurs propres à droite et àgauche (orthogonaux
respec- tivement pour lesmétriques (D
etQ)
de la matricerectangulaire
B. Pourplus
de détails concernant la recherche des vecteurs propres de matricesrectangulaires
sereporter
à[21b].
Pour une étudeplus systématique
desapplications
aet p
etl’intégration
des méthodes factorielles dans un cadreplus général
voir[14].
2.4. REPRÉSENTATIONS GRAPHIQUES ET REMARQUES POUR LEUR UTILISATION 2.4.1.
Principes
àpartir desquels
sonteffectuées
lesreprésentations graphiques a)
Lesreprésentations
sont :. axiales ou
planes,
.. obtenues par
projection 0-orthogonale
dans Rn(ou ’il-orthogonale
dansRP)
... constituées par les
projections
des éléments des nuages etparfois
des vecteurs de base..... Dans R"
(par exemple)
lamétrique représentée
est 0 : le de deux vecteurs de Rn estrepré-
senté par un cosinus associé au
produit
scalaire usuel(identité)
de R". Leslongueurs
mesurées en centi-mètres des vecteurs du
plan
sontproportionnelles
à leurb)
Parmi lesgraphiques qui peuvent
êtreconstruits,
trois sont courants, leplus habituel,
letroisième,
n’estpas le
plus simple
àinterpréter.
Les notations étant celles de 2.2.4 on a :
Dans le
graphique
3,représentation
dite simultanée : lesmétriques représentées
sont à la fois (D et~.
On regroupe en un même
graphique
lesprojections Pr, (x,)
soit n vecteurs etPrQ (yJ)
soit p vecteurs. Lesprojections
des vecteurs de base sont omises.c) Exemple
de l’étude des villestouristiques
littoralesNous avons introduit deux
représentations graphiques :
i)
lafigure
1qui
est ungraphique
detype
3(représentation
ditesimultanée) ; ii)
lafigure
3qui
est ungraphique
detype
2(sans
vecteurs debase).
2.4.2. Trois
propriétés
utiles àl’interprétation
(P’1 ) - D’après
lapropriété barycentrique
de 1.1.4 on a :sur le
graphique
1 :Prp (x,)
est lepoint
moyen du nuagesur le
graphique
2 :(yi)
est lepoint
moyen du nuage(P’2) -
Produitsd’affinités
Soit s = dim a où a, on le
rappelle,
est lesupport
du nuagec¥ (I), puisque (expression
des vecteurs dedl
dans la base’~9) d’après
3.3.2. :(la
dimension de aétant s,
seules les splus grandes
valeurs propres de sont nonnulles).
Quel
que e]nl :
- xi 1 s’écrit
(xii,
..., x 1.,, 0, ...,0)
e Rl’ dans la base~/.
- la relation
(1) permet
de dire quele
vecteur(x~,
...,x,.,)
e R’ estl’image
de(a",
.... e R" par lacomposée
de s affinités derapports ~l, , (1 ~ k s)
et d’axes directeurs ceuxengendrés
par les vecteurs de la basecanonique
de R’.- matriciellement on
peut
écrire dans la basecanonique
de Rs :de même :
dk
E]s]
Figure
6(P"8) -
Relationbarycentrique
etproduit d’affinité
De
(P’1)
et(P’2)
on déduit que : -.2.4.3.
Remarque
pour l’utilisation desgraphiques
a)
Ils’agit toujours
à l’aide deprocédures
inférentielles basées sur des constatations faites sur lesgraphiques
ou les tableaux de résultats de déterminer des
propriétés
sur les liaisons entre les i E7,
ou entreles j
EJ,
ou entre les éléments de 7 et ceux de J.
Les éléments sont
représentés
sur les différentsgraphiques
par lesprojections
des vecteurs suivants :b)
Afin dejuger,
à l’aide desgraphiques
ettableaux,
des liaisons entreprofils (proximités
deprofils
ou deprofils
et de vecteurs debase)
ondispose
pour chacun des élémentsprojetés
de saqualité
dereprésentation
par le
plan
defigure.
Cet indice est utilisé comme encomposantes principales.
Sur les
graphiques
1, 2 et 3(pour
deuxprofils
x, ou deuxprofils yJ)
deux vecteurs bienreprésentés
et de
projections proches
sontproches.
Exemples
V.T.L. : lafigure
VI parexemple permet
de mettre en évidence desgroupements
de villes bienreprésentés
aux deux extrémitésgauche (Nord :
BRAY-DUNES, LE PORTEL, WIMEREUX,EQUIHEN)
et droite(Méditerranée :
BEAULIEU, ROQUEBRUNE, SAINT-JEAN-CAP-FERRAT,COLLIOURE) ;
il en est de même pour les classesd’âges
que le lecteur pourraregarder.
c)
Vecteurs malreprésentés
i)
Si laprojection
d’unprofil yi
estproche,
parexemple,
de celle d’un vecteur de basealo, peut-on
n i j
en déduire que est
grand?
ni
~ Oui si Pr
(a~° )
estpériphérique (voir
lafigure
6bis).
~ Non si Pr
(aiO)
n’est pas un vecteur de lapériphérie
dugraphique
comme onpeut
s’en convaincresur un
grand
nombred’exemples.
En effet Pr
J
estbarycentre
de Pr a‘° muni de la masse~‘°~
et dupoint
moyen g du nuage n Jaffecté de la masse
Soit
(r) l’enveloppe
convexe de(Pr (a’), i :0
g est à l’intérieur de(r).
Lespoints D, E,
g sontalignés.
F étant définie sur lafigure (6 bis)
ona :
ii)
Ilpeut
arriver que Pryi
soitproche
d’unsous-ensemble, {Pr (a’) /
i E7o
de vecteurs situés à lapériphérie
dugraphique.
Dans ce cas, onpeut
déduire de cetteproximité :
d)
Enfin dans legraphique
3 les relations liant les x~k auxyik
faisant intervenir des affinités(voir (P2)
et(P3)
de1.4.2)
sont engénéral
suffisammentcompliquées
pour ne pas autoriser l’utilisation des pro-priétés barycentriques
avec la même sécurité que dans lesgraphiques
1 et 2.Exemple
des V.T.L. : lapetite
taille des valeurs propres, mais aussi lagrande
différence entre les deuxpremières (~7~1 N
0,4, 0,06 toutes deux très différentes de1)
nous interdisent une utilisationaveugle
desproximités
entre classesd’âges
etV.T.L.,
même si elles sont toutes bienreprésentées.
Celadit,
les données confirment les liaisons entre les villes du sud
déjà
citées et les classesd’âges représentant
lespersonnes de
plus
de 70 ans.2.4.4. Part de la
dispersion prise
encompte
par les éléments xi etyJ
Etant donné xi vecteur du nuage
c4i (I), [u,]
un axefactoriel,
onappelle part
de ladispersion
de xi dansla
dispersion
du nuageprojeté
sur[u,] l’expression
Les différentes colonnes b du tableau 4 fournissent ces éléments en
pourcentage
pour les classesd’âges
et les 4
premiers
axes factoriels.a)
Si les mi sont presqueégaux
entre eux, pour k fixéles A8
sontproportionnels
aux(xi - g¡)112 ;
ces
quantités
se déduisent desgraphiques.
b)
Si les m ~ sont différents les uns des autres, les valeurs desAfl
nepeuvent
être déduites des gra-phiques.
Dans les deux cas cet indice constitue un
complément important
au critère de laqualité
de larepré-
sentation et
permet
d’évaluer(ou d’apprécier)
la contribution des différents éléments(points pondérés)
du nuage à la détermination de l’axe.
Remarque (2.4.4)
Une définition et des
propriétés analogues peuvent
être énoncées pouryf
E R net[v’]
un axe factoriel du nuageCAP (J).
2.4.5.
Représentation
d’élémentssupplémentaires
etsuppression
d’élémentsa)
Considérons deuxcorrespondances
l’une sur I XJ1
l’autre sur 7 XJ2.
Exemple :
Dansl’analyse
descompositions
parâges
des V.T.L. onpeut
considérer l’ensembleJi
des classesd’âges hommes,
et l’ensembleJZ
des classesd’âges
femmes. Lesanalyses
de I XJi
et I XJ2
fournissent deux ensembles de résultats(graphiques, tableaux, interprétations).
Il est intéressant de
rapporter,
parexemple,
lesdescripteurs
deJ2
aux différentesreprésentations
obtenues sans eux ; cela a pour but de confronter
l’analyse
faite sur 7 XJ,
1 à des informations n’interve- nant pas dansl’analyse.
La méthode est
simple :
il suffit deprojeter
lesdescripteurs
deJ2
sur les axes factoriels del’analyse
dans
l’analyse
I XJ 1.
Lesgraphiques
et lesqualités
dereprésentation
des vecteurs associés àJ2
ainsi obtenus sont utilisés pour étudier parexemple
les liens entre éléments deJ1
etJ2.
b)
Considérons un vecteur x ~ E RP tel que m ~ ~ 0 et dont lapart
de ladispersion
dans ladispersion
totaleest
grande.
Ce vecteurpeut
être déterminant dans le calcul d’un des.,
premiers
axes factoriels. On se trouve alors dans une situationparfois
embarrassante : un despremiers
axes(qui prend
encompte
unegrande part
de ladispersion
totale dunuage)
est en faitspécifique
à un seul vec-teur. Dans ce cas il est intéressant d’effectuer une
analyse
sur les ensembles J et I - et deprojeter
levecteur x, en élément
supplémentaire
sur les axes obtenus. Cettepratique
revient à affecter à x, une massenulle.
1. Cet indice et ces