R EVUE DE STATISTIQUE APPLIQUÉE
A. Z ÁRRAGA B. G OITISOLO
Étude de la structure inter-tableaux à travers l’analyse simultanée
Revue de statistique appliquée, tome 51, n
o3 (2003), p. 39-60
<http://www.numdam.org/item?id=RSA_2003__51_3_39_0>
© Société française de statistique, 2003, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ÉTUDE DE LA STRUCTURE INTER-TABLEAUX
À TRAVERS L’ANALYSE SIMULTANÉE
A.
ZÁRRAGA
et B. GOITISOLO Departamento de EconomiaAplicada
III,Universidad del Pais Vasco-Euskal Herriko Unibertsitatea, Bilbao, Espafia
RÉSUMÉ
L’analyse
factorielle des relations internes d’un ensemble de tableaux decontingence,
chacun d’eux ayant le même ensemble de
lignes
et un nombreidentique
ou différent de colonnes,est résolue dans
Zàrraga
& Goitisolo (2002) à traversl’Analyse
Simultanée, méthodequi
permet de maintenir lescaractéristiques
et relations d’association propres à chacun des tableaux.Dans le
présent
travail, oncomplète l’analyse
antérieure par unecomparaison globale
desressemblances et des différences entre les tableaux à travers une étude du nuage de
points-
tableaux. Pour ce faire, on définit, en dehors du
point
quereprésente chaque
tableau, desmesures de relation entre les
points-groupes
et entre les facteurs des différentesanalyses,
mesures
qui
sont desadaptations
de celles utilisées enAnalyse
FactorielleMultiple
(Escofier&
Pagès
(1988 (1998 3.éd.))).Mots-clés :
Analyse factorielle,
Juxtaposition de Tableaux deContingence, Analyse
des Corres-pondances, Analyse
FactorielleMultiple,
Interstructure, Covariance Généralisée.ABSTRACT
Factorial
analysis
of the internairelationships
within a setof contingency
tables with thesame number of rows and the same or a different number of columns is resolved in
Zàrraga
&Goitisolo (2002)
by
means of SimultaneousAnalysis.
This method enables the characteristics of each table and its associationrelationships
with the others to be maintained. This worksupplements
thatanalysis
with an overallcomparison
of the similarities and differences between the tables,using
agraphical representation
for the tables. To that end, notonly
thepoint representing
each table but also measurements of therelationship
between the clouds ofpoints
and the factors of the variousanalyses
are described. These measurements are suitable transformations of those usedby Multiple
FactorAnalysis
(Escofier &Pagès
(1988 (1998 3.éd.))).Keywords :
FactorAnalysis, Contingency
Tables Juxtaposition,Correspondence Analysis,
Multiple
FactorAnalysis,
Interstructure, Generalized Covariance.40 A. ZÁRRAGA, B. GOITISOLO
1. Introduction
L’Analyse
Simultanée(Zàrraga
& Goitisolo(2002))
vient du besoin de déve-lopper
une méthode factorielle pourl’analyse conjointe
des tendancesgénérales
deplusieurs
tableaux decontingence qui permette,
de manière similaire àl’analyse
descorrespondances,
l’étude des ressemblances entre l’ensemble deslignes,
descolonnes,
et les relations entre les deux
ensembles,
sanspermettre
que l’un des tableaux ait uneprépondérance
sur les autres. Lestechniques
factoriellesclassiques appliquées
àplu-
sieurs tableaux de
contingence peuvent
se révélerinadaptées
à l’étude des relations internes destableaux,
notamment pour les cas danslesquels
l’effectif des tableaux estdifférent, quand
lespoids appliqués
à une mêmeligne
diffèrent d’un tableau à un autre ouquand
les tableauxpossèdent
des inerties très dissemblables.L’Analyse
Simultanéepréserve
lescaractéristiques
propres àchaque
tableau(poids, métrique, etc.).
On obtient ainsi uneanalyse conjointe
de tableaux decontingence
ou dejuxtaposition
de tableaux decontingence
où sont maintenues les relations d’association à l’intérieur dechaque
tableau. Dans un travailantérieur,
onanalyse
en détaill’intrastructure 1
des tableaux et l’onvérifie,
à travers unexemple,
les
avantages
de cette méthode face à destechniques classiques d’analyse
factorielle.Dans le
présent travail,
on faitau § 2,
une brèveprésentation
de la méthode et de l’obtention des axes d’intrastructure.Outre l’étude
conjointe
pour tous lestableaux,
des relations entrelignes
et colonnes de
chaque tableau,
la structuration des données en groupes ou entableaux justifie
le besoin d’obtention d’autres résultatsqui permettent
de comparerglobalement
les groupes. Pourprocéder
à cettecomparaison
on propose,au § 3,
lareprésentation
dechaque
tableau à travers unpoint qui
caractérise la structure du tableau. Laprojection
de cespoints-groupes
sur les axesd’intrastructure,
ainsi que les aides àl’interprétation
desprojections
habituelles dans lesanalyses factorielles,
facilitel’interprétation
des ressemblances et des différences entre groupes, c’est-à-dire, l’interprétation
de l’ interstructure des tableaux.Au §
4 onsuggère
decompléter l’analyse
des relations entre les tableaux par des mesures de la relation entre les facteurs obtenus dansl’Analyse
Simultanée et ceux obtenus dans lesanalyses séparées
dechaque
tableau.Au §
5 on constate l’utilité de ces aidescomplémentaires
à traversl’application
à
l’Enquête
sur la Société de l’Information relative aux nouvellestechnologies
del’information et la communication.
2.
L’Analyse
Simultanée : IntrastructureSoit {1,...
g, ... ,G}
l’ensemble des tableaux decontingence
àanalyser.
Chacun d’entre eux classifie les
réponses
de03BAg
individus à deux variablesqualitatives
codifiées en modalités. Tous les tableaux
ont
une des variables(dont
lesmodalités,
I = {1,..., i,..., I},
se retrouvent dans leslignes)
en commun. L’autre variable dechaque
tableau decontingence peut
être la même oudifférente,
codifiée de la1 On emploie les termes intrastructure, compromis et interstructure suivant en cela la méthodologie
STATIS (L’ Hermier des Plantes (1976), Lavit (1988)).
même manière ou d’une manière différente. Les modalités de la seconde variable de
chaque tableau 9
sont7g = {1,... j,
...,Jg}.
Enjuxtaposant
tous ces tableaux decontingence,
on obtient unensemble J = {1,..., j,
...,J}
de colonnes.L’élément
kgij, correspond
au nombre total d’individusqui
choisissent simul- tanément les modalités i E Z de lapremière
variableet j
EJg
de la seconde variable(appartenant
autableau g
Eg).
L’ajustement
des effectifs des tableaux est lepremier
pas pouréquilibrer
l’influence des tableaux. Pour
cela,
chacun des tableaux decontingence
esttransformé,
en le divisant par
kg,
total dug-ième tableau, g
Eg,
en un tableau defréquences
relatives.
On notera :
Afin
d’équilibrer
l’influence quechaque
tableau exerce dansl’analyse conjointe
et de ne pas
permettre
que celle-ci soit dominée par un tableauparticulier,
dansl’Analyse
Simultanée on introduira unepondération
surchaque
tableau. Cettepondération dépendra
des inertiesqui
résultent d’uneanalyse
descorrespondances simples
de chacun des tableaux traitésséparément.
Ces inerties pour le tableau g, g Eg,
seront notées03BBgs (l’inertie projetée
sur l’axe s,s ~ S)
et03BBgTOT (l’inertie totale).
Dans
l’Analyse
Simultanée on considère a =1/03BBg1, g ~ G, qui
est lapondération
effectuée dans
l’Analyse
FactorielleMultiple (AFM).
Afin d’effectuer
l’analyse conjointe,
on cherche pourchaque ligne
unreprésen-
tant, que nous noterons
ic,
i ET,
dit« compromis », qui représente
le sous-nuage deprofils-lignes
formé par tous lespoints
de la mêmeligne
dans les différents tableaux.L’ensemble de tous les
représentants
surRJ,
muni de lamétrique
de matrice associée la matricediagonale
des03B1g/fgj, j
EJg
CJ,
forme le nuageN(Ic).
On définit le
compromis
iC avec lepoids
pic, i e 1:où i9 dénote le
profil correspondant
à laligne i,
i EI,
dutableau g, g
Eg, représenté
dans
l’espace RJ
dont les coordonnées sont :42 A. Z4RRAGA, B. GOITISOLO
2.1. Obtention
des facteurs
Afin de chercher la relation entre les
analyses
deslignes
et des colonnes dans lesdéveloppements suivants, l’analyse
factorielle de l’ensemble des tableaux decontingence s’effectue,
comme il est dit dansZarraga
& Goitisolo(2002),
enrecherchant les valeurs propres
(Às)
et les vecteurs propres(us), s ~ S,
issus de ladiagonalisation
de la matrice A =X T
X où le termegénéral
de la matrice X est :Cette matrice
peut
êtreexprimée
commejuxtaposition
des matricesX 9’
d’ordre( I
xJg), qui
secomposent
des coordonnées de la matrice X pour l’ensemble des colonnesJ9
dutableau g, 9 E 9 :
De
plus,
on utilisera les matricesdiagonales
R d’ordre I x I et N d’ordre J xJ,
determes
généraux respectivement :
On définit aussi la matrice
Y, diagonale
parblocs,
oùchaque
bloc de ladiagonale
est la matrice
Xg
et on définit la matriceQ, diagonale
par blocsaussi,
oùchaque
bloc est, de
même,
une matricediagonale
d’ordre(I
xI)
et de termegénéral if,
i E I, 9 E g.
2.2. Relation entre les vecteurs propres des deux
analyses
Puisque
dansl’analyse
deslignes
ondiagonalise
la matriceX T X
et dans celle des colonnes la matriceXXT
la relation entre les valeurs propres et vecteurs directeurs desanalyses
deslignes (Às
et us ERJ)
et colonnes(J1s
et vs ERI)
est :2.3.
Projections
desprofils
On calcule les
projections
sur l’axe s,s ~ S,
desprofils-lignes partiels Fs(ig),
des
compromis Fs (ic),
i EI,
et desprofils-colonnes Gs (j), j
EJ.
Lesprojections
de tous les
profils-lignes partiels
etcompromis
sontrespectivement Fs(Ig)
avecIQ == {Ig/g ~ 91
etF,(1’)
et de toutes les colonnesGs(J).
Lesprojections
surl’axe
s, s E S,
deslignes
et colonnes sont calculées en sachantqu’il
est nécessaired’éliminer l’effet de l’introduction des
poids
et lesprofils-lignes partiels
sontprojetés
comme
supplémentaires
en éliminant aussi l’effet de l’introduction dupoids :
3.
Comparaison
des groupes ou tableaux : InterstructureJusqu’à
maintenant on a réalisé une étude simultanée des tableaux àpartir
des
projections
desprofils-lignes partiels
et desprofils-colonnes,
ainsi que despoints compromis. Quand
le nombre de tableaux estimportant, l’analyse peut
êtrecomplétée
par une visualisation où
chaque point représente
l’un des tableaux.Dans certains cas
(Cazes (1982),
Torre & Chessel(1995))
lesprojections
dechaque
tableaucorrespondent
au centre degravité
desprojections
deslignes
dechaque
tableau sur les axes obtenus. Dans d’autres
(Qannari, Qannari
& Courcoux(1992),
Escofier &
Pagès (1983),
Chessel & Hanafi(1996), Simier, Blanc, Pellegrin
& Nandris(1999)
et L’ Hermier des Plantes(1976)
entreautres)
on se livre à uneanalyse globale
des ressemblances et différences des tableaux en recherchant des axes sur la base de différents critères.
Ci-après,
on recherche unpoint qui représenterait
chacun des tableaux et des axes, enutilisant,
commecritère,
la maximisation de la somme desprojections
de cespoints
sur les axes.3.1.
Représentation
dechaque
tableau(Analyse
dansRI2)
Le nuage de colonnes du tableau g, g E
g,
une fois sesprofils
transformés pourpouvoir
êtrereprésentés
dansl’espace RI
doté de lamétrique euclidienne,
est caractérisé en utilisant la matrice d’inertie que nous dénoterons parWg:
où
Xg
est la matrice définieau §
2.1.La
diagonalisation
de la matriceWg permet
d’obtenir une reconstructionparfaite
de la structure du nuage deprofils-colonnes
dutableau 9
d’où l’on deduit que la matriceWg
est une bonnereprésentation
du tableaucorrespondant.
La matrice
Wg,
d’ordre(I I ), peut
êtrereprésentée
comme unpoint
dansun espace de dimension
12
doté de lamétrique
euclidienne. Les coordonnées de cepoint, représenté
par le vecteur d’ordre(1 I2)
que nous dénoteronsWg (Figure 1),
s’obtiennent
en juxtaposant
leslignes
de la matriceWg.
44 A.
ZÁRRAGA,
B. GOITISOLOFIGURE 1
Représentation
des tableaux enRI2
3.2. Mesure de la dimensionnalité d’un tableau
On
peut
se livrer à unepremière comparaison
des tableaux en utilisant comme mesure de la dimensionnalité des tableaux la norme deWg
ou distance au carré dupoint W9
àl’origine.
Nous dénoterons cette mesurepar 2
par£g (g) :
où
tr(A)
est la trace de la matrice A.Quand
lapondération appliquée
aux tableaux est l’inverse de lapremière
valeur propre des
analyses
decorrespondances séparées (a
=1/03BBg1),
cette distanceau carré
peut
êtreexprimée
en fonction des valeurs propres,03BBgs,
del’analyse
decorrespondances séparée
du tableau g, gE 9 :
Cette mesure
dépend,
parconséquent,
de la structure du groupe ; elle sera d’autantplus grande
que le groupe seraplus multidimensionnel,
étant entendu que multidimensionnalité est non le nombre total de dimensions mais le faitqu’à chaque
dimension il est
assigné
uneimportance
en fonction de son inertie. Cette valeur seraproche
de 1 s’il existe unpremier
axeprépondérant
dansl’analyse
et elleapprochera
le nombre de dimensions total si chacun des axes
possède
une inertie semblable.Pour vérifier
l’égalité (10)
on dénote parVg
la matricequi
contient en colonnesles vecteurs propres de
l’analyse
decorrespondances
desprofils-colonnes
du tableaug et par
Ag
la matricediagonale
d’inertiesprojetées
associées à cetteanalyse.
Unefois
qu’on
a introduit lapondération
cx9 =1/03BBg1,
ces inertiesprojetées
sont(03BBgs/03BBg1).
2 Par sa similitude avec la mesure utilisée dans l’Analyse Factorielle Multiple.
Les distances au carré de
chaque point-tableau
àl’origine
enRI2
peuvent être obtenues enpartant
des relations dansl’analyse
dutableau g :
En
post-multipliant
les matrices dechaque
membre del’équation
par leurstransposées :
étant donné
que Vg
est une matriceorthogonale
comme matrice de vecteurs propres.En
post-multipliant
parVg
et ensimplifiant
le résultat :En
conséquence,
les vecteurs propres, contenus enVg,
del’analyse
deprofils-colonnes
du
tableau g
sontégalement
vecteurs propres deWg Wg
mais associés aux valeurs propres(03BBgs/03BBg1)2.
3.3.
Projection
des groupesL’étude de l’affinité entre les groupes ou tableaux
pourrait
êtreopérée
à traversune
analyse
factorielle du nuage depoints -
tous depoids
unitaire -, chacun d’entreeux
représentant
untableau,
dansl’espace
de dimensionI2 .
Lareprésentation
dansun espace de
petite
dimensionpermettrait
de comparerglobalement
lestableaux,
endécidant
lesquels
sont similaires etlesquels
sont les tableauxqui
se différencient leplus
du reste.Cependant,
il est difficile par cette manière deprocéder d’interpréter
la cause de ces différences entre les
tableaux,
étant donné que les axes sont fonction des donnéesinitiales,
defaçon complexe.
Pour obtenir des axes facilement
interprétables
en fonction des variablesinitiales,
serait-ce auxdépens
d’unereprésentation
moinsprécise
des relations entre lestableaux,
onimpose
aux axes(définis
à travers levecteur zs
d’ordre(1 I2))
d’êtredes éléments
symétriques
de rang 1(zs zTs).
La démarcheadoptée
pourreprésenter
les groupes est, en
réalité,
celle del’Analyse
FactorielleMultiple.
Nous dénotons par
Fs (g)
lesprojections
despoints-groupes (Wg)
sur le vecteurzs .
Dans la mesure où cesprojections
sonttoujours positives,
le critère utilisé pour l’obtention des axes consiste àmaximiser,
sous la contrainte de l’orthonormalité des axes, la somme desprojections.
Critèreplus
facile àobtenir,
et dans ce casinterprétable,
que la maximisation de la somme des carrés desprojections.
46 A.
ZÁRRAGA,
B. GOITISOLOPour obtenir les
axes 4 qui
maximisent la fonction antérieure nous commen- cerons pardévelopper
laprojection
deWg sur zs :
où
Ng
est la matricediagonale
d’ordre(Jg Jg) qui
contient lespoids
desprofils-
colonnes du tableau g. En usant de
l’équivalence
avec la relation(7),
cecipeut s’exprimer
comme :(Projection
de lamodalité j
surzs)2
=(Inertie projetée
de lamodalité j
surzs )
En faisant la somme dans l’ensemble des groupes :
Max (Inertie projetée
de lamodalité j
surzs)
Mais cette dernière
expression
est, enréalité,
le critère utilisé dans l’obtention des axes del’analyse
desprofils-colonnes,
et parconséquent
lesvecteurs zs
obtenusdans
l’analyse
du nuage depoints-groupes peuvent
être calculés àpartir
des axesvs obtenus dans
l’Analyse
Simultanée desprofils-colonnes
de tous les tableaux.Autrement
dit,
le vecteurligne
de dimension[2 (zs )
est celui résultant de la vectorisation de la matricezs zs = vsvTs.
De la sorte,
où
Inerties (g) représente
l’inertieprojetée
de l’ensemble de colonnes du groupe g sur l’axe s.Rappelant
que, dansl’analyse séparée
du groupe g, l’inertie maximumprojetée
sur un axe
correspond
à sapremière
valeur propre(03BBg1)
et que,après
lapondération appliquée
aux groupes, l’inertie maximumprojetée
surn’importe lequel
des axes estl’unité. La coordonnée d’un groupe
peut
doncégalement
êtreinterprétée
comme laproportion
de l’inertie maximalepossible
enprojection
sur l’axe s de l’ensemble des colonnes du groupe g. Une valeurproche
de 1indique
que l’axe del’analyse conjointe
est
pratiquement
le même que dansl’analyse séparée
alorsqu’une
valeurproche
de0
indique orthogonalité
entre lespremiers
axes desanalyses séparées
parrapport
àl’Analyse
Simultanée.En faisant la somme des
projections
de tous les groupes on obtient l’inertieprojetée
sur l’axe :La
projection
dechaque
groupe sur lepremier
axe étant inférieure ouégale
àl’unité,
l’inertieprojetée
sur lui estcomprise
entre zéro etG,
le nombre de groupes.Aides à
l’interprétation
des groupes enRI2
La contribution de
chaque
groupe à la formation d’un axe s,sES,
et saqualité
de
représentation
surcelui-ci, peut
secalculer, respectivement,
comme :d2 (g, 0)
étant la distance dupoint-groupe
àl’origine
obtenue en(9),
où elle est dénotéepar
£g(g).
3.4. Mesure de la relation entre les groupes
On
peut
utiliser leproduit
scalaire entre deuxpoints-groupes
comme mesurede la relation entre les groupes. Cette mesure sera dénotée par
£(g, h) :
Pour
justifier pourquoi
ceproduit
scalaire est une bonne mesure de la relation entre deuxpoints-groupes
nous définissons la relation entre un groupe g et un vecteur zs, et nous la dénotons par,C (g, zs),
comme laprojection
dupoint-groupe
sur levecteur
dansl’espace
de dimensionI2, Fs (g) .
En(11)
nous avons vu que cetteprojection peut s’exprimer
en fonction des inertiesprojetées
par les colonnes :(Inertie projetée
de lamodalité j
surzs)
De
plus,
la matrice d’inertie du nuage deprofils-colonnes, pondérés
parah,
dutableau h peut
s’exprimer
comme :48 A. ZÁRRAGA, B. GOITISOLO
ÀZ et vs
étant les valeurs et vecteurs propres(normalisés
pour lamétrique
euclidienneusuelle),
d’ordre s, obtenus dansl’analyse
decorrespondances séparée
desprofils- colonnes, pondérés,
dugroupe h
et oùAh
etVh
sont les matricesqui
les contiennent.En d’autres termes :
Inertie
projetée
de lamodalité j
surCette mesure,
toujours positive,
sera d’autantplus grande
que chacune des modalités d’un groupe g estplus
reliée aux vecteurs propres de l’autre groupeh,
cette relation étant
pondérée
par la valeur propre de l’axecorrespondant.
Les vecteurspropres étant les variables
qui synthétisent
les relations entre les variables dechaque
groupe, le
produit
scalaire entre deuxpoints-groupes
mesure la relation de toutes les modalités de l’un des groupes avec l’ensemble de modalités de l’autre groupe.4. Autres aides à
l’interprétation :
Relation entre facteurs des différentes
analyses
Pour mesurer le
degré
de similitude de chacun des facteurs dansl’Analyse
Simultanée avec les facteurs des
analyses séparées
dechaque
tableau et de cesderniers entre eux, on
peut envisager
de calculer leur coefficient de corrélation.Cette manière de
procéder
est habituellequand
les facteursproviennent
del’analyse
de tableaux où les
lignes représentent
desindividus,
parexemple,
Torre & Chessel(1995)
et Escofier &Pagès (1988 (1998 3.éd.))
ou des groupes d’individusauxquels
on associe le même
poids
dans les différents tableaux(Bastin, Benzécri, Bourgarit
& Cazes
(1980),
Cazes(1982)). Cependant,
il nous fautrappeler
que dans ce travailon considère G tableaux et à
chaque ligne
du tableaugénéral
est associé un groupe de Gprofils-lignes différents,
un par tableau. Cazes(1982)
propose de calculer le coefficient de corrélation entre facteurs enprenant
pourpoids
deslignes,
lespoids
issus de
l’analyse
descorrespondances
d’un de cestableaux,
cespoids dépendant
doncdu choix du tableau de référence retenu pour
assigner
lespoids.
Nous proposons de résoudre ceproblème
despoids
enélargissant
leconcept
de covariancegénéralisée (Méot
& Leclerc(1997))
à celui de corrélationgénéralisée.
Bien que le nombre d’axes dans chacune des
analyses séparées
et dansl’Analyse
Simultanée
puisse
êtredifférent,
nous dénoterons par s un axegénéral
den’importe laquelle
d’entre elles. Les mesuresproposées
nepourront
être calculées que pour desaxes dont l’inertie
projetée
sera différente de zéro.2022 Relation entre facteurs des
analyses séparées
La relation entre les facteurs s et s’ des groupes g et
h, respectivement,
se calculeraitcomme :
où
Ff (i)
etFs (i)
sont lesprojections
sur les axes s et s’ desanalyses séparées
dans les groupes g et h
respectivement
et où03BBgs
et03BBhs’
sont les inerties associées àces axes.
Cette mesure
permet
de vérifier si les facteurs desanalyses séparées
sont semblableset les
possibles
rotationsqui
seproduisent.
Comparer
lesprojections
entre les groupes g et héquivaut
à étudier le cosinus entre le vecteur directeur del’analyse séparée
du groupe g(vgs)
et le vecteur associé augroupe h
(vhs’).
Sachant que ces vecteurs sontreprésentés
dans des espaces dotés demétriques différentes,
il sera nécessaire(de
mêmequ’il
estjustifié
enZàrraga
&Goitisolo
(2002))
de rechercher un espace commun. Pour cefaire,
on lesreprésente
dans un espace doté de la
métrique
euclidienne danslequel
il estpossible
de calculer leur cosinus. Ce cosinus coïncide avecl’expression (12).
2022 Relation entre facteurs de
l’Analyse
Simultanée et facteurs desanalyses séparées
De manière
similaire,
onpeut
calculer pourchaque
facteur s del’Analyse
Simul-tanée,
la relation avec chacun des facteurs s’ desanalyses séparées
des différents groupes :Si chacun des tableaux de
fréquences analysés possède
la mêmemarginale
colonnecette mesure se
réduit, puisqu’on
a alors pic- =G2 fgi.
etcompte
tenu de(6),
à :c’est-à-dire,
le coefficient de corrélation entre les facteurs desanalyses séparées
etles facteurs de
l’Analyse
Simultanée.50 A.
ZÁRRAGA,
B. GOITISOLORelation entre le nuage
compromis
et les nuages deprofils-lignes partiels
Pour vérifier si un groupe est bien
représenté
sur chacun des facteurs del’Analyse
Simultanée on
peut
calculer la corrélationgénéralisée
entre lesprojections
d(chaque
sous-nuage deprofils-lignes partiels
avec lesprojections
descompromis.
On notera que dans les
analyses
factorielles les facteurs sont déterminés ausigne près. Donc,
dans toutes les mesures de liaisonsprécédentes
on nepeut interpréter
que la valeur absolue et pas lesigne.
5.
Application
del’Analyse
SimultanéeProposée
Ci-après,
on se livre à uneAnalyse Simultanée 3
sur des données obtenues del’Enquête
sur la Société de l’ Information -ESI- Famillescorrespondant
auquatrième
trimestre 2000. Réalisée à intervalle semestriel par l’Institut
Basque
de laStatistique -EUSTAT-,4
cetteenquête
se propose de recueillir de l’information sur les nouvellestechnologies
de l’information et de la communication dans lapopulation
des 15 anset
plus
résidant dans la Communauté Autonome duPays Basque.
Outre l’information relative àl’enquête proprement
dite ondispose,
pour chacun desindividus,
de variablessociodémographiques
extraites del’Enquête démographique
en relationavec l’activité
également
fournie par EUSTAT sur la mêmepériode.
Pour
l’application qui
seprésente,
les individus ont étéclassés,
conformément à leurâge,
en 5 groupes : 15-17 ans,18-24, 25-34,
35-44 etplus
de 44 ans. Deplus,
del’Enquête
sur la Société de l’Information on a sélectionné les variables relatives à lafréquence
d’utilisation dequatre
servicestechniques
d’Internet(tableau 1),
ainsi que les thèmessondés,
pourlesquels
les individus montrent un intérêt ou nonlorsqu’ils
vont sur Internet
(tableau 2). Compte
tenu du faible effectif des individusqui
déclarentne
jamais
se connecter sur les pages web(modalité
5 de la variableUWE),
cettedernière a
été jointe
à la modalité 4 pour cette variable.Dans les
graphiques,
chacune des modalités sera identifiée par le libellé de lavariable,
suivie du numéro de la modalité. Dans le cas desprofils-lignes partiels
et des
profils-colonnes,
cette notation seraprécédée
du numéro indicateur du groupeauquel appartient
ce mêmeprofil.
Parexemple,
3UCE2 fait référence à l’utilisation du courrierélectronique plusieurs
fois par mois chez les individus du groupe 3(entre
25 et34
ans).
Pour faciliter la localisation des modalités mentionnées dansl’interprétation
on a,
compte
tenu dugrande
nombre deprojections, augmenté
la taille des libellés des modalitésqui
contribuent leplus
à la création des axes etreprésenté
sur des3 Cette application a été extraite de Goitisolo (2002), où l’on peut consulter plus de détails sur l’application
et la méthode.
4 L’Eustat est un organisme public du Pays Basque auprès duquel il est possible d’obtenir plus d’information à l’adresse «www.eustat.es».
TABLEAU 1
Variables d’Utilisation des Services
Techniques
d’InternetTABLEAU 2
Variables Thèmes
jugés
d’intérêt dans l’Accès à Internet52 A.
ZÁRRAGA,
B. GOITISOLOgraphiques
différents lesprojections
descompromis
et desprofils-colonnes.
On aaussi
représenté
ce derniers sur desgraphiques différents,
en fonction de la variable àlaquelle
ils sont associés.5.1.
Analyse
de l’IntrastructureL’Analyse
Simultanée met en évidence l’excessiveimportance,
dans la détermi- nation des axes, des modalités de transfert de fichiers -UTF- pour lesplus jeunes (15-17 ans)
et cellescorrespondant
àl’usage
de « chats » -UCC- dans les groupes lesplus âgés (35-44
etplus
de 44ans). L’analyse
despoids
de ces modalités révèle la raison d’être de cetteinfluence, uniquement
31 % desplus jeunes
affirment utiliser à certaines occasions le transfert de fichiers(modalités
UTF1 àUTF4)
et il en vaà peu
près
de mêmeparmi
les groupesplus âgés
pourl’emploi
des« chats »,
79 % des utilisateurs d’Internet de 35 à 44 ansrépondent
nejamais
utiliser Internet pourconverser
(ce pourcentage
s’élève à 80 % pour les personnes deplus
de 44ans).
Ondécide,
pour cetteraison,
d’éliminer ces variables et les modalités associées pour les groupesd’âge correspondants.
Ces
premières précisions
étantfournies,
nous allonsanalyser
en détail letableau
reproduit
dans le tableau 3 danslequel kfj représente
le nombre d’individusappartenant
au tableaud’âge g qui répondent
àla
modalité i sur l’intérêt pour les thèmeset j
surl’emploi
de servicestechniques
d’Internet.TABLEAU 3 Tableau
analysé
L’inertie
projetée (tableau 4)
sur lepremier
axe del’Analyse
Simultanée du tableauprécédent (4.323, 45.096
% de l’inertietotale) indique
que, même s’il n’atteint pas sa valeur maximum(le
nombre de groupesqui
estcinq),
ils’agit
d’un axe d’inertieimportant
dans lescinq
groupesanalysés.
Ci-après,
nous limiteronsl’interprétation
aupremier plan
factoriel danslequel
est
représenté
56.046 % de l’inertie totale. Agrands traits,
onpeut
dire que lepremier
facteur manifeste l’intérêt ou le désintérêt pour tous les thèmes
figurant
dansl’enquête.
L’intérêt pour les
journaux électroniques
et lesinformations -TNO-,
pour lagestion bancaire,
de la bourse et des servicesfinanciers -TFI-,
pour lesbibliothèques
etdocumentation -TBI- et pour les services administratifs et
citoyens -TSA-
étant deTABLEAU 4 Inerties des 5
premiers
axesla
plus
hauteimportance
pour la détermination de cepremier
facteur. Les modalitésindicatrices du désintérêt pour les thèmes cités se
projettent
dans lapartie positive
du
premier
axe et cellesqui représentent
del’intérêt,
dans lapartie négative
de l’axe(figure 2).
Le recours aux consultations sur le Web
-UWE-,
à 39.4%,
ainsi que l’utilisation du transfert de fichiers-UTF-,
à 28.96%,
est cequi apparaît
deplus
déterminant dansce facteur. Dans la
figure 3,
etplus
clairement dans lafigure 4,
où leplan
1-2 est éclatépar services
techniques,
on observe comment lespositions
extrêmes(plusieurs
foispar semaine
et jamais),
dans l’utilisation de tous les servicestechniques
d’Internetconsultés dans
l’enquête (web
et consultations-UWE-,
courrierélectronique -UCE-,
transfert de fichiers(FTP)
-UTF- et« chats »,
conversations-UCC-)
sonttoujours
associées. Du côté
négatif
de l’axe sepositionnent
les modalitésqui indiquent
l’utilisation
plusieurs
fois par semaine des services -modalités 1- et dans lapartie positive
cellesqui
montrent leur absence totale(ou pratiquement
dans le cas duweb, consultations)
d’utilisation.Par
conséquent,
on notequ’il
existe un lien entrel’emploi fréquent
de tous lesservices
techniques
d’Internet et l’intérêtgénéralisé
pour lesthèmes ;
sachant que lesenquêtés
lesplus
attirés par lagestion bancaire,
de la bourse et des services financiers -TFI 1- ainsi que par les services administratifs etcitoyens -TSA 1-
sont aussi ceuxqui
utilisent Internet leplus
intensément. Demême,
lesenquêtés qui
ne manifestent pas d’intérêt pour lesjournaux électroniques
et lesinformations -TN02-,
ou pour lesbibliothèques
et ladocumentation -TBI2-,
sont ceuxqui emploient
le moins Internet.Le second facteur
distingue,
d’unepart,
l’intérêt ou le désintérêt pour des thèmes déterminés comme les droits des consommateurs -TDC- avec une contribution de 29.10%,
la recherched’emploi -TBE-
avec une contribution de 23.57 % etles journaux électroniques
et informations -TNO- et lesbibliothèques
etdocumentation -TBI-,
avec des contributions de 15.71 % et 9.57 %respectivement
et, d’autrepart,
lafréquence
de l’utilisation du Web et des consultations -UWE- et du courrier
électronique
-UCE-(avec
44.09 % et 33.51 %respectivement
de l’inertie du nuage de modalitésprojetée
sur le second
axe).
54 A.
ZÁRRAGA,
B. GOITISOLOAnalyse Simultanée par groupes d’âge
FIGURE 2
Projection
descompromis
Analyse Simultanée par groupes d’âge
FIGURE 3
Projection
desprofils-colonnes
FIGURE 4
Plans factoriels
1-2 pour utilisation de servicestechniques
d’Internet56 A.
ZÁRRAGA,
B. GOITISOLOOn
observe,
parexemple,
comment l’intérêt pour lesjournaux électroniques
et les
infomations -TNO 1-,
pour lesbibliothèques
et documentation -TBI 1- et pour lesjeux
et hobbies -TJU1- est lié aux personnes, de tousâges, qui
consultent le webplusieurs
fois parsemaine -UWE 1-,
tandis que cellesqui
ne se sentent pas attirées par lesjournaux électroniques
et les nouvelles surInternet -TN02-,
pasplus
que par lesbibliothèques
et ladocumentation -TBI2-,
n’utilisent nonplus jamais
oupratiquement jamais
Internet pour des consultations -UWE4-. Jamais le font-elles pour le courrierélectronique -UCE5-,
pour le transfert de fichiers -UTF5- ou encore pour le « chat » et converser -UCC5-. L’intérêt pour la recherched’emploi
-TBE1- et pour les droits des consommateurs -TDC1- se manifeste chez les personnesqui
utilisent de manièresporadique
le web -UWE3- et le courrierélectronique
-UCE3-.5.2.
Analyse
de l’InterstructureDans l’étude de l’interstructure
l’objectif
est de comparerglobalement
lescinq
tableaux ou groupes
d’âge,
cequi peut
fairel’objet
de mise en évidence à l’aide d’ungraphique
surlequel
les groupes sontreprésentés
chacun par unpoint.
Cesprojections,
par le fait de la
pondération
retenue pour les groupes, vonttoujours
se trouver, dansun
plan,
dans un carré de côté 1(figure 5).
FIGURE 5
Projection
des groupes sur les deuxpremiers
axesComme inertie
projetée
du groupe, la coordonnée sur un axeindique l’impor-
tance du groupe dans la détermination de l’axe.
Ainsi,
laproximité
descinq projections
à la valeur 1
indique
que lapremière
direction del’Analyse
Simultanée est une direc- tion d’inertieimportante
de chacun descinq
nuages considérés dansl’application.
La faible coordonnée sur le second axe
pourrait
donner à penserqu’il s’agit
d’une direction de faible inertie pour
chaque
nuage.Cependant,
dans notreexemple,
la consultation des coefficients de relation entre les facteurs de
l’Analyse
Simultanéeet des
A.C. 5 séparées (tableau
5 etfigure 6)
révèle que ce second axe est très lié avecles seconds axes des
analyses séparées
despremier,
second etcinquième
groupes(15- 17,
18-24 etplus
de 44 ansrespectivement),
ces derniers étant ceuxqui
contribuent leplus
à la création du second axe(tableau 6).
TABLEAU 5
Relation entre les
premiers
axes des A. C.séparées
etl’Analyse
SimultanéeTABLEAU 6
Contributions
(ctas (g))
dechaque
groupe à l’inertie des 2premiers
axesLe tableau 6 montre
également
comment tous les groupes contribuent de manièresignificative
etéquilibrée
à la création dupremier
axe. Cequi, joint
auxfortes relations entre celui-ci et les
premiers
axes desanalyses séparées (tableau 5),
nous
permet
de conclure que la structurereprésentée
par lepremier
axe, association entre l’utilisationfréquente
des servicestechniques
d’Internet et l’intérêt pour les5 A.C. représente l’Analyse de Correspondances.
58
FIGURE 6
Représentation
des deuxpremiers facteurs
des A. C.séparées
de
chaque
groupe par leur cosinus avec les deuxpremiers
axesde
l’Analyse
Simultanée.Fs (g) facteur
de rang s de l’A. C.séparée
du groupe gdifférents thèmes d’accès à Internet face à l’association entre le désintérêt pour les thèmes et la faible utilisation des services
techniques d’Internet,
est une structurecommune à chacun des groupes
d’âge.
Parallèlement,
la structurereprésentée
par le second axe del’Analyse
Simul-tanée,
association entre l’utilisationplusieurs
fois par semaine de consultations surle web avec l’intérêt manifesté pour les
journaux électroniques
et les informations et pour lesbibliothèques
et documentation face à la relation entre le désintérêt pour la recherched’emploi
et pour les droits des consommateurs avec une utilisationplus
spo-radique,
est une structureplus présente parmi
les individusappartenant
aux groupesd’âges
de moins de 24 ans et deplus
de 44 ans.A
signaler
enfin que lequatrième
groupe(35-44 ans),
celui deplus grande
dimensionnalité