M ATHÉMATIQUES ET SCIENCES HUMAINES
B. E SCOFIER B. L EROUX
Étude des questionnaires par l’analyse des correspondances.
Modification du codage des questions ou de leur nombre et stabilité de l’analyse
Mathématiques et sciences humaines, tome 49 (1975), p. 5-27
<http://www.numdam.org/item?id=MSH_1975__49__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1975, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ETUDE DES
QUESTIONNAIRES
PARL’ANALYSE
DES CORRESPONDANCES MODIFICATION DU CODAGE DESQUESTIONS
OU DE LEUR NOMBREET STABILITE DE
L’ANALYSE
par
B. ESCOFIER* et B. LEROUX**
L’analyse
descorrespondances
est souventutilisée
dans letraite-
ment des résultats
d’un questionnaire
et cette méthodes’est
révéléeparticu-
lièrement efficace
àcondition
deprendre certaines précautions
en codant lesdonnées.
Leplus
souventil
estpréférable d’associer
àchaque question
unensemble de modalités de
réponses s’excluant mutuellement, chaque individu
devant choisir une des
modalités
et une seule. On construit alors un tableau decorrespondance
entrel’ensemble
1 desindividus interrogés
etl’ensemble
J desmodalités
deréponses
à toutes lesquestions,
en codantk..
1J = 1si l’in-
dividu
i achoisi
lamodalité j
et zérosinon.
Les données sont alors sousforme
"disjonctive complète.
La
plupart
desquestionnaires
seprê tent
à cetype
decodage. : , par exemple,
dans le cas dequestions n’admettant
que lesréponses
oui et non, oncode deux
modalités
deréponses
pourchaque question, l’une associée
auoui,
et
l’autre
au non.Quand
unequestion correspond
à unevariable continue, (par exemple l’âge),
on lapartitionne
enquelques classes ;
onappelle
alorsmodalité
deréponse,
chacune de cesclasses.
Cecodage
trèssouple permet
demêler variables logiques
etquantitatives.
L’analyse
dedonnées
de cetype
a despropriétés particulières
intéressantes qu’il
estutile
deconnaître
pour letraitement
etl’interpré-
tation
desrésultats.
Nousrappelons brièvement
cespropriétés
dans lepremier paragraphe.
L’étude
devariables quantitatives
par cecodage
poseimmédiate-
ment le
problème
duchoix
du nombre de classes et soninfluence
sur les* Département
deMathématiques. I.N.S.A.,
Rennes.** U.E.R. de
Mathématiques. Université
RenéDescartes, Paris.
facteurs.
Lamultiplication
du nombre de classespermet
dedécrire plus fine-
ment la
variable mais n’est
pas sansinconvénient :
lataille
du tableau aug-mente, l’effectif
danschaque
classediminue
et les résultats deviennent sou- ventdifficilement interprétables.
Dans cet
article,
nous avons étudié ceproblème.
Nous montrons quelorsque
le nombre dequestions
estgrand,
et que la valeur propreassociée
au facteur est
bien séparée
des autres, alors leregroupement
demodalités d’une question perturbe
peu le facteur.Mais
leplus
souvent, les facteurspeuvent changer
etmême disparaître.
Lecodage
est unproblème délicat mais
très
important :
deuxcodages apparemment proches peuvent
donner des résul-tats
d’analyse différents.
Un autre
problème
se pose souvent auniveau
del’interprétation :
il
peut apparaître,
dans uneanalyse,
unequestion
peuhomogène
aux autresou
bien d’inertie prédominante
pour unfacteur.
On fait souvent une nouvelleanalyse
en lasupprimant afin
de mesurer soninfluence
sur ladétermination
des facteurs. Les résultatsprésentés ici permettent
danscertains
casd’as-
surer la
stabilité
des facteurs et doncd’éviter
une autreanalyse.
Noustraitons plus particulièrement
desquestions
à deux modalités deréponses,
la
connaissance
de leurposition
parrapport
aux axesfactoriels, permet
en effetd’affiner considérablement
lesrésultats.
L’influence
sur les facteurs del’adjonction d’une
ouplusieurs questions
se pose souvent. Danscertains
cas, lesréponses
à cesquestions
n’étaient
pasdisponibles
au moment del’analyse,
oubien
ellesn’ont
pas ététraitées
pourdiminuer
lataille
du tableau àanalyser
ou parcequ’elles paraissaient
peuhomogènes
aux autres.Nous
étudions aussi
ceproblème
et nous pouvons danscertains
cas,assurer la
stabilité
desfacteurs ;
lesquestions
à deuxmodalités
derépon-
ses
mises
enéléments supplémentaires
fontl’objet d’une
étudeparticulière
dont les
résultats
semblent trèsintéressants.
Enfin,
dans undernier paragraphe,
nousrappelons
des résultatsrelatifs
aux éléments propres de deuxendomorphismes symétriques
deRn,
A et C = A + B, résultats
que nousutilisons
dans lesparagraphes précédents
(démontrés
en[5]
et[6]).
1 - PROPRIETES DE L’ANALYSE DES
QUESTIONNAIRES
MIS SOUS FORME DISJONCTIVE COMPLETE[1]
et[3]
1-0 : Notations
R T désigne l’espace
vectoriel des mesures sur l’ensemble fini I,RI
celui des fonctions sur I.
On note
k U
lacorrespondance
définie sur I x J, J est divisé enune suite
Q
de sous-ensembles q(ou questions).
Les nombresk..
1J sontégaux
à zéro ou un. On note
Les données étant sous forme
disjonctive complète :
Désignons
parfi
leprofil
de l’élément iEn
analyse
descorrespondances
on définit le nuagedans
l’espace vectoriel (Ri
muni dela
métrique
1-1 :
Distance du X2 _
entre l’élément de JSoit X l’ensemble des individus
ayant
choisi la modalité deréponse j
et Y l’ensemble des individus
ayant
choisi la modalité deréponse j’,
X 0 Y la différence
symétrique
entre X et Y, alors la distance du chi-deuxentre j et j’ est :
Dans le cas
particulier où j et j’
1 s’excluentmutuellement,
parexemple j
etj’
sont deux modalités deréponses
d’une mêmequestion,
alors :Si g
désigne
le centre degravité
du nuagela distance
augmente
avec la rareté de laréponse.
1-2 : Distance du
2
entre éléments de I{modalités
deréponses
choisies par i etnon par
i’}}
1-3 :
Barycentre
desréponses
à une mêmequestion
Autrement
dit,
les modalités deréponses
d’une mêmequestion
ont lemême
barycentre
queN(J).
Cettepropriété
se conservant enprojection,
pourchaque
espacefactoriel,
les modalités deréponses
d’une mêmequestion
ontdonc leur
barycentre
àl’origine.
Enparticulier
si q a deux modalités deréponses q+
etq-,
elles sontalignées
avec le centre degravité
du nuage.1-4: Inertie des
éléments de
J(questions)
où
In(j) désigne
l’inertie dej,
cette inertie est d’autantplus
faible que la modalité de
réponse
est souvent choisie.Pour une
question,
on a :Si toutes les
questions ont le
même nombre de modalités deréponses,
alors elles ont toutes même inertie. Dans le cas où les p
questions
q n’ont que deux modalités deréponses, In(q) = pp
- l’inertie du nuage
In(J) = card - J 1,
elle vaut(r-1)
si toutesp
les
questions
ont r modalités deréponses,
et 1 si elles n’en ont que deux.1-5 : Equivalence
entrel’analyse
Ix J
et celles descorrespondances
I x I et J x J déduite de la
correspondance
I x JDe la
correspondance
I x J, on déduit unecorrespondance sJJ
symétrique
sur J x J telle que :Alors
s..,
est le nombre d’individusqui
ont choisi simultanément les JJmodalités de
réponses j
etj’.
Tout facteur sur J de la
correspondance
I x J associé à la valeur pro- pre a est facteur de lacorrespondance
J x J associé à la valeur propre~2
etréc iproquemen t. L’analyse
d’un tableau mis sous formedisjonctive complète est
donc
équivalente
à celle d’un tableau defréquences.
De
même, l’analyse
de lacorrespondance symétrique tII
définie surI x I par
est
identique
à celle de lacorrespondance
I x J. Ce dernier résultat est d’ailleurs valable pour toutecorrespondance.
1-6 : Analyse
de lasous-correspondance
I xq
associée àune estion
Etudions la
correspondance kIq
entre l’ensemble des individus et l’ensemble des modalités deréponses
de laquestion
q. Lacorrespondance symétrique
q x q déduite(cf. § 1-5)
estdiagonale puisque
les modalitésde
réponses
d’une mêmequestion
s’excluent deux à deux. Les élémentsdiago-
naux sont
égaux
àk.,
nombre d’individusayant
choisi la modalité derépon-
J
se
j.
Si la
question
q a r modalités deréponses,
alors lacorrespondance
I x q a
(r-1)
valeurs propreségales
à un et les autres sont nulles.2 - AJOUT
(ET SUPPRESSION)
D’UNEQUESTION :
CAS GENERALDans ce
paragraphe,
on compare les résultats del’analyse
I x Jà ceux de
l’analyse
I x(JUqa), qa désigne
laquestion ajoutée
et r lenombre de ses modalités de
réponses.
Dans le cas des
questionnaires
mis sous formedisjonctive complète,
1la distribution
marginale
sur I estuniforme,
les nuagesN (J)
etN(JUq )
a etN(qa)
ont donc même centre degravité
et induisent surRI
la mêmemétrique
II
zM .
2- 1 :
Formes quadratiques
d’inertieLes trois nuages
N(J), N(JUq )
a etId (qa)
aayant
même centre degravité,
on
peut
comparer les facteurs non triviaux de ces nuages par l’étude de leur formequadratique
d’inertie autour del’origine,
notéesrespectivement SII’
TII et RII.
On
rappelle
queLes facteurs
(et
leurinertie)
des nuages --N (J) , -N (JUqa)
-- a etN.(q )
asont
respectivement
les éléments propres deapplications M-1-symétriques.
On
peut
doncappliquer
les résultats relatifs à la somme de deuxendomorphismes symétriques (cf. § 5-2).
Ondésigne respectivement
par a, T et p les valeurs propres de MoS, MoT et MoR,rangées
par ordre décroissant.2-2 :
Comparaison
des valeurspropres
descorrespondances
I x J et1 x (JUq )
aLa
question q
aayant
r modalités deréponses,
le nuageN(q )
a a(r-1)
valeurs propres
égales
à un, les autres étantnulles,
on a doncpl =
1 etp = 0. On obtient donc :
n
Pour les valeurs propres Q de I x J et T de I x
(3Uqa),
p étant le nombre dequestions, qa
exclue, on a :Pour les taux d’inertie notés taux
(J)
et taux(JUqa)
extraits parles s
premiers
facteurs des nuagesN(J)
etN(JUq ) :
Si les
questions
ont toutes le même nombre r de modalités deréponses
on a :
Remarque
On ne
peut
conclure sur le sens de variation des valeurs propres et des taux d’inertiequand
onajoute
unequestion. Naturellement,
si le nombre p dequestions
est grand les valeurs propres et les taux d’inertie seront peu modifiés11-3 :
Comparaison
des facteurs sur I descorrespondances
I x J etI x
(joug )
aPour comparer deux à deux les facteurs des
correspondances
I x J etI x
(juta ),
on étudie leurangle
dansRI
muni de lamétrique M~1.
Le cosinus de cetangle
n’est autre que la corrélation entre lesfacteurs, plus l’angle
est
petit, plus
la corrélation estproche
de un. Mais il n’est pas suffisant de comparer les facteurs deux à deux. Eneffet,
si deux valeurs propres sontvoisines,
les facteurs associés sont peustables,
ilspeuvent s’échanger,
mais souvent le
plan qu’ils engendrent
ne varie pas. Dans certains cas, on nepeut
assurer la stabilité d’unfacteur,
1 il est alors intéressant d’examiner celle d’un sous-espacequi
le contient. Pour cela nous étudions l’écart entre deux sous-espaces deRI engendrés
par des facteurs de même rang. On mesurecet écart par
l’angle
maximum entre un vecteur de l’un et saprojection
or-thogonale
sur l’autre[§ 5-1].
Le cosinus de cetangle
minore la corrélationmultiple
entre un facteur de l’un de ces deux sous-espaces et ceuxengendrant
l’autre. Plus
l’angle
estpetit, plus
les deux sous-espaces factoriels sontproches.
Pour mesurer la stabilité d’un sous-espace on cherche la bornesupé-
rieure de cet
angle,
pour cela onapplique
les résultatsdu §
5-2.-
l’angle
6 entre les sous-espacesengendrés
par les spremiers
fac-teurs sur I des nuages
N(J)
etN(JUq )
a est tel que :.-
l’angle
6 entre les sous-espacesengendrés
par lesfacteurs de rang s,s+1,
... ~ s+ l
est tel queAlors sin 6
Pour comparer les facteurs deux à deux il suffit de
poser £
= 0dans la formule
précédente.
Ces
majorations
sont d’autantplus petites
que les valeurs propres del’espace
factoriel considéré sont bienséparées
des autres et que le nom- bre dequestions
estgrand.
2-4 :
Ajout
deplusieurs questions
On
généralise
immédiatement les résultats duparagraphe précédent
au cas de
l’ajout
d’un nombrequelconque pa
dequestions.
Pour les valeurspropres, on a :
L’angle
6 entre les sops-espaces invariantsengendrés
par les spremiers
facteurs est tel que :alors 0
n
et sin 4L’angle
6 entre les sous-espacesengendrés
par les facteurs de rangs, ... ,
s+£
est tel que :2-5 :
Suppression
d’unequestion
Etudions maintenant les
perturbations
des résultats del’analyse
pro-voqués
par lasuppression
d’unequestion q .
aDe manière
analogue
auparagraphe précédent,
on compare les valeurs propres(a)
del’analyse
où laquestion qa a
étésupprimée
à celles(T)
del’analyse
desp+1 questions :
Soit 6
l’angle
entre les sous-espacesengendrés
par les spremiers
facteurs des
correspondances
I x J et I x(JUq ) :
aRemarquons
que ces résultats se déduisent de ceux duparagraphe pré-
cédent en
remplaçant
cl par T et p parp+1.
2-6 : Commentaires
Les bornes obtenues ci-dessus pour
l’angle
entre les sous-espacesengendrés
par lespremiers
facteurs sontoptima ;
ellespeuvent
être attein- tes. Ceci montre bien que,lorsque
les valeurs propres sont peuséparées
ouque le nombre de
questions ajoutées
ou retirées n’est pas très inférieur à celui desquestions analysées,
lesperturbations
sur les facteurspeuvent
devenir très
importantes.
Ceci a souvent été constaté enpratique ;
en par-ticulier,
lasuppression
dequestions peut
entraîner ladisparition complète
d’un facteur. Les tableaux de données mis sous forme
disjonctive complète
sontsensibles aux modifications du nombre de
questions
étudiées.Sans informations
supplémentaires
sur lesquestions ajoutées
ou reti-rées,
on nepeut
obtenir de meilleuresmajorations. Cependant, lorsque
cesquestions
sont à deux modalités deréponses,
onconnait, (ou
onpeut
calculerfacilement)
leurspositions
parrapport
aux axesfactoriels ;
Ceproblème
fait
l’objet
duparagraphe
suivant : onprécisera
la variation des facteurs et on améliorera considérablement les bornes.3 - AJOUT
(ET
RETRAIT) D’UNEQUESTION
A DEUX MODALITES DE REPONSESq+
etq
a a
Les résultats
précédents s’appliquent
évidemment à ce casparticulier,
mais on
peut
obtenir desmajorations beaucoup plus
fines en utilisant les car-rés des corrélations de la
question
avecchaque
axe factoriel. Ils sont cal- culés dans les programmesd’analyse
descorrespondances.
Pour les élémentsintervenant dans
l’analyse
et pour ceux mis en élémentssupplémentaires,
ilssont
égaux
aux contributions relatives de laquestion
au facteur.Lorsqu’on
retire une
question,
on connait donctoujours
cescoefficients,
par contre sion
l’ajoute,
il fautqu’elle
ait été étudiée en élément depoids
nul.Nous avons vu
au § 1,
que les deux modalités deréponses
sontalignées
avec le centre degravité
dunuage et que la
correspondance
I x
{q a
a 1q }
a n’aqu’une
valeurpropre non nulle.
+ -
La forme
quadratique
d’inertie du sous-nuage{q +
a 1 "qa},
a parrapport
au centre de
gravité,
est de rang1, l’angle
de son vecteur propre avec cha- que facteur est donné par la contribution relative deq+
ou q à ce facteur.a a
Nous pouvons donc
appliquer
les résultatsdu §
5-3 à la somme(p+1)
MoT = p MoS + MoRpuisque
MoR est de rang un.Soit s ) l’angle
entre laquestion qa
et le sous-espace factorielcorrespondant
aux splus grandes
valeurs propres de lacorrespondan-
ce I x J
(resp.
I x(JUq )),
a alorscos 2(Ds
s(resp. cos2 s)
s estégal
à la sommedes contributions relatives de
q a
aux spremiers
facteurs de I x J(resp.
I x
(JUqa) ) .
3 -1 : Comparaison
des valeurspropres
de 1 x J et I x-- -
--- - -.
- -->.
a
Nous étudions les
perturbations provoquées
sur les valeurs propres de I x J parl’adjonction
de laquestion
qa
. -.- -
a
Entre les valeurs propres a de I x J et T de I x
(JUq ),
a 1 p étant lenombre de
questions (qa exclue),
1 on a les relations :-
Pour la somme des s
premières
valeurs propres, on a :(Cette inégalité permet
enparticulier
de comparerT1
etcr1).
Pour les taux d’inertie notés taux
(J)
et taux(JUq )
extraits para
les s
premiers facteurs,
on a :S~ chaque question
a deux modalités deréponses,
la formule sesimpli-
fie :
9
De manière
analogue,
on étudie lesperturbations
dûes au retrait de laon a par
exemple :
Commentaires
Quand
on étudiel’ajout
d’une nouvellequestion à l’analyse,
la con-naissance de ses contributions relatives aux
facteurs, permet
d’améliorer les résultatsdu § 2-2,
d’autantplus que 0,_, est plus petit.
Les valeurs pro- pres diminuent dès quesin2 s- 1
enparticulier
si laquestion q a
appar-tient au sous-espace factoriel
correspondant
aux spremiers facteurs,
les va-leurs propres de rang
supérieur
sontmultipliées
parp/(p+l).
Engénéral,
onne
peut
déterminer le sens de variation des tauxd’inertie, cependant si ID s
est
petit, plus précisément
sicos 2bs
>taux(J),
le taux d’inertieextrait
par les s
premiers
facteursaugmente.
De
même, quand
onsupprime une question
del’analyse,
les résultatsdu §
2 -5 sont améliorés. Les valeurs propresaugmentent
dès quecos 2 s
estinférieur
à Ts ;
si laquestion ajoutée
estorthogonale
au sous-espace asso- cié aux spremiers facteurs,
les valeurs propres de rangsupérieur
sont mul-tipliées
par le coefficient(p+1)/p.
3.2 :
Comparaison
des facteurs sur I descorrespondances
I x J et Ix(JUqa)
Pour
l’ajout
d’anequestion
les résultats du§
2-3 sont améliorés.L’angle
6 entre lessous-espaces engendrés ar
less premiers
facteurs surI des nuages
N(J)
etN(JUq a ),
p étant le nombre dequestions (qa exclue) ,
1est tel que :
L’angle
0 entre lessous-espaces engendrés par
les facteurs derang s,... s+l
de I x J et Idésignant l’angle
entreq et
a a
le sous-espace factoriel associé à I x J, est tel que
alors
De
même,
dans l’étude duretrait
d’uneauestion,
on a pour les sous-espacescorrespondant
aux spremiers
facteurs :Pour les sous-espaces
intermédiaires,
onobtient,
si
alors
Commentaires
Avec les résultats du
paragraphe précédent,
il était rare depouvoir
assurer la stabilité desfacteurs,
alorsqu’en
utilisant les corré-lations de la
question ajoutée
avec les axesfactoriels,
onpeut
très fré-quemment
le faire et donc éviter de nouvellesanalyses.
Les courbes
ci-jointes
donnent en fonction des contributions relatives de laquestion ajoutée (cos 2 4)s)
ou retirée la borne dus s
cosinus de
l’angle
entre les sous-espaces associés aux splus grandes
va-leurs propres des deux
correspondances
pourquelques
valeurs d’unparamètre )
pourl’ajout
et)
pour leretrait] .
Les minimas de ces courbes
correspondent
auxmajorations
duparagraphe
2.Ces courbes
présentent
unpic,
d’autantplus aigu
que la valeur duparamètre
est
plus petite.
Sauf à l’intérieur d’un trèspetit intervalle,
les corréla- tionspermettent
d’améliorer notablement les résultatsprécédents
et doncd’assurer la stabilité des facteurs.
Les faisceaux de courbes
correspondant
àl’ajout
et au retraitse déduisent l’un de l’autre par
symétrie
parrapport
à la droite2 21
cos 4l s
= les a doncfigurés
sur le mêmegraphique
entraçant
deux axeshorizontaux,
l’un associé àcos 2 (Ds
s et l’autre àcos 2 ’ys
s .On constate que, dans le cas de
l’ajout
-- . ---- ---- . ad’unequestion q ,
lesous-espace factoriel étudié ne varie pas du tout si
q
en estproche
, 2 . , . .
(si 1/2 ,
cos 6 est encoresupérieur
àQ,925 quand
leparamètre
vaut
1,01 ,
alors que son minimum est0,767).
Si laquestion q
a est dansl’orthogonal
dusous-espace
factorielétudié,
celui-ci ne varie pas nonplus,
mais cette stabilité est détruite dès que l’on s’en
éloigne
un peu.Dans le cas de la
s,uppression d’une question,
la situation estinversée,
la stabilité estplus
durablequand
laquestion qa
est au voisi-nage de
l’orthogonal
du sous-espace étudié quelorsqu’elle
en estproche.
Pour les facteurs de même rang,
(ou, plus généralement,
pour les sous-espaces factorielsintermédiaires),
nosmajorations
montrent que si laquestion ajoutée
ou retirée estproche
de l’axe factoriel(sin 4l
ou . sinproche
dezéro)
ou lui est presqueorthogonale (cos 0
ou cos Tproche
de
zéro),
le facteur est stable.Les
majorations
données pour les sous-espaces intermédiairespeuvent
évidemments’appliquer
aux sous-espaces associés auxplus grandes
valeurs propres. Les bornes obtenues sont moins bonnes mais les conditions
d’application
étant moinsstrictes,
on estparfois
amené à les utiliser .Elles
permettent
enparticulier
d’affirmer que le sous-espace esttoujours
fixe
quand
il contient laquestion q
ou lui estorthogonal.
a
4 - REGROUPEMENT DE PLUSIEURS MODALITES DE REPONSES D’UNE
QUESTION
On se propose ici d’étudier les modifications des résultats de
l’analyse
descorrespondances
dues auregroupement
deplusieurs
modalitésde
réponses J C
d’une mêmequestion
en une modalité notée d. On diraqu’un
individu a choisi cette modalité c s’il a choisi l’une des modalités regrou-
pées.
De lacorrespondance
sur I x J on déduit ainsi unecorrespondance
entre I et C l’ensemble des nouvelles modalités de
réponses.
Dans le tableau decorrespondance,
cela revient àremplacer
les colonnesreprésentant
lesmodailités à regrouper par une seule colonne
égale
à leur somme.La
correspondance
I x C est du mêmetype
que lacorrespondance
I x J : le tableau associé ne
comprend
que des 0 et des 1 et est sous formedisjonctive complète.
Pour
simplifier,
nous étudions le cas ©ù l’onregroupe
les moda-lités d’une seule
question,
lagénéralisation
àplusieurs questions
est immédiate.Ceci est un cas
particulier
duproblème
duregroupement
en classes pour unecorrespondance quelconque,
que nous avonsdéjà traité [ 5 I. D’après
le théorème de
Huyghens,
la formequadratique
d’inertieTII
du nuageN(J)
est la somme de la forme
quadratique
d’inertieSII
du nuageN(C)
et de celledu sous nuage
N(J )
parrapport
à son centre degravité. L’analyse
deN(J)
et de
N(C)
se fait dans le même espace euclidien fil muni de lamétrique MIl,
les facteurs et leur inertie sont les éléments propres de
M oTII
et deMIIoS
II
respectivement.
0n pourraappliquer
les résultats relatifs à la somme de deuxendomorphismes symétriques [cf. § 5 -2I
à la somme :Montrons que les valeurs propres de MoR sont nulles ou
égales
à1/p.
Soit
Le
support
du sous-nuageN(J )
est contenu dansR C R , MoR
c I l
c
est donc nul en dehors de ce
support.
Deplus, l’analyse
de la correspon- danceIc x Jc
est celle d’unequestion
à card(Jc)
modalités deréponses exclusives,
elle admet donc(cf. § 1-6)
cardJc -
1 valeurs propreségales
à un, les autres sont nulles. Or la forme
quadratique
des moments d’inertie du nuageN(J ) ,
associé à lacorrespondance
le centre de
gravité
du nuage estassociée est donc
égale
à Les valeurs propres desont
égales
à un(ou nulles) ,
parconséquent
celles de MoR sontégales
nulles.,P
4.1 :
Comparaison
des valeurspropres
descorrespondances
I x J et I x CPour les valeurs propres
de l x J et l x C, p
étant le nombre dequestions,
on a :Pour les taux
d’inertie,
notéstaux(J)
ettaux(C)
extraits par les spremiers
facteurs des nuagesN(J)
etN(C) :
Remarques
Le
regroupement
deplusieurs
modalités deréponses,
comme toutregroupement
enclasses,
diminue les valeurs propres. Le nombre de modalitésregroupées
n’intervient pas. Si le nombre p dequestions
estgrand,
leregroupement
de modalités d’unequestion
diminue peu les valeurs propres.Mais si on a effectué des
regroupements
dans les pquestions,
entre lesvaleurs propres T de I x J et J de I x C, on a :
Et on ne
peut
rien conclure deplus ;
il en est de même pour le sens de variation des taux d’inertie extraits par les spremiers
facteurs.4.2 :
Comparaison
des facteurs sur I descorrespondances
i x J et i X C-
L’angle
8 entre les sous-espacesengendrés par
les spremiers
facteurs sur I des nuages
N(J)
etN(C)
est tel que :-
L’angle 9
entre lessous-espaces engendrés
par les facteurs de rang s,S+1;.... , s+t
est tel quealors sin6
4.3 :
Regroupements
de modalitéspour plusieurs questions
On
généralise
immédiatement les résultatsprécédents
dans lecas où l’on effectue des
regroupements
dans un nombrequelconque p’
dequestions.
Pour les valeurs propres, on a :
L’angle
6 entre les sous-espacesengéndrés
par les spremiers
facteurs est tel que :
Commentaires
Les
majorations
obtenues sont d’autantplus petites
que les valeurs propres del’espace
factoriel considéré sont bienséparées
desautres et que le nombre de
questions
modifiées estpetit
parrapport
aunombre total de
questions, Remarquons
que, le nombre de modalités regrou-pées
dans unequestion
n’intervient pas dans lesmajorations,
et que les dernières sontidentiques
à celles obtenues dans l’étude del’ajout
ou duretrait d’une
question.
Elles sontoptimales,
onpeut
donc en conclureque le
regroupement
de modalitésd’une question peut entraîner
unepertur-
bation del’analyse aussi importante
que sasuppression.
Ces bornespermettent
très rarement de conclure à-la stabilité des
facteurs ;
cephénomène
n’estpas
surprenant puisque
nous avonsdéjà montré [
5]
quel’analyse
des cor-respondances
est peuperturbée,
seulement si les élémentsregroupés
sontproches.
Or des modalités s’excluant mutuellement ne sontjamais proches (cf. § 1.1).
Les tableaux de données mis sous formedisjonctive complète
sont donc sensibles aux
regroupements
de modalités deréponses. Cependant,
il ne faut pas en conclure
qu’il
est nécessaire demultiplier
le nombre demodalités de
réponses,
cettepratique risquant
de faireapparaître
des fac-teurs
parasites.
On remarque deplus
quesi,
desregroupements
sont effec- tués dans toutes lesquestions,
tous les facteurspeuvent changer,
danscertains cas ils
peuvent
mêmedisparaître (voir
parexemple [ 2 ]
page21).
5 - RAPPELS : COMPARAISON DES ELEMENTS PROPRES DE DEUX ENDOMORPHISMES
SYMETRIQUES
5.1 :
Définition :Soit
un espace euclidien de dimension n. Soient E et F deux sous-espaces de~ ayant
mêmedimension,
onappelle angle
entre E et Fl’angle
maximum entre un vecteur de l’un etsa
projection orthogonale
sur l’autre.(Pour
définir laposition
entre deux sous-espaces, voirC
4~j) .
5.2 :
Comparaison des
élémentspropres
desendomorphismes symétriques
A et C = A+B
-C 5
Soient A, B, C trois
endomorphismes symétriques
de~
telsque C = A+B, dont les valeurs propres
respectives
sont notées« s
sS s
s etYs
set
rangées
par ordre décroissant. Alors :5.2.1 :
Comparaison
desvaleurs propres
5.2.2 :
Comgaraison_des sous-esgaces invariants
- Soit 6
l’angle
entre les deux sous-espacesengendrés
respec- tivement par les rpremiers
vecteurs propres de A et C.cette borne est
optimale.
- Soit 8
l’angle
entre les deux sous-espacesengendrés
respec- tivement par les vecteurs propres de rangk,..., k+~
de A et C :5.3 :
Comparaison
des élémentspropres
desendomorphismes symétriques
A et C =
A+B,
avec Bde rang
un1
Soient A, B, C trois
endomorphismes symétriques
de2
avecC = A+B et B de rang un et non
négative.
la direction propre de B associée à la valeur propre non
nulle, Ts (resp. 0s) l’angle entre 1
Z1
et le sous-espace engen- dré par les spremiers
vecteurs propres de C(resp. A).
On a :5.3.1 :
Comparaison des valeurs propres
5.3.2 :
Comparaison des sous-espaces invariants
- Soit 6
l’angle
entre les deux sous-espacesengendrés
respec- tivement par les rpremiers
vecteurs propres de A et C.Ces deux bornes sont
optimales.
- Soit 6
l’angle
entre les sous-espaces invariants de C et A associés aux valeurs propres de rangs,...,s+£ .
Soit Y(resp. ~) l’angle
entre
[z]
et ce sous-espace invariant de C(resp. A),
on a :BIBLIOGRAPHIE
[ 1] BENZECRI,
J.P. etcollaborateurs, L’Analyse des données,
Tome2,
PARIS, Dunod,
1973.[ 2]
BENZECRI,J.P.,
Lesscrutins
en 1967à l’Assemblée des Nations Unies,
ISUP, PARIS, 1974,
Ronéo.[ 3]
BENZECRI,J.P.,
Surl’analyse des tableaux binaires associés à
unecorrespondance multiple,
ISUP, PARIS, 1970,
Ronéo.[4] DEMPSTER,
A.P.,Elements of continuous multivariate analysis,
NEW
YORK,
AddisonWesley,
1969.[5] ESCOFIER,
B. et LEROUX,
B.,Etude de trois problèmes de stabilité
en
analyse factorielle,
PARIS,
Publications de l’Institut deStatistiques,
à
paraître
1974.[6] ESCOFIER,
B. et LEROUX, B.,
Mesurede l’influence d’un descripteur
sur