J EAN -F RANÇOIS B ALLIF G EORGES L ERESCHE
Paramétrisation et analyse des correspondances
Mathématiques et sciences humaines, tome 65 (1979), p. 23-50
<http://www.numdam.org/item?id=MSH_1979__65__23_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1979, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
PARAMETRISATION ET ANALYSE DES CORRESPONDANCES
Jean-François
BALLIF et GeorgesLERESCHE 1
1. INTRODUCTION
Le
questionnaire
est,depuis longtemps,
leprincipal
outild’investigation
en sciences humaines.
Depuis
l’avènement de l’ordinateur se sontdéveloppées
des méthodes de traitement d’autant
plus puissantes
que lalongueur
ou la difficulté des calculs ne sontplus
desobstacles,
pasplus
que le nombre des variables(questions)
ou que legrand
effectif des échantillonsétudiés,
ce dernier élément étant un facteur
important
pour assurer la validité des résultats. La libertéméthodologique qui
en découle rendtoujours plus
né- cessaire la réflexion sur les méthodes elles-Tnêmes et sur les liensqui
existent entre elles.
Instruments destinés à "mesurer" des dimension
humaines,
les ques- tionnaires sedistinguent
des instruments ouappareils
de mesurephysique
par l’absence d’étalon a
priori.
Leurs utilisateurs sont doncfréquemment
confrontés à des
problèmes
demétrique.
Un certain nombre de méthodes ontété
proposées
pour tourner cettedifficulté,
méthodesqui dépendent
d’ail-leurs souvent de la forme du
questionnaire.
Nous considérons ici la situation suivante: une
population
P estsoumise à un
questionnaire
consistant en p items1. Université de Lausanne, chaire de
Mathématiques
des Scienceshumaines;
recherches sur Za
genèse
du choixprofessionneZ
chez lesfuturs
bacheliers(FNRS, n2
l’7430.72 SR;requérants:
les Prof. J.-B. Dupont et G.Leresche)
et sur l’évaluation des
psychothérapies
brèves(en
collaboration avec lapoliclinique psychiatrique universitaire,
Prof. P.-B.Schneider).
formant l’ensemble I , pour
lesquels
on propose le même ensemble de moda- lités deréponse
S ={ si Il S 2 ,
... ,5 r }
.Chaque
item constitue ce quenous
appellerons
une observable. Selon la nature de S, les P observa- bles pourront être nominales -lorsque
S est sans structure apriori
-,ordinales -
lorsque
S admet apriori
une structure d’ordre -,numériques
-
lorsque
S peut seplonger
dans R(muni
de sastructure).
Souvent S est une échelle destinée à mesurer un
intérêt,
uneapti- tude,
undegré d’engagement,
unefréquence
d’utilisation etc... et admet parconséquent
une structured’ordre, laquelle
peutcependant
n’être quepartielle,
comme nous le voyonsplus
loin(paragraphe 5).
On aimerait voir dans
quelles
conditions on peut utiliserl’analyse multivariée,
et notammentl’analyse factorielle,
pour traiter un tel ques-tionnaire. Or
l’analyse
multivariéeprésuppose
engénéral
que les observa- bles soientnumériques;
nous devons donc définir uneapplication ~
de Sdans R afin de transformer nos observables ordinales en observables nu-
mériques.
Remarquons ici que notre
problématique
serapproche
de cellequi
adébouché sur les nombreuses méthodes dites de muZt2d2mens2onaZ
scaling,
dans
lesquelles
unephase
de "métrisation" des donnéesprécède
celle de ré-duction ou
d’analysel.
Paramétrer les items d’un
questionnaire,
c’est en fait considérerque S constitue une
partition
en classes d’un ensemble S’ - ensembledes réactions
possibles
aux items-stimuli -, et attribuer àchaque
classeune valeur centrale. Si l’on
appelle Xi
l’observable ordinale fournie par le i èmeitem,
il luicorrespond
une observableimplicite X! ,
1 numé-rique,
dont l’ensemble des scores S’ s’identifie à R .On.peut
donc con- sidérer le schéma suivant:1. Voir par
exemple Torgerson (8),
pages 247 à 297.Le
problème
est dedéfinir ~
defaçon
que les observablesparamé-
trées
yoX. i
soientcompatibles
d’une manièreoptimale
avec leshypothèses
éventuelles faites sur les observables
sous-jacentes X’
ou avec lesobjec-
tifs
descriptifs qu’on
s’est fixés.Notons ici
qu’en envisageant
uneparamétrisation
de l’ensemble des modalités deréponse, indépendamment
desitems,
nous supposonsqu’une
moda-lité est
appréhendée
de la mêmefaçon, quel
que soit l’itemqui
lui estconfronté. Cette
hypothèse,
si elle n’est pas formellementréaliste, -
unemodalité pouvant
avoir,
face à certainsitems,
des connotationspsychologi-
ques différentes - n’est
cependant
pas tropréductive,
pour autantqu’on
suppose une
homogénéité
designification
desquestions
et unehomogénéité
de
compréhension
des modalités deréponse.
D’autre part la variation d’in-terprétation
des différentes modalités est certainementplus grande
encoreentre les individus
qu’entre
les items. Pourtant, notreobjectif
étant decomparer les individus aussi bien que les
items,
la nécessité d’un référen- tiel commun nous conduit àadopter
uneparamétrisation indépendante
de cesdeux éléments.
Par cette
position
nous nousdistinguons
dupoint
de vue de Guttman(4)
et de sa "scaleanalysis" (voir
aussi Torgerson(8),
pages 338 à345),
sur
laquelle
nous reviendrons etqui envisage
laparamétrisation
dechaque
modalité pourchaque
itemséparément.
Il est vrai que dans les situationsenvisagées
par Guttman on ne suppose pas un ensemble S de modalités deréponse
commun à l’ensemble desitems;
chacun de ceux-ci peut avoir son propre ensemble de modalités. D’autre partl’objectif
de Guttman est bienplutôt
un classement dessujets
sur une échelle unidimensionnellequ’une paramétrisation
des modalités pour un usage ultérieur. Dans le cas de Gut- tman, laparamétrisation
est une fin ensoi;
pour nous elle est uneétape
sur la voie des traitements multivariés.
En revanche, cette
position
nousrapproche
des méthodes issues des mo- dèlesgénéraux
de Thurstone(La
loi dujugement cathégorique,
voir Thorger-son
(8), chapitre 10),
enparticulier
de celles des "intervalles successifs"(voir
parexemple
Gulliksen(3)), lesquelles
cherchent àassigner
àchaque
modalité deréponse - indépendamment
des items - un intervalle réel. Il faut notercependant
que ces dernières méthodes reposent toutes sur deshypothè-
ses relatives aux distributions des observables
sous-jacentes
X’ - suppo-1
sées
généralement gaussiennes.
Or il peut arriver que de telles
hypothèses
ne soient pas soutenables- différences évidentes entre distributions
d’items,
influenceprépondéran-
te d’éléments extérieurs
s’opposant
au caractère normal des distributions...Dans ces conditions la
paramétrisation
peut être basée sur desobjectifs descriptifs.
La
paramétrisation
étant uneétape
dansl’analyse
desdonnées,
doncdans la
description
d’une certaine réalité reflétée par unquestionnaire,
onpeut
choisir, parmi
lesapplications
de S dans R , cellequi
réalise lemieux certains éléments de cette
description.
On se trouve ici dans la situ-ation du
biologiste qui,
désirant étudier aumicroscope
une coupe d’un cer-tain
tissu,
va utiliser différentescolorations,
afin d’en mieuxséparer
lesdiverses composantes; comme nous, il confère à ses données un
éclairage
fa-vorable,
lié auxobjectifs
de sa recherche.Notre propos,
ici,
est deprésenter
une méthode deparamétrisation
liée à un
objectif descriptif.
En elle-même cette méthode n’est pas nouvelle(voir
par exemple Nishisato et Arri(6)), mais,
cequi
nous intéresseraici, après
en avoir donné ledéveloppement théorique,
c’est de mettre en évidenceses liens avec
l’analyse
descorrespondancesl,
ainsi que leursconséquences
sur le
plan
del’interprétation.
Les réflexions
qui
vont suivre nous ont d’ailleurs étéinspirées
par laphrase suivante,
lue dans le livre de Benzécri surl’analyse
des corres-pondances (1), à
la page 484: "Les distances entre notes dans leplan
des .deux
premiers facteurs
sont sans doute la meilleure mesurepsychométrique
de distance dont on
puisse disposer."
Cherchant àapprofondir
cetteproposi- tion,
nous sommes tombés sur la méthode que nous nous proposons d’étudier.2. POUVOIR SEPARATEUR D’UNE PARAMETRISATION
L’un des
objectifs descriptifs
pouvantprésider
à uneparamétrisation
est demettre en
évidence,
s’ilexiste,
un ordre sur l’ensemble des items. Pour le décrire au mieux on utilisera laparamétrisation qui
a ce que l’onpourrait appeler
le meilleurpouvoir séparateur,
en moyenne, sur les items. Eneffet,
comme nous le voyons
plus
loin(paragraphe 3),
s’il existe un ordre sur1. Pour une
description
détaillée de cette méthoded’analyse
desdonnées,
voir par exemple Benzécri
(1)
ou Lebart et Fénelon(5).
un ensemble d’observables
paramétrées,
c’est au niveau des moyennes que l’on reconnaît cet ordre;l’ordre,
s’ilexiste,
sera donc d’autantplus
"visible"que les moyennes des
items, après paramétrisation,
serontplus dispersées.
Disposant
pour p items - observables ordinales -, des effectifs des choix de chacune des r modalités de’réponse,
nous avons le tableau T :où n.. est l’effectif de la ré- ij
ponse
S.
J à l’itemI..
1Par rapport à l’ensemble des
réponses
données au ques-tionnaire, chaque couple ( Ii ,
iS. )
J a unefréquence
Un item
I,
1 a alors unpoids
et une modalité S. 1 a unefréquence
d’utilisation Notonsqu’en
l’absence de non-réponses, chaque
item a le mêmepoids
Nous
appellerons
distributionbaryeentr2que
la distribution de fré-quences et distribution
marg2naZe
la dis-tribution des
poids
Le
problème
est de trouver uneparamétrisation ~
rendant maximale laquantité
P =Var(M) ,
mr1alce de la suiteM = ( ml ,
1m2 , ... ,
2m )
p desmoyennes des observables
paramétrées $oX2 ’
... , oX , P munie dela distribution
marginale gr.
«Appelons
b.l’image (S.)
d’une modalité S. et G la suiteJ J J .
( bl ,
1b2 ,
2 " ... ,b )
r munie de la distributionbarycentrique g .
SNous considérerons les matrices suivantes:
matrice des
fréquences
dechaque couple
(Ii ,
i 9Si )
J par rapport à l’ensembledes
réponses
données auquestionnaire
matrice-ligne
du vecteur unité dans!R p
matrice-ligne
du vecteur unité dans(Rr
matrice-ligne
de la distributionmargi-
nale des
poids
des itemsmatrice-ligne
de la distributionbary- centrique
matrice
diagonale
de la distributionmarginale
matrice
diagonale
de la distribution ba-rycentrique
matrice-ligne
de laparamétrisation
matrice-ligne
des moyennes des itemsaprès paramétrisation
Entre ces matrices nous avons les relations suivantes:
D’autre part,
si ~
et~’
sont deuxparamétrisations,
nous avons, defaçon immédiate,
les deuximplications
suivantes:Notre
problème
sera donc de maximiser P engardant
constante la va- riance de G ainsi que sa moyenne, ce dernierpoint équivalant
àgarder
constante la moyenne de M . Nous nous proposons de rechercher la solution satisfaisant à la condition: G centrée et
réduite;
ou, si l’onpréfère:
Var(G) =
1 etMoy(G) =
0 .Nous devons donc maximiser la
quantité
sous les conditions
Notons que ceci revient à
maximiser,
sous la conditionMoy(G) =
0 , le rapportV 2013 ,
oùV
etV
peuvents’interpréter,
dans un certain sens,T
E Tcomme des
variances, l’une, VE , entre
lesitems, l’autre, VT ,
totale. Eneffet,
s i l’on considère la variab le aléatoire X : ~ ~ es t l’en- semble I x S muni desprobabilités p..
J et X est définie comme suit:alors on a:
D’autre part,
Var(X)
peut sedécomposer
enSi.l’on
appelle a. 2 la variance de l’item
I, 1
pour laparamétrisation
i L
on a:
On peut donc écrire
V T = VI
+VE
ou, si l’onpréfère, Var(G) = VI
+ P ,ce
qui implique
enparticulier:
D’autre part, la relation
(7) implique
que maximiser--
P sous la condition
(10)
revient à maximiser le rapportC’est cette
interprétation qu’on
trouvegénéralement
chez les auteurss’étant intéressés à cette
méthode,
etqu’ils
ontbaptisée "optimal scaling"
(voir
parexemple
Nishisato et Arri(6)).
Certains,
commeBradley ,
Katti et Coons(2)
maximisent le rapportRevenant à notre
problème
nous posons:On peut voir cette transformation comme le passage à une base
orthonormée,
de manière que la variance de G soit
égale
à b’tb’ .
(9)
s’écrit alors:tandis que
(10)
et(11)
deviennent:Il suffit maintenant de poser:
pour se trouver devant la situation tout-à-fait
classique
de maximiserP =
b’tCCtb’
sous la condition(14),
avec la conditionsupplémentaire (15).
On sait que P sera maximum sous la condition
(14)
si l’onprend
pour b’ le vecteur propre detCC correspondant
à laplus grande
valeur propreÀ ,
et que, deplus,
cette valeur maximale de P seraprécisément À (voir
par
exemple
Lebart et Fénelon(5),
page200).
Assurons-nous de lacompatibi-
lité de ce résultat avec la condition
(15).
Si b’ est vecteur propre de
tCC
nous avons:ce
qui
peut s’écrire:qu’on prémultiplie
parUs :
devient,
en utilisant la relation(3):
puis
la relation(5):
et encore la relation
(3):
ce
qui
peut s’écrireAinsi,
pour toute valeur propre différente de 1 , la condition(15)
est
compatible
avec le fait que b soit vecteur propre detCC.
Nous devons encore remarquer que la matrice
tCC qui
s’écrit:est celle dont les vecteurs propres nous
fournissent,
dansl’analyse
descorrespondances
du tableau T - ou de la matrice A -, les facteurs surl’ensemble des colonnes: si v est un vecteur propre
ligne
detCC
et si1 ~
alors on obtient le facteur }) réduitcorrespondant
par:Nous avons donc établi que Za
paramétrisation o f frant
le meilleur pou- voirséparateur
en moyenne sur lesitems,
etcorrespondant
à la condition" G centrée et
réduite",
est donnée par lepremier facteur
non trivial(c’est-à-dire
relatif à laplus grande
valeur propre différente de1 )
ré- du2t del’analyse
descorrespondances appliquée
au tableau T de distribu- tion desréponses.
D’autre part, le
principe barycentrique (voir
Benzécri(1),
tomeI,
page
25)
nous dit que lepremier facteur,
nonréduit,
sur l’ensemble des items nousfournit
la matrice m des moyennes desitems,
pour cetteparamé-
trisation.
Ce rapprochement entre
l’analyse
descorrespondances
et les méthodes ditesd "’optimal scaling"
nousparaît
être d’ungrand intérêt,
de par le fait que l’un et l’autre s’en trouvent éclairés d’unjour
nouveau. Eneffet,
si certains résultats
exposés
dans le livre de Benzécri surl’analyse
descorrespondances (1)
permettent uneinterprétation plus approfondie
de notreparamétrisation -
nous pensons notamment à certain théorème relatif à l’or- dre latéral surlequel
nous nous arrêtonsplus
loin -, cette dernière don-ne un sens nouveau à la
métrique
du chicarré,
surlaquelle
reposel’analy-
se des
correspondances.
3. SUR L’INTERET DE LA RELATION ENTRE POUVOIR SEPARATEUR ET ANALYSE DES CORRESPONDANCES.
3.1. Ordre sur les items et ordre sur les modalités de
réponse
S’il est
toujours possible
d’obtenir laparamétrisation
rendant maximal lepouvoir séparateur,
il peut arriverqu’elle
n’aitguère
de sens: destinée àmettre en
évidence,
d’une manièreoptimale,
un ordre sur l’ensemble desitems,
elle n’a sa raison d’être quelorsque
cet ordre estprésent
naturel-lement,
d’une manièreintrinsèque,
dans les données. On devra donc s’assurer que l’ordre exhibé n’est pas un artefact lié à laméthode,
mais bien un élé-ment de la structure des données.
Avant de
parler
directement de cequ’est
un ordre naturel sur un en-semble
d’items,
il nous faut aborder la notionplus générale
d’ordre entre distributions deprobabilités -
ou defréquences
sur un ensemble ordonné.Considérons un ensemble
S = { SI S2 ... Sr} ordonné,
et surS deux distributions de
probabilités
a et b . Poursimplifier
l’écriturenous
adoptons
les notations :Appelons Fa , respectivement Fb ,
10l’application
desprobabilités
cumuléesa b
de a ,
respectivement
b ;L’ordre usuel entre
F
a etF ,
b défini par :si et seulement si
nous fournit un ordre sur les distributions de
probabilités.
De la même
manière,
si S est un ensemble de modalités deréponse
etsi a et b sont les distributions de
fréquences
relatives à deux itemsIa
a et1
9 nous pouvons définir un ordrei
- entre les items par :"à droite" de
1 )
si et seulement sia
Si,
deplus,
on considère uneparamétrisation ~
croissante de S , nousavons
l’implication :
où
ma
etmb
sont les moyennes deIa et 1
~ calculées sur la base dela
paramétrisation ~ .
Considérons encore
Xa et Xb
les observablesnumériques sous-ja-
centes, associées - comme
expliqué
au paragraphe 1 j àI a et 1 b
SiXa
et
Xb
ne diffèrent que par la moyenne(exemple : Xa et Xb sont
deuxobservables distribuées normalement,
d’écart-type
o et de moyennesm
a et
m respectivement),
alors nous avons les deuxéquivalences :
Nous voyons donc que l’ordre défini à
partir
des fonctions de fré-quences cumulées est à rapprocher de l’ordre entre les moyennes d’observa- bles
paramétrées,
pour autant que lacomparaison
des moyennes ait tout sonsens, c’est-à-dire que les autres
paramètres
de distribution soient inva- riants entre les items. Il faut toutefois remarquer que cette invariance n’est pas une condition nécessaire à la doubleéquivalence ci-dessus; lorsqu’
un ensemble
d’items I1 , I 2 ,
9 ... ,I p }
est tel que:,
paramétrisation
croissante de S ;sont les moyennes des observables
numériques sous-jacen-
tes associées à
Ii
1 etI,
Jrespectivement,
etmi
1 et m. J sont les moyennes, pour laparamétrisation w,
des items I. i et 1.respective-
J
ment)
nous dirons que les itemsI 1 I2 ,
... ,I P
ne diffèrent essent2eZ-lement que par la moyenne.
’
Il nous faut encore dire que l’ordre entre distributions de
probabi- lités,
tel que nous l’avons défini àpartir
des fonctions deprobabilités cumulées,
n’est autre que l’ordre ditlatéral,
introduit par Benzécri(1)
(tome
I, page261).
L’équivalence
de ces deux ordres estintéressante, puisqu’elle
nouspermet
d’appliquer
à notreproblème
deparamétrisation
le théorèmesuivant,
démontré dans Benzécri
(1) (tome
I, page279), qui
peut s’énoncer ainsi:Si les colonnes
(respectivement
leslignes)
d’un tableau de corres-pondances représentent
les éléments d’un ensemble ordonné S , et que sur l’ensemble L deslignes (respectivement
descolonnes) -
dont les éléments peuvent être considérés comme des distributions deprobabilités
sur S -,l’ordre latéral est
total,
alors lefacteur
sur L’ensemble S(respective-
ment
L ), relatif à
laplus grande
valeur propredifférente
de1 ,
est unefonction
croissante de S(respectivement
L ~ .Transposant
ce résultat à notreproblème
deparamétrisation,
et nousappuyant sur les considérations faites en début de
paragraphe,
nous obtenonsla
proposition
suivante:Si
1= {Il) 12’ ... , l p } des
items d’unquestion-
utilisant l’ensemble
ordonné
S - ~ S 1 , S 2
, ..., gS r }
de modali- tés deréponse,
est tel que luicorresponde
un ensemble X ={ X , X ,
1 2...,
X }
p d’observablesnumériques sous-jacentes -
dont lesS .
J consti-tuent une
partition
en classes - nedifférant
essentiellement que par la moyenne, alorsl’analyse
descorrespondances appliquée
au tableau de distri- bution desréponses fournit
desfacteurs
de rang 1qui
redonnent l’ordredes modalités et l’ordre des moyennes.
Ce résultat est
d’importance puisqu’il constitue,
d’une certainemanière,
unegénéralisation
de celui obtenu par Guttman(4)
surl’analyse
des
scalogrammes (tableau
dont chaqueligne
estcomposée uniquement
de 1et de
0 );
Guttman a montré en effet quelorsque, après permutation
de li-gnes et de
colonnes,
unscalogramme -
ouplutôt
les 1qu’il
contient - ala forme d’un
parallélograrnne,
alorsl’analyse
d’un telscalogramme - qui
n’est autre, comme nous le voyons
plus loin, qu’une analyse
des correspon- dances - fournit des facteurs de rang 1qui
sont des fonctions croissantes de l’ensemble deslignes (respectivement
descolonnes),
muni de l’ordre dé-fini par le
parallélogramme.
Nous verronsplus
loin(paragraphe 5) qu’il
n’est pas
impossible
que les résultats obtenus par Guttman sur les facteurs de rangsupérieur
soientgénéralisables
de la mêmefaçon.
3.2. La
métrique
du chi carréEtant donné trois distributions de
fréquences
ou deprobabilités
a , b , csur un ensemble S =
{ Si e S2 ,
... ,S },
r onappellera
distance du chiearré de centre a entre b et c , que l’on notera
d a ( b , c ) ,
laquantité:
(où
l’on notea. , b i il c. les fréquences -
ouprobabilités -
J J J
’
Rappelons
quel’analyse
descorrespondances
est une méthoded’analy-
se factorielle
qui
mesure les distances entrelignes (respectivement
colon-nes)
d’un tableau dedépendance
par lamétrique
du chi carré de centre laligne (respectivement
lacolonne) marginale
dutableau, qui
constitue d’ail- leurs pour cettemétrique
lebarycentre
des distributions deslignes (res-
pectivement
descolonnes).
Cette
métrique, qui
n’est pastoujours
clairementjustifiée,
trouveici une nouvelle
interprétation:
c’est cellequi apparaît
naturellementlorsqu’on
cherche à donner aux éléments des colonnes d’un tableau de contin- gence, despoids b.
J dont les sommes,pondérées
par lesp.. -
1J élémentsdu tableau
exprimés
enfréquences -
et en nombreégal
à celui deslignes,
soient de variance maximale.
Il est bon de savoir aussi que,
lorsqu’on pratique 1"’optimal scalings
- ou
paramétrisation
à meilleurpouvoir séparateur
-, on mesure, enfait,
les distances entre modalités de
réponse
par lamétrique
du chi carré decentre
gI ,
distributionmarginale; ensuite,
faisantl’hypothèse
que l’en- semble S des modalités deréponse
estunidimensionnel,
on cherche le meil-leur
ajustement,
au sens des moindrescarrés,
de cesdistances,
mesurées surnos
données,
au modèle unidimensionnel.4. LA THEORIE DE GUTTMAN
Dans ce
qu’il appelle
"scaleanalysis"
Guttman(4)
considère la situationsuivante: N
sujets
sont soumis à unquestionnaire -
ou test - de p itemsI1 ,
9I2 ,
...Ip ;
... ; àchaque
itemIi
est associé un ensembleSi
deri
modalités de
réponse
on a donc au totalmodalités. Les données constituent donc un tableau T à N li- gnes et r colonnes - que nous
désignerons,
poursimplifier
lesnotations,
par S
1 ,
S ,
... , yS -
dont un élémentt ,
vaut 1 si lehème
su-1 2 r hj
jet
a choisi la modalité S. et 0 sinon.J
Guttman se propose alors de trouver une
paramétrisation ~ :
: S + Rqui
soit la meilleurepossible
dans le sens suivant: pourchaque
personnesimultanément,
les modalités retenues par cette personne de- vront avoir par ~ desimages
aussiproches
quepossibles
les unes des au-tres, et aussi différentes que
possible
des modalités non retenues. En d’au-tres termes il cherche à maximiser la variance de l’observable construite
par rapport à la variance totale
Vt
du tableau T pour laparamétrisation
4’ : .ce
qui
revient à soumettre àl’analyse
des correspondances le tableau T . Guttman s’intéresse alors à cequi
se passelorsque
l’ensemble desitems,
ouplutôt
celui des modalités deréponse -
chacune d’elles pouvant être considérée comme un itemdichotomique
-, constitue cequ’il appelle
une échelle
parfaite,
c’est-à-dire que les éléments non nuls du tableau T forment - éventuellementaprès permutation
delignes
et de colonnes - unparallélogramme;
en d’autres termes,lorsque
sur S ,l’ordrel * ,
définipar:
si et seulement si
est
total,
de mêmequ’est
total sur l’ensembledes
sujets,
l’ordre:si et seulement si
Il obtient les résultats suivants: le
premier
facteur sur S(res- pectivement P )
est une fonction croissante de S(respectivement
deP )
muni de l’ordre* .
C’est ce que Guttmanappelle
lacomposante métr2que.
Sur S elle constitue une
paramétrisation.
Sur P elle donne, à une cons-tante
multiplicative près,
les scores obtenus par lessujets,
pour cetteparamétrisation, après
sommation sur l’ensemble des items.Les facteurs suivants sont des oscillations
successives;
ainsi le se-cond facteur est une fonction
polynômiale
dedegré 2 , en
1 dupremier
facteur; le
troisième,
une fonctionpolynômiale
dedegré
3 , deforme ’,
du
premier facteur;
ainsi de suite. Deplus, d’après
Guttman, les extremade ces
fonctions,
ou, si l’onpréfère,
leurs sommets, sontindépendants
desitems utilisés et des échantillons testés.
1. Il
s’agit, rigoureusement,
d’une relation depréordre ; néanmoins,
danstout ce
qui suit,
comme dans leparagraphe
2, nousparlons systématique-
ment
d’ordre,
pour ne pascompliquer
inutilementl’exposé,
la différenceentre ces deux notions ne
jouant
aucun rôle dans ce contexte.Les facteurs
2 , 3
et 4 ont reçu de Guttman desinterprétations précises.
Ainsi le second facteur serait lacomposante
d’intensité. Les ren-seignements
fournis par cefacteur,
sur P , seraient doncéquivalents,
enquelque
sorte, à laréponse
à laquestion:
"Quelle
est la force de vos sen- timents là-dessus ? "Guttman
interprète
le facteur 3 comme lacomposante
de clôtupe(
" Aquel point
êtes-vous sûr que votreopinion
soit bien formée ? ").
Le facteur
4 , enfin,
serait lacomposante
d’involution(
tt Avez-vous dû réfléchir
longtemps
avant derépondre ?
").
La
question
que l’on peut se poser est la suivante: dansquelle
me-sure ces résultats sont-ils
applicables
àl’analyse
d’un tableau de distri-bution des
réponses
à unquestionnaire ?
Nous avonsdéjà
vu(paragraphe 3.1)
que, dans le cas où l’ordre latéral sur les items est total, le
premier
fac-teur est une fonction croissante de S . Au vu de certains résultats d’ana-
lyses (voir paragraphe
5.1 et Benzécri(1),
tomeII, page 482),
on constateque les facteurs de rang
supérieur
à 1constituent,
comme dans la situa-tion
envisagée
par Guttman, des oscillations successives. Cetteparticulari-
té nous donne un moyen de contrôler le caractère unidimensionnel de l’ensem- ble des modalités de
réponse,
et de celui des items par rapport aux modali-tés,
ou, si l’onpréfère,
de confirmer laprésence
d’un ordre naturel surl’ensemble des items.
5. APPLICATIONS
5.1 La
paramétrisation d’un questionnaire
de valeursprofessionnelles
Dans le cadre d’une
enquête
sur lagenèse
du choixprofessionnel
desbacheliers en Suisse une série de
questionnaires
et de tests ontété soumis à trois
reprises,
en1974,
’75 et’76,
à un échantillon decinq
cents candidats au baccalauréat. Parmi les instruments
utilisés,
certainsont été élaborés
spécialement
pour cette recherche. C’est le cas notammentd’un
questionnaire
relatif aux-valeursprofessionnelles,
comportant quarante items et dont nousreproduisons partiellement
lapremière
page ci-dessous.1. Recherche effectuée par l’Institut de
psychologie appliquée
de l’Univer-sité de Lausanne, et financée par le FNRS