D OMINIQUE J. F ERRAND J EAN -M ARC M ARTEL
Le choix multicritère des items d’une échelle de mesure
Mathématiques et sciences humaines, tome 89 (1985), p. 35-59
<http://www.numdam.org/item?id=MSH_1985__89__35_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1985, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LE CHOIX MULTICRITERE DES ITEMS
D’UNE
ECHELLE DE MESUREDOMINIQUE
J.FERRAND1
JEAN-MARC
MARTEL2*
La recherche est sans cesse confrontée dans ses tentatives
d’opérationnali-
sation à
l’épineuse question
de la mesure de sesconcepts.
La constructiond’une
échelle àpartir d’items multiples
constitue une des méthodesprivi- légiées parmi
lesplus
usitées deconception d’un
instrument de mesure.La démarche de construction
d’une
échelle(peu importe d’ailleurs qu’elle
soit de
type Guttman, Likert, sémantique
différentielle ou tout autre modè- lesimilaire) consiste,
dans unpremier temps,
àgénérer
une multituded’items
àpartir
de la définition duconcept
et, ensuite à chercher à con-férer à
l’instrument
de mesure, constitué par un ensembled’items,
unequalité métrologique
satisfaisante enprocédant
à uneanalyse
des items.L’analyse
des items est le processus parlequel
on sélectionnequelques
items
parmi
un ensembled’items
candidats àpartir
de critèresmultiples
defiabilité et de validité. Les
critères
de validité testent sil’instrument
1 Professeur à
l’Université
duQuébec
à Hull2 Professeur à
l’Université
Laval(Québec)
* Les auteurs remercient M. Jean Couillard pour sa collaboration à la pro-
grammation
del’algorithme
ELECTRE. Cette recherche a été financée con-jointement
par le F.I.R. del’Université
duQuébec
à Hull et le FondsF.C.A.C.
(EQ-2594).
mesure ce
qu’il
est censé mesurer. Lescritères
defiabilité analysent si,
toutes choses étant par ailleurs
égales, l’instrument
estsusceptible d’é-
tablir des mesures
analogues d’une
fois àl’autre.
L’analyse
des itemscependant
pose unproblème
délicat.Certes,
la fiabi- litécroît
avec le nombred’items,
maischaque
nouvel itemaccroît
la durée del’expérimentation,
et legain marginal
de fiabilité estlargement
dé-croissant. Pour
dissiper
cettedifficulté,
on cherche à retenir leplus petit
nombre suffisantd’items.
En
l’absence
de méthodedéfinie,
le choix des items àpartir
descritères multiples
de fiabilité et de validité était laissé àl’arbitraire
del’ana- lyste.
Pour remédier à cettelacune,
nous proposonsd’utiliser
la méthode ELECTRE IIqui permet
de classer les items candidats àpartir
de relations de surclassement.Cette méthode
exige
toutefois que soitprécisé
lerôle joué
par chacun des critères dansl’analyse.
La détermination del’importance
relative des critèrespermet
alors de concevoir uneprocédure d’analyse
et de choix sys-tématique
desitems,
que nous examinerons à travers uneapplication.
I -
FIABILITE,
VALIDITE ET ANALYSE DES ITEMSSelon la théorie de la
fiabilité, l’utilité d’un
instrument de mesure dé-pend
de sacapacité
à éviterd’enregistrer
des erreurs. La fiabilité estune estimation de la
performance
del’instrument
de mesure évaluée àpartir d’un
coefficient de corrélation. Plusprécisément,
le coefficient de fia- bilitécalculé
àpartir
de deux mesuresparallèles
X etX’ s’établit
commele
rapport
de la covariance entre X etX’
sur leproduit
de leurécart-type
respectif:
Le
rapport (1)
montre quel’importance
del’erreur
diminue la valeur ducoefficient de fiabilité. De
façon opérationnelle,
on calcule le coeffi- cient de fiabilité suivant laméthode
du test-retest ou celle del’équiva-
lence
(Bohrnstedt, 1969).
La méthode du test-retest est le
plus
souvent exclue del’analyse
en raisonde ses nombreux inconvénients: il est en effet
impossible
decontrôler l’effet
deschangements qui peuvent
intervenir entrechaque
administration del’instrument
de mesure, etl’apprentissage provoqué
par unepremière pratique
del’instrument.
Onpréfère
engénéral
à cetteméthode,
celle del’équivalence qui comporte
deuxtypes d’approche:
la mesure de bissection(split-half)
dont le coefficient de fiabilité est leplus
souvent estimé àpartir
de la formule deSpearman-Brown (1910),
et la mesure de la consis- tance internequi,
engénéral, s’effectue
àpartir
du coefficientalpha
deCronbach
(1951).
Ces
coefficients, parmi
lesplus usuels,
montrent que la fiabilités’ac- croît
avec le nombred’items.
Il faut néanmoins remarquer que legain marginal
de fiabilité par itemsupplémentaire
estdécroissant,
et il estd’autant plus
décroissant que la fiabilité despremiers
items est élevée.Bohrnstedt
(1969) rapporte
undiagramme
surl’évolution
du coefficient deSpearman-Brown
en fonction du nombred’items
pour des coefficients initiaux de fiabilité différents:Figure
1. Accroissement defiabilité
en fonction du nombred’items (corrélation
inter-itemconstante) d’après
Borhnstedt(1969)
Ce
schéma
montrequ’il
suffiraitd’introduire
ungrand
nombred’items
pours’assurer d’un
coefficient defiabilité
satisfaisant. Mais une telle dé- marche se heurte à des obstaclesd’ordre opérationnel
etthéorique. L’ad-
dition
d’items
a uncoût
habituellement estiméélevé qui s’exprime
entemps
d’expérimentation,
et legain marginal
defiabilité
par itemsupplémentaire
est
largement décroissant.
Ils’avère
alorsimportant
desélectionner
leplus petit
ensemble suffisantd’items qui garantiront
une fiabilité et unevalidité satisfaisantes de
l’échelle. L’analyse s’appuie
alors sur de mul-tiples critères à partir desquels peut s’effectuer
un choix. Lescritères
sont essentiellement
définis à partir
des différentstypes
de validité(contenu, critère, construit),
la fiabilitén’en
introduisantqu’un
seul.La corrélation
pih d’un
item candidat au total del’échelle H, composée
detous les items
candidats,
constitue leprincipal critère
relié à la fiabi-lité.
Toutefois, l’item
étant inclus dansl’échelle H,
on estimeégalement
un coefficient de corrélation
corrigé pih, qui
mesure lacorrélation d’un
item candidat àl’échelle
modifiéH’ composée
de tous les autres items can-didats
(Cureton, 1966).
La différencePih Pih’
, est alors un indice decontribution de
l’item
àl’échelle*.
La validité de contenu réfère au
degré auquel l’échelle
couvre les diversesfacettes du
concept qu’elle
mesure. Comme iln’existe
pas de critère sta-tistique
pour évaluer la validité de contenu, on recourt à uneprocédure qui
offre unegarantie
relative de couverture duconcept.
Lechamp
du con-tenu est
stratifié,
etchaque
strate(ou dimension)
est divisée en sous-strates
(ou sous-dimensions) jusqu’à l’obtention
des strates(ou
composan-tes)
élémentaires. Ils’agit
alors de déterminer si les itemsappartenant
à une même strate ou dimensionprésentent
entre eux des corrélationsplus
élevées que celles
enregistrées
avec les items des autres strates. Le cri- tèrepid
mesure la relation linéaire entrel’item
i et une dimensiond,
etpid’ correspond
à sa corrélationcorrigée.
La différencePid Pid’
estalors un indice de contribution de
l’item
à la dimension. Sipid représen-
te la corrélation de
l’item
aux autresdimensions,
alors 1 -pid
est un in-dice
d’indépendance
del’item
aux k-1 autres dimensions.La validité associée à un
critère
vérifie sil’échelle
est corrélée à une mesure directe duconcept.
Le critèrepic
estimel’intensité
de la rela-ic
tion linéaire entre un
construit-type
- etl’item i,
et 1 -p.-
ic constitue unindice
d’indépendance
del’item
aux autresconstruits-types.
La validité de construit examine la
correspondance
entre la théorisation etl’opérationnalisation
del’échelle:
ils’agit
de savoir sil’item
mesure,* Si le nombre
d’items
estgrand,
cette différencepeut être
assez faible.et avant tout autre, le
concept
pourlequel
il a été conçu. Ladifférence
pid pih représente
alors un indiced’appartenance
del’item
à la dimen-sion
qu’il
est censé mesurer. Mais cette convergenceétablie,
il fautéga-
lement
s’assurer
quel’échelle
estcapable
de discriminer. Le critère de différenciation est un test du tqui
examines’il
existe unedifférence significative
pourchaque
item sur un échantillon donné entre les 27X desréponses enregistrant
les scores lesplus
élevés et les 27% desréponses
ayant
les scores lesplus
faibles(Edwards, 1957).
Onpeut
enfinadjoindre
à ce critère une mesure de la centralité des
réponses gi
iqui indique
- laqualité
de la relation entrel’énoncé
del’item
et sagradation:
elle cor-respond
à la valeur absolue de la moyenne des différences entre les scores et la valeur centrale de lagradation
del’item.
Chaque item,
étant évalué sur cesmultiples critères,
se pose unproblème
de choix: il consiste à identifier le
plus petit
ensemble suffisantd’items
offrant à la fois lesqualités métrologiques indispensables
de fiabilité etde validité et la
représentation
laplus
fidèle del’ensemble
des dimen- sions composant le concept à mesurer. Lacomplexité
de latâche
nécessi-terait,
dans laplupart
des cas,l’intervention d’un
outild’aide
à la décision pour ques’opère
defaçon adéquate
ce choix. La méthode ELECTRE(Elimination
Et Choix Traduisant laRéalité)
semble laplus appropriée
pourrépondre
à ce besoin.II - LA METHODE ELECTRE
Pour résoudre le
problème
du choix desitems,
nous pouvonsenvisager d’a- gréger
lesappréciations enregistrées
par les divers critères. Cette solu- tions’avère
peuacceptable:
bien que les valeurs attribuées aux critères soient de naturestatistique,
ceux-cireflètent
despoints
de vue diffé-rents. Il est donc
préférable d’opter
pour une méthodequi
respecte cettediversité.
ELECTRE II permetd’établir
un classement sur un ensemble finid’objets
en tenantcompte
simultanément deplusieurs
critères non aisémentréductibles en un seul.
Dans le cas
présent,
nousdisposons d’un
ensemble de n itemscandidats,
etpour
chaque
itemi,
i =1, 2,
..., n,d’une
sériey (i), Y2(i),
...,Ym(i)
de scores sur chacun des
j, j
=1, 2,
..., m, critères. Nous obtenons alors un tableau à double entrée telqu’illustré (Figure 2).
Figure
2. Formalisationcanonique
duproblème
de choixmulticritère
des itemsd’une
échelle de mesureComme, en
général,
aucun itemn’apparaît
meilleur que tous les autres surl’ensemble
descritères,
nous sommes conduits à rechercher les itemsqui,
àla
fois,
réalisent un"bon"
score sur leplus grand
nombrepossible
de cri-tères
(en
considérant leurimportance relative)
etn’affichent
pas detrop
"mauvais"
scores sur les autres.Aussi, importe-t-il
de définir les condi-tions
qui
autorisent àaffirmer,
étant donné deuxitems,
ou quel’un
estglobalement préférable
àl’autre,
ouqu’il
estéquivalent,
ouqu’il s’avère impossible
de conclure lerisque d’erreur
étanttrop grand.
La notion de"globalement préférable"
est formalisée par une relation dite de surclasse- ment notée S.Une relation binaire
SI
définie surl’ensemble
I des items estappelée
re-lation de surclassement
si,
pour toutepaire d’items,
on se prononce pourune situation:
.
d’indifférence lorsque iSli’
eti’SIi,
. de
préférence
stricte oularge lorsque iSli’
et noni’SIi,
.
d’incomparabilité lorsque
noniSli’
et noni’SIi, où
i eti’
e I(R)y, 1974).
La décision
d’opter
pourl’une
de ces trois situations pour unepaire d’i-
tems
(i, i’) dépend
des vecteurs de scoresy(i) =
-(yl(i),
...,y.(i),
J ...,et
y(i’) _ (yl(i’),
...,y.(i’)
...,ym(i’)),
etc’est
àpartir
dem - J m
ces scores que
s’élabore
la relation de surclassementSI. L’idée
de basede la méthode ELECTRE est sur ce
point
relativement intuitive et naturelle:si un item i est au moins aussi bon que
i’
sur laplupart
des critères(concordance)
et si par ailleurs iln’existe
pas de critèrestipulant
que i estbeaucoup plus
mauvais quei’ (discordance),
alors les chances sontgrandes
pour que i soitpréférable
ài’, c’est-à-dire
que i surclassei’.
La relation de surclassement est ainsi conçue à
partir
de deux indices:un indice de concordance et un indice de discordance*.
Une
façon simple
de calculer un indice de concordance consisterait à retenir le nombre decritères
pourlesquels
i est au moins aussi bon quei’. Cepen- dant,
tous lescritères
oupoints
de vue neprésentent
pas nécessairement lemême intérêt. Aussi,
associe-t-on auxcritères
despoids
P,
Jexprimant
leur
importance
relative. Onpeut
alors calculerl’indice
de concordanceen effectuant la somme des
poids
pourlesquels
i est au moins aussi bon quei’,
sommequi
se normalise en divisant le résultat obtenu par la somme de* Le lecteur
ayant
une bonne connaissanced’Electre
II pourra passer direc- tement à la section III:"Application
à la Constructiond’une
Echelle deMesure".
tous les
poids. Ainsi,
pour lapaire d’items (i, i’) l’indice
de concor-dance
C(i, i’)
est tel que:1
estl’ensemble
des critè-res
procurant
un score au moins aussi élevé àl’item
iqu’à l’item i’.
On peut vérifier que cet indice varie defaçon
non décroissante entre 0 et 1avec
l’enrichissement
del’ensemble C..,.
11Il est en
général nécessaire,
mais nonsuffisant, d’atteindre
undegré
relativement élevé de concordance pour déclarer que
l’item
i surclassel’item i’.
Eneffet,
certainsparmi
lescritères j
vontparfois
àl’en-
contre de la relation
"i
est au moins aussi bon quei’".
.Aussi,
faut-ilintroduire des conditions
supplémentaires
sur ces écartsnégatifs
pour dé-cider du surclassement de
i’
par i. Il semble fondé de refuser ce surclas- sement dèsl’instant
oùy.(i)
Japparaît trop "discordant" comparé
ày.(i’)
Jpour j
eC..,,
11C..,
11= j : y . ( i)
J Jy.(i’)}. Ainsi,
pourchaque paire d’items
(i, i’) l’indice
de discordance selon lecritère j
est établi de la manièresuivante:
Ce
n’est
pas la seulefaçon
de définir ces indices et ilpourrait être
uti-le de la modifier en fonction du contexte.
Les indices de concordance et de discordance
calculés,
on pourra direqu’un
item i surclasse un item
i’, iSii’,
où I estl’ensemble
des itemsanalysés,
si les trois conditions suivantes sont réunies:
1)
Le rapport de la somme despoids
descritères
pourlesquels
i est con-sidéré comme au moins aussi bon que i’ sur la somme des
poids
descritères
pour
lesquels
i est considéré moins bon quei’
doitêtre plus grand
que1;
soit:
2)
La somme despoids
descritères
pourlesquels
i est considéré comme aumoins aussi bon que
i’, P(i, i’)
doitêtre "suffisamment élevée":
cette condition estimel’importance
du nombre de relations favorables au surclas- sement dei’
par i.3)
Pour toutcritère j
ne vérifiant pas la relation i est moins bon quei’,
la différence de scoreD.(i,
Ji’)
=y.(i’) - y.(i)
J J ne doit pasêtre "trop
importante". C’est
une condition statuant surl’ampleur
de la discordance.L’estimation d’un
niveau"suffisamment élevé"
ou celled’un
niveau"pas trop
important"
sontspécifiées par des
seuils dits de concordance et de discor- dance. Le niveau des seuilsdépend
à la fois desexigences
del’analyste
etdu taux de
risque qu’il
estprêt
àaccepter
dans la construction des rela- tions de surclassement*.La combinaison des seuils avec les conditions de concordance et de discor- dance
permet d’interpréter
la force de la relation de surclassement. Dans ELECTREII,
le surclassement est évalué comme fort ou faible en fonction des relations observées entre trois seuils de concordance({cI’
* Le choix de ces seuils relève autant
d’une appréciation subjective
qued’un
claculd’erreur
au sens de laphysique.
Il nes’agit
pas ici degrandeurs expérimentales,
mais degrandeurs d’opportunité
utiles pour scinderl’approximatif
dusignificatif
dans les données.Aussi,
lesvaleurs attribuées aux seuils contiennent-elles une
part inévitable
d’arbitraire.
avec 1 >
c2 > c3 > 0)
et deux seuils de discordance({d.(1), d.(2)}
avec
d.(1) d.(2))
dont le niveaudépend
des échelles choisies pour enre-J J
gistrer
lesappréciations
des critères*.L’item
i surclasse fortementi’,
notéiSI(F)i’,
si enplus
de la condition(1)
énuméréeprécédemment:
L’item
i surclasse faiblementi’
notéiSI(f)i’
si enplus
de la condition(1) :
L’évaluation,
en terme de forte ou defaible,
de la relation de surclasse- ment pourchaque paire d’items permet
de construire ungraphe qui
procure,en se basant sur la
longueur
deschemins, d’une part
incidents etd’autre part issus,
deux classementsextrêmes**
del’ensemble
des items: les rela- tions de surclassement faibles sont introduites pourdépartager
les itemsestimés
équivalents
selon le surclassement fort. Il est alorspossible d’obtenir
un ordreunique (préordre complet)
en effectuant un classementfinal, situé
enquelque
sorte àégale
distance des classementsprécédents,
et dont les rangs
correspondent
à la moyenne des rangs obtenus dans les* On retient habituellement comme valeurs standards pour les seuils de
concordance c
=3/4, c2 = 2/3, c
=3/5;
les seuils de discordance sont fixés parl’analyste qui
définitune amplitude
de discordanceacceptable.
** Un chemin incident à un sommet i est
l’ensemble
des sommets(il, i2,
...,ik)
vérifianti1SF i2, i2Spi3’
... ,ihSF i, ou Sp signifie :
surclasseforte
ment. Un chemin issu
diun
sommet i est l’ensemble des sommets(il, iZ,
... ,
1 vérifiant iS il, i1S i2,
...F1.
Lalongueur d’un
che-min incident ou issu
est
lenombre
de sommetsfigurant
dansl’ensemble.
La
longueur
des chemins incidents détermine le classementdirect,
et celle des cheminsissus,
le classement indirect.classements
extrêmes (Bertier
etRoy, 1972).
Ce classement finalprend d’autant plus
de sens que les classementsextrêmes
sont peudissemblables;
dans le cas de dissimilarité
notoire,
il existe de nombreusesincomparabi-
lités insolubles selon la
méthode,
les donnéesn’offrant
pas unegarantie
suffisante.
III - APPLICATION A LA CONSTRUCTION
D’UNE
ECHELLE DE MESUREL’utilité
de cetteprocédure
à la foisd’analyse
et de choix des items appa-rait
clairement à lalumière d’un exemple.
Nous nous servons à cette findes données recueillies lors du
prétest d’une
échelle detype
Likertbapti-
sée
"Indice
de MotivationTechnocratique
etPolitique" (Ferrand, 1982).
L’objet
de cette échelle est de déterminer dansquelle
mesure les utilisa-teurs
d’un système d’information
attendent desrécompenses
de nature tech-nocratique et/ou politique lorsqu’un projet
dedéveloppement
de cesystème
est
engagé.
Unerécompense
est dite detype technocratique lorsque
safinalité
s’exprime
en termes de moyens. Ell.e est dite de typepolitique lorsqu’elle
se définit strictement en termes de finalité(Poitou, 1978).
Pour construire les
items,
nous avons diviséchaque
dimension en ses com-posantes
lesplus
élémentaires. La dimension"Politique"
fut éclatée enquatre
sous-dimensionscorrespondant
auxquatre
sources fondamentales dupouvoir (Shukla, 1977).
La dimension"Technocratique"
fut différenciée àpartir
descritères d’efficience
etd’efficacité
dans lessystèmes d’infor-
mation tels
qu’exposés
par Jenkins(1977)
etCheney (1977).
Les diversesdéfinitions
attachées
aux sous-dimensionspermettent d’identifier
des com-posantes
élémentaires. Nous obtenons le tableau de lafigure
3.1 1
Figure
3. Lescomposantes
élémentaires des deux dimensions del’échelle
de mesureUne trentaine
d’items,
issus descomposantes
élémentaires des deux dimen-sions,
furentprésentés séparément
à troisexperts
du domaine dessystèmes
d’information qui
enanalysèrent
lasémantique.
Nous avonsrejetté
toutitem
qui
ne recevait pasl’unanimité
decompréhension
desexperts.
Suite à leursavis,
24 items furent retenus,parmi lesquels
deux items correspon- daient à des mesures directes de chacune des dimensions.L’échelle
variait de 1(absolument
pasimportant)
à 6(extrêmement important).
A titred’exem- ple,
ellecomprenait
pour la dimensionpolitique
des items comme:"j’ai préféré
ce moded’exploitation
dusystème d’information
parcequ’il
corres-pond
le mieux auxresponsabilités
liées à maposition hiérarchique",
oupour la dimension
technocratique,
des items comme:"j’ai préféré
ce moded’exploitation
dusystème
parcequ’il
est leplus approprié
pour conduireà une amélioration dans la
rapidité d’obtention
del’information".
Lesitems formant
l’échelle prétestée
furentrépartis
suivant une suite de nom-bres aléatoires*.
L’échelle
futadministrée,
afind’être prétestée,
à 54utilisateurs
importants
desystèmes d’information ordinés.
Le coefficient de
Spearman-Brown s’élevait
à .84 et le coefficient a de Cronback était de.86,
cequi s’avérait d’excellents résultats,
.80étant
considéré comme un taux de fiabilité très satisfaisant. Nous
procédions
alors au calcul des divers coefficients de
corrélation,
du test t et de lacentralité de
l’item.
Les résultatsapparaissent
dans le Tableau 1.Avant
d’effectuer
le traitement parl’algorithme
ELECTREII,
il est néces-saire
d’assigner
unpoids
reflétantl’intérêt
relatif dechaque
critère.Six
experts**
ontaccepté
departiciper
à ladéfinition,
dans le cadre de la méthode ELECTREII,
del’importance
relative despoids
descritères
ensuivant une
procédure simplifiée
de la méthode DELPHI: la consultation depanels (Helmer, 1966).
Ilimportait
notamment ici depréciser
les mobilesqui légitiment
le choix despoids
relatifs dechaque
critère. Nous avonsenregistré
les résultats suivants.La corrélation de
l’item
àl’échelle
pih
a reçu unpoids
de(1).
Bienqu’il
soitimportant d’examiner l’incidence
del’item
surl’ensemble
del’échelle,
celle-cicomprenant plusieurs dimensions,
il est difficiled’en
estimer
l’impact
réel. Lepoids
del’indice
de contribution del’item
àl’échelle
pih - P..t
, est seulement de(1) puisqu’il reprend
enpartie
lacorrélation de
l’item
àl’échelle.
* Provenant du
générateur
de nombres aléatoires APL-SV del’Université
Laval.
**
Psychométriciens.
Il fut attribué un
poids
de(1)
à la corrélation del’item
à la dimensionpid’
les corrélationssubséquentes pid pid "
indice de contribution delu lu id
l’item
à ladimension,
et 1 -pid,
indiced’indépendance
del’item
aux au-tres dimensions recevant un
poids
de(2).
La distribution despoids
de cesindices, important
en raison de leur référence directe à la validité de contenu,s’explique
par leurinterdépendance.
La validité de construit reçue
globalement,
unpoids
de(4), répartie
en-tre
l’estimation
del’intensité
de la relation entre leconstruit-type
etl’item
pic
etl’indice d’indépendance
del’item
aux autresconstruits-types
1C
(1 - p -).
1CUn
poids
de(2)
a été accordé àl’indice d’appartenance
del’item
à la di-mension
Pid Pih’
la mesure de convergence del’échelle
étant un facteurimportant.
Il fut admis que lacapacité d’un
item à discriminers’avérait
une
caractéristique majeure
de laqualité métrologique
del’échelle, puis- qu’elle
constitue sa raisond’être.
Il a été de ce fait attribué unpoids
de
(5)
au critère de différenciation mesuré àpartir d’un
test du t. En-fin,
le critère de centralité desréponses gi a
été dotéd’un poids
de(1).
Les indices de concordance sont obtenus
simplement
enappliquant
aux don-nées du tableau 1 la formule
(2).
Le tableau 2 donne les valeurs de cesindices pour les dimensions
technocratique
etpolitique.
La condition de discordance nécessite souvent
(a)
que soientopérés
desajustements préalables
des échellesenregistrant
lesappréciations
des cri-tères ou
(b)
que les seuils de discordance soient établis en fonction des niveaux del’échelle.
Onopte
pour une transformationd’échelle lorsque
des variations
égales
surl’échelle n’ont
pas unesignification identique
pour tous les niveaux de
l’échelle.
Pour lastatistique
t, parexemple,
en (v w la) 4il -rq w u M Q)
"0 e :i u
1=
ci ci:2 m cri a) p 0 u M
r-f
:2 Cu
0)
1-1 10
E--4
aTableau 2. Matrice des indices de concordance
une variation de 0.50
n’a
pas la mêmesignification
si elle se situe autourd’une
valeur t de 1.75 oud’une
valeur du t de3.50;
deplus,
au delàd’un
certain
seuil,
un accroissementmarginal d’un
scoren’est
passignificatif.
Autre
exemple:
les valeurs des coefficients de corrélationspih’ p.id’ pic’
utilisées comme
critères,
subissent la transformation de Fisher1
2 1-p puis
sontstandardisées
af i.n de se distribuer selon une normale(0,1).
Lesvaleurs de ces trois variables standardisées
z.., j
1J =h, d,
c, ainsi queles valeurs
enregistrées
par lastatistique
t sont alors transformées par la fonction derépartition
deprobabilité O(z) d’une
normale(0,1).
Cesdiverses transformations conduisent au tableau 3.
On
applique
la condition de discordance àpartir
des données du tableau 3.Les seuils retenus sont:
L’algorithme
ELECTRE IIétablit,
àpartir
des indices de concordance et dediscordance,
unpréordre partiel
des itemsqui permet
de construire un gra-phe
de surclassement pour chacune des dimensions:a) graphe
de surclassement des items pour la dimensiontechnocratique (Figure 4),
b) graphe
de surclassement des items pour la dimensionpolitique (Figure 5).
Le classement issu de
l’application
de la méthode ELECTRE II est ainsi fonc-tion,
non seulement des évaluations des items parcritère,
mais aussi desen CI)
$-4 il) 4j -f-4
~ 0 Go CI)
’"0 d :i ci
as
à a
~ g m M BD
6
w 0 44
M C a w 4-J co (3) 4 0 u cn
m
:1 (t cu 1-4 as E-t
Figure
4.Graphe
de surclassement des itemspour
la dimensiontechnocratique
Figure
5.Graphe
de surclassement des items pour la dimensionpolitique
valeurs des
paramètres (les
seuils et lespoids) qui
interviennent dans la construction de la relation de surclassement. Toute modification des va-leurs des
paramètres
estsusceptible
dechanger l’ordre
de classement. Lespoids
et les seuilsn’étant
que des ordres degrandeur,
ilimporte
de tes-ter la sensibilité des
résultats
à desvariations,
dans une fourchette rai-sonnable,
des valeurs desparamètres.
Dans la mesure où ces variationsperturbent
peu ou pas du toutl’ordre
de classementfinal,
on sera enclinà accorder une
grande
confiance dans les résultats. Dans le casopposé
etlimite où de
légères
variations viennent bouleverserl’ordre
de classementfinal,
il faudra conclure quel’information
contenue dans les données estinsuffisante pour
permettre
dedépartager
valablement les items.Les résultats de notre
analyse
de sensibilité sontprésentés
sur lafigure
6. Ils
permettent
de constaterque,.d’une façon générale,
le classement final des items nes’est
pas avérétrès
sensible à des variations raisonna- bles des seuils de discordance et despoids. Certes,
parexemple, l’item
17 a
gagné
6 rangslorsque
les seuils de discordance ont été modifiés pour lecritère 1,
mais en réalité le classement final suite à cette modifica- tions’établit
ainsi:21, 22, {4, 5, 9, 16, 17, 19}, 10, 24, {1, 6};
alorsque
l’ordre
avant modification était le suivant:21, 22, {4, 5, 9, 16, 19}, 10, {17, 24}, {1, 6}.
Deplus,
on observe que les rangs des items classéscomme
prioritaires
se montrenttrès
peu sensibles(à l’exception
del’item
18
qui enregistre quelques légers déplacements)
aux variations de seuils etde
poids
tant pour la dimension"Technocratique"
que la dimension"Politi-
que".
IV - CONCLUSIONS
Les
graphes
issus del’application
del’algorithme
ELECTRE IIreprésentent
des
priorités
de choixparmi
les items. Il devient alorspossible
de ré-%0 4j -F-4 V-4 -F-4
.0
V-4 0 S
ai
0) 0 lu 0 03 r--i
tu
SU
ci r w
-9-1
F
pondre
aux deuxquestions,
intimementreliées,
àl’origine
de notre étude:(a)
combiend’items
doit-on retenir?(b)
le seuil de fiabilité del’ensem-
ble des items choisiss’avère-t-il
satisfaisant?Les courbes
d’accroissement
defiabilité
en fonction du nombred’items
dé-montrent
qu’à partir d’une corrélation
inter-item constante située entre .4et
.5,
un nombre de 4 à 5 items permetd’atteindre
un tauxacceptable
defiabilité de .80
(coefficient
deSpearman-Brown,
cf.:Figure 1).
Pour ladimension
technocratique,
lesquatre
items classésprioritaires (item 21,
item
22,
item16,
item4)
sur legraphe
obtenaient un taux de fiabilité ade
.79;
pour la dimensionpolitique,
lescinq premiers
items(item 13,
item15,
item18,
item2,
item23)
affichaient un taux de fiabilité a de .77.Il est notoire que
l’ensemble
choisi des items necorrespond
pas nécessai-rement à
l’ensemble pouvant
maximiser le taux de fiabilité a.L’ensemble optimal
pour le taux de fiabilité a, pour un nombred’items donné,
estconstitué par le sous-ensemble des items candidats
possédant
lesplus
fortes corrélations inter-items. On
perçoit
à travers cette remarquel’intérêt d’une approche multicritère
àl’analyse
des items.L’approche multicritère,
en classant les items parrapport
à leurs résultats sur unensemble de critères de validation
permet d’extraire
un sous-ensemble suf- fisantd’items, lesquels
sontpuisés
au sein des diverses sous-dimensions duconcept
mesuré:l’approche multicritère
tend ainsi à conserver la va-riété
théorique
des sous-dimensions composant leconcept.
Opérer
une réduction del’ensemble
des items àpartir
du critèreunique
defiabilité revient à
privilégier
un sous-ensembled’items
rattachés à unedes sous-dimensions ou aux sous-dimensions les
plus
similaires du concept,et dont les mesures
enregistrent,
parrapport
à tout sous-ensembled’itens
demême cardinal,
laplus grande
redondance.L’intérêt
del’approche
mul-ticritère est de réaliser un
compromis,
le meilleur euégard
àl’ensemble
des critères utilisés pour un ensemble donné
d’items candidats,
entre lafiabilité,
les critères devalidité,
la variété des sous-dimensions et le nombred’items.
End’autres
termes,l’approche multicritère
permetd’iso-
ler un ensemble réduitd’items qui,
pour un niveau satisfaisant de fiabili-té,
offre deplus grandes
chances de capter dans saglobalité théorique
leconcept
mesuré.BIBLIOGRAPHIE
BERTIER, P., ROY, B., "La
méthode ELECTREII,
uneapplication
au media-planning",
VI Conférence internationale de rechercheopérationnelle, Dublin, août 1972,
M. RossEditor,
OR72,
North HollandPublishing Company.
BORHNSTEDT, G.W., "Reliability
andValidity
Assessment in Attitude Measure-ment",
inSUMMERS, G.F., ed.,
AttitudeMeasurement, Chicago,
Rand andMcNally, 1969,
80-99.CHENEY, P.H., "Organizational
Characteristics and InformationSystems:
anInvestigation",
Ph.D.Thesis, University
ofMinnesota,
1977.CRONBACK, L.J., "Coefficient Alpha
and the Internal Structure ofTests", Psychometrika, 1951,
297-334.CURETON.
E.E., "Corrected
Item-TestCorrelations", Psychometrika, 1966, 91-96.
EDWARDS, A.L., Techniques
of Attitude ScaleConstruction,
NewYork,
Appleton-Century-Crofts,
1957.FERRAND, D.J., "Les logiques d’interprétation
de la rationalisation dusystème d’information organisationnel",
Ph.D.Thesis, Université Laval,
1982.HELMER, O.,
The Use of theDelphi Technique,
RandCorp.
SantaMonica,
1966.JENKINS, A.M., "An Investigation
of SomeManagement
InformationSystems Design
Variables andDecision-Making
Performance: a simulation ex-periment",
Ph.D.Thesis, University
ofMinnesota,
1977.POITOU, J.P.,
Ladynamique
des groupes: uneidéologie
autravail,
Conseil national de la recherche
scientifique, 1978.
ROY, B., "Critères multiples
et modélisation despréférences",
Revued’éco-
nomie
politique, janvier-février
1974.SHUKLA, R. K. , "A Contingency
Model of InfluenceDispersion
and the Bases ofPower in